CN101622274A - 转铁蛋白融合蛋白库 - Google Patents

转铁蛋白融合蛋白库 Download PDF

Info

Publication number
CN101622274A
CN101622274A CN200780050623A CN200780050623A CN101622274A CN 101622274 A CN101622274 A CN 101622274A CN 200780050623 A CN200780050623 A CN 200780050623A CN 200780050623 A CN200780050623 A CN 200780050623A CN 101622274 A CN101622274 A CN 101622274A
Authority
CN
China
Prior art keywords
fusion rotein
transferrins
iron complexes
cell
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200780050623A
Other languages
English (en)
Inventor
安德鲁·J·特纳
王百扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biorexis Pharmaceutical Corp
Original Assignee
Biorexis Pharmaceutical Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biorexis Pharmaceutical Corp filed Critical Biorexis Pharmaceutical Corp
Publication of CN101622274A publication Critical patent/CN101622274A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/79Transferrins, e.g. lactoferrins, ovotransferrins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/76Albumins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/035Fusion polypeptide containing a localisation/targetting motif containing a signal for targeting to the external surface of a cell, e.g. to the outer membrane of Gram negative bacteria, GPI- anchored eukaryote proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/31Fusion polypeptide fusions, other than Fc, for prolonged plasma life, e.g. albumin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Toxicology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Plant Pathology (AREA)
  • Botany (AREA)
  • Physics & Mathematics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了含有转铁蛋白部分和整联蛋白结合域的融合蛋白及其肽库。本发明包括筛选在被宿主细胞表达的融合蛋白中展示的转铁蛋白和整联蛋白肽库的方法。本发明的融合蛋白包括能够在酵母中表达的转铁蛋白融合蛋白。

Description

转铁蛋白融合蛋白库
相关申请
本申请与2006年6月19日提交的PCT国际申请PCT/US2006/023742相关,该PCT国际申请要求2005年6月17日提交的美国临时申请60/691,229的优先权。本申请还与2004年11月23日提交的美国专利申请10/515,429;2003年7月9日提交的美国临时申请60/485,404;2003年3月10日提交的美国专利申请10/384,060;和2002年8月30日提交的美国临时申请60/406,977有关,皆全文引入作为参考。
技术领域
本发明涉及融合蛋白、融合蛋白库,以及融合蛋白用于筛选配体例如整联蛋白结合肽的结合活性的用途。
背景技术
细胞表面展示系统
组合库筛选和选择方法已经成为常规研究手段(Phizicky等,(1995)Microbiological Reviews 59:94-123)。最普遍的技术之一是噬菌体展示,藉此蛋白质被表达为对噬菌体壳蛋白的多肽融合,随后通过与固定的或者可溶的生物素化的配体相结合被筛选。通常通过构建表达在例如M13、fd和fl的丝状噬菌体外表面的嵌合体蛋白质实现随机肽的展示。已经成功地将噬菌体展示应用于抗体、DNA结合蛋白、蛋白酶抑制剂和酶。参见Hoogenboom等,(1997)Trends in Biotechnol.15:62-70;Ladner,(1995)Trends in Biotechnol.13:426-430;Lowman等,(1991)Biochemistry 30:10832-10838;Markland等,(1996)Biochemistry35:8045-8057;和Matthews等,(1993)Nucleic Acids Res.21:1727-1734。
除了噬菌体展示,已经开发出几种细菌细胞表面展示方法。参见Georgiou等,(1997)Nat.Biotechnol.15:29-34。细菌细胞表面展示方法实现的一种途径是用含有菌毛蛋白(TraA)或其一部分和异源多肽的融合蛋白在能够形成菌毛的细菌宿主细胞外表面上展示库肽。参见美国专利5,156,637,在此将其全文引入作为参考。
FLITRXTM随机肽库(InvitrogenTM Life Technologies)使用细菌鞭毛蛋白、FliC、和硫氧还蛋白,TrxA,在大肠杆菌表面以构象限制方式展示十二肽的随机肽库。参见Lu等,(1995)Bio Technology 13:366。已经将这些系统应用于抗体抗原表位定位、活菌疫苗传递系统的开发和构建、以及用于环境净化目的和诊断的全-细胞生物-吸附剂的产生。使用FLITRXTM系统还确定了与肿瘤起源的上皮细胞上的肿瘤特异性靶相结合的肽序列。参见Brown等,(2000)Annals of Surgical Oncology,7(10):743。
已经开发出用于库筛选的酵母细胞表面展示系统,其成功克服了噬菌体和细菌展示系统的一些缺陷。酵母表面展示系统,例如pYD1酵母展示载体试剂盒(pYD1 Yeast Display Vector Kit)(InvitrogenTM LifeTechnologies),使用酿酒酵母的a-凝集素受体在细胞表面展示外源蛋白。a-凝集素受体由被AGA1和AGA2基因编码的两个亚基组成。Aga1蛋白(Aga1p,725个氨基酸)由细胞分泌并共价连接在细胞外基质中的酵母细胞壁的β葡聚糖上。Aga2蛋白(Aga2p,69个氨基酸)通过两个二硫键与Aga1p结合并且在分泌后通过其与Aga1p的联系继续连接在细胞上。Aga2p的N-末端部分对于其与Aga1p的连接是必须的,而蛋白质和肽可以被融合至其C-末端以展示在酵母细胞表面。凝集素是一种天然的酵母蛋白,通常其具有特异性粘附接触的作用,在配对过程中融合酵母细胞。正因为这样,它已经为了蛋白-蛋白结合而发展为没有额外的来自于细胞壁成分的空间位阻。Boder等,在“Yeast SurfaceDisplay for Directed Evolution of Protein Expression,Affinity,andStability”,Applications of Chimeric Genes and Hybrid Proteins,(JeremyThorner等),Academic Press,2000,328卷,430-439页中;US6,699,658和US6,423,538,在此皆全文引入作为参考。
然而,由于为了使Aga2p蛋白与细胞壁相连,Aga2p-融合蛋白和Aga1p需要形成二硫键,因此该系统的缺点之一是展示的效率比较低,仅占在其表面有效展示蛋白质的酵母细胞的40%-60%。参见Feldhause等,(2003)Nat.Biotechnol.21(2):163-70。存在对在细胞表面展示大部分(如果不是全部)库蛋白的酵母展示系统的需求。
Aga1p和Aga2p酵母展示系统的另一个缺点是其要求需经过筛选的配体连接于Aga2p的C-末端。结果,该系统不能被用于选择其游离N-末端对于结合和/或活性是必须的肽。因此,需要灵活的展示系统,其无需配体的N-末端与酵母细胞蛋白结合。
转铁蛋白融合蛋白
血清转铁蛋白(Tf)是分子量为80,000道尔顿的单体糖蛋白,它与循环中的铁结合,并经由转铁蛋白受体(TfR)将铁转运至各种组织(Aisen等,(1980)Ann.Rev.Biochem.49:357-393;MacGillivray等,(1981)J.Biol.Chem.258:3543-3553;和美国专利5,026,651)。Tf是最常见的血清分子之一,它占高达约5-10%的总血清蛋白质。在酗酒者的血液中,存在高水平的糖缺损的转铁蛋白,并且这种糖缺损的转铁蛋白的半衰期(约14-17天)比糖基化的转铁蛋白的半衰期(约7-10天)更长。参见vanEijk等,(1983)Clin.Chim.Acta 132:167-171;Stibler(1991)Clin.Chem.37:2029-2037;Arndt (2001)Clin.Chem.47(1):13-27;和Stibler等,“Carbohydrate-deficient consumption”,Advances in the Biosciences,(EdNordmann等),Pergamon,1988,71卷,353-357页)。Tf的结构已经被充分表征,且受体结合、铁结合与释放、以及碳酸根离子结合的机理已经被阐明。参见美国专利5,026,651、5,986,067以及MacGillivray等,(1983)J.Biol.Chem.258(6):3543-3546,在此皆全文引入作为参考。
黏蛋白是被高度糖基化的蛋白质家族。黏蛋白和黏蛋白-样蛋白已经被用于在融合蛋白的配体结构域与生物芯片间提升实质性的距离。据信在配体与基质间提升显著的距离能增强配体与展示在受体表达细胞中的受体结合。参见WO01/46698,在此全文引入作为参考。
本发明的发明人先前已经开发了转铁蛋白融合蛋白库。参见美国专利申请10/515,429,在此全文引入作为参考。本发明提供了包含柄-样部分(例如黏蛋白或黏蛋白-样蛋白)的转铁蛋白融合蛋白,柄样部分旨在减少空间位阻和增强配体结合。融合蛋白可以被表达和展示在宿主细胞例如酵母细胞的表面,使得表达的转铁蛋白融合蛋白可以用作肽筛选平台。而且,融合蛋白的转铁蛋白和配体部分可以断裂并用作治疗剂。这对于现有的酵母展示技术来说是不可能实现的,因为去除N-末端融合的Aga2蛋白很可能会影响连接于转铁蛋白的小配体的构象。
发明内容
如下文所详述,本发明包括具有转铁蛋白(Tf)部分的融合蛋白。在本发明的一个实施方案中,融合蛋白含有转铁蛋白部分、柄部分和细胞壁连接基。在本发明的该实施方案中,融合蛋白被表达在细胞的细胞表面,通过细胞壁连接基连接于细胞壁。在本发明的另一个实施方案中,融合蛋白含有经由锚定,例如GPI锚定从而与细胞膜连接的转铁蛋白部分。
要求保护的本发明的转铁蛋白部分包括转铁蛋白或其一部分。例如,转铁蛋白部分可以是转铁蛋白的N域部分(即小叶(lobe))。Tf部分可以是经修饰的Tf蛋白质,使得融合蛋白的Tf部分与野生型Tf相比表现出减少的糖基化。在本发明的一个实施方案中,融合蛋白的转铁蛋白部分表现出无糖基化。在本发明的另一个实施方案中,融合蛋白的转铁蛋白部分被修饰以使它与野生型转铁蛋白相比对铁、碳酸氢盐和/或转铁蛋白受体表现出降低的亲和力。转铁蛋白部分可以被修饰以使其不能与转铁蛋白受体、铁或碳酸氢盐结合。因此,本发明包括经修饰的转铁蛋白部分,其中转铁蛋白部分在由糖基化位点、铁结合位点、铰链位点、碳酸氢盐位点和受体结合位点组成的组中的一个或多个位点处被修饰。
要求保护的本发明的配体可以以各种方式与转铁蛋白部分复合或融合。而且,转铁蛋白部分可以有超过一个的配体与之联合。配体部分可以被融合至转铁蛋白部分的N-末端、C-末端或被定位在转铁蛋白部分之内。在本发明的一个实施方案中,配体被插入到选自氨基酸位置Asp33、Asn55、Asn75、Asp90、Gly257、Lys280、His289、Ser298、Ser105、Glu141、Asp166、Gln184、Asp197、Lys217、Thr231和Cys241的N-小叶(N1或N2)的一个或多个氨基酸位置。
本发明还包括定位在转铁蛋白部分的暴露环上的配体。例如,通过在宿主细胞内表达编码转铁蛋白融合蛋白和配体的载体,能够将融合蛋白构建为配体部分在转铁蛋白部分的框架内。
在另一个实施方案中,配体部分可含有在转铁蛋白部分之内的一个或多个随机化表面暴露的氨基酸残基。例如,转铁蛋白部分可含有至少约3个、约4个、约5个、约6个、约7个、约8个、约9个或者约10个或者更多的随机化表面暴露的氨基酸残基。在一个实施方案中,使用约6个表面暴露的氨基酸残基构建转铁蛋白融合蛋白库或转铁蛋白库。可使用本领域已知的突变形成方法使转铁蛋白的表面暴露的氨基酸随机化。随机化的氨基酸残基在暴露区域可以是有序的或成簇的。转铁蛋白的表面暴露区域包括但不限于,在约位置85至约位置92、约位置276至约位置298或者约位置207至约位置217的氨基酸。
配体可以采取多种形式,包括但不限于单链抗体、抗体、抗体片段、抗体可变区、随机肽、或抗体互补-决定区(CDR)。配体包括可变或随机区和不变区。在一个实施方案中,配体是随机肽。可以通过许多本领域已知的方法制造与转铁蛋白部分一起表达的随机肽配体部分,所述方法包括但不限于易错PCR和DNA改组。还可以在转铁蛋白融合蛋白已经被翻译后将配体部分加至转铁蛋白融合蛋白。
配体可以是感兴趣的配体或配体库中的一个配体。配体能够与一个或多个受体或者试剂例如肽、抗原、受体、抗体、毒素、代谢物、和核酸相结合。
在本发明的一个实施方案中,配体是已知的配体结合序列,在其配体结合序列中或与其配体结合序列非常接近的序列中包括一个或多个随机化的氨基酸。例如,配体可以是在整联蛋白结合序列Arg-Gly-Asp(RGD)的一侧或两侧具有一个或多个随机化的氨基酸残基的RGD序列。在本发明的一个实施方案中,配体是CXXXRGDXXXC,其中X是随机化的氨基酸残基。在本发明的另一个实施方案中,配体是XXXRGDXXX。
如前所述,在一个实施方案中,融合蛋白含有柄部分。柄部分可以被定向使得其N-末端与转铁蛋白部分融合且其C-末端定位在细胞中,例如定位在细胞壁中。在一个实施方案中,柄部分的C-末端与锚定部分融合。在一个实施方案中,本发明的柄部分跨越酵母细胞的细胞壁并且通常是被中度至高度糖基化的肽。通过跨越细胞壁,柄部分担当将融合蛋白连接穿过细胞壁的细胞壁连接组件。在本发明的另一个实施方案中,柄部分跨越细胞壁,被部分展示在细胞表面上。柄部分的组成使其具有棒-样构象,减少了在非棒样构象情况下存在于融合蛋白尤其配体和宿主细胞之间的空间位阻。
柄部分可包含黏蛋白、黏蛋白变体或其片段,或由黏蛋白、黏蛋白变体或其片段组成。黏蛋白域可包括例如MUC1、MUC2、MUC3、MUC4、MUC5AC、MUC5B、MUC6、MUC7、MUC8、MUC9、MUC10、MUC11、MUC12、MUC13、MUC14、MUC15、MUC16、MUC17、MUC18、MUC19、MCU20、MUC21及其变体。在一个实施方案中,柄部分包括人MUC1域,例如包含与SEQ ID NO.:5的核酸序列或其片段相对应的肽。在另一个实施方案中,柄部分含有两个或多个重复的黏蛋白,例如两个或多个重复的MUC1或MUC3。在另一个实施方案中,柄部分含有选自MUC1、MUC2、MUC3、MUC4、MUC5AC、MUC5B、MUC6、MUC7、MUC8、MUC9、MUC10、MUC11、MUC12、MUC13、MUC14、MUC15、MUC16、MUC17、MUC18、MUC19、MCU20和MUC21的两个或多个黏蛋白或其变体或片段。黏蛋白变体和其它柄蛋白变体可以用本领域已知的方法工程化制备,例如用随机化突变形成方法制备。
柄部分还包括中度至高度糖基化的其它蛋白质,或由被中度至高度糖基化的其它蛋白质组成,所述其他蛋白质包括天然酵母细胞壁蛋白。例如,在本发明的一个实施方案中,柄部分包含Aga1、Aga1变体或其片段,或由Aga1、Aga1变体或其片段组成。
本发明的融合蛋白还可包括细胞壁连接组件,细胞壁连接组件起到将融合蛋白固定或连接于宿主细胞的作用。细胞壁连接组件可共价地或非共价地将本发明的融合蛋白连接于酵母细胞壁。在本发明的一个实施方案中,融合蛋白的柄部分是细胞壁连接组件。例如,来自于柄部分的O-多糖可以与细胞壁的β葡聚糖交联。其它细胞壁连接组件包括但不限于含有游离半胱氨酸残基的肽。例如,含有一个或多个未配对的半胱氨酸残基的柄部分或锚定部分可以与细胞壁内蛋白的一个或多个未配对的半胱氨酸残基形成二硫键。
本发明的融合蛋白可以任选包括锚定部分,锚定部分也具有将转铁蛋白融合蛋白固定或连接到宿主细胞的作用。锚定部分可以是细胞壁连接组件或可以使融合蛋白与细胞膜连接。
其中,一种能够使本发明的融合蛋白连接于酵母细胞膜的锚定域是糖基-磷脂酰-肌醇(GPI)肽锚定,其经由翻译后的蛋白修饰而被加到在GPI信号肽序列(例如在SEQ ID NO.:15内提供的信号肽序列)中的ω-位点。GPI肽锚定也可被用于将本发明的融合蛋白锚定至更高级的真核细胞膜,例如哺乳动物细胞膜或植物细胞膜。在本发明的一个实施方案中,锚定(例如由经修饰的GPI信号肽序列提供的锚定)在断裂前将融合蛋白短暂地连接于宿主细胞膜或细胞壁。一旦断裂,融合蛋白经由细胞壁连接组件保持与细胞连接,细胞壁连接组件是柄部分的多糖与细胞壁β葡聚糖交联的结果。
在本发明的另一个实施方案中,锚定是跨膜域。跨膜域(TMD)可以是单跨I型或II型膜蛋白区域,或者是多跨膜蛋白的几个跨膜区域中的任一个。
本发明还包括编码要求保护的融合蛋白的核酸分子。可以将核酸插入到载体中用其转化宿主细胞,例如转化酵母细胞。一旦宿主细胞用本发明的核酸转变,其能够表达融合蛋白。可以通过本领域已知的方法控制融合蛋白表达的诱导,例如通过使用可诱导的启动子。本发明包括表达在宿主细胞集合(例如,表达本发明的展示随机化肽的融合蛋白的酵母细胞集合)中的融合蛋白库。
在本发明的另一个实施方案中,融合蛋白被用于筛选配体或试剂的结合活性。能够表达要求保护的融合蛋白的宿主细胞库可以被暴露于包括但不限于抗原或受体的试剂,然后针对结合活性而被筛选。细胞表面展示库可以使用本领域已知的方法筛选,所述方法包括但不限于FACS和磁珠。
附图说明
图1显示了展示在转铁蛋白融合蛋白上的随机肽库或CDR库以及配体与靶的结合。
图2提供了酵母YIR019C GPI锚定肽序列并高亮显示负责细胞膜连接的氨基酸。
图3提供了pREX0549的载体图谱。
图4提供了pREX0995的载体图谱。
图5提供了pREX0667的载体图谱。
图6提供了pREX1012的载体图谱。
图7提供了pREX0759的载体图谱。
图8显示在两轮MACS分离之后存在Flag-标记的酵母。
图9提供了pREX0855的载体图谱。
图10提供了pREX1087的载体图谱。
图11提供了pREX1106的载体图谱。
图12显示了用MUC1和AGA1的FACS分析。
图13显示了通过用引物P1980/P2181和P2127/P1173扩增pREX1106获得的片段A和B。
图14显示了RGD转移体(trans-bodies)与整联蛋白的直接结合。
图15显示了RGD转移体结合的竞争性结合分析。
图16显示了通过RGD转移体克隆抑制小鼠血小板凝集。
图17是在酵母内表达的hMUC3变体的FACS分析。
图18提供了pREX0757的载体图谱。
图19提供了pREX1234的载体图谱。
图20提供了pREX1235的载体图谱。
图21是使用来自表达Flag-标记的转铁蛋白的哺乳动物细胞的裂解产物的蛋白质印迹,以抗-Flag或抗转铁蛋白抗体作为探针。
图22是暴露的血浆膜蛋白的蛋白质印迹。
图23是pREX1235的FACS分析。
具体实施方式
一般性描述
本发明的发明人已经开发出多功能的融合蛋白,所述融合蛋白例如作为细胞表面展示系统的一部分从而能用于筛选库(例如随机肽库或CDR库)。所述融合蛋白包括与一个或多个的配体复合或融合的转铁蛋白部分。转铁蛋白部分也可以通过随机化表面暴露的氨基酸残基而用作配体。
本发明包括含有除转铁蛋白之外的蛋白质的融合蛋白,只要该蛋白质是可溶的,并能够在融合的一个或多个的配体从融合蛋白残余物断裂时,或在融合的一个或多个的配体在没有融合蛋白残余物的情况下重新构建时,使该融合的一个或多个的配体具有延长的血清半衰期。举例来说,白蛋白或其变体或片段可代替转铁蛋白而被使用。
在本发明的一个实施方案中,将融合蛋白的转铁蛋白部分与被中度或高度糖基化的柄部分融合。在本发明的该实施方案中,融合蛋白包括能够共价地或非共价地将融合蛋白与酵母细胞细胞壁连接的细胞壁连接组件。
在本发明的另一个实施方案中,融合蛋白包括例如跨膜域的锚定部分。融合蛋白可能还经由GPI锚定被锚定于细胞膜。可以使用这种锚定在哺乳动物细胞上表达本发明的融合蛋白。尽管本发明的融合蛋白可以包括柄部分和锚定部分两者,但是本发明也包括含有柄部分但不含锚定部分的融合蛋白,以及包括含有锚定部分但不含柄部分的融合蛋白。
在本发明的一个实施方案中,融合蛋白在酵母内被表达。这样的融合蛋白相对于现有技术的优点包括:与Aga1p和Aga2p酵母展示系统相比,提供了增高的百分比的具有细胞表面展示肽的克隆。本发明的融合蛋白还具有筛选其N-末端对于结合是必须的配体的灵活性。此外,通过将本发明的融合蛋白锚定于哺乳动物细胞膜,本发明的融合蛋白还能够表达和展示在哺乳动物细胞上。
本发明还包括含有融合蛋白或其一部分的治疗性组合物,以及通过向需要这种治疗剂的受试对象施用融合蛋白或其一部分以治疗、预防或改善疾病或失调的方法。本发明的融合蛋白至少包括推定的治疗性蛋白质的片段或变体作为配体部分。在本发明的一个实施方案中,转铁蛋白和配体,即融合蛋白的治疗性部分,可以从细胞断裂,用于制备生物药物或疫苗。例如,融合蛋白的治疗性部分可从柄部分或锚定断裂。
定义
本文所用术语“生物活性”指的是治疗性分子、配体部分、蛋白或肽在生物学范围内,即在生物体中或其体外模拟物中,行使的功能或一整套的活性。生物活性包括但不限于要求保护的融合蛋白的治疗性分子部分的功能,例如但不限于诱导应答细胞系的细胞外基质分泌、诱导激素分泌、诱导趋化性、诱导有丝分裂发生、诱导分化或抑制应答细胞的细胞分裂。如果本发明的融合蛋白或肽呈现其治疗性蛋白质的天然配对物的一种或多种生物活性,则融合蛋白或肽被视为具有生物活性。
本文所用的转铁蛋白序列中的“相应氨基酸”或“等价氨基酸”是通过比对来最大化第一条转铁蛋白序列和至少第二条转铁蛋白序列之间的相同性或相似性而确定的。用于确定第二条转铁蛋白序列中的等价氨基酸的编号是基于用于确定第一条转铁蛋白序列中的相应氨基酸的编号。在某些情况下,可以使用这些措辞描述与兔血清转铁蛋白中的某些氨基酸残基相比较的人转铁蛋白中的氨基酸残基。
本文所用术语“Tf部分”、“Tf蛋白质片段”或“Tf蛋白质”,或“Tf蛋白质的部分”指的是含有天然存在Tf蛋白质或其突变体的至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%的氨基酸序列。
本文所用术语“基因”指的是与生物功能相关的DNA的任何片段。因此,基因包括但不限于编码序列和/或编码序列表达所需的调控序列。基因也可以包括非表达的DNA片段,例如形成其他蛋白的识别序列的片段。可由各种来源获得基因,包括由感兴趣的来源克隆,或由已知或推测的序列信息合成,基因可包括经设计后具有所需参数的序列。
本文所用的“异源多核苷酸”或“异源核酸”或“异源基因”或“异源序列”或“外源DNA片段”指的是源自相对于特定的宿主细胞而言为外源的多核苷酸、核酸或DNA片段,或指来源相同,但对其原始形式进行过修饰的多核苷酸、核酸或DNA片段。宿主细胞中的异源基因包括相对于特定的宿主细胞而言虽是内源的,但已经被修饰过的基因。因此,该术语指的是相对于细胞而言为外源或异源的DNA片段,或指相对于细胞而言虽是同源的,但在宿主细胞核酸内的某个一般不会出现该组件的位置处出现的DNA片段。例如,与人Tf序列结合的酵母细胞天然信号序列是异源的。
本文所用的“分离的”核酸序列指的是经琼脂糖凝胶电泳测定,基本上不含其它核酸序列的核酸序列,例如至少约20%纯、优选至少约40%纯、更优选约60%纯、甚至更优选约80%纯、最优选约90%纯,和甚至最优选约95%纯的核酸序列。例如,通过基因工程中所用的标准克隆步骤,将核酸序列从其天然位置处转移至欲重新产生该序列的不同位点处,即获得分离的核酸序列。克隆步骤包括切下和分离所需的含有编码多肽的核酸序列的核酸片段,将所述片段插入载体分子,再将重组载体结合入宿主细胞,即可在所述细胞中复制多拷贝或多克隆的核酸序列。核酸序列可以源自基因组、cDNA、RNA、半合成、合成来源或其任意组合。
如本文所用,当DNA编码序列之间的框内融合导致DNA编码序列被翻译成融合多肽时,即可认为两个或多个DNA编码序列是“连接的”或“融合的”。与融合蛋白有关的术语“融合物”含有配体部分、柄部分和锚定部分。Tf融合蛋白是转铁蛋白部分与柄部分的融合物,并包括细胞壁连接组件。
本文所用的“经修饰的转铁蛋白”指的是与野生型转铁蛋白相比,其氨基酸序列中存在至少一个修饰的转铁蛋白分子。
本文所用的“经修饰的转铁蛋白融合蛋白”指的是至少一个经修饰的转铁蛋白分子(或其片段或变体)与配体复合或融合形成的蛋白质,所述蛋白质被融合至柄部分。
本文所用术语“核酸”或“多核苷酸”指的是单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。除非另有限定,该术语包括含有天然核苷酸的类似物的核酸,所述类似物具有与参照核酸类似的结合特性,并以类似于天然存在的核苷酸的方式被代谢。除非另有说明,特定的核酸序列也暗含其经保守修饰的变体(如简并密码子取代)和互补序列以及明确指出的序列。具体地说,通过产生其中一个或多个选定(或全部)的密码子的第三位被混合的-碱基和/或脱氧肌苷残基取代的序列,可获得简并密码子取代(Batzer等,(1991)Nucleic Acid Res.19:5081;Ohtsuka等,(1985)J.Biol.Chem.260:2605-2608;Cassol等,(1992);Rossolini等,(1994)Mol.Cell.Probes 8:91-98)。术语核酸可以与基因、cDNA和由基因编码的mRNA互换使用。
如本文所用,当使某个DNA片段处于与另一个DNA片段功能相关关系中时,可认为是“可操作相连的”。例如,当信号序列的DNA被表达成参与融合蛋白分泌的前蛋白质时,可认为它与编码本发明融合蛋白的DNA可操作相连;如果启动子或增强子促进序列转录,可认为它们与编码序列可操作相连。一般来说,可操作相连的DNA序列是邻接的,就信号序列或融合蛋白而言,所述DNA序列既是邻接的也是处于读码期的。然而,增强子无须再与其控制下转录的编码序列邻接。在此上下文中,通过在方便的限制性位点或者在衔接子或被插入以对其进行替代的连接子处完成连接。
本文所用术语“启动子”指的是参与结合RNA聚合酶以起始转录的DNA区域。
本文所用术语“重组体”指的是经重组DNA转化的细胞、组织或生物体。
本文所用的靶向实体、蛋白质、多肽或肽指的是与特定细胞类型特异性结合,因此可用于将Tf融合蛋白或化合物(药物或细胞毒性剂)特异性靶向该细胞类型的分子,特定细胞类型举例来说,正常的细胞如淋巴细胞,或异常的细胞如癌细胞。
本文所用的“治疗性蛋白质”指的是具有一种或多种治疗和/或生物活性的蛋白质、多肽、抗体、肽或其片段或变体。本发明包含的治疗性蛋白质包括但不限于蛋白质、多肽、肽、抗体和生物制品。本文中的术语肽、蛋白质和多肽可以互换使用。另外,术语“治疗性蛋白质”可指治疗性蛋白质的内源性或天然存在的关联物。显示出“治疗活性”的多肽或具有“治疗活性的”蛋白质指的是具有一种或多种与治疗性蛋白质(例如,如本文所述的或本领域已知的一种或多种治疗性蛋白质)有关的已知生物活性和/或治疗活性的多肽。作为一个非限制性的例子,“治疗性蛋白质”是用于治疗、预防或改善疾病、健康状况或失调的蛋白质。所述疾病、健康状况或失调可以是人或非人动物的疾病、健康状况或失调,例如可以用于兽医。
本文所用术语“转化”指的是将核酸(即核苷酸聚合物)转移至细胞内。本文所用术语“基因转化”指的是将DNA,特别是重组DNA转移和结合至细胞内。
本文所用术语“转化体”指的是经转化的细胞、组织或生物体。
本文所用术语“转基因”指的是以确保其功能的方式插入生物体、宿主细胞或载体中的核酸。
本文所用术语“转基因的”指的是通过多种转化方法中的一种,接受了外源基因或经修饰的基因,特别是编码经修饰的Tf融合蛋白的基因的细胞、细胞培养物、生物体、细菌、真菌、动物、植物及前述任一个的后代,其中相对于接受外源基因或经修饰的基因的生物体物种而言,外源基因或经修饰的基因得自相同或不同的物种。
“变体”指的是与参照核酸或多肽有所不同,但能保持其基本特性的多核苷酸或核酸。一般来说,变体整体上与参照核酸或多肽非常相似,并且在很多区域相同。本文所用的“变体”指的是本发明转铁蛋白融合蛋白的治疗性蛋白质部分,该部分的序列与天然治疗性蛋白质序列有所不同,但保留了天然蛋白质如本文所述的或本领域已知的至少一种功能性和/或治疗性特性。
本文所用术语“载体”泛指任何编码外源性核酸的质粒、噬菌粒或病毒。该术语还被解释为包括便于将核酸转移至病毒粒子或细胞中的非-质粒、非-噬菌粒和非-病毒化合物,例如聚赖氨酸化合物等。载体可以是适用于作为传递载体以将核酸或其突变体传递至细胞中的病毒载体,或者可以是适用于相同目的的非-病毒载体。用于将DNA传递至细胞和组织的病毒和非-病毒载体的例子是本领域众所周知的,描述于例如Ma等(1997,Proc.Natl.Acad.Sci.U.S.A.94:12744-12746)中。病毒载体的例子包括但不限于:重组牛痘病毒、重组腺病毒、重组逆转录病毒、重组腺伴随病毒、重组禽痘病毒等(Cranage等,1986,EMBOJ.5:3057-3063;国际专利申请号WO94/17810,公开于1994年8月18日;国际专利申请号WO94/23744,公开于1994年10月27日)。非-病毒载体的例子包括但不限于脂质体、DNA的多胺衍生物等。
本文所用术语“野生型”指的是天然存在的多核苷酸或多肽序列。
本文所用术语“骨架蛋白质”、“骨架多肽”或“骨架”指的是氨基酸序列(例如随机肽)能够与之融合的蛋白质。所述肽相对于骨架是外源的。
本文所用术语“随机肽序列”指的是由两个或多个氨基酸单体组成并通过随机步骤构建的氨基酸序列。随机肽包括框架或骨架基序,该基序可含有不变序列。随机肽序列可包括非变(即非随机)氨基酸部分。
本文所用术语“随机肽库”指的是编码一组随机肽的一组多核苷酸序列、由该多核苷酸序列编码的一组随机肽、以及包括该随机肽的融合蛋白。
本文所用术语“伪随机的”指的是具有受限可变性的一组序列,使得例如在一个位置的残基可变性程度与另在一个位置的残基可变性程度不同,但是任何伪随机的位置都允许残基在一定程度上变异,尽管是受限制的。
本文所用术语“确定序列框架”指的是在非随机基础上选择的一组确定序列,通常是在实验数据或结构数据的基础上选择,例如,确定序列框架可含有预计形成β-层状结构的一组氨基酸序列,或者在其它变异中含有亮氨酸拉链七肽重复基序、锌指域。“确定序列核”是包含受限范围可变性的一组序列。然而20个常规氨基酸的完全随机的10-单体的序列是(20)10个序列中的任一个,20个常规氨基酸的伪随机的10-单体的序列是(20)10个序列中的任一个,但是在特定位置和/或全部位置偏向于特定残基,如果确定序列核在每个残基位置都允许是任何可允许的20个常规氨基酸(和/或可允许的非常规氨基酸/亚氨基酸),其是少于潜在序列的最大值的序列子集。确定序列核或者部分地或者在特别选择的库成员序列的全长通常含有变异的残基位置和不变的残基位置,和/或含有变异的残基位置,但在该残基位置含有选自于氨基酸残基的确定子集等的残基。确定序列核既可以指氨基酸序列也可以指多核苷酸序列。
本文所用术语“连接子”或“间隔子”指的是连接两个分子(例如DNA结合蛋白和随机肽)的分子或分子簇,用于将两个分子置于所需的构型中,例如使随机肽以最小的来自于DNA结合蛋白的空间位阻与受体结合。
本文所用术语“可变片段”指的是含有随机序列、伪随机序列或确定核序列的新生肽的一部分。可变片段不仅含有可变的残基位置,还含有不变的残基位置,并且在可变的残基位置的残基可变程度可能被限制;两种选择取决于从业者的判断力。典型地,可变片段约3至20个氨基酸残基长,例如8至10个氨基酸长,然而可变片段可以更长并且可以含有抗体部分或受体蛋白,例如抗体片段、核酸结合蛋白和受体蛋白等。
本文所用术语“抗原表位”指的是能够形成结合相互作用的抗原或者其他大分子的一部分,该部分能与抗体的可变区结合口袋相互作用。典型地,这种结合相互作用显示为与CDR的一个或多个氨基酸残基的分子间接触。
本文所用术语“受体”、“靶”、或“试剂”指的是与给定配体具有亲和力的分子。受体可以是天然存在或合成的分子。受体可以以未被改变的状态使用或者被用作与其它种受体的集合体。受体可以直接地或经由特异结合物共价地或非共价地连在结合组件即配体上。受体的例子包括但不限于抗体(包括单克隆抗体)、与特异抗原决定物(例如在病毒、细胞或其他物质上)反应的抗血清、细胞膜受体、抗原、含有抗原表位的分子、复合的碳水化合物和糖蛋白、酶和激素受体。
本文所用术语“配体”或“配体部分”指的是能被特定的受体或试剂识别的分子,例如随机肽或可变片段序列。本领域技术人员会认识到分子(或大分子复合物)既可以是受体也可以是配体。
本文所用术语“融合的”、“复合的”或“可操作相连的”意思是指随机肽和骨架蛋白以使骨架结构稳定性的破坏最小化的方式连接在一起。
本文所用术语“单链抗体”指的是含有位于多肽连接中的VH域和VL域的多肽,通常经由间隔子肽(例如,[Gly-Gly-Gly-Gly-Ser]x SEQ IDNO.:17)连接并且在其氨基-末端和/或羧基-末端可以含有额外的氨基酸序列。例如,单链抗体可含有用于与编码多核苷相连的连接片段。例如,scFv是一种单链抗体。单链抗体通常是由一条或多条有至少10个连续氨基酸的多肽片段组成的蛋白质,所述多肽片段主要由免疫球蛋白超家族基因编码(例如,参见The Immunoglobulin Gene Superfamily,A.F.Williams和A.N.Barclay,Immunoglobulin Genes中,T.Honjo,F.W.Alt,和T.H.Rabbitts,编辑,(1989),Academic Press:San Diego,Calif.,361-387页,在此全文引入作为参考),最经常由啮齿动物、非人灵长类动物、鸟、猪、牛、绵羊、山羊或人的重链或轻链基因序列编码。功能性单链抗体通常含有免疫球蛋白超家族基因产物的足够的部分以保持与特异性靶分子结合的特性,特异性靶分子典型的是受体或抗原(抗原表位)。
本文所用术语“互补决定区”和“CDR”指的是如Kabat和ChothiaCDR定义解释的现有技术公认的术语,通常被认为是超变区或超变环。参见Chothia和Lesk,(1987),J.Mol.Biol.196:901;Chothia等,(1989),Nature 342:877;E.A.Kabat等,Sequences of Proteins of ImmunologicalInterest(National Institutes of Health,Bethesda,Md.),(1987);和Tramontano等,(1990),J.Mol.Biol.215:175。可变区域典型地含有天然存在的免疫球蛋白链的氨基-末端约105-115个氨基酸,例如氨基酸1-110,尽管或略短或略长的可变域也适于形成单链抗体。
免疫球蛋白轻链或重链可变区由被3个超变区中断的“框架”区组成,也叫CDR。框架区和CDR的长度前面已经定义了。参见,“Sequencesof Proteins of Immunological Interest”,E.Kabat等,4th Ed.,U.S.Department of Health and Human Services,Bethesda,Md.(1987)。不同轻链或重链框架区的序列在物种内相对保守。如本文所用,“人框架区”是与天然存在的人免疫球蛋白的框架区基本上(约85%以上,通常90-95%以上)相同的框架区。抗体的框架区是组成性轻链和重链的组合框架区,用于定位和排列CDR。CDRs主要负责与抗原的抗原表位结合。
除非另有定义,在此所用的所有技术和科学术语具有与本发明所属领域普通技术人员通常所理解的相同的含义。虽然任何类似或等同于在此所描述的那些方法和材料可以被用于实施或验证本发明,但仅描述了优选的方法和材料。
转铁蛋白和转铁蛋白修饰物
本发明的融合蛋白包括转铁蛋白(Tf)或其部分,其能够将配体(例如随机肽或CDR)展示给受体或试剂。Tf部分与柄部分的N-末端融合。融合蛋白的Tf蛋白质或其部分可指融合蛋白的Tf“区”、“区域”或“部分”。如本文所用,转铁蛋白融合蛋白是与柄部分融合的转铁蛋白或部分,其含有细胞壁连接组件和任选含有锚定部分,或者是与细胞膜锚定直接融合的转铁蛋白或部分。
任何转铁蛋白都可以用于制备本发明的经修饰的Tf融合蛋白。例如,野生型人Tf(Tf)是679个氨基酸的蛋白质,约75kD(不计糖基化),它具有两个似乎源自基因复制的主要的小叶或域,N(约330个氨基酸)和C(约340个氨基酸)。参见GenBank登录号NM001063、XM002793、M12530、XM039845、XM039847和S95936(www.ncbi.nlm.nih.gov),所有这些以及SEQ ID NO.:1、2和3皆在此全文引入作为参考。这两个域随着时间而相互演化偏离,但仍保持了高度的同一性/相似性。
每个N域和C域进一步被分成两个亚域,N1和N2,C1和C2。Tf的功能是将铁转运到机体细胞。该过程由在所有细胞上,特别是处于活性生长中的细胞上表达的Tf受体(TfR)介导。TfR识别铁结合型Tf(每个受体结合两分子铁结合型Tf),然后发生内吞作用,同时将TfR/Tf复合物转运到内涵体,此时局部pH值的下降导致结合铁的释放,TfR/Tf复合物重新循环至细胞表面并释放出Tf(非-铁结合型被称为apoTf)。受体结合主要通过Tf的C域。由于非糖基化的铁结合Tf与受体结合,因此C域中的两个糖基化位点似乎并不参与受体结合。
每个Tf分子能携带两个铁离子(Fe3+)。它们在N1和N2,C1和C2亚域之间的空间内复合,导致分子的构象改变。
在人转铁蛋白中,铁结合位点至少含有SEQ ID NO.:3的氨基酸Asp 63(含有天然Tf信号序列的SEQ ID NO.:2的Asp 82)、Asp 392(SEQID NO.:2的Asp411)、Tyr 95(SEQ ID NO.:2的Tyr 114)、Tyr 426(SEQ IDNO.:2的Tyr 445)、Tyr 188(SEQ ID NO.:2的Tyr 207)、Tyr 514或517(SEQ ID NO.:2的Tyr 533或Tyr 536)、His 249(SEQ ID NO.:2的His 268)和His 585(SEQ ID NO.:2的His 604)。铰链区至少含有SEQ IDNO.:3的N域氨基酸残基94-96、245-247和/或316-318,以及C域氨基酸残基425-427、581-582和/或652-658。碳酸盐结合位点至少含有SEQ ID NO.:3的氨基酸Thr 120(SEQ ID NO.:2的Thr 139)、Thr452(SEQ ID NO.:2的Thr 471)、Arg 124(SEQ ID NO.:2的Arg 143)、Arg 456(SEQ ID NO.:2的Arg 475)、Ala 126(SEQ ID NO.:2的Ala145)、Ala 458(SEQ ID NO.:2的Ala 477)、Gly 127(SEQ ID NO.:2的Gly 146)和Gly 459(SEQ ID NO.:2的Gly 478)。
在本发明的一个实施方案中,融合蛋白包括经修饰的人转铁蛋白,但任何动物Tf分子都可用于制备本发明的融合蛋白,包括人Tf变体、奶牛、猪、绵羊、狗、兔、大鼠、小鼠、仓鼠、echnida、鸭嘴兽、鸡、青蛙、天蛾幼虫、猴、猿以及其它种类的牛、犬和禽类。所有这些Tf序列都可以从GenBank和其它公共数据库中方便地获得。人Tf核苷酸序列是可以获得的(参见SEQ ID NO.:1、2和3以及上文所述的登录号,它们可从www.ncbi.nlm.nih.gov/获得),可以使用这些序列来制备Tf或Tf域与所选择的治疗性分子之间的基因融合物。融合物也可以由相关的分子,如乳转铁蛋白(乳铁蛋白,GenBank登录号NM_002343)或黑色素转铁蛋白制备。
乳铁蛋白(Lf),一种天然防御性铁-结合蛋白,已经被发现具有抗细菌、抗真菌、抗病毒、抗肿瘤和抗炎活性。该蛋白质存在于外分泌物中,所述外分泌物通常暴露于正常菌群:乳汁、眼泪、鼻分泌液、唾液、支气管粘液、胃肠液、宫颈-阴道粘液和精液中。另外,Lf是循环多形核嗜中性粒细胞(PMN)的次级特异性颗粒的主要成分。在脓毒性区域,脱辅基蛋白质被释放于脱粒后的PMN上。Lf的主要功能是清除液体和发炎区域的游离铁,从而抑制自由基-介导的损害,并降低金属侵害微生物和肿瘤细胞的可用性。在检查成人125I Lf周转率的研究中,证实Lf能被肝脏和脾脏快速吸收,放射性可在肝脏和脾脏中维持几周(Bennett等,(1979),Clin.Sci.(Lond.)57:453-460)。
在一个实施方案中,本发明的融合蛋白的转铁蛋白部分包括转铁蛋白剪切变体。在一个实施例中,转铁蛋白剪切变体可以是人转铁蛋白的剪切变体。在一个特定实施例中,人转铁蛋白剪切变体可以是Genbank登录号AAA61140的蛋白。
在另一个实施方案中,本发明的融合蛋白的转铁蛋白部分包括乳铁蛋白的剪切变体。在一个实施例中,人血清乳铁蛋白剪切变体可以是嗜中性粒细胞乳铁蛋白的新剪切变体。在一个特定的实施方案中,嗜中性粒细胞乳铁蛋白剪切变体可以是Genebank登录号AAA59479的蛋白。在另一个特定实施方案中,嗜中性粒细胞乳铁蛋白剪切变体可以包含如下氨基酸序列EDCIALKGEADA(SEQ ID NO.:4),其包括新的剪切变异区。
也可以使用黑素转铁蛋白(GenBank登录号NM_013900,鼠科黑素转铁蛋白)制备融合蛋白。黑素转铁蛋白是以高含量存在于恶性黑素瘤细胞中的糖基化蛋白质,最初被命名为人黑素瘤抗原p97(Brown等,1982,Nature,296:171-173)。其与人血清转铁蛋白、人乳铁蛋白和鸡转铁蛋白存在高度序列同一性(Brown等,1982,Nature,296:171-173;Rose等,Proc.Natl.Acad.Sci.,1986,83:1261-1265)。但是,与这些蛋白不同,还没有确定黑素转铁蛋白的细胞受体。黑素转铁蛋白与铁可逆地结合,并且存在两种形式,其中之一是通过糖基磷脂酰肌糖锚定结合到细胞膜上,而另一种形式是可溶的并且被活跃地分泌(Baker等,1992,FEBSLett,298:215-218;Alemany等,1993,J.Cell Sci,104:1155-1162;Food等,1994,J.Biol.Chem.274:7011-7017)。
可以使用任何Tf蛋白质、片段、域或经改造的域制备经修饰的Tf融合物。例如,可使用含或不含天然Tf信号序列的全长Tf序列制备融合蛋白。也可使用单个Tf域,如各个N或C域制备转移体。还可使用双Tf域,例如双N域或双C域制备转移体。在一些实施方案中,制备了治疗性蛋白质与单个C域的融合物,其中改变C域以减少、抑制或防止糖基化、铁结合和/或Tf受体结合。在其它实施方案中,由于Tf糖基化位点存在于C域并且N域其本身不结合铁或Tf受体,因此使用单个N域是有利的。在一个实施方案中,Tf融合蛋白含有被高水平表达的单个N域。
如本文所用,经修饰以发挥N-样域作用的C端域或小叶经修饰从而表现出基本上类似于天然的或野生型的N域或小叶的糖基化模式或铁结合特性。在一个实施方案中,通过用将相关C域区域或氨基酸取代为存在于天然或野生型的N域的相应区域或位点上的那些氨基酸从而对C域或小叶进行修饰使其不被糖基化并且不结合铁。
如本文所用,包含“两个N域或小叶”的Tf部分包括Tf分子,该Tf分子被修饰成用第二天然或野生型N域或小叶或者经修饰的N域或小叶代替天然C域或小叶,或者该Tf分子含有已被修饰从而作用实质上类似于野生型或经修饰的N域的C域。参见美国临时申请60/406,977,在此全文引入作为参考。
通过重叠两个域(Swiss PDB Viewer 3.7b2,Iterative Magic Fit)的三维结构和通过直接氨基酸比对(ClustalW多重比对)分析两个域,表明这两个域随着时间而演化偏离。氨基酸比对表明这两个域之间具有42%同一性和59%相似性。但是,由于结构相当,约80%的N域与C域匹配。与N域相比,C域还具有几个额外的二硫键。
N域和C域的分子模型比对显示如下结构等同物:
  N域(1-330) 4-24   36-7275-88 94-136 138-139 149-164 168-173   178-198200-214 219-255 259-260 263-268 271-275 279-280   283-288290-304 309-327
C域(340-679) 340-361 365-415   425-437439-468 470-471 475-490 492-497 507-542 555-591 593-594 597-602 605-609 614-615 620-640 645-663
两个域的二硫键对比如下:
Figure A20078005062300331
在一个实施方案中,融合蛋白的转铁蛋白区包括至少两个转铁蛋白的N端小叶。在另一个实施方案中,融合蛋白的转铁蛋白部分包括至少两个源自人血清转铁蛋白的转铁蛋白的N端小叶。
在另一个实施方案中,融合蛋白的转铁蛋白区包括、含有至少两个转铁蛋白的N端小叶或至少由两个转铁蛋白的N端小叶组成,该N端小叶在选自SEQ ID NO.:3的Asp63、Gly65、Tyr95、Tyr188和His249的至少一个氨基酸残基上具有突变。
在另一个实施方案中,经修饰的融合蛋白的转铁蛋白区包括在SEQ IN NO.:3的Lys206或His207具有突变的重组人血清转铁蛋白N-末端小叶突变体。
在另一个实施方案中,融合蛋白的转铁蛋白区包括、含有至少两个转铁蛋白的C端小叶,或基本由或由至少两个转铁蛋白的C端小叶组成。在另一个实施方案中,融合蛋白的转铁蛋白部分包括至少两个源自人血清转铁蛋白的转铁蛋白的C端小叶。
在进一步的实施方案中,C端小叶突变体在SEQ ID NO.:3的Asn413和Asn611的至少一处还包括不允许糖基化的突变。
在另一个实施方案中,转铁蛋白部分包括至少两个转铁蛋白的C端小叶,该转铁蛋白在选自SEQ ID NO.:3的Asp392、Tyr426、Tyr514、Tyr517和His585的至少一个氨基酸残基具有突变,其中该突变体保留结合金属离子的能力。在一个可选择的实施方案中,转铁蛋白区包括至少两个转铁蛋白的C端小叶,该转铁蛋白在选自SEQ ID NO.:3的Tyr426、Tyr514、Tyr517和His585的至少一个氨基酸残基具有突变,其中该突变体与金属离子结合的能力降低。在另一个实施方案中,转铁蛋白区包括至少两个转铁蛋白的C端小叶,该转铁蛋白在选自SEQID NO.:3的Asp392、Tyr426、Tyr517和His585的至少一个氨基酸残基具有突变,其中该突变体不具有结合金属离子的能力并基本上起类似于N域的作用。
在一些实施方案中,Tf或Tf区应足够长,从而当融合蛋白的Tf或Tf区和配体从融合蛋白残余物断裂时,与非融合状态(即未融合至Tf)的配体的体内循环半衰期、血清稳定性(半衰期)、体外稳定性或生物利用度相比,增加配体(即治疗剂)的体内循环半衰期、血清稳定性、体外溶液稳定性或生物利用度。所述稳定性、体内循环半衰期或生物利用度的增加可以是超过未融合的配体部分区域的约30%、50%、70%、80%、90%或更高的增加。在某些情况下,含有经修饰的转铁蛋白的配体部分与非融合状态的配体相比表现出约1天或更多天、1-2天或更多天、3-5天或更多天、5-10天或更多天、10-15天或更多天、10-20天或更多天、约12-18天或约14-17天的血清半衰期。
当Tf的C域是融合蛋白的一部分时,可突变两个N-联糖基化位点,即对应于SEQ ID NO.:3的N413和N611的氨基酸残基,以在酵母系统中表达从而防止糖基化或高甘露糖基化并延长融合蛋白(用于制备脱涎-Tf,或在某些情况下制备单涎-Tf或双涎-Tf)的血清半衰期。除了对应于N413和N611的Tf氨基酸外,对N-X-S/T糖基化位点内或临近的残基进行突变可防止或实质上减少糖基化。参见Funk等的美国专利5,986,067。例如,本发明包括在S415和T613氨基酸的修饰。在一个实施方案中,转铁蛋白部分含有S415A和T613A的修饰。在该实施方案中,氨基酸的修饰相应于SEQ ID NO.:3的S415和T613。
已经报道,在巴斯德毕赫氏酵母(Pichia Pastoris)中表达的Tf的N域在S32处被单个己糖O-联糖基化,也可对此位点进行突变或修饰以防止这种糖基化。此外,可以通过在一个或多个PMT基因突变在酵母宿主细胞内减少或消除O-联糖基化。
因此,在本发明的一个实施方案中,融合蛋白包括经修饰的转铁蛋白分子,其中转铁蛋白表现出减少的糖基化,其包括但不限于脱涎-、单涎-和双涎形式的Tf。在另一个实施方案中,融合蛋白的转铁蛋白部分包括经突变后可防止糖基化的重组转铁蛋白突变体。在另一个实施方案中,融合蛋白的转铁蛋白部分包括完全被糖基化的重组转铁蛋白突变体。在另一个实施方案中,融合蛋白的转铁蛋白区包括经突变后可防止糖基化的重组人血清转铁蛋白突变体,其中SEQ ID NO.:3的Asn413和Asn611中的至少一个被突变成不允许糖基化的氨基酸。在另一个实施方案中,融合蛋白的转铁蛋白区包括经突变后可防止或实质性减少糖基化的重组人血清转铁蛋白突变体,其中可对N-X-S/T糖基化位点内的残基进行突变。此外,通过突变丝氨酸或苏氨酸残基可以减少或防止糖基化。例如,在本发明的一个实施方案中,融合蛋白的转铁蛋白区包括经突变后可防止糖基化的重组人血清转铁蛋白突变体,其中SEQ ID NO.:3的Ser415和Thr613中的至少一个被突变成不允许糖基化的氨基酸。进一步地,已知将X改变为脯氨酸能抑制糖基化。
正如下文所详细讨论的那样,可以对本发明的含有经修饰的Tf的经修饰Tf融合蛋白进行改造以使其不与铁结合和/或不与Tf受体结合。在本发明的其它实施方案中,铁结合得以保留,可以使用Tf的铁结合能力将治疗性蛋白质或肽传递至细胞内部和/或使其穿越血脑屏障(BBB)。当负载有铁时,单独的N域不与TfR结合,与铁结合的C域会与TfR结合,但结合亲和性不同于完整的分子。
在另一个实施方案中,转铁蛋白融合蛋白的转铁蛋白区包括具有突变的重组转铁蛋白突变体,其中突变体未保留结合金属离子的能力。在可替代的实施方案中,转铁蛋白融合蛋白的转铁蛋白区包括具有突变的重组转铁蛋白突变体,其中相对于野生型血清转铁蛋白而言,突变体对金属离子具有较弱的结合亲和性。在可替代的实施方案中,转铁蛋白融合蛋白的转铁蛋白区包括具有突变的重组转铁蛋白突变体,其中相对于野生型血清转铁蛋白而言,突变体对金属离子具有较强的结合亲和性。
在另一个实施方案中,转铁蛋白区包括具有突变的重组转铁蛋白突变体,其中突变体未保留结合转铁蛋白受体的能力。在可替代的实施方案中,转铁蛋白区包括具有突变的重组转铁蛋白突变体,其中相对于野生型血清转铁蛋白而言,突变体对转铁蛋白受体具有较弱的结合亲和性。在可替代的实施方案中,转铁蛋白区包括具有突变的重组转铁蛋白突变体,其中相对于野生型血清转铁蛋白而言,突变体对转铁蛋白受体具有较强的结合亲和性。
在另一个实施方案中,转铁蛋白区包括具有突变的重组转铁蛋白突变体,其中突变体未保留结合碳酸盐离子的能力。在可替代的实施方案中,转铁蛋白区包括具有突变的重组转铁蛋白突变体,其中相对于野生型血清转铁蛋白而言,突变体对碳酸盐离子具有较弱的结合亲和性。在可替代的实施方案中,转铁蛋白部分包括具有突变的重组转铁蛋白突变体,其中相对于野生型血清转铁蛋白而言,突变体对碳酸盐离子具有较强的结合亲和性。
在另一个实施方案中,转铁蛋白区包括重组人血清转铁蛋白突变体,其中至少一个选自SEQ ID NO.:3的Asp63、Gly65、Tyr95、Tyr188、His249、Asp392、Tyr426、Tyr514、Tyr517和His585的氨基酸残基具有突变,其中突变体保留了结合金属离子的能力。在可替代的实施方案中,重组人血清转铁蛋白突变体在至少一个选自SEQ ID NO.:3的Asp63、Gly65、Tyr95、Tyr188、His249、Asp392、Tyr426、Tyr514、Tyr517和His585的氨基酸残基具有突变,其中突变体结合金属离子的能力降低。在另一个实施方案中,重组人血清转铁蛋白突变体在至少一个选自SEQ ID NO.:3的Asp63、Gly65、Tyr95、Tyr188、His249、Asp392、Tyr426、Tyr517和His585的氨基酸残基具有突变,其中突变体未保留结合金属离子的能力。
在另一个实施方案中,转铁蛋白区包括在SEQ ID NO.:3的Lys206或His207具有突变的重组人血清转铁蛋白突变体,其中与野生型人血清转铁蛋白相比,突变体对金属离子具有较强的结合亲和性(参见美国专利5,986,067,其全文引入作为参考)。在可替代的实施方案中,转铁蛋白部分包括在SEQ ID NO.:3的Lys206或His207具有突变的重组人血清转铁蛋白突变体,其中与野生型人血清转铁蛋白相比,突变体对金属离子具有较弱的结合亲和性。在进一步的实施方案中,转铁蛋白区包括在SEQ ID NO.:3的Lys206或His207具有突变的重组人血清转铁蛋白突变体,其中突变体不与金属离子结合。
可以使用任何能利用的技术制备本发明的融合蛋白,包括但不限于常用的分子技术,例如Sambrook等,Molecular Cloning:A LaboratoryManual,2nd Ed.,Cold Spring Harbor Laboratory Press,1989中公开的技术。当使用本领域众所周知的用于定点诱变的技术进行核苷酸取代时,优选对编码的氨基酸的次要特性进行改变,即进行保守的氨基酸取代,但是,也可以进行其它非保守的取代,尤其是当在制备经修饰的转铁蛋白区,例如表现出减少的糖基化、降低的铁结合等的经修饰的融合蛋白时。特别可预期的是氨基酸取代、小的缺失或插入(一般为1至约30个氨基酸);转铁蛋白域之间的插入;小的氨基-或羧基-末端延伸,如氨基-末端的甲硫氨酸残基,或转铁蛋白域之间或连接转铁蛋白和治疗性蛋白质或肽、配体、或抗体可变区或柄区的少于50、40、30、20或10个残基的小连接肽;或便于纯化的小延伸,如聚-组氨酸序列段,抗原表位或结合域。
保守氨基酸取代的例子有:相同组的氨基酸内的取代,如碱性氨基酸(如精氨酸、赖氨酸、组氨酸),酸性氨基酸(如谷氨酸和天冬氨酸),极性氨基酸(如谷氨酰胺和天冬酰胺),疏水性氨基酸(如亮氨酸、异亮氨酸、缬氨酸),芳香族氨基酸(如苯丙氨酸、色氨酸、酪氨酸)和小氨基酸(如甘氨酸、丙氨酸、丝氨酸、苏氨酸、甲硫氨酸)组内发生的取代。
非-保守取代包括用一组氨基酸取代另一组氨基酸。例如,非-保守取代包括用极性氨基酸取代疏水性氨基酸。有关核苷酸取代的一般性描述,可参见例如Ford等(1991),Prot.Exp.Pur.2:95-107。非-保守取代、缺失和插入可特别用于制备本发明的Tf融合蛋白,优选为转移体,所述Tf融合蛋白,优选为转移体表现出与铁的结合降低或消失,融合蛋白与Tf受体的结合降低或消失。
在本发明的多肽和蛋白质中,根据下述常规列表,按照下列系统命名氨基酸:
氨基酸表
  氨基酸   单字母符号   三字母符号
  丙氨酸   A   Ala
  精氨酸   R   Arg
  天冬酰胺   N   Asn
  天冬氨酸   D   Asp
  半胱氨酸   C   Cys
  谷氨酰胺   Q   Gln
  谷氨酸   E   Glu
  甘氨酸   G   Gly
  组氨酸   H   His
  异亮氨酸   I   Ile
  亮氨酸   L   Leu
  赖氨酸   K   Lys
  甲硫氨酸   M   Met
  氨基酸   单字母符号   三字母符号
  苯丙氨酸   F   Phe
  脯氨酸   P   Pro
  丝氨酸   S   Ser
  苏氨酸   T   Thr
  色氨酸   W   Trp
  酪氨酸   Y   Tyr
  缬氨酸   V   Val
通过在对应于一个或多个SEQ ID NO.:3的Tf N域残基Asp63、Tyr95、Tyr188、His249和/或C域残基Asp392、Tyr426、Tyr514和/或His585的氨基酸残基进行突变,包括缺失、取代或插入,即可降低或破坏铁结合和/或受体结合。通过突变SEQ ID NO.:3的氨基酸Lys206、Hys207或Arg632也可影响铁结合。通过在对应于一个或多个SEQ ID NO.:3TfN域残基Thr120、Arg124、Ala126、Gly127和/或C域残基Thr452、Arg456、Ala458和/或Gly459的氨基酸残基进行突变,包括缺失、取代或插入,即可降低或破坏碳酸盐结合。碳酸盐结合的降低或破坏可不利地影响铁和/或受体结合。
通过在对应于一个或多个上文针对铁结合所述的TfN域残基的氨基酸残基进行突变,包括缺失、取代或插入,即可降低或破坏与Tf受体的结合。
如上所述,通过对对应于C域残基N413和/或N611的N-X-S/T位点的一个或多个Tf C域残基所对应的氨基酸残基进行突变,包括缺失、取代或插入,即可减少或防止糖基化(参见美国专利5,986,067)。例如,可将N413和/或N611突变成Glu残基,也可将临近氨基酸突变成Glu残基。在一个实施方案中,将S415和/或T613突变成Ala残基。
当未修饰本发明的Tf融合蛋白以防止糖基化、铁结合、碳酸盐结合和/或受体结合时,可从融合蛋白上去除或断裂糖基化、铁和/或碳酸盐离子。例如,可使用可获得的去糖基化酶从融合蛋白上裂解糖基化残基,特别是与Tf部分连接的糖残基,可使用糖基化酶有缺陷的酵母防止糖基化,和/或可在能防止糖基化的试剂(如衣霉素)存在时培养重组细胞。
通过用去糖基化酶处理融合蛋白,可以降低或完全去除融合蛋白上的碳酸盐。去糖基化酶在本领域是公知的。去糖基化酶的例子包括但不限于半乳糖苷酶、PNGase A、PNGase F、葡萄糖苷酶、甘露糖苷酶、岩藻糖苷酶和内H去糖基化酶(Endo H deglycosylase)。
可对Tf进行更多的突变以改变Tf的三维结构,如对铰链区进行修饰以防止出现铁结合和Tf受体识别所需的构象改变。例如可在N域氨基酸残基94-96、245-247和/或316-318以及C域氨基酸残基425-427、581-582和/或652-658中或其附近进行突变。另外,可在这些位点的侧翼区内或其附近进行突变以改变Tf的结构和功能。
在本发明的一个方面,融合蛋白可用作载体蛋白以延长配体的半衰期或生物利用度,以及在某些情况下将配体传递至细胞内部,并且融合蛋白保留了穿越血脑屏障的能力。在可替代的实施方案中,融合蛋白包括经修饰的转铁蛋白分子,其中转铁蛋白未保留穿越血脑屏障的能力。
在另一个实施方案中,融合蛋白包括经修饰的转铁蛋白分子,其中转铁蛋白分子保留了与转铁蛋白受体结合并将抗体可变区转运至细胞内部的能力。在可替代的实施方案中,融合蛋白包括经修饰的转铁蛋白分子,其中转铁蛋白分子未保留与转铁蛋白受体结合并将抗体可变区转运至细胞内部的能力。
在进一步的实施方案中,融合蛋白包括经修饰的转铁蛋白分子,其中转铁蛋白分子保留了与转铁蛋白受体结合并将抗体可变区转运至细胞内部的能力,但未保留穿越血脑屏障的能力。在可替代的实施方案中,融合蛋白包括经修饰的转铁蛋白分子,其中转铁蛋白分子保留了穿越血脑屏障的能力,但未保留与转铁蛋白受体结合并将抗体可变区转运至细胞内部的能力。
转铁蛋白融合蛋白
本发明的融合蛋白可含有一个或多个拷贝的与Tf蛋白质的N-末端和/或C-末端连接的配体、抗体可变区或随机肽。在一个实施方案中,配体部分与Tf蛋白质的N-末端连接。在一些实施方案中,配体、可变区或肽既与Tf蛋白质的N-末端连接也与Tf蛋白质的C-末端连接,融合蛋白可在Tf的任一端或两端含有一个或多个这些区域的等同物。
在其它实施方案中,将一个或多个配体插入到转铁蛋白肽中,例如在Tf蛋白质的已知域插入,例如插入到Tf的一个或多个环中。参见Ali等,(1999)J.Biol.Chem.274(34):24066-24073。
在本发明的一个实施方案中,将配体插入到转铁蛋白的N小叶。例如,本发明还包括在如下表所示的从小叶的N1和N2域的其它位置或其周围作出的一个或多个插入。
  N1   N2
  Asp33   Ser105
  Asn55   Glu141
  Asn75   Asp166
  Asp90   Gln184
  Gly257   Asp197
  Lys280   Lys217
  His289   Thr231
  Ser298   Cys241
在另一个实施方案中,配体在转铁蛋白的表面暴露的氨基酸残基处含有随机化的氨基酸残基。随机化的氨基酸残基可定位于表面暴露的氨基酸的一个区域或多于一个区域。例如,在由SEQ ID NO.:3的约氨基酸残基85至约氨基酸残基92、约氨基酸残基276至约氨基酸残基298或约氨基酸残基207至约氨基酸残基217组成的一个或多个区域中可含有随机化的氨基酸。在本发明的一个实施方案中,随机化的氨基酸残基定位于SEQ ID NO.:3的位置Y85、G86、S87、E89、D90和Q92。在另一个实施方案中,随机化的氨基酸残基定位于SEQ ID NO.:3的位置K276、D277、K280、Q283、S286和D297和任选位置S298。在另一个实施方案中,随机化的氨基酸残基定位于SEQ ID NO.:3的位置H207、S208、F211、E212和A215和任选位置N216和/或K217。
尽管每个区域随机化的氨基酸残基的数量可以变化,但优选每个区域至少约3个、至少约4个、至少约5个、至少约6个、至少约7个、至少约8个、至少约9个或至少约10个或更多的氨基酸残基是随机化的。
在本发明的一个实施方案中,配体部分包括已知的配体结合序列,例如能与整联蛋白结合的配体序列,包括但不限于α4整联蛋白(例如a4b1和a4b7)。这种配体包括但不限于VCAM和MadCAM。参见Jackson,2002,Current Pharmaceutical Design.*:1229-1253,在此为所有目的全文引入。
导致组织损伤和疾病的炎症过程部分被表达于白细胞表面的α4整联蛋白,a4b1和a4b7介导。这些糖蛋白受体经由与在感染组织中表达的它们的第一配体,血管细胞粘附分子(VCAM)和黏膜地址素细胞粘附分子(MAdCAM)的相互作用从而调节细胞粘附。通过结合,在细胞表面上的组合整联蛋白/CAM的相互作用导致白细胞稳固地粘附于血管壁,然后进入感染组织。在各种生物体内升高的细胞粘附分子(CAM)的表达与几种自身免疫疾病有关。在本发明的一个实施方案中,可以向受试对象施用含有一个或多个能与α4整联蛋白或其CAM配体结合的肽的转移体(即含有转铁蛋白和配体的融合蛋白)以治疗和/或调节炎症。在本发明的一个实施方案中,向受试对象施用含有一个或多个能与α4整联蛋白或其CAM配体结合的肽的转移体以治疗自身免疫疾病。
在本发明的另一个实施方案中,配体部分含有已知的配体结合序列和随机化的氨基酸残基,该随机化的氨基酸残基或者在配体结合序列中或者在配体结合序列的任一端或者两端。例如本发明包括含有被随机化的氨基酸残基围绕的整联蛋白结合序列RGD的转铁蛋白融合蛋白。该融合蛋白可被插入到转铁蛋白部分中,例如,插入到SEQ IDNO.:3的氨基酸289和290之间。在本发明的一个实施方案中,整联蛋白结合序列和随机化的肽配体部分是CXXXRGDXXXC,其中X是随机化的氨基酸残基。在本发明的另一个实施方案中,整联蛋白结合序列和随机化的肽配体部分是XXXRGDXXX。本发明还包括但不限于被随机化的肽围绕的整联蛋白结合序列KGD和被随机化的肽围绕的整联蛋白结合序列LDV。
在本发明的另一个实施方案中,配体部分是抗体可变区。在该实施方案中,通常,本发明的转铁蛋白融合蛋白含有一个经修饰的源自转铁蛋白的区域和一个抗体可变区。然而可以使用多于一个的抗体可变区制备本发明的转铁蛋白融合蛋白,从而制备多功能的经修饰的Tf融合蛋白。
在一个实施方案中,本发明的融合蛋白含有融合至转铁蛋白分子或其部分的抗体可变区或其部分。在另一个实施方案中,本发明的融合蛋白含有融合至转铁蛋白分子的N端的抗体可变区。在可替代的实施方案中,本发明的融合蛋白含有融合至转铁蛋白分子C端的抗体可变区。在进一步的实施方案中,本发明的融合蛋白含有融合至抗体可变区N端的转铁蛋白分子。在可替代的实施方案中,本发明的融合蛋白含有融合至抗体可变区C端的转铁蛋白分子。
本发明还提供了含有融合至经修饰的转铁蛋白分子或其部分的抗体可变区或其部分的融合蛋白。
在其它实施方案中,本发明的融合蛋白含有融合至经修饰的转铁蛋白的N-末端和C-末端两端的抗体可变区。在另一个实施方案中,在N-末端和C-末端融合的抗体可变区结合相同的抗原。而且,与相同抗原结合的抗体可变区可源自不同的抗体,从而与同一靶的不同的抗原表位结合。在可替代的实施方案中,在N-末端和C-末端融合的抗体可变区结合不同的抗原。在其它可替代的实施方案中,融合至N-末端和C-末端的抗体可变区结合不同的抗原,可用于活化两种不同的细胞以治疗或预防疾病、失调或健康状况。在另一个实施方案中,在N-末端和C-末端融合的抗体可变区结合不同的抗原,可用于桥联不同的抗原以治疗或预防本领域已知的在患者中通常同时出现的疾病或失调。
此外,还可通过在经修饰的转铁蛋白的内部区域插入感兴趣的抗体可变区,例如与治疗性蛋白质或其片段或变体结合的单链抗体,制备本发明的转铁蛋白融合蛋白。经修饰的转铁蛋白的内部区域包括但不限于环区、铁结合位点、铰链区、碳酸氢盐结合位点或受体结合域。
在经修饰的转铁蛋白分子的蛋白序列内存在许多通过二硫键稳定的环或转角。这些环可用于插入或内部融合治疗活性肽(优选抗体可变区,特别是那些二级结构对功能是必须的肽)或治疗性蛋白质(优选抗体可变区)以产生具有特定生物活性的经修饰的转铁蛋白分子。
在将配体例如抗体可变区,优选CDR,插入或代替Tf分子的至少一个环时,可以在除了Tf的其它区域之外的任何表面暴露环区域中进行插入。例如,可以在含有Tf氨基酸32-33、74-75、256-257、279-280和288-289的环内插入。参见Ali等,supra。如前所述,也可在Tf的其它区域内进行插入,例如铁和碳酸氢盐结合位点、铰链区和如下所详述的受体结合域。对用于插入蛋白或肽的修饰/替代响应的Tf蛋白序列中的环还可用于建立随机肽插入物的筛选库。在克隆至Tf域中和/或融合至Tf末端之前可以使用任何步骤制备用于产生肽库的核酸插入物,包括可利用的噬菌体和细菌展示系统。
Tf的N-末端是游离的并指向远离融合蛋白体方向。在本发明的一个实施方案中,在转铁蛋白的N-末端融合配体。这种融合可包括连接子区,例如但不限于聚甘氨酸带或PEAPTD连接子(SEQ ID NO.:18)以使配体和Tf分隔开。
Tf的C-末端似乎被从C-末端起6个氨基酸的二硫键隐藏或部分隐藏和保护。在人Tf中,C-末端氨基酸是脯氨酸,脯氨酸或者指向远离融合蛋白方向或者指向分子体内部,取决于其被调整的方向。在本发明的一些实施方案中,可在C-末端使用连接子或间隔子部分。N-末端附近也有脯氨酸。在本发明的一个方面,可以修饰或用其它氨基酸代替在N-或C-末端的脯氨酸。在本发明的另一个方面,可以除去C-末端的二硫键使之不再连接于C-末端。
柄部分
本发明的柄部分在其N-末端与转铁蛋白部分或配体融合并任选可在其C-末端与锚定部分融合。当在酵母细胞内表达时,柄部分的C-末端定位在细胞内,例如定位在细胞壁内。在本发明的一个实施方案中,柄部分担当细胞壁连接组件将融合蛋白共价地或非-共价地与酵母细胞的的细胞壁结合。
本发明的柄部分含有棒-样或刷-样构象。这种类型的构象是中度至高度糖基化的肽所特有的。本发明的柄部分含有N-多糖或O-多糖。参见U.S.6,114,147,在此全文引入作为参考。O-多糖的存在优于N-多糖,因为O-多糖与N-多糖相比使柄部分更多地呈现为延伸的棒-样构象。柄部分还含有中度至高度糖基化的丝氨酸和苏氨酸位点。
本发明融合蛋白的柄部分含有中至高百分比的丝氨酸或苏氨酸残基。例如,本发明包括具有至少约5%或更高的丝氨酸和/或苏氨酸残基、至少约10%或更高的丝氨酸和/或苏氨酸残基、至少约20%或更高的丝氨酸和/或苏氨酸残基、至少约30%或更高的丝氨酸和/或苏氨酸残基、至少约40%或更高的丝氨酸和/或苏氨酸残基、至少50%或更高的丝氨酸和/或苏氨酸残基、至少约60%或更高的丝氨酸和/或苏氨酸残基、至少约70%或更高的丝氨酸和/或苏氨酸残基、至少80%或更高的丝氨酸和/或苏氨酸残基或至少90%或更高的丝氨酸和/或苏氨酸残基的柄部分。在本发明的一个实施方案中,柄部分含有约20-30%的丝氨酸和/或苏氨酸残基、约20-40%的丝氨酸和/或苏氨酸残基、约30-40%的丝氨酸和/或苏氨酸残基、约20-50%的丝氨酸和/或苏氨酸残基、约30-50%的丝氨酸和/或苏氨酸残基、约20-60%的丝氨酸和/或苏氨酸残基或约30-60%的丝氨酸和/或苏氨酸残基.
柄部分可含有以重量计至少约5%或更多的N-或O-多糖、以重量计至少约10%或更多的N-或O-多糖、以重量计至少约20%或更多的N-或O-多糖、以重量计至少约30%或更多的N-或O-多糖、以重量计至少约40%或更多的N-或O-多糖、以重量计至少约50%或更多的N-或O-多糖、以重量计至少约60%或更多的N-或O-多糖、以重量计至少约70%或更多的N-或O-多糖、以重量计至少约80%或更多的N-或O-多糖或以重量计至少约90%或更多的N-或O-多糖。在本发明的一个实施方案中,柄部分含有以重量计约20-30%的O-多糖、以重量计约20-40%的O-多糖、以重量计约30-40%的O-多糖、以重量计约20-50%的O-多糖、以重量计约30-50%的O-多糖、以重量计约20-60%的O-多糖或约30-60%的O-多糖。在另一个实施方式中,多糖的存在,特别是O-多糖,使得柄部分与细胞壁蛋白质中存在的β葡聚糖交联。正因如此,本发明的柄部分能够担任细胞壁连接组件。
柄部分可含有黏蛋白或黏蛋白的一部分,例如MUC-型蛋白质的成员。MUC-型黏蛋白是高度糖基化的结构相关分子家族,在呼吸道、胃肠道和生殖道上皮细胞中表达,例如MUC1(GenBank登录号AF125525)、MUC2(GenBank登录号L21998)、MUC3(GenBank登录号AF113616)、MUC4(GenBank登录号AJ000281)、MUC5AC(GenBank登录号U83139)、MUC5B(GenBank登录号AJ001402)、MUC6(GenBank登录号U97698)、MUC7(GenBank登录号L13283)、MUC8(GenBank登录号U14383)、MUC9(GenBank登录号AW271430)。在本发明的一个实施方案中,柄部分含有hMUC1或hMUC1蛋白的一部分,例如SEQID NO.:70核酸编码的SEQ ID NO.:71,以及SEQ ID NO.:5核酸编码的多肽。在本发明的另一个实施方案中,柄部分含有hMUC3或hMUC3蛋白的一部分。例如本发明包括SEQ ID NO.:68核酸编码的SEQ IDNO.69的hMUC3柄。
本发明的融合蛋白还包括含有变体的柄,所述变体例如黏蛋白、黏蛋白-样蛋白及其部分的类似物和衍生物。可以制备变体使在细胞表面表达的蛋白最优化。变体可以使用本领域已知的方法制备。例如可以通过去除重复的氨基酸残基和/或对肽进行随机突变和选择制造变体。
本发明的柄部分也可源自黏蛋白之外的糖基化蛋白,包括但不限于AGA1(例如,核酸序列SEQ ID NO.:72编码的SEQ ID NO.:73);MAdCAM-1;GLyCAM-1;CD34;E-selectin、P-selectin或L-selectin的共有重复序列;或病毒糖蛋白棘(例如流感病毒、单纯疱疹病毒、人类免疫缺陷病毒或烟草花叶病毒)及其变体和片段。参见WO01/46698,Girard等,(1995)Immunity 2:113-123,和Van Kinken等,(1998)Anal.Biochem.265:103-116,在此皆全文引入作为参考。本发明包括两个或多个糖基化蛋白或其片段的重复,以及两种或多种糖基化蛋白的组合。
在本发明的另一个实施方案中,制备含有一个或多个游离半胱氨酸残基的柄。该一个或多个游离半胱氨酸残基能够与酵母细胞细胞壁内蛋白质的游离半胱氨酸残基形成二硫键。细胞壁内一个或多个二硫键的形成是用于制造能够担当细胞壁连接组件的柄部分的另一种方法。
当要在酵母细胞内表达本发明的融合蛋白时,柄部分优选为足够长以跨越酵母细胞的整个细胞壁。优选为,柄部分的N-端位于细胞壁的外侧,更优选为以远离酵母细胞的棒-样结构延伸以减小转铁蛋白部分和配体与宿主酵母细胞之间的空间位阻。柄部分应该至少约25个氨基酸、至少约50个氨基酸、至少约75个氨基酸、至少约100个氨基酸、至少约125个氨基酸、至少约150个氨基酸、至少约175个氨基酸、至少约200个氨基酸、至少约225个氨基酸、至少约250个氨基酸、至少约275个氨基酸、至少约300个氨基酸、至少约325个氨基酸、至少约350个氨基酸、至少约375个氨基酸、至少约400个氨基酸、至少约425个氨基酸、至少约450个氨基酸、至少约475个氨基酸、至少约500个氨基酸、至少约525个氨基酸、至少约550个氨基酸、至少约575个氨基酸、至少约600个氨基酸、至少约625个氨基酸或至少约650个氨基酸长。在一个实施方式中,柄部分长约500个氨基酸。在另一个实施方式中,柄部分长约300至600个氨基酸。
锚定部分
本发明融合蛋白的锚定部分是融合蛋白的一部分,它将融合蛋白物理地地连接于宿主细胞表面或基质表面。在本发明的一个实施方案中,锚定部分将融合蛋白连接于细胞膜,例如但不限于哺乳动物细胞膜。在本发明的另一个实施方案中,锚定部分将融合蛋白连接或固定于细胞壁,例如但不限于酵母细胞壁。当锚定将融合蛋白与细胞壁连接时,它是细胞壁连接组件。
锚定部分可短暂地将融合蛋白连接于细胞壁或细胞膜。在本发明的一个实施方案中,锚定部分短暂地将融合蛋白连接于细胞壁或细胞膜,为柄部分共价地或非-共价地与细胞壁结合提供了时机。例如,锚定在细胞内的短暂连接使得柄部分的O-多糖与细胞壁的β葡聚糖交联。
在本发明的一个实施方案中,锚定部分插入微生物的细胞膜或细胞壁中,微生物例如低等真核细胞(如酵母和真菌)以及哺乳动物细胞(例如哺乳动物细胞系)。锚定部分具有长的C端用氨基酸例如脯氨酸将其锚定于细胞膜或细胞壁内(Kok(1990)FEMS Microbiology Reviews87:15-42)。
锚定部分可通过使用糖基-磷脂酰-肌醇(GPI)锚定从而被锚定到细胞。参见Conzelmann等,EMBO 9:653-661和Lipke和Ovalle,(1998)J.Bacteriol.180:3735-3740。GPI信号序列肽,例如在此公开的GPI信号肽,引发GPI与融合蛋白的C端连接。GPI信号自身含有三个域:含有GPI连接点(ω位点)及ω位点下游的第一个和第二个氨基酸的区域、5-10个氨基酸的间隔子和10-15个氨基酸的疏水带。含有GPI信号的蛋白质在ω位点断裂,得到的蛋白的羧基末端与GPI部分共价地结合。该反应发生在内质网中。依靠GPI部分与膜相关联,从而将GPI-连接蛋白质运输到细胞表面,如果蛋白质在短的ω负方向区域中含有碱性残基(R和/或K),该蛋白质保持在质膜上成为GPI-锚定蛋白质。在ω-4/-5位点具有V、I或L以及在ω-2位点具有Y或N的GPI-关联蛋白质被接入到细胞膜内。参见Hamada等,(1999)J.Bacteriol.181:3886-3889;Nuoffer等,(1993)J.Biol.Chem.268:10558-10563;De Nobel等,(1994)Trends Cell Biol.4:42-45.;Hamada等,(1998)Mol.Gen.Genet.258:53-59;和Van Der Vaart等,(1998)Biotechnol.Genet.Eng.Rev.15:387-411。
在本发明的一个实施方案中,使用酵母GPI YIR019C提供转铁蛋白融合蛋白的锚定部分。图2提供了GPI YIR019C的图谱。在氨基酸序列(SEQ ID NO.:15)中的ω位点是甘氨酸,图示在其任一侧有空隙。该空隙表明在ω位点的任一侧为间隔子区域。粗体印刷的I和Y氨基酸分别是ω-5/-4位点和ω-2位点。
本领域已知几种酵母菌锚定部分,可用其来构建本发明的融合蛋白。酵母GPI信号蛋白的其它例子包括但不限于,YDR534C、YNL327W、YOR214C、YDR134C、YPL130、YOR009W、YER150W、YDR077W、YOR383C、YJR151C、YJR004、YJL078C、YLR110C和YNL300W。此外,可以使用来自于其它生物体的GPI信号蛋白,例如光滑假丝酵母(Canidida glabrate)的EPA1的GPI、白假丝酵母(Candidaalbicans)的Hwp1p的GPI或布氏锥虫(Trypanosoma brucei)的VSG的GPI。
在本发明的一个实施方案中,锚定部分是哺乳动物部分或其衍生物或片段。在本发明的另一个实施方案中,GPI信号肽是哺乳动物GPI信号蛋白。例如,本发明包括如表1公开的那些人MDP GPI信号蛋白衍生物(参见实施例5)。
本发明还包括含有锚定部分的融合蛋白,该锚定部分具有一个或多个未结合的半胱氨酸残基。所述半胱氨酸残基通过与细胞壁内蛋白质的半胱氨酸残基形成二硫键,承担将融合蛋白连接于细胞的作用。
本发明包括含有跨膜域(TMD)的融合蛋白,以该跨膜域作为锚定部分。在本发明的一个实施方案中,TMD是单跨I型或II型膜蛋白区域。例如,本发明包括但不限于FUS1的残基70-98。
在本发明的另一个实施方案中,TMD包括多跨膜蛋白的几个跨膜区域中的一个或多个区域。在本发明的一个实施方案中,TMD是多跨膜蛋白的疏水区,含有约10-60个氨基酸、约15-60个氨基酸、约20-60个氨基酸、约30-60个氨基酸或约25-50个氨基酸。例如,本发明包括但不限于选自由残基25-30、73-100、171-198、249-277、714-742、761-789、838-858、864-884、940-967和979-1000(酵母菌基因组数据库注释)组成的组的一个或多个酵母菌的STE6的TMD。
在另一个实施方案中,锚定部分用于将转铁蛋白融合蛋白连接于固体基质例如微阵列。锚定部分优选是短的抗原表位标记(即被抗体,典型地为被单克隆抗体识别的序列),例如多组氨酸、SEAP、或M1和M2标记。参见Bush等,(1991)J.Biol.Chem.266:13811-13814、Berger等,(1988)Gene 66:1-10、美国专利5,011,912、美国专利4,851,341、美国专利4,703,004和美国专利4,782,137,皆在此全文引入作为参考。在一个实施方案中,柄域通过抗-柄序列抗体(例如抗-黏蛋白抗体)而连接于基质。
白蛋白
本发明还包括使用除转铁蛋白之外的蛋白质或蛋白质片段将配体“展示”给靶的融合蛋白。合适的蛋白质是那些可溶的并且至少约50个氨基酸长或者更长的蛋白质。在本发明的一个实施方案中,蛋白质或蛋白质片段含有与转铁蛋白类似的二级结构。
优选,那些蛋白质或片段在当配体从融合蛋白的柄部分断裂并用作治疗剂时能够延长配体的半衰期。例如,本发明预想了含有白蛋白部分、柄部分和细胞壁连接组件的融合蛋白的用途。本发明还预想了含有白蛋白部分和锚定部分的融合蛋白的用途。当融合蛋白的白蛋白和配体部分从融合蛋白的残余物断裂并被需要配体治疗的患者摄入后,白蛋白部分能够使配体,即治疗剂具有延长的血清半衰期。
含有白蛋白部分的融合蛋白可包括白蛋白、白蛋白变体或其片段。在一个实施方案中,白蛋白含有由核苷酸序列SEQ ID NO.:66编码的氨基酸序列SEQ ID NO.:67。本发明包括本领域已知的白蛋白修饰物。
核酸
本发明还提供了核酸分子。它们编码经修饰的Tf融合蛋白,所述融合蛋白含有与配体部分共价连接或相连的转铁蛋白或转铁蛋白的一部分。融合蛋白可进一步含有连接子区,例如少于约50、40、30、20或10个氨基酸残基的连接子。连接子可在转铁蛋白或其部分以及配体部分之间与它们共价连接。本发明的核酸分子可以是纯化的或非纯化的。
本发明还提供了用于复制核酸分子并表达编码的融合蛋白的宿主细胞和载体。可以使用任何载体或宿主细胞,包括原核的和真核的,但是真核表达系统,特别是酵母表达系统和哺乳动物表达系统是优选的。本领域已知多种用于此目的的载体和宿主细胞。针对所需的用途,本领域技术人员能容易地选择合适的载体和宿主细胞。
编码转铁蛋白、转铁蛋白部分和所需治疗性蛋白质的DNA序列可克隆自多种本领域已知的基因组或cDNA文库。使用基于探针的方法分离所述DNA序列的技术是常规技术,并且是本领域技术人员众所周知的技术。分离所述DNA序列的探针可基于公开的DNA或蛋白质序列(参见例如Baldwin,G.S.(1993)Comparison of Transferrin Sequencesfrom Different Species.Comp.Biochem.Physiol.106B/1:203-218和其中提及的所有参考文献,皆在此全文引入作为参考)。可选择地,也可使用在此作为参考文献引入本文的、由Mullis等(美国专利4,683,195)和Mullis(美国专利4,683,202)公开的聚合酶链反应(PCR)方法。文库的选择和分离所述DNA序列所用探针的选择对本领域普通技术人员来说是显而易见的。
如本领域所知,通过将一种多核苷酸或多肽的核苷酸或氨基酸序列及其保守的核苷酸或氨基酸取代物与另一种多核苷酸或多肽的序列进行比较,可测定两种多核苷酸或多肽之间的“相似性”。如本领域所知,“同一性”指的是两种多肽或两种多核苷酸序列之间的序列相关程度,通过两行这种序列之间匹配的相同性测定。同一性和相似性都是容易计算的。(Computational Molecular Biology,Lesk,A.M.,编辑,Oxford University Press,New York,1988;Biocomputing:Informatics andGenome Projects,Smith,D.W.,编辑,Academic Press,New York,1993;Computer Analysis of Sequence Data,Part I,Griffin,A.M.,和Griffin,H.G.,编辑,Humana Press,New Jersey,1994;Sequence Analysis inMolecular Biology,von Heinje,G.,Academic Press,1987;和SequenceAnalysis Primer,Gribskov,M.和Devereux,J.,编辑,M Stockton Press,New York,1991)。
尽管有许多方法可用于测定两个多核苷酸或多肽序列之间的同一性和相似性,但术语“同一性”和“相似性”是本领域技术人员众所周知的(Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987;Sequence Analysis Primer,Gribskov,M.和Devereux,J.,编辑,MStockton Press,New York,1991;和Carillo,H.和Lipman,D.,SIAM J.Applied Math.,48:1073(1988)。通常用于测定两个序列之间的同一性或相似性的方法包括但不限于Guide to Huge Computers,Martin J.Bishop,编辑,Academic Press,San Diego,1994,和Carillo,H.和Lipman,D.,SIAM J.Applied Math.48:1073(1988)中公开的方法。
将测定同一性的优选方法设计成可使两个受测试的序列之间出现最大程度的匹配。测定同一性和相似性的方法被编写在计算机程序中。测定两个序列之间的同一性和相似性的优选的计算机程序方法包括但不限于GCG程序包(Devereux等,Nucl.Acid Res.12(1):387(1984))、BLASTP、BLASTN、FASTA(Atschul等,J.Mol.Biol.215:403(1990))。将上文所指的相似性或同一性程度测定为两个序列之间的相同程度,通常表示第一个序列起源于第二个序列。通过本领域已知的计算机程序如GCG程序包中提供的GAP(Needleman和Wunsch,J.Mol.Biol.48:443-453(1970)),可以测定两个核酸序列之间的同一性程度。为了在本发明中测定两个核酸序列之间的同一性程度,使用具有如下设定的GAP:GAP产生罚分为5.0,GAP延伸罚分为0.3。
密码子最优化
遗传密码的简并性使得可以对转铁蛋白和/或感兴趣的治疗性蛋白质的核苷酸序列进行变异,但仍会产生氨基酸序列与天然DNA序列所编码多肽的氨基酸序列相同的多肽。该过程被称为“密码子最优化”(描述于美国专利5,547,871,在此全文引入作为参考),其为人们提供了一种设计经改变的DNA序列的方法。密码子最优化基因的设计应考虑许多因素,包括生物体中的密码子的使用频率、最近邻的频率、RNA稳定性、形成二级结构的潜能、合成路径和预期该基因将采用的DNA操作。特别是,当使用酵母表达系统时,可以使用可利用的方法,用最容易被酵母识别的密码子来改变编码给定融合蛋白的密码子。
遗传密码的简并性使得相同的氨基酸序列可以用多种不同的方法编码和翻译。例如,亮氨酸、丝氨酸和精氨酸分别由六种不同的密码子编码,而缬氨酸、脯氨酸、苏氨酸、丙氨酸和甘氨酸分别由四种不同的密码子编码。然而,在真核生物和原核生物中,这种同义密码子的使用频率在基因组之间是不同的。例如,哺乳动物的同义密码子-选择模式非常类似,而在进化上关系较远的生物体,如酵母(酿酒酵母(Scerevisiae))、细菌(如大肠杆菌(E.Coli))和昆虫(如黑腹果蝇(D.melanogaster))的基因组密码子使用频率模式明显不同(Grantham,R.等,Nucl.Acid Res.,8,49-62(1980);Grantham,R.等,Nucl.Acid Res.,9,43-74(1981);Maroyama,T.等,Nucl.Acid Res.,14,151-197(1986);Aota,S.等,Nucl.Acid Res.,16,315-402(1988);Wada,K.等,Nucl.AcidRes.,19 Supp.,1981-1985(1991);Kurland,C.G.,FEBS Lett.,285,165-169(1991))。密码子-选择模式的差异似乎通过调节肽延长速率,来影响各个基因的整体表达水平(Kurland,C.G.,FEBS Lett.,285,165-169(1991);Pedersen,S.,EMBO J.,3,2895-2898(1984);Sorensen,M.A.,J.Mol.Biol.,207,365-377(1989);Randall,L.L.等,Eur.J.Biochem.,107,375-379(1980);Curran,J.F.,and Yarus,M.,J.Mol.Biol.,209,65-77(1989);Varenne,S.等,J.Mol.Biol.,180,549-576(1984),Varenne,S.等,J.Mol,Biol.,180,549-576(1984);Garel,J.-P.,J.Theor.Biol.,43,211-225(1974);Ikemura,T.,J.Mol.Biol.,146,1-21(1981);Ikemura,T.,J.Mol.Biol.,151,389-409(1981))。
合成基因的密码子使用频率应反映来源于细胞/生物体(尤其酵母)的精确的(或尽可能密切相关的)基因组的核基因的密码子使用,细胞/生物体将被用于重组蛋白质的表达。如上所述,在一个实施方案中,在此所描述的修饰之前或之后,人Tf序列被密码子最优化以用于酵母表达,该序列可以是治疗性蛋白质的核苷酸序列。
载体
用于本发明的表达单位一般含有以5’至3’方向可操作相连的下述元件:转录启动子;分泌信号序列;与编码感兴趣的治疗性蛋白质或肽的DNA序列相连接的编码经修饰的Tf融合蛋白的DNA序列,所述经修饰的Tf融合蛋白包含转铁蛋白或转铁蛋白的一部分;和转录终止子。如上所述,与Tf部分融合或位于Tf部分内部的治疗性蛋白质或肽的任何排列都可用于本发明的载体中。由选定的宿主细胞确定合适的启动子、信号序列和终止子的选择,这一点对于本领域技术人员而言是显而易见的,下文将要更详细地讨论。
可用于本发明的合适的酵母载体描述于美国专利6,291,212,其包括YRp7(Struhl等,Proc.Natl.Acad.Sci.USA 76:1035-1039,1978)、YEp13(Broach等,Gene 8:121-133,1979)、pJDB249和pJDB219(Beggs,Nature 275:104-108,1978)、pPPC0005、pSeCHSA、pScNHSA、pC4及其衍生物。有用的酵母质粒载体还包括可得自Stratagene CloningSystems,La Jolla,CA 92037,USA.的pRS403-406、pRS413-416和毕赤氏酵母载体。质粒pRS403、pRS404、pRS405和pRS406是酵母整合质粒(Yips),其中掺入了酵母选择标记HIS3、TRP1、LEU2和URA3。质粒pRS413~41.6是酵母着丝粒质粒(YCps)。
所述载体一般包括可选择标记,所述可选择标记是任意数量的表现出显性表型的基因之一,对其进行表型分析能够选择转化子。优选的可选择标记是能补偿宿主细胞营养缺陷、提供抗生素抗性或使细胞能利用特定碳源的标记,其包括LEU2(Broach等,出处同上)、URA3(Botstein等,Gene 8:17,1979)、HIS3(Struhl等,出处同上)或POT1(Kawasaki和Bell,EP 171,142)。其它合适的可选择标记包括能赋予酵母细胞氯霉素抗性的CAT基因。用于酵母的优选启动子包括酵母糖酵解基因的启动子(Hitzeman等,J Biol.Chem.225:12073-12080,1980;Alber和Kawasaki,J.Mol.Appl.Genet.1:419-434,1982;Kawasaki,美国专利4,599,311)或乙醇脱氢酶基因的启动子(Young等,载于GeneticEngineering of Microorganisms for Chemicals,Hollaender等,(编辑),355页,Plenum,N.Y.,1982;Ammerer,Meth.Enzymol.101:192-201,1983)。在这方面,可使用的启动子是TPI1启动子(Kawasaki,美国专利4,599,311)和ADH2-4C(参见美国专利6,291,212)启动子(Russell等,Nature 304:652-654,1983)。表达单位还可包括转录终止子。优选的转录终止子是TPI1终止子(Alber和Kawasaki,出处同上)。
除了酵母,还可以在丝状真菌,如曲霉属(Aspergillus)真菌菌株中表达本发明的经修饰的融合蛋白。有用的启动子的例子包括来源于构巢曲霉(Aspergillus nidulans)糖酵解基因的启动子,如adh3启动子(McKnight等,EMBO J.4:2093-2099,1985)和tpiA启动子。合适的终止子的例子是adh3终止子(McKnight等,出处同上)。可将利用上述组分的表达单位克隆至载体中,所述载体能插入例如曲霉(Aspergillus)的染色体DNA中。
用于实施本发明的哺乳动物表达载体将包括能引导经修饰的Tf融合蛋白转录的启动子。启动子包括但不限于病毒启动子和细胞启动子。例如,病毒启动子包括腺病毒2的主要晚期启动子(Kaufman和Sharp,Mol.Cell.Biol.2:1304-13199,1982)和SV40启动子(Subramani等,Mol.Cell.Biol.1:854-864,1981)。细胞启动子包括小鼠金属硫蛋白1启动子(Palmiter等,Science 222:809-814,1983)和小鼠V6(参见美国专利6,291,212)启动子(Grant等,Nuc.Acids Res.15:5496,1987)。一种这样的启动子是小鼠VH(参见美国专利6,291,212)启动子(Loh等,出处同上)。所述表达载体还可含有位于启动子下游和编码转铁蛋白融合蛋白的DNA序列上游的一套RNA剪切位点。RNA剪切位点可得自例如腺病毒和/或免疫球蛋白基因。
表达载体中还含有位于感兴趣的编码序列下游的聚腺苷酸信号。聚腺苷酸信号包括来自SV40的早期或晚期聚腺苷酸信号(Kaufman和Sharp,出处同上),来自腺病毒5E1B区和人生长激素基因终止子的聚腺苷酸信号(DeNoto等,Nucl.Acid Res.9:3719-3730,1981)。一种这样的聚腺苷酸信号是VH(参见美国专利6,291,212)基因终止子(Loh等,出处同上)。表达载体可包括位于启动子和RNA剪切位点之间的非编码病毒前导序列,如腺病毒2三联前导序列。优选的载体还可包括增强子序列,如SV40增强子和小鼠(参见美国专利6,291,212)增强子(Gillies,Cell 33:717-728,1983)。表达载体还可包括编码腺病毒VA RNAs的序列。
转化
用于转化真菌的技术已在文献中公开,被描述于例如Beggs(出处同上)、Hinnen等(Proc.Natl.Acad.Sci.USA 75:1929-1933,1978)、Yelton等(Proc.Natl.Acad.Sci.USA 81:1740-1747,1984)和Russell(Nature 301:167-169,1983)中。宿主细胞的基因型一般含有遗传缺陷,该缺陷可由表达载体中存在的可选择标记补偿。对特定宿主和可选择标记的选择对本领域技术人员而言是显而易见的。
通过例如磷酸钙介导的转染(Wigler等,Cell 14:725,1978;Corsaro和Pearson,Somatic Cell Genetics 7:603,1981;Graham和Van der Eb,Virology 52:456,1973.),可将含有本发明的经修饰的Tf融合蛋白的克隆DNA序列导入培养的哺乳动物细胞中。也可以使用其它将克隆的DNA序列导入哺乳动物细胞的技术,例如电穿孔(Neumann等,EMBO J.1:841-845,1982)或脂质转染法。为了鉴定出已经整合了克隆DNA的细胞,一般将可选择标记与感兴趣的基因或cDNA一起导入细胞。用于培养的哺乳动物细胞的优选的可选择标记包括赋予药物抗性的基因,这些药物例如新霉素、潮霉素和氨甲喋呤。可选择标记可以是可扩增的可选择标记。一种可扩增的可选择标记是DHFR cDNA。特别优选的可扩增标记是DHFRr(参见美国专利6,291,212)cDNA(Simonsen和Levinson,Proc.Natl.Acad.Sci.USA 80:2495-2499,1983)。Thilly对可选择标记进行了综述(Mammalian Cell Technology,Butterworth Publishers,Stoneham,Mass.),可选择标记的选择对本领域技术人员而言是显而易见的。
宿主细胞
本发明还包括经转化以表达本发明的经修饰的转铁蛋白融合蛋白的细胞,例如酵母细胞或者哺乳动物细胞。除了经转化的宿主细胞本身外,本发明还包括这些细胞在营养培养基中的培养物,例如单克隆(克隆均一)培养物,或衍生自单克隆培养物的培养物。如果多肽被分泌出来,培养基中会含有多肽和细胞,或者当细胞被过滤或者离心掉,则不含细胞。
用于实施本发明的宿主细胞包括真核细胞,有时包括原核细胞,其能够用外源DNA转化或转染,并能在培养基中生长,例如经培养的哺乳动物、昆虫、真菌、植物和细菌细胞。
真菌细胞,包括酵母类(例如酵母菌属、裂殖酵母菌属、毕赤氏酵母属)可用作本发明的宿主细胞。预期可在本发明的实践中用作宿主以表达本发明的转铁蛋白融合蛋白的酵母属的例子有:毕赤氏酵母(Pichia)(包括以前被分类为汉逊氏酵母(Hansenula))、酵母菌(Saccharomyces)、克鲁维氏酵母(Kluyveromyces)、曲霉(Aspergillus)、假丝酵母(Candida)、球拟酵母(Torulopsis)、孢圆酵母(Torulaspora)、裂殖酵母菌(Schizosaccharomyces)、固囊酵母(Citeromyces)、管囊酵母(Pachysolen)、接合酵母菌(Zygosaccharomyces)、德巴利氏酵母(Debaromyces)、木霉(Trichoderma)、头孢霉(Cephalosporium)、腐殖霉(Humicola)、毛霉(Mucor)、脉孢霉(Neurospora)、亚罗酵母(Yarrowia)、Metschunikowia、红冬孢酵母(Rhodosporidium)、白冬孢酵母(Leucosporidium)、Botryoascus、锁掷孢酵母(Sporidiobolus)、拟内孢霉(Endomycopsis)等。酵母菌属(Saccharomyces spp.)的例子为酿酒酵母菌(S.cerevisiae)、意大利酵母菌(S.italicus)和鲁氏酵母菌(S.rouxii)。克鲁维氏酵母属(KIuyveromyces spp.)的例子为乳酸克鲁维氏酵母菌(K.lactis)和马克斯克鲁维氏酵母菌(K.marxianus)。合适的物种为孢圆酵母菌(T.delbrueckii)。毕赤氏酵母(Pichia)(汉逊氏酵母(Hansenula))属的例子为P.angusta(以前被称作多形汉逊氏酵母菌(H.polymorpha))、异常毕赤氏酵母菌(P.anomala)(以前被称作异常汉逊氏酵母菌(H.anomala))和巴斯德毕赤氏酵母菌(P.pastoris)。
对于制备本发明的Tf融合蛋白特别有用的宿主细胞是巴斯德毕赤氏酵母(Steinlein等,(1995)Protein Express.Purif.6:619-624)。自从巴斯德毕赤氏酵母的醇氧化酶启动子被分离和克隆以来,巴斯德毕赤氏酵母已被开发成用于制备外源蛋白的重要宿主;1985年首次报道了巴斯德毕赤氏酵母的转化。在缺乏葡萄糖时,巴斯德毕赤氏酵母能利用甲醇作为碳源。巴斯德毕赤氏酵母的表达系统可使用甲醇-诱导的醇氧化酶(AOX1)启动子,该启动子能控制编码编码醇氧化酶表达的基因,所述酶催化甲醇代谢的第一步。已表征该启动子,并将其接入到一系列巴斯德毕赤氏酵母表达载体中。由于巴斯德毕赤氏酵母中产生的蛋白质一般能够正确折叠并被分泌至培养基中,发酵经遗传工程改造的巴斯德毕赤氏酵母可提供优良的大肠杆菌表达系统的替代物。使用该系统已经制备出许多蛋白质,包括破伤风毒素片段、百日咳博德特氏菌粘着素(Bordatella pertussis pertactin)、人血清白蛋白和溶菌酶。
例如,可按Malardier等,(1989)Gene 78:147-156所述进行尖孢镰孢(F.oxysporum)的转化。
酿酒酵母菌菌株是另一种优选的宿主。在一个实施方案中,使用酵母细胞,或者更具体地在糖蛋白的天冬酰胺偶联的糖基化所需的基因中具有遗传缺陷的酿酒酵母菌宿主细胞。使用标准的突变和选择技术可制备具有这种缺陷的酿酒酵母菌宿主细胞,但是,也有许多可以获得的酵母菌株被修饰来防止或减少糖基化或超甘露糖基化。Ballou等(J.Biol.Chem.255:5986-5991,1980)已经描述了甘露糖蛋白生物合成突变体的分离,所述突变体缺乏影响天冬酰胺-偶联的糖基化的基因。Gentzsch和Tanner(Glycobiology 7:481-486,1997)已经描述了至少六个基因(PMT1-6)的家族,这些基因编码负责酵母中蛋白的O-糖基化的第一步的酶。缺乏这些基因中的一个或多个的突变体表现出O-联糖基化下降和/或O-糖基化的改变的特异性。
为了最优化异源蛋白的制备,优选宿主菌株具有突变,例如酿酒酵母pep4突变(Jones,Genetics 85:23-33,1977),所述突变导致蛋白水解活性下降。在其它蛋白酶编码区中具有突变的宿主菌株对于大量制备本发明的Tf融合蛋白特别有用。
在合适的生长培养基中生长含有本发明的DNA构建体的宿主细胞。本文所用术语“合适的生长培养基”指的是含有细胞生长所需营养物质的培养基。细胞生长所需的营养物质包括碳源、氮源、必需氨基酸、维生素、矿物质和生长因子。生长培养基一般通过例如药物选择或必需营养物质的缺乏来选择含有DNA构建体的细胞,所述药物选择或必需营养物质的缺乏由位于DNA构建体上或与DNA构建体共转染的可选择标记进行弥补。例如,优选在化学成分确定的培养基中培养酵母细胞,所述培养基含有碳源(例如蔗糖)、非-氨基酸氮源、无机盐、维生素和必需氨基酸添加剂。优选将培养基的pH维持在pH大于2小于8,优选pH 5.5至6.5。维持稳定的pH的方法包括进行缓冲和持续的pH控制,优选通过添加氢氧化钠。优选的缓冲剂包括琥珀酸和Bis-Tris(Sigma Chemical Co.,St.Louis,Mo.)。缺失天冬酰胺偶联糖基化所需基因的酵母细胞优选在含有渗透稳定剂的培养基中培养。一种这样的渗透稳定剂是以在0.1M和1.5M之间的浓度,优选0.5M或1.0M,被添加到培养基中的山梨醇。
一般在市售的含血清或无血清的培养基中生长经培养的哺乳动物细胞。本领域技术人员具备能力选择适用于所用的特定细胞系的培养基。将经转染的哺乳动物细胞培养一段时间,一般为1-2天,以开始表达感兴趣的DNA序列。然后进行药物选择以选择出以稳定的方式表达可选择标记的细胞的生长。对于已经用可扩增的可选择标记转染的细胞而言,可足部提高药物浓度以选择出拷贝数增加的克隆序列,从而提高表达水平。
也可使用杆状病毒(Baculovirus)/昆虫细胞表达系统来制备本发明的经修饰的Tf融合蛋白。BacPAKTM杆状病毒表达系统(BDBiosciences(Clontech))在昆虫宿主细胞中以高水平表达重组蛋白。将靶基因插入转移载体,所述载体与线性化的BacPAK6病毒DNA一起被共转染到昆虫宿主细胞中。BacPAK6DNA缺失杆状病毒基因组的必需部分。当DNA与载体重组时,该必需元件被恢复,靶基因被转移至杆状病毒基因组。重组后,少数病毒噬斑被挑选和纯化,并证实重组表型。然后扩增新分离的重组病毒,并用于感染昆虫细胞培养物来制备大量的所需蛋白质。
分泌信号序列
术语“分泌信号序列”或“信号序列”或“分泌前导序列”可以互换使用,被描述于例如美国专利6,291,212和美国专利5,547,871,二者皆在此全文引入作为参考。分泌信号序列或信号序列或分泌前导序列编码分泌肽。分泌肽是用于引导成熟多肽或蛋白质从细胞中分泌出来的氨基酸序列。一般来说,分泌肽的特征在于疏水氨基酸核心,典型地(也不排除其它情况)存在于新合成的蛋白质的氨基末端。通常分泌肽在分泌过程中从成熟蛋白质上断裂下来。分泌肽可含有使其在经过分泌路径时信号肽能从成熟蛋白质上断裂下来的加工位点。加工位点可编码在信号肽内,或者可通过例如体外诱变被添加至信号肽中。
分泌肽可被用于引导本发明的经修饰的Tf融合蛋白的分泌。一种可以与其它分泌肽结合使用的这种分泌肽是酵母屏障蛋白的第三域。分泌信号序列或信号序列或分泌前导序列是一系列复杂的、导致蛋白质分泌的翻译后加工步骤所必需的。如果存在完整的信号序列,被表达的蛋白质进入粗面内质网的内腔,然后通过高尔基体转运到分泌小泡中,最后被转运到细胞外。通常,信号序列紧跟在起始密码子之后,并在待分泌的蛋白质的氨基-末端编码信号肽。在大多数情况下,信号序列被称作信号肽酶的特定蛋白酶切割断裂掉。优选的信号序列能提高使用病毒、哺乳动物或酵母表达载体的重组蛋白质表达的加工和外排效率。在一些情况下,可以使用天然的Tf信号序列表达和分泌本发明的融合蛋白。
连接子
本发明的经修饰的转铁蛋白融合蛋白的Tf部分和配体可以直接融合,或者使用各种长度的连接肽来融合,以提供较大的物理间距,使融合蛋白之间的空间灵活性更大,从而最大化抗体可变区的易靠近性,例如,用于与其关联受体结合。连接肽可由柔性或更刚性的氨基酸组成。在一个实施方案中,本发明包括基本上非螺旋的连接子例如(PEAPTD)n(SEQ ID NO.:18)。在另一个实施方案中,本发明的融合蛋白包括具有聚甘氨酸带的连接子。连接子可以少于约50、40、30、20、或10个氨基酸残基。连接子可以在转铁蛋白或其部分和抗体可变区之间与它们共价连接。
还可以使用连接子将抗体可变区结合到配体中。合适的用于结合抗体可变区的连接子是允许抗体可变区折叠成保持整个抗体的结合特异性的三维结构的那些连接子。
筛选方法
通过筛选本发明的融合蛋白库能够确定的配体,其可能的靶分子的数量实质上是无限的。例如,靶分子(即受体或试剂)可以是抗体(或其结合部分)或抗原。抗体与之相结合的抗原可以是已知的,甚至可能是序列确定的,在这种情况下,本发明可用于定位抗原的抗原表位。如果抗原是未知的,例如某些自身免疫疾病,本发明的筛选方法能够用来自于具有该疾病的病人的例如血清、体液、组织或细胞来确定肽,从而确定引发自身免疫反应的抗原。一旦肽被确定,该肽就能用作或提供疫苗、治疗剂、诊断试剂等开发的基础。参见WO01/46698中一系列的配体可以被筛选的靶分子,在此为所有目的全文引入参考。
可以通过使用本领域从业者公知的方法之一来实施筛选,例如通过生物淘筛、FACS或MACS。在本发明的一个实施方案中,实施筛选用于受体激活。靶或者是纯化并在溶液中的,或者是表面结合的,或者是与细胞关联的。靶可以是标记的,例如用生物素或者本领域已知的其它方法标记的。
具有所需特性的多肽或肽可以被分离,并通过测定相应核苷酸序列或通过氨基酸测序或质谱法被确定。随后的最优化可通过重复用不同的序列,优选用随机序列代替子序列以及一次或多次的筛选步骤来实现。
一旦构建了肽库,宿主细胞可使用库载体转化。典型地通过在选择性的培养基中或在选择性的条件下培养来选择成功的转化子,例如,合适的生长培养基或者取决于所使用的载体的其他条件。这种选择可在固体培养基上或者在液体培养基中进行。为了使细菌细胞在固体培养基上生长,在大的表面(例如,含有选择性抗生素的L-琼脂)以高密度(约108至109转化子/m2)培养细胞以形成本质上融合的菌苔。为了在液体培养物中生长,可在L-肉汤(具有抗生素选择性)经过10次或更多次倍增生长细胞。由于库的尺寸的原因,在液体培养物中生长更方便,而在固体培养基中生长很可能在扩增过程中提供更少机会的偏差。
如果要用酵母细胞表面展示筛选转铁蛋白融合蛋白肽库,酵母细胞需要用编码转铁蛋白融合蛋白的表达载体转化。突变形成方法全程与酵母表面展示库的构建一致,例如易错聚合酶链反应和DNA改组。参见Boder等,(2000)Methods of Enzymology328:430-444。可选择地,表达的融合蛋白的转铁蛋白部分可作为随机肽序列或CDR的骨架。
一旦产生了酵母细胞转铁蛋白融合蛋白肽库,现有技术已知几种方法用于确定所需的肽。例如,如果亲和浓度相当低(Kd>nM,或当筛选库以分离新的结合特异性时,无亲和性),可通过与低浓度的荧光标记的靶(即受体或试剂)达到平衡的结合来识别肽。对于旨在进化出紧密-结合的蛋白质的应用,过度大量的稀释靶溶液对于保持摩尔配体过量是必需的,使得样品的处理复杂化。在这种情况下,可以通过改变溶解过程动力学改善结合亲合力。对于化学计量限制的靶的动力学竞争能够用于确定群体中改良的克隆(Hawkins等,(1992)J.Mol.Biol.226:889);然而,该方法排除了筛选方法的定量可预见性,通常不被推荐使用。参见Boder等,(2000)Methods of Enzymology 328:430-444。
靶可被生物素化或荧光化标记,或可选择地,感兴趣的配体,即展示在转铁蛋白上的肽,可被标记。优选标记靶。标记的靶,例如,生物素化的靶,可与转铁蛋白融合蛋白肽库一起培养。该库含有至少约104个成员(即展示的肽)、至少约105个成员、至少约106个成员、至少约107个成员、至少约108个成员、至少约109个成员、至少约1010个成员、至少约1011个成员、至少约1012个成员、至少约1013个成员、至少约1014个成员、至少约1015个成员、或至少约1016个成员。
培育后,细胞可被第二标记物标记,第二标记物例如二抗、链酶亲和素标记的分子或本领域已知的其它方法。二抗可以是抗-生物素抗体。链酶亲和素标记的分子包括但不限于链酶亲和素-藻红蛋白或链酶亲和素微珠。
如本领域已知,可使用流式细胞术分析细胞群落。当这样做时,仅群落中展示的微小部分被分析。参见Boder等(2000)Methods ofEnzymology 328:430-444和Kondo等(2004)Appl.Microbiol.Biotechnol.64:28-40,二者均在此全文引入作为参考。
可选择地,当使用含有标记小珠的第二标记物,即抗-生物素或链酶亲和素标记的小珠时,可使用在Yeung等,(2002)Biotechnol.Prog.18:212-220(其在此全文引入作为参考)中描述的磁选程序拣选配体和靶分子的混合物。
Figure A20078005062300621
微珠试剂盒可与该筛选方案(Miltenyi BiotecGmbH)一起使用。磁选可与FACS结合使用。
在本发明的一个具体实施方案中,需要突出在酵母细胞中表达的令人感兴趣的单个配体。可使用多种方法筛选表达的蛋白质。如果蛋白质具有功能,其可以被直接测定。例如,表达于酵母表面的单链抗体是全功能的,其可基于与抗原的结合被筛选。如果蛋白质不具有可检测的能被容易地测定的功能,配体的表达可以用抗体来监测。由于酵母细胞比噬菌体大得多,因此可以使用流式细胞术监测单个酵母细胞上的蛋白显型。
在本发明的另一个实施方案中,通过本领域已知的除细胞表面展示之外的方法实现配体部分与受体或试剂结合,所述方法例如ELISA、当靶的天然结合配对物是已知时的竞争性结合检测法、夹心式检测法、使用其结合被肽库阻断的放射性配体的放射性受体检测法等。在这些方法中,用Tf融合蛋白肽库转化的宿主细胞被裂解。Tf融合蛋白肽通过合适的锚定部分锚定到检测载体,锚定部分例如但不限于抗-MUC1抗体。筛选过程包括使Tf肽库与感兴趣的靶相互作用从而建立基线结合水平,随后的肽库的结合活性与基线结合水平相比较。该检测的本质是只要其对检测微量的与靶结合的肽或与靶竞争性结合的肽是足够灵敏的,而不是精确的。可以顾及不同的感兴趣的结合底物的最佳结合条件或其它生物活性来改变该检测的条件。因此,结合的pH、温度、盐浓度、体积和持续时间等等都可以改变以在与感兴趣的环境类似的条件下实现肽与靶的结合。
一旦确定肽库含有与感兴趣的目标相结合的肽,可使用本发明的方法鉴定混合物中肽的序列。可以通过MACS或FACS筛选方法从库的一般群体中分离出展示与靶结合的肽的细胞。对最初的隔离种群重复2至3次筛选过程以耗尽任何非特异性的结合物。然后用基于结合亲合力的FACS拣选分离进行最后一轮筛选。从分离的细胞中回收质粒DNA,测定插入部位的DNA的序列以确定蛋白质的序列。然后能够确定分离物之间的共同基序。
治疗性配体分子
本发明的配体可以是公认的或公知的治疗性分子。如本文所用,治疗性分子通常是能在体内或体外产生有益的生物学作用的蛋白质或肽,包括产生与正常稳态、生理学或疾病状态相关的有益作用的蛋白质或肽。治疗性分子不包括通常被用作标记或蛋白质纯化辅助物的融合配对物,例如半乳糖甘酶(参见例如,美国专利5,986,067和Aldred等,(1984)Biochem.Biophys.Res.Commun.122:960-965)。例如,与疾病状态相关的有益作用包括对被治疗者有益的任何作用,包括疾病预防、稳定病情、减轻或缓解疾病症状,或者调节、缓解或治愈潜在缺陷以产生对被治疗者有益的作用。
治疗性配体可直接地或通过如前所述的连接子部分间接地与转铁蛋白部分融合。在一个实施方案中,可能需要切割断裂融合蛋白以从融合蛋白残余物分离融合蛋白的转铁蛋白和配体部分。在另一个实施方案中,可能需要从融合蛋白残余物切割断裂配体。
本发明的融合蛋白的配体部分可至少含有治疗性蛋白质的片段或变体,和/或至少含有抗体的片段或变体。在进一步的实施方案中,融合蛋白含有蛋白质或抗体的肽片段或肽变体,其中变体或片段保留了至少一种生物学或治疗活性。融合蛋白含有治疗性蛋白质,所述治疗性蛋白质是与经修饰的转铁蛋白的N末端和/或C末端相融合、插入经修饰的转铁蛋白中或插入经修饰的转铁蛋白的环中的长度为至少约3个、至少约4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少20个、至少25个、至少30个、至少35个、或至少约40个、至少约50个、至少约55个、至少约60个或至少约70个或更多个氨基酸的肽片段或肽变体。
在另一个实施方案中,本发明的融合蛋白的配体部分含有可以是治疗性蛋白质片段的治疗性蛋白质部分,它包括全长蛋白质以及从氨基酸序列的氨基末端缺失了一个或多个残基的多肽。
在另一个实施方案中,本发明的融合蛋白的配体部分含有可以是治疗性蛋白质片段的治疗性蛋白质部分,它包括全长蛋白质以及从氨基酸序列的羧基末端缺失了一个或多个残基的多肽。
在另一个实施方案中,本发明的融合蛋白的配体部分含有在氨基末端和羧基末端都缺失了一个或多个氨基酸的治疗性蛋白质部分。
在另一个实施方案中,融合蛋白含有与本文所述的参照治疗性蛋白质或其片段至少约80%、85%、90%、95%、96%、97%、98%、99%或100%相同的治疗性蛋白质部分,即配体部分。在另一个实施方案中,转铁蛋白融合分子含有治疗性蛋白质部分,所述治疗性蛋白质部分与上文所述的具有N-末端和C-末端缺失的氨基酸序列的参照多肽至少约80%、85%、90%、95%、96%、97%、98%或99%相同。
在另一个实施方案中,融合蛋白含有与例如治疗性蛋白质的天然的或野生型氨基酸序列至少约80%、85%、90%、95%、96%、97%、98%、99%或100%相同的治疗性蛋白质部分。还提供了这些多肽的片段。
对应于本发明的经修饰的转铁蛋白融合蛋白的治疗性蛋白质部分的治疗性蛋白质,例如细胞表面和分泌蛋白质,可以通过连接一个或多个寡糖基团来修饰。被称作糖基化的修饰可显著地影响蛋白质的物理特性,对于蛋白质的稳定性、分泌和定位来说是重要的。糖基化发生在沿多肽主链的特定位置。通常有两种主要类型的糖基化:特征为O-联寡糖的糖基化,O-联寡糖被连接到丝氨酸或苏氨酸残基上;和特征为N-联寡糖的糖基化,N-联寡糖被连接到Asn-X-Ser/Thr序列中的天冬酰胺残基上,其中X可以是除脯氨酸之外的氨基酸。变量如蛋白质结构和细胞类型影响在链内不同糖基化位点的糖单位的数量和特性。在给定细胞类型中,相同位点也常出现糖基化异构体。例如,几种类型的人干扰素被糖基化。
对应于本发明的融合蛋白的治疗性蛋白质部分的治疗性蛋白质及其类似物和变体可以被修饰,使得在一个或多个位点的糖基化由于它们的核酸序列被表达它们的宿主细胞操纵或者由于它们的其它的表达条件而发生改变。例如,可以通过去除或插入糖基化位点,例如通过氨基酸残基的取代或缺失,例如用谷氨酰胺取代天冬酰胺来制备糖基化异构体,或者通过在不会使其糖基化的宿主细胞,如糖基化缺陷的酵母中表达蛋白质来制备非糖基化的重组蛋白质。这些方法在本领域是已知的。
治疗性蛋白质和它们的核酸序列在本领域是众所周知的,可得自公共数据库例如Chemical Abstracts Services Databases(例如,CASRegistry)、GeneBank和GenSeq。下文提及的登录号和序列在此全部引入作为参考。
本发明进一步涉及含有在此描述的治疗性蛋白质的片段的融合蛋白。即使从蛋白质的N-末端缺失一个或多个氨基酸,导致治疗性蛋白质部分的一种或多种生物学功能被改变或缺失,其它治疗活性和/或功能活性(例如,生物活性、多聚化的能力、结合配体的能力)仍然被保留。例如,从N-末端除去不超过完整多肽的残基的大部分,该N-末端有缺失的多肽诱导和/或结合识别完整或成熟形式的多肽的抗体的能力一般仍被保留下来。可以通过本文所述的和本领域已知的其它方法测定缺乏完整多肽的N-末端残基的特定多肽是否仍保留这种免疫活性。N-末端缺失了大量氨基酸残基的突变体也有可能保留某些生物学或免疫学活性。实际上,由少至六个氨基酸残基组成的肽常常能够引发免疫应答。
另外如上所述,即使从治疗性蛋白质的N-末端或C-末端缺失一个或多个氨基酸导致该蛋白质的一种或多种生物学功能被改变或缺失,其它功能活性(例如,生物活性、多聚化的能力、结合配体的能力)和/或治疗活性仍然被保留下来。例如从C-末端除去不超过完整或成熟多肽的残基的大部分,该C-末端有缺失的多肽诱导和/或结合识别完整或成熟形式的多肽的抗体的能力一般仍被保留下来。可以通过本文所述的和/或本领域已知的其它方法测定缺乏参照多肽的N-末端和/或C-末端残基的特定多肽是否仍保留治疗活性。
治疗性蛋白质的肽片段可以是含有能显示出治疗性蛋白质的多肽序列的治疗活性和/或功能活性(例如生物活性)的氨基酸序列,或可选择地由所述序列组成的片段,所述氨基酸序列是治疗性蛋白质的片段。
其它多肽片段是生物活性片段。生物活性片段是那些表现出与本发明所用治疗性蛋白质相似但不必相同的活性的片段。片段的生物活性可包括改善所需的活性或降低不需要的活性。
一般来说,蛋白质的变体总体上非常类似,在很多区域都与对应于本发明转铁蛋白融合蛋白的治疗性蛋白质部分的治疗性蛋白质的氨基酸序列相同。本发明也包括编码这些变体的核酸。
本发明进一步可以使用的治疗性多肽是由在本领域技术人员已知的严格杂交条件下能与编码治疗性蛋白质氨基酸序列之核酸分子的互补序列杂交的多核苷酸编码的多肽。参见,例如,Ausubel,F.M.等,编辑,1989 Current protocol in Molecular Biology,Green PublishingAssociates,Inc.,和John Wiley&Sons Inc.,New.York。本发明也包括编码这些多肽的多核苷酸。
具有与本发明的查询(query)氨基酸序列至少例如95%“相同的”氨基酸序列的多肽是指除了受试多肽序列可在查询氨基酸序列的每100个氨基酸中包括多达5个氨基酸改变外,受试多肽的氨基酸序列与查询氨基酸序列相同。换句话说,为了获得具有与查询氨基酸序列至少95%相同的氨基酸序列的多肽,受试序列中多达5%的氨基酸残基可被插入、缺失或用别的氨基酸取代。参照序列的这些改变可发生在参照序列的氨基或羧基末端位置,或发生在所述末端位置之间的任何位置,或单个散布于参照序列的残基中,或散布于参照序列内的一个或多个邻近基团中。
在实践中,通常可以使用已知的计算机程序确定任何特定多肽是否与例如,本发明的融合蛋白或其片段(例如融合蛋白或其部分的治疗性蛋白质部分)的氨基酸序列至少约80%、85%、90%、95%、96%、97%、98%或99%相同。一种用于确定查询序列(本发明的序列)和受试序列之间的最佳全面匹配的方法,也被称作全序列比对,可以使用基于Brufiag等,(Comp.App.Biosci 245-(1990))的算法的FASTDB计算机程序来确定。
本发明的多核苷酸变体可在编码区、非-编码区或这两处含有改变。可以使用含有改变的多核苷酸变体制备经修饰的配体部分,所述改变能产生沉默的取代、添加或缺失,但不会改变所编码多肽的特性或活性。可以利用因遗传密码简并性所致的沉默取得产生的核苷酸变体。另外,也可以利用以任意组合取代、缺失或添加了少于约50、少于40、少于30、少于20、少于10、或5-50、5-25、5-10、1-5或1-2个氨基酸的多肽变体。产生多核苷酸变体的原因可以有多个,例如针对特定宿主的最优化密码子表达(将人的mRNA的密码子改变为被上述宿主,例如酵母或大肠杆菌优选的密码子)。
在其它实施方案中,与野生型相比,治疗性蛋白质部分(即配体部分)具有保守取代。“保守取代”是指在组内交换,如脂肪族或疏水氨基酸Ala、Val、Leu和Ile的替换;羟基残基Ser和Thr的替换;酸性残基Asp和Glu的替换;酰胺残基Asn和Gln的替换;碱性残基Lys、Arg和His的替换;芳香族残基Phe、Tyr和Trp的替换;和小氨基酸Ala、Ser、Thr、Met和Gly的替换。例如Bowie等在“Deciphering theMessage in Protein Sequences:Tolerance to Amino Acid Substitutions,”Science 247:1306-1310(1990)中提供了关于如何进行表型沉默的氨基酸取代的指导。在特定实施方案中,本发明的多肽含有本文所述治疗性蛋白质和/或血清转铁蛋白,和/或本发明的经修饰的转铁蛋白的氨基酸序列的片段或变体,或可选择地由所述片段或变体组成,其中与参照氨基酸序列相比,所述片段或变体具有1-5、5-10、5-25、5-50、10-50或50-150个氨基酸残基的添加、取代和/或缺失。在进一步的实施方案中,氨基酸取代是保守的。本发明还包括编码这些多肽的核酸。
本发明的经修饰的融合蛋白可由通过肽键或经修饰的肽键彼此连接的氨基酸组成,并可含有除20个基因-编码的氨基酸以外的氨基酸。可以通过任一种天然方法,例如翻译后加工,或通过本领域众所周知的化学修饰技术来修饰多肽。基础教材和更详细的专题著作以及多卷研究文献中详细描述了所述修饰。
修饰可发生在多肽的任何位置,包括肽主链、氨基酸侧链和氨基或羧基末端。可以意识到在给定多肽的几个位点处,存在相同或各种程度的相同类型的修饰。并且,给定多肽也可含有多种类型的修饰。多肽也可以因为例如泛素化(ubiquitination)而是分支的,它们也可以是有或无分支的环形的。环形的、分支的、以及分支环形的多肽可以由翻译后的天然加工获得,或者通过合成方法制备。修饰包括乙酰化、酰化、ADP-核糖基化、酰胺化、与黄素共价连接、与亚铁血红素部分共价连接、与核苷酸或核苷酸衍生物共价连接、与脂质或脂质衍生物共价连接、与磷脂酰肌醇共价连接、交联、环化、形成二硫键、去甲基化、形成共价交联、形成半胱氨酸、糖基化、GPI锚定形成、羟基化、碘化、甲基化、十四烷基化、氧化、PEG化、蛋白水解加工、磷酸化、异戊二烯化、外消旋化、硫酸盐化、蛋白质中由转运-RNA介导的氨基酸添加,如精氨酰化和泛素化。参见,例如,Proteins-Structure andMolecular Properties,2nd Ed.,T.E.Creighton,W.H.Freeman andCompany,New York(1993);POST-TRANSLATIONAL COVALENTMODIFICATION OF PROTEINS,B.C.Johnson,编辑,Academic Press,New’York,pgs.1-12(1983);Seifter等,(1990)Meth.Enzymol.182:626-646;Rattan等,Ann.N.Y.Acad.Sci.663:48-62。
可以用作配体部分的治疗性分子包括但不限于:激素、基质蛋白质、免疫抑制剂、支气管扩张药、心血管药剂、酶、CNS药剂、神经递质、受体蛋白质或肽、生长激素、生长因子、抗病毒肽、融合抑制剂肽(fusogenic inhibitor peptides)、细胞因子、淋巴因子、单核因子、白细胞介素、集落刺激因子、分化因子、血管生成因子、受体配体、癌症-相关蛋白、抗肿瘤剂、病毒肽、抗菌肽、血液蛋白质、拮抗剂蛋白质、转录因子、抗-血管生成因子、拮抗剂蛋白质或肽、受体拮抗剂、抗体、单链抗体和细胞粘附分子。不同的治疗性分子可与单个融合蛋白组合以产生双功能或多功能的治疗性分子。也可以联合使用不同的分子以产生具有治疗实体和靶向实体的融合蛋白。治疗性分子可与本发明的柄部分直接融合,或可选择地融合至或插入至展示子(presenter)部分,例如Tf部分或白蛋白部分。
细胞因子是由免疫系统的细胞释放的可溶性蛋白质,它通过特定的受体发挥非酶解作用以调节免疫应答。细胞因子与激素的相似之处在于它们能在低浓度下起作用,以高亲合力与特定受体结合。本文所用术语“细胞因子”用于描述在具有该细胞因子的受体的细胞中引发特异性生物学应答的天然或重组的蛋白质、其类似物和其片段。细胞因子优选包括白细胞介素例如白细胞介素-2(IL-2)(GenBank登录号S77834)、IL-3(GenBank登录号M14743)、IL-4(GenBank登录号M23442)、IL-5(GenBank登录号J03478)、IL-6(GenBank登录号M14584)、IL-7(GenBank登录号NM_000880)、IL-10(GenBank登录号NM_000572)、IL-12(GenBank登录号AF180562和GenBank登录号AF180563)、IL-13(GenBank登录号U10307)、IL-14(GenBank登录号XM_170924)、IL-15(GenBank登录号X91233)、IL-16(GenBank登录号NM_004513)、IL-17(GenBank登录号NM_002190)和IL-18(GenBank登录号NM_001562)、造血因子例如粒细胞-巨噬细胞集落刺激因子(GM-CSF)(GenBank登录号X03021)、粒细胞集落刺激因子(G-CSF)(GenBank登录号X03656)、血小板活化因子(GenBank登录号NM_000437)和促红细胞生成素(GenBank登录号X02158)、肿瘤坏死因子(TNF)例如TNFα(GenBank登录号X02910)、淋巴因子例如淋巴毒素-α(GenBank登录号X02911)、淋巴毒素-β(GenBank登录号L11016)、白细胞调节素、巨噬细胞迁移抑制因子(GenBank登录号M25639)、和神经白细胞素(GenBank登录号K03515)、代谢过程调节剂例如leptin(GenBank登录号U43415)、干扰素例如干扰素α(IFNα)(GenBank登录号M54886)、IFNβ(GenBank登录号V00534)、IFNγ(GenBank登录号J00219)、IFNo(GenBank登录号NM_002177)、血小板反应蛋白1(THBS1)(GenBank登录号NM_003246)、THBS2(GenBank登录号L12350)、THBS3(GenBank登录号L38969)、THBS4(GenBank登录号NM_003248)和趋化因子。优选本发明的经修饰的转铁蛋白-细胞因子融合蛋白显示出细胞因子生物活性。
本文所用术语“激素”用于描述多种生物活性物质中的任一种,所述物质由某种细胞或组织产生,并能导致位于机体别处的另一种细胞或组织产生特异性生物学变化或活性。优选激素包括胰岛素原(GenBank登录号V00565)、胰岛素(GenBank登录号NM_000207)、生长激素1(GenBank登录号V00520)、生长激素2(GenBank登录号F006060)、生长激素释放因子(GenBank登录号NM_021081)、胰岛素-样生长因子I(GenBank登录号M27544)、胰岛素-样生长因子II(GenBank登录号NM_000612)、胰岛素-样生长因子结合蛋白1(IGFBP-1)(GenBank登录号M59316)、IGFBP-2(GenBank登录号X16302)、IGFBP-3(GenBank登录号NM_000598)、IGFBP-4(GenBank登录号Y12508)、IGFBP-5(GenBank登录号M65062)、IGFBP-6(GenBank登录号NM_002178)、IGFBP-7(GenBank登录号NM_001553)、绒毛膜促性腺素β链(GenBank登录号NM_033142)、绒毛膜促性腺素α链(GenBank登录号NM_000735)、促黄体素β(GenBank登录号X00264)、促卵泡激素β(GenBank登录号NM_000510)、促甲状腺激素β(GenBank登录号NM_000549)、促乳素(GenBank登录号NM_000948)、阿黑皮素原(GenBank登录号V01510)、促肾上腺皮质激素(ACTH)、β-促脂解素、α-促黑激素(α-MSH)、γ-促脂解素、β-MSH、β-内啡肽、和中间叶促皮质样肽(CLIP)。
术语“激素”还包括胰高血糖素样肽-1(GLP-1),其是调节胰岛素分泌的胃肠道激素,属于所谓的肠胰岛素轴以及作为GLP-1受体兴奋剂的肠促胰岛素类似物(exendin)(例如,肠促胰岛素类似物-4及其变体)。
本文所用术语“生长因子”用于描述任何与受体结合以刺激细胞增殖的蛋白质或肽。生长因子优选包括血小板-衍生的生长因子-α(PDGF-α)(GenBank登录号X03795),PDGF-β(GenBank登录号X02811),类固醇激素,表皮生长因子(EGF)(GenBank登录号NM_001963),成纤维细胞生长因子例如成纤维细胞生长因子1(FGF1)(GenBank登录号NM_000800)、FGF2(GenBank登录号NM_002006)、FGF3(GenBank登录号NM_005247)、FGF4(GenBank登录号NM_002007)、FGF5(GenBank登录号M37825)、FGF6(GenBank登录号X57075)、FGF7(GenBank登录号NM_002009)、FGF8(GenBank登录号AH006649)、FGF9(GenBank登录号NM_002010)、FGF10(GenBank登录号AB002097)、FGF11(GenBank登录号NM_004112)、FGF12(GenBank登录号NM_021032)、FGF13(GenBank登录号NM_004114)、FGF14(GenBank登录号NM_004115)、FGF16(GenBank登录号AB009391)、FGF17(GenBank登录号NM_003867)、FGF18(GenBank登录号AF075292)、FGF19(GenBank登录号NM_005117)、FGF20(GenBank登录号NM_019851)、FGF21(GenBank登录号NM_019113)、FGF22(GenBank登录号NM_020637)、和FGF23(GenBank登录号NM_020638)、血管生成素(GenBank登录号M11567)、脑-衍生的神经营养因子(GenBank登录号M61176)、睫状神经营养生长因子(GenBank登录号X60542)、转化生长因子-α(TGF-α)(GenBank登录号X70340)、TGF-β(GenBank登录号X02812)、神经生长因子-α(NGF-α)(GenBank登录号NM_010915)、NGF-β(GenBank登录号X52599)、金属蛋白酶组织抑制剂1(TIMP1)(GenBank登录号NM_003254)、TIMP2(GenBank登录号NM_003255)、TIMP3(GenBank登录号U02571)、TIMP4(GenBank登录号U76456)和巨噬细胞刺激因子1(GenBank登录号L11924)。
本文所用术语“基质蛋白质”用于描述通常存在于细胞外基质中的蛋白质或肽。这些蛋白质对于强度、过滤或粘附功能至关重要。基质蛋白质优选包括胶原蛋白例如胶原蛋白I(GenBank登录号Z74615)、胶原蛋白II(GenBank登录号X16711)、胶原蛋白III(GenBank登录号X14420)、胶原蛋白IV(GenBank登录号NM_001845)、胶原蛋白V(GenBank登录号NM_000393)、胶原蛋白VI(GenBank登录号NM_058175)、胶原蛋白VII(GenBank登录号L02870)、胶原蛋白VIII(GenBank登录号NM_001850)、胶原蛋白IX(GenBank登录号X54412)、胶原蛋白X(GenBank登录号X60382)、胶原蛋白XI(GenBank登录号J04177)和胶原蛋白XII(GenBank登录号U73778)、层粘连蛋白如LAMA2(GenBank登录号NM_000426)、LAMA3(GenBank登录号L34155)、LAMA4(GenBank登录号NM_002290)、LAMB1(GenBank登录号NM_002291)、LAMB3(GenBank登录号L25541)、LAMC1(GenBank登录号NM_002293)、巢蛋白(GenBank登录号NM_002508)、α-覆膜蛋白(tectorin)(GenBank登录号NM_005422)、β-覆膜蛋白(GenBank登录号NM_058222)和纤连蛋白(GenBank登录号X02761)。
术语“血液蛋白质”传统定义为来源于血浆的蛋白质,但目前通常由重组方法生产血液蛋白质,其包括但不限于天然血清蛋白质,其衍生物、片段和突变体或变体,凝血因子,其衍生物、突变体、变体和片段(包括因子VII,VIII,IX,X),蛋白酶抑制剂(抗凝血酶3,α-1抗胰蛋白酶),尿激酶型纤溶酶激活物,免疫球蛋白,von Willebrand因子和von Willebrand突变体,纤连蛋白,血纤维蛋白原,凝血酶和血红蛋白。
本文所用术语“酶”用于描述任何能催化特异性反应而本身永远不会改变或破坏的蛋白质或蛋白质类物质。酶优选包括凝结因子例如F2(GenBank登录号XM_170688)、F7(GenBank登录号XM_027508)、F8(GenBank登录号XM_013124)、F9(GenBank登录号NM_000133)、F10(GenBank登录号AF503510)等、基质金属蛋白酶例如基质金属蛋白酶I(GenBank登录号MMP1)(GenBank登录号NM_002421)、MMP2(GenBank登录号NM_004530)、MMP3(GenBank登录号NM_002422)、MMP7(GenBank登录号NM_002423)、MMP8(GenBank登录号NM_002424)、MMP9(GenBank登录号NM_004994)、MMP10(GenBank登录号NM_002425)、MMP12(GenBank登录号NM_002426)、MMP13(GenBank登录号X75308)、MMP20(GenBank登录号NM_004771)、腺苷脱氨酶(GenBank登录号NM_000022)、促分裂原活化蛋白激酶例如MAPK3(GenBank登录号XM_055766)、MAP2K2(GenBank登录号NM_030662)、MAP2K1(GenBank登录号NM_002755)、MAP2K4(GenBank登录号NM_003010)、MAP2K7(AF013588)、和MAPK12(NM_002969)、激酶例如JNKK1(GenBank登录号U17743)、JNKK2(GenBank登录号AF014401)、JAK1(M64174)、JAK2(NM_004972)、和JAK3(NM_000215),和磷酸酶例如PPM1A(GenBank登录号NM_021003)和PPM1D(GenBank登录号NM_003620)。
本文所用术语“转录因子”用于描述任何参与蛋白质-编码基因转录的蛋白质或肽。转录因子包括Sp1、Sp2(GenBank登录号NM_003110)、Sp3(GenBank登录号AY070137)、Sp4(GenBank登录号NM_003112)NFYB(GenBank登录号NM_006166)、Hap2(GenBank登录号M59079)、GATA-1(GenBank登录号NM_002049)、GATA-2(GenBank登录号NM_002050)、GATA-3(GenBank登录号X55122)、GATA-4(GenBank登录号L34357)、GATA-5、GATA-6(GenBank登录号NM_005257)、FOG2(NM_012082)、Eryf1(GenBank登录号X17254)、TRPS1(GenBank登录号NM_014112)、NF-E2(GenBank登录号NM_006163)、NF-E3、NF-E4、TFCP2(GenBank登录号NM_005653)、Oct-1(GenBank登录号X13403)、同源框蛋白例如HOXB2(GenBank登录号NM_002145)、HOX2H(GenBank登录号X16665)、无毛同系物(GenBank登录号NM_005144)、mothers against decapentaplegic蛋白例如MADH1(GenBank登录号NM_005900)、MADH2(GenBank登录号NM_005901)、MADH3(GenBank登录号NM_005902)、MADH4(GenBank登录号NM_005359)、MADH5(GenBank登录号AF009678)、MADH6(GenBank登录号NM_005585)、MADH7(GenBank登录号NM_005904)、MADH9(GenBank登录号NM_005905)、以及转录蛋白的信号转导物和激活物例如STAT1(GenBank登录号XM_010893)、STAT2(GenBank登录号NM_005419)、STAT3(GenBank登录号AJ012463)、STAT4(GenBank登录号NM_003151)、STAT5(GenBank登录号L41142)、和STAT6(GenBank登录号NM_003153)。
在本发明的另一个实施方案中,治疗性分子是非-人或非-哺乳动物蛋白质。例如,可以使用HIV gp120,HIV Tat,其它病毒(例如肝炎病毒、疱疹病毒、流感病毒、腺病毒和RSV)的表面蛋白,其它HIV组分,寄生虫表面蛋白例如疟疾抗原,以及细菌表面蛋白。这些非-人蛋白质可用作例如抗原,或者因其有用的活性而被使用。例如,治疗性分子可以是链激酶、葡激酶、天冬酰胺酶、尿激酶或其他具有有用酶解活性的蛋白质。
在本发明可替代的实施方案中,治疗性分子是具有生物活性的配体-结合蛋白质。所述配体-结合蛋白质可以例如(1)阻断在细胞表面的受体-配体相互作用;或(2)中和血液液相中分子的生物活性,从而阻止其到达其细胞靶。在一些实施方案中,经修饰的转铁蛋白融合蛋白包括与受体的配体-结合域融合的经修饰的转铁蛋白分子,所述受体选自但不限于由低密度脂蛋白(LDL)受体、乙酰化LDL受体、肿瘤坏死因子α受体、转化生长因子β受体、细胞因子受体、免疫球蛋白Fc受体、激素受体、葡萄糖受体、糖脂受体和糖胺聚糖受体组成的组。在其它实施方案中,配体-结合蛋白包括CD2(M14362)、CD3G(NM_000073)、CD3D(NM_000732)、CD3E(NM_000733)、CD3Z(J04132)、CD28(NM_006139)、CD4(GenBank登录号NM_000616)、CD1A(GenBank登录号M28825)、CD1B(GenBank登录号NM_001764)、CD1C(GenBank登录号NM_001765)、CD1D(GenBank登录号NM_001766)、CD80(GenBank登录号NM_005191)、GNB3(GenBank登录号AF501884)、CTLA-4(GenBank登录号NM_005214)、细胞间粘附分子例如ICAM-1(NM_000201)、ICAM-2(NM_000873)、和ICAM-3(NM_002162)、肿瘤坏死因子受体例如TNFRSF1A(GenBank登录号X55313)、TNFR1SFB(GenBank登录号NM_001066)、TNFRSF9(GenBank登录号NM_001561)、TNFRSF10B(GenBank登录号NM_003842)、TNFRSF11B(GenBank登录号NM_002546)、和TNFRSF13B(GenBank登录号NM_006573)、以及白细胞介素受体例如IL2RA(GenBank登录号NM_000417)、IL2RG(GenBank登录号NM_000206)、IL4R(GenBank登录号AF421855)、IL7R(GenBank登录号NM_002185)、IL9R(GenBank登录号XM_015989)和IL13R(GenBank登录号X95302)。优选为,本发明的配体-结合蛋白融合物显示出配体-结合蛋白的生物活性。
本文所用术语“癌症-相关蛋白”用于描述其表达与癌症或维持受控细胞生长有关的蛋白质或多肽,例如被肿瘤抑制基因或癌基因编码的蛋白质。癌症-相关蛋白可包括p16(GenBank登录号AH005371)、p53(GenBank登录号NM_000546)、p63(GenBank登录号NM_003722)、p73(GenBank登录号NM_005427)、BRCA1(GenBank登录号U14680)、BRCA2(GenBank登录号NM_000059)、CTBP相互作用蛋白(GenBank登录号U72066)、DMBT1(GenBank登录号NM_004406)、HRAS(GenBank登录号NM_005343)、NCYM(GenBank登录号NM_006316)、FGR(GenBank登录号NM_005248)、myb(GenBank登录号AF104863)、raf1(GenBank登录号NM_002880)、erbB2(GenBank登录号NM_004448)、VAV(GenBank登录号X16316)、c-fos(V GenBank登录号01512)、c-fes(GenBank登录号X52192)、c-jun(GenBank登录号NM_002228)、MAS1(GenBank登录号M13150)、pim-1(GenBank登录号M16750)、TIF1(GenBank登录号NM_003852)、c-fms(GenBank登录号X03663)、EGFR(GenBank登录号NM_005228)、erbA(GenBank登录号X04707)、c-src酪氨酸激酶(GenBank登录号XM_044659)、c-abl(GenBank登录号M14752)、N-ras(GenBank登录号X02751)、K-ras(GenBank登录号M54968)、jun-B(GenBank登录号M29039)、c-myc(GenBank登录号AH001511)、RB1(GenBank登录号M28419)、DCC(GenBank登录号X76132)、APC(GenBank登录号NM_000038)、NF1(GenBank登录号M89914)、NF2(GenBank登录号Y18000)、和bcl-2(GenBank登录号M13994)。
本文所用术语“融合抑制剂肽”用于描述显示出抗病毒活性,抗-膜融合能力,和/或调节细胞内过程(如参与卷曲螺旋肽结构)的能力的肽。抗病毒活性包括但不限于抑制HIV-1、HIV-2、RSV、SIV、EBV、麻疹病毒、流感病毒或CMV传播至非感染细胞。另外肽的抗融合能力,抗病毒活性或细胞内调节活性仅需要肽的存在,具体地说,不需要刺激定向抗所述肽的宿主免疫应答。抗融合指的是相对于缺乏肽时两种或多种部分之间发生的膜融合水平而言,所述肽抑制或降低所述部分之间的膜融合事件的水平的能力。所述部分可以是例如细胞膜或病毒结构,如病毒包膜或纤毛。本文所用术语“抗病毒肽”指的是所述肽能抑制病毒对细胞的感染,或能抑制一些经由例如细胞-细胞融合或游离病毒感染的生产性病毒感染和/或病毒病理所需的病毒活性。所述感染可包括发生于有包膜病毒中的膜融合,或者一些其它的与病毒结构和细胞结构有关的融合事件。融合抑制剂肽和抗病毒肽常具有得自一种以上病毒蛋白质(例如衍生自HIV-1、HIV-2、RSV和SIV的多肽)的氨基酸序列。
融合抑制剂肽和抗病毒肽的例子见于WO 94/2820、WO 96/19495、WO 96/40191、WO 01/64013和美国专利6,333,395、6,258,782、6,228,983、6,133,418、6,093,794、6,068,973、6,060,065、6,054,265、6,020,459、6,017,536、6,013,263、5,464,933、5,346,989、5,603,933、5,656,480、5,759,517、6,245,737、6,326,004和6,348,568,在此以上皆全部引入本文作为参考。
其它类型的肽的例子包括本文所述的治疗性蛋白质的片段,特别是保留了亲代分子的至少一种活性的人蛋白质片段。可用于生产本发明的配体部分的肽还包括模拟肽和表现出治疗性蛋白质的生物活性但是序列或者三维结构与全长治疗性蛋白质不同的肽。作为非-限制性的例子,肽包括Johnson等,(2000)Nephrol.Dial.Transplant 15(9):1274-7,Kuai等,(2000)J.Pept.Res.56(2):59-62,Barbone等,(1999)Nephrol.Dial.Transplant.14 Supp 2:80-4,Middleton等,(1999)J.Biol.Chem.274(20):14163-9,Johnson等,(1998)Biochemistry 37(11):3699-710,Johnson等,(1997)Chem.Biol.12:939-50,Wrighton等,(1997)Nat.Biotechnol.15(12):1261-5,Livnah等,(1996)Science 273:464-71,和Wrighton等,(1996)Science 273:458-64中公开的促红细胞生成素模拟肽。
治疗性分子还包括过敏原蛋白质及其经消化的片段。其包括豚草属植物(ragweed)、黑麦(rye)、六月草(June grass)、果园草(orchard grass)、香春草(sweet vernal grass)、红顶草(red top grass)、梯牧草(timothy grass)、黄色阔叶野草(yellow dock)、小麦、玉米、蒿属植物(sagebrush)、早熟禾(blue grass)、加利福尼亚一年生草(California annual grass)、苋(pigweed)、狗牙草(Bermuda grass)、细叶钾猪毛菜(Russian thistle)、山雪松(mountain cedar)、橡树(oak)、羽叶槭(box elder)、悬铃木(sycamore)、枫树、榆树等的花粉过敏原,尘螨,蜂毒,食物过敏原,动物皮屑和其它昆虫毒液。
其它治疗性分子包括微生物疫苗,所述疫苗包括病毒、细菌和原生动物疫苗及其多种组分,例如表面抗原。所述疫苗包括含有糖蛋白、蛋白质或衍生自这些蛋白质的肽的疫苗。所述疫苗制备自金黄色葡萄球菌(Staphylococcus aureus)、化脓链球菌(Streptococcus pyogenes)、肺炎链球菌(Streptococcus pneumoniae)、脑膜炎奈瑟氏球菌(Neisseriameningitidis)、淋病奈瑟氏球菌(Neisseria gonorrhoeae)、沙门氏菌(Salmonella spp.)、志贺氏菌(Shigella spp.)、大肠杆菌(Escherichia coli)、克雷白氏杆菌(Klebsiella spp.)、变形菌(Proteus spp.)、霍乱弧菌(Vibriocholerae)、幽门弯曲杆菌(Campylobacter pylori)、铜绿假单胞菌(Pseudomonas aeruginosa)、流感嗜血杆菌(Haemophilus influenzae)、百日咳博德特氏菌(Bordetella pertussis)、结核分枝杆菌(Mycobacteriumtuberculosis)、嗜肺军团杆菌(Legionella pneumophila)、梅毒密螺旋体(Treponema pallidum)、衣原体(chlamydia)、破伤风类毒素(tetanustoxoid)、白喉类毒素(diphtheria toxoid)、流感病毒(influenza viruses)、腺病毒(adenoviruses)、副粘病毒(paramyxoviruses腮腺炎病毒(mumps)、麻疹病毒(measles))、风疹病毒(rubella viruses)、脊髓灰质炎病毒(polioviruses)、肝炎病毒(hepatitis viruses)、疱疹病毒(herpes viruses)、狂犬病毒(rabies virus)、HIV-1、HIV-2、RSV和乳头瘤病毒。
优选的融合分子可含有抗-HIV病毒肽、抗-RSV肽、人生长激素、α和/或β干扰素、促红细胞生成素(EPO)、EPO样肽、粒细胞-集落刺激因子(GCSF)、粒细胞-巨噬细胞集落刺激因子(GMCSF)、胰岛素、胰岛素-样生长因子(IGF)、血小板生成素、对应于抗体CDR的肽、胰岛新生相关蛋白(INGAP)、降钙素、血管抑素、内皮抑素、白细胞介素-2、生长激素释放因子、人甲状旁腺激素、抗-肿瘤坏死因子(TNF)肽、白细胞介素-1(IL-1)受体和/或单链抗体。
本发明的融合蛋白也可被制备成包括衍生自肽库的肽或多肽,以筛选具有新功能的分子。所述肽库包括可商购或公众能够获得的肽库,例如,American Peptide Co.Inc.、Cell Sciences Inc.、InvitrogenCorporation、Phoenix Pharmaceuticals Inc.、United States Biological,以及通过可利用的技术制备的肽库,例如,使用标准方法制备的噬菌体和细菌展示库。
在本发明的其它实施方案中,可使用本领域已知的治疗性蛋白质部分来制备融合蛋白,由美国食品药品管理局(FDA,www.fda.gov/cber/efoi/approve.htm)以及PCT专利公开号WO 01/79258、WO 01/77137、WO 01/79442、WO 01/79443、WO 01/79444和WO01/79480(在此皆全文引入作为参考)最新认可的肽和蛋白质即是所述融合蛋白的例子。
表1(来自PCT国际公开号WO 03/020746,在此引入作为参考)提供了非穷举的治疗性蛋白质列表,所述治疗性蛋白质对应于本发明的融合蛋白的治疗性蛋白质部分,即配体部分。“治疗性蛋白质X”一栏公开了治疗性蛋白质分子,其后面的括号中包含学名和商品名,所述分子含有治疗性蛋白质分子或其片段或其变体,或可选择地由它们组成。本文所用“治疗性蛋白质X”可指各个治疗性蛋白质分子(由得自CAS和Genbank登录号的氨基酸序列限定),或指与该栏公开的给定治疗性蛋白质分子相关的整组治疗性蛋白质。“例举的标识符”一栏提供了Chemical Abstracts Services(CAS)登记号(由American Chemical Society公开)和/或Genbank登录号(例如通过网址为www.ncbi.nlm.nih.gov的国立生物技术信息中心(NCBI)的网页即可获得基因座ID,NP-XXXXX(参照序列蛋白质),和XP-XXXXX(模型蛋白质)标识符),所述登记号或登录号相当于CAS登记或Genbank数据库的入口,所述数据库含有治疗性蛋白质分子或其片段或变体的氨基酸序列。另外,表1还给出了GenSeq登录号和/或期刊出处以鉴定所例举的一些多肽的氨基酸序列。
与所述CAS和Genbank和GenSeq登录号以及所引用的期刊出版物中的每一个都有关的摘要页是可以获得的(例如PubMed ID号(PMID)),在此皆全文引入作为参考。PCT/专利参考文献一栏提供了对应于描述治疗性蛋白质分子的专利和/或公开的专利申请的美国专利号或PCT国际公开号,皆在此全文引入作为参考。生物活性一栏描述与治疗性蛋白质分子相关的生物活性。例举的活性试验一栏提供了描述试验的参考文献,所述试验可用于检测治疗性蛋白质或含有治疗性蛋白质X部分的本发明的转铁蛋白融合蛋白的治疗和/或生物活性。这些参考文献在此也皆全文引入作为参考。“优选适应症Y”一栏描述了治疗性蛋白质X或含有治疗性蛋白质X部分的本发明的转铁蛋白融合蛋白可以治疗、预防、诊断或改善的疾病、失调和/或健康状况。本发明包括WO 03/020746中提供的治疗性蛋白质,其在此全文引入作为参考。
实施例
实施例1-GPI锚定、hMUC1和mTF表达盒的制备
用SalI和HindIII消化含有mTf表达盒(SEQ ID NO:16)的pREX0549载体。图3提供了pREX0549的载体图谱。将引物P0922和P0923(SEQ ID NO:7和SEQ ID NO:8)一起退火,在SalI/HindIII消化位点连接到pREX0549中。由P0922和P0923形成的连接子包括SpeI,HindIII和XbaI限制性位点,该连接子被设计成能接受编码GPI锚定和MUC1柄的核酸分子。得到的载体,pREX0628,包括具有P0922/P0923连接子的mTf表达盒。
用HindIII和XbaI消化pREX0628。退火引物P0924和P0925(SEQID NO:9和SEQ ID NO:10)以形成GPI锚定YIR019c。将YIR019c连接到经消化的pREX0628中以产生载体pREX0634。
采用引物P0958和P0959(SEQ ID NO:11和SEQ ID NO:12)自人乳腺肿瘤总RNA文库(Clontech)RT-PCR扩增hMUC1 cDNA。得到的cDNA用引物P1019和P1020(SEQ ID NO:13和SEQ ID NO:14)扩增以产生SpeI和HindIII限制性位点。在SEQ ID NO:6中提供了所得到的具有SpeI和HindIII位点的hMUC1。
用SpeI和HindIII消化pREX0634,将具有SpeI和HindIII位点的hMUC1连接到该载体中。得到的载体,pREX0663,被用作展示表达盒(mTf-MUC1-GPI)。
pREX0663被用于产生高和低拷贝量的酵母表达载体。为了产生高拷贝量的酵母表达载体,通过用NotI消化pREX0663从该载体除去4.1kb的展示表达盒。然后将表达盒连接到经NotI消化的和去磷酸化的pSAC35载体中,得到载体pREX0667(酵母展示载体I)。
低拷贝量酵母表达载体通过用NotI消化pREX0663并将表达载体连接到经NotI消化和去磷酸化的pREX0699中产生,得到pREX0721酵母展示(酵母展示载体II)。
使用上文所述的酵母表达载体能够如本领域已知转化酵母细胞和细菌细胞。如本领域已知,载体能在酵母细胞内表达。而且如本领域已知,可产生能够展示配体部分(如随机肽或CDR)库的经表达的转铁蛋白融合蛋白的集合并将其用于筛选结合试剂。
实施例2-15-单体随机库的构建
为了选择具有新的结合特性的转铁蛋白变体,通过本领域已知的PCR拼合程序(knitting procedure)在转铁蛋白的289-290氨基酸位置中构建随机的15-单体(15-mer)库(参见Martin和Smith(2006)Biochem J.396(2):287-95)。设计了15-单体肽库,尽管形成结合抗原表位通常只需要约7个氨基酸,并且~109的库仅包括设计库(3.3×1019)的小部分。然而,109大小的15-单体库含有比同样大小的7-单体(7-mer)肽库多6.4倍的7-单体。
在使用P1174/P1227得到转铁蛋白的含有BamHI/BspEI序列的DNA片段后,执行两次PCR反应(每次使用单一引物-P1172和P1173)以获得单链DNA。分离该ssDNA并退火以形成拼合15-单体库。该操作确保库保持了合成的寡核苷酸的最初的复杂性。使用P1174/P1227进一步扩增双链拼合15-单体库以获得足够量的DNA。纯化PCR产物,将其用BamHI/BspEI消化并克隆到合适的质粒载体中,例如pREX0995(图4)或pREX0667。
P1172(SEQ ID NO.:19)
289-290插入15-单体随机肽库向前后拼合的片段
C CAA CTA TTC AGC TCT CCT 567 567 567 567 567 567 567 567 567
567 567 567 567 567 567 CAT GGG AAG GAC CTG CTG TTT AAG
为了在DNA序列的每个位置中都引入随机性,将核苷(A、G、T和C)混合物依照LaBean和Kauffman(1993)Protein Sci.2:1249-54以预定比例掺入到该位置中。下面所示的混合物最小化了终止密码子的频率并与天然蛋白质的氨基酸组成相匹配。
5  13%T,32%G,20%C,35%A
6  24%T,24%G,22%C,30%A
7  37%T,26%G,37%C
P1173(SEQ ID NO.:20)
289-29015单体随机肽库前面片段的向后拼合的引物
AGGAGAGCTGAATAGTTGG
P1174(SEQ ID NO.:21)
289-29015单体随机肽库前面片段的向前拼合的引物
CTGGATGCAGGTTTGGTGTATG
P1227(SEQ ID NO.:22)
289-29015单体随机肽库后面片段的向后拼合的引物
TCATGATCTTGGCGATGCAGTC
实施例3-酵母细胞展示Flag的选择
建立酵母展示系统,藉此通过将转铁蛋白的N-小叶融合于柄区域、huMUC1和GPI信号序列将其展示在酵母表面上。为了证明该系统在结合选择方面的有效性,将Flag-标记序列,DYKDDDDK(SEQ ID NO.:23),或随机的15-单体肽库插入至转铁蛋白N-小叶的氨基酸位置289。然后将展示了Flag-标记的转铁蛋白N-小叶的酵母,pREX1012(图6),刺入(spike)展示了具有随机的15-单体肽的转铁蛋白N-小叶的酵母的池中。只有展示了Flag-标记的转铁蛋白N-小叶的酵母能通过抗-Flag抗体选择从该混合群体中重新获得。
为了在转铁蛋白的氨基酸位置289处插入Flag标记序列,合成掺入Flag标记序列的寡核苷酸,将其PCR编织入pREX0667载体以产生pREX0759(图7)。然后用含有Flag标记序列的pREX0759的BamHI/BspEI片段取代pREX0995(图4)的同样的限制性片段。得到的质粒,pREX1012,表达Flag标记的转铁蛋白N-小叶-MUC1-GPI融合蛋白。
还在pREX0995的BamHI/BspEI位点之间克隆了15-单体库。下面描述了15-单体库的制备。将结合样本转化到大肠杆菌DH5α之中,将转化混合物全部平铺在2LB/Amp(50μg/mL)的琼脂培养皿上。收集所有的克隆,并用Qiagen质粒制备方案用几个小量制备柱提取质粒DNA。
将pREX1012和15-单体库两者的质粒DNA转化到酿酒酵母链DS1101 cir°中。将pREX1012的单个克隆接种到含有蔗糖的缓冲最小培养基(Buffered Minimal Medium with Sucrose)(BMM/S)中并培养过夜。收集15-单体库的所有克隆并接种至BMM/S。用血球计数计确定两个过夜培养物中的细胞数,并制备如下细胞混合物:
(A)103个pREX1012酵母细胞与109个15-单体库酵母细胞的混合物(10∶107)
(B)103个pREX1012酵母细胞与108个15-单体库酵母细胞(100∶107)
在1ml细胞阻滞溶液(1×PBS/0.05% Tween-20,1%BSA)中于冰上培养细胞混合物30分钟。离心(在13000rpm 30秒)后,将细胞球悬浮在1ml含有生物素化抗-Flag抗体(Sigma Aldrich,1∶25稀释)的洗液(1×PBS,0.5% BSA,2mM EDTA)中,并在冰上培养30分钟。用1ml洗液冲洗细胞两次并将其悬浮在800μl(A)或160μl(B)的阻滞溶液中。将200μl(A)或40μl(B)的链酶亲和素MACS微珠(Miltenyi Biotec)添加到细胞悬浮液中并在冰上培养30分钟。使用MS柱按照制造商的操作指南(Miltenyi Biotec)将标记的细胞与未标记的细胞分开。收集标记的细胞并将其平铺在BMM/S琼脂糖培养皿上在30℃培养直到出现小的克隆。
通过从每一个培养皿中收集所有的克隆并将它们在5ml BMM/S中30℃培养过夜以进行第二轮选择。对来自这些培养物的相当于1.5OD600的细胞进行另一轮的如上所述的MACS分离。将第二轮筛选所得的细胞在5ml BMM/S中30℃培养过夜。每一次选择之前和之后都用抗-Flag单克隆抗体(Sigma Aldrich)和APC标记-山羊抗-小鼠检测抗体在Agilent Technolgy的生物分析仪中通过FACS分析酵母细胞培养物。按照制造商的操作指南进行FACS分析。在两轮MACS分离之后Flag-标记的酵母的出现变得明显(图8)。
实施例4-Aga1柄展示
通过用如下引物对S288c酵母基因组DNA进行PCR得到酵母基因AGA1核心区域的DNA序列(成熟蛋白质的残基116-658)。
(a)CAGATCTAGAACAACCGCTATCAGCTCATTATCC(SEQ ID NO.:24)
(b)CAGAAAGCTTAGTAGTGGAAACTTCTGTAGTG(SEQ ID NO.:25)
AGA1(部分序列)(SEQ ID NO.:74)
ACAACCGCTATCAGCTCATTATCCGAAGTAGGAACTACAACCGT
GGTATCATCCAGCGCCATTGAACCATCAAGTGCCTCTATAATCT
CACCTGTCACCTCTACACTTTCGAGTACAACATCGTCCAATCCAA
CTACTACCTCCCTAAGTTCGACATCTACATCTCCAAGCTCTACAT
CTACATCTCCAAGCTCTACATCTACCTCATCAAGTTCGACATCTA
CCTCATCAAGTTCGACATCTACCTCATCAAGTTCGACATCTACAT
CTCCAAGTTCGACATCCACATCTTCAAGTTTGACATCCACATCTT
CAAGTTCTACATCTACATCCCAAAGTTCTACATCTACCTCATCAA
GTTCGACATCTACATCTCCAAGCTCTACATCTACCTCATCAAGTT
CAACATCTACATCTCCAAGTTCTAAATCTACTTCTGCAAGCTCCA
CTTCCACTTCTTCATATTCAACATCTACATCCCCAAGTTTGACTT
CTTCATCTCCAACTTTGGCTTCCACTTCTCCAAGTTCAACATCTA
TTAGCTCTACTTTTACTGATTCAACTTCATCCCTTGGCTCCTCTAT
AGCATCTTCATCAACGTCTGTGTCATTATACAGCCCATCCACACC
TGTTTACTCCGTCCCTTCGACTTCGTCAAATGTTGCAACTCCTTC
TATGACTTCTTCAACTGTTGAAACAACTGTTAGTTCACAAAGTTC
GTCTGAATATATCACCAAATCCTCAATTTCTACTACTATCCCATC
ATTTTCCATGTCTACATATTTCACCACTGTTAGTGGAGTCACTAC
AATGTATACGACATGGTGTCCTTATAGCTCTGAATCTGAGACTA
GCACATTAACCAGTATGCATGAAACGGTTACAACAGACGCTACA
GTCTGCACTCACGAGTCTTGCATGCCCTCGCAGACAACAAGTTT
GATTACATCTTCTATAAAAATGTCCACTAAAAACGTCGCAACTT
CTGTAAGCACCTCAACGGTTGAATCCTCATATGCATGCTCCACA
TGTGCTGAAACGTCACACTCGTATTCTTCCGTGCAAACAGCTTCA
TCAAGTTCTGTAACACAGCAGACCACATCCACAAAGAGTTGGGT
AAGTTCAATGACAACTTCGGATGAAGATTTCAATAAGCACGCTA
CCGGTAAGTATCATGTAACATCTTCAGGTACCTCAACCATTTCG
ACTAGTGTAAGTGAAGCCACGAGTACATCAAGCATTGACTCAGA
ATCTCAAGAACAATCATCACACTTATTATCGACATCGGTCCTTTC
ATCCTCCTCCTTGTCTGCTACATTATCCTCTGACAGTACTATTTTG
CTATTCAGTTCTGTATCATCACTAAGTGTCGAACAGTCACCAGTT
ACCACACTTCAAATTTCTTCAACATCAGAGATTTTACAACCCACT
TCTTCCACAGCTATTGCTACAATATCTGCCTCTACATCATCACTT
TCCGCAACATCTATCTCTACACCATCTACCTCTGTGGAATCGACT
ATTGAATCTTCATCATTGACTCCGACGGTATCTTCTATTTTCCTCT
CATCATCATCTGCTCCCTCTTCTCTACAAACATCTGTTACCACTA
CAGAAGTTTCCACTACT
(SEQ ID NO.:75)
TTAISSLSEVGTTTVVSSSAIEPSSASIISPVTSTLSSTTSSNPTTTSLSS
TSTSPSSTSTSPSSTSTSSSSTSTSSSSTSTSSSSTSTSPSSTSTSSSLTST
SSSSTSTSQSSTSTSSSSTSTSPSSTSTSSSSTSTSPSSKSTSASSTSTSSY
STSTSPSLTSSSPTLASTSPSSTSISSTFTDSTSSLGSSIASSSTSVSLYSP
STPVYSVPSTSSNVATPSMTSSTVETTVSSQSSSEYITKSSISTTIPSFS
MSTYFTTVSGVTTMYTTWCPYSSESETSTLTSMHETVTTDATVCTH
ESCMPSQTTSLITSSIKMSTKNVATSVSTSTVESSYACSTCAETSHSY
SSVQTASSSSVTQQTTSTKSWVSSMTTSDEDFNKHATGKYHVTSSG
TSTISTSVSEATSTSSIDSESQEQSSHLLSTSVLSSSSLSATLSSDSTILL
FSSVSSLSVEQSPVTTLQISSTSEILQPTSSTAIATISASTSSLSATSISTP
STSVESTIESSSLTPTVSSIFLSSSSAPSSLQTSVTTTEVSTT
分离~1.5kb的PCR产物并用XbaI/HindIII消化。将片段连接到经SpeI/HindIII消化的pREX0855(图9)中并转化到大肠杆菌DH5α中。收集全部得到的克隆并从细胞分离质粒DNA。通过NotI消化重新获得表达盒,将表达盒连接到pSAC35中以提供酵母表达载体。
如前所述转化到酵母中并用抗-Flag抗体进行FACS分析。酵母克隆显示出高水平N-小叶,比对照的MUC1柄为基础的构建体展示约高10倍(数据未显示)。
分离单个酵母克隆,从该酵母细胞中提取质粒DNA。在提取的质粒DNA被NotI消化后,重新获得NotI表达盒,将该表达盒连接到经NotI消化的pREX0855中以提供质粒pREX1087(图10),即含有Flag-N-小叶-Aga1-GPI表达盒的pUC-基础的载体。测定与Aga1相应的DNA序列区域的序列以确定其同一性。还将表达盒转移回pSAC35中以提供pREX1106(图11)。
实施例5-在酵母细胞中具有功能的哺乳动物GPI变体的选择
哺乳动物GPI信号具有它们的酵母类似物所不具有的作用,例如细胞内运输、跨膜信号的传递以及网格蛋白-独立的内吞作用(BiochemJ.1993,294:305-324)。酵母细胞不仅含有细胞膜,还含有哺乳动物细胞缺少的细胞壁,许多酵母GPI具有独特的序列,该序列使蛋白质靶向酵母细胞壁(J Bacteriol,1999,181:3886-3889)。人胎盘碱性磷酸酶的GPI已经显示在酵母细胞中毫无功能(Mol Microbiol 1999,34:247-256)。作为为了获得新的能够将表达的组合蛋白连接到酵母细胞壁中的序列的方法,酵母使用huMDP GPI序列(DQLGGSCRTHYGYS SGASSLHRHWGLLLASLAPLVLCLSLL)展示基于pREX0885的载体(图9)。修饰该序列以掺入四个完全随机的密码子(X)以及几种(有下划线的)合理的修饰物,XQXGGSXXTIGGYSG AASSLQRTIGLLLASLAPLVLASLL(SEQ ID NO.:26),其中X是任何氨基酸。
将表达如下融合蛋白:Flag标记-N-小叶-MUC1柄-GPI的酵母库转化到酿酒酵母链DS1101 cir°中,在所述融合蛋白中GPI序列如上所述被修饰。用生物素化-抗-Flag抗体通过MACS分离任何具有与细胞壁连接的融合蛋白的酵母细胞。
退火两个寡核苷酸P2035和P2036(参见下面)并用Taq聚合酶延伸。纯化所得到的DNA片段,用HindIII/XbaI消化,并将其连接到经HindIII/XbaI消化的pREX0855中(参见下面以及图9)。
引物
P2035(SEQ ID NO.:27)
CTACAAGCTTNNKCAANNKGGTGGTTCTNNKNNKACTATTGGTG
GTTATTCTGGTGCTGCTTCTTCCTTGCAGAGAACTATTG
P2036(SEQ ID NO.:28)
GATGTCTAGATTATTATAACAAAGAAGCTAAAACCAATGGAGCT
AAAGAAGCCAATAACAAACCAATAGTTCTCTGCAAGGAAG
   HindIII
   -+----
   aagcttnnkc aannkggtgg ttctnnknnk actattggtg gttattctgg tgctgcttct
   ttcgaannmg ttnnmccacc aagannmnnm tgataaccac caataagacc acgacgaaga
      k  l x    q x  g     g  s x x   t   i  g    g  y  s    g   a  a  s
   >>............................P2035.............................>
                                                                 P2036<<
   tccttgcaga gaactattgg tttgttattg gcttctttag ctccattggt tttagcttct
   aggaacgtct cttgataacc aaacaataac cgaagaaatc gaggtaacca aaatcgaaga
       s   l  q       r  t i         g  l  l  l   a  s  l   a  p  l  v  l  a  s
   >......P2035......>>
   <.............................P2036.............................<
                                 XbaI
                                 -+----
   ttgttataat aatctaga(SEQ ID NO.:29)
   aacaatatta ttagatct
     l  l   -    -   s  r(SEQ ID NO.:30)
   <......P2036.....<<
将连接混合物转化到大肠杆菌DH5α中以获得约5×105个克隆。收集全部克隆并分离质粒DNA。用NotI消化质粒DNA以重新获得表达盒,将质粒DNA克隆到SAC35中以产生酵母表达库。将该库通过电穿孔转化到DS1101 cir°细胞中。用生物素化-抗-Flag抗体对前述库的过夜培养物进行MACS。立即用同样的抗体通过MACS再次纯化被分离的细胞。将得到的细胞平铺在BMMS培养皿上,通过FACS和DNA序列分析表征了24个克隆(参见Flag棘(spike)描述)。
在呈现出可读序列的22个克隆中,仅7个含有具有不同展示水平的全长的GPI锚定(表1),其中最好的好于表达具有酵母GPI锚定的同一融合蛋白的pREX1003载体。
表1
Figure A20078005062300861
Figure A20078005062300871
Figure A20078005062300881
出乎意料地,50%的克隆在随机化的密码子的一处被终止密码子截短,有效地去除了GPI锚定信号。确定在这12个克隆中有2个具有比pREX1003明显好的展示水平,其被发现正好在终止密码子之前含有半胱氨酸残基(CQIGGS*(SEQ ID NO.:34)和CQ*,其中*=终止密码子)(图12)。这些构建体多半通过与细胞壁蛋白质中的游离半胱氨酸残基二硫键连接从而交联到细胞壁中。
实施例6-RGD库的构建和筛选
为了选择结合整联蛋白αIIbβ3和抑制血小板凝集的转铁蛋白变体,通过PCR编织程序在转铁蛋白289-290氨基酸位置之间的Tf骨架中插入肽构建库,其中所述肽为在整联蛋白结合序列Arg-Gly-Asp(RGD)的任一侧含有3个随机化的氨基酸的肽(CXXXRGDXXXC;X代表随机化位置)。
使用引物P1980/P2181和P2127/P1173扩增pREX1106(图11)以获得片段A和B(图13)。
P1173
289-290前面片段的向后拼合的引物
AGGAGAGCTGAATAGTTGG
P1980
289-290含有随机肽库的RGD后面片段的向前拼合的引物
CCAACTATTCAGCTCTCCTTGT567567567AGAGGAGAC567567567
TGTCATGGGAAGGACCTGCTGTTTAAG
5  13%T,32%G,20%C,35%A
6  24%T,24%G,22%C,30%A
7  37%T,26%G,37%C
(能最小化终止密码子的频率并与天然蛋白质的氨基酸组成相匹配的核苷混合物;Labean,TH和Kauffman,SA,1993,Protein Science.2:1249-1254)
P2127
289-290前面片段的向前拼合的引物
CCTCCTACCTTGATTGCATCAG
P2181
289-290后面片段的向后拼合的引物
GGAGATGAAGAAGTCAAACTTGGG
P2139
空位修复GPI库
GAGGCACTTGATGGTTCAATGG
引物P1980引入了随机化的序列。用凝胶纯化扩增的DNA片段,并用单个引物(P2181用于片段A以及P2127用于片段B)进一步扩增以获得单链DNA(ss-A和ss-B)。在dNTP和Klenow酶存在下退火ss-A和ss-B以形成双链片段。最后使用P2127和P2139扩增退火产物并用凝胶纯化以产生RGD-库插入物。该操作确保库保持了合成的寡核苷酸的最初的复杂性。
将该插入物通过空位-修复插入到经BamHI-BspEI消化的pREX1106中使用如下描述的电穿孔方法构建7×108库。对于每一个缺口-修复反应,将1.4μg经BamHI/BspEI消化的pREX1106与1μg上述的RGD-库插入物混合并电穿孔到DS1101 cir°酵母细胞中。
用于库构建的高效率的酵母(DS1101 cir°)电穿孔。
1)接种100mL的YEP/S(1%w/v酵母提取物,2%w/v蛋白胨,2%w/v蔗糖)至来自DS1101 cir°的新鲜过夜培养物的OD600=0.2。
2)在30℃,200rpm生长细胞至OD600为0.8(约5个小时)。
3)通过在2,000rpm离心5分钟收集细胞。
4)轻轻倒出上清液,将小球再次悬浮于18mL的TE(10mMTris-HCl,pH7.5和1mM EDTA)缓冲液中。然后加入2mL 1M的醋酸锂。
5)在滚筒鼓中于30℃培养细胞45分钟。
6)加入0.5mL的1M的DTT。
7)在滚筒鼓中于30℃培养15分钟。
8)用80mL无菌水在室温冲洗。
9)在100mL无菌水中于室温冲洗小球。
10)在10mL冰的1M山梨醇中冲洗小球。
11)在60μL冰的1M山梨醇(足够6次转化)中再次悬浮细胞。
12)在冰上保存细胞并在消过毒的微量离心管中混合:
i.50μL的感受态酵母细胞
ii.1.4μg DNA(等于5μL)
iii.5μg的ssDNA(0.5μl 10mg/mL)
13)脉冲前在冰上培养5分钟。向0.2cm冰的试管底部轻拍cell/DNA悬浮物并脉冲一次:
i.电压1.5Kv
ii.电容25μF
iii.电阻200Ω
14)立即加入1mL的YEP/S和1M山梨醇的50∶50的混合物,将酵母转移到微量离心管中并使酵母在30℃恢复1小时(需要通过试验确定是否需要恢复)。
15)通过在5000rpm离心1分钟收集细胞,并用1mL 1M的山梨醇冲洗1次。
16)在1mL 1M的山梨醇中再次悬浮并铺在BMM/S培养皿上。在30℃培养。
从酵母展示库中选择对αIIbβ3具有高亲合力的转移体,该酵母展示库位于用纯化自人血小板的整联蛋白包被的培养皿上。按照作了些许改动的Hillman等(Hillman等,2002,Protein Expr.Purif.25(3):494-502)的方法纯化αIIbβ3整联蛋白。在包被液(50mM硼酸盐缓冲液,pH 9.5)中稀释(1∶30稀释液)整联蛋白,并将整联蛋白包被到培养皿上,4℃过夜。在用缓冲液A(20mM Tris-HCl,pH7.5,150mM NaCl,1mM MgCl2,1mM CaCl2和1mM MnCl2)冲洗3次后,培养皿用结合缓冲液+1%BSA在室温阻滞2个小时。通过离心收集在30℃,200rpm条件下在培养皿上于BMM/S(2%w/v蔗糖)中培养过夜的40OD600单位的酵母RGD库并将其悬浮于10mL的含有1%BSA和GRGDSP抑制剂肽(第一次选择为1μg/mL和第2次选择为10μg/mL)的结合缓冲液中并与包被的整联蛋白在室温平缓摇动培养2个小时。用结合缓冲液冲洗3次将未结合的细胞冲去并收集结合的细胞。
可溶性蛋白质的制备。
从酵母展示载体中重新获得编码含有RGD序列的N-小叶的DNA编码区域,并克隆到酵母表达载体中以产生含有该RGD序列的可溶性Tf分子。它们在高细胞密度的补料分批发酵液中被表达并用柱层析纯化。下面为与天然αIIbβ3配体的序列相对比的经选择的克隆的序列实例:
Figure A20078005062300911
整联蛋白结合分析。
用ELISA测量RGD转移体对整联蛋白的直接结合。在包被液中稀释整联蛋白并将其包被到Maxisorb ELISA培养皿上,4℃过夜。
用含有1%BSA和0.05%Tween-20的缓冲液A(结合缓冲液)在室温轻摇将培养皿阻滞2个小时。将在结合缓冲液中稀释的转移体与整联蛋白在4℃结合过夜。用含有0.05%Tween-20的缓冲液A(冲洗缓冲液)冲洗去未结合的物质。用生物素化的抗-转铁蛋白和链霉亲和素-HRP在结合缓冲液中检测结合的物质,每一步骤之后都用冲洗缓冲液冲洗。用QuantaBlue荧光基质在SpectraMax Gemini EM及SoftMax软件上进行结合定量化。参见图14。
转移体结合还可以在竞争性ELISA试验形式中确定。按照如上方法包被整联蛋白和阻滞培养皿。将在结合缓冲液中的转移体,或控制肽,和生物素化的纤连蛋白添加到适当的孔中将其在4℃下结合过夜。用冲洗缓冲液冲洗培养皿,用链霉亲和素-HRP检测结合的纤连蛋白。按照如上方法对进行结合定量。参见图15。
血小板凝集分析。
用小鼠血小板-富集的血浆(PRP)进行血小板凝集试验。从B6小鼠获得新鲜的血小板。将血小板稀释至2.5×108/mL备用。用血小板凝集计在37℃摇动(900rpm)下测量血小板凝集。在加入ADP(10μM)前,测试样品与PRP培养10分钟。血小板凝集的程度用比浊法连续监测6分钟,用光透射的增加表示血小板凝集的程度。参见图16。
实施例7-MUC3柄改造
为了在酵母表面展示蛋白质,最优化人MUC3(hMUC3)蛋白质作为展示柄。修饰hMUC3DNA序列(Genebank登陆#AAC02272)去除一些重复并用合成的针对酵母最优化的寡核苷酸密码子进行构建。得到的hMUC3柄序列(参见如下序列)由GenScript Corporation Piscataway,New Jersey合成。
已经证实在大肠杆菌中经修饰的hMUC3DNA当处于酵母表达载体中时是不稳定的。通过随机的突变形成和选择在大肠杆菌中稳定的克隆进一步改造hMUC3DNA序列。通过易错PCR,GeneMorph II试剂盒(Stratagene)对hMUC3 DNA序列进行2轮的随机的突变形成。用SpeI/HindIII消化得到的PCR片段,并将其连接到经SpeI/HindIII消化的pREX0855中。使用连接混合物转化大肠杆菌XL1-Blue。平铺细胞,培养过夜,从培养皿中重新获得全部生物物质。重新获得质粒DNA,用NotI/XmnI消化并用琼脂糖凝胶电泳分离。从凝胶中切下合适大小的DNA带并纯化。通过在酵母中空位-修复将得到的含有具有hMUC3柄的NotI展示盒的DNA克隆到基于pSAC35的酵母展示载体pREX1003中。
在BMM/S培养基中培养得到的全部酵母,在用抗-FLAG抗体包被的培养皿上进行平面选择。在包被缓冲液(50mM硼酸盐缓冲液,pH9.5)中稀释(1∶25稀释液)抗-Flag抗体(Sigma F9291),在4℃将其包被到培养皿上过夜。在用结合缓冲液(PBS-T,2mM EDTA,1%BSA)冲洗3次后,用结合缓冲液在室温阻滞培养皿2个小时。收集40 OD600单位的酵母过夜培养物并将其悬浮于10mL结合缓冲液中并与包被的抗体在室温平缓摇动培养2个小时。用结合缓冲液冲洗3次将未结合的细胞冲去并收集结合的细胞。
如FACS分析证明,结合物显示高水平的蛋白质展示(图17)。分离单个的克隆以获得在大肠杆菌中稳定并在酵母中具有高水平展示的hMUC3DNA序列。
经修饰的人MUC3基因(SEQ ID NO.:76)
TCTACTAGTACACCAAGCTATACTACATCAATTACTAGCACTGAGACACC
ATCTCATTCAACTCCTTCTAGTTCGACTTCAATTACAACTACAGAGACAC
CCAGTCACAGCACCCCATCTTACACTAGCTCTGTCTCCACATCCGAGACT
ACATCACATTCTACTCCATCAGAAACAAGCTCCAGTAGAACAACAGAAAG
CACCTCTTATAGTTCACCTAGCTCCACTTCATCTAACACAATTACTGAGA
CAAGCTCACACTCCACTCCTAGTACTGCTACTTCTATTTCCTCGACCGAA
ACACCTAGTTCAAGTACACCATCTGTATCATCGTCCATTACTGTTACTGA
GAGTTCATCTCATAGCACTCCTGGAGCTACTTCCACTTTGACATCGAGTG
AAACTTCTACTTGGTCAACACCATCTAGCACAAGTTCTATTATGTCAAGC
TCCTACACTTCAGCTGACACTCCATCTGAAACATCAGTTTATACTTCCAG
CGAAACCCCATCGTCCTCAAGCCCAACTAGCACATCTTTGATTTCTAGTT
CGAAGTCAACATCGACCAGTACACCTTCGTTTACTTCTTCGATTACTAGC
ACTGAGACCTCCTCATATTCTGCTAGTTCCTATACACCTTCAGTTAGTAG
CACAGCAAGTTCTAGCAAGAACACAACGAGTTCCACTGCTTCTATAAGCA
GTACAGAGACTGTTAGTTCATCGACTAGCTCTGTCTCTAGTACTATTCCT
TCTTCTCAATCCACAAGTTATTCTACACCATCATTCTCCAGTTCGGCAAC
AAGCAGTGTTACTCCATTGCATTCAACACCATCTCTACCATCTTGGGTTA
CTACAAGTAAGACCACATCACATATTACACCAGGTCTGACTTCGTCCATG
TCTTCGAGCGAGACCTATAGCCATAGTACTCCAGGTTTTACAAGCTCTAT
TACTTCGACAGAATCGACAAGTGAGTCAACTCCATCATTGTCCAGTTCTA
CAATTTATAGTACTGTTTCAACATCTACTACAGCTATTACTTCACATTTT
ACAACTTCTGAGACAGCTGTTACTCCAACACCAGTTACACCCTCTAGCTT
GAGTACAGATATCCCAACTACAAGTTTGAGAACTTTGACTCCTTCCTCTG
TTGGTACCTCGACTTCCTTGACAACTACAACTGACTTTCCATCAATTCCA
ACAGACATTAGCACTTTGCCAACAAGAACTCATATTATTTCAAGCTCACC
ATCTATTCAATCAACAGAGACTAGCAGTTTGGTTGGTACTACATCTCCAA
CTATGTCAACAGTTAGAATGACTTTGAGAATTACAGAGAACACTCCAATT
TCTTCATTCAGTACTTCCATTGTTGTTATTCCAGAGACACCAACTCAAAC
ACCACCAGTTTTGACTTCTGCTACAGGTACTCAAACATCACCAGCTCCAA
CTACAGTTACTTTTGGTTCTACTGACTCATCTACATCAACTTTGCATAAG
CTTTTG
实施例8-表面暴露的转铁蛋白氨基酸残基的随机化
通过在Tf分子内的几个点处随机化(即非插入)表面暴露的氨基酸残基(例如6个表面暴露的残基)产生转铁蛋白融合蛋白库。这些残基无需连续但优选在区域中成簇,其侧链指向远离分子本身的溶剂相。具有6个表面暴露的残基的库仅需要~107个蛋白质,从而每个库仅需20至40次转化(取决于引物的性质)。
3个可能的位点的实例是:
位点I Y85     位点II K276      位点III H207
      G86            D277              S208
      S87            K280              F211
      E89            Q283              E212
      D90            S286              A215
      Q92            D297              N216(任选)
                    (任选S298)         K217(任选)
实施例9-转铁蛋白融合蛋白在哺乳动物细胞表面上的表达
材料与方法
在添加了10%胎牛血清(HyClone)、L-谷氨酰胺(GIBCO-BRL)与HEPES(GIBCO-BRL)的DMEM(HyClone)中培养和保存HEK-293细胞。
通过退火引物P0926和P0927及之后用Taq DNA聚合酶延伸产生人胎盘碱性磷酸酶(ALPP)GPI DNA序列。
P0926
ACTAAGCTTGACCTGGCTCCACAAATTGCTGGCTATACCGACGC
CGCGCATCCGGGTAGATCCGTGGTCCCAGCTTTGCTTCCTCT
P0927
TTATCTAGATTATTATGGAGCAGTGGCAGTTTCCAACAGTAACA
GAGTACCGGCCAGCAGAGGAAGCAAAGCTGGGAC
PCR反应的条件为94℃达1分钟,94℃达40秒25个循环,55℃达40秒和72℃达2分钟,之后在72℃延伸7分钟。用HindIII/XbaI消化PCR产物,将其克隆至pREX0757(图18)的HindIII/XbaI位点中,然后测序,其中pREX0757去除了酵母GPI序列。得到的质粒,pREX1234(图19),含有在N-末端具有FLAG标记并且在C-末端具有人GPI序列的经修饰的转铁蛋白(mTf)。为将该mTf盒与引物P2225和P2226用PCR克隆至哺乳动物表达载体中,在5’和3’末端修饰该mTf盒,PCR条件为:94℃达1分钟,94℃达40秒25个循环,55℃达40秒和72℃达2分钟,之后在72℃延伸7分钟。
P2225
CACCATGAGGCTCGCCGTGGGAGCCCTG
P2226
TTATTATGGAGCAGTGGCAGTTTC
将该PCR产物克隆至pcDNA3.1(Invitrogen,Carlsbad,CA)中以产生pREX1235(图20)。通过DNA测序确定在pREX1235中的mTf盒的序列。
使用FuGENE 6(Roche)按照制造商的程序将HEK-293细胞转染pREX 1235。在1×磷酸盐缓冲液(1×PBS)中冲洗细胞,并用细胞裂解缓冲液(pH为7.4的20mM Tris-HCl,150mM NaCl,1%Triton X-100,1mM EDTA)以及HaltTM磷酸酶抑制剂合剂(Pierce)和蛋白酶抑制剂合剂(Sigma)的混合物在4℃将细胞裂解过夜。细胞在4℃下14,000rpm离心30分钟成小球。收集上清液,使之在4℃结合抗-Flag琼脂糖珠(Sigma)2个小时。在裂解缓冲液中冲洗小球一次,在三羟甲基氨基甲烷缓冲盐水(TBS)(20mM pH为7.4的Tris-HCl,150mM NaCl)+0.5%Triton X-100中冲洗两次,在1×PBS中冲洗一次。在
Figure A20078005062300961
LDS样品上样缓冲液+样品还原剂(Invitrogen)中洗脱样品。按照每个制造商的操作指南将重新获得的蛋白质在NuPAGETM 4-12% Bis-Tris凝胶(Invitrogen)上跑胶,用
Figure A20078005062300962
Transfer缓冲液将其转移到PVDF(Invitrogen)膜上。在含5%脱脂奶粉的PBS-T(1×PBS+0.2%Tween-20)中于室温阻滞印迹1小时,并用生物素化的针对FLAG(1∶1000小鼠抗-FLAG BioM2;Sigma)或人转铁蛋白(1∶4000生物素化的鸡抗-人转铁蛋白;Accurate Chemical&Scientific)的一抗在室温(RT)探测2个小时,之后在室温用链霉和素(strepavidin)-马-萝卜过氧化物酶(strepavidin-horse-radish peroxidase,SA-HRP)(1∶2500
Figure A20078005062300963
Strepavidin Horseradish,Peroxidase Conjugated;Pierce)培养1个小时。可选择地,对表面生物素化实验,仅用SA-HRP(1∶2500;Pierce)探测印迹。所有的印迹用the SuperSignal West Dura Extended Duration Substrate(Pierce)显影并用Quantity One Software(v.4.5.0;Bio-Rad)显现在Fluor-STM MultiImager(Bio-Rad)上。
如上所述转染HEK-293细胞24小时。在无菌冰的1×PBS中冲洗细胞3次,然后在1×PBS中用0.5mg/mL的Sulfo-NHS-LC-Biotin试剂(Pierce)处理细胞并在摇杆平台上于4℃培养2个小时。表面生物素化之后,用淬灭缓冲液(1×BS+100mM甘氨酸)冲洗细胞3次并将其再次悬浮于细胞裂解缓冲液中以进行如上所述的免疫沉淀和免疫印迹。
如上所述转染HEK-293细胞24小时。在无菌的1×PBS中冲洗细胞1次,然后将细胞再次悬浮在另外的1×PBS中并计数。将每个样品4.25×105个细胞转移到1.5mL的eppendorf管中。在4℃下4000rpm离心3分钟成小球。然后将细胞在室温于1×PBS-T(0.05%Tween-20)中阻滞30分钟,向下旋转,再次悬浮在一抗(1∶25-1∶625小鼠抗-FLAGBioM2;Sigma)中并在室温培养30分钟。在1×PBS-T中冲洗细胞2次,再次悬浮在二抗(1∶100山羊抗-小鼠-APC;Molecular Probes)中并在室温培养30分钟。在1×PBS-T中另外冲洗细胞2次之后,按照每一个制造商的操作指南将细胞再次悬浮于Cell Buffer(Agilent)中,使细胞最后浓缩成2×106个细胞/mL并上样到细胞荧光芯片(CellFluorescence
Figure A20078005062300971
Kit,Agilent)。用Agilent 2100生物分析仪和Agilent 2100软件进行所有的FACS分析。
结论
对转染了pREX1235的细胞或模拟-转染的细胞的裂解产物用抗-FLAG-琼脂糖珠进行免疫沉淀反应,然后进行蛋白印迹。用抗-FLAG或抗-转铁蛋白抗体的蛋白印迹检测清楚地证明同时存在转铁蛋白部分和FLAG部分(图21)。
pREX1235转染或模拟-转染的细胞在细胞裂解之前被表面-生物素化,用抗-FLAG-琼脂糖免疫沉淀并用链酶亲和素-HRP进行蛋白印迹。表面-生物素化确保仅暴露的质膜蛋白质在蛋白印迹中会被检测到。观测到具有预定分子量的FLAG-可沉淀的蛋白质证明FLAG-转铁蛋白融合物被表达在细胞表面(图22)。
另外,对转染的细胞进行荧光-激活的细胞拣选(FACS)分析。相对于模拟-转染的细胞,在pREX1235-转染的细胞中观测到4倍的着色增加,清楚表明FLAG-转铁蛋白融合物在细胞表面的表达(图23)。
尽管参照上述实施例详细描述了本发明,但应理解可在不背离本发明的精神的情况下对本发明进行多种修改。因此,本发明仅受下述权利要求书的限制。本申请中提及的所有引用的专利、专利申请和出版物在此皆全文引入作为参考。
序列表
<110>比奥雷克西斯药物公司
<120>转铁蛋白融合蛋白库
<130>BIOR-022/00US
<160>76
<170>PatentIn version 3.3
<210>1
<211>2318
<212>DNA
<213>智人
<220>
<221>CDS
<222>(51)..(2147)
<223>GenBank登录号NM_001063,转铁蛋白基因和蛋白
<220>
<221>sig_肽
<222>(51)..(107)
<400>1
gcacagaagc gagtccgact gtgctcgctg ctcagcgccg cacccggaag atg agg     56
                                                       Met Arg
                                                       1
ctc gcc gtg gga gcc ctg ctg gtc tgc gcc gtc ctg ggg ctg tgt ctg   104
Leu Ala Val Gly Ala Leu Leu Val Cys Ala Val Leu Gly Leu Cys Leu
        5                   10                  15
gct gtc cct gat aaa act gtg aga tgg tgt gca gtg tcg gag cat gag   152
Ala Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val Ser Glu His Glu
    20                  25                  30
gcc act aag tgc cag agt ttc cgc gac cat atg aaa agc gtc att cca   200
Ala Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys Ser Val Ile Pro
35                  40                  45                  50
tcc gat ggt ccc agt gtt gct tgt gtg aag aaa gcc tcc tac ctt gat   248
Ser Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala Ser Tyr Leu Asp
                55                  60                  65
tgc atc agg gcc att gcg gca aac gaa gcg gat gct gtg aca ctg gat   296
Cys Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala Val Thr Leu Asp
            70                  75                  80
gca ggt ttg gtg tat gat gct tac ctg gct ccc aat aac ctg aag cct   344
Ala Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn Asn Leu Lys Pro
        85                  90                  95
gtg gtg gca gag ttc tat ggg tca aaa gag gat cca cag act ttc tat   392
Val Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro Gln Thr Phe Tyr
    100                 105                 110
tat gct gtt gct gtg gtg aag aag gat agt ggc ttc cag atg aac cag   440
Tyr Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe Gln Met Asn Gln
115                 120                 125                 130
ctt cga ggc aag aag tcc tgc cac acg ggt cta ggc agg tcc gct ggg   488
Leu Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly Arg Ser Ala Gly
                135                 140                 145
tgg aac atc ccc ata ggc tta ctt tac tgt gac tta cct gag cca cgt   536
Trp Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu Pro Glu Pro Arg
            150                 155                 160
aaa cct ctt gag aaa gca gtg gcc aat ttc ttc tcg ggc agc tgt gcc   584
Lys Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser Gly Ser Cys Ala
        165                 170                 175
cct tgt gcg gat ggg acg gac ttc ccc cag ctg tgt caa ctg tgt cca   632
Pro Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys Gln Leu Cys Pro
    180                 185                 190
ggg tgt ggc tgc tcc acc ctt aac caa tac ttc ggc tac tcg gga gcc   680
Gly Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly Tyr Ser Gly Ala
195                 200                 205                 210
ttc aag tgt ctg aag gat ggt gct ggg gat gtg gcc ttt gtc aag cac   728
Phe Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala Phe Val Lys His
                215                 220                 225
tcg act ata ttt gag aac ttg gca aac aag gct gac agg gac cag tat   776
Ser Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp Arg Asp Gln Tyr
            230                 235                 240
gag ctg ctt tgc ctg gac aac acc cgg aag ccg gta gat gaa tac aag   824
Glu Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val Asp Glu Tyr Lys
        245                 250                 255
gac tgc cac ttg gcc cag gtc cct tct cat acc gtc gtg gcc cga agt   872
Asp Cys His Leu Ala Gln Val Pro Ser His Thr Val Val Ala Arg Ser
    260                 265                 270
atg ggc ggc aag gag gac ttg atc tgg gag ctt ctc aac cag gcc cag   920
Met Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu Asn Gln Ala Gln
275                 280                 285                 290
gaa cat ttt ggc aaa gac aaa tca aaa gaa ttc caa cta ttc agc tct   968
Glu His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln Leu Phe Ser Ser
                295                 300                 305
cct cat ggg aag gac ctg ctg ttt aag gac tct gcc cac ggg ttt tta  1016
Pro His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala His Gly Phe Leu
            310                 315                 320
aaa gtc ccc ccc agg atg gat gcc aag atg tac ctg ggc tat gag tat  1064
Lys Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu Gly Tyr Glu Tyr
        325                 330                 335
gtc act gcc atc cgg aat cta cgg gaa ggc aca tgc cca gaa gcc cca  1112
Val Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys Pro Glu Ala Pro
    340                 345                 350
aca gat gaa tgc aag cct gtg aag tgg tgt gcg ctg agc cac cac gag  1160
Thr Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu Ser His His Glu
355                 360                 365                 370
agg ctc aag tgt gat gag tgg agt gtt aac agt gta ggg aaa ata gag  1208
Arg Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val Gly Lys Ile Glu
                375                 380                 385
tgt gta tca gca gag acc acc gaa gac tgc atc gcc aag atc atg aat  1256
Cys Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala Lys Ile Met Asn
            390                 395                 400
gga gaa gct gat gcc atg agc ttg gat gga ggg ttt gtc tac ata gcg  1304
Gly Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe Val Tyr Ile Ala
        405                 410                 415
ggc aag tgt ggt ctg gtg cct gtc ttg gca gaa aac tac aat aag agc  1352
Gly Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn Lys Ser
    420                 425                 430
gat aat tgt gag gat aca cca gag gca ggg tat ttt gct gta gca gtg  1400
Asp Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe Ala Val Ala Val
435                 440                 445                 450
gtg aag aaa tca gct tct gac ctc acc tgg gac aat ctg aaa ggc aag  1448
Val Lys Lys Ser Ala Ser Asp Leu Thr Trp Asp Asn Leu Lys Gly Lys
                455                 460                 465
aag tcc tgc cat acg gca gtt ggc aga acc gct ggc tgg aac atc ccc  1496
Lys Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly Trp Asn Ile Pro
            470                 475                 480
atg ggc ctg ctc tac aat aag atc aac cac tgc aga ttt gat gaa ttt  1544
Met Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg Phe Asp Glu Phe
        485                 490                 495
ttc agt gaa ggt tgt gcc cct ggg tct aag aaa gac tcc agt ctc tgt  1592
Phe Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp Ser Ser Leu Cys
    500                 505                 510
aag ctg tgt atg ggc tca ggc cta aac ctg tgt gaa ccc aac aac aaa  1640
Lys Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu Pro Asn Asn Lys
515                 520                 525                 530
gag gga tac tac ggc tac aca ggc gct ttc agg tgt ctg gtt gag aag  1688
Glu Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Val Glu Lys
                535                 540                 545
gga gat gtg gcc ttt gtg aaa cac cag act gtc cca cag aac act ggg  1736
Gly Asp Val Ala Phe Val Lys His Gln Thr Val Pro Gln Asn Thr Gly
            550                 555                 560
gga aaa aac cct gat cca tgg gct aag aat ctg aat gaa aaa gac tat  1784
Gly Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn Glu Lys Asp Tyr
        565                 570                 575
gag ttg ctg tgc ctt gat ggt acc agg aaa cct gtg gag gag tat gcg  1832
Glu Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val Glu Glu Tyr Ala
    580                 585                 590
aac tgc cac ctg gcc aga gcc ccg aat cac gct gtg gtc aca cgg aaa  1880
Asn Cys His Leu Ala Arg Ala Pro Asn His Ala Val Val Thr Arg Lys
595                 600                 605                 610
gat aag gaa gct tgc gtc cac aag ata tta cgt caa cag cag cac cta  1928
Asp Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln Gln Gln His Leu
                615                 620                 625
ttt gga agc aac gta act gac tgc tcg ggc aac ttt tgt ttg ttc cgg  1976
Phe Gly Ser Asn Val Thr Asp Cys Ser Gly Asn Phe Cys Leu Phe Arg
            630                 635                 640
tcg gaa acc aag gac ctt ctg ttc aga gat gac aca gta tgt ttg gcc   2024
Ser Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr Val Cys Leu Ala
        645                 650                 655
aaa ctt cat gac aga aac aca tat gaa aaa tac tta gga gaa gaa tat   2072
Lys Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu Gly Glu Glu Tyr
    660                 665                 670
gtc aag gct gtt ggt aac ctg aga aaa tgc tcc acc tca tca ctc ctg   2120
Val Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr Ser Ser Leu Leu
675                 680                 685                 690
gaa gcc tgc act ttc cgt aga cct taa aatctcagag gtagggctgc         2167
Glu Ala Cys Thr Phe Arg Arg Pro
                695
caccaaggtg aagatgggaa cgcagatgat ccatgagttt gccctggttt cactggccca 2227
agtggtttgt gctaaccacg tctgtcttca cagctctgtg ttgccatgtg tgctgaacaa 2287
aaaataaaaa ttattattga ttttatattt c                                2318
<210>2
<211>698
<212>PRT
<213>智人
<400>2
Met Arg Leu Ala Val Gly Ala Leu Leu Val Cys Ala Val Leu Gly Leu
1               5                   10                  15
Cys Leu Ala Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val Ser Glu
            20                  25                  30
His Glu Ala Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys Ser Val
        35                  40                  45
Ile Pro Ser Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala Ser Tyr
    50                  55                  60
Leu Asp Cys Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala Val Thr
65                  70                  75                  80
Leu Asp Ala Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn Asn Leu
                85                  90                  95
Lys Pro Val Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro Gln Thr
            100                 105                 110
Phe Tyr Tyr Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe Gln Met
        115                 120                 125
Asn Gln Leu Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly Arg Ser
    130                 135                 140
Ala Gly Trp Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu Pro Glu
145                 150                 155                 160
Pro Arg Lys Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser Gly Ser
                165                 170                 175
Cys Ala Pro Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys Gln Leu
            180                 185                 190
Cys Pro Gly Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly Tyr Ser
        195                 200                 205
Gly Ala Phe Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala Phe Val
    210                 215                 220
Lys His Ser Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp Arg Asp
225                 230                 235                 240
Gln Tyr Glu Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val Asp Glu
                245                 250                 255
Tyr Lys Asp Cys His Leu Ala Gln Val Pro Ser His Thr Val Val Ala
            260                 265                 270
Arg Ser Met Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu Asn Gln
        275                 280                 285
Ala Gln Glu His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln Leu Phe
    290                 295                 300
Ser Ser Pro His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala His Gly
305                 310                 315                 320
Phe Leu Lys Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu Gly Tyr
                325                 330                 335
Glu Tyr Val Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys Pro Glu
            340                 345                 350
Ala Pro Thr Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu Ser His
        355                 360                 365
His Glu Arg Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val Gly Lys
    370                 375                 380
Ile Glu Cys Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala Lys Ile
385                 390                 395                 400
Met Asn Gly Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe Val Tyr
                405                 410                 415
Ile Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn
            420                 425                 430
Lys  Ser Asp Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe Ala Val
         435                 440                 445
Ala Val Val Lys Lys  Ser Ala Ser Asp Leu Thr Trp Asp Asn Leu Lys
    450                 455                 460
Gly Lys Lys Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly Trp Asn
465                 470                 475                 480
Ile Pro Met Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg Phe Asp
                485                 490                 495
Glu Phe Phe Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp Ser Ser
            500                 505                 510
Leu Cys Lys Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu Pro Asn
        515                 520                 525
Asn Lys Glu Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Val
    530                 535                 540
Glu Lys Gly Asp Val Ala Phe Val Lys His Gln Thr Val Pro Gln Asn
545                 550                 555                 560
Thr Gly Gly Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn Glu Lys
                565                 570                 575
Asp Tyr Glu Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val Glu Glu
            580                 585                 590
Tyr Ala Asn Cys His Leu Ala Arg Ala Pro Asn His Ala Val Val Thr
        595                 600                 605
Arg Lys Asp Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln Gln Gln
    610                 615                 620
His Leu Phe Gly Ser Asn Val Thr Asp Cys Ser Gly Asn Phe Cys Leu
625                 630                 635                 640
Phe Arg Ser Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr Val Cys
                645                 650                 655
Leu Ala Lys Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu Gly Glu
            660                 665                 670
Glu Tyr Val Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr Ser Ser
        675                 680                 685
Leu Leu Glu Ala Cys Thr Phe Arg Arg Pro
    690                 695
<210>3
<211>679
<212>PRT
<213>智人
<220>
<221>MISC_FEATURE
<223>成熟转铁蛋白
<400>3
Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val Ser Glu His Glu Ala
1               5                   10                  15
Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys Ser Val Ile Pro Ser
            20                  25                  30
Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala Ser Tyr Leu Asp Cys
        35                  40                  45
Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala Val Thr Leu Asp Ala
    50                  55                  60
Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn Asn Leu Lys Pro Val
65                  70                  75                  80
Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro Gln Thr Phe Tyr Tyr
                85                  90                  95
Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe Gln Met Asn Gln Leu
            100                 105                 110
Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly Arg Ser Ala Gly Trp
        115                 120                 125
Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu Pro Glu Pro Arg Lys
    130                 135                 140
Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser Gly Ser Cys Ala Pro
145                 150                 155                 160
Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys Gln Leu Cys Pro Gly
                165                 170                 175
Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly Tyr Ser Gly Ala Phe
            180                 185                 190
Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala Phe Val Lys His Ser
        195                 200                 205
Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp Arg Asp Gln Tyr Glu
    210                 215                 220
Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val Asp Glu Tyr Lys Asp
225                 230                 235                 240
Cys His Leu Ala Gln Val Pro Ser His Thr Val Val Ala Arg Ser Met
                245                 250                 255
Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu Asn Gln Ala Gln Glu
            260                 265                 270
His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln Leu Phe Ser Ser Pro
        275                 280                 285
His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala His Gly Phe Leu Lys
    290                 295                 300
Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu Gly Tyr Glu Tyr Val
305                 310                 315                 320
Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys Pro Glu Ala Pro Thr
                325                 330                 335
Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu Ser His His Glu Arg
            340                 345                 350
Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val Gly Lys Ile Glu Cys
        355                 360                 365
Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala Lys Ile Met Asn Gly
    370                 375                 380
Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe Val Tyr Ile Ala Gly
385                 390                 395                 400
Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn Lys Ser Asp
                405                 410                 415
Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe Ala Val Ala Val Val
            420                 425                 430
Lys Lys Ser Ala Ser Asp Leu Thr Trp Asp Asn Leu Lys Gly Lys Lys
        435                 440                 445
Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly Trp Asn Ile Pro Met
    450                 455                 460
Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg Phe Asp Glu Phe Phe
465                 470                 475                 480
Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp Ser Ser Leu Cys Lys
                485                 490                 495
Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu Pro Asn Asn Lys Glu
            500                 505                 510
Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Val Glu Lys Gly
        515                 520                 525
Asp Val Ala Phe Val Lys His Gln Thr Val Pro Gln Asn Thr Gly Gly
    530                 535                 540
Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn Glu Lys Asp Tyr Glu
545                 550                 555                 560
Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val Glu Glu Tyr Ala Asn
                565                 570                 575
Cys His Leu Ala Arg Ala Pro Asn His Ala Val Val Thr Arg Lys Asp
            580                 585                 590
Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln Gln Gln His Leu Phe
        595                 600                 605
Gly Ser Asn Val Thr Asp Cys Ser Gly Asn Phe Cys Leu Phe Arg Ser
    610                 615                 620
Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr Val Cys Leu Ala Lys
625                 630                 635                 640
Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu Gly Glu Glu Tyr Val
                645                 650                 655
Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr Ser Ser Leu Leu Glu
            660                 665                 670
Ala Cys Thr Phe Arg Arg Pro
        675
<210>4
<211>12
<212>PRT
<213>人造序列
<220>
<223>中性粒细胞剪接变体序列
<400>4
Glu Asp Cys Ile Ala Leu Lys Gly Glu Ala Asp Ala
1               5                   10
<210>5
<211>732
<212>DNA
<213>智人
<220>
<221>misc_feature
<223>人类MUCI
<400>5
acaggttctg gtcatgcaag ctctacccca ggtggagaaa aggagacttc ggctacccag    60
agaagttcag tgcccagctc tactgagaag aatgctgtga gtatgaccag cagcgtactc   120
tccagccaca gccccggttc aggctcctcc accactcagg gacaggatgt cactctggcc   180
ccggccacgg aaccagcttc aggttcagct gccacctggg gacaggatgt cacctcggtc   240
ccagtcacca ggccagccct gggctccacc accccgccag cccacgatgt cacctcagcc   300
ccggacaaca agccagcccc gggctccacc gcccccccag cccacggtgt cacctcggcc   360
ccggacaaca ggcccgcctt ggcgtccacc gcccctccag tccacaatgt cacctcggcc   420
tcaggctctg catcaggctc agcttctact ctggtgcaca acggcacctc tgccagggct   480
accacaaccc cagccagcaa gagcactcca ttctcaattc ccagccacca ctctgatact   540
cctaccaccc ttgccagcca tagcaccaag actgatgcca gtagcactca ccatagcacg   600
gtacctcctc tcacctcctc caatcacagc acttctcccc agttgtctac tggggtctct   660
ttctttttcc tgtcttttca catttcaaac ctccagttta attcctctct ggaagatccc   720
agcaccgact ac                                                       732
<210>6
<211>744
<212>DNA
<213>人造序列
<220>
<223>具有SpeI和HindIII位点的hMUCI
<400>6
actagtacag gttctggtca tgcaagctct accccaggtg gagaaaagga gacttcggct    60
acccagagaa gttcagtgcc cagctctact gagaagaatg ctgtgagtat gaccagcagc   120
gtactctcca gccacagccc cggttcaggc tcctccacca ctcagggaca ggatgtcact   180
ctggccccgg ccacggaacc agcttcaggt tcagctgcca cctggggaca ggatgtcacc   240
tcggtcccag tcaccaggcc agccctgggc tccaccaccc cgccagccca cgatgtcacc   300
tcagccccgg acaacaagcc agccccgggc tccaccgccc ccccagccca cggtgtcacc   360
tcggccccgg acaacaggcc cgccttggcg tccaccgccc ctccagtcca caatgtcacc   420
tcggcctcag gctctgcatc aggctcagct tctactctgg tgcacaacgg cacctctgcc   480
agggctacca caaccccagc cagcaagagc actccattct caattcccag ccaccactct   540
gatactccta ccacccttgc cagccatagc accaagactg atgccagtag cactcaccat   600
agcacggtac ctcctctcac ctcctccaat cacagcactt ctccccagtt gtctactggg   660
gtctctttct ttttcctgtc ttttcacatt tcaaacctcc agtttaattc ctctctggaa   720
gatcccagca ccgactacaa gctt                                          744
<210>7
<211>32
<212>DNA
<213>人造序列
<220>
<223>引物
<400>7
tactagtatc aagcttatct ctagataata at                                  32
<210>8
<211>36
<212>DNA
<213>人造序列
<220>
<223>引物
<400>8
agctattatt atctagagat aagcttgata ctagta                              36
<210>9
<211>86
<212>DNA
<213>人造序列
<220>
<223>引物
<400>9
atcaagcttt ctggttctgc agtcgctaca tactctgttc cttctatctc gagtacttac    60
caaggtgctg ctaatatcaa ggttct                                         86
<210>10
<211>80
<212>DNA
<213>人造序列
<220>
<223>引物
<400>10
ttatctagat tattagaata caactggaag agcgagtagc aaccacataa agtttccaag    60
aaccttgata ttagcagcac                                                80
<210>11
<211>26
<212>DNA
<213>人造序列
<220>
<223>引物
<400>11
gtagtcggtg ctgggatctt ccagag                                         26
<210>12
<211>26
<212>DNA
<213>人造序列
<220>
<223>引物
<400>12
gctgctcctc acagtgctta cagttg                                         26
<210>13
<211>32
<212>DNA
<213>人造序列
<220>
<223>引物
<400>13
cgtactagta caggttctgg tcatgcaagc tc                                  32
<210>14
<211>31
<212>DNA
<213>人造序列
<220>
<223>引物
<400>14
tctaagcttg tagtcggtgc tgggatcttc c                                   31
<210>15
<211>40
<212>PRT
<213>酿酒酵母
<220>
<221>MISC_FEATURE
<223>酵母YIR019C GPI锚定
<400>15
Ser Gly Ser Ala Val Ala Thr Tyr Ser Val Pro Ser Ile Ser Ser Thr
1               5                   10                  15
Tyr Gln Gly Ala Ala Asn Ile Lys Val Leu Gly Asn Phe Met Trp Leu
            20                  25                  30
Leu Leu Ala Leu Pro Val Val Phe
        35                  40
<210>16
<211>2094
<212>DNA
<213>智人
<220>
<221>misc_feature
<223>修饰转铁蛋白
<220>
<221>misc_feature
<223>Tf表达框
<400>16
atgaggctcg ccgtgggagc cctgctggtc tgcgccgtcc tggggctgtg tctggcggta      60
cctgataaaa ctgtgagatg gtgtgcagtg tcggagcatg aggccactaa gtgccagagt     120
ttccgcgacc atatgaaaag cgtcattcca tccgatggtc ccagtgttgc ttgtgtgaag     180
aaagcctcct accttgattg catcagggcc attgcggcaa acgaagcgga tgctgtgaca     240
ctggatgcag gtttggtgta tgatgcttac ctggctccca ataacctgaa gcctgtggtg     300
gcagagttct atgggtcaaa agaggatcca cagactttct attatgctgt tgctgtggtg     360
aagaaggata gtggcttcca gatgaaccag cttcgaggca agaagtcctg ccacacgggt     420
ctaggcaggt ccgctgggtg gaacatcccc ataggcttac tttactgtga cttacctgag     480
ccacgtaaac ctcttgagaa agcagtggcc aatttcttct cgggcagctg tgccccttgt     540
gcggatggga cggacttccc ccagctgtgt caactgtgtc cagggtgtgg ctgctccacc     600
cttaaccaat acttcggcta ctcgggagcc ttcaagtgtc tgaaggatgg tgctggggat     660
gtggcctttg tcaagcactc gactatattt gagaacttgg caaacaaggc tgacagggac     720
cagtatgagc tgctttgcct ggacaacacc cggaagccgg tagatgaata caaggactgc     780
cacttggccc aggtcccttc tcataccgtc gtggcccgaa gtatgggcgg caaggaggac     840
ttgatctggg agcttctcaa ccaggcccag gaacattttg gcaaagacaa atcaaaagaa     900
ttccaactat tcagctctcc tcatgggaag gacctgctgt ttaaggactc tgcccacggg     960
tttttaaaag tcccccccag gatggatgcc aagatgtacc tgggctatga gtatgtcact    1020
gccatccgga atctacggga aggcacatgc ccagaagccc caacagatga atgcaagcct    1080
gtgaagtggt gtgcgctgag ccaccacgag aggctcaagt gtgatgagtg gagtgttaac    1140
agtgtaggga aaatagagtg tgtatcagca gagaccaccg aagactgcat cgccaagatc    1200
atgaatggag aagctgatgc catgagcttg gatggagggt ttgtctacat agcgggcaag    1260
tgtggtctgg tgcctgtctt ggcagaaaac tacaataagg ctgataattg tgaggataca    1320
ccagaggcag ggtattttgc tgtagcagtg gtgaagaaat cagcttctga cctcacctgg    1380
gacaatctga aaggcaagaa gtcctgccat acggcagttg gcagaaccgc tggctggaac    1440
atccccatgg gcctgctcta caataagatc aaccactgca gatttgatga atttttcagt    1500
gaaggttgtg cccctgggtc taagaaagac tccagtctct gtaagctgtg tatgggctca    1560
ggcctaaacc tctgtgaacc caacaacaaa gagggatact acggctacac aggcgctttc    1620
aggtgtctgg ttgagaaggg agatgtggcc tttgtgaaac accagactgt cccacagaac    1680
actgggggaa aaaaccctga tccatgggct aagaatctga atgaaaaaga ctatgagttg    1740
ctgtgccttg atggtactag gaaacctgtg gaggagtatg cgaactgcca cctggccaga    1800
gccccgaatc acgctgtggt cacacggaaa gataaggaag catgcgtcca caagatatta    1860
cgtcaacagc agcacctatt tggaagcaac gtagctgact gctcgggcaa cttttgtttg    1920
ttccggtcgg aaaccaagga ccttctgttc agagatgaca cagtatgttt ggccaaactt    1980
catgacagaa acacatatga aaaatactta ggagaagaat atgtcaaggc tgttggtaac    2040
ctgagaaaat gctccacctc atcactcctg gaagcctgca ctttccgtcg acct          2094
<210>17
<211>5
<212>PRT
<213>未知
<220>
<223>间隔肽
<220>
<221>REPEAT
<222>(1)..(5)
<223>序列可重复
<400>17
Gly Gly Gly Gly Ser
1               5
<210>18
<211>6
<212>PRT
<213>未知
<220>
<223>连接肽
<220>
<221>REPEAT
<222>(1)..(6)
<223>可重复
<400>18
Pro Glu Ala Pro Thr Asp
1               5
<210>19
<211>88
<212>DNA
<213>人造序列
<220>
<223>P1172引物
<220>
<221>misc_feature
<222>(20)..(64)
<223>n是a、c、g或t
<400>19
ccaactattc agctctcctn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnncatggg aaggacctgc tgtttaag                                       88
<210>20
<211>19
<212>DNA
<213>人造序列
<220>
<223>P1173引物
<400>20
aggagagctg aatagttgg                                                 19
<210>21
<211>22
<212>DNA
<213>人造序列
<220>
<223>P1174引物
<400>21
ctggatgcag gtttggtgta tg                                             22
<210>22
<211>22
<212>DNA
<213>人造序列
<220>
<223>P1227引物
<400>22
tcatgatctt ggcgatgcag tc                                         22
<210>23
<211>8
<212>PRT
<213>人造序列
<220>
<223>Flag-tag序列
<400>23
Asp Tyr Lys Asp Asp Asp Asp Lys
1               5
<210>24
<211>34
<212>DNA
<213>人造序列
<220>
<223>酵母基因AGA1的PCR引物
<400>24
cagatctaga acaaccgcta tcagctcatt atcc                            34
<210>25
<211>32
<212>DNA
<213>人造序列
<220>
<223>酵母基因AGA1的PCR引物
<400>25
cagaaagctt agtagtggaa acttctgtag tg                              32
<210>26
<211>40
<212>PRT
<213>人造序列
<220>
<223>经修饰的huMDP GPI序列
<220>
<221>misc_feature
<222>(1)..(1)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(3)..(3)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(7)..(8)
<223>Xaa可以是任何天然氨基酸
<400>26
Xaa Gln Xaa Gly Gly Ser Xaa Xaa Thr Ile Gly Gly Tyr Ser Gly Ala
1               5                   10                  15
Ala Ser Ser Leu Gln Arg Thr Ile Gly Leu Leu Leu Ala Ser Leu Ala
            20                  25                  30
Pro Leu Val Leu Ala Ser Leu Leu
        35                  40
<210>27
<211>83
<212>DNA
<213>人造序列
<220>
<223>P2035引物
<220>
<221>misc_feature
<222>(11)..(12)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(17)..(18)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(29)..(30)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(32)..(33)
<223>n是a、c、g或t
<400>27
ctacaagctt nnkcaannkg gtggttctnn knnkactatt ggtggttatt ctggtgctgc    60
ttcttccttg cagagaactattg                                             83
<210>28
<211>84
<212>DNA
<213>人造序列
<220>
<223>P2036引物
<400>28
gatgtctaga ttattataac aaagaagcta aaaccaatgg agctaaagaa gccaataaca    60
aaccaatagt tctctgcaag gaag                                           84
<210>29
<211>138
<212>DNA
<213>人造序列
<220>
<223>寡核苷酸P2035和P2036的退火和延长反应的跟制性酶消化得到的DNA序列
<220>
<221>misc_feature
<222>(7)..(8)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(13)..(14)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(25)..(26)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(28)..(29)
<223>n是a、c、g或t
<400>29
aagcttnnkc aannkggtgg ttctnnknnk actattggtg gttattctgg tgctgcttct     60
tccttgcaga gaactattgg tttgttattg gcttctttag ctccattggt tttagcttct    120
ttgttataat aatctaga                                                  138
<210>30
<211>42
<212>PRT
<213>人造序列
<220>
<223>寡核苷酸P2035和P2036的退火和延长反应的限制性酶消化得到的DNA序列的氨基酸序列
<220>
<221>misc_feature
<222>(3)..(3)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(5)..(5)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(9)..(10)
<223>Xaa可以是任何天然氨基酸
<400>30
Lys Leu Xaa Gln Xaa Gly Gly Ser Xaa Xaa Thr Ile Gly Gly Tyr Ser
1               5                   10                  15
Gly Ala Ala Ser Ser Leu Gln Arg Thr Ile Gly Leu Leu Leu Ala Ser
            20                  25                  30
Leu Ala Pro Leu Val Leu Ala Ser Leu Leu
        35                  40
<210>31
<211>24
<212>DNA
<213>人造序列
<220>
<223>共有GPI锚定序列
<220>
<221>misc_feature
<222>(1)..(2)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(7)..(8)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(19)..(20)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(22)..(23)
<223>n是a、c、g或t
<400>31
nnkcaannkg gtggttctnn knnk                      24
<210>32
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆23GPI锚定序列
<400>32
tgtcaatagg gtggttctag gcct                      24
<210>33
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆8GPI锚定序列
<400>33
tgtcaaattg gtggttctta gtgt                         24
<210>34
<211>6
<212>PRT
<213>人造序列
<220>
<223>克隆8GPI锚定序列
<400>34
Cys Gln Ile Gly Gly Ser
1               5
<210>35
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆15GPI锚定序列
<400>35
cagcaatatg gtggttctgt ggat                         24
<210>36
<211>8
<212>PRT
<213>人造序列
<220>
<223>克隆15GPI锚定序列
<400>36
Glu Gln Tyr Gly Gly Ser Val Asp
1               5
<210>37
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆14GPI锚定序列
<400>37
tctcaagttg gtggttctac ttgg                         24
<210>38
<211>8
<212>PRT
<213>人造序列
<220>
<223>克隆14GPI锚定序列
<400>38
Ser Gln Val Gly Gly Ser Thr Trp
1               5
<210>39
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆5GPI锚定序列
<220>
<221>misc_feature
<222>(1)..(2)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(7)..(8)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(19)..(20)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(22)..(23)
<223>n是a、c、g或t
<400>39
nnkcaannkg gtggttctnn knnk                         24
<210>40
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆2GPI锚定序列
<400>40
catcaaggtg gtggttctat tcgg                         24
<210>41
<211>8
<212>PRT
<213>人造序列
<220>
<223>克隆2GPI锚定序列
<400>41
His Gln Gly Gly Gly Ser Ile Arg
1               5
<210>42
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆6GPI锚定序列
<220>
<221>misc_feature
<222>(1)..(2)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(7)..(8)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(19)..(20)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(22)..(23)
<223>n是a、c、g或t
<400>42
nnkcaannkg gtggttctnn knnk                         24
<210>43
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆12GPI锚定序列
<400>43
catcaattgg gtggttctgt tacg                         24
<210>44
<211>8
<212>PRT
<213>人造序列
<220>
<223>克隆12GPI锚定序列
<400>44
His Gln Leu Gly Gly Ser Val Thr
1               5
<210>45
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆18GPI锚定序列
<400>45
tatcaatcgg gtggttctgg gact                    24
<210>46
<211>8
<212>PRT
<213>人造序列
<220>
<223>克隆18GPI锚定序列
<400>46
Tyr Gln Ser Gly Gly Ser Gly Thr
1               5
<210>47
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆13GPI锚定序列
<400>47
gggcaatatg gtggttctta gtgg                    24
<210>48
<211>6
<212>PRT
<213>人造序列
<220>
<223>克隆13GPI锚定序列
<400>48
Gly Gln Tyr Gly Gly Ser
1               5
<210>49
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆1GPI锚定序列
<400>49
gtgcaagcgg gtggttctga ttag                    24
<210>50
<211>7
<212>PRT
<213>人造序列
<220>
<223>克隆1GPI锚定序列
<400>50
Val Gln Ala Gly Gly Ser Asp
1               5
<210>51
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆4GPI锚定序列
<400>51
tagcaaatgg gtggttctac taag                    24
<210>52
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆21GPI锚定序列
<400>52
tagcaaacgg gtggttcttc ttat                    24
<210>53
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆3GPI锚定序列
<400>53
aagcaacggg gtggttctta gact                    24
<210>54
<211>6
<212>PRT
<213>人造序列
<220>
<223>克隆3GPI锚定序列
<400>54
Lys Gln Pro Gly Gly Ser
1               5
<210>55
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆7GPI锚定序列
<400>55
ctgcaatgtg gtggttctta gtgg                    24
<210>56
<211>6
<212>PRT
<213>人造序列
<220>
<223>克隆7GPI锚定序列
<400>56
Leu Gln Lys Gly Gly Ser
1               5
<210>57
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆16GPI锚定序列
<400>57
tagcaactgg gtggttcttt tggg                    24
<210>58
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆17GPI锚定序列
<400>58
tagcaatatg gtggttctgt tcta                    24
<210>59
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆19GPI锚定序列
<400>59
cttcaagtgg gtggttcttt gtag                    24
<210>60
<211>7
<212>PRT
<213>人造序列
<220>
<223>克隆19GPI锚定序列
<400>60
Leu Gln Val Gly Gly Ser Leu
1               5
<210>61
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆24GPI锚定序列
<400>61
tagcaatttg gtggttctca tgcg                       24
<210>62
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆9GPI锚定序列
<400>62
cggcaacggg gtggttctaa gtgg                       24
<210>63
<211>8
<212>PRT
<213>人造序列
<220>
<223>克隆9GPI锚定序列
<400>63
Arg Gln Arg Gly Gly Ser Lys Trp
1               5
<210>64
<211>24
<212>DNA
<213>人造序列
<220>
<223>克隆20GPI锚定序列
<400>64
tcgcaaactg gtggttctgt tgct                       24
<210>65
<211>8
<212>PRT
<213>人造序列
<220>
<223>克隆20GPI锚定序列
<400>65
Ser Gln Thr Gly Gly Ser Val Ala
1               5
<210>66
<211>2215
<212>DNA
<213>智人
<220>
<221>sig_肽
<222>(40)..(93)
<220>
<221>CDS
<222>(40)..(1866)
<220>
<221>mat肽
<222>(112)..(1866)
<400>66
agcttttctc ttctgtcaac cccacacgcc tttggcaca atg aag tgg gta acc       54
                                           Met Lys Trp Val Thr
                                                           -20
ttt att tcc ctt ctt ttt ctc ttt agc tcg gct tat tcc agg ggt gtg     102
Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Tyr Ser Arg Gly Val
                -15                 -10                 -5
ttt cgt cga gat gca cac aag agt gag gtt gct cat cgg ttt aaa gat     150
Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp
        -1  1               5                   10
ttg gga gaa gaa aat ttc aaa gcc ttg gtg ttg att gcc ttt gct cag     198
Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln
    15                  20                  25
tat ctt cag cag tgt cca ttt gaa gat cat gta aaa tta gtg aat gaa     246
Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu
30                  35                  40                  45
gta act gaa ttt gca aaa aca tgt gtt gct gat gag tca gct gaa aat     294
Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn
                50                  55                  60
tgt gac aaa tca ctt cat acc ctt ttt gga gac aaa tta tgc aca gtt     342
Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val
            65                  70                  75
gca act ctt cgt gaa acc tat ggt gaa atg gct gac tgc tgt gca aaa     390
Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys
        80                  85                  90
caa gaa cct gag aga aat gaa tgc ttc ttg caa cac aaa gat gac aac     438
Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn
    95                  100                 105
cca aac ctc ccc cga ttg gtg aga cca gag gtt gat gtg atg tgc act     486
Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr
110                 115                 120                 125
gct ttt cat gac aat gaa gag aca ttt ttg aaa aaa tac tta tat gaa     534
Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu
                130                 135                 140
att gcc aga aga cat cct tac ttt tat gcc ccg gaa ctc ctt ttc ttt     582
Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe
            145                 150                 155
gct aaa agg tat aaa gct gct ttt aca gaa tgt tgc caa gct gct gat     630
Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp
        160                 165                 170
aaa gct gcc tgc ctg ttg cca aag ctc gat gaa ctt cgg gat gaa ggg     678
Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly
    175                 180                 185
aag gct tcg tct gcc aaa cag aga ctc aag tgt gcc agt ctc caa aaa     726
Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys
190                 195                 200                 205
ttt gga gaa aga gct ttc aaa gca tgg gca gta gct cgc ctg agc cag     774
Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln
                210                 215                 220
aga ttt ccc aaa gct gag ttt gca gaa gtt tcc aag tta gtg aca gat     822
Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp
            225                 230                 235
ctt acc aaa gtc cac acg gaa tgc tgc cat gga gat ctg ctt gaa tgt     870
Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys
        240                 245                 250
gct gat gac agg gcg gac ctt gcc aag tat atc tgt gaa aat caa gat     918
Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp
    255                 260                 265
tcg atc tcc agt aaa ctg aag gaa tgc tgt gaa aaa cct ctg ttg gaa     966
Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu
270                 275                 280                 285
aaa tcc cac tgc att gcc gaa gtg gaa aat gat gag atg cct gct gac    1014
Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp
                290                 295                 300
ttg cct tca tta gct gct gat ttt gtt gaa agt aag gat gtt tgc aaa    1062
Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys
            305                 310                 315
aac tat gct gag gca aag gat gtc ttc ctg ggc atg ttt ttg tat gaa    1110
Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu
        320                 325                 330
tat gca aga agg cat cct gat tac tct gtc gtg ctg ctg ctg aga ctt    1158
Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu
    335                 340                 345
gcc aag aca tat gaa acc act cta gag aag tgc tgt gcc gct gca gat    1206
Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp
350                 355                 360                 365
cct cat gaa tgc tat gcc aaa gtg ttc gat gaa ttt aaa cct ctt gtg    1254
Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val
                370                 375                 380
gaa gag cct cag aat tta atc aaa caa aat tgt gag ctt ttt gag cag    1302
Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln
            385                 390                 395
ctt gga gag tac aaa ttc cag aat gcg cta tta gtt cgt tac acc aag    1350
Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys
        400                 405                 410
aaa gta ccc caa gtg tca act cca act ctt gta gag gtc tca aga aac    1398
Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn
    415                 420                 425
cta gga aaa gtg ggc agc aaa tgt tgt aaa cat cct gaa gca aaa aga    1446
Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg
430                 435                 440                 445
atg ccc tgt gca gaa gac tat cta tcc gtg gtc ctg aac cag tta tgt    1494
Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys
                450                 455                 460
gtg ttg cat gag aaa acg cca gta agt gac aga gtc acc aaa tgc tgc    1542
Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys
            465                 470                 475
aca gaa tcc ttg gtg aac agg cga cca tgc ttt tca gct ctg gaa gtc    1590
Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val
        480                 485                 490
gat gaa aca tac gtt ccc aaa gag ttt aat gct gaa aca ttc acc ttc    1638
Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe
    495                 500                 505
cat gca gat ata tgc aca ctt tct gag aag gag aga caa atc aag aaa    1686
His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys
510                 515                 520                 525
caa act gca ctt gtt gag ctc gtg aaa cac aag ccc aag gca aca aaa    1734
Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys
                530                 535                 540
gag caa ctg aaa gct gtt atg gat gat ttc gca gct ttt gta gag aag    1782
Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys
            545                 550                 555
tgc tgc aag gct gac gat aag gag acc tgc ttt gcc gag gag ggt aaa    1830
Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys
        560                 565                 570
aaa ctt gtt gct gca agt caa gct gcc tta ggc tta taacatctac         1876
Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu
    575                 580                 585
atttaaaagc atctcagcct accatgagaa taagagaaag aaaatgaaga tcaaaagctt  1936
attcatctgt tttctttttc gttggtgtaa agccaacacc ctgtctaaaa aacataaatt  1996
tctttaatca ttttgcctct tttctctgtg cttcaattaa taaaaaatgg aaagaatcta  2056
atagagtggt acagcactgt tatttttcaa agatgtgttg ctatcctgaa aattctgtag  2116
gttctgtgga agttccagtg ttctctctta ttccacttcg gtagaggatt tctagtttct  2176
gtgggctaat taaataaatc actaatactc ttctaagtt                         2215
<210>67
<211>609
<212>PRT
<213>智人
<400>67
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
                -20                 -15                 -10
Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala
            -5              -1  1               5
His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu
    10                  15                  20
Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val
25                  30                  35                  40
Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp
                45                  50                  55
Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp
            60                  65                  70
Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala
        75                  80                  85
Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys  Phe Leu Gln
    90                  95                  100
His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val
105                 110                 115                 120
Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys
                125                 130                 135
Lys  Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro
             140                 145                 150
Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys
        155                 160                 165
Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu
    170                 175                 180
Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys
185                 190                 195                 200
Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val
                205                 210                 215
Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser
            220                 225                 230
Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly
        235                 240                 245
Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile
    250                 255                 260
Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu
265                 270                 275                 280
Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp
                285                 290                 295
Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser
            300                 305                 310
Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly
        315                 320                 325
Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val
330                 335                 340
Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys
345                 350                 355                 360
Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu
                365                 370                 375
Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys
            380                 385                 390
Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu
        395                 400                 405
Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val
    410                 415                 420
Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His
425                 430                 435                 440
Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val
                445                 450                 455
Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg
            460                 465                 470
Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe
        475                 480                 485
Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala
    490                 495                 500
Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu
505                 510                 515                 520
Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys
                525                 530                 535
Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala
            540                 545                 550
Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe
        555                 560                 565
Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly
    570                 575                 580
Leu
585
<210>68
<211>1507
<212>DNA
<213>智人
<400>68
tctactagta ctcccagcta cactacctca atcaccacca ccgagacccc ctcacacagt    60
actcccagct acactacctc aatcaccacc accgagaccc catcacacag tactcccagc   120
ttcacttctt caatcaccac caccgagacc acatcccaca gtactcccag cttcacttct   180
tcaatcagga ccaccgagac cacatcctac agtactccca gcttcacttc ttcaaatacc   240
atcactgaga ccacctcaca cagtactccc agctacatta cctcaatcac caccaccgag   300
accccctcaa gcagtactcc cagcttcagt tcttcgatca ccaccactga gaccacatcc   360
cacagtactc ccggcttcac ttcttcaatc accaccactg agactacatc ccacagtact   420
cccagcttca cttcttcgat caccaccact gagaccacct cacatgatac tcccagcttc   480
acttcttcaa tcaccaccag tgagaccccc tcacacagta ctcccagctc cacttcttta   540
atcaccacca ccaagaccac ctcacacagt actcccagct tcacttcttc gatcaccacc   600
accgagacca cctcacacag tgctcgcagc ttcacttctt cgatcaccac caccgagacc   660
acctcacaca atactcggag cttcacttct tcgatcacca ccaccgagac caactctcac   720
agtactacca gcttcacttc ttcgatcacc accaccgaga ccacctcaca cagtactccc   780
agcttcagtt cttcaatcac caccactgag acccccttac acagtactcc tggcctacct   840
tcgtgggtca ccaccaccaa gaccacctca cacattactc ctggcctcac ttcttcaatc   900
accaccactg agactacctc acacagtact cccggcttca cttcttcaat caccaccact   960
gagaccacct cagagagtac tcccagcctc agttcttcaa ccatctactc cacagtcagc  1020
acatccacaa ctgccatcac ctcacatttt actacctcag agactgcggt gactcccaca  1080
cctgtaaccc catcttctct gagtacagac atcccgacca caagcctacg aactctcacc  1140
ccttcgtctg tgggcaccag cacttcattg actacaacca cagactttcc ctctataccc  1200
actgatatca gtaccttacc aactcgaaca cacatcattt catcttctcc ctccatccaa  1260
agtacagaaa cctcatccct tgtgggcacc acctctccca ccatgtccac tgtgagaatg  1320
accctcagaa ttactgagaa caccccaatc agttccttta gcacaagtat tgttgttata  1380
cctgaaaccc caacacagac ccctcctgta ctgacgtcag ccactgggac ccaaacatct  1440
cctgcaccta ctactgtcac ctttggaagt acggattcct ccacgtccac tcttcataag  1500
cttctct                                                            1507
<210>69
<211>502
<212>PRT
<213>智人
<400>69
Ser Thr Ser Thr Pro Ser Tyr Thr Thr Ser Ile Thr Thr Thr Glu Thr
1               5                   10                  15
Pro Ser His Ser Thr Pro Ser Tyr Thr Thr Ser Ile Thr Thr Thr Glu
            20                  25                  30
Thr Pro Ser His Ser Thr Pro Ser Phe Thr Ser Ser Ile Thr Thr Thr
        35                  40                  45
Glu Thr Thr Ser His Ser Thr Pro Ser Phe Thr Ser Ser Ile Arg Thr
    50                  55                  60
Thr Glu Thr Thr Ser Tyr Ser Thr Pro Ser Phe Thr Ser Ser Asn Thr
65                  70                  75                  80
Ile Thr Glu Thr Thr Ser His Ser Thr Pro Ser Tyr Ile Thr Ser Ile
                85                  90                  95
Thr Thr Thr Glu Thr Pro Ser Ser Ser Thr Pro Ser Phe Ser Ser Ser
            100                 105                 110
Ile Thr Thr Thr Glu Thr Thr Ser His Ser Thr Pro Gly Phe Thr Ser
        115                 120                 125
Ser Ile Thr Thr Thr Glu Thr Thr Ser His Ser Thr Pro Ser Phe Thr
    130                 135                 140
Ser Ser Ile Thr Thr Thr Glu Thr Thr Ser His Asp Thr Pro Ser Phe
145                 150                 155                 160
Thr Ser Ser Ile Thr Thr Ser Glu Thr Pro Ser His Ser Thr Pro Ser
                165                 170                 175
Ser Thr Ser Leu Ile Thr Thr Thr Lys Thr Thr Ser His Ser Thr Pro
            180                 185                 190
Ser Phe Thr Ser Ser Ile Thr Thr Thr Glu Thr Thr Ser His Ser Ala
        195                 200                 205
Arg Ser Phe Thr Ser Ser Ile Thr Thr Thr Glu Thr Thr Ser His Asn
    210                 215                 220
Thr Arg Ser Phe Thr Ser Ser Ile Thr Thr Thr Glu Thr Asn Ser His
225                 230                 235                 240
Ser Thr Thr Ser Phe Thr Ser Ser Ile Thr Thr Thr Glu Thr Thr Ser
                245                 250                 255
His Ser Thr Pro Ser Phe Ser Ser Ser Ile Thr Thr Thr Glu Thr Pro
            260                 265                 270
Leu His Ser Thr Pro Gly Leu Pro Ser Trp Val Thr Thr Thr Lys Thr
        275                 280                 285
Thr Ser His Ile Thr Pro Gly Leu Thr Ser Ser Ile Thr Thr Thr Glu
    290                 295                 300
Thr Thr Ser His Ser Thr Pro Gly Phe Thr Ser Ser Ile Thr Thr Thr
305                 310                 315                 320
Glu Thr Thr Ser Glu Ser Thr Pro Ser Leu Ser Ser Ser Thr Ile Tyr
                325                 330                 335
Ser Thr Val Ser Thr Ser Thr Thr Ala Ile Thr Ser His Phe Thr Thr
            340                 345                 350
Ser Glu Thr Ala Val Thr Pro Thr Pro Val Thr Pro Ser Ser Leu Ser
        355                 360                 365
Thr Asp Ile Pro Thr Thr Ser Leu Arg Thr Leu Thr Pro Ser Ser Val
    370                 375                 380
Gly Thr Ser Thr Ser Leu Thr Thr Thr Thr Asp Phe Pro Ser Ile Pro
385                 390                 395                 400
Thr Asp Ile Ser Thr Leu Pro Thr Arg Thr His Ile Ile Ser Ser Ser
                405                 410                 415
Pro Ser Ile Gln Ser Thr Glu Thr Ser Ser Leu Val Gly Thr Thr Ser
            420                 425                 430
Pro Thr Met Ser Thr Val Arg Met Thr Leu Arg Ile Thr Glu Asn Thr
        435                 440                 445
Pro Ile Ser Ser Phe Ser Thr Ser Ile Val Val Ile Pro Glu Thr Pro
    450                 455                 460
Thr Gln Thr Pro Pro Val Leu Thr Ser Ala Thr Gly Thr Gln Thr Ser
465                 470                 475                 480
Pro Ala Pro Thr Thr Val Thr Phe Gly Ser Thr Asp Ser Ser Thr Ser
                485                 490                 495
Thr Leu His Lys Leu Leu
            500
<210>70
<211>738
<212>DNA
<213>智人
<400>70
actagtacag gttctggtca tgcaagctct accccaggtg gagaaaagga gacttcggct    60
acccagagaa gttcagtgcc cagctctact gagaagaatg ctgtgagtat gaccagcagc   120
gtactctcca gccacagccc cggttcaggc tcctccacca ctcagggaca ggatgtcact   180
ctggccccgg ccacggaacc agcttcaggt tcagctgcca cctggggaca ggatgtcacc   240
tcggtcccag tcaccaggcc agccctgggc tccaccaccc cgccagccca cgatgtcacc   300
tcagccccgg acaacaagcc agccccgggc tccaccgccc ccccagccca cggtgtcacc   360
tcggccccgg acaacaggcc cgccttggcg tccaccgccc ctccagtcca caatgtcacc   420
tcggcctcag gctctgcatc aggctcagct tctactctgg tgcacaacgg cacctctgcc   480
agggctacca caaccccagc cagcaagagc actccattct caattcccag ccaccactct   540
gatactccta ccacccttgc cagccatagc accaagactg atgccagtag cactcaccat   600
agcacggtac ctcctctcac ctcctccaat cacagcactt ctccccagtt gtctactggg    660
gtctctttct ttttcctgtc ttttcacatt tcaaacctcc agtttaattc ctctctggaa    720
gatcccagca ccgactac                                                  738
<210>71
<211>246
<212>PRT
<213>智人
<400>71
Thr Ser Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly Glu Lys
1               5                   10                  15
Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr Glu Lys
            20                  25                  30
Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro Gly
        35                  40                  45
Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro Ala
    50                  55                  60
Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val Thr
65                  70                  75                  80
Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala
                85                  90                  95
His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr
            100                 105                 110
Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Asn Arg Pro Ala
        115                 120                 125
Leu Ala Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala Ser Gly
    130                 135                 140
Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala
145                 150                 155                 160
Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro
                165                 170                 175
Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys
            180                 185                 190
Thr Asp Ala Ser Ser Thr His His Ser Thr Val Pro Pro Leu Thr Ser
        195                 200                 205
Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe
    210                 215                 220
Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu
225                 230                 235                 240
Asp Pro Ser Thr Asp Tyr
                245
<210>72
<211>1632
<212>DNA
<213>酵母
<400>72
agaacaaccg ctatcagctc attatccgaa gtaggaacta caaccgtggt atcatccagc     60
gccattgaac catcaagtgc ctctataatc tcacctgtca cctctacact ttcgagtaca    120
acatcgtcca atccaactac tacctcccta agttcgacat ctacatctcc aagctctaca    180
tctacatctc caagctctac atctacctca tcaagttcga catctacctc atcaagttcg    240
acatctacct catcaagttc gacatctaca tctccaagtt cgacatccac atcttcaagt    300
ttgacatcca catcttcaag ttctacatct acatcccaaa gttctacatc tacctcatca    360
agttcgacat ctacatctcc aagctctaca tctacctcat caagttcaac atctacatct    420
ccaagttcta aatctacttc tgcaagctcc acttccactt cttcatattc aacatctaca    480
tccccaagtt tgacttcttc atctccaact ttggcttcca cttctccaag ttcaacatct    540
attagctcta cttttactga ttcaacttca tcccttggct cctctatagc atcttcatca    600
acgtctgtgt cattatacag cccatccaca cctgtttact ccgtcccttc gacttcgtca    660
aatgttgcaa ctccttctat gacttcttca actgttgaaa caactgttag ttcacaaagt    720
tcgtctgaat atatcaccaa atcctcaatt tctactacta tcccatcatt ttccatgtct    780
acatatttca ccactgttag tggagtcact acaatgtata cgacatggtg tccttatagc    840
tctgaatctg agactagcac attaaccagt atgcatgaaa cggttacaac agacgctaca    900
gtctgcactc acgagtcttg catgccctcg cagacaacaa gtttgattac atcttctata    960
aaaatgtcca ctaaaaacgt cgcaacttct gtaagcacct caacggttga atcctcatat   1020
gcatgctcca catgtgctga aacgtcacac tcgtattctt ccgtgcaaac agcttcatca   1080
agttctgtaa cacagcagac cacatccaca aagagttggg taagttcaat gacaacttcg   1140
gatgaagatt tcaataagca cgctaccggt aagtatcatg taacatcttc aggtacctca   1200
accatttcga ctagtgtaag tgaagccacg agtacatcaa gcattgactc agaatctcaa   1260
gaacaatcat cacacttatt atcgacatcg gtcctttcat cctcctcctt gtctgctaca   1320
ttatcctctg acagtacta ttttgctattc agttctgtat catcactaag tgtcgaacag   1380
tcaccagtta ccacacttca aatttcttca acatcagaga ttttacaacc cacttcttcc   1440
acagctattg ctacaatatc tgcctctaca tcatcacttt ccgcaacatc tatctctaca   1500
ccatctacct ctgtggaatc gactattgaa tcttcatcat tgactccgac ggtatcttct   1560
attttcctct catcatcatc tgctccctct tctctacaaa catctgttac cactacagaa   1620
gtttccacta ct                                                       1632
<210>73
<211>544
<212>PRT
<213>酵母
<400>73
Arg Thr Thr Ala Ile Ser Ser Leu Ser Glu Val Gly Thr Thr Thr Val
1               5                   10                  15
Val  Ser Ser Ser Ala Ile Glu Pro Ser Ser Ala Ser Ile Ile Ser Pro
             20                  25                  30
Val Thr Ser Thr Leu Ser Ser Thr Thr Ser Ser Asn Pro Thr Thr Thr
        35                  40                  45
Ser Leu Ser Ser Thr Ser Thr Ser Pro Ser Ser Thr Ser Thr Ser Pro
    50                  55                  60
Ser Ser Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Ser Ser Ser
65                  70                  75                  80
Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser Ser Thr Ser
                85                  90                  95
Thr Ser Ser Ser Leu Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser
            100                 105                 110
Gln Ser Ser Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser
        115                 120                 125
Ser Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser Ser Lys
    130                 135                 140
Ser Thr Ser Ala Ser Ser Thr Ser Thr Ser Ser Tyr Ser Thr Ser Thr
145                 150                 155                 160
Ser Pro Ser Leu Thr Ser Ser Ser Pro Thr Leu Ala Ser Thr Ser Pro
                165                 170                 175
Ser Ser Thr Ser Ile Ser Ser Thr Phe Thr Asp Ser Thr Ser Ser Leu
            180                 185                 190
Gly Ser Ser Ile Ala Ser Ser Ser Thr Ser Val Ser Leu Tyr Ser Pro
        195                 200                 205
Ser Thr Pro Val Tyr Ser Val Pro Ser Thr Ser Ser Asn Val Ala Thr
    210                 215                 220
Pro Ser Met Thr Ser Ser Thr Val Glu Thr Thr Val Ser Ser Gln Ser
225                 230                 235                 240
Ser Ser Glu Tyr Ile Thr Lys Ser Ser Ile Ser Thr Thr Ile Pro Ser
                245                 250                 255
Phe Ser Met Ser Thr Tyr Phe Thr Thr Val Ser Gly Val Thr Thr Met
            260                 265                 270
Tyr Thr Thr Trp Cys Pro Tyr Ser Ser Glu Ser Glu Thr Ser Thr Leu
        275                 280                 285
Thr Ser Met His Glu Thr Val Thr Thr Asp Ala Thr Val Cys Thr His
    290                 295                 300
Glu Ser Cys Met Pro Ser Gln Thr Thr Ser Leu Ile Thr Ser Ser Ile
305                 310                 315                 320
Lys Met Ser Thr Lys Asn Val Ala Thr Ser Val Ser Thr Ser Thr Val
                325                 330                 335
Glu Ser Ser Tyr Ala Cys Ser Thr Cys Ala Glu Thr Ser His Ser Tyr
            340                 345                 350
Ser Ser Val Gln Thr Ala Ser Ser Ser Ser Val Thr Gln Gln Thr Thr
        355                 360                 365
Ser Thr Lys Ser Trp Val Ser Ser Met Thr Thr Ser Asp Glu Asp Phe
    370                 375                 380
Asn Lys His Ala Thr Gly Lys Tyr His Val Thr Ser Ser Gly Thr Ser
385                 390                 395                 400
Thr Ile Ser Thr Ser Val Ser Glu Ala Thr Ser Thr Ser Ser Ile Asp
                405                 410                 415
Ser Glu Ser Gln Glu Gln Ser Ser His Leu Leu Ser Thr Ser Val Leu
            420                 425                 430
Ser Ser Ser Ser Leu Ser Ala Thr Leu Ser Ser Asp Ser Thr Ile Leu
        435                 440                 445
Leu Phe Ser Ser Val Ser Ser Leu Ser Val Glu Gln Ser Pro Val Thr
    450                 455                 460
Thr Leu Gln Ile Ser Ser Thr Ser Glu Ile Leu Gln Pro Thr Ser Ser
465                 470                 475                 480
Thr Ala Ile Ala Thr Ile Ser Ala Ser Thr Ser Ser Leu Ser Ala Thr
                485                 490                 495
Ser Ile Ser Thr Pro Ser Thr Ser Val Glu Ser Thr Ile Glu Ser Ser
            500                 505                 510
Ser Leu Thr Pro Thr Val Ser Ser Ile Phe Leu Ser Ser Ser Ser Ala
        515                 520                 525
Pro Ser Ser Leu Gln Thr Ser Val Thr Thr Thr Glu Val Ser Thr Thr
    530                 535                 540
<210>74
<211>1629
<212>DNA
<213>酵母
<400>74
acaaccgcta tcagctcatt atccgaagta ggaactacaa ccgtggtatc atccagcgcc     60
attgaaccat caagtgcctc tataatctca cctgtcacct ctacactttc gagtacaaca    120
tcgtccaatc caactactac ctccctaagt tcgacatcta catctccaag ctctacatct    180
acatctccaa gctctacatc tacctcatca agttcgacat ctacctcatc aagttcgaca    240
tctacctcat caagttcgac atctacatct ccaagttcga catccacatc ttcaagtttg    300
acatccacat cttcaagttc tacatctaca tcccaaagtt ctacatctac ctcatcaagt    360
tcgacatcta catctccaag ctctacatct acctcatcaa gttcaacatc tacatctcca    420
agttctaaat ctacttctgc aagctccact tccacttctt catattcaac atctacatcc    480
ccaagtttga cttcttcatc tccaactttg gcttccactt ctccaagttc aacatctatt    540
agctctactt ttactgattc aacttcatcc cttggctcct ctatagcatc ttcatcaacg    600
tctgtgtcat tatacagccc atccacacct gtttactccg tcccttcgac ttcgtcaaat    660
gttgcaactc cttctatgac ttcttcaact gttgaaacaa ctgttagttc acaaagttcg    720
tctgaatata tcaccaaatc ctcaatttct actactatcc catcattttc catgtctaca    780
tatttcacca ctgttagtgg agtcactaca atgtatacga catggtgtcc ttatagctct    840
gaatctgaga ctagcacatt aaccagtatg catgaaacgg ttacaacaga cgctacagtc    900
tgcactcacg agtcttgcat gccctcgcag acaacaagtt tgattacatc ttctataaaa    960
atgtccacta aaaacgtcgc aacttctgta agcacctcaa cggttgaatc ctcatatgca   1020
tgctccacat gtgctgaaac gtcacactcg tattcttccg tgcaaacagc ttcatcaagt   1080
tctgtaacac agcagaccac atccacaaag agttgggtaa gttcaatgac aacttcggat   1140
gaagatttca ataagcacgc taccggtaag tatcatgtaa catcttcagg tacctcaacc   1200
atttcgacta gtgtaagtga agccacgagt acatcaagca ttgactcaga atctcaagaa   1260
caatcatcac acttattatc gacatcggtc ctttcatcct cctccttgtc tgctacatta   1320
tcctctgaca gtactatttt gctattcagt tctgtatcat cactaagtgt cgaacagtca   1380
ccagttacca cacttcaaat ttcttcaaca tcagagattt tacaacccac ttcttccaca   1440
gctattgcta caatatctgc ctctacatca tcactttccg caacatctat ctctacacca   1500
tctacctctg tggaatcgac tattgaatct tcatcattga ctccgacggt atcttctatt   1560
ttcctctcat catcatctgc tccctcttct ctacaaacat ctgttaccac tacagaagtt   1620
tccactact                                                           1629
<210>75
<211>543
<212>PRT
<213>酵母
<400>75
Thr Thr Ala Ile Ser Ser Leu Ser Glu Val Gly Thr Thr Thr Val Val
1               5                   10                  15
Ser Ser Ser Ala Ile Glu Pro Ser Ser Ala Ser Ile Ile Ser Pro Val
            20                  25                  30
Thr Ser Thr Leu Ser Ser Thr Thr Ser Ser Asn Pro Thr Thr Thr Ser
        35                  40                  45
Leu Ser Ser Thr Ser Thr Ser Pro Ser Ser Thr Ser Thr Ser Pro Ser
    50                  55                  60
Ser Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Ser Ser Ser Thr
65                  70                  75                  80
Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser Ser Thr Ser Thr
                85                  90                  95
Ser Ser Ser Leu Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Gln
            100                 105                 110
Ser Ser Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser Ser
        115                 120                 125
Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser Ser Lys Ser
    130                 135                 140
Thr Ser Ala Ser Ser Thr Ser Thr Ser Ser Tyr Ser Thr Ser Thr Ser
145                 150                 155                 160
Pro Ser Leu Thr Ser Ser Ser Pro Thr Leu Ala Ser Thr Ser Pro Ser
                165                 170                 175
Ser Thr Ser Ile Ser Ser Thr Phe Thr Asp Ser Thr Ser Ser Leu Gly
            180                 185                 190
Ser Ser Ile Ala Ser Ser Ser Thr Ser Val Ser Leu Tyr Ser Pro Ser
        195                 200                 205
Thr Pro Val Tyr Ser Val Pro Ser Thr Ser Ser Asn Val Ala Thr Pro
    210                 215                 220
Ser Met Thr Ser Ser Thr Val Glu Thr Thr Val Ser Ser Gln Ser Ser
225                 230                 235                 240
Ser Glu Tyr Ile Thr Lys Ser Ser Ile Ser Thr Thr Ile Pro Ser Phe
                245                 250                 255
Ser Met Ser Thr Tyr Phe Thr Thr Val Ser Gly Val Thr Thr Met Tyr
            260                 265                 270
Thr Thr Trp Cys Pro Tyr Ser Ser Glu Ser Glu Thr Ser Thr Leu Thr
        275                 280                 285
Ser Met His Glu Thr Val Thr Thr Asp Ala Thr Val Cys Thr His Glu
    290                 295                 300
Ser Cys Met Pro Ser Gln Thr Thr Ser Leu Ile Thr Ser Ser Ile Lys
305                 310                 315                 320
Met Ser Thr Lys Asn Val Ala Thr Ser Val Ser Thr Ser Thr Val Glu
                325                 330                 335
Ser Ser Tyr Ala Cys Ser Thr Cys Ala Glu Thr Ser His Ser Tyr Ser
            340                 345                 350
Ser Val Gln Thr Ala Ser Ser Ser Ser Val Thr Gln Gln Thr Thr Ser
        355                 360                 365
Thr Lys Ser Trp Val Ser Ser Met Thr Thr Ser Asp Glu Asp Phe Asn
    370                 375                 380
Lys His Ala Thr Gly Lys Tyr His Val Thr Ser Ser Gly Thr Ser Thr
385                 390                 395                 400
Ile Ser Thr Ser Val Ser Glu Ala Thr Ser Thr Ser Ser Ile Asp Ser
                405                 410                 415
Glu Ser Gln Glu Gln Ser Ser His Leu Leu Ser Thr Ser Val Leu Ser
            420                 425                 430
Ser Ser Ser Leu Ser Ala Thr Leu Ser Ser Asp Ser Thr Ile Leu Leu
        435                 440                 445
Phe Ser Ser Val Ser Ser Leu Ser Val Glu Gln Ser Pro Val Thr Thr
    450                 455                 460
Leu Gln Ile Ser Ser Thr Ser Glu Ile Leu Gln Pro Thr Ser Ser Thr
465                 470                 475                 480
Ala Ile Ala Thr Ile Ser Ala Ser Thr Ser Ser Leu Ser Ala Thr Ser
                485                 490                 495
Ile Ser Thr Pro Ser Thr Ser Val Glu Ser Thr Ile Glu Ser Ser Ser
            500                 505                 510
Leu Thr Pro Thr Val Ser Ser Ile Phe Leu Ser Ser Ser Ser Ala Pro
        515                 520                 525
Ser Ser Leu Gln Thr Ser Val Thr Thr Thr Glu Val Ser Thr Thr
    530                 535                 540
<210>76
<211>1506
<212>DNA
<213>人造序列
<220>
<223>经修饰的MUC3基因
<400>76
tctactagta caccaagcta tactacatca attactagca ctgagacacc atctcattca    60
actccttcta gttcgacttc aattacaact acagagacac ccagtcacag caccccatct   120
tacactagct ctgtctccac atccgagact acatcacatt ctactccatc agaaacaagc   180
tccagtagaa caacagaaag cacctcttat agttcaccta gctccacttc atctaacaca   240
attactgaga caagctcaca ctccactcct agtactgcta cttctatttc ctcgaccgaa   300
acacctagtt caagtacacc atctgtatca tcgtccatta ctgttactga gagttcatct   360
catagcactc ctggagctac ttccactttg acatcgagtg aaacttctac ttggtcaaca   420
ccatctagca caagttctat tatgtcaagc tcctacactt cagctgacac tccatctgaa   480
acatcagttt atacttccag cgaaacccca tcgtcctcaa gcccaactag cacatctttg   540
atttctagtt cgaagtcaac atcgaccagt acaccttcgt ttacttcttc gattactagc   600
actgagacct cctcatattc tgctagttcc tatacacctt cagttagtag cacagcaagt   660
tctagcaaga acacaacgag ttccactgct tctataagca gtacagagac tgttagttca   720
tcgactagct ctgtctctag tactattcct tcttctcaat ccacaagtta ttctacacca   780
tcattctcca gttcggcaac aagcagtgtt actccattgc attcaacacc atctctacca   840
tcttgggtta ctacaagtaa gaccacatca catattacac caggtctgac ttcgtccatg   900
tcttcgagcg agacctatag ccatagtact ccaggtttta caagctctat tacttcgaca   960
gaatcgacaa gtgagtcaac tccatcattg tccagttcta caatttatag tactgtttca  1020
acatctacta cagctattac ttcacatttt acaacttctg agacagctgt tactccaaca  1080
ccagttacac cctctagctt gagtacagat atcccaacta caagtttgag aactttgact  1140
ccttcctctg ttggtacctc gacttccttg acaactacaa ctgactttcc atcaattcca  1200
acagacatta gcactttgcc aacaagaact catattattt caagctcacc atctattcaa  1260
tcaacagaga ctagcagttt ggttggtact acatctccaa ctatgtcaac agttagaatg  1320
actttgagaa ttacagagaa cactccaatt tcttcattca gtacttccat tgttgttatt  1380
ccagagacac caactcaaac accaccagtt ttgacttctg ctacaggtac tcaaacatca  1440
ccagctccaa ctacagttac ttttggttct actgactcat ctacatcaac tttgcataag  1500
cttttg                                                             1506

Claims (118)

1.一种融合蛋白,其包含:
(a)转铁蛋白Tf部分和
(b)整联蛋白结合部分。
2.如权利要求1所述的融合蛋白,其中所述融合蛋白进一步包含柄部分。
3.如权利要求1或2所述的融合蛋白,其中所述融合蛋白进一步包含细胞壁连接组件。
4.如权利要求2所述的融合蛋白,其中所述转铁蛋白部分与柄部分直接融合。
5.如权利要求1-3所述的融合蛋白,其中所述融合蛋白进一步含有锚定部分。
6.如权利要求1所述的融合蛋白,其中所述转铁蛋白部分是转铁蛋白、经修饰的转铁蛋白或它们的片段。
7.如权利要求6所述的融合蛋白,其中所述转铁蛋白是人转铁蛋白。
8.如权利要求6所述的融合蛋白,其中所述转铁蛋白部分包含SEQ ID NO.:3的氨基酸序列。
9.如权利要求1所述的融合蛋白,其中所述Tf部分包含Tf蛋白的N域。
10.如权利要求1所述的融合蛋白,其中所述Tf部分由Tf蛋白的N域组成。
10.如权利要求1所述的融合蛋白,其中所述Tf部分包含Tf蛋白的N域的一部分。
11.如权利要求1所述的融合蛋白,其中所述Tf部分包含Tf蛋白的C域。
12.如权利要求1所述的融合蛋白,其中所述Tf部分由Tf蛋白的C域组成。
13.如权利要求1所述的融合蛋白,其中所述Tf部分包含Tf蛋白的C域的一部分。
14.如权利要求1所述的融合蛋白,其中所述Tf部分表现出减少的糖基化。
15.如权利要求1所述的融合蛋白,其中所述Tf部分经修饰以表现出降低的与转铁蛋白受体的结合亲和力。
16.如权利要求15所述的融合蛋白,其中所述Tf部分不与转铁蛋白受体结合。
17.如权利要求1所述的融合蛋白,其中所述Tf部分经修饰以表现出降低的与铁的亲和力。
18.如权利要求17所述的融合蛋白,其中所述Tf部分不与铁结合。
19.如权利要求1所述的融合蛋白,其中所述Tf部分经修饰以具有降低的与碳酸氢盐的亲和力。
20.如权利要求19所述的融合蛋白,其中所述Tf部分不与碳酸氢盐结合。
21.如权利要求1所述的融合蛋白,其中所述Tf部分在选自糖基化位点、铁结合位点、铰链位点、碳酸氢盐位点和受体结合位点的一个或多个位点处被修饰。
22.如权利要求1所述的融合蛋白,其中所述Tf部分包含至少一个防止糖基化的突变。
23.如权利要求22所述的融合蛋白,其中所述突变位于包含序列N-X-S/T的N-联糖基化位点中。
24.如权利要求23所述的融合蛋白,其中所述序列N-X-S/T开始于与SEQ ID NO.:3的N413或N611相应的氨基酸。
25.如权利要求24所述的融合蛋白,其中所述N、X、S或T已经被改变为脯氨酸。
26.如权利要求22所述的融合蛋白,其中所述Tf部分包含在SEQID NO.:3的氨基酸S415和T613处的突变。
27.如权利要求22所述的融合蛋白,其中所述Tf部分包含在SEQID NO.:3的氨基酸S415或T613处的突变。
28.如权利要求1所述的融合蛋白,其中所述转铁蛋白部分已经被修饰以表现出无糖基化。
29.如权利要求1所述的融合蛋白,其中所述整联蛋白结合部分与所述Tf部分的N-末端相融合。
30.如权利要求1所述的融合蛋白,其中所述整联蛋白结合部分与所述Tf部分的C-末端相融合。
31.如权利要求1所述的融合蛋白,其中所述整联蛋白结合部分插入到所述转铁蛋白部分内。
32.如权利要求28所述的融合蛋白,其中所述整联蛋白结合部分插入到所述转铁蛋白SEQ ID NO.:3的289-290氨基酸位置间。
33.如权利要求1所述的融合蛋白,其中所述整联蛋白结合部分插入到所述转铁蛋白部分的表面暴露环中。
34.如权利要求1所述的融合蛋白,其中所述整联蛋白结合部分由3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、11个或更多、12个或更多、13个或更多、14个或更多、15个或更多、或20个或更多的氨基酸组成。
35.如权利要求1所述的融合蛋白,其中所述整联蛋白结合部分包含氨基酸序列RGD。
36.如权利要求1所述的融合蛋白,其中所述整联蛋白结合部分包含氨基酸序列CXXXRGDXXXC,其中X=任何氨基酸。
37.如权利要求1所述的融合蛋白,其中所述整联蛋白结合部分包含氨基酸序列XXXRGDXXX,其中X=任何氨基酸。
38.如权利要求35所述的融合蛋白,其中所述整联蛋白结合部分在氨基酸序列RGD的N-末端和C-末端进一步包含一个或多个随机化的氨基酸。
39.如权利要求35所述的融合蛋白,其中所述整联蛋白结合部分进一步在氨基酸序列RGD的N-末端或C末端包含一个或多个随机化的氨基酸。
40.如权利要求1所述的融合蛋白,其中所述转铁蛋白部分和整联蛋白结合部分包含转移体。
41.如权利要求1所述的融合蛋白,其中所述整联蛋白结合部分能够与整联蛋白αIIbβ3结合。
42.如权利要求1所述的融合蛋白,其中所述整联蛋白结合部分能够与α4整联蛋白结合。
43.如权利要求1所述的融合蛋白,其中所述整联蛋白结合部分能够抑制血小板凝集。
44.如权利要求2所述的融合蛋白,其中所述转铁蛋白部分与柄部分的N-末端融合。
45.如权利要求2所述的融合蛋白,其中所述柄部分与Tf部分的C-末端融合。
46.如权利要求2所述的融合蛋白,其中所述柄部分是高度糖基化的肽。
47.如权利要求2所述的融合蛋白,其中所述柄部分包含酵母AGA1蛋白或其片段。
48.如权利要求2所述的融合蛋白,其中所述柄部分包含黏蛋白域或黏蛋白-样域。
49.如权利要求48所述的融合蛋白,其中黏蛋白域包含选自MUC1、MUC2、MUC3、MUC4、MUC5AC、MUC5B、MUC6、MUC7、MUC8、MUC9、MUC10、MUC11、MUC12、MUC13、MUC14、MUC15、MUC16、MUC17、MUC18、MUC19、MCU20、MUC21及其变体、衍生物和类似物和片段的一个或多个蛋白。
50.如权利要求2所述的融合蛋白,其中所述柄部分包含人MUC1蛋白或其变体或片段。
51.如权利要求50所述的融合蛋白,其中所述柄部分由SEQ IDNO.:5的核酸编码。
52.如权利要求2所述的融合蛋白,其中所述柄部分包含人MUC3蛋白或其变体或片段。
53.如权利要求2所述的融合蛋白,其中所述柄部分起到减小转铁蛋白部分与宿主细胞或基质之间的空间位阻的作用。
54.如权利要求5所述的融合蛋白,其中所述柄部分与所述锚定部分的N-末端融合。
55.如权利要求5所述的融合蛋白,其中所述锚定部分与所述柄部分的C-末端融合。
56.如权利要求5所述的融合蛋白,其中所述锚定部分是糖基-磷脂酰-肌醇GPI或其衍生物或片段。
57.如权利要求56所述的融合蛋白,其中所述GPI包含酵母GPI信号序列或其片段。
58.如权利要求57所述的融合蛋白,其中所述GPI信号序列包含SEQ ID NO.:15。
59.如权利要求56所述的融合蛋白,其中所述GPI包含哺乳动物GPI信号序列或其片段。
60.如权利要求5所述的融合蛋白,其中所述锚定部分包含经修饰的GPI信号序列。
61.如权利要求60所述的融合蛋白,其中所述经修饰的GPI信号序列在SEQ ID NO.:26的位置1处包括半胱氨酸残基。
62.如权利要求60所述的融合蛋白,其中所述经修饰的GPI信号序列是选自由SEQ ID NO.:34的最前两位氨基酸和SEQ ID NO.:34、36和38的最前两位氨基酸组成的组的氨基酸序列。
63.如权利要求3所述的融合蛋白,其中所述细胞壁连接组件共价地连接到细胞壁。
64.如权利要求3所述的融合蛋白,其中所述细胞壁连接组件非共价地连接到细胞壁。
65.如权利要求3所述的融合蛋白,其中所述细胞壁连接组件是柄部分。
66.如权利要求3所述的融合蛋白,其中所述细胞壁连接组件是锚定部分。
67.如权利要求66所述的融合蛋白,其中所述锚定部分是跨膜域。
68.如权利要求3所述的融合蛋白,其中所述细胞壁连接组件包含一个或多个能与细胞壁中的一个或多个蛋白形成二硫键的游离半胱氨酸残基。
69.如权利要求3所述的融合蛋白,其中所述细胞壁连接组件包含能与细胞壁的β-葡聚糖交联的一个或多个柄部分多糖。
70.一种融合蛋白,其包含
(a)白蛋白部分和
(b)整联蛋白结合部分;
71.如权利要求70所述的融合蛋白,其进一步包含柄部分。
72.如权利要求70或71所述的融合蛋白,其进一步包含细胞壁连接组件。
73.如权利要求70所述的融合蛋白,其中所述白蛋白部分是白蛋白、经修饰的白蛋白或其片段。
74.如权利要求72所述的融合蛋白,其中所述白蛋白是人白蛋白。
75.如权利要求70-73所述的融合蛋白,其进一步包含锚定部分。
76.如权利要求70所述的融合蛋白,其进一步包含跨膜域。
77.如权利要求70所述的融合蛋白,其中所述整联蛋白结合部分包含氨基酸序列RGD。
78.如权利要求70所述的融合蛋白,其中所述整联蛋白结合部分包含氨基酸序列CXXXRGDXXXC,其中X=任何氨基酸。
79.如权利要求70所述的融合蛋白,其中所述整联蛋白结合部分包含氨基酸序列XXXRGDXXX,其中X=任何氨基酸。
80.如权利要求77所述的融合蛋白,其中所述整联蛋白结合部分在氨基酸序列RGD的N-末端和C-末端进一步包含一个或多个随机化的氨基酸。
81.如权利要求77所述的融合蛋白,其中所述整联蛋白结合部分在氨基酸序列RGD的N-末端或C末端进一步包含一个或多个随机化的氨基酸。
82.如权利要求70所述的融合蛋白,其中所述整联蛋白结合部分能够与整联蛋白αIIbβ3结合。
83.如权利要求70所述的融合蛋白,其中所述整联蛋白结合部分能够抑制血小板凝集。
84.编码权利要求1-83中任一项所述的融合蛋白的核酸分子。
85.包含如权利要求84所述的核酸分子的宿主细胞。
86.表达如权利要求1-83任一项所述的融合蛋白的宿主细胞。
87.如权利要求85所述的宿主细胞,其中所述细胞是酵母细胞。
88.如权利要求87所述的宿主细胞,其中所述酵母细胞是酵母菌或毕赤氏酵母菌。
89.包含大量如权利要求1或70所述的融合蛋白的库。
90.包含大量如权利要求2或71所述的融合蛋白的库。
91.包含大量融合蛋白的库,每个融合蛋白包含与至少一个第二肽相融合的第一转铁蛋白Tf肽,其中所述第二肽包含整联蛋白结合序列。
92.如权利要求91所述的库,其中所述整联蛋白结合序列包含氨基酸序列RGD。
93.如权利要求91所述的库,其中所述第二肽包含氨基酸序列CXXXRGDXXXC,其中X=任何氨基酸。
94.如权利要求91所述的库,其中所述第二肽包含氨基酸序列XXXRGDXXX,其中X=任何氨基酸。
95.如权利要求91所述的库,其中所述第二肽在氨基酸序列RGD的两侧进一步包含一个或多个随机化的氨基酸。
96.如权利要求91所述的库,其中所述第二肽在氨基酸序列RGD的一侧进一步包含一个或多个随机化的氨基酸。
97.如权利要求91所述的库,其中所述转铁蛋白和第二肽包含转移体。
98.如权利要求91所述的库,其中所述整联蛋白结合序列能够与整联蛋白αIIbβ3结合。
99.如权利要求91所述的库,其中所述整联蛋白结合序列能够抑制血小板凝集。
100.整联蛋白结合序列的结合活性的筛选方法,所述方法包括将如权利要求89、90或91所述的库暴露于试剂,并检测至少一个融合蛋白与所述试剂的结合。
101.如权利要求100所述的方法,其中所述库在酵母细胞中表达。
102.如权利要求100所述的方法,其中所述试剂是整联蛋白。
103.包含大量转铁蛋白的转铁蛋白库,其中每一个转铁蛋白包含至少约3个随机突变的氨基酸残基,并且其中所述至少约3个随机突变的氨基酸残基位于转铁蛋白的表面暴露区域内。
104.如权利要求103所述的库,其中所述每一个转铁蛋白包含至少约四个随机突变的氨基酸残基。
105.如权利要求103所述的库,其中所述每一个转铁蛋白包含至少约五个随机突变的氨基酸残基。
106.如权利要求103所述的库,其中所述每一个转铁蛋白包含至少约六个随机突变的氨基酸残基。
107.如权利要求103所述的库,其中所述至少3个氨基酸残基选自Y85、G86、S87、E89、D90、Q92、K276、D277、K280、Q283、S286、D297、S298、H207、S208、F211、E212、A215、N216和K217。
108.如权利要求103所述的库,其中所述转铁蛋白的表面暴露区域选自由约氨基酸残基85至约92、约氨基酸残基276至约298和约氨基酸残基207至约217组成的区域组。
109.如权利要求103所述的库,其中所述每一个转铁蛋白进一步与柄部分融合。
110.一种融合蛋白,其包含:
(a)转铁蛋白部分;
(b)柄部分;和
(c)细胞壁连接组件。
111.如权利要求110所述的融合蛋白,其中所述转铁蛋白部分包含至少约3个经突变的表面暴露的氨基酸残基。
112.如权利要求110所述的融合蛋白,其中所述至少约3个经突变的表面暴露的氨基酸残基选自由Y85、G86、S87、E89、D90、Q92、K276、D277、K280、Q283、S286、D297、S298、H207、S208、F211、E212、A215、N216和K217。
113.如权利要求110所述的融合蛋白,其中所述至少3个经突变的氨基酸残基位于选自由约氨基酸残基85至约92、约氨基酸残基276至约298和约氨基酸残基207至约217组成的区域组的一个转铁蛋白表面暴露区域中。
114.如权利要求110所述的融合蛋白,其中所述转铁蛋白部分包含至少约3、4、5、6、7、8、9或10个表面暴露的氨基酸残基。
115.如权利要求110所述的融合蛋白,其中所述柄部分包含一个或多个随机化的突变。
116.如权利要求110所述的融合蛋白,其中所述柄部分包含MUC3变体。
117.如权利要求110所述的融合蛋白,其中所述MUC3变体包含SEQ ID NO.:76的序列。
CN200780050623A 2006-12-12 2007-12-07 转铁蛋白融合蛋白库 Pending CN101622274A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US93495106P 2006-12-12 2006-12-12
US60/934,951 2006-12-12

Publications (1)

Publication Number Publication Date
CN101622274A true CN101622274A (zh) 2010-01-06

Family

ID=39362844

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780050623A Pending CN101622274A (zh) 2006-12-12 2007-12-07 转铁蛋白融合蛋白库

Country Status (13)

Country Link
US (1) US8822639B2 (zh)
EP (2) EP2114999A2 (zh)
JP (1) JP5492563B2 (zh)
KR (1) KR20090098880A (zh)
CN (1) CN101622274A (zh)
AU (1) AU2007331195A1 (zh)
CA (1) CA2673085C (zh)
ES (1) ES2535358T3 (zh)
IL (1) IL198815A0 (zh)
MX (1) MX2009006398A (zh)
NO (1) NO20092591L (zh)
WO (1) WO2008072075A2 (zh)
ZA (1) ZA200904757B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102258767A (zh) * 2010-05-24 2011-11-30 黄敏铨 促进伤口愈合的组合物
CN107075507A (zh) * 2014-11-10 2017-08-18 小利兰斯坦福大学理事会 用于在细胞表面上表达多肽的组合物和方法
CN109641971A (zh) * 2016-08-25 2019-04-16 Jcr制药股份有限公司 抗体融合蛋白的制造方法
CN113045670A (zh) * 2019-12-27 2021-06-29 华南农业大学 一种可溶性鸡α干扰素融合蛋白及其生产方法与应用
CN113811542A (zh) * 2018-12-21 2021-12-17 非营利性组织佛兰芒综合大学生物技术研究所 包含细胞因子和支架蛋白的融合蛋白

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8401798B2 (en) * 2008-06-06 2013-03-19 Dna Twopointo, Inc. Systems and methods for constructing frequency lookup tables for expression systems
US20130079382A1 (en) 2009-10-12 2013-03-28 Larry J. Smith Methods and Compositions for Modulating Gene Expression Using Oligonucleotide Based Drugs Administered in vivo or in vitro
US20130251740A1 (en) * 2010-10-26 2013-09-26 Rockefeller University (The) Immunogenic agents
KR101615161B1 (ko) * 2011-02-02 2016-04-25 메디포스트(주) 신경질환의 예방 또는 치료를 위한 icam-1의 용도
US9623117B2 (en) * 2011-04-04 2017-04-18 Wisconsin Alumni Research Foundation Method for selective targeting and entry of bacterial toxins to cells
JP6234446B2 (ja) 2012-06-08 2017-11-22 アルカーメス,インコーポレイテッド ムチンドメインポリペプチドに連結された活性タンパク質を含む融合ポリペプチド
AU2013359469B2 (en) * 2012-12-10 2019-05-16 Seattle Biomedical Research Institute Cell-free biofragment compositions and related systems, devices, and methods
WO2017170418A1 (ja) * 2016-03-30 2017-10-05 株式会社カネカ エンドヌクレアーゼ活性を有するポリペプチド及びその製造方法
WO2023114912A2 (en) * 2021-12-16 2023-06-22 Thomas Jefferson University A therapeutic against crimean-congo hemorrhagic fever virus

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4599311A (en) 1982-08-13 1986-07-08 Kawasaki Glenn H Glycolytic promotersfor regulated protein expression: protease inhibitor
US4782137A (en) 1984-01-24 1988-11-01 Immunex Corporation Synthesis of protein with an identification peptide, and hybrid polypeptide incorporating same
US4703004A (en) 1984-01-24 1987-10-27 Immunex Corporation Synthesis of protein with an identification peptide
AU600885B2 (en) 1984-05-25 1990-08-30 Zymogenetics Inc. Stable DNA constructs
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5026651A (en) 1985-04-25 1991-06-25 Board Of Regents, The University Of Texas System Methods and compositions for the production of human transferrin
US5011912A (en) 1986-12-19 1991-04-30 Immunex Corporation Hybridoma and monoclonal antibody for use in an immunoaffinity purification system
US4851341A (en) 1986-12-19 1989-07-25 Immunex Corporation Immunoaffinity purification system
US6018026A (en) 1988-01-22 2000-01-25 Zymogenetics, Inc. Biologically active dimerized and multimerized polypeptide fusions
US6514936B1 (en) 1988-09-01 2003-02-04 Bayer Corporation Antiviral methods using human rhinovirus receptor (ICAM-1)
US5346989A (en) 1990-08-22 1994-09-13 Syntello Vaccine Development Kb Peptides for use in induction of T cell activation against HIV-1
US5347849A (en) 1990-08-30 1994-09-20 Tanknology Corporation International Water sensor that detects tank or vessel leakage
US5986067A (en) 1991-02-08 1999-11-16 The University Of Vermont And State Agricultural College Recombinant transferrins, transferrin half-molecules and mutants thereof
DE69226197T2 (de) 1991-11-08 1999-02-11 Somatogen Inc Hämoglobine als arzneimittelabgabesystem
DE69326069T2 (de) 1992-07-20 2000-03-23 Univ Durham Zusammensetzungen die die hiv replikation inhibieren
US5547871A (en) 1993-01-25 1996-08-20 American Cyanamid Company Heterologous signal sequences for secretion of insect controlling proteins
US6955900B1 (en) * 1993-02-02 2005-10-18 The Scripps Research Institute Methods for producing polypeptide binding sites, monoclonal antibodies and compositions thereof
JP3691055B2 (ja) 1993-02-10 2005-08-31 ユニリーバー・ナームローゼ・ベンノートシャープ 特異的結合力をもつ固定化タンパク質並びに各種プロセス・物品におけるそれらの使用
WO1994017810A1 (en) 1993-02-12 1994-08-18 The Wistar Institute Of Anatomy And Biology Recombinant cytomegalovirus vaccine
CA2160583A1 (en) 1993-04-16 1994-10-27 Stanley A. Plotkin Recombinant cytomegalovirus vaccine
US6479055B1 (en) 1993-06-07 2002-11-12 Trimeris, Inc. Methods for inhibition of membrane fusion-associated events, including respiratory syncytial virus transmission
US5464933A (en) 1993-06-07 1995-11-07 Duke University Synthetic peptide inhibitors of HIV transmission
US6017536A (en) 1993-06-07 2000-01-25 Trimeris, Inc. Simian immunodeficiency virus peptides with antifusogenic and antiviral activities
US5603933A (en) 1993-08-31 1997-02-18 Board Of Regents, The University Of Texas CD4 peptides for binding to viral envelope proteins
US5981478A (en) * 1993-11-24 1999-11-09 La Jolla Cancer Research Foundation Integrin-binding peptides
US5516637A (en) 1994-06-10 1996-05-14 Dade International Inc. Method involving display of protein binding pairs on the surface of bacterial pili and bacteriophage
US5843882A (en) 1995-04-27 1998-12-01 The United States Of America As Represented By The Department Of Health And Human Services Antiviral proteins and peptides
US5817789A (en) 1995-06-06 1998-10-06 Transkaryotic Therapies, Inc. Chimeric proteins for use in transport of a selected substance into cells
KR100571215B1 (ko) 1995-06-07 2006-10-24 트라이머리스 인코퍼레이티드 복합적인치료요법을이용한hiv와다른바이러스감염의치료
US6699658B1 (en) 1996-05-31 2004-03-02 Board Of Trustees Of The University Of Illinois Yeast cell surface display of proteins and uses thereof
US6696251B1 (en) 1996-05-31 2004-02-24 Board Of Trustees Of The University Of Illinois Yeast cell surface display of proteins and uses thereof
US6300065B1 (en) 1996-05-31 2001-10-09 Board Of Trustees Of The University Of Illinois Yeast cell surface display of proteins and uses thereof
US6759243B2 (en) 1998-01-20 2004-07-06 Board Of Trustees Of The University Of Illinois High affinity TCR proteins and methods
US6258782B1 (en) 1998-05-20 2001-07-10 Trimeris, Inc. Hybrid polypeptides with enhanced pharmacokinetic properties
US6699677B1 (en) * 1999-12-20 2004-03-02 Chemocentryx, Inc. Tethered ligands and methods of use
US6623741B1 (en) 2000-02-29 2003-09-23 Trimeris, Inc. Methods and compositions for inhibition of membrane fusion-associated events including RSV transmission
AU2001259063A1 (en) 2000-04-12 2001-10-30 Human Genome Sciences, Inc. Albumin fusion proteins
US20040023334A1 (en) 2001-08-30 2004-02-05 Biorexis Pharmaceutical Corporation Modified transferrin fusion proteins
US7176278B2 (en) 2001-08-30 2007-02-13 Biorexis Technology, Inc. Modified transferrin fusion proteins
WO2004019872A2 (en) 2002-08-30 2004-03-11 Biorexis Pharmaceutical Corporation Oral delivery of modified transferrin fusion proteins
US20070031440A1 (en) 2001-08-30 2007-02-08 Prior Christopher P Modified transferin-antibody fusion proteins
US20030226155A1 (en) 2001-08-30 2003-12-04 Biorexis Pharmaceutical Corporation Modified transferrin-antibody fusion proteins
WO2004020588A2 (en) 2002-08-30 2004-03-11 Biorexis Pharmaceutical Corporation Transferrin fusion protein libraries
US20060105387A1 (en) 2002-08-30 2006-05-18 Prior Christopher P Transferrin fusion proteins libraries
AU2003262886A1 (en) 2002-08-30 2004-03-19 Biorexis Pharmaceutical Corporation Modified transferrin fusion proteins comprising duplicate transferrin amino or carboxy terminal domains
US20070060512A1 (en) 2003-03-04 2007-03-15 Homayoun Sadeghi Dipeptidyl-peptidase protected protein
WO2004078777A2 (en) 2003-03-04 2004-09-16 Biorexis Pharmaceutical Corporation Dipeptidyl-peptidase protected proteins
WO2005021579A2 (en) 2003-08-28 2005-03-10 Biorexis Pharmaceutical Corporation Epo mimetic peptides and fusion proteins
US20060205037A1 (en) 2003-08-28 2006-09-14 Homayoun Sadeghi Modified transferrin fusion proteins
WO2006049983A2 (en) * 2004-10-27 2006-05-11 Biorexis Pharmaceutical Corporation Peptide yy modified transferrin fusion proteins
JP2008531059A (ja) 2005-03-04 2008-08-14 バイオレクシス ファーマシューティカル コーポレーション 改変トランスフェリン融合タンパク質
US20090275481A1 (en) * 2005-06-17 2009-11-05 Pfizer, Inc. Anchored Transferrin Fusion Protein Libraries
JP5102833B2 (ja) 2006-07-24 2012-12-19 バイオレクシス ファーマシューティカル コーポレーション エキセンディン融合タンパク質

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102258767A (zh) * 2010-05-24 2011-11-30 黄敏铨 促进伤口愈合的组合物
CN102258767B (zh) * 2010-05-24 2013-05-15 黄敏铨 促进伤口愈合的组合物
CN107075507A (zh) * 2014-11-10 2017-08-18 小利兰斯坦福大学理事会 用于在细胞表面上表达多肽的组合物和方法
US10829771B2 (en) 2014-11-10 2020-11-10 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods for expressing polypeptides on the surface of cells
CN107075507B (zh) * 2014-11-10 2021-08-24 小利兰斯坦福大学理事会 用于在细胞表面上表达多肽的组合物和方法
CN109641971A (zh) * 2016-08-25 2019-04-16 Jcr制药股份有限公司 抗体融合蛋白的制造方法
CN109641971B (zh) * 2016-08-25 2023-04-04 Jcr制药股份有限公司 抗体融合蛋白的制造方法
CN113811542A (zh) * 2018-12-21 2021-12-17 非营利性组织佛兰芒综合大学生物技术研究所 包含细胞因子和支架蛋白的融合蛋白
CN113045670A (zh) * 2019-12-27 2021-06-29 华南农业大学 一种可溶性鸡α干扰素融合蛋白及其生产方法与应用
CN113045670B (zh) * 2019-12-27 2022-11-01 华南农业大学 一种可溶性鸡α干扰素融合蛋白及其生产方法与应用

Also Published As

Publication number Publication date
KR20090098880A (ko) 2009-09-17
WO2008072075A3 (en) 2008-11-06
EP2114999A2 (en) 2009-11-11
AU2007331195A1 (en) 2008-06-19
NO20092591L (no) 2009-09-11
EP2479189B1 (en) 2015-02-25
CA2673085C (en) 2013-10-15
IL198815A0 (en) 2011-08-01
JP5492563B2 (ja) 2014-05-14
US8822639B2 (en) 2014-09-02
ZA200904757B (en) 2010-04-28
JP2010512160A (ja) 2010-04-22
EP2479189A1 (en) 2012-07-25
CA2673085A1 (en) 2008-06-19
ES2535358T3 (es) 2015-05-08
MX2009006398A (es) 2009-06-23
WO2008072075A2 (en) 2008-06-19
US20110086768A1 (en) 2011-04-14

Similar Documents

Publication Publication Date Title
CN101622274A (zh) 转铁蛋白融合蛋白库
AU2002323501C1 (en) Modified transferrin fusion proteins
JP5038591B2 (ja) 改変トランスフェリン−抗体の融合タンパク質
Rich et al. Survey of the year 2001 commercial optical biosensor literature
EP1545595B1 (en) Modified transferrin fusion proteins comprising duplicate transferrin amino or carboxy terminal domains
US20100204052A1 (en) Protein scaffolds and uses thereof
US20040101905A1 (en) Product
AU2002323501A1 (en) Modified transferrin fusion proteins
CN101743249A (zh) 融合分子与il-15变异体
US20090275481A1 (en) Anchored Transferrin Fusion Protein Libraries
JP2014523238A (ja) インターフェロンと標的化修飾ユビキチンタンパク質とを含むヒト融合タンパク質
AU2006268111A1 (en) Il-6 binding proteins
US7820790B2 (en) IL-6 binding proteins
US20060105387A1 (en) Transferrin fusion proteins libraries
EP1539221B1 (en) Transferrin fusion protein libraries
CN101519449A (zh) 经修饰的运铁蛋白融合蛋白
WO1985004673A1 (en) Novel dna and its use

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1135992

Country of ref document: HK

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100106

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1135992

Country of ref document: HK