CN101098886A - 蛋白的生产 - Google Patents

蛋白的生产 Download PDF

Info

Publication number
CN101098886A
CN101098886A CNA2005800461115A CN200580046111A CN101098886A CN 101098886 A CN101098886 A CN 101098886A CN A2005800461115 A CNA2005800461115 A CN A2005800461115A CN 200580046111 A CN200580046111 A CN 200580046111A CN 101098886 A CN101098886 A CN 101098886A
Authority
CN
China
Prior art keywords
sequence
leu
pro
gln
host cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005800461115A
Other languages
English (en)
Other versions
CN101098886B (zh
Inventor
马里亚·多洛雷斯·路德维德穆西卡
米利亚姆·巴斯蒂达维尔基里
布兰卡·洛姆帕特罗约
巴勃罗·马萨阿瓦尔鲁纳
玛加丽塔·托伦特克格拉斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ERA PLANTECH S L
Original Assignee
ERA PLANTECH S L
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ERA PLANTECH S L filed Critical ERA PLANTECH S L
Publication of CN101098886A publication Critical patent/CN101098886A/zh
Application granted granted Critical
Publication of CN101098886B publication Critical patent/CN101098886B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • C07K14/425Zeins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • C07K14/485Epidermal growth factor [EGF], i.e. urogastrone
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/585Calcitonins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/61Growth hormone [GH], i.e. somatotropin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/02Preparation of hybrid cells by fusion of two or more cells, e.g. protoplast fusion
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/04Fusion polypeptide containing a localisation/targetting motif containing an ER retention signal such as a C-terminal HDEL motif

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Toxicology (AREA)
  • Endocrinology (AREA)
  • Botany (AREA)
  • Cell Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开了形成融合蛋白的方法,所述融合蛋白在作为宿主体系的不同于高等植物的宿主真核细胞和生物体中以重组蛋白体样组装体表达。更具体地,将肽和蛋白融合到介导诱导重组蛋白体样组装体(RPBLA)形成的蛋白序列,通过适合的载体转化后在这些宿主细胞中稳定地表达和积聚。本发明也公开了制备融合蛋白的方法。

Description

蛋白的生产
技术领域
本发明关注以不同于高等植物的真核细胞和生物体作为宿主体系生产重组肽和蛋白。更具体地,将肽和蛋白融合到介导诱导重组蛋白体样组装体(recombinant protein body-like assembly,RPBLA)形成的蛋白序列,用适合的载体转化后在这些宿主体系中稳定地表达和积聚。
背景技术
在过去十年,出于治疗、营养或工业目的的重组蛋白生产已取得很大成功。已证实不同的真核细胞和生物体可生产基于活性蛋白的治疗剂。遗憾的是,通常源于低的重组蛋白生产水平和/或蛋白分离和纯化操作的高成本,使它们的工业应用不能实现。已进行了积极的研究,以通过不同的方法改进生产水平和纯化操作。
已开发了基于将感兴趣的蛋白与植物种子贮藏蛋白结构域融合的新技术(WO 2004/003207),用于增强重组蛋白在高等植物中的稳定性和积聚。这些贮藏蛋白为植物种子所特有,并以蛋白体稳定的积聚在其中(Galili et al.,1993,Trends Cell Biol 3:437-442)。
所述贮藏蛋白通过信号肽插入到内质网(ER)腔中,并在内质网中组装形成称作ER衍生蛋白体(ER-PB)的特定细胞器,或在蛋白贮藏液泡(PSV)中组装(Okita and Rogers 1996 Annu.Rev.Plant Physiol Mol.Biol.47:327-50;Herman and Larkins 1999 Plant Cell 11:601-613;Sanderfoot and Raikel 1999 Plant Cell 11:629-642)。也已描述了重组贮藏蛋白在诸如爪蟾卵母细胞和酵母的非植物宿主体系的蛋白体样(PB-like)细胞器中组装。
已描述了经注射相应的mRNA在爪蟾卵母细胞中表达谷类醇溶谷蛋白(最丰富的谷类贮藏蛋白)。已将这种体系用作模型来研究这些贮藏蛋白的靶向特性(Simon et al.,1990,Plant Cell 2:941-950;Altschuler et al.,1993,Plant Cell 5:443-450;Torrent et al.,1994,Planta192:512-518),以及测试修饰19kDaα-玉米蛋白(一种玉米醇溶谷蛋白)而不改变其稳定性的可能性,该修饰通过将必需氨基酸赖氨酸和色氨酸引入其序列中来进行(Wallace et al,1988,Science 240:662-664)。
出于不同目的,也已在酵母中生产了玉米蛋白类(玉米醇溶谷蛋白的复杂群)。Coraggio et al.,1988,Eur J Cell Biol 47:165-172在酵母中表达天然和修饰的α-玉米蛋白,以研究这种蛋白的靶向决定子。Kim et al.,2002,Plant Cell 14:655-672研究了导致蛋白体形成的α-、β-、γ-和δ-玉米蛋白的可能的相互作用。为解决这个问题,他们用编码这些蛋白的cDNA转化酵母细胞。此外,这些作者构建了玉米蛋白-GFP融合蛋白以确定玉米蛋白在酵母细胞中的亚细胞定位。接着,可将酵母细胞作为模型表达体系研究玉米蛋白的特性。值得注意的是,Kim et al。2002,Plant Cell 14:655-672得出结论为酵母不是研究玉米蛋白相互作用的好模型,因为玉米蛋白本身在转化的酵母中极少积聚。也将酵母细胞用作模型研究调控称作麦醇溶蛋白的小麦贮藏蛋白的转运和蛋白体沉积的机制(Rosenberg et al.,1993,Plant Physiol 102:61-69)。
这里,我们证实介导重组蛋白体样组装体(RPBLA)的诱导的蛋白序列,例如醇溶谷蛋白或醇溶谷蛋白结构域,与感兴趣的(目标)肽或蛋白的融合介导了那些RPBLA在诸如真菌(包括酵母)、藻类和动物的生物体的细胞中积聚。有趣的是,这些融合蛋白在动物细胞的蛋白体样细胞器结构中稳定积聚。
发明的简要概述
本发明提供了在诸如动物、真菌和藻类的不同于高等植物的真核细胞中以及在培养的动物、真菌和藻类细胞中生产包含蛋白体诱导序列(PBIS)和感兴趣肽或蛋白(本文常统称为多肽)的融合蛋白的体系和方法,包含感兴趣的肽或蛋白的融合蛋白以重组蛋白体样组装体(RPBLA)在这些细胞中稳定地积聚。PBIS能够介导诱导RPBLA形成以及蛋白进入这些细胞器和/或在这些细胞器中积聚,例如天然和修饰的贮藏蛋白序列连同感兴趣(目标)肽或蛋白。
本发明尤其提供了在作为宿主体系的不同于高等植物的真核细胞中以融合蛋白的形式生产感兴趣的产物的方法,其中所述宿主体系被包含编码PBIS的核酸部分和编码感兴趣多肽产物的核酸部分的核酸序列所转化。
在具体的实施方案中,用于转化的核酸序列包含(i)编码PBIS的核酸序列,以及(ii)包含编码感兴趣产物的核苷酸序列的核酸序列。在一个实施方案中,将核酸序列(i)的3’端连接到所述核酸序列(ii)的5’端。在另一个实施方案中,将核酸序列(i)的5’端连接到所述核酸序列(ii)的3’端。因此,PBIS序列可在融合蛋白的N末端或C末端。
在另一具体实施方案中,除了前述核酸序列(i)和(ii)外,用于转化的核酸序列还包含含有编码间隔氨基酸序列的核苷酸序列的核酸序列。间隔氨基酸序列可以为通过酶或化学方法可断开或不可断开的氨基酸序列。在一个具体的实施方案中,核酸序列(iii)位于核酸序列(i)和(ii)之间,例如,将核酸序列(iii)的3’端连接到所述核酸序列(ii)的5’端。在另一个实施方案中,将所述核酸序列(iii)的5’端连接到核酸序列(ii)的3’端。
另外,在一个具体实施方案中,用于转化目的的核酸序列编码特定可断开的序列,如根据专利申请WO 2004003207所定义的,该申请与本申请一起转让。而且,在另外的实施方案中,所述核酸与专利申请WO 2004003207一致,但其中缺少通过酶或化学方法可特异断开的编码氨基酸序列的核酸序列。在另一实施方案中,融合蛋白可为PBIS和感兴趣肽或蛋白之间的直接融合。
在另一实施方案中,本发明的方法还包括分离和纯化融合蛋白。
在另一实施方案中,将感兴趣蛋白融合到天然或修饰的贮藏蛋白,例如天然或修饰的醇溶谷蛋白或醇溶谷蛋白结构域。感兴趣蛋白的实例包括具有治疗、营养、生物控制或工业用途的任何蛋白。示例性的蛋白和肽例如包括诸如降钙素和生长激素等的激素、诸如单克隆抗体和其片段的抗体、诸如可用作针对人免疫缺陷病毒(HIV)的疫苗的抗原、乙型肝炎表面或核心蛋白、胃肠炎冠状病毒等、蛋白酶抑制剂、抗生素、胶原蛋白、人乳铁蛋白、细胞因子、诸如水解酶、糖苷酶和氧化还原酶等的工业用酶。
附图简要说明
在形成本公开内容的一部分的附图中:
图1为SDS/PAGE分析照片,显示融合蛋白在转染的哺乳动物细胞中的积聚,所述融合蛋白包括作为各感兴趣蛋白连接到γ-玉米蛋白衍生的RX3蛋白体诱导序列的降钙素(Ct)、人生长激素(hGH)和表皮生长因子(EGF)。显示了融合蛋白RX3-Ct、RX3-hGH和RX3-EGF在转化的293T、CHO和Cos1培养哺乳动物细胞中的积聚。转染44小时后,提取等量的转染的哺乳动物细胞,采用抗γ-玉米蛋白的抗体通过电泳和Western印迹分析相应的总可溶蛋白。也包括了编码RX3-Ct、RX3-hGH和RX3-EGF融合蛋白的构建体的示意图。“c”=细胞;“RX3”=无信号肽的N末端富集脯氨酸的γ-玉米蛋白序列;“m”=培养基。左边标明了分子量标记(kDa)。
图2为照片,以六个图(A-F)显示了RPBLA中的融合蛋白在转染的细胞内的定位。共焦显微镜法用于显示表达RX3-CT的Cos1细胞(图2A)、表达RX3-Ct的CHO细胞(图2B)、表达RX3-EGF的CHO细胞(图2C)以及共表达RX3-Ct和DsRed2-ER标记蛋白的293T细胞(图2D、图2E和图2F)。采用抗γ-玉米蛋白血清,RX3衍生的融合蛋白被免疫定位在蛋白体样结构(图2A-2D)和内质网(见图2A中的箭头)中。图2E显示用红色荧光DsRed2-ER蛋白标记染色的ER。图2F显示图2D和图2E的重叠,显示RX3-Ct与DsRed2在ER和在PBLS中的共定位。图2A和图2C中的插图显示PBLS的高倍放大图。标尺条为1微米。
图3用两个图(A和B)显示在转化的酵母细胞中融合蛋白的积聚。图3A显示RX3-EGF(道c117)和RX3-hGH(道c118)融合蛋白在转化的Saccharomyces(酵母属)中的积聚。采用特异性抗体通过免疫印迹分析来自细胞和培养基等量的总蛋白提取物。用无插入物的pYX243质粒转化的细胞作为对照(C)。每个图的下面包括编码RX3-hGH和RX3-EGF融合蛋白构建体的示意图。
图3B显示使用两种不同的信号肽时包含hGH和RX3-hGH的融合蛋白在Pichiapastoris(巴斯德毕赤酵母)中的积聚。采用特异性抗体通过免疫印迹分析来自转化的细胞和培养基等量的总蛋白提取物。C1和C2分别表示作为对照的pPIC9和pPIC3.5K质粒转化的细胞。在图的下面示出了编码RX3-hGH融合蛋白的构建体c135和c121以及编码hGH的构建体c136的示意图。图的左边表示分子量标记(kDa)。“y”=酵母细胞;“m”=培养基;“SPg”=来自γ-玉米蛋白的信号肽;“RX3”=无信号肽的N末端富集脯氨酸的γ-玉米蛋白序列;“EGF”=表皮生长因子;“hGH”=人生长激素;“Afprepro”=α因子前体肽原(prepropeptide)。
本发明具有一些好处和优势。
一个好处为它的应用使得可在选择的非高等植物真核细胞中相对简单和快速地表达所期望的重组蛋白。
本发明的优势为由于以RPBLA形式表达而提供了可容易获得和纯化的重组蛋白的来源。
由于下文的讨论,其它的一些好处和优势对技术人员是显而易见的。
发明的详细描述
所关注的重组蛋白是在表达它们的宿主细胞中形成重组蛋白体样组装体(RPBLA)的融合蛋白。该RPBLA形成由在细胞内形成高密度沉积物的贮藏蛋白结构域诱导。这些密集的沉积物在细胞质、内膜体系细胞器、线粒体、质体中聚集或被分泌。重组蛋白体样组装体具有随不同融合蛋白而不同的预定密度,但对于制备的特定融合蛋白是已知的。RPBLA的这种预定密度通常大于在匀浆中存在的几乎所有内源性宿主细胞蛋白的密度,并且通常在约1.1至1.35g/ml之间。这种新RPBLA的高密度是源自重组融合蛋白组装为多聚体并积聚的一般能力。在非高等植物真核细胞中表达所关注的RPBLA,它们通常以如上所述的密度为特征。当在动物细胞中表达时,RPBLA的形状通常为球形,具有约1微米(μ)的直径,并且具有环绕的膜。
这些融合蛋白包含通过肽键直接或间接地连接在一起的两种多肽序列,其中一种序列为连接到感兴趣(目标)多肽产物(例如肽或蛋白)的蛋白体诱导序列(PBIS)。PBIS为介导诱导RPBLA形成以及蛋白进入细胞器和/或在细胞器中积聚的蛋白或肽氨基酸序列。PBIS和宿主细胞优选来自生物学上不同的门。因此,PBIS通常来自高等植物-种子植物,而宿主细胞为不同于种子植物的真核细胞,可以是动物细胞,例如哺乳动物或昆虫细胞、真菌/酵母、或藻类细胞,所有这些都来自不同于种子植物的门。示例性、非限定性的PBIS的例子包括贮藏蛋白或修饰的贮藏蛋白,例如醇溶谷蛋白或修饰的醇溶谷蛋白、醇溶谷蛋白结构域或修饰的醇溶谷蛋白结构域。在Shewry et al.,2002 J.Exp.Bot.53(370):947-958中综述了醇溶谷蛋白。优选的PBIS为那些醇溶谷蛋白化合物,如下述的γ-玉米蛋白、α-玉米蛋白或稻米醇溶谷蛋白。
γ-玉米蛋白为玉米贮藏蛋白,下文示出了其DNA和氨基酸残基序列,它是四种玉米醇溶谷蛋白中的一种,占玉米胚乳总蛋白的10-15%。和其它谷类醇溶谷蛋白一样,α-和γ-玉米蛋白在粗糙型ER细胞质侧的膜结合多核糖体中生物合成,在腔内组装,然后隔离到ER衍生的蛋白体中(Herman et al.,1999 Plant Cell 11:601-613;Ludevid et al.,1984 Plant Mol.Biol.3:277-234;Torrent et al..1 986 Plant Mol.Biol.7:93-403)。
γ-玉米蛋白由四种特征性结构域组成:i)19个氨基酸的肽信号;ii)包含八单位六肽PPPVHL(SEQ ID NO:1)的重复结构域(53aa);iii)脯氨酸残基与其它氨基酸交替的ProX结构域(29 aa);以及iv)疏水的半胱氨酸富集的C端结构域(111aa)。
γ-玉米蛋白在ER衍生的RPBLA中组装的能力并不限于种子。实际上,当γ-玉米蛋白基因在转基因的拟南芥(Arabidopsis)植物中组成型表达时,贮藏蛋白在叶肉细胞的ER衍生的PBLS中积聚(Geli et al.,1994 Plant Cell 6:1911-1922)。为了寻找负责γ-玉米蛋白沉积到ER衍生的蛋白体中的信号(醇溶谷蛋白没有KDEL信号),已证实包括串联重复结构域的脯氨酸富集的N末端结构域是ER驻留所必需的,而C端结构域涉及蛋白体形成。然而,仍不知道这些结构域促使蛋白体组装的机制。
由于蛋白体是仅在种子中的合适命名,那么在其它植物器官和在非高等植物中产生的同样的结构通常就称为重组蛋白体样组装体(RPBLA)。
下表示出了示例性的其他有用的醇溶谷蛋白型序列以及它们的GenBank标识。
    蛋白名称     GENBANK ID
    α-玉米蛋白(22kD )     M86591
    白蛋白(32kD)     X70153
    β-玉米蛋白(14kD)     M13507
    γ-玉米蛋白(27kD)     X53514
    γ-玉米蛋白(50kD)     AF371263
    δ-玉米蛋白(18kD)     AF371265
    δ-玉米蛋白(10 kD)     U25674
    7S球蛋白或豌豆球蛋白型     NM113163
    11S球蛋白或豆球蛋白型     DQ256294
    醇溶谷蛋白13kD     AB016504
    醇溶谷蛋白16kD     AY427574
    醇溶谷蛋白10kD     AF294580
通过在所有非冗余 GenBank  CDStranslations+PDB+SwissProt+PIR+PRF(排除环境样品)数据库中进行BLAST查询还可获得有用的序列,如Altschul et al。1997 Nucleic AcidsRes.25:3389-3402中所描述的采用如下所示的查询:
RX3查询SEQ ID NO:2;α-玉米蛋白SEQ ID NO:3;以及稻米醇溶谷蛋白查询SEQ ID NO:4。
示例性的修饰的醇溶谷蛋白包括(a)信号肽序列,(b)一个或多个拷贝的γ-玉米蛋白的重复结构域六肽PPPVHL(SEQ ID NO:1)的序列,整个结构域包含八个六肽单元;以及(c)γ-玉米蛋白的ProX结构域的全部或部分序列。示例性的具体的修饰的醇溶谷蛋白包括以下鉴定为R3、RX3和P4的多肽,下文也示出了其DNA和氨基酸残基序列。
具体的优选的醇溶谷蛋白包括公开在已公布的申请WO2004003207中的γ-玉米蛋白及其组成部分、稻米rP13蛋白和22kDa玉米α-玉米蛋白以及其N末端片段。γ-玉米蛋白(27 kD)、稻米和α-玉米蛋白的DNA和氨基酸序列显示于SEQ ID NO:5(DNA序列)和SEQ ID NO:6(蛋白序列);SEQ ID NO:7(RX3 DNA序列)和SEQ IDNO:8(蛋白序列);SEQ ID NO:9(R3 DNA序列)和SEQ ID NO:10(蛋白序列);SEQ ID NO:11(P4 DNA序列)和SEQ ID NO 12(蛋白序列);SEQ ID NO:13(X10 DNA序列)和SEQ ID NO:14(蛋白序列);
rP13:(蛋白序列SEQ ID NO:15和DNA序列SEQ ID NO:16)-与克隆AB016504同源的13kD稻米醇溶谷蛋白。Sha et al.,1996 Biosci.Biotechnol.Biochem.60(2):335-337;Wen et al.,1993 Plant Physiol.101(3):1115-1116;Kawagoe et al.,2005 Plant Cell 17(4):1141-1153;Mullins et al.,2004 J.Agric.Food Chem.52(8):2242-2246;Mitsukawa etal.,1999 Biosci.Biotechnol.Biochem.63(11):185 1-1858;
22aZt(蛋白序列全长SEQ ID NO:17和DNA序列全长SEQ ID NO:18),22 kD-V01475玉米α-玉米蛋白的N末端片段。Kim et al.,2002Plant Cell14(3):655-672;Woo et al.,2001 Plant Cell 13(10):2297-2317;Matsushima et al.,1997 Biochim. Biophys. Acta 1339(1):14-22;Thompson et al.,1992 Plant Mol.Biol.18(4):827-833。
感兴趣蛋白的实例包括具有治疗、营养、生物控制或工业用途的任何蛋白,例如单克隆抗体(诸如IgG、IgM、IgA等的mAbs)及其片段、用于疫苗(人免疫缺陷病毒HIV;乙型肝炎前表面、表面和核心抗原;胃肠炎冠状病毒等)的抗原、激素(降钙素、生长激素等)、蛋白酶抑制剂、抗生素、胶原蛋白、人乳铁蛋白、细胞因子、工业用酶(水解酶、糖苷酶和氧化还原酶等)。提供了示例性感兴趣蛋白的示例性DNA和氨基酸残基序列:Salmon降钙素BAC57417(蛋白序列SEQ ID NO:19和DNA序列SEQ ID NO:20);
hEGF-基于AAF85790的无信号肽的构建体(蛋白序列SEQ IDNO:21和DNA序列SEQ ID NO:22);
hGH-基于P01241的无信号肽的构建体(蛋白序列SEQ ID NO:23和DNA序列SEQ ID NO:24)。
在另一实施方案中,重组融合蛋白除了包含PBIS和感兴趣产物的序列外,还包含间隔氨基酸序列。间隔氨基酸序列可以为通过酶或化学方法可断开或不可断开的氨基酸序列。在具体的实施方案中,间隔氨基酸序列位于PBIS和目标产物之间。示例性氨基酸序列可被蛋白酶断开,这些蛋白酶如肠激酶、Arg-C内蛋白酶、Glu-C内蛋白酶、Lys-C内蛋白酶、因子Xa等。作为选择,可编码通过诸如溴化氰(在甲硫氨酸残基处断开)的化学试剂可特异性断开的氨基酸序列。
在另一个实施方案中,用于转化目的的核酸序列如根据一起转让的专利申请WO 2004003207所公开的。而且,在另一实施方案中,核酸序列如根据专利申请WO 2004003207所公开的,但是缺少编码可断开氨基酸序列的核酸序列。
在优选的实施方案中,根据包括如下步骤的方法制备融合蛋白:用包含(i)编码PBIS的第一核酸序列和(ii)包含编码感兴趣多肽产物的核苷酸序列的第二核酸序列的核酸(DNA或RNA)序列转化诸如动物、动物细胞培养物、真菌/酵母、昆虫或藻类的非高等植物真核宿主细胞体系,其中第一核酸序列同框(in frame)可操作地连接到第二核酸序列;即,编码PBIS的核酸序列化学键合(肽键合)到编码感兴趣多肽的序列,以至于两种多肽可它们适合的读码框处表达。将宿主细胞在适于表达融合蛋白以及将表达的融合蛋白组装进重组蛋白体样组装体(RPBLA)的培养条件下维持一段时间。表达后,得到的融合蛋白在转化的宿主体系中积聚为高密度重组蛋白体样组装体。随后可从宿主细胞中回收融合蛋白,或者,如果需要,将包含融合蛋白的宿主细胞用作含有添加了营养物或补充剂的动物食品。融合蛋白可作为RPBLA的一部分被分离或也与RPBLA分离。
适合表达融合蛋白的培养条件通常对每一类型的宿主细胞是不同的。然而,这些条件为技术人员所公知并且容易确定。同样地,培养时间随宿主细胞和所期望制备的融合蛋白的量而不同。而且,这些条件是熟知的并且在特定情形下容易确定。另外,从本文的引文中可获得特定的培养条件。
在一个实施方案中,第一核酸序列(i)的3’端连接(键合)到第二核酸序列(ii)的5’端。在其他实施方案中,将第一核酸序列(i)的5’端连接(键合)到第二核酸序列(ii)的3’端。在另一个实施方案中,PBIS包括贮藏蛋白或修饰的贮藏蛋白、其片段或修饰的片段。
在另一具体实施方案中,根据包括如下步骤的方法制备融合蛋白:用除了包含前述核酸序列(i)和(ii)之外还包含编码间隔氨基酸序列的同框核酸序列(iii)的核酸序列转化诸如动物、动物细胞培养物、真菌/酵母或藻类的宿主细胞体系。间隔氨基酸序列可以为通过酶或化学方法可断开或不可裂开的氨基酸序列,如上所述。在一个具体实施方案中,核酸序列(iii)置于所述核酸序列(i)和(ii)之间,例如,将第三核酸序列(iii)的3’端连接到第二核酸序列(ii)的5’端。在另一个实施方案中,将第三核酸序列(iii)的5’端连接到第二核酸序列(ii)的3’端。
本发明还关注编码前述融合蛋白分子的核酸序列(片段)或该编码序列的互补物。在一些优选的实施方案中,这种核酸片段以分离的或纯化的形式存在。
在活的生物体中,蛋白或多肽的氨基酸残基序列通过遗传密码与编码该蛋白的基因的脱氧核糖核酸(DNA)序列直接相关。因此,如果需要,可通过熟知的遗传密码简并性制备其它的DNA和相应的RNA序列(核酸),它们编码相同的融合蛋白氨基酸残基序列,但与前述基因序列足够不同以至于两个序列不以高严紧型杂交,但可以中等严紧型杂交。
高严紧型条件可定义为包括在温度约50°-55℃下在6XSSC中的杂交,以及在温度68℃下在1-3XSSC中的最终洗涤。中等严紧条件包括在温度约50℃至65℃下在0.2至0.3M NaCl中的杂交,以及随后在温度约50℃至55℃下在0.2X SSC和0.1%SDS(十二烷基硫酸钠)中的洗涤。
本发明还关注本身编码或其互补物编码包含蛋白体诱导序列(PBIS)和感兴趣多肽的核酸序列(DNA序列或RNA序列)。众所周知,当诸如所关注核酸序列的核酸序列可操作地连接到本文其它地方所述的适合的表达体系中的适合的启动子时,该序列就可表达。
不同的宿主常常偏爱特定的密码子用于编码特定的氨基酸残基。这种密码子偏爱是熟知的,编码所期望融合蛋白序列的DNA序列可以改变,例如应用体外突变,可使得待表达融合蛋白的特定宿主利用宿主偏爱的密码子。
本发明还关注包含载体的诸如DNA分子的重组核酸分子,所述载体包含适于在适合的真核宿主细胞生物体中启动基因表达的诸如启动子的一个或多个调控序列(控制元件),该调控序列可操作地连接到确定编码所关注的融合蛋白的基因的外源核酸片段(例如DNA片段或序列),如上所述。更具体地,还关注包含载体的重组DNA分子,所述载体包含适于在宿主生物体细胞中启动融合蛋白表达的启动子,该启动子可操作地连接到确定编码连接到感兴趣多肽的蛋白体诱导序列(PBIS)的DNA片段。在宿主真核细胞中适当转染和表达后,该重组DNA分子以RPBLA提供所关注的融合蛋白。
本领域众所周知,只要存在所需的核酸(例如DNA序列)(包括起始和终止信号),那么其它的碱基对通常可存在于该DNA片段的任一端,并且该片段仍可被用于表达蛋白。由此可以认为如果在所述片段中缺乏抑制表达的可操作连接的DNA序列,就可表达耗费所期望表达的融合蛋白的其它产物、表达耗费由期望的融合蛋白产生的期望反应产物的产物,或者要不然就干扰该DNA片段表达该基因。
因此,只要所述DNA片段没有这些干扰DNA的序列,本发明的DNA片段约为500至15,000碱基对长度。如果需要,一旦复制和表达所需的所有最小的DNA序列存在时,重组DNA分子,特别是表达载体的最大尺寸大多情况下由便利性和宿主细胞所容纳的载体尺寸来确定。最小载体尺寸是熟知的。这些长的DNA片段不是优选的,但可以使用。
可通过化学方法合成编码前述融合蛋白的DNA片段,例如Matteucci et al.(1981)J.Am.Chem.Soc.,103:3185中的磷酸三酯方法。当然,通过化学合成编码序列,通过适合的碱基置换编码天然氨基酸残基序列的那些碱基可容易地实现任意期望的修改。然而,优选包含本文具体讨论的序列的DNA片段。
包含编码融合蛋白的基因的DNA片段优选从包含该基因的重组DNA分子(质粒载体)获得。在宿主细胞中指导表达融合蛋白基因的载体在本文称为“表达载体”。
表达载体包含包括启动子在内的表达控制元件。融合蛋白编码基因可操作地连接到表达载体,使得启动子序列指导RNA聚合酶结合并表达融合蛋白编码基因。可用于表达多肽编码基因的启动子是那些可诱导的、病毒的、合成的、组成型的启动子,如Poszkowski et al.(1989)EMBO J.,3:2719和Odell et al.(1985)Nature,313:810中所述,以及可时间上调节、空间上调节以及时空上调节的启动子,如Chua et al.(1989)Science,244:174-181中所述。
本发明关注适合于真核细胞的表达载体,如适合于酵母细胞的表达载体或适合于哺乳动物、藻类或昆虫等的细胞的表达载体。这些表达载体还可用于形成本发明的重组DNA分子。用于诸如S.cerivisiae或Pichia pastoris的酵母中的载体可以是游离基因的或是整合的,这是众所周知的。真核细胞表达载体在本领域是熟知的,并且可从一些商业来源获得。通常,这些载体包含一个或多个方便的限制性位点以插入所期望的DNA片段和启动子序列。任选地,这些载体包含特意用于真核细胞的选择性标记。用于S.cerivisiae中的示例性启动子包括S.cerevisiae磷酸甘油酸激酶(PGK)启动子和异向启动子(divergentpromoters)GAL 10和GAL 1,然而醇氧化酶基因(AOX1)是Pichiapastoris的有用的启动子。下文显示了在S.cerivisiae和Pichia pastoris中示例性地表达融合蛋白。
下文示例性地说明了在哺乳动物细胞中通过表达重组DNA产生融合蛋白,其中采用了在中国仓鼠卵巢(CHO)宿主细胞、Cos1猴宿主和人293T宿主细胞中表达融合蛋白基因的重组DNA载体。这通过采用本领域熟知的方法来完成,详细描述见于Sambrook et al., Molecular Clonine:A Laboratory Manual(分子克隆:实验室手册),2nd ed.,ColdSpring Harbor Laboratories(1989)。
昆虫细胞体系也可用于表达所关注的融合蛋白。例如,在一个这样的体系中,将苜蓿尺蠖核型多角体病毒(AcNPV)或杆状病毒作为载体在草地贪夜蛾(Spodoptera frugiperda)细胞或粉蚊夜蛾(Trichoplusia)幼虫中表达外源基因。可将编码融合蛋白的序列克隆到病毒的诸如多角体蛋白基因的非必需区域,并放置在调控多角体蛋白启动子之后。成功地插入融合蛋白序列致使多角体蛋白基因失活,产生缺乏外壳蛋白的重组病毒。重组病毒随后可用于例如感染S.frugiperda细胞或粉蚊夜蛾幼虫,在这些细胞中就可表达融合蛋白。E.Engelhard et al.(1994)Proc.Natl.Acad.Sci.,USA,91:3224-3227;以及V.Luckow,Insect CellExpression Technology(昆虫细胞表达技术),pp.183-218, Protein Engineering:Principles and Practice(蛋白质工程:原理和实践),J.L.Cleland et al.eds.,Wiley-Liss,Inc,1996)。在感染的晚期阶段通常高水平表达位于苜蓿尺蠖核型多角体病毒(AcNPV)的多角体蛋白启动子控制下的异源基因。
采用商业上以Bac-To-Bac杆状病毒表达体系(Life Technologies)销售的杆状病毒穿梭载体体系构建包含融合蛋白基因的重组杆状病毒(Luckow et al.(1993)J.Virol.,67:4566-4579)。制备原种重组病毒,通过标准方法检测重组蛋白的表达(O′Reilly et al., Baculovirus Expression Vectors:A Laboratory Manual(杆状病毒表达载体:实验室手册),W.H.Freeman and Company,New York,1992;以及King et al., The Baculovirus Expression System:A Laboratorv Guide (杆状病毒表达体系:实验室指南),Chapman & Hall,London,1992)。
选择哪种表达载体以及融合蛋白编码基因最终可操作地连接到哪种启动子上直接决定于所期望的功能特性(例如蛋白表达的位置和时间)和被转化的宿主细胞。这些是本领域构建重组DNA分子公知的固有限制。然而,用于实施本发明的载体可指导复制,优选还指导包括在DNA片段内并与其可操作地连接的融合蛋白基因的表达(对于表达载体)。
通过用于生物化学或生物学回收的常规方法从表达宿主细胞中获得表达的RPBLA及其融合蛋白。由于RPBLA相对于存在于宿主细胞中的其他蛋白是密集的,因此RPBLA尤其适于通过离心细胞匀浆物进行收集。通过在包含诸如2-巯基乙醇的还原剂的缓冲液中溶解环绕的膜从收集的RPBLA中获得融合蛋白。
无需进一步详细描述,可相信本领域技术人员采用前面的叙述以及以下详细的实施例可最大程度实现本发明。因此,以下优选的具体实施方案仅作为示例性的解释,并不以任何方式对公开内容其余部分的限制。
实施例1:融合蛋白在转化的哺乳动物细胞中的积聚
将对应于成熟降钙素(Ct)和EGF序列以及编码hGH序列的cDNA的合成基因融合到N末端γ-玉米蛋白编码序列RX3(WO2004003207)上,并引入载体pcDNA3.1(Invitrogen)中获得构建体p3.1RX3Ct、p3.1RX3EGF和p3.1RX3hGH。通过基于lipofectamine的转染方法(Invitrogen)将这些编码融合蛋白RX3-Ct、RX3-EGF和RX3-hGH的构建体引入293T、Cos1和CHO哺乳动物培养细胞中。将质粒pECFP-N1(Clontech)转染的293T和Cos1细胞作为对照,该质粒pECFP-N1包含增强型绿色荧光修饰的GFP的基因序列。
采用针对γ-玉米蛋白产生的抗体通过Western印迹分析在瞬时转染的细胞中融合蛋白的积聚。转染44小时后,用缓冲液A(100mMTris-HCl pH 8.0,150mM NaCl,5mM EDTA,0.5%SDS,0.5%TritonX-100,2%2-巯基乙醇和蛋白酶抑制剂)提取全部可溶蛋白。将等份的细胞孵育介质沉淀并保存在-20℃。用SDS聚丙烯酰胺凝胶电泳分离从等量的转染的细胞中提取的蛋白,并将其转移到硝基纤维膜上。
从图1描述的结果中可以看出所分析的RX3-Ct、RX3-EGF和RX3-hGH三种融合蛋白可非常有效地积聚,与所选择表达的培养细胞类型无关:比较在293T和CHO培养细胞中积聚的RX3-hGH图和在CHO和Cos1细胞中积聚的RX3-EGF图。在对应于转染细胞的蛋白提取物中观察到融合蛋白(道c),而在细胞培养介质中发现没有免疫反应带(道m)。这些观察数据提示RX3结构域能够在内膜区室中组装并保留融合蛋白。
这些结果说明了RX3衍生的融合蛋白如何在所分析的三种类型的哺乳动物细胞(人293T细胞、猴Cos1细胞和仓鼠CHO细胞)中的内膜体系中组装和积聚,提示通过与RX3结构域融合可在任何所选择的哺乳动物细胞或有机体中实现所期望蛋白的有效积聚。实施例2:在转化的哺乳动物细胞中融合蛋白的亚细胞定位
在确定N末端γ-玉米蛋白序列RX3是否能诱导哺乳动物细胞中的重组蛋白体样组装体时,采用共焦显微镜法通过免疫细胞化学分析了RX3-Ct和RX3-EGF融合蛋白的定位。将转染的细胞在3.7%多聚甲醛中固定10分钟,用磷酸盐缓冲液洗涤后,将其与γ-玉米蛋白抗血清(稀释度1/700)一起孵育1小时。非免疫血清作为对照。采用偶联到Alexa Fluor 488或Alexa Fluor 555染料(Molecular Probes)的抗兔抗体检测初级抗体。
采用装有可选择发射带波长的分光光度计的共聚焦激光扫描显微镜(Leica TCS SP,Heidelberg,Germany)可获得转染细胞的显微照片。采用495-535nm的发射窗口,用氩离子激光器在488nm激发获得绿色荧光图像。用HeNe激光器在543nm激发后采用550-600的发射窗口获得红色荧光图像。光学切片厚度为0.5μm。采用共聚焦显微镜软件记录数字图像和影像。
图2显示了p3.1Ct和p3.1RX3EGF转染细胞的共聚焦影像。如图所示,在内质网(ER,图2A中的箭头)中发现了对应的融合蛋白RX3-Ct和RX3EGF,表明了γ-玉米蛋白信号肽在哺乳动物细胞中具有功能,其中它介导了融合蛋白转移进ER。作为对照的与非免疫血清一起孵育的样品没有显示出任何显著的荧光(未示出)。
值得注意的是融合蛋白令人惊讶地优先积聚在明显被膜环绕的大斑点中(见图2A中的插图)。这些结构在非转染的细胞中不存在,其大小与植物蛋白体相似,直径约1微米(A和C中的插图)。这些结果令人惊讶,不仅在于动物细胞可再现植物中描述的PB贮藏细胞器的事实,而且还在于在所有转染的细胞中观察到大量的RPBLA,表明了这些细胞的有效积聚能力。另外,不同的转染细胞类型显示了类似的融合蛋白定位和积聚模式(见图2A、2B和2D),这种模式显示与融合到PBIS的目标无关(图2B和2C)。
将细胞用包含荧光蛋白序列的质粒pDsRed2-ER(Clontech)共转染,以分析诱导的PBLS的亚细胞起源,所述荧光蛋白可用作ER标记。有趣的是,如图2D、2E和2F中所看到的,RX3-Ct和ER标记共定位在ER和PB样组装体中,表明了哺乳动物细胞中诱导的RPBLA的ER起源,如同在植物细胞中发生的。
实施例3:在转化的酵母细胞中融合蛋白的积聚
将编码EGF和hGH的序列融合到N末端γ-玉米蛋白编码序列RX3(WO2004003207),并将其引入到载体pYX243(R&D体系)中获得构建体c117和c118。将编码融合蛋白RX3-EGF和RX-hGH的这些构建体引入到Saccharomyces cerevisiae(酿酒酵母)中。
通过在含有半乳糖的培养基中培育转化体进行表达分析,采用针对重组表达蛋白的特异性抗体通过SDS-PAGE和免疫印迹分析等量的细胞和培养基。如图3A所示,RX3-EGF(道c117)和RX3-hGH(道c118)融合蛋白都在酵母细胞中积聚,在培养基中几乎没有发现蛋白。
还在用构建体c135和c121(编码融合的RX3-hGH蛋白)和c136(编码hGH蛋白,见图3B中的示意图)转化的酵母Pichia pastoris中研究了hGH和hGH衍生的融合蛋白的积聚。选择积聚最高水平重组蛋白的转化体。
用两种不同的信号肽表达融合蛋白:γ-玉米蛋白信号肽(图3B,SPg)和酵母α因子前体肽原(图3B,Afprepro)。此外,也分析了通过采用直接融合到hGH的酵母α因子前体肽原的分泌控制(图3B,c136)。采用在兔中产生针对hGH的特异性抗体通过Western印迹分析来自细胞和培养基的总蛋白。
如所预料的,当采用Afprepro肽时,hGH被分泌到培养基中(图3B,道c136/m)。与此相反,融合蛋白RX3-hGH积聚在酵母细胞中,与所采用的信号肽无关。如图3B所示,在以下两种情况下,即当采用酵母Afprepro肽(道c135/y)时和当采用γ-玉米蛋白信号肽(道c121/y)时,融合蛋白在细胞内,在培养基中几乎没有发现蛋白(未示出)。因此,γ-玉米蛋白的N末端富集脯氨酸的结构域足以介导蛋白保留在酵母细胞的内膜区室中,更具体地在对应于可通过离心分离的PB样结构的密集部分。
在Saccharomyces cerevisiae和Pichia pastoris中获得的结果是不同于植物界和动物界的其他真核生物体的实例,其中包含种子贮藏蛋白的融合蛋白在PB样结构中有效组装和积聚。
实验方法
用于哺乳动物转染的质粒构建体
按之前的描述(专利申请WO2004003207)获得对应于成熟降钙素序列(Ct)的合成基因。
采用约60个碱基的4个寡核苷酸(20个重叠碱基)通过引物重叠延伸PCR方法获得编码活性hEGF的53个氨基酸的合成基因。合成的hEGF cDNA包括对应于因子Xa特异性切割位点的5’接头序列。通过聚丙烯酰胺变性凝胶纯化寡核苷酸(EGF1 SEQ ID NO:25;EGF2 SEQID NO:26;EGF3 SEQ ID NO:27;EGF4 SEQ ID NO:28)。
采用寡核苷酸GH5(SEQ ID NO:29)和GH3(SEQ ID NO:30)通过PCR从人垂体腺的cDNA(Clontech,BDBiosciences)获得编码人生长激素(hGH)的191个氨基酸的cDNA序列,其包含对应于肠激酶切割位点的序列。
将对应于成熟降钙素(Ct,WO2004003207)和hEGF序列的合成基因以及编码hGH的cDNA融合到RX3 N末端γ-玉米蛋白编码序列(专利WO2004003207),并将其引入到pUC18中。将来自pUC18衍生质粒pUC18RX3Ct、pUC18RX3EGF和pUC18RX3gHG(包含对应的融合蛋白RX3-Ct、RX3-EGF和RX3-hGH序列)的SalI-BamHI限制性片段引入经Xho I-Bam HI限制性酶切的载体pcDNA3.1-(Invitrogen)中。在得到的命名为p3.1RX3CT、p3.1RX3EGF和p3.1RX3hGH的构建体中,融合蛋白序列置于CMV启动子和终止子pA BGH控制之下。
用于酵母转化的质粒构建体
宿主菌株和载体:
采用载体pYX243(GAL启动子、LEU2、AmpR,来自R&D System)衍生的构建体转化Saccharomyces cerevisiae菌株(基因型Mata his3leu2 met15 ura3 bar1:: URA3)。Pichia pastoris菌株GS115(his4)以及载体pPIC9和pPIC3.5K(AOX1启动子,HIS4,AmpR)来自Invitrogen lifetech.。
质粒构建体:
将来自上述pUC18衍生的质粒pUC18RX3EGF和pUC18RX3hGH(包含对应的融合蛋白RX3-EGF和RX3-hGH)的Sal I(平末端)-Bam HI限制性片段引入经EcoRI(平末端)-Bam HI限制性切割的载体pYX243(R&D System)中。在得到的分别命名为c117和c118的构建体中,融合蛋白序列置于可诱导GAL启动子控制之下。
将来自pUC18衍生的质粒pUC18RX3EGF和pUC18RX3hGH的SalI(平末端)-Bam HI(平末端)限制性片段引入经NotI(平末端)-EcoRI(平末端)限制性切割的载体pPIC3.5K(Invitrogen)中,获得质粒c120和c121以转化Pichia pastoris。
质粒pPIC9(Invitrogen)用于分析采用酵母信号肽Saccharomyces的α前体肽原的融合蛋白表达。采用pUC18RX3hGH作为模板和寡核苷酸af06(SEQ ID NO:31)、afRX(SEQ ID NO:32)和06Not(SEQ IDNO:33)通过PCR获得编码RX3-hGH和hGH蛋白的XhoI-NotI之间的序列。
这些序列包含编码有效切割α前体肽原所必需的位点KEX2的序列(Invitrogen,Pichia表达试剂盒)。将该PCR产物克隆进经XhoI-NotI限制性切割的pPIC9中,获得分别包含融合到α因子前体肽原的RX3-hGH和hGH蛋白序列的质粒c135和c136。
酵母转化
采用质粒构建体c117和c118通过LiAc方法(Ito et al.1983,J.Bacteriol.153:163-168)转化Saccharomyces cerevisiae菌株(leu2),在Leu-平板中选择转化体。在包含半乳糖的培养基(demanar composició..)中培育转化体进行表达分析。
采用SacI线形化的c120和c121质粒通过Pichia EasyComp试剂盒(Invitrogen life tech.)转化Pichiapastoris菌株GS115(his4),并在RDBHis-培养基中平板培养。通过将克隆在MD和MM琼脂平板上划线确定Mut表型。通过在YPD培养基中培养转化体两天进行表达试验。其后,沉淀细胞,在MM培养基中再悬浮48小时,每24小时加入甲醇至终浓度为0.5%。选择积聚最高水平重组蛋白的转化体。培养基的制法如Invitrogen(Pichia表达试剂盒)所描述的。
酵母蛋白提取和Western印迹
沉淀S.cerevisiae和P.pastoris表达的重组融合蛋白。沉淀等份的各个孵育培养基并保存在-20℃用于分析。还将细胞沉淀冷冻,融化后,采用玻璃珠和培养基H(50mM HCl-Tris pH 8.0、150mM NaCl、5mMEDTA、200mM DTT和蛋白酶抑制剂)通过标准方法破碎细胞。采用针对重组表达蛋白的特异性抗体通过SDS-PAGE和免疫印迹分析等量的细胞和培养基。
通过参考将本文引用的各个专利和文章并入。本文中使用“a”或“an”旨在包括一个或多个。
前面的叙述和实施例旨在作为示例性的而不应视为限定性的。在本发明本质和范围内还可做出其他的变化,这些变化对本领域技术人员是不言自明的。
序列表
<110>ERA生命技术公司
<120>蛋白的生产
<130>P1350PC
<160>33
<170>PatentIn version 3.3
<210>1
<211>6
<212>PRT
<213>人工序列
<220>
<223>重复结构域六肽
<400>1
Pro Pro Pro Val His Leu
1               5
<210>2
<211>53
<212>PRT
<213>人工序列
<220>
<223>RX3查询氨基酸序列
<400>2
Pro Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro
1               5                   10                  15
Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro
            20                  25                  30
Pro Pro Val His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His
        35                  40                  45
Leu Pro Pro Pro Pro
    50
<210>3
<211>65
<212>PRT
<213>人工序列
<220>
<223>α玉米蛋白氨基酸序列
<400>3
Gln Gln Gln Gln Gln Phe Leu Pro Ala Leu Ser Gln Leu Asp Val Val
1               5                   10                  15
Asn Pro Val Ala Tyr Leu Gln Gln Gln Leu Leu Ala Ser Asn Pro Leu
            20                  25                  30
Ala Leu Ala Asn Val Ala Ala Tyr Gln Gln Gln Gln Gln Leu Gln Gln
        35                  40                  45
Phe Leu Pro Ala Leu Ser Gln Leu Ala Met Val Asn Pro Ala Ala Tyr
    50                  55                  60
Leu
65
<210>4
<211>70
<212>PRT
<213>人工序列
<220>
<223>稻米醇溶谷蛋白查询氨基酸序列
<400>4
Gln Gln Val Leu Ser Pro Tyr Asn Glu Phe Val Arg Gln Gln Tyr Gly
1               5                   10                  15
Ile Ala Ala Ser Pro Phe Leu Gln Ser Ala Thr Phe Gln Leu Arg Asn
            20                  25                  30
Asn Gln Val Trp Gln Gln Leu Ala Leu Val Ala Gln Gln Ser His Cys
        35                  40                  45
Gln Asp Ile Asn Ile Val Gln Ala Ile Ala Gln Gln Leu Gln Leu Gln
    50                  55                  60
Gln Phe Gly Asp Leu Tyr
65                  70
<210>5
<211>672
<212>DNA
<213>玉米
<400>5
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg    60
catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctacc gccgccggtg    120
catctgccac ctccggttca cctgccacct ccggtgcatc tcccaccgcc ggtccacctg    180
ccgccgccgg tccacctgcc accgccggtc catgtgccgc cgccggttca tctgccgccg    240
ccaccatgcc actaccctac tcaaccgccc cggcctcagc ctcatcccca gccacaccca    300
tgcccgtgcc aacagccgca tccaagcccg tgccagctgc agggaacctg cggcgttggc    360
agcaccccga tcctgggcca gtgcgtcgag tttctgaggc atcagtgcag cccgacggcg    420
acgccctact gctcgcctca gtgccagtcg ttgcggcagc agtgttgcca gcagctcagg    480
caggtggagc cgcagcaccg gtaccaggcg atcttcggct tggtcctcca gtccatcctg    540
cagcagcagc cgcaaagcgg ccaggtcgcg gggctgttgg cggcgcagat agcgcagcaa    600
ctgacggcga tgtgcggcct gcagcagccg actccatgcc cctacgctgc tgccggcggt    660
gtcccccacg cc                                                        672
<210>6
<211>224
<212>PRT
<213>玉米
<400>6
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro
            20                  25                  30
Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu
        35                  40                  45
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
    50                  55                  60
His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu Pro Pro
65                  70                  75                  80
Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro
                85                  90                  95
Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
             100                 105                110
Leu Gln Gly Thr Cys Gly Val Gly Ser Thr Pro Ile Leu Gly Gln Cys
        115                 120                 125
Val Glu Phe Leu Arg His Gln Cys Ser Pro Thr Ala Thr Pro Tyr Cys
    130                 135                 140
Ser Pro Gln Cys Gln Ser Leu Arg Gln Gln Cys Cys Gln Gln Leu Arg
145                 150                 155                 160
Gln Val Glu Pro Gln His Arg Tyr Gln Ala Ile Phe Gly Leu Val Leu
                165                 170                 175
Gln Ser Ile Leu Gln Gln Gln Pro Gln Ser Gly Gln Val Ala Gly Leu
            180                 185                 190
Leu Ala Ala Gln Ile Ala Gln Gln Leu Thr Ala Met Cys Gly Leu Gln
        195                 200                 205
Gln Pro Thr Pro Cys Pro Tyr Ala Ala Ala Gly Gly Val Pro His Ala
    210                 215                 220
<210>7
<211>339
<212>DNA
<213>人工序列
<220>
<223>RX3 DNA序列
<400>7
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg     60
catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctacc gccgccggtg    120
catctgccac ctccggttca cctgccacct ccggtgcatc tcccaccgcc ggtccacctg    180
ccgccgccgg tccacctgcc accgccggtc catgtgccgc cgccggttca tctgccgccg    240
ccaccatgcc actaccctac tcaaccgccc cggcctcagc ctcatcccca gccacaccca    300
tgcccgtgcc aacagccgca tccaagcccg tgccagacc                           339
<210>8
<211>113
<212>PRT
<213>人工序列
<220>
<223>RX3氨基酸
<400>8
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro
            20                  25                  30
Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu
        35                  40                  45
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
    50                  55                  60
His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu Pro Pro
65                  70                  75                  80
Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro
                85                  90                  95
Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln
            100                 105                 110
Tyr
<210>9
<211>240
<212>DNA
<213>人工序列
<220>
<223>R3 DNA
<400>9
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg     60
catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctacc gccgccggtg    120
catctgccac ctccggttca cctgccacct ccggtgcatc tcccaccgcc ggtccacctg    180
ccgccgccgg tccacctgcc accgccggtc catgtgccgc cgccggttca tctgccgccg    240
<210>10
<211>92
<212>PRT
<213>人工序列
<220>
<223>人工序列
<400>10
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro
            20                  25                  30
Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu
        35                  40                  45
Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val
    50                  55                  60
His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu Pro Pro
65                  70                  75                  80
Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Tyr
                85                  90
<210>11
<211>213
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>11
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg     60
catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctgcc gccgccacca    120
tgccactacc ctacacaacc gccccggcct cagcctcatc cccagccaca cccatgcccg    180
tgccaacagc cgcatccaag cccgtgccag acc                                 213
<210>12
<211>71
<212>PRT
<213>人工序列
<220>
<223>人工序列
<400>12
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro
             20                 25                  30
Pro Val His Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro
        35                  40                  45
Arg Pro Gln Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro
    50                  55                  60
His Pro Ser Pro Cys Gln Tyr
65                  70
<210>13
<211>180
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>13
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg     60
catacaagcg gcggctgcgg ctgccaatgc cactacccta ctcaaccgcc ccggcctcag    120
cctcatcccc agccacaccc atgcccgtgc caacagccgc atccaagccc gtgccagacc    180
<210>14
<211>60
<212>PRT
<213>人工序列
<220>
<223>人工序列
<400>14
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Cys His Tyr
            20                  25                  30
Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His Pro Cys
        35                  40                  45
Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln Tyr
    50                  55                  60
<210>15
<211>150
<212>PRT
<213>人工序列
<220>
<223>人工序列
<400>15
Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Ser
1               5                   10                  15
Ala Ser Ala Gln Phe Asp Val Leu Gly Gln Ser Tyr Arg Gln Tyr Gln
            20                  25                  30
Leu Gln Ser Pro Val Leu Leu Gln Gln Gln Val Leu Ser Pro Tyr Asn
        35                  40                  45
Glu Phe Val Arg Gln Gln Tyr Gly Ile Ala Ala Ser Pro Phe Leu Gln
    50                  55                  60
Ser Ala Thr Phe Gln Leu Arg Asn Asn Gln Val Trp Gln Gln Leu Ala
65                  70                  75                  80
Leu Val Ala Gln Gln Ser His Cys Gln Asp Ile Asn Ile Val Gln Ala
                85                  90                  95
Ile Ala Gln Gln Leu Gln Leu Gln Gln Phe Gly Asp Leu Tyr Phe Asp
            100                 105                 110
Arg Asn Leu Ala Gln Ala Gln Ala Leu Leu Ala Phe Asn Val Pro Ser
        115                 120                 125
Arg Tyr Gly Ile Tyr Pro Arg Tyr Tyr Gly Ala Pro Ser Thr Ile Thr
    130                 135                 140
Thr Leu Gly Gly Val Leu
145                 150
<210>16
<211>450
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>16
atgaagatca ttttcgtctt tgctctcctt gctattgctg catgcagcgc ctctgcgcag     60
tttgatgttt taggtcaaag ttataggcaa tatcagctgc agtcgcctgt cctgctacag    120
caacaggtgc ttagcccata taatgagttc gtaaggcagc agtatggcat agcggcaagc    180
cccttcttgc aatcagctac gtttcaactg agaaacaacc aagtctggca acagctcgcg    240
ctggtggcgc aacaatctca ctgtcaggac attaacattg ttcaggccat agcgcagcag    300
ctacaactcc agcagtttgg tgatctctac tttgatcgga atctggctca agctcaagct    360
ctgttggctt ttaacgtgcc atctagatat ggtatctacc ctaggtacta tggtgcaccc    420
agtaccatta ccacccttgg cggtgtcttg                         450
<210>17
<211>144
<212>PRT
<213>人工序列
<220>
<223>人工序列
<400>17
Met Ala Thr Lys Ile Leu Ala Leu Leu Ala Leu Leu Ala Leu Phe Val
1                5                  10                  15
Ser Ala Thr Asn Ala Phe Ile Ile Pro Gln Cys Ser Leu Ala Pro Ser
            20                  25                  30
Ala Ile Ile Pro Gln Phe Leu Pro Pro Val Thr Ser Met Gly Phe Glu
        35                  40                  45
His Leu Ala Val Gln Ala Tyr Arg Leu Gln Gln Ala Leu Ala Ala Ser
    50                  55                  60
Val Leu Gln Gln Pro Ile Asn Gln Leu Gln Gln Gln Ser Leu Ala His
65                  70                  75                  80
Leu Thr Ile Gln Thr Ile Ala Thr Gln Gln Gln Gln Gln Phe Leu Pro
                85                  90                  95
Ala Leu Ser Gln Leu Asp Val Val Asn Pro Val Ala Tyr Leu Gln Gln
            100                 105                 110
Gln Leu Leu Ala Ser Asn Pro Leu Ala Leu Ala Asn Val Ala Ala Tyr
        115                 120                 125
Gln Gln Gln Gln Gln Leu Gln Gln Phe Leu Pro Ala Leu Ser Gln Leu
    130                 135                 140
<210>18
<211>432
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>18
atggctacca agatattagc cctccttgcg cttcttgccc tttttgtgag cgcaacaaat    60
gcgttcatta ttccacaatg ctcacttgct cctagtgcca ttataccaca gttcctccca   120
ccagttactt caatgggctt cgaacaccta gctgtgcaag cctacaggct acaacaagcg    180
cttgcggcaa gcgtcttaca acaaccaatt aaccaattgc aacaacaatc cttggcacat    240
ctaaccatac aaaccatcgc aacgcaacag caacaacagt tcctaccagc actgagccaa    300
ctagatgtgg tgaaccctgt cgcctacttg caacagcagc tgcttgcatc caacccactt    360
gctctggcaa acgtagctgc ataccaacaa caacaacaat tgcagcagtt tctgccagcg    420
ctcagtcaac ta                                                        432
<210>19
<211>34
<212>PRT
<213>鲑鱼
<400>19
Lys Cys Ser Asn Leu Ser Thr Cys Val Leu Gly Lys Leu Ser Gln Glu
1               5                   10                  15
Leu His Lys Leu Gln Thr Tyr Pro Arg Thr Asn Thr Gly Ser Gly Thr
            20                  25                  30
Pro Gly
<210>20
<211>102
<212>DNA
<213>鲑鱼
<400>20
aagtgctcca acctctctac ctgcgttctt ggtaagctct ctcaggagct  tcacaagctc    60
cagacttacc ctagaaccaa cactggttcc ggtacccctg gt                       102
<210>21
<211>53
<212>PRT
<213>人工序列
<220>
<223>人工序列
<400>21
Asn Ser Asp Ser Glu Cys Pro Leu Ser His Asp Gly Tyr Cys Leu His
1               5                   10                  15
Asp Gly Val Cys Met Tyr Ile Glu Ala Leu Asp Lys Tyr Ala Cys Asn
            20                  25                  30
Cys Val Val Gly TyrIle Gly Glu Arg Cys Gln Tyr Arg Asp Leu Lys
        35                 40                  45
Trp Trp Glu Leu Arg
    50
<210>22
<211>162
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>22
aactctgatt cagaatgccc actcagtcac gacggatatt gtcttcacga tggggtatgc      60
atgtacatcg aggccttgga caagtacgca tgtaattgtg tagtgggata cattggtgaa     120
cgctgtcagt atcgagactt gaaatggtgg gagcttaggt ga                        162
<210>23
<211>191
<212>PRT
<213>人工序列
<220>
<223>hGH蛋白
<400>23
Phe Pro Thr Ile Pro Leu Ser Arg Leu Phe Asp Asn Ala Met Leu Arg
1               5                   10                  15
Ala His Arg Leu His Gln Leu Ala Phe Asp Thr Tyr Gln Glu Phe Glu
            20                  25                  30
Glu Ala Tyr Ile Pro Lys Glu Gln Lys Tyr Ser Phe Leu Gln Asn Pro
        35                  40                  45
Gln Thr Ser Leu Cys Phe Ser Glu Ser Ile Pro Thr Pro Ser Asn Arg
    50                  55                  60
Glu Glu Thr Gln Gln Lys Ser Asn Leu Glu Leu Leu Arg Ile Ser Leu
65                  70                  75                  80
Leu Leu Ile Gln Ser Trp Leu Glu Pro Val Gln Phe Leu Arg Ser Val
                85                  90                  95
Phe Ala Asn Ser Leu Val Tyr Gly Ala Ser Asp Ser Asn Val Tyr Asp
            100                 105                 110
Leu Leu Lys Asp Leu Glu Glu Gly Ile Gln Thr Leu Met Gly Arg Leu
        115                 120                 125
Glu Asp Gly Ser Pro Arg Thr Gly Gln Ile Phe Lys Gln Thr Tyr Ser
    130                 135                 140
Lys Phe Asp Thr Asn Ser His Asn Asp Asp Ala Leu Leu Lys Asn Tyr
145                 150                 155                 160
Gly Leu Leu Tyr Cys Phe Arg Lys Asp Met Asp Lys Val Glu Thr Phe
                165                 170                 175
Leu Arg Ile Val Gln Cys Arg Ser Val Glu Gly Ser Cys Gly Phe
            180                 185                 190
<210>24
<211>576
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>24
ttcccaacca ttcccttatc caggcttttt gacaacgcta tgctccgcgc ccatcgtctg     60
caccagctgg cctttgacac ctaccaggag tttgaagaag cctatatccc aaaggaacag    120
aagtattcat tcctgcagaa cccccagacc tccctctgtt tctcagagtc tattccgaca    180
ccctccaaca gggaggaaac acaacagaaa tccaacctag agctgctccg catctccctg    240
ctgctcatcc agtcgtggct ggagcccgtg cagttcctca ggagtgtctt cgccaacagc    300
ctggtgtacg gcgcctctga cagcaacgtc tatgacctcc taaaggacct agaggaaggc    360
atccaaacgc tgatggggag gctggaagat ggcagccccc ggactgggca gatcttcaag    420
cagacctaca gcaagttcga cacaaactca cacaacgatg acgcactact caagaactac    480
gggctgctct actgcttcag gaaggacatg gacaaggtcg agacattcct gcgcatcgtg    540
cagtgccgct ctgtggaggg cagctgtggc ttctga                              576
<210>25
<211>64
<212>DNA
<213>人工序列
<220>
<223>EFG1 DNA序列
<400>25
catgccatgg gaattgaggg taggaactct gattcagaat gcccactcag tcacgacgga  60
tatt                                                               64
<210>26
<211>65
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>26
acttgtccaa ggcctcgatg tacatgcata ccccatcgtg aagacaatat ccgtcgtgac  60
tgagt                                                              65
<210>27
<211>65
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>27
catcgaggcc ttggacaagt acgcatgtaa ttgtgtagtg ggatacattg gtgaacgctg  60
tcagt                                                              65
<210>28
<211>65
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>28
tcaggatcct tatcacctaa gctcccacca tttcaagtct cgatactgac agcgttcacc  60
aatgt                                                              65
<210>29
<211>44
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>29
gtccatggac gacgatgata agttcccaac cattccctta tcca                   44
<210>30
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>30
tcaggatcct  tatcagaagc  cacagctgcc  ctcca    35
<210>31
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>31
gctctcgaga aaagattccc  aaccattccc  ttatcc    36
<210>32
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>32
gctctcgaga aaagaacgca tacaagcggc ggctgc      36
<210>33
<211>33
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>33
cttcgcggcc gcttatcaga agccacagct gcc         33

Claims (20)

1.在重组蛋白体样组装体(RPBLA)中包含重组融合蛋白的非高等植物真核宿主细胞,所述融合蛋白包含连接在一起的两个序列,其中一个序列为异源于所述宿主细胞的蛋白体诱导序列,另一个序列为感兴趣产物的序列。
2.如权利要求1所述的宿主细胞,其中所述RPBLA的密度为约1.1至1.35g/ml。
3.如权利要求1所述的宿主细胞,其中所述融合蛋白还包含所述蛋白体诱导序列和所述感兴趣产物的序列之间的接头序列。
4.如权利要求1所述的宿主细胞,其中所述蛋白体诱导序列包括醇溶谷蛋白或修饰的醇溶谷蛋白。
5.如权利要求4所述的宿主细胞,其中所述蛋白体诱导序列为醇溶谷蛋白序列。
6.如权利要求5所述的宿主细胞,其中所述醇溶谷蛋白序列为γ-玉米蛋白、α-玉米蛋白或稻米醇溶谷蛋白。
7.生产融合蛋白的方法,包括如下步骤:
(a)用包含可操作地同框连接到(ii)第二核酸序列的(i)第一核酸序列的核酸序列转化非高等植物真核宿主细胞,其中所述第一核酸序列编码蛋白体诱导序列(PBIS),所述第二核酸序列包含编码感兴趣多肽产物的核酸序列;以及
(b)在适合所述融合蛋白表达和所述表达的融合蛋白组装进重组蛋白体样组装体(RPBLA)的培养条件下维持转化的宿主细胞一段时间。
8.如权利要求7所述的方法,其中所述第一核酸序列(i)的3’端连接到所述第二核酸序列(ii)的5’端。
9.如权利要求7所述的方法,其中所述核酸编码所述PBIS和感兴趣多肽产物之间的接头序列。
10.如权利要求7所述的方法,其中所述宿主细胞为真菌细胞,尤其是酵母细胞。
11.如权利要求7所述的方法,其中所述宿主细胞为藻类细胞。
12.如权利要求7所述的方法,其中所述宿主细胞为动物细胞,尤其是哺乳动物细胞。
13.如权利要求7所述的方法,还包括回收所述表达的融合蛋白的步骤。
14.如权利要求7所述的方法,其中所述蛋白体诱导序列包括醇溶谷蛋白或修饰的醇溶谷蛋白。
15.如权利要求14所述的方法,其中所述醇溶谷蛋白序列为修饰的醇溶谷蛋白,其包含:
(a)信号肽序列,
(b)γ-玉米蛋白的重复结构域六肽PPPVHL(SEQ ID NO:1)的一个或多个拷贝的序列,以及
(c)γ-玉米蛋白ProX结构域的全部或部分序列。
16.如权利要求14所述的方法,其中所述醇溶谷蛋白序列为γ-玉米蛋白、α-玉米蛋白或稻米醇溶谷蛋白。
17.如权利要求7所述的方法,其中所述用于转化宿主细胞的核酸序列存在于包含一个或多个调控序列的表达载体中。
18.如权利要求17所述的方法,其中所述一个或多个调控序列包含启动子。
19.包含含有可操作地连接到外源核酸片段的一个或多个调控序列的载体的重组核酸分子,所述外源核酸片段限定了编码融合蛋白的基因,所述融合蛋白包含连接到(ii)感兴趣多肽产物的(i)蛋白体诱导序列。
20.如权利要求19所述的核酸,其中所述载体的所述一个或多个调控序列包含适于在适合的真核宿主细胞中启动所述基因的表达的启动子。
CN2005800461115A 2004-11-29 2005-11-29 蛋白的生产 Expired - Fee Related CN101098886B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0426160.8 2004-11-29
GBGB0426160.8A GB0426160D0 (en) 2004-11-29 2004-11-29 Production of proteins
PCT/EP2005/012877 WO2006056483A1 (en) 2004-11-29 2005-11-29 Production of proteins

Publications (2)

Publication Number Publication Date
CN101098886A true CN101098886A (zh) 2008-01-02
CN101098886B CN101098886B (zh) 2012-09-26

Family

ID=33561506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800461115A Expired - Fee Related CN101098886B (zh) 2004-11-29 2005-11-29 蛋白的生产

Country Status (12)

Country Link
US (1) US8822181B2 (zh)
EP (1) EP1819725B1 (zh)
JP (1) JP2008521391A (zh)
KR (1) KR101430081B1 (zh)
CN (1) CN101098886B (zh)
AR (1) AR051837A1 (zh)
AU (1) AU2005308921B2 (zh)
BR (1) BRPI0517121A (zh)
CA (1) CA2589164C (zh)
GB (1) GB0426160D0 (zh)
RU (1) RU2429243C2 (zh)
WO (1) WO2006056483A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103328634A (zh) * 2010-12-23 2013-09-25 菲利普莫里斯生产公司 用于在植物中产生缪勒氏管抑制质的方法
CN109071611A (zh) * 2016-05-06 2018-12-21 葛兰素史克知识产权开发有限公司 产生重组蛋白的方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2224792B1 (es) * 2002-06-28 2007-02-16 Era Plantech, S.L. Produccion de peptidos y proteinas por acumulacion de cuerpos proteicos derivados de reticulos endoplasmico en plantas.
GB0426161D0 (en) * 2004-11-29 2004-12-29 Era Plantech S L Protein isolation and purification
US9555097B2 (en) 2006-02-23 2017-01-31 Era Biotech, S.A. Recombinant protein bodies as immunogen-specific adjuvants
US8163880B2 (en) * 2006-02-23 2012-04-24 Era Biotech S.A. Production of biologically active proteins
EP2418284A1 (en) 2010-08-13 2012-02-15 ERA Biotech, S.A. Protein body-inducing polypeptide sequences
CA2824155A1 (en) 2011-01-17 2012-07-26 Philip Morris Products S.A. Vectors for nucleic acid expression in plants
DK2665818T3 (en) 2011-01-17 2017-04-10 Philip Morris Products Sa Protein expression in plants
FI20115704L (fi) 2011-07-01 2013-01-02 Teknologian Tutkimuskeskus Vtt Oy Vierasproteiinien tuoton parantaminen
GB201514648D0 (en) * 2015-08-18 2015-09-30 Univ Cape Town Synthetic BTV VP2 fusion protein
GB201514652D0 (en) * 2015-08-18 2015-09-30 Univ Cape Town Synthetic BTV VP2 multiepitope peptide vaccine
CN112048518B (zh) * 2020-08-22 2022-06-24 江西农业大学 一种玉米醇溶蛋白降解酶的制备方法及其应用
US10947552B1 (en) 2020-09-30 2021-03-16 Alpine Roads, Inc. Recombinant fusion proteins for producing milk proteins in plants
EP4222167A1 (en) 2020-09-30 2023-08-09 Nobell Foods, Inc. Recombinant milk proteins and food compositions comprising the same
US10894812B1 (en) 2020-09-30 2021-01-19 Alpine Roads, Inc. Recombinant milk proteins

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4215040A (en) * 1978-12-22 1980-07-29 The Procter & Gamble Company Density separation process
US5650554A (en) * 1991-02-22 1997-07-22 Sembiosys Genetics Inc. Oil-body proteins as carriers of high-value peptides in plants
ATE346944T1 (de) * 1997-09-30 2006-12-15 Univ California Herstellung von proteinen in pflanzensamen
WO2002086077A2 (en) 2001-04-18 2002-10-31 New Mexico State University Technology Transfer Corporation Co-expression of zein proteins
DK1532261T3 (da) * 2002-05-24 2010-05-31 Medtronic Inc Fremgangsmåder og DNA-konstrukter til produktion af polypeptider med højt udbytte
AU2003239894A1 (en) * 2002-05-24 2003-12-12 Restoragen Inc. Methods and constructs for high yield expression of clostripain
ES2224792B1 (es) * 2002-06-28 2007-02-16 Era Plantech, S.L. Produccion de peptidos y proteinas por acumulacion de cuerpos proteicos derivados de reticulos endoplasmico en plantas.
GB0426161D0 (en) 2004-11-29 2004-12-29 Era Plantech S L Protein isolation and purification
US8163880B2 (en) * 2006-02-23 2012-04-24 Era Biotech S.A. Production of biologically active proteins
US9555097B2 (en) * 2006-02-23 2017-01-31 Era Biotech, S.A. Recombinant protein bodies as immunogen-specific adjuvants
EP2418284A1 (en) 2010-08-13 2012-02-15 ERA Biotech, S.A. Protein body-inducing polypeptide sequences

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103328634A (zh) * 2010-12-23 2013-09-25 菲利普莫里斯生产公司 用于在植物中产生缪勒氏管抑制质的方法
CN109071611A (zh) * 2016-05-06 2018-12-21 葛兰素史克知识产权开发有限公司 产生重组蛋白的方法

Also Published As

Publication number Publication date
US20060121573A1 (en) 2006-06-08
BRPI0517121A (pt) 2008-09-30
EP1819725A1 (en) 2007-08-22
RU2007124369A (ru) 2009-01-10
AU2005308921A1 (en) 2006-06-01
EP1819725B1 (en) 2013-03-27
GB0426160D0 (en) 2004-12-29
CN101098886B (zh) 2012-09-26
AR051837A1 (es) 2007-02-14
KR101430081B1 (ko) 2014-08-13
KR20070091156A (ko) 2007-09-07
CA2589164C (en) 2014-10-28
RU2429243C2 (ru) 2011-09-20
US8822181B2 (en) 2014-09-02
JP2008521391A (ja) 2008-06-26
CA2589164A1 (en) 2006-06-01
AU2005308921B2 (en) 2011-11-24
WO2006056483A1 (en) 2006-06-01

Similar Documents

Publication Publication Date Title
CN101098886B (zh) 蛋白的生产
KR100975596B1 (ko) 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자
CN101103114B (zh) 蛋白分离和纯化
AU718510B2 (en) Transformation of pichia methanolica
US9115364B2 (en) Protein expression system
KR20100017491A (ko) 식물 소포체 파생적 단백질체들 내의 축적에 의한 펩티드 및 단백질들의 생산
WO2001049742A1 (en) Method for making insulin precursors and insulin precursor analogs
US9012367B2 (en) Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
Luo et al. Improving heterologous expression of porcine follicle-stimulating hormone in Pichia pastoris by integrating molecular strategies and culture condition optimization
JP2511251B2 (ja) 成熟インスリンの生産のための遺伝子系
WO2005113775B1 (en) Pproduction of a protein localized to the endoplasmic reticulum protein bodies in a transgenic plant and seed
Lin et al. The primary structure of rat ribosomal protein S12. The relationship of rat S12 to other ribosomal proteins and a correlation of the amino acid sequences of rat and yeast ribosomal proteins.
Müller II et al. Production of IFNα-2a in Hansenula polymorpha
US20110117600A1 (en) Process for obtaining aspart insulin using a pichia pastoris yeast strain
Yan et al. Overexpression of a small medicinal peptide from ginseng in the yeast Pichia pastoris
CN110358770B (zh) 一种酵母生物合成芋螺毒素的方法
CN116970631B (zh) 一种重组蛋白的编码基因、载体、细胞及制备方法
KR102559048B1 (ko) Cho 세포 유래 단백질 분비 인자 및 이를 포함하는 발현 벡터
CA2339350A1 (en) High level secretory expression system of intact mk family protein
MX2007006330A (en) Production of proteins
CA2175068C (en) The recombinant production of proteins in yeast
EP0189463A1 (en) Yeast cloning vehicle

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120926

Termination date: 20211129