CN101818121A - 基因表达技术 - Google Patents

基因表达技术 Download PDF

Info

Publication number
CN101818121A
CN101818121A CN201010156552A CN201010156552A CN101818121A CN 101818121 A CN101818121 A CN 101818121A CN 201010156552 A CN201010156552 A CN 201010156552A CN 201010156552 A CN201010156552 A CN 201010156552A CN 101818121 A CN101818121 A CN 101818121A
Authority
CN
China
Prior art keywords
protein
plasmid
host cell
sequence
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201010156552A
Other languages
English (en)
Inventor
达雷尔·斯利普
吉利恩·沙特尔沃思
克里斯托弗·J·A·芬尼斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes Biopharma DK AS
Original Assignee
Novozymes Biopharma DK AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes Biopharma DK AS filed Critical Novozymes Biopharma DK AS
Publication of CN101818121A publication Critical patent/CN101818121A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及基因表达技术,具体地,本发明提供了用于生产异源蛋白质的方法,包括:(a)提供包含2μm家族质粒的宿主细胞,该质粒包含编码包含伴侣蛋白之序列的蛋白质的基因和编码异源蛋白质的基因;(b)在容许编码伴侣蛋白的基因和编码异源蛋白质的基因表达的条件下在培养基中培养宿主细胞;并(c)由培养的宿主细胞或培养基纯化由此表达的异源蛋白质。

Description

基因表达技术
本申请是申请日为2004年12月23日、申请号为200480042021.4(国际申请号为PCT/GB2004/005462)、发明名称为“基因表达技术”的发明申请的分案申请。
发明领域
本申请涉及基因表达技术。
发明背景
Hartl,1996,Nature,381,571-580将称为蛋白伴侣的一类蛋白质定义为如下蛋白质,它结合并稳定另一种蛋白质在其它条件下不稳定的构象异构体,并且通过控制结合和释放来推动其正确的体内命运,即折叠、寡聚物装配、转运至特定亚细胞隔室、或通过降解而处置。
BiP(也称为GRP78、Ig主链结合蛋白和酵母中的Kar2p)是高丰度、约70kDa、属于hsp70家族的蛋白伴侣,驻留在内质网(ER)中,发挥辅助分泌系统中的转运和折叠蛋白质的功能,还有其它功能。
蛋白质二硫键异构酶(PDI)是驻留在ER中,参与蛋白质翻译后加工过程中催化二硫键形成的伴侣蛋白。
关于天然和外来两类蛋白质分泌的研究证明,由ER至高尔基体的转运是限速步骤。证据指向BiP与正常蛋白质的瞬时结合以及与突变或未折叠形式蛋白质的更稳定相互作用。结果是,BiP可能在溶解折叠前体和防止未折叠和未装配蛋白质转运中发挥双重作用。Robinson和Wittrup,1995,Biotechnol.Prog.,11,171-177检验了酿酒酵母中外来蛋白质分泌对BiP(Kar2p)和PDI蛋白质水平的影响,发现外来分泌性蛋白质的长期组成性表达将可溶性BiP和PDI降至Western分析不可检出的水平。作为异源蛋白质分泌的后果,ER蛋白伴侣和折叠酶水平的降低对于改善酵母表达/分泌系统的尝试具有重要含意。
蛋白伴侣的表达受到许多机制的调控,包括未折叠蛋白质应答(UPR)。
使用重组技术已经证明,多个PDI基因拷贝提高宿主细胞中的PDI蛋白质水平(Farquhar等,1991,Gene,108,81-89)。
1993年12月23日发表的WO 93/25676最早提出了编码PDI的基因和编码异源二硫键键合蛋白质的基因的共表达,作为提高异源蛋白质产量的手段。WO 93/25676报告了可以通过与PDI的共表达来提高antistasin和蜱抗凝蛋白质的重组表达。
这种策略已经用于提高其它类型蛋白质的重组表达。
Robinson等,1994,Bio/Technology,12,381-384报告了酿酒酵母中重组的额外PDI基因拷贝可用于将人血小板衍生生长因子(PDGF)B同型二聚体的重组表达提高10倍,将粟酒裂殖酵母酸性磷酸酶提高4倍。
Hayano等,1995,FEBS Letters,377,505-511描述了人溶菌酶和PDI在酵母中的共表达。观察到功能性溶菌酶的生成和分泌提高了约30-60%。
Shusta等,1998,Nature Biotechnology,16,773-777报告了酿酒酵母中单链抗体片段(scFv)的重组表达可以通过在宿主细胞中过度表达PDI而提高2-8倍。
Bao和Fukuhara,2001,Gene,272,103-110报告了酵母乳克鲁维氏酵母中重组人血清清蛋白(rHSA)的表达和分泌可以通过与酵母PDI基因(KlPDI1)额外重组拷贝的共表达而提高15倍或更多。
为了生成包含PDI基因和异源蛋白质的基因二者的共转化酵母,WO93/25676讲授了两种基因可以是整合在染色体中的;一种可以是整合在染色体中,而一种存在于质粒上;可以将每一种基因导入不同的质粒;或者可以将两种基因导入相同的质粒。WO 93/25676例示了具有整合在染色体中的PDI基因额外拷贝的酵母菌株中由质粒pKH4α2表达antistasin(实施例16和17);额外PDI基因拷贝存在于多拷贝酵母穿梭载体YEp24(Botstein等,1979,Gene,8,17-24)上时由载体K991表达antistasin(实施例20);和分别在GAL10和GAL1启动子的控制下由酵母穿梭载体pC1/1(Rosenberg等,1984,Nature,312,77-80)表达antistasin和PDI基因二者。事实上,Robinson和Wittrup,1995,前述引用还使用GAL1-GAL10基因间区来表达红细胞生成素,并得出结论,应当使用可紧密抑制的、诱导型启动子来构建用于分泌异源蛋白质的生产酵母菌株,否则持续分泌的负面作用(即可检测BiP和PDI降低)将在充满大规模发酵罐所需要的细胞生长许多代后占据支配地位。
本领域的后续工作确定了转基因的染色体整合是将重组蛋白产量最大化的关键。
Robinson等,1994,前述引用使用额外的整合在染色体中的PDI基因拷贝在PDGF和粟酒裂殖酵母酸性磷酸酶的表达中获得了观察到的增加。Robinson等报告了使用多拷贝2μm表达载体来提高PDI蛋白质水平的尝试对异源蛋白质分泌具有有害作用。
Hayano等,1995,前述引用描述了将人溶菌酶和PDI的基因导入酵母宿主,各自在分开的线性化整合载体中,由此带来染色体整合。
Shusta等,1998,前述引用报告了在酵母系统中,将转基因整合到宿主染色体中或使用附加型表达载体之间的选择能够大大影响分泌,而且,参照Parekh和Wittrup,1997,Biotechnol.Prog.,13,117-122,使用δ整合载体将scFv基因稳定整合到宿主染色体中优于使用基于2μm的表达质粒。Parekh和Wittrup,前述引用先前讲授了使用δ整合载体比基于2μm的表达载体将牛胰腺胰蛋白酶抑制物(BPTI)的表达提高了一个数量级。基于2μm的表达载体据说对异源分泌性蛋白质生产产生反面作用。
Bao和Fukuhara,2001,前述引用报告了“最初认为可以将KlPDI1基因直接导入携带rHSA表达盒的多拷贝载体中。然而,发现这些构建物严重影响酵母生长和质粒稳定性。这验证了我们先前的发现,即多拷贝载体上的KlPDI1基因对乳克鲁维氏酵母细胞的生长有害(Bao等,2000)”。Bao等,2000,Yeast,16,329-341,在上文引用的Bao和Fukuhara一节中提及时,报告了已经将KlPDI1基因在多拷贝质粒pKan707上导入乳克鲁维氏酵母,且质粒的存在致使菌株的生长情况很差。Bao等得出结论,即KlPDI1基因的过度表达对乳克鲁维氏酵母细胞有毒。根据Bao等的早期发现,Bao和Fukuhara选择在宿主染色体上导入KlPDI1的单一副本。
与此背景相反,我们已经令人惊讶的证明,与现有技术的建议相反,在酵母中在2μm家族多拷贝质粒上共表达伴侣蛋白和异源蛋白质的基因时,异源蛋白质的产量有实质提高。
发明描述
本发明的第一个方面提供了用于生产异源蛋白质的方法,包括:
(a)提供包含2μm家族质粒的宿主细胞,该质粒包含编码包含伴侣蛋白之序列的蛋白质的基因和编码异源蛋白质的基因;
(b)在容许编码伴侣蛋白的基因和编码异源蛋白质的基因共表达的条件下在培养基中培养宿主细胞;
(c)由培养物培养基纯化由此表达的异源蛋白质;并
(d)任选将由此纯化的蛋白质冻干。
在一个实施方案中,步骤(c)将由此表达的异源蛋白质纯化至商业可接受的纯度水平或制药学可接受的纯度水平。
优选的是,该方法还包括如下步骤:将纯化的异源蛋白质与载体或稀释剂诸如制药学可接受的载体或稀释剂一起配制,并任选以单位剂量形式提供由此配制的蛋白质。
本发明的第二个方面提供了2μm家族质粒作为表达载体通过在相同2μm家族质粒上提供编码异源蛋白质的基因和编码包含伴侣蛋白之序列的蛋白质的基因用于提高真菌(优选酵母)或脊椎动物异源蛋白质产量的用途。
本发明的第三个方面提供了包含编码包含伴侣蛋白之序列的蛋白质的基因和编码异源蛋白质的基因的2μm家族质粒,其中如果质粒基于2μm质粒,那么它是非整合载体。
本发明的第四个方面提供了包含如上定义的质粒的宿主细胞。
具体地,本发明涉及如下方面:
1.用于生产非2μm家族质粒蛋白质的方法,包括:
(a)提供包含2μm家族质粒的宿主细胞,该质粒包含编码包含伴侣蛋白之序列的蛋白质的基因和编码非2μm家族质粒蛋白质的基因;
(b)在容许编码包含伴侣蛋白之序列的蛋白质的基因和编码非2μm家族质粒蛋白质的基因表达的条件下在培养基中培养宿主细胞;并
(c)由培养的宿主细胞或培养基纯化由此表达的非2μm家族质粒蛋白质。
2.项1的方法,还包括如下步骤:将纯化的非2μm家族质粒蛋白质与载体或稀释剂一起配制,并任选以单位剂量形式提供由此配制的蛋白质。
3.2μm家族质粒作为表达载体通过在相同2μm家族质粒上提供编码非2μm家族质粒蛋白质的基因和编码伴侣蛋白的基因用于提高真菌(优选酵母)或脊椎动物非2μm家族质粒蛋白质产量的用途。
4.包含编码包含伴侣蛋白之序列的蛋白质的基因和编码非2μm家族质粒蛋白质的基因的2μm家族质粒,其中如果质粒基于2μm质粒,那么它是非整合载体。
5.依照任何前述项的方法、用途或质粒,其中所述蛋白伴侣具有真菌蛋白伴侣(优选酵母蛋白伴侣)或哺乳动物蛋白伴侣(优选人蛋白伴侣)的序列。
6.依照任何前述项的方法、用途或质粒,其中所述蛋白伴侣包含由如下任何之一编码的蛋白质的序列:AHA1、CCT2、CCT3、CCT4、CCT5、CCT6、CCT7、CCT8、CNS1、CPR3、CPR6、EPS1、ERO1、EUG1、FMO1、HCH1、HSP10、HSP12、HSP104、HSP26、HSP30、HSP42、HSP60、HSP78、HSP82、JEM1、MDJ1、MDJ2、MPD1、MPD2、PDI1、PFD1、ABC1、APJ1、ATP11、ATP12、BTT1、CDC37、CPR7、HSC82、KAR2、LHS1、MGE1、MRS11、NOB1、ECM10、SSA1、SSA2、SSA3、SSA4、SSC1、SSE2、SIL1、SLS1、UBI4、ORM1、ORM2、PER1、PTC2、PSE1和HAC1或截短的无内含子的HAC1。
7.依照任何前述项的方法、用途或质粒,其中所述蛋白伴侣是蛋白质二硫键异构酶,或是包含由PSE1、ORM2或SSA1编码的蛋白质或其变体或片段的序列。
8.依照项1、2、5、6或7任一项的方法,其中所述宿主细胞还表达编码与由所述质粒编码的第一蛋白伴侣不同的蛋白伴侣的第二重组基因。
9.依照项8的方法,其中编码蛋白伴侣的第二重组基因整合在染色体中。
10.依照项1至8任一项的方法、用途或质粒,其中所述质粒包含两种编码不同蛋白伴侣的不同基因,其中一种基因是如项8定义的编码蛋白伴侣的第二重组基因。
11.依照项8至10任一项的方法、用途或质粒,其中一种蛋白伴侣是蛋白质二硫键异构酶。
12.依照项8至11任一项的方法、用途或质粒,其中一种蛋白伴侣是ORM2。
13.依照项8或9的方法、用途或质粒,其中所述两种蛋白伴侣是蛋白质二硫键异构酶和ORM2。
14.依照任何前述项的方法、用途或质粒,其中所述非2μm家族质粒蛋白质包含在酵母中有效引起分泌的前导序列。
15.依照任何前述项的方法、用途或质粒,其中所述非2μm家族质粒蛋白质是真核蛋白质或其片段或变体,优选脊椎动物或真菌(诸如酵母)蛋白质。
16.依照任何前述项的方法、用途或质粒,其中所述非2μm家族质粒蛋白质是商业上有用的蛋白质。
17.依照任何前述项的方法、用途或质粒,其中所述非2μm家族质粒蛋白质包含选自清蛋白、单克隆抗体、鬼臼亚乙苷、血清蛋白质(诸如血液凝结因子)、antistasin、蜱抗凝肽、运铁蛋白、乳铁蛋白、内皮抑制素、抑管张素、胶原蛋白、免疫球蛋白或基于免疫球蛋白的分子或二者任一的片段(如dAb、Fab′片段、F(ab′)2、scAb、scFv或scFv片段)、Kunitz结构域蛋白质、干扰素、白介素、IL10、IL11、IL2、干扰素α的各个种类和亚类、干扰素β的各个种类和亚类、干扰素γ的各个种类和亚类、瘦蛋白、CNTF、CNTFAX15(AxokineTM)、IL1受体拮抗物、红细胞生成素(EPO)和EPO模拟物、血小板生成素(TPO)和TPO模拟物、prosaptide、蓝藻抗病毒蛋白N,5-螺旋、T20肽、T1249肽、HIV gp41、HIV gp120、尿激酶、尿激酶原、tPA、水蛭素、血小板衍生的生长因子、甲状旁腺激素、胰岛素原、胰岛素、胰高血糖素、胰高血糖素样肽、胰岛素样生长因子、降钙素、生长激素、转化生长因子β、肿瘤坏死因子、G-CSF、GM-CSF、M-CSF、FGF、前体和活性形式的凝血因子包括但不限于纤溶酶原、纤维蛋白原、凝血酶、前凝血酶、凝血酶原、von Willebrand氏因子、α1-抗胰蛋白酶、纤溶酶原激活物、因子VII、因子VIII、因子IX、因子X和因子XIII、神经生长因子、LACI、血小板衍生的内皮细胞生长因子(PD-ECGF)、葡萄糖氧化酶、血清胆碱酯酶、抑酶肽、淀粉状蛋白前体蛋白、inter-α胰蛋白酶抑制物、抗凝血酶III、脱脂载脂蛋白各个种类、蛋白C、蛋白S或任何上述的变体或片段的序列。
18.依照任何前述项的方法、用途或质粒,其中所述非2μm家族质粒蛋白质包含清蛋白或其变体或片段的序列。
19.依照任何前述项的方法、用途或质粒,其中所述非2μm家族质粒蛋白质包含运铁蛋白家族成员,优选运铁蛋白或乳铁蛋白,或其变体或片段的序列。
20.依照任何前述项的方法、用途或质粒,其中所述非2μm家族质粒蛋白质包括融合蛋白,诸如清蛋白或运铁蛋白家族成员或其中任一的变体或片段与另外的蛋白质的序列直接或间接融合的融合蛋白。
21.包含任何前述项定义的质粒的宿主细胞。
22.依照项21的宿主细胞,其中由质粒编码的蛋白伴侣是必需基因。
23.依照项22的宿主细胞,其中在缺乏所述质粒时,所述宿主细胞不能生成所述蛋白伴侣。
24.依照项21至23任一项的宿主细胞,它是酵母细胞。
25.依照项24的宿主细胞,其中所述质粒基于pSR1、pSB3或pSB4且所述酵母细胞是鲁氏接合糖酵母(Zygosaccharomyces rouxii);所述质粒基于pSB1或pSB2且所述酵母细胞是拜列氏接合糖酵母(Zygosaccharomycesbailii);所述质粒基于pSM1且所述酵母细胞是发酵接合糖酵母(Zygosaccharomyces fermentati);所述质粒基于pKD1且所述酵母细胞是果蝇克鲁维氏酵母(Kluyveromyces drosophilarum);所述质粒基于pPM1且所述酵母细胞是膜醭毕赤氏酵母(Pichia membranaefaciens);或所述质粒基于2μm质粒且所述酵母细胞是酿酒酵母(Saccharomyces cerevisiae)或卡尔斯伯糖酵母(Saccharomyces carlsbergensis)。
26.依照项25的宿主细胞,其中所述质粒基于2μm质粒且所述酵母细胞是酿酒酵母或卡尔斯伯糖酵母。
27.依照项1的方法,其中所述宿主细胞是项21至26任一项定义的宿主细胞。
28.依照项27的方法,其中所述宿主细胞是项23或依赖它的任何其它项定义的宿主细胞。
29.项27的方法,其中步骤(b)涉及在非选择性培养基诸如丰富培养基中培养宿主细胞。
30.用于生产非2μm家族质粒蛋白质的方法,包括:
(a)提供包含编码包含第一伴侣蛋白之序列的蛋白质的第一重组基因、编码包含第二伴侣蛋白之序列的蛋白质的第二重组基因和编码非2μm家族质粒蛋白质的第三重组基因的宿主细胞,其中第一和第二蛋白伴侣是不同的;
(b)在容许第一、第二和第三基因表达的条件下在培养基中培养宿主细胞;并
(c)任选由培养的宿主细胞或培养基纯化由此表达的非2μm家族质粒蛋白质;并
(d)任选将由此纯化的蛋白质冻干。
31.项30的方法,还包括如下步骤:将纯化的非2μm家族质粒蛋白质与载体或稀释剂一起配制,并任选以单位剂量形式提供由此配制的蛋白质。
32.依照项30或31的方法,其中第一和第二蛋白伴侣包含由如下任何之一编码的蛋白质的序列:AHA1、CCT2、CCT3、CCT4、CCT5、CCT6、CCT7、CCT8、CNS1、CPR3、CPR6、EPS1、ERO1、EUG1、FMO1、HCH1、HSP10、HSP12、HSP104、HSP26、HSP30、HSP42、HSP60、HSP78、HSP82、JEM1、MDJ1、MDJ2、MPD1、MPD2、PDI1、PFD1、ABC1、APJ1、ATP11、ATP12、BTT1、CDC37、CPR7、HSC82、KAR2、LHS1、MGE1、MRS11、NOB1、ECM10、SSA1、SSA2、SSA3、SSA4、SSC1、SSE2、SIL1、SLS1、UBI4、ORM1、ORM2、PER1、PTC2、PSE1和HAC1或截短的无内含子的HAC1。
33.依照项30至33任一项的方法,其中第一蛋白伴侣是蛋白质二硫键异构酶。
34.依照项30至34任一项的方法,其中第二蛋白伴侣是ORM2。
35.依照项30至34任一项的方法,其中第一或第二蛋白伴侣至少其一是由整合在染色体中的重组基因编码的。
36.依照项30至35任一项的方法,其中第一或第二蛋白伴侣至少其一是由质粒上的基因编码的。
37.依照项36的方法,其中所述质粒是如项1至26任一项定义的质粒。
38.包含编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因和编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因的宿主细胞。
39.编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的重组基因用于提高基于运铁蛋白的蛋白质表达的用途。
40.依照项38的宿主细胞或依照项39的用途,其中基于运铁蛋白的蛋白质包含运铁蛋白或运铁蛋白家族任何其它成员(如乳铁蛋白)或其变体或片段或包含运铁蛋白或其变体或片段的融合蛋白的序列。
41.依照项38至40任一项的宿主细胞,其中编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因在质粒上提供。
42.依照项41的宿主细胞或用途,其中所述质粒是2μm家族质粒。
43.依照项38至40任一项的宿主细胞或用途,其中编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因整合在染色体中。
44.依照项43的宿主细胞或用途,其中编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因在内源编码PDI基因的基因座处整合在染色体中,优选没有破坏内源PDI基因的表达。
45.依照项38至44任一项的宿主细胞或用途,其中编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因在质粒上提供。
46.依照项45的宿主细胞或用途,其中所述质粒是2μm家族质粒。
47.依照项38至44任一项的宿主细胞或用途,其中编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因整合在染色体中。
48.依照项47的宿主细胞或用途,其中编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因在内源编码PDI基因的基因座处整合在染色体中,优选没有破坏内源PDI基因的表达。
49.用于生产非2μm家族质粒蛋白质的方法,包括:
(a)提供包含编码包含ORM2或其变体或片段之序列的蛋白质的第一重组基因和编码非2μm家族质粒蛋白质的第二重组基因的宿主细胞;并
(b)在容许第一和第二基因表达的条件下在培养基中培养宿主细胞。
50.项49的方法,还包括如下步骤:将纯化的非2μm家族质粒蛋白质与载体或稀释剂一起配制,并任选以单位剂量形式提供由此配制的蛋白质。
51.依照项49或50的方法,其中编码包含ORM2或其变体或片段之序列的蛋白质的第一重组基因整合在宿主细胞的染色体中。
52.依照项49或50的方法,其中编码包含ORM2或其变体或片段之序列的蛋白质的第一重组基因位于质粒上。
53.包含编码包含ORM2或其变体或片段之序列的蛋白质的第一重组基因和编码非2μm家族质粒蛋白质的第二重组基因的宿主细胞。
54.编码包含ORM2或其变体或片段之序列的蛋白质的重组基因用于提高宿主细胞中非2μm家族质粒蛋白质表达的用途。
55.包含编码包含ORM2或其变体或片段之序列的蛋白质的第一重组基因和编码非2μm家族质粒蛋白质的第二重组基因的质粒。
56.依照项55的质粒,它是2μm家族质粒。
57.依照项49至56任一项的方法、用途、宿主细胞或质粒,其中所述非2μm家族质粒蛋白质如项14至20任一项的定义。
58.包含如下质粒的宿主细胞,该质粒包含编码必需蛋白伴侣的基因,其中在缺乏所述质粒时,所述宿主细胞不能生成所述蛋白伴侣,该质粒还包含编码非2μm家族质粒蛋白质的重组基因,诸如项14至20任一项中定义的非2μm家族质粒蛋白质。
59.依照项58的宿主细胞,其中在缺乏所述质粒时,所述细胞不能存活。
60.项58或59的宿主细胞,其中所述蛋白伴侣是蛋白质二硫键异构酶。
61.包含编码必需蛋白伴侣的基因作为唯一选择标记的质粒。
62.项61的质粒,还包含编码非2μm家族质粒蛋白质的基因,诸如项14至20任一项中定义的非2μm家族质粒蛋白质。
63.项61或62的质粒,它是2μm家族质粒。
64.用于生产非2μm家族质粒蛋白质的方法,包括下列步骤:
(a)提供项58至60任一项定义的宿主细胞;并
(b)在容许必需蛋白伴侣和非2μm家族质粒蛋白质表达的条件下在培养基中培养宿主细胞。
65.项64的方法,其中所述宿主细胞包含项61至63任一项定义的质粒。
66.项64或65的方法,其中步骤(b)是通过在非选择性培养基诸如丰富或复合培养基中培养宿主细胞来进行的。
67.编码蛋白质二硫键异构酶的核苷酸序列通过在宿主细胞中表达该核苷酸序列用于提高宿主细胞中非2μm家族质粒蛋白质表达的用途,该宿主细胞是在选择性培养基诸如极限培养基中培养的,其中编码蛋白质二硫键异构酶的核苷酸序列的特征为它具有至少一项下列特征:
(a)所述核苷酸包含具有天然PDI启动子或其功能性变体之序列的启动子且包含一连串的14个“TA”重复;
(b)所编码的蛋白质二硫键异构酶在参照基因库编号CAA38402定义的位置506-513处通常包含氨基酸序列EADAEAEA或其保守替代变体;
(c)所编码的蛋白质二硫键异构酶的残基Ser41是由密码子TCT编码的;
(d)所编码的蛋白质二硫键异构酶的残基Glu44是由密码子GAA编码的;
(e)所编码的蛋白质二硫键异构酶的残基Leu262是由密码子TTG编码的;
(f)所编码的蛋白质二硫键异构酶的残基Asp514是由密码子GAC编码的;或
(g)所述核苷酸序列包含具有天然PDI终止子或其功能性变体之序列的终止子序列,且包含一连串的8个连续“A”碱基和/或在位置1919(参照天然SKQ2n终止子序列的位置1919定义)处包含碱基“C”。
68.用于生产非2μm家族质粒蛋白质的方法,包括下列步骤:
(a)提供包含编码蛋白质二硫键异构酶且具有项67定义的核苷酸序列之序列的重组基因的宿主细胞,该宿主细胞还包含编码非2μm家族质粒蛋白质的重组基因;并
(b)在容许蛋白质二硫键异构酶和非2μm家族质粒蛋白质表达的条件下在极限培养基中培养宿主细胞。
69.包含与编码蛋白伴侣的编码序列可操作连接的启动子序列的多核苷酸通过在宿主细胞内表达该多核苷酸用于提高宿主细胞中非2μm家族质粒蛋白质表达的用途,其中所述启动子的特征是它所达到的蛋白伴侣表达水平比所述编码序列与其天然存在启动子可操作连接时所达到的低。
70.用于生产非2μm家族质粒蛋白质的方法,包括下列步骤:
(a)提供包含如下重组基因的宿主细胞,该重组基因包含与编码蛋白伴侣的编码序列可操作连接的启动子序列,其中所述启动子的特征是它所达到的蛋白伴侣表达水平比所述编码序列与其天然存在启动子可操作连接时所达到的低,且宿主细胞还包含编码非2μm家族质粒蛋白质的重组基因;并
(b)在容许蛋白伴侣和非2μm家族质粒蛋白质表达的条件下培养宿主细胞。
71.项1的方法,还包括如下步骤:将由此纯化的蛋白质冻干。
72.项49、64、68或70的方法,还包括如下步骤:由培养的宿主细胞或培养基纯化由此表达的非2μm家族质粒蛋白质。
73.项72的方法,还包括如下步骤:将由此纯化的蛋白质冻干。
74.项72或73的方法,还包括如下步骤:将纯化或冻干的非2μm家族质粒蛋白质与载体或稀释剂一起配制。
75.项74的方法,还包括如下步骤:以单位剂量形式提供由此配制的蛋白质。
本发明还涉及重组改良形式的2μm家族质粒。
已经证明,某些密切相关的芽殖酵母(budding yeast)物种含有天然存在的环状双链DNA质粒。这些质粒统称为2μm家族质粒,包括来自鲁氏接合糖酵母(Zygosaccharomyces rouxii,以前归入双孢接合糖酵母Zygosaccharomyces bisporus)的pSR1、pSB3或pSB4,来自拜列氏接合糖酵母(Zygosaccharomyces bailii)的pSB1或pSB2,来自发酵接合糖酵母(Zygosaccharomyces fermentati)的pSM1,来自果蝇克鲁维氏酵母(Kluyveromyces drosophilarum)的pKD1,来自膜醭毕赤氏酵母(Pichiamembranaefaciens)的未命名质粒(下文称为“pPM1”),及来自酿酒酵母(Saccharomyces cerevisiae)的2μm质粒和变体(诸如Scp1、Scp2和Scp3)(Volkert等,1989,Microbiological Reviews,53,299;Murray等,1988,J.Mol.Biol.,200,601;Painting等,1984,J.Applied Bacteriology,56,331)。
作为一个质粒家族,这些分子共享一系列共有特征,即它们通常在质粒的对边(opposite sides)具有两个反向重复片段,具有6kb左右(范围为4757至6615bp)的相似大小,三个开放读码框其中一个编码位点特异性重组酶(FLP),和自主复制序列(ARS),也称为复制起点(ori),位于反向重复片段之一的末端附近(Futcher,1988,Yeast,4,27;Murray等,前述引用;及Toh-e等,1986,Basic Life Sci.,40,425)。尽管它们缺乏可辨别的DNA序列同源性,然而它们共享的三个开放读码框的分子构造和功能保守性证明了家族成员之间的共有祖先联系。
尽管可以在本发明中使用任何上述天然存在2μm家族质粒,然而本发明不限于天然存在2μm家族质粒的使用。为了本发明的目的,将2μm家族质粒描述如下。
2μm家族质粒是环状双链DNA质粒。它通常较小,诸如在排除重组插入序列时的3,000至10,000bp之间,优选4,500至7,000bp之间。
2μm家族质粒通常包含至少三个开放读码框(“ORF”),它们各自编码在2μm家族质粒作为多拷贝质粒而稳定维持中发挥功能的蛋白质。可以将由这三个ORF编码的蛋白质称为FLP、REP1和REP2。当2μm家族质粒没有包含编码FLP、REP1和REP2的所有三个ORF时,应当反式提供编码缺失蛋白质的ORF,或是在另一种质粒上或是通过染色体整合。
“FLP”蛋白质是能够在受到FLP识别的反向重复序列之间催化位点特异重组的蛋白质。该反向重复序列称为FLP重组靶(FRT)位点,且各自通常作为更大反向重复片段的一部分存在(见下文)。优选的FLP蛋白质包含由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒其中一种质粒编码的FLP蛋白质的序列,例如Volkert等,前述引用;Murray等,前述引用;及Painting等,前述引用中所述。本发明还包括这些FLP蛋白质的变体和片段。“片段”和“变体”指保留天然蛋白质在相同FRT序列之间催化位点特异重组能力的那些。这些变体和片段常常与由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒其中一种质粒编码的FLP蛋白质具有至少50%、60%、70%、80%、90%、95%、98%、99%或更高同源性。不同的FLP蛋白质可以具有不同的FRT序列特异性。典型的FRT位点可以包含侧翼为反向重复序列的核心核苷酸序列。在2μm质粒中,FRT核心序列的长度是8个核苷酸且侧翼反向重复序列的长度是13个核苷酸(Volkert等,前述引用)。然而,受到任何指定FLP蛋白质识别的FRT位点可以与2μm质粒FRT位点不同。
REP1和REP2是参与在细胞分裂过程中分配质粒拷贝的蛋白质,而且可能还在FLP表达的调控中发挥作用。在来自不同2μm家族质粒的REP1蛋白质间观察到可观的序列趋异,而目前不可能在来自不同2μm家族质粒的REP2蛋白质间进行序列对比。优选的REP1和REP2蛋白质包含由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒其中一种质粒编码的REP1和REP2蛋白质的序列,例如Volkert等,前述引用;Murray等,前述引用;及Painting等,前述引用中所述。本发明还包括这些REP1和REP2蛋白质的变体和片段。REP1和REP2的“片段”和“变体”指在由代替天然ORF的质粒编码时在合适酵母群内不破坏质粒的稳定多拷贝维持的那些。这些REP1和REP2变体和片段常常分别与由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒其中一种质粒编码的REP1和REP2蛋白质具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或更高同源性。
由质粒上的ORF编码的REP1和REP2蛋白质必须是相容的。优选的是,REP1和REP2蛋白质具有由相同天然存在2μm家族质粒诸如pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒编码的REP1和REP2蛋白质或其变体或片段的序列。
2μm家族质粒通常包含两个反向重复序列。反向重复片段可以是任何大小,只要它们各自含有FRT位点(见上文)。反向重复片段通常是高度同源的。它们可以共享超过50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.5%或更高序列同一性。在一个优选的实施方案中,它们是相同的。通常,反向重复片段的长度各自是200至1000bp。优选的反向重复序列可以各自具有200至300bp、300至400bp、400至500bp、500至600bp、600至700bp、700至800bp、800至900bp、或900至1000bp的长度。特别优选的反向重复片段是质粒pSR1(959bp)、pSB1(675bp)、pSB2(477bp)、pSB3(391bp)、pSM1(352bp)、pKD1(346bp)、2μm质粒(599bp)、pSB4和pPM1的那些。
反向重复片段的序列可以有所变化。然而,每个反向重复片段中FRT位点的序列应当与由质粒编码的FLP蛋白质的特异性相容,从而使得所编码FLP蛋白质能够发挥作用,即在质粒的反向重复序列之间催化位点特异重组。可以通过本领域知道的方法来测定反向重复序列之间的重组(及由此FLP蛋白质识别质粒内FRT位点的能力)。例如,可以在有利于FLP表达的条件下对酵母细胞中的质粒测定质粒限制图谱的变化,而这是由质粒中一个区域相对于质粒中另一个区域的取向变化引起的。若检测出限制图谱有变化,则指示FLP蛋白质能够识别质粒中的FRT位点,且因此每个反向重复片段中的FRT位点与由质粒编码的FLP蛋白质的特异性相容。
在一个特别优选的实施方案中,包括FRT位点在内的反向重复片段的序列衍生自与编码FLP蛋白质的ORF相同的2μm家族质粒,诸如pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1或2μm质粒。
反向重复片段通常以这样一种方式位于2μm家族质粒内,使得在排除外源导入的序列诸如转基因时,反向重复片段之间定义的两个区域(如诸如在2μm质粒中定义为UL和US)具有大致相似的大小。例如,两个区域其中之一所具有的长度可以相当于另一个区域的长度的至少40%、50%、60%、70%、80%、90%、95%或更多、可多达100%。
2μm家族质粒通常包含编码FLP的ORF和以这样一种方式并置的一个反向重复片段(任意的称为“IR1”,使之与下一段中提及的另一个反向重复片段有所区别),使得IR1存在于FLP ORF的远端且没有任何插入其间的编码序列,例如在2μm质粒中所看到的。“远端”在此语境中指FLP ORF中与启动子起始其转录的末端相反的末端。在一个优选的实施方案中,FLP ORF的远端与IR1交叠。
2μm家族质粒通常包含编码REP2的ORF和以这样一种方式并置的另一个反向重复片段(任意的称为“IR2”,使之与上一段中提及的IR1有所区别),使得IR2存在于REP2 ORF的远端且没有任何插入其间的编码序列,例如在2μm质粒中所看到的。“远端”在此语境中指REP2 ORF中与启动子起始其转录的末端相反的末端。
在一个实施方案中,编码REP2和FLP的ORF可以存在于2μm家族质粒的反向重复片段之间所定义的两个区域中的相同区域上,该区域可以是两个区域中的较大者或较小者(如果两个区域的大小之间存在任何不平等的话)。
在一个实施方案中,编码REP2和FLP的ORF可以由不同的启动子转录。
通常,2μm家族质粒的反向重复片段之间定义的区域(如诸如在2μm质粒中定义为UL和US)可以包含不超过两种内源基因,它们所编码的蛋白质在2μm家族质粒作为多拷贝质粒的稳定维持中发挥功能。由此,在一个优选的实施方案中,质粒中反向重复片段之间定义的一个区域可以包含不超过编码FLP和REP2;FLP和REP1;或REP1和REP2的ORF作为内源编码序列。
2μm家族质粒通常包含复制起点(也称为自主复制序列-“ARS”),它通常是双向的。可以存在任何合适的ARS序列。酵母染色体复制起点典型的共有序列可能是合适的(Broach等,1982,Cold Spring Harbor Symp.Quant.Biol.,47,1165-1174;Williamson,1985,Yeast,1,1-14)。优选的ARS包括由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒分离的那些。
由此,优选的2μm家族质粒可以包含编码FLP、REP1和REP2的ORF、两个反向重复序列(每个反向重复片段包含与所编码FLP蛋白质相容的FRT位点)、和ARS序列。优选的是,FRT位点衍生自与编码FLP蛋白质的序列相同的2μm家族质粒。更加优选的是,所编码REP1和REP2蛋白质的序列衍生自彼此相同的2μm家族质粒。甚至更加优选的是,FRT位点衍生自与所编码FLP、REP1和REP2蛋白质的序列相同的2μm家族质粒。仍然更加优选的是,编码FLP、REP1和REP2的ORF的序列和反向重复片段(包括FRT位点)的序列衍生自相同的2μm家族质粒。此外,ARS位点可以衍生自与FLP、REP1和REP2的ORF及反向重复片段(包括FRT位点)的序列其中一种或多种相同的2μm家族质粒。
术语“衍生自”包括与衍生它的序列具有相同序列的序列。然而,还包括如上定义的它们的变体和片段。例如,具有衍生自2μm质粒的FLP基因之序列的FLP基因可以具有与天然存在基因相比经过修饰的启动子或其它调控序列。另外/或者,具有衍生自2μm质粒的FLP基因之序列的FLP基因可以在开放读码框中具有经过修饰的核苷酸序列,它可以编码与天然存在基因相同的蛋白质,或者可以编码经过修饰的FLP蛋白质。相同考虑应用于2μm家族质粒上具有衍生自特定来源的序列的其它序列。
任选的是,2μm家族质粒可以包含衍生自2μm质粒中STB区域(也称为REP3)的区域,正如Volkert等,前述引用中所定义的。本发明2μm家族质粒中的STB区域可以包含两个或多个串联重复序列,诸如3个、4个、5个或更多。或者,可以不存在串联重复序列。串联重复片段可以是任何大小,诸如长度为10、20、30、40、50、60、70、80、90、100bp或更长。2μm质粒STB区域中的串联重复片段的长度是62bp。串联重复片段的序列是相同的并不重要。可以承受轻微的序列变异。由与REP1和REP2 ORF其中任一或二者相同的质粒选择STB区域可能是优选的。认为STB区域是顺式作用元件且优选是不转录的。
任选的是,2μm家族质粒可以包含额外ORF,它所编码的蛋白质在2μm家族质粒作为多拷贝质粒的稳定维持中发挥功能。额外的蛋白质可以命名为RAF或D。在例如2μm质粒和pSM1上可以看到编码RAF或D基因的ORF。由此,RAF或D的ORF可以包含适于编码由2μm质粒或pSM1编码的RAF或D基因OFR的蛋白质产物或其变体和片段的序列。由此,本发明还包括2μm质粒或pSM1的RAF或D基因的蛋白质产物的变体和片段。2μm质粒或pSM1的RAF或D基因的蛋白质产物“片段”和“变体”指在由2μm质粒或pSM1代替天然ORF编码时不破坏质粒在合适酵母群中的稳定多拷贝维持的那些。这些变体和片段通常与由2μm质粒或pSM1编码的RAF或D基因ORF的蛋白质产物具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或更高同源性。
天然存在2μm家族质粒可能是优选的。天然存在2μm家族质粒指具有上述特征的任何质粒,该质粒是发现在酵母中天然存在的,即尚未经过重组修饰以包含异源序列。优选的是,天然存在2μm家族质粒选自由鲁氏接合糖酵母获得的pSR1(编号X02398)、pSB3(编号X02608)或pSB4,由拜列氏接合糖酵母获得的pSB1或pSB2(编号NC_002055或M18274),由发酵接合糖酵母获得的pSM1(编号NC_002054),由果蝇克鲁维氏酵母获得的pKD1(编号X03961),由膜醭毕赤氏酵母获得的pPM1,或最优选的是由酿酒酵母获得的2μm质粒(编号NC_001398或J01347)。此段中的编号指NCBI的保藏物。
2μm质粒(图1)是6318bp双链DNA质粒,在大多数酿酒酵母菌株中是内源的,每个单倍体基因组60-100个拷贝。2μm质粒包含由两个599bp反向重复序列分开的小独特(US)区和大独特区(UL)。反向重复序列的位点特异重组导致A型和B型质粒之间的体内互变(Volkert和Broach,1986,Cell,46,541)。两种形式的2μm质粒只有它们独特区的相对取向不同。
尽管来自酿酒酵母的克隆2μm质粒(也称为Scp1)的DNA测序给出6318bp的大小(Hartley和Donelson,1980,Nature,286,860),然而已知存在其它略微较小的2μm变体Scp2和Scp3,分别是称为STB的区域中125bp和220bp小段删除的结果(Cameron等,1977,Nucl.Acids Res.,4,1429;Kikuchi,1983,Cell,35,487;及Livingston和Hahne,1979,Proc.Natl.Acad.Sci.USA,76,3727)。在一项研究中,来自世界各地的天然糖酵母菌株中约80%含有与2μm同源的DNA(根据Southern印迹分析)(Hollenberg,1982,Current Topics in Microbiology and Immunobiology,96,119)。此外,在酿酒酵母和卡尔斯伯糖酵母中发现的天然2μm质粒群内存在变异(遗传多态性),NCBI序列(编号NC_001398)是一个实例。
2μm质粒具有核定位,且展示高水平的有丝分裂稳定性(Mead等,1986,Molecular & General Genetics,205,417)。2μm质粒的固有稳定性源自质粒编码的拷贝数扩增和分配机制,它在嵌合载体的开发中可能受到损害(Futcher和Cox,1984,J.Bacteriol.,157,283;Bachmair和Ruis,1984,Monatshefte für Chemie,115,1229)。将含有2μm质粒的酵母菌株称为[cir+],而将不含2μm质粒的酵母菌株称为[cir0]。
2μm质粒的US区含有REP2和FLP基因,而UL区含有REP1和D(也称为RAF)基因、STB基因座和复制起点(Broach和Hicks,1980,Cell,21,501;Sutton和Broach,1985,Mol.Cell.Biol.,5,2770)。Flp重组酶结合反向重复片段内的FRT位点(Flp识别靶)以介导位点特异重组,这对于体内天然质粒扩增和质粒拷贝数控制是至关重要的(Senecoff等,1985,Proc.Natl.Acad.Sci.USA,82,7270;Jayaram,1985,Proc.Natl.Acad.Sci.USA,82,5875)。Flp重组酶活性的变化能够显著影响2μm家族质粒的拷贝数(Sleep等,2001,Yeast,18,403;Rose和Broach,1990,Methods Enzymol.,185,234)。Rep1和Rep2蛋白质介导质粒隔离,尽管它们的作用模式尚不清楚(Sengupta等,2001,J.Bacteriol.,183,2306)。它们还抑制FLP基因的转录(Reynolds等,1987,Mol.Cell.Biol.,7,3566)。
2μm质粒的FLP和REP2基因由不同的启动子转录,而且它们之间显然没有定义的插入其间的序列。FLP和REP2转录本都在反向重复序列内的相同序列基序处终止,分别在它们翻译终止密码子后24bp和178bp(Sutton和Broach,1985,Mol.Cell.Biol.,5,2770)。
在FLP的情况中,C端编码序列也位于反向重复序列内。此外,两个反向重复序列在599bp上高度保守,认为这种特征对于体内有效的质粒复制和扩增是有利的,尽管只有FRT位点(少于65bp)对于体内位点特异重组是必需的(Senecoff等,1985,Proc.Natl.Acad.Sci.USA,82,7270;Jayaram,1985,Proc.Natl.Acad.Sci.USA,82,5875;Meyer-Leon等,1984,Cold SpringHarbor Symposia On Quantitative Biology,49,797)。FLP的关键催化残基是精氨酸308和酪氨酸343(其是必需的),而组氨酸309和组氨酸345促进链切割(Prasad等,1987,Proc.Natl.Acad.Sci.USA,84,2189;Chen等,1992,Cell,69,647;Grainge等,2001,J.Mol.Biol.,314,717)。
在Rep2中描述了两个功能性结构域。残基15-58形成Rep1结合结构域,而残基59-296含有自我缔合和STB结合区(Sengupta等,2001,J.Bacteriol.,183,2306)。
缺乏2μm质粒的许多必需功能区但保留功能性顺式元件ARS和STB的2μm质粒的嵌合或大段删除的突变衍生物不能在细胞分裂时在母细胞和子细胞之间有效分配。如果通过例如在宿主内提供功能性2μm质粒而反式提供这些功能即所谓的[cir+]宿主,那么这些质粒就能这样做。
先前已经将目的基因插入2μm质粒的UL区。例如,参阅EP 0 286 424中的质粒pSAC3U1和图2所示质粒,它包含β-内酰胺酶基因(用于氨苄青霉素抗性)、LEU2选择标记和寡核苷酸接头,其中后两种插入2μm样非整合载体pSAC3的UL区内唯一SnaBI位点(参阅EP 0 286 424)。在转化到酵母中后,图2所示质粒遗失XbaI位点之间含有氨苄青霉素抗性基因的大肠杆菌DNA。这在Chinery和Hinchliffe,1989,Curr.Genet.,16,21和EP0 286 424中有所描述,其中这些类型的载体称为“非整合载体”。可以在接头内的NotI位点中进行其它多核苷酸插入(Sleep等,1991,Biotechnology(NY),9,183)。
本领域知道2μm质粒中的候选插入位点,包括Rose和Broach,1990,Methods Enzymol.,185,234-279中描述的那些,诸如利用FLP中EcoRI处插入的质粒pCV19、pCV20、CVneo,利用D中EcoRI作为插入位点的质粒pCV21、pGT41和pYE,利用D中PstI作为插入位点的质粒pHKB52,利用D中PstI和D中EcoRI处插入的质粒pJDB248,利用D中PstI和FLP中EcoRI作为插入位点的质粒pJDB219,利用FLP中ClaI处插入的质粒G18、质粒pAB18,利用D中PstI作为插入位点的质粒pGT39和pA3、质粒pYT11、pYT14和pYT11-LEU,及利用FLP中EcoRI作为插入位点的质粒pTY39。其它2μm质粒包括EP 0 286 424及Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中描述的pSAC3、pSAC3U1、pSAC3U2、pSAC300、pSAC310、pSAC3C1、pSAC3PL1、pSAC3SL4、和pSAC3SC1,它们还将PstI、EagI或SnaBI描述为适当的2μm插入位点。其它2μm质粒包括pAYE255、pAYE316、pAYE443、pAYE522(Kerry-Williams等,1998,Yeast,14,161-1690)、pDB2244(WO 00/44772)和pAYE329(Sleep等,2001,Yeast,18,403-421)。
在一个优选的实施方案中,将一种或多种基因插入2μm家族质粒,在ARS序列周围的非转录区内。例如,在由酿酒酵母获得的2μm质粒中,ARS序列周围的非转录区由D基因的末端延伸至ARS序列的开端。Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中描述了SnaBI(复制起点序列ARS附近)中的插入。技术人员将认识到,还可以在非转录区中进行基因插入,位于由Chinery和Hinchliffe描述的SnaBI位点的附近位置。
在另一个优选的实施方案中,2μm家族质粒中的REP2和FLP基因各自具有与之相邻的反向重复片段,2μm家族质粒中插入了一种或多种基因,位于REP2基因或FLP基因其中任一的最后一个功能性密码子后面的第一个碱基和与所述基因相邻的反向重复片段中FRT位点前面的最后一个碱基之间的区域内。REP2基因或FLP基因其中任一的最后一个功能性密码子指基因开放读码框中位于基因启动子下游最远的密码子,且如上定义其终止密码子替代将导致质粒多拷贝稳定性的不可接受的损失。由此,通过插入多核苷酸序列插入、删除或替代在任一基因中最后一个功能性密码子下游的任何点破坏REP2或FLP基因不会导致不可接受的质粒多拷贝稳定性的损失。
例如,可以在密码子59后面破坏2μm质粒的REP2基因,而且可以在密码子344后面破坏2μm质粒的FLP基因,各自不会损害质粒的多拷贝稳定性。可以通过在FLP或REP2基因其中任一中构建质粒突变体并遵循本文列出的测试方法测定质粒是否保持多拷贝稳定性,常规确定其它2μm家族质粒中等价基因的最后一个功能性密码子。
可以使用诸如Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中定义的测试方法来确定质粒是否保持多拷贝稳定性。对于在Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中定义的非选择性培养基(YPD,也称为YEPD)中不生长的酵母,可以使用其它合适的非选择性培养基。质粒稳定性可以定义为在限定代数后对选择标记保持原养型的细胞百分比。代数优选足以显示对照质粒诸如pSAC35或pSAC310之间的差异,或是显示与这样一种对照质粒可比的稳定性。代数可以是1代、2代、3代、4代、5代、6代、7代、8代、9代、10代、11代、12代、13代、14代、15代、16代、17代、18代、19代、20代、25代、30代、35代、40代、45代、50代、60代、70代、80代、90代、100代或更多。优选较高数目。可接受的质粒稳定性可以是1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或基本上100%。优选较高百分比。技术人员将认识到,即使质粒可能在非选择性培养基上生长时具有低于100%的稳定性,质粒仍然能够在选择性培养基中培养时使用。例如,实施例中描述的质粒pDB2711在依照实施例1的测试方法测定稳定性时只有10%是稳定的,但是在选择性生长条件下在摇瓶培养中在重组运铁蛋白生产力中提供15倍增量。
由此,REP2基因最后一个功能性密码子后面的第一个碱基和与所述基因相邻的反向重复片段中FRT位点前面的最后一个碱基之间、更加优选反向重复片段的第一个碱基和FRT位点前面的最后一个碱基之间、甚至更加优选REP2基因翻译终止密码子后面且FRT位点前面最后一个碱基前面的位置处可以存在一种或多种基因插入。
另外/或者,FLP基因最后一个功能性密码子后面的第一个碱基和与所述基因相邻的反向重复片段中FRT位点前面的最后一个碱基之间、优选反向重复片段的第一个碱基和FRT位点前面的最后一个碱基之间、更加优选FLP编码序列末端后面的第一个碱基和FRT位点前面的最后一个碱基之间、诸如FLP编码序列末端后面的第一个碱基处可以存在一种或多种基因插入。
在一个优选的实施方案中,如果2μm家族质粒基于酿酒酵母的2μm质粒,那么它是本领域知道的非整合载体(例如参阅EP 286 424,将其内容收入本文作为参考)。非整合载体可以是包含预定通过重组遗失的DNA序列、三对2μm FRT位点(其中一对位点取顺向而另两对取逆向)、和目的DNA序列(诸如大肠杆菌复制起点和细菌选择标记)的2μm质粒载体,将要遗失的所述序列位于取顺向的所述位点之间。
由此,将要遗失的序列可以包含选择标记DNA序列。
优选的非整合载体包括额外携带下列各项的完整2μm质粒:(i)载体在细菌宿主中繁殖所必需的细菌质粒DNA序列;(ii)额外2μm FRT位点;和(iii)用于酵母转化的选择标记DNA序列;所述细菌质粒DNA序列和额外FRT位点存在于/创建在2μm质粒的两个反向重复序列其中之一中的限制性位点诸如XbaI处,所述额外FRT位点相对于所述一个重复序列的内源FRT位点取顺向,且所述细菌质粒DNA序列夹在额外FRT位点和所述一个重复序列的内源FRT位点之间。在一种优选的非整合载体中,所有细菌质粒DNA序列如上所述夹在中间。一种特别优选的2μm质粒载体本质上具有EP 286424中所示pSAC3的构造。
术语“非整合载体”在用于本文时还包括US 6,451,559中定义的质粒,将其内容收入本文作为参考。由此,非整合载体可以是除了编码非酵母多肽的DNA序列以外,不含细菌(特别是大肠杆菌)复制起点或更优选的是细菌(特别是大肠杆菌)序列的2μm载体,更优选的是,除了编码非酵母多肽的DNA序列以外,所述载体中的所有DNA是酵母衍生的DNA。
术语“蛋白伴侣”在用于本文时指如下蛋白质,它结合并稳定另一种蛋白质在其它条件下不稳定的构象异构体,并且通过控制结合和释放来推动其正确的体内命运,即折叠、寡聚物装配、转运至特定亚细胞隔室、或通过降解而处置。因此,蛋白伴侣还指如下蛋白质,它参与蛋白质折叠,或是具有蛋白伴侣活性或参与未折叠蛋白质应答。本领域知道这类伴侣蛋白,例如斯坦福基因组数据库(Stanford Genome Database,SGD,http://yeastgenome.org)。优选的蛋白伴侣是真核蛋白伴侣,尤其优选酵母蛋白伴侣,包括AHA1、CCT2、CCT3、CCT4、CCT5、CCT6、CCT7、CCT8、CNS1、CPR3、CPR6、EPS1、ERO1、EUG1、FMO1、HCH1、HSP10、HSP12、HSP104、HSP26、HSP30、HSP42、HSP60、HSP78、HSP82、JEM1、MDJ1、MDJ2、MPD1、MPD2、PDI1、PFD1、ABC1、APJ1、ATP11、ATP12、BTT1、CDC37、CPR7、HSC82、KAR2、LHS1、MGE1、MRS11、NOB1、ECM10、SSA1、SSA2、SSA3、SSA4、SSC1、SSE2、SIL1、SLS1、ORM1、ORM2、PER1、PTC2、PSE1、UBI4和HAC1或截短的无内含子HAC1(Valkonen等,2003,Applied Environ.Micro.,69,2065)。
可用于本发明实践的蛋白伴侣可以是:
●热休克蛋白,诸如作为hsp70蛋白家族成员的蛋白质(包括Kar2p、SSA和SSB蛋白质,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2编码的蛋白质)、作为HSP90家族成员的蛋白质、或作为HSP40家族成员的蛋白质或参与其调控的蛋白质(如Sillp),包括DNA-J和DNA-J样蛋白质(如Jem1p、Mdj2p);
●作为核周蛋白/输入蛋白蛋白质家族成员的蛋白质,诸如α或β核周蛋白/输入蛋白蛋白家族,例如核周蛋白β蛋白PSE1;
●作为Hjelmqvist等,2002,Genome Biology,3(6),research0027.1-0027.16描述的ORMDL家族成员的蛋白质,诸如Orm2p;
●天然位于内质网中或分泌途径中其它部位诸如高尔基体中的蛋白质,例如天然在内质网(ER)内腔中特别是在分泌细胞中发挥作用的蛋白质,诸如PD1;
●作为锚定在ER中的跨膜蛋白质的蛋白质,诸如Hjelmqvist等,2002,前述引用描述的ORMDL家族的成员(例如Orm2p);
●在细胞溶胶中发挥作用的蛋白质,诸如hsp70蛋白,包括SSA和SSB蛋白,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2编码的蛋白质;
●在细胞核、核被膜和/或细胞质中发挥作用的蛋白质,诸如Pse1p;
●对细胞存活而言必需的蛋白质,诸如PDI或必需的核周蛋白蛋白质,诸如Pse1p;
●参与巯基氧化或二硫键形成、断裂或异构化的蛋白质,或是催化蛋白质中硫醇:二硫化物互换反应的蛋白质,特别是在分泌和细胞表面蛋白的生物合成过程中,诸如蛋白质二硫键异构酶(如Pdi1p、Mpd1p)、同源物(如Eug1p)和/或相关蛋白质(如Mpd2p、Fmo1p、Ero1p);
●参与蛋白质合成、装配或折叠的蛋白质,诸如PDI和Ssa1p;
●优先或专门结合未折叠而非成熟蛋白质的蛋白质,诸如hsp70蛋白,包括SSA和SSB蛋白,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2编码的蛋白质;
●防止蛋白质前体在细胞溶胶中聚集的蛋白质,诸如hsp70蛋白,包括SSA和SSB蛋白,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2编码的蛋白质;
●结合并稳定损坏的蛋白质的蛋白质,例如Ssa1p;
●参与未折叠蛋白质应答或对诱导未折叠蛋白质应答的试剂(诸如衣霉素和二硫苏糖醇)提供升高的抗性的蛋白质,诸如Hjelmqvist等,2002,前述引用描述的ORMDL家族的成员(例如Orm2p)或参与压力应答的蛋白质(如Ubi4p);
●作为辅伴侣蛋白的蛋白质和/或间接参与蛋白质折叠和/或未折叠蛋白质应答的蛋白质(如hsp104p、Mdj1p);
●参与高分子核质转运的蛋白质,诸如Pse1p;
●通过识别核定位序列和核输出序列并与核孔复合体相互作用来介导高分子穿过核膜转运的蛋白质,诸如PSE1;
●EP 0 746 611及Hillson等,1984,Methods Enzymol.,107,281-292中描述的能够再激活被扰乱核糖核酸酶针对RNA的核糖核酸酶活性的蛋白质,诸如PDI;
●具有酸性pI(例如4.0-4.5)的蛋白质,诸如PDI;
●作为Hsp70家族成员且优选具有N端ATP结合结构域和C端肽结合结构域的蛋白质,诸如Ssa1p;
●作为肽基脯氨酸顺反异构酶的蛋白质(如Cpr3p、Cpr6p);
●与已知蛋白伴侣同源的蛋白质(如Hsp10p);
●作为线粒体蛋白伴侣的蛋白质(如Cpr3p);
●作为细胞质或细胞核蛋白伴侣的蛋白质(如Cns1p);
●作为膜结合蛋白伴侣的蛋白质(如Orm2p、Fmo1p);
●具有蛋白伴侣激活物活性或蛋白伴侣调控活性的蛋白质(如Aha1p、Hac1p、Hch1p);
●瞬时结合未成熟形式的多肽以引起正确折叠、转运和/或分泌的蛋白质,包括高效易位进入内质网(如Lhs1p)或它们在细胞内的作用位点(如Pse1p)所需要的蛋白质;
●参与蛋白质复合体装配和/或核糖体装配的蛋白质(如Atp11p、Pse1p、Nob1p);
●陪伴蛋白T复合体的蛋白质(如Cct2p);或
●预折叠复合体的蛋白质(如Pfd1p)。
一种优选的蛋白伴侣是蛋白质二硫键异构酶(PDI)或其在内质网(ER)内腔中具有催化二硫键形成的等价能力的片段或变体。“PDI”包括EP 0 746611和Hillson等,1984,Methods Enzymol.,107,281-292中描述的具有再激活被扰乱核糖核酸酶针对RNA的核糖核酸酶活性的能力的任何蛋白质。
PDI指通常催化硫醇:二硫化物互换反应的酶,它是分泌细胞中内质网内腔中的主要驻留蛋白质成分。大量证据表明它在分泌性蛋白质的生物合成中发挥作用(Freedman,1984,Trends Biochem.Sci.,9,438-41),而且这得到了原位直接交联研究的支持(Roth和Pierce,1987,Biochemistry,26,4179-82)。PDI缺陷的微粒体膜在共翻译蛋白质二硫键形成中显示特异缺陷的发现(Bulleid和Freedman,1988,Nature,335,649-51)暗示该酶在分泌和细胞表面蛋白的生物合成过程中发挥天然二硫键形成催化物的功能。这种作用与已知的该酶在体外的催化特性是一致的;它催化硫醇:二硫化物互换反应,导致净余蛋白质二硫键形成、断裂或异构化,而且通常能够在极其多种还原的、未折叠的蛋白质底物中催化蛋白质折叠和天然二硫键形成(Freedman等,1989,Biochem.Soc.Symp.,55,167-192)。PDI还作为蛋白伴侣发挥作用,因为缺乏异构酶活性的突变型PDI加速蛋白质折叠(Hayano等,1995,FEBS Letters,377,505-511)。最近,有报道说巯基氧化而非二硫键异构化是蛋白质二硫键异构酶在酿酒酵母中的主要功能(Solovyov等,2004,J.Biol.Chem.,279(33),34095-34100)。已经知道该酶在数个物种中的DNA和氨基酸序列(Scherens等,1991,Yeast,7,185-193;Farquhar等,1991,Gene,108,81-89;EP 074 661;EP 0 293 793;EP 0 509841),而且关于由哺乳动物肝脏纯化至同质的酶的作用机制的信息日益增加(Creighton等,1980,J.Mol.Biol.,142,43-62;Freedman等,1988,Biochem.Soc.Trans.,16,96-9;Gilbert,1989,Biochemistry,28,7298-7305;Lundstrom和Holmgren,1990,J.Biol.Chem.,265,9114-9120;Hawkins和Freedman,1990,Biochem.J.,275,335-339)。在目前涉及在细胞中作为蛋白质折叠、装配和易位的介导物的许多蛋白质因子中(Rothman,1989,Cell,59,591-601),PDI具有充分鉴定的催化活性。
宿主中内源PDI基因的删除或灭活导致不能生存的宿主的生成。换言之,内源PDI基因是“必需”基因。
PDI易于由哺乳动物组织分离,而且同质的酶是具有特征性酸性pI(4.0-4.5)的二聚体(2x57kD)(Hillson等,1984,前述引用)。还已经由小麦和藻类莱茵衣藻(Chlamydomonas reinhardii)(Kaska等,1990,Biochem.J.,268,63-68)、大鼠(Edman等,1985,Nature,317,267-270)、牛(Yamauchi等,1987,Biochem.Biophys.Res.Comm.,146,1485-1492)、人(Pihlajaniemi等,1987,EMBO J.,6,643-9)、酵母(Scherens等,前述引用;Farquhar等,前述引用)和鸡(Parkkonen等,1988,Biochem.J.,256,1005-1011)纯化得到该酶。来自这些脊椎动物物种的蛋白质整个显示高度的序列保守性,而且都显示数项最初在大鼠PDI序列中注意到的总体特征(Edman等,1985,前述引用)。
优选的PDI序列包括来自人的那些和来自酵母物种诸如酿酒酵母的那些。
酵母蛋白质二硫键异构酶前体PDI1可以以基因库编号CAA42373或BAA00723找到。它具有522个氨基酸的如下序列:
1   mkfsagavls wsslllassv faqqeavape dsavvklatd sfneyiqshd lvlaeffapw
61  cghcknmape yvkaaetlve knitlaqidc tenqdlcmeh nipgfpslki fknsdvnnsi
121 dyegprtaea ivqfmikqsq pavavvadlp aylanetfvt pvivqsgkid adfnatfysm
181 ankhfndydf vsaenadddf klsiylpsam depvvyngkk adiadadvfe kwlqvealpy
241 fgeidgsvfa qyvesglplg ylfyndeeel eeykplftel akknrglmnf vsidarkfgr
301 hagnlnmkeq fplfaihdmt edlkyglpql seeafdelsd kivleskaie slvkdflkgd
361 aspivksqei fenqdssvfq lvgknhdeiv ndpkkdvlvl yyapwcghck rlaptyqela
421 dtyanatsdv liakldhten dvrgvviegy ptivlypggk ksesvvyqgs rsldslfdfi
481 kenghfdvdg kalyeeaqek aaeeadadae ladeedaihd el
候选酵母蛋白质二硫键异构酶序列可以以基因库编号CAA38402找到。它具有530个氨基酸的如下序列:
1   mkfsagavls wsslllassv faqqeavape dsavvklatd sfneyiqshd lvlaeffapw
61  cghcknmape yvkaaetlve knitlaqidc tenqdlcmeh nipgfpslki fknrdvnnsi
121 dyegprtaea ivqfmikqsq pavavvadlp aylanetfvt pvivqsgkid adfnatfysm
181 ankhfndydf vsaenadddf klsiylpsam depvvyngkk adiadadvfe kwlqvealpy
241 fgeidgsvfa qyvesglplg ylfyndeeel eeykplftel akknrglmnf vsidarkfgr
301 hagnlnmkeq fplfaihdmt edlkyglpql seeafdelsd kivleskaie slvkdflkgd
361 aspivksqei fenqdssvfq lvgknhdeiv ndpkkdvlvl yyapwcghck rlaptyqela
421 dtyanatsdv liakldhten dvrgvviegy ptivlypggk ksesvvyqgs rsldslfdfi
481 kenghfdvdg kalyeeaqek aaeeaeadae aeadadaela deedaihdel
这些序列的如下对比(基因库编号CAA42373或BAA00723的序列在上,基因库编号CAA38402的序列在下)显示了这两种序列之间的差异在于位置114处的单个氨基酸差异(以粗体突出显示),而且由基因库编号CAA38402定义的序列在位置506-513处含有额外氨基酸EADAEAEA。
1   mkfsagavls wsslllassv faqqeavape dsavvklatd sfneyiqshd lvlaeffapw
1   mkfsagavls wsslllassv faqqeavape dsavvklatd sfneyiqshd lvlaeffapw
61  cghcknmape yvkaaetlve knitlaqidc tenqdlcmeh nipgfpslki fknsdvnnsi
61  cghcknmape yvkaaetlve knitlaqidc tenqdlcmeh nipgfpslki fknrdvnnsi
121 dyegprtaea ivqfmikqsq pavavvadlp aylanetfvt pvivqsgkid adfnatfysm
121 dyegprtaea ivqfmikqsq pavavvadlp aylanetfvt pvivqsgkid adfnatfysm
181 ankhfndydf vsaenadddf klsiylpsam depvvyngkk adiadadvfe kwlqvealpy
181 ankhfndydf vsaenadddf klsiylpsam depvvyngkk adiadadvfe kwlqvealpy
241 fgeidgsvfa qyvesglplg ylfyndeeel eeykplftel akknrglmnf vsidarkfgr
241 fgeidgsvfa qyvesglplg ylfyndeeel eeykplftel akknrglmnf vsidarkfgr
301 hagnlnmkeq fplfaihdmt edlkyglpql seeafdelsd kivleskaie slvkdflkgd
301 hagnlnmkeq fplfaihdmt edlkyglpql seeafdelsd kivleskaie slvkdflkgd
361 aspivksqei fenqdssvfq lvgknhdeiv ndpkkdvlvl yyapwcghck rlaptyqela
361 aspivksqei fenqdssvfq lvgknhdeiv ndpkkdvlvl yyapwcghck rlaptyqela
421 dtyanatsdv liakldhten dvrgvviegy ptivlypggk ksesvvyqgs rsldslfdfi
421 dtyanatsdv liakldhten dvrgvviegy ptivlypggk ksesvvyqgs rsldslfdfi
481 kenghfdvdg kalyeeaqek aaeea***** ***dadaela deedaihdel
481 kenghfdvdg kalyeeaqek aaeeaeadae aeadadaela deedaihdel
本发明还包括上述PDI序列的变体和片段,以及其它天然存在PDI序列的变体。“变体”在PDI的语境中指其中一个或多个位置存在或保守的或非保守的氨基酸插入、删除、或替代的蛋白质,只要这些变化产生其基本特性例如酶促活性(活性的类型和特异性)、热稳定性、在某些pH范围中的活性(pH稳定性)没有显著变化的蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。优选的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
“变体”通常与衍生它的多肽具有至少25%、至少50%、至少60%或至少70%、优选至少80%、更加优选至少90%、甚至更加优选至少95%、仍然更加优选至少99%、最优选至少99.5%的序列同一性。
可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,正如下文所讨论的。这些变体可以是天然的,或是使用本领域众所周知的蛋白质工程和定点诱变的方法人造的。
“片段”在PDI的语境中指一个或多个位置存在删除的蛋白质。由此,片段可以包含完整成熟PDI蛋白质的完整序列的至多5%、10%、20%、30%、40%或50%、通常可高达60%、更典型的是可高达70%、优选可高达80%、更加优选可高达90%、甚至更加优选可高达95%、仍然更加优选可高达99%。特别优选的PDI蛋白质的片段包含期望蛋白质的一个或多个完整结构域。
PDI的片段或变体可以是在宿主细胞诸如酿酒酵母中重组表达时能够补足宿主细胞中内源编码PDI基因的删除的蛋白质,而且可以是例如PDI的天然存在同系物,诸如由另一种生物体诸如另一种酵母或其它真菌、或另一种真核生物诸如人或其它脊椎动物、或动物或由植物编码的同系物。
另一种优选的蛋白伴侣是SSA1或其具有等价蛋白伴侣样活性的片段或变体。SSA1,也称为YG100,位于酿酒酵母的染色体I上,且大小为1.93kb。
SSA1的一种已发表蛋白质序列如下:
MSKAVGIDLGTTYSCVAHFANDRVDIIANDQGNRTTPSFVAFTDTERLIGDAAKNQAAMN
PSNTVFDAKRLIGRNFNDPEVQADMKHFPFKLIDVDGKPQIQVEFKGETKNFTPEQISSM
VLGKMKETAESYLGAKVNDAVVTVPAYFNDSQRQATKDAGTIAGLNVLRIINEPTAAAIA
YGLDKKGKEEHVLIFDLGGGTFDVSLLFIEDGIFEVKATAGDTHLGGEDFDNRLVNHFIQ
EFKRKNKKDLSTNQRALRRLRTACERAKRTLSSSAQTSVEIDSLFEGIDFYTSITRARFE
ELCADLFRSTLDPVEKVLRDAKLDKSQVDEIVLVGGSTRIPKVQKLVTDYFNGKEPNRSI
NPDEAVAYGAAVQAAILTGDESSKTQDLLLLDVAPLSLGIETAGGVMTKLIPRNSTISTK
KFEIFSTYADNQPGVLIQVFEGERAKTKDNNLLGKFELSGIPPAPRGVPQIEVTFDVDSN
GILNVSAVEKGTGKSNKITITNDKGRLSKEDIEKMVAEAEKFKEEDEKESQRIASKNQLE
SIAYSLKNTISEAGDKLEQADKDTVTKKAEETISWLDSNTTASKEEFDDKLKELQDIANP
IMSKLYQAGGAPGGAAGGAPGGFPGGAPPAPEAEGPTVEEVD
SSA1的一种已发表编码序列如下,但是应当认识到,可以通过简并替代来修饰序列以获得编码相同蛋白质产物的候选核苷酸序列:
ATGTCAAAAGCTGTCGGTATTGATTTAGGTACAACATACTCGTGTGTTGCTCACTTTGCT
AATGATCGTGTGGACATTATTGCCAACGATCAAGGTAACAGAACCACTCCATCTTTTGTC
GCTTTCACTGACACTGAAAGATTGATTGGTGATGCTGCTAAGAATCAAGCTGCTATGAAT
CCTTCGAATACCGTTTTCGACGCTAAGCGTTTGATCGGTAGAAACTTCAACGACCCAGAA
GTGCAGGCTGACATGAAGCACTTCCCATTCAAGTTGATCGATGTTGACGGTAAGCCTCAA
ATTCAAGTTGAATTTAAGGGTGAAACCAAGAACTTTACCCCAGAACAAATCTCCTCCATG
GTCTTGGGTAAGATGAAGGAAACTGCCGAATCTTACTTGGGAGCCAAGGTCAATGACGCT
GTCGTCACTGTCCCAGCTTACTTCAACGATTCTCAAAGACAAGCTACCAAGGATGCTGGT
ACCATTGCTGGTTTGAATGTCTTGCGTATTATTAACGAACCTACCGCCGCTGCCATTGCT
TACGGTTTGGACAAGAAGGGTAAGGAAGAACACGTCTTGATTTTCGACTTGGGTGGTGGT
ACTTTCGATGTCTCTTTGTTGTTCATTGAAGACGGTATCTTTGAAGTTAAGGCCACCGCT
GGTGACACCCATTTGGGTGGTGAAGATTTTGACAACAGATTGGTCAACCACTTCATCCAA
GAATTCAAGAGAAAGAACAAGAAGGACTTGTCTACCAACCAAAGAGCTTTGAGAAGATTA
AGAACCGCTTGTGAAAGAGCCAAGAGAACTTTGTCTTCCTCCGCTCAAACTTCCGTTGAA
ATTGACTCTTTGTTCGAAGGTATCGATTTCTACACTTCCATCACCAGAGCCAGATTCGAA
GAATTGTGTGCTGACTTGTTCAGATCTACTTTGGACCCAGTTGAAAAGGTCTTGAGAGAT
GCTAAATTGGACAAATCTCAAGTCGATGAAATTGTCTTGGTCGGTGGTTCTACCAGAATT
CCAAAGGTCCAAAAATTGGTCACTGACTACTTCAACGGTAAGGAACCAAACAGATCTATC
AACCCAGATGAAGCTGTTGCTTACGGTGCTGCTGTTCAAGCTGCTATTTTGACTGGTGAC
GAATCTTCCAAGACTCAAGATCTATTGTTGTTGGATGTCGCTCCATTATCCTTGGGTATT
GAAACTGCTGGTGGTGTCATGACCAAGTTGATTCCAAGAAACTCTACCATTTCAACAAAG
AAGTTCGAGATCTTTTCCACTTATGCTGATAACCAACCAGGTGTCTTGATTCAAGTCTTT
GAAGGTGAAAGAGCCAAGACTAAGGACAACAACTTGTTGGGTAAGTTCGAATTGAGTGGT
ATTCCACCAGCTCCAAGAGGTGTCCCACAAATTGAAGTCACTTTCGATGTCGACTCTAAC
GGTATTTTGAATGTTTCCGCCGTCGAAAAGGGTACTGGTAAGTCTAACAAGATCACTATT
ACCAACGACAAGGGTAGATTGTCCAAGGAAGATATCGAAAAGATGGTTGCTGAAGCCGAA
AAATTCAAGGAAGAAGATGAAAAGGAATCTCAAAGAATTGCTTCCAAGAACCAATTGGAA
TCCATTGCTTACTCTTTGAAGAACACCATTTCTGAAGCTGGTGACAAATTGGAACAAGCT
GACAAGGACACCGTCACCAAGAAGGCTGAAGAGACTATTTCTTGGTTAGACAGCAACACC
ACTGCCAGCAAGGAAGAATTCGATGACAAGTTGAAGGAGTTGCAAGACATTGCCAACCCA
ATCATGTCTAAGTTGTACCAAGCTGGTGGTGCTCCAGGTGGCGCTGCAGGTGGTGCTCCA
GGCGGTTTCCCAGGTGGTGCTCCTCCAGCTCCAGAGGCTGAAGGTCCAACCGTTGAAGAA
GTTGATTAA
蛋白质Ssa1p属于Hsp70蛋白质家族,而且驻留在细胞溶胶中。Hsp70具有执行许多蛋白伴侣活性的能力;帮助蛋白质合成、装配和折叠;介导多肽易位至多种胞内位置和分解蛋白质聚集体(Backer和Craig,1994,Eur.J.Biochem.,219,11-23)。Hsp70基因高度保守,具有N端ATP结合结构域和C端肽结合结构域。Hsp70蛋白质与蛋白质(主要是未折叠的)的肽主链相互作用。hsp70蛋白质对肽的结合和释放是依赖ATP的过程,而且伴随着hsp70的构象变化(Becher和Craig,1994,前述引用)。
细胞溶胶hsp70蛋白质特别参与蛋白质的合成、折叠和分泌(Becher和Craig,1994,前述引用)。在酿酒酵母中,已经将细胞溶胶hsp70蛋白质分成两组,SSA(SSA 1-4)和SSB(SSB 1和2)蛋白质,它们在功能上彼此截然不同。SSA家族是必需的,即为了维持细胞的存活,至少一种来自该组的蛋白质必须是有活性的(Becher和Craig,1994,前述引用)。细胞溶胶hsp70蛋白质优先结合未折叠的和不成熟的蛋白质。这说明它们通过将蛋白质前体在细胞溶胶中在装配成多分子复合体前维持未折叠状态和/或推动它们易位至多种细胞器来防止其聚集(Becher和Craig,1994,前述引用)。SSA蛋白质特别参与前体易位进入内质网和线粒体的翻译后生物发生和维持(Kim等,1998,Proc.Natl.Acad.Sci.USA,95,12860-12865;Ngosuwan等,2003,J.Biol.Chem.,278(9),7034-7042)。已经证明Ssa1p结合损坏的蛋白质,使之稳定于部分未折叠形式并容许发生重折叠或降解(Becher和Craig,1994,前述引用;Glover和Lindquist,1998,Cell,94,73-82)。
Demolder等,1994,J.Biotechnol.,32,179-189报道了SSA1在酵母中的过度表达提高整合在染色体中的编码人干扰素-β的重组基因的表达。没有提出,如果由相同质粒上的重组基因来编码SSA1和人干扰素-β,那么将能够实现异源基因表达的增加。事实上,根据蛋白伴侣在酵母中过度表达领域的最新发展(如Robinson等,1994,前述引用;Hayano等,1995,前述引用;Shusta等,1998,前述引用;Parekh和Wittrup,1997,前述引用;Bao和Fukuhara,2001,前述引用;及Bao等,2000,前述引用),为了提高异源蛋白质的表达水平,技术人员将根本不愿由2μm家族质粒来表达SSA1,比由2μm家族质粒表达SSA1和异源蛋白质二者低得多。
本发明还包括SSA1的变体和片段。“变体”在SSA1的语境中指具有天然SSA1的序列,只是一个或多个位置存在或保守的或非保守的氨基酸插入、删除、或替代的蛋白质,只要这些变化产生其基本特性例如酶促活性(活性的类型和特异性)、热稳定性、在某些pH范围中的活性(pH稳定性)没有显著变化的蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。优选的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
SSA1的“变体”通常与天然SSA1的序列具有至少25%、至少50%、至少60%或至少70%、优选至少80%、更加优选至少90%、甚至更加优选至少95%、仍然更加优选至少99%、最优选至少99.5%的序列同一性。
可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,正如下文所讨论的。这些变体可以是天然的,或是使用本领域众所周知的蛋白质工程和定点诱变的方法人造的。
“片段”在SSA1的语境中指具有天然SSA1的序列,只是一个或多个位置存在删除的蛋白质。由此,片段可以包含完整成熟SSA1蛋白质的完整序列的至多5%、10%、20%、30%、40%或50%、通常可高达60%、更典型的是可高达70%、优选可高达80%、更加优选可高达90%、甚至更加优选可高达95%、仍然更加优选可高达99%。特别优选的SSA1蛋白质的片段包含期望蛋白质的一个或多个完整结构域。
SSA1的片段或变体可以是在宿主细胞诸如酿酒酵母中重组表达时能够补足宿主细胞中内源编码SSA1基因(或其同系物)的删除的蛋白质,而且可以是例如SSA1的天然存在同系物,诸如由另一种生物体诸如另一种酵母或其它真菌、或另一种真核生物诸如人或其它脊椎动物、或动物或由植物编码的同系物。
另一种优选的蛋白伴侣是PSE1或其具有等价蛋白伴侣样活性的片段或变体。
PSE1,也称为KAP121,是一种必需基因,位于染色体XIII上。
蛋白质Pse1p的一种已发表蛋白质序列如下:
MSALPEEVNRTLLQIVQAFASPDNQIRSVAEKALSEEWITENNIEYLLTFLAEQAAFSQD
TTVAALSAVLFRKLALKAPPSSKLMIMSKNITHIRKEVLAQIRSSLLKGFLSERADSIRH
KLSDAIAECVQDDLPAWPELLQALIESLKSGNPNFRESSFRILTTVPYLITAVDINSILP
IFQSGFTDASDNVKIAAVTAFVGYFKQLPKSEWSKLGILLPSLLNSLPRFLDDGKDDALA
SVFESLIELVELAPKLFKDMFDQIIQFTDMVIKNKDLEPPARTTALELLTVFSENAPQMC
KSNQNYGQTLVMVTLIMMTEVSIDDDDAAEWIESDDTDDEEEVTYDHARQALDRVALKLG
GEYLAAPLFQYLQQMITSTEWRERFAAMMALSSAAEGCADVLIGEIPKILDMVIPLINDP
HPRVQYGCCNVLGQISTDFSPFIQRTAHDRILPALISKLTSECTSRVQTHAAAALVNFSE
FASKDILEPYLDSLLTNLLVLLQSNKLYVQEQALTTIAFIAEAAKNKFIKYYDTLMPLLL
NVLKVNNKDNSVLKGKCMECATLIGFAVGKEKFHEHSQELISILVALQNSDIDEDDALRS
YLEQSWSRICRILGDDFVPLLPIVIPPLLITAKATQDVGLIEEEEAANFQQYPDWDVVQV
QGKHIAIHTSVLDDKVSAMELLQSYATLLRGQFAVYVKEVMEEIALPSLDFYLHDGVRAA
GATLIPILLSCLLAATGTQNEELVLLWHKASSKLIGGLMSEPMPEITQVYHNSLVNGIKV
MGDNCLSEDQLAAFTKGVSANLTDTYERMQDRHGDGDEYNENIDEEEDFTDEDLLDEINK
SIAAVLKTTNGHYLKNLENIWPMINTFLLDNEPILVIFALVVIGDLIQYGGEQTASMKNA
FIPKVTECLISPDARIRQAASYIIGVCAQYAPSTYADVCIPTLDTLVQIVDFPGSKLEEN
RSSTENASAAIAKILYAYNSNIPNVDTYTANWFKTLPTITDKEAASFNYQFLSQLIENNS
PIVCAQSNISAVVDSVIQALNERSLTEREGQTVISSVKKLLGFLPSSDAMAIFNRYPADI
MEKVHKWFA*
PSE1的一种已发表核苷酸编码序列如下,但是应当认识到,可以通过简并替代来修饰序列以获得编码相同蛋白质产物的候选核苷酸序列:
ATGTCTGCTTTACCGGAAGAAGTTAATAGAACATTACTTCAGATTGTCCAGGCGTTTGCT
TCCCCTGACAATCAAATACGTTCTGTAGCTGAGAAGGCTCTTAGTGAAGAATGGATTACC
GAAAACAATATTGAGTATCTTTTAACTTTTTTGGCTGAACAAGCCGCTTTCTCCCAAGAT
ACAACAGTTGCAGCATTATCTGCTGTTCTGTTTAGAAAATTAGCATTAAAAGCTCCCCCT
TCTTCGAAGCTTATGATTATGTCCAAAAATATCACACATATTAGGAAAGAAGTTCTTGCA
CAAATTCGTTCTTCATTGTTAAAAGGGTTTTTGTCGGAAAGAGCTGATTCAATTAGGCAC
AAACTATCTGATGCTATTGCTGAGTGTGTTCAAGACGACTTACCAGCATGGCCAGAATTA
CTACAAGCTTTAATAGAGTCTTTAAAAAGCGGTAACCCAAATTTTAGAGAATCCAGTTTT
AGAATTTTGACGACTGTACCTTATTTAATTACCGCTGTTGACATCAACAGTATCTTACCA
ATTTTTCAATCAGGCTTTACTGATGCAAGTGATAATGTCAAAATTGCTGCAGTTACGGCT
TTCGTGGGTTATTTTAAGCAACTACCAAAATCTGAGTGGTCCAAGTTAGGTATTTTATTA
CCAAGTCTTTTGAATAGTTTACCAAGATTTTTAGATGATGGTAAGGACGATGCCCTTGCA
TCAGTTTTTGAATCGTTAATTGAGTTGGTGGAATTGGCACCAAAACTATTCAAGGATATG
TTTGACCAAATAATACAATTCACTGATATGGTTATAAAAAATAAGGATTTAGAACCTCCA
GCAAGAACCACAGCACTCGAACTGCTAACCGTTTTCAGCGAGAACGCTCCCCAAATGTGT
AAATCGAACCAGAATTACGGGCAAACTTTAGTGATGGTTACTTTAATCATGATGACGGAG
GTATCCATAGATGATGATGATGCAGCAGAATGGATAGAATCTGACGATACCGATGATGAA
GAGGAAGTTACATATGACCACGCTCGTCAAGCTCTTGATCGTGTTGCTTTAAAGCTGGGT
GGTGAATATTTGGCTGCACCATTGTTCCAATATTTACAGCAAATGATCACATCAACCGAA
TGGAGAGAAAGATTCGCGGCCATGATGGCACTTTCCTCTGCAGCTGAGGGTTGTGCTGAT
GTTCTGATCGGCGAGATCCCAAAAATCCTGGATATGGTAATTCCCCTCATCAACGATCCT
CATCCAAGAGTACAGTATGGATGTTGTAATGTTTTGGGTCAAATATCTACTGATTTTTCA
CCATTCATTCAAAGAACTGCACACGATAGAATTTTGCCGGCTTTAATATCTAAACTAACG
TCAGAATGCACCTCAAGAGTTCAAACGCACGCCGCAGCGGCTCTGGTTAACTTTTCTGAA
TTCGCTTCGAAGGATATTCTTGAGCCTTACTTGGATAGTCTATTGACAAATTTATTAGTT
TTATTACAAAGCAACAAACTTTACGTACAGGAACAGGCCCTAACAACCATTGCATTTATT
GCTGAAGCTGCAAAGAATAAATTTATCAAGTATTACGATACTCTAATGCCATTATTATTA
AATGTTTTGAAGGTTAACAATAAAGATAATAGTGTTTTGAAAGGTAAATGTATGGAATGT
GCAACTCTGATTGGTTTTGCCGTTGGTAAGGAAAAATTTCATGAGCACTCTCAAGAGCTG
ATTTCTATATTGGTCGCTTTACAAAACTCAGATATCGATGAAGATGATGCGCTCAGATCA
TACTTAGAACAAAGTTGGAGCAGGATTTGCCGAATTCTGGGTGATGATTTTGTTCCGTTG
TTACCGATTGTTATACCACCCCTGCTAATTACTGCCAAAGCAACGCAAGACGTCGGTTTA
ATTGAAGAAGAAGAAGCAGCAAATTTCCAACAATATCCAGATTGGGATGTTGTTCAAGTT
CAGGGAAAACACATTGCTATTCACACATCCGTCCTTGACGATAAAGTATCAGCAATGGAG
CTATTACAAAGCTATGCGACACTTTTAAGAGGCCAATTTGCTGTATATGTTAAAGAAGTA
ATGGAAGAAATAGCTCTACCATCGCTTGACTTTTACCTACATGACGGTGTTCGTGCTGCA
GGAGCAACTTTAATTCCTATTCTATTATCTTGTTTACTTGCAGCCACCGGTACTCAAAAC
GAGGAATTGGTATTGTTGTGGCATAAAGCTTCGTCTAAACTAATCGGAGGCTTAATGTCA
GAACCAATGCCAGAAATCACGCAAGTTTATCACAACTCGTTAGTGAATGGTATTAAAGTC
ATGGGTGACAATTGCTTAAGCGAAGACCAATTAGCGGCATTTACTAAGGGTGTCTCCGCC
AACTTAACTGACACTTACGAAAGGATGCAGGATCGCCATGGTGATGGTGATGAATATAAT
GAAAATATTGATGAAGAGGAAGACTTTACTGACGAAGATCTTCTCGATGAAATCAACAAG
TCTATCGCGGCCGTTTTGAAAACCACAAATGGTCATTATCTAAAGAATTTGGAGAATATA
TGGCCTATGATAAACACATTCCTTTTAGATAATGAACCAATTTTAGTCATTTTTGCATTA
GTAGTGATTGGTGACTTGATTCAATATGGTGGCGAACAAACTGCTAGCATGAAGAACGCA
TTTATTCCAAAGGTTACCGAGTGCTTGATTTCTCCTGACGCTCGTATTCGCCAAGCTGCT
TCTTATATAATCGGTGTTTGTGCCCAATACGCTCCATCTACATATGCTGACGTTTGCATA
CCGACTTTAGATACACTTGTTCAGATTGTCGATTTTCCAGGCTCCAAACTGGAAGAAAAT
CGTTCTTCAACAGAGAATGCCAGTGCAGCCATCGCCAAAATTCTTTATGCATACAATTCC
AACATTCCTAACGTAGACACGTACACGGCTAATTGGTTCAAAACGTTACCAACAATAACT
GACAAAGAAGCTGCCTCATTCAACTATCAATTTTTGAGTCAATTGATTGAAAATAATTCG
CCAATTGTGTGTGCTCAATCTAATATCTCCGCTGTAGTTGATTCAGTCATACAAGCCTTG
AATGAGAGAAGTTTGACCGAAAGGGAAGGCCAAACGGTGATAAGTTCAGTTAAAAAGTTG
TTGGGATTTTTGCCTTCTAGTGATGCTATGGCAATTTTCAATAGATATCCAGCTGATATT
ATGGAGAAAGTACATAAATGGTTTGCATAA
PSE1基因的大小是3.25kb。Pse1p参与高分子的核质转运(Seedorf和Silver,1997,Proc.Natl.Acad.Sci.USA,94,8590-8595)。该过程经由包埋在核被膜中且由核孔蛋白构成的核孔复合体(NPC)发生(Ryan和Wente,2000,Curr.Opin.Cell Biol.,12,361-371)。蛋白质具有包含核输入(核定位序列(NLS))和输出(核输出序列(NES))所需信息的特异序列(Pemberton等,1998,Curr.Opin.Cell Biol.,10,392-399)。Pse1p是核周蛋白/输入蛋白,分成α和β家族的一组蛋白质。核周蛋白是通过识别NLS和NES并与NPC相互作用来介导高分子转运穿过核膜的可溶性转运因子(Seedorf和Silver,1997,前述引用;Pemberton等,1998,前述引用;Ryan和Wente,2000,前述引用)。穿过核孔的易位是由GTP水解驱动的,后者是由小GTP结合蛋白质Ran催化的(Seedorf和Silver,1997,前述引用)。已经将Pse1p鉴定为核周蛋白β。已经在酿酒酵母中鉴定了14种核周蛋白β蛋白质,其中只有4种是必需的。这可能是因为多种核周蛋白可以介导一种高分子的转运(Isoyama等,2001,J.Biol.Chem.,276(24),21863-21869)。Pse1p定位于细胞核,位于核被膜,而且在某种程度上延伸至细胞质。这说明该蛋白质移动出入细胞核作为其转运功能的一部分(Seedorf和Silver,1997,前述引用)。Pse1p参与转录因子(Isoyama等,2001,前述引用;Ueta等,2003,J.Biol.Chem.,278(50),50120-50127)、组蛋白(Mosammaparast等,2002,J.Biol.Chem.,277(1),862-868)、和核糖体蛋白质(在它们装配成核糖体前)(Pemberton等,1998,前述引用)的核输入。它还介导mRNA由细胞核的输出。核周蛋白识别并结合在RNA结合蛋白上找到的NES,该RNA结合蛋白在RNA由细胞核输出前将其包被(Seedorf和Silver,1997,前述引用;Pemberton等,1998,前述引用)。
由于高分子的核质转运对于正确进行细胞周期是至关重要的,因此核转运因子诸如Pse1p成为生长控制的新型候选靶(Seedorf和Silver,1997,前述引用)。
已经证明酿酒酵母中Pse1p(蛋白质分泌增强子)的过度表达提高一系列生物学活性蛋白质的蛋白质分泌水平(Chow等,1992,J.Cell.Sci.,101(3),709-719)。没有提出,如果由相同质粒上的重组基因来编码PSE1和异源蛋白质,那么将能够实现异源基因表达的增加。事实上,根据蛋白伴侣在酵母中过度表达领域的最新发展(如Robinson等,1994,前述引用;Hayano等,1995,前述引用;Shusta等,1998,前述引用;Parekh和Wittrup,1997,前述引用;Bao和Fukuhara,2001,前述引用;及Bao等,2000,前述引用),为了提高异源蛋白质的表达水平,技术人员将根本不会尝试由2μm家族质粒来表达PSE1,比由2μm家族质粒表达PSE1和异源蛋白质二者低得多。
本发明还包括PSE1的变体和片段。“变体”在PSE1的语境中指具有天然PSE1的序列,只是其中一个或多个位置存在或保守的或非保守的氨基酸插入、删除、或替代的蛋白质,只要这些变化产生其基本特性例如酶促活性(活性的类型和特异性)、热稳定性、在某些pH范围中的活性(pH稳定性)没有显著变化的蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。优选的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
PSE1的“变体”通常与天然PSE1的序列具有至少25%、至少50%、至少60%或至少70%、优选至少80%、更加优选至少90%、甚至更加优选至少95%、仍然更加优选至少99%、最优选至少99.5%的序列同一性。
可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,正如下文所讨论的。这些变体可以是天然的,或是使用本领域众所周知的蛋白质工程和定点诱变的方法人造的。
“片段”在PSE1的语境中指具有天然PSE1的序列,只是一个或多个位置存在删除的蛋白质。由此,片段可以包含完整成熟PSE1蛋白质的完整序列的至多5%、10%、20%、30%、40%或50%、通常可高达60%、更典型的是可高达70%、优选可高达80%、更加优选可高达90%、甚至更加优选可高达95%、仍然更加优选可高达99%。特别优选的PSE1蛋白质的片段包含期望蛋白质的一个或多个完整结构域。
PSE1的片段或变体可以是在宿主细胞诸如酿酒酵母中重组表达时能够补足宿主细胞中内源PSE1基因的删除的蛋白质,而且可以是例如PSE1的天然存在同系物,诸如由另一种生物体诸如另一种酵母或其它真菌、或另一种真核生物诸如人或其它脊椎动物、或动物或由植物编码的同系物。
另一种优选的蛋白伴侣是ORM2或其具有等价蛋白伴侣样活性的片段或变体。
ORM2,也称为YLR350W,位于酿酒酵母基因组的染色体XII上(位置828729至829379),且编码与酵母蛋白质Orm1p具有相似性的进化保守的蛋白质。Hjelmqvist等,2002,Genome Biology,3(6),research 0027.1-0027.6报告了ORM2属于包括三种人类基因(ORMDL1、ORMDL2和ORMDL3)以及微孢子虫、植物、果蝇、尾索动物和脊椎动物中的同系物的基因家族。有报道说ORMDL基因编码锚定在内质网(ER)中的跨膜蛋白质。
蛋白质Orm2p是针对诱导未折叠蛋白质应答的试剂的抗性所需要的。Hjelmqvist等,2002,前述引用报告了两种酿酒酵母ORMDL同系物(ORM1和ORM2)的双重敲除导致生长速率降低和针对衣霉素(tunicamycin)和二硫苏糖醇的敏感性增加。
Orm2p的一种已发表序列如下:
MIDRTKNESPAFEESPLTPNVSNLKPFPSQSNKISTPVTDHRRRRSSSVISHVEQETFED
ENDQQMLPNMNATWVDQRGAWLIHIVVIVLLRLFYSLFGSTPKWTWTLTNMTYIIGFYIM
FHLVKGTPFDFNGGAYDNLTMWEQINDETLYTPTRKFLLIVPIVLFLISNQYYRNDMTLF
LSNLAVTVLIGVVPKLGITHRLRISIPGITGRAQIS*
上述蛋白质在酿酒酵母中是由如下编码核苷酸序列编码的,但是应当认识到,可以通过简并替代来修饰序列以获得编码相同蛋白质产物的候选核苷酸序列:
ATGATTGACCGCACTAAAAACGAATCTCCAGCTTTTGAAGAGTCTCCGCTTACCCCCAAT
GTGTCTAACCTGAAACCATTCCCTTCTCAAAGCAACAAAATATCCACTCCAGTGACCGAC
CATAGGAGAAGACGGTCATCCAGCGTAATATCACATGTGGAACAGGAAACCTTCGAAGAC
GAAAATGACCAGCAGATGCTTCCCAACATGAACGCTACGTGGGTCGACCAGCGAGGCGCG
TGGTTGATTCATATCGTCGTAATAGTACTCTTGAGGCTCTTCTACTCCTTGTTCGGGTCG
ACGCCCAAATGGACGTGGACTTTAACAAACATGACCTACATCATCGGATTCTATATCATG
TTCCACCTTGTCAAAGGTACGCCCTTCGACTTTAACGGTGGTGCGTACGACAACCTGACC
ATGTGGGAGCAGATTAACGATGAGACTTTGTACACACCCACTAGAAAATTTCTGCTGATT
GTACCCATTGTGTTGTTCCTGATTAGCAACCAGTACTACCGCAACGACATGACACTATTC
CTCTCCAACCTCGCCGTGACGGTGCTTATTGGTGTCGTTCCTAAGCTGGGAATTACGCAT
AGACTAAGAATATCCATCCCTGGTATTACGGGCCGTGCTCAAATTAGTTAG
本发明还包括ORM2的变体和片段。“变体”在ORM2的语境中指具有天然ORM2的序列,只是其中一个或多个位置存在或保守的或非保守的氨基酸插入、删除、或替代的蛋白质,只要这些变化产生其基本特性例如酶促活性(活性的类型和特异性)、热稳定性、在某些pH范围中的活性(pH稳定性)没有显著变化的蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。优选的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
ORM2的“变体”通常与天然ORM2的序列具有至少25%、至少50%、至少60%或至少70%、优选至少80%、更加优选至少90%、甚至更加优选至少95%、仍然更加优选至少99%、最优选至少99.5%的序列同一性。
可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,正如下文所讨论的。这些变体可以是天然的,或是使用本领域众所周知的蛋白质工程和定点诱变的方法人造的。
“片段”在ORM2的语境中指具有天然ORM2的序列,只是一个或多个位置存在删除的蛋白质。由此,片段可以包含完整成熟ORM2蛋白质的完整序列的至多5%、10%、20%、30%、40%或50%、通常可高达60%、更典型的是可高达70%、优选可高达80%、更加优选可高达90%、甚至更加优选可高达95%、仍然更加优选可高达99%。特别优选的ORM2蛋白质的片段包含期望蛋白质的一个或多个完整结构域。
ORM2的片段或变体可以是在宿主细胞诸如酿酒酵母中重组表达时能够补足宿主细胞中内源ORM2基因的删除的蛋白质,而且可以是例如ORM2的天然存在同系物,诸如由另一种生物体诸如另一种酵母或其它真菌、或另一种真核生物诸如人或其它脊椎动物、或动物或由植物编码的同系物。
可以以下文关于编码异源蛋白质的基因讨论的同样方式形成编码包含蛋白伴侣之序列的蛋白质的基因,特别强调ORF与调控区的组合。
术语“蛋白质”在用于本文时包括所有天然的和非天然的蛋白质、多肽和肽。“异源蛋白质”指不是天然由2μm家族质粒编码的蛋白质,还可以描述为“非2μm家族质粒蛋白质”。为了方便,术语“异源蛋白质”和“非2μm家族质粒蛋白质”在整篇本申请中同义使用。因此,优选的是,异源蛋白质不是由如下任一质粒编码的FLP、REP1、REP2、或RAF/D蛋白质自鲁氏接合糖酵母获得的pSR1、pSR3或pSR4,自拜列氏接合糖酵母获得的pSB1或pSB2,自发酵接合糖酵母获得的pSM1,自果蝇克鲁维氏酵母获得的pKD1,自膜醭毕赤氏酵母获得的pPM1,及自酿酒酵母获得的2μm质粒。
编码异源蛋白质的基因包含编码异源蛋白质的多核苷酸序列(通常符合任何指定生物体的标准密码子使用率),称为开放读码框(“ORF”)。基因可以额外包含一些不编码开放读码框的多核苷酸序列(称为“非编码区”)。
基因中的非编码区可以包含一种或多种与ORF可操作连接的调控序列,它们容许开放读码框的转录和/或由此得到的转录本的翻译。
术语“调控序列”指调控(即提高或降低)与之可操作连接的ORF的表达(即转录和/或翻译)的序列。调控区通常包括启动子、终止子、核糖体结合位点等等。技术人员将认识到,调控区的选择将取决于预定的表达系统。例如,启动子可以是组成性的或诱导型的,而且可以是细胞或组织类型特异的或非特异的。
合适调控区的长度可以是5bp、10bp、15bp、20bp、25bp、30bp、35bp、40bp、45bp、50bp、60bp、70bp、80bp、90bp、100bp、120bp、140bp、160bp、180bp、200bp、220bp、240bp、260bp、280bp、300bp、350bp、400bp、450bp、500bp、550bp、600bp、650bp、700bp、750bp、800bp、850bp、900bp、950bp、1000bp、1100bp、1200bp、1300bp、1400bp、1500bp或更长。
本领域技术人员将认识到,编码蛋白伴侣诸如PDI的基因可以额外包含非编码区和/或调控区。这些非编码区和调控区不限于通常与蛋白伴侣ORF相关的天然非编码区和/或调控区。
如果表达系统是酵母诸如酿酒酵母的话,那么适合于酿酒酵母的启动子包括与PGK1基因、GAL1或GAL10基因、TEF1、TEF2、PYK1、PMA1、CYC1、PHO5、TRP1、ADH1、ADH2、甘油醛-3-磷酸脱氢酶、己糖激酶、丙酮酸脱羧酶、果糖磷酸激酶、丙糖磷酸异构酶、葡萄糖磷酸异构酶、葡糖激酶的基因、α-交配因子信息素、a-交配因子信息素有关的启动子、PRB1启动子、PRA1启动子、GPD1启动子、和涉及部分5’调控区与部分其它启动子5’调控区或与上游激活位点(如EP-A-258 067的启动子)的杂合体的杂合启动子。
本领域众所周知合适的转录终止信号。如果宿主细胞是真核的话,那么转录终止信号优选衍生自真核基因的3’侧翼序列,它包含转录终止和多聚腺苷酸化的正确信号。合适的3’侧翼序列可以是例如与所用表达控制序列天然相连的那些,即可以与启动子相对应。或者,它们可以是不同的。在那种情况中,且如果宿主是酵母优选酿酒酵母的话,那么优选酿酒酵母ADH1、ADH2、CYC1、或PGK1基因的终止信号。
可能有利的是,异源基因的启动子和开放读码框诸如蛋白伴侣PDI1的那些的侧翼是转录终止序列,使得转录终止序列位于启动子和开放读码框的上游和下游两处,从而防止转录通读进入相邻基因,诸如2μm基因,反之亦然。
在一个实施方案中,在酵母诸如酿酒酵母中偏爱的调控序列包括:酵母启动子(如酿酒酵母PRB1启动子),正如EP 431 880中所讲授的;和转录终止子,优选来自糖酵母ADH1的终止子,正如EP 60 057中所讲授的。优选的是,载体中掺入至少两个翻译终止密码子。
可能有利的是,在非编码区中掺入超过一个编码翻译终止密码子的DNA序列,诸如UAA、UAG或UGA,从而将翻译通读降至最低,并由此避免延长的、非天然融合蛋白的生成。优选翻译终止密码子UAA。
术语“可操作连接”在其含义中包括调控序列位于基因的任何非编码区内,使之与开放读码框形成如下关系,即容许调控区以其预定方式对ORF发挥作用。由此,与ORF“可操作连接”的调控区以这样一种方式安置,使得调控区能够在与调控序列相容的条件下以预定方式影响ORF的转录和/或翻译。
在一个优选的实施方案中,异源蛋白质是分泌性的。在那种情况中,可以在开放读码框中包含编码分泌前导序列的序列,例如WO 90/01063中讲授的,它包含天然HSA分泌前导的大部分,加上酿酒酵母α-交配因子分泌前导的一小部分。
或者,异源蛋白质可以是胞内的。
在另一个优选的实施方案中,异源蛋白质包含真核蛋白质或其片段或变体的序列。合适的真核生物包括真菌、植物和动物。在一个优选的实施方案中,异源蛋白质是真菌蛋白质,诸如酵母蛋白质。在另一个优选的实施方案中,异源蛋白质是动物蛋白质。例示性的动物包括脊椎动物和非脊椎动物。例示性的脊椎动物包括哺乳动物,诸如人和非人哺乳动物。
由此,异源蛋白质可以包含酵母蛋白质的序列。例如,它可以包含来自与衍生2μm家族质粒相同的宿主的酵母蛋白质的序列。本领域技术人员将认识到,本发明第一个、第二个或第三个方面的方法、用途或质粒可以包含编码超过一种异源蛋白质、超过一种蛋白伴侣、或超过一种异源蛋白质和超过一种蛋白伴侣的DNA序列。
在另一个优选的实施方案中,异源蛋白质可以包含清蛋白、单克隆抗体、鬼臼亚乙苷(etoposide)、血清蛋白质(诸如血液凝结因子)、antistasin、蜱抗凝肽(tick anticoagulant peptide)、运铁蛋白、乳铁蛋白、内皮抑制素(endostatin)、抑管张素(angiostatin)、胶原蛋白、免疫球蛋白或基于免疫球蛋白的分子或二者片段(如Small Modular ImmunoPharmaceuticalTM(小模块免疫药物,“SMIP”)或dAb、Fab′片段、F(ab′)2、scAb、scFv或scFv片段)、Kunitz结构域蛋白质(诸如WO 03/066824中所描述的,含或不含清蛋白融合体)、干扰素、白介素、IL10、IL11、IL2、干扰素α的各个种类和亚类、干扰素β的各个种类和亚类、干扰素γ的各个种类和亚类、瘦蛋白(1eptin)、CNTF、CNTFAX15、IL1受体拮抗物、红细胞生成素(EPO)和EPO模拟物、血小板生成素(TPO)和TPO模拟物、prosaptide、蓝藻抗病毒蛋白N(cyanovirin-N),5-螺旋、T20肽、T1249肽、HIV gp41、HIV gp120、尿激酶、尿激酶原、tPA、水蛭素、血小板衍生的生长因子、甲状旁腺激素、胰岛素原、胰岛素、胰高血糖素、胰高血糖素样肽、胰岛素样生长因子、降钙素、生长激素、转化生长因子β、肿瘤坏死因子、G-CSF、GM-CSF、M-CSF、FGF、前体和活性形式的凝血因子包括但不限于纤溶酶原、纤维蛋白原、凝血酶、前凝血酶、凝血酶原、von Willebrand氏因子、α1-抗胰蛋白酶、纤溶酶原激活物、因子VII、因子VIII、因子IX、因子X和因子XIII、神经生长因子、LACI、血小板衍生的内皮细胞生长因子(PD-ECGF)、葡萄糖氧化酶、血清胆碱酯酶、抑酶肽(aprotinin)、淀粉状蛋白前体蛋白(amyloid precursor)、inter-α胰蛋白酶抑制物(inter-alpha typsin)、抗凝血酶III、脱脂载脂蛋白各个种类、蛋白C、蛋白S或任何上述的变体或片段的序列。
“变体”在上文所列蛋白质的语境中指其中一个或多个位置存在或保守的或非保守的氨基酸插入、删除、或替代的蛋白质,只要这些变化产生其基本特性例如酶促活性或受体结合(活性的类型和特异性)、热稳定性、在某些pH范围中的活性(pH稳定性)没有显著变化的蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。优选的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
“变体”通常与衍生它的多肽具有至少25%、至少50%、至少60%或至少70%、优选至少80%、更加优选至少90%、甚至更加优选至少95%、仍然更加优选至少99%、最优选至少99.5%的序列同一性。
可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,例如威斯康星大学(University of Wisconsin)遗传计算小组(GeneticComputing Group)的GAP程序,而且应当认识到,同一性百分比是关于其序列得到最佳对比的多肽计算得出的。
或者,可以使用Clustal W程序(Thompson等,1994,Nucleic Acids Res.,22(22),4673-80)来进行对比。可以使用如下参数:
●快速成对对比参数:K-tuple(词)大小;1,窗口大小;5,缺口罚分;3,最高对角线数目;5。评分方法:x百分比。
●多重对比参数:缺口打开罚分;10,缺口延伸罚分;0.05。
●评分矩阵:BLOSUM。
这些变体可以是天然的,或是使用本领域众所周知的蛋白质工程和定点诱变的方法人造的。
“片段”在上文所列蛋白质的语境中指一个或多个位置存在删除的蛋白质。由此,片段可以包含完整成熟多肽的完整序列的至多5%、10%、20%、30%、40%或50%。通常,片段包含完整期望多肽的完整序列的可高达60%、更典型的是可高达70%、优选可高达80%、更加优选可高达90%、甚至更加优选可高达95%、仍然更加优选可高达99%。特别优选的蛋白质的片段包含该蛋白质的一个或多个完整结构域。
在一个特别优选的实施方案中,异源蛋白质包含清蛋白或其片段或变体的序列。
“清蛋白”包括包含由任何来源获得的清蛋白蛋白质之序列的蛋白质。通常,来源指哺乳动物。在一个优选的实施方案中,血清清蛋白指人血清清蛋白(“HSA”)。术语“人血清清蛋白”包括具有在人类中天然存在的氨基酸序列的血清清蛋白及其变体的含义。优选的是,清蛋白具有WO 90/13653中公开的氨基酸序列或其变体。可以通过用于分离与人类基因对应的cDNA的已知方法获得HSA编码序列,正如例如EP 73 646和EP 286 424中所公开的。
在另一个优选的实施方案中,“清蛋白”包含牛血清清蛋白的序列。术语“牛血清清蛋白”包括具有在牛中天然存在的氨基酸序列的血清清蛋白(例如来自Swissprot编号P02769)及其变体的含义,正如下文所定义的。术语“牛血清清蛋白”还包括全长牛血清清蛋白或其变体的片段的含义,正如下文所定义的。
在另一个优选的实施方案中,清蛋白包含由来自犬(如参阅Swissprot编号P49822)、猪(如参阅Swissprot编号P08835)、山羊(如可由Sigma以产品编号A2514或A4164获得)、火鸡(如参阅Swissprot编号O73860)、狒狒(如可由Sigma以产品编号A1516获得)、猫(如参阅Swissprot编号P49064)、鸡(如参阅Swissprot编号P19121)、卵清蛋白(如鸡卵清蛋白)(如参阅Swissprot编号P01012)、驴(如参阅Swissprot编号P39090)、豚鼠(如可由Sigma以产品编号A3060、A2639、O5483或A6539获得)、仓鼠(如可由Sigma以产品编号A5409获得)、马(如参阅Swissprot编号P35747)、猕猴(如参阅Swissprot编号Q28522)、小鼠(如参阅Swissprot编号O89020)、鸽子(如Khan等,2002,Int.J.Biol.Macromol.,30(3-4),171-8所定义的)、兔(如参阅Swissprot编号P49065)、大鼠(如参阅Swissprot编号P36953)和绵羊(如参阅Swissprot编号P14639)的血清清蛋白其中之一衍生(具有其序列)的清蛋白的序列,且包括其变体和片段,正如下文所定义的。
已知清蛋白的许多天然存在的突变形式。Peters,1996,《All AboutAlbumin:Biochemistry,Genetics and Medical Applications》,Academic PressInc.,San Diego,California,第170-181页描述了许多。如上定义的变体可以是这些天然存在变体之一。
“变体清蛋白”指其中一个或多个位置存在或保守的或非保守的氨基酸插入、删除、或替代的清蛋白蛋白质,只要这些变化产生其至少一项基本特性例如结合活性(活性的类型和特异性,如与胆红素结合)、渗透性(渗透压、胶体渗透压)、在某些pH范围中的表现(pH稳定性)没有显著变化的清蛋白蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。可以通过本领域众所周知的技术来制备这些变体,正如通过1981年11月24日发布给Stevens的美国专利号4,302,386中公开的定点诱变,收入本文作为参考。
通常,清蛋白变体与天然存在的清蛋白具有超过40%、通常至少50%、更加典型的是至少60%、优选至少70%、更加优选至少80%、仍然更加优选至少90%、甚至更加优选至少95%、最优选至少98%或更高序列同一性。可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,例如威斯康星大学(University of Wisconsin)遗传计算小组(Genetic ComputingGroup)的GAP程序,而且应当认识到,同一性百分比是关于其序列得到最佳对比的多肽计算得出的。或者可以使用Clustal W程序(Thompson等,1994)来进行对比。可以使用如下参数:
快速成对对比参数:K-tuple(词)大小;1,窗口大小;5,缺口罚分;3,最高对角线数目;5。评分方法:x百分比。M多重对比参数:缺口打开罚分;10,缺口延伸罚分;0.05。评分矩阵:BLOSUM。
术语“片段”如上所用包括全长清蛋白或其变体的任何片段,只要至少一项基本特性例如结合活性(活性的类型和特异性,如与胆红素结合)、渗透性(渗透压、胶体渗透压)、在某些pH范围中的表现(pH稳定性)没有显著变化。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。片段的长度通常是至少50个氨基酸。片段可以包含清蛋白的至少一个完整亚结构域。已经作为重组蛋白表达HSA的结构域(Dockal,M.等,1999,J.Biol.Chem.,274,29303-29310),其中结构域I定义为由氨基酸1-197组成,结构域II定义为由氨基酸189-385组成,而结构域III定义为由氨基酸381-585组成。存在结构域的部分交叠是因为结构域I和II之间、结构域II和III之间存在延伸的α-螺旋结构(h10-h1)(Peters,1996,前述引用,表2-4)。HSA还包含六个亚结构域(亚结构域IA、IB、IIA、IIB、IIIA和IIIB)。亚结构域IA包含氨基酸6-105,亚结构域IB包含氨基酸120-177,亚结构域IIA包含氨基酸200-291,亚结构域IIB包含氨基酸316-369,亚结构域IIIA包含氨基酸392-491,而亚结构域IIIB包含氨基酸512-583。片段可以包含如上定义的一个或多个结构域或亚结构域的整个或部分,或是那些结构域和/或亚结构域的任意组合。
在另一个特别优选的实施方案中,异源蛋白质包含运铁蛋白或其变体或片段的序列。术语“运铁蛋白”在用于本文时包括运铁蛋白家族的所有成员(Testa,《Proteins of iron metabolism》,CRC Press,2002;Harris和Aisen,《Iron carriers and iron proteins》,第5卷,Physical Bioinorganic Chemistry,VCH,1991)及其衍生物,诸如运铁蛋白、运铁蛋白突变体(Mason等,1993,Biochemistry,32,5472;Mason等,1998,Biochem.J.,330(1),35)、截短的运铁蛋白、运铁蛋白叶(Mason等,1996,Protein Expr.Purif.,8,119;Mason等,1991,Protein Expr.Purif.,2,214)、乳铁蛋白、乳铁蛋白突变体、截短的乳铁蛋白、乳铁蛋白叶(lobe)、或任何上述与其它肽、多肽或蛋白质的融合体(Shin等,1995,Proc.Natl.Acad.Sci.USA,92,2820;Ali等,1999,J.Biol.Chem.,274,24066;Mason等,2002,Biochemistry,41,9448)。
运铁蛋白可以是人运铁蛋白。术语“人运铁蛋白”在用于本文时指与衍生自人的运铁蛋白不能区别或是其变体或片段的物质。“变体”包括或保守的或非保守的插入、删除和替代,其中这些变化不显著改变运铁蛋白的有用的配体结合或免疫原性特性。
本发明包括运铁蛋白的突变体。这些突变体可以具有改变的免疫原性。例如,运铁蛋白突变体可以展示改良的(如降低的)糖基化。可以通过添加/消除氨基酸糖基化共有序列来修饰运铁蛋白分子的N连接糖基化模式,诸如N-X-S/T,在N、X、或S/T的任何或所有位置。对运铁蛋白突变体可以改变其与金属离子和/或其它蛋白质诸如运铁蛋白受体的天然结合。下文例示了以这种方式修饰的运铁蛋白突变体的一个实例。
本发明还包括人运铁蛋白或人运铁蛋白类似物的天然存在多态变体。通常,人运铁蛋白的变体或片段具有人运铁蛋白的配体结合活性(例如铁结合)的至少5%、10%、15%、20%、30%、40%、或50%(优选至少80%、90%或95%),重量对重量。可以通过分光光度法测定运铁蛋白或测试样品的铁结合活性,对蛋白质测量它们没有铁和满载铁状态的470nm∶280nm吸光度比值。试剂应当不含铁,除非另有说明。可以通过在0.1M柠檬酸盐、0.1M醋酸盐、10mM EDTA pH4.5中透析由运铁蛋白或测试样品中清除铁。蛋白质应当以约20mg/ml溶于100mM HEPES、10mM NaHCO3 pH8.0。测量在水中稀释的脱铁运铁蛋白(Calbiochem,CN Biosciences,Nottingham,UK)的470nm∶280nm吸光度比值,从而能够通过分光光度法精确测定280nm吸光度(0%铁结合)。将191mg次氮基三乙酸溶于2ml 1M NaOH,然后添加2ml 0.5M氯化铁,由此制备20mM次氮基三乙酸铁(FeNTA)溶液。用去离子水稀释至50ml。添加充分过量的新鲜制备的20mM FeNTA使脱铁运铁蛋白满载铁(100%铁结合),然后在100mM HEPES、10mM NaHCO3 pH8.0中彻底透析全运铁蛋白,从而在测量470nm∶280nm吸光度比值前清除剩余FeNTA。用测试样品重复此流程,它应当是最初不含铁,并将最终比值与对照进行比较。
另外,可以使用包含任何上述的单一或多重异源融合体;或是与清蛋白、运铁蛋白或免疫球蛋白或其变体或片段的一种或多种异源融合体。这些融合体包括清蛋白N端融合体、清蛋白C端融合体及WO 01/79271例示的清蛋白N端和C端共融合体、以及运铁蛋白N端融合体、运铁蛋白C端融合体及运铁蛋白N端和C端共融合体。
美国专利申请US2003/0221201和US2003/0226155;Shin等,1995,Proc.Natl.Acad.Sci.USA,92,2820;Ali等,1999,J.Biol.Chem.,274,24066;Mason等,2002,Biochemistry,41,9448给出了运铁蛋白融合体的实例,将它们的内容收入本文作为参考。
技术人员还将领会,任何其它基因的开放读码框或变体或部分或其中任一可用作本发明中使用的开放读码框。例如,开放读码框可以编码包含任何序列的蛋白质,它可以是天然蛋白质(包括酶原)、或天然蛋白质的变体、或片段(它可以是例如结构域);或是完全人工合成的蛋白质;或是不同蛋白质(天然的或合成的)的单一或多重融合体。不排他的,这些蛋白质可以来自WO 01/79258、WO 01/79271、WO 01/79442、WO 01/79443、WO 01/79444和WO 01/79480中提供的列表或其变体或片段;将其公开书收入本文作为参考。尽管这些专利申请提供了关于清蛋白融合配偶体的内容的列表,本发明不受此限制,而且出于本发明的目的,可以单独提供其中所列的任何蛋白质或者以清蛋白、免疫球蛋白Fc区、运铁蛋白、乳铁蛋白或任何其它蛋白质或任何上述的片段或变体的融合配偶体的形式,作为期望多肽。
异源蛋白质可以是有治疗活性的蛋白质。换言之,它可以具有公认的对个体诸如人的医学效果。本领域众所周知许多不同类型的有治疗活性的蛋白质。
异源蛋白质可以包含在酵母中有效引起分泌的前导序列。
为了由宿主细胞分泌蛋白质,已经使用或开发了许多天然的或人造的多肽信号序列(也称为分泌前区)。信号序列知道新生蛋白质通向将蛋白质由细胞输出至周围培养基或在有的情况中是周质空间中的细胞器。信号序列通常(尽管不是必须的)位于初级翻译产物的N端,而且通常(尽管不是必须的)在分泌过程中由蛋白质上切除而产生“成熟的”蛋白质。
在有些蛋白质的情况中,在切除信号序列后最初分泌的实体在其N端包含额外氨基酸,称为“原”(pro)序列,而中间实体称为“蛋白质原”。这些原序列可能辅助最终蛋白质进行折叠和变成功能性的,而且通常在然后切除。在其它情况中,原区仅仅为酶提供切割位点以切除前-原区,而不知道具有其它功能。
原序列可以在蛋白质由细胞分泌的过程中或者在由细胞输出到周围培养基或周质空间中后切除。
无论它们是像信号(即前,pre)序列或前-原分泌序列,将指导蛋白质分泌的多肽序列都称为前导序列。蛋白质的分泌是涉及翻译、易位和翻译后加工的动态加工,而且这些步骤中的一个或多个步骤可能不必在另一个步骤启动或完成前完成。
关于在真核物种诸如酵母酿酒酵母、接合糖酵母物种、乳克鲁维氏酵母和巴斯德毕赤氏酵母中生成蛋白质,已知的前导序列包括来自酿酒酵母酸性磷酸酶蛋白质(Pho5p)(见EP 366 400)、转化酶蛋白质(Suc2p)(见Smith等,1985,Science,229,1219-1224)和热休克蛋白-150(Hsp150p)(见WO 95/33833)的那些。另外,已经使用了来自酿酒酵母交配因子α-1蛋白质(MFα-1)和来自人溶菌酶和人血清清蛋白(HSA)蛋白质的前导序列,后者尤其已经用于分泌人清蛋白,尽管不是排他的。WO 90/01063公开了MFα-1与HSA前导序列的融合体,相对于MFα-1前导序列的使用,它有利的降低了人清蛋白杂质片段的生成。本申请的实施例中还公开了经修饰的前导序列,而且读者将领会,那些前导序列可用于运铁蛋白以外的蛋白质。另外,可以使用天然运铁蛋白前导序列来指导运铁蛋白和其它异源蛋白质的分泌。
如果蛋白伴侣是蛋白质二硫键异构酶,那么优选的是,异源蛋白质在其成熟形式中包含二硫键。二硫键可以是分子内的和/或分子间的。
异源蛋白质可以是商业上有用的蛋白质。有些异源表达的蛋白质预期与它们在其中表达的细胞相互作用,从而对细胞的活性带来有益的效果。这些蛋白质凭其自身并不是商业上有用的。商业上有用的蛋白质指对它们在其中表达的细胞具有离体效用的蛋白质。无论如何,熟练读者将领会,商业上有用的蛋白质还可以对表达它作为异源蛋白质的宿主细胞具有生物学效果,但是该效果不是在其中表达蛋白质的主要或唯一原因。
在一个实施方案中,优选的是异源蛋白质不是β-内酰胺酶。在另一个实施方案中,优选的是异源蛋白质不是antistasin。然而,读者将领会,这两项附带条件都不排除编码β-内酰胺酶或antistasin的基因存在于本发明的2μm家族质粒上,只是编码异源蛋白质的基因编码β-内酰胺酶和/或antistasin以外的蛋白质。
可以使用本领域众所周知的技术,诸如Sambrook等,《Molecular Cloning:A Laboratory Manual》,2001,第3版(将其内容收入本文作为参考)中所描述的来制备质粒,即通过插入编码蛋白伴侣的基因并插入编码异源蛋白质的基因来修饰本领域知道的2μm家族质粒。例如,这样一种方法涉及经粘端的连接。可以通过合适的限制酶的作用在用于插入的DNA片段和质粒上生成相容粘端。这些末端将经由互补碱基配对而快速退火,而且可以通过DNA连接酶的作用来关闭剩余的切口。
另一种方法使用合成的双链寡核苷酸接头和衔接头。通过消除突出的3’末端并补平凹入的3’末端的噬菌体T4DNA聚合酶或大肠杆菌DNA聚合酶I生成具有平端的DNA片段。可以通过T4DNA连接酶将含有指定限制酶的识别序列的合成接头和平端双链DNA碎片与末端补平的DNA片段连接。然后用合适的限制酶消化它们以生成粘端,并与具有相容末端的表达载体连接。衔接头也是化学合成的DNA片段,它含有一个用于连接的平端,但也具有一个预先形成的粘端。或者,可以在存在或不含一种或多种合成双链寡核苷酸(任选含有粘端的)时通过DNA连接酶的作用将DNA片段连接到一起。
可以通过商业途经由许多来源获得含有多种限制性内切核酸酶位点的合成接头,包括Sigma-Genosys Ltd,London Road,Pampisford,Cambridge,United Kingdom。
2μm家族质粒中的合适插入位点包括但不限于上文所述那些。
本发明还提供了包含上文定义的质粒的宿主细胞。宿主细胞可以是任何类型的细胞。优选细菌和酵母宿主细胞。细菌宿主细胞可用于克隆目的。酵母宿主细胞可用于表达质粒中存在的基因。
在一个实施方案中,宿主细胞是酵母细胞,诸如糖酵母、克鲁维氏酵母、或毕赤氏酵母属的成员,诸如优选酿酒酵母、乳克鲁维氏酵母、巴斯德毕赤氏酵母和膜醭毕赤氏酵母、或鲁氏接合糖酵母、拜列氏接合糖酵母、发酵接合糖酵母、或果蝇克鲁维氏酵母。
宿主细胞类型可以选择与所用质粒类型的相容性。由一种酵母类型获得的质粒可以在其它酵母类型中得到维持(Irie等,1991,Gene,108(1),139-144;Irie等,1991,Mol.Gen.Genet.,225(2),257-265)。例如,来自鲁氏接合糖酵母的pSR1可以在酿酒酵母中维持。优选的是,宿主细胞与所用2μm相容(如下质粒的详尽描述见下文)。例如,如果质粒是基于pSR1、pSB3或pSB4的,那么合适的酵母细胞是鲁氏接合糖酵母;如果质粒是基于pSB1或pSB2的,那么合适的酵母细胞是拜列氏接合糖酵母;如果质粒是基于pSM1的,那么合适的酵母细胞是发酵接合糖酵母;如果质粒是基于pKD1的,那么合适的酵母细胞是果蝇克鲁维氏酵母;如果质粒是基于pPM1的,那么合适的酵母细胞是膜醭毕赤氏酵母;如果质粒是基于2μm质粒的,那么合适的酵母细胞是酿酒酵母或卡尔斯伯糖酵母。特别优选的是,质粒是基于2μm质粒的,且酵母细胞是酿酒酵母。
如果本发明的2μm质粒包含具有衍生自该天然存在质粒之序列的基因FLP、REP1和REP2中的一种、两种或优选三种,那么可以将它说成是“基于”该天然存在质粒的。
利用参与蛋白质O-糖基化的一种或多种蛋白质甘露糖基转移酶缺陷的酵母,例如通过破坏基因编码序列,可能是特别有利的。
重组表达的蛋白质可能由生产宿主细胞进行不想要的翻译后修饰。例如,清蛋白蛋白质序列不含N-连接糖基化的任何位点,且没有报道说在自然条件下受到O-连接糖基化的修饰。然而,发现在许多酵母物种中生成的重组人清蛋白(“rHA”)可以受到O-连接糖基化的修饰,通常涉及甘露糖。甘露糖化清蛋白能够结合凝集素伴刀豆球蛋白A。由酵母生成的甘露糖化清蛋白的数量可以通过使用一种或多种PMT基因缺陷的酵母菌株而降低(WO94/04687)。实现这一目的的最方便方式是创建其基因组具有缺陷使得Pmt蛋白质之一的水平降低的酵母。例如,编码序列或调控区(或调节PMT基因之一表达的另一种基因)中可以存在缺失、插入或转座,使得生成少许Pmt蛋白质或不生成。或者,可以转化酵母以生成抗Pmt试剂,诸如抗Pmt抗体。
如果使用酿酒酵母以外的酵母,那么破坏酿酒酵母PMT基因的一种或多种等价基因也是有利的,例如在巴斯德毕赤氏酵母或乳克鲁维氏酵母中。由酿酒酵母分离的PMT1(或任何其它PMT基因)的序列可用于鉴定或破坏在其它真菌物种中编码相似酶促活性的基因。WO 94/04687中描述了乳克鲁维氏酵母PMT1同系物的克隆。
有利的是,酵母具有HSP150和/或YAP3基因的缺失,正如WO 95/33833和WO 95/23857中分别讲授的。
可以经由标准技术将如上定义的质粒导入宿主。关于原核宿主细胞的转化,参阅例如Cohen等,1972,Proc.Natl.Acad.Sci.USA,69,2110及Sambrook等,2001,《Molecular Cloning,A Laboratory Manual》,第3版,Cold SpringHarbor Laboratory,Cold Spring Harbor,NY。酵母细胞的转化参阅Sherman等,1986,《Methods In Yeast Genetics,A Laboratory Manual》,Cold SpringHarbor,NY。也可以使用Beggs,1978,Nature,275,104-109的方法。EP251 744、EP 258 067和WO 90/01063中概括讲授了用于转化酿酒酵母的方法,将它们都收入本文作为参考。关于脊椎动物细胞,可用于转染这些细胞的试剂例如磷酸钙和DEAE-右旋糖苷或脂质体配剂可以由StratageneCloning System或Life Technologies Inc.,Gaithersburg,MD 20877,USA获得。
电穿孔也可用于转化细胞,而且在本领域众所周知用于转化酵母细胞、细菌细胞和脊椎动物细胞。Becker和Guarente,1990,Methods Enzymol.,194,182中公开了通过电穿孔转化酵母的方法。
一般而言,质粒不会转化所有的宿主,因此必须选择得到转化的宿主细胞。由此,质粒可以包含选择标记,包括但不限于细菌选择标记和/或酵母选择标记。典型的细菌选择标记是β-内酰胺酶基因,尽管本领域还知道许多其它的。典型的酵母选择标记包括LEU2、TRP1、HIS3、HIS4、URA3、URA5、SFA1、ADE2、MET15、LYS5、LYS2、ILV2、FBA1、PSE1、PDI1和PGK1。本领域技术人员将领会,其染色体删除或灭活将导致宿主不可存活的任何基因,即所谓的必需基因,都可用作选择标记,如果在质粒上提供功能性基因的话,正如PGK1在pgk1酵母菌株中所证明的(Piper和Curran,1990,Curr.Genet.,17,119)。合适的必需基因可以在斯坦福基因组数据库(StanfordGenome Database,SGD,http://db.yeastgenome.org)中找到。为了提高质粒的稳定性且没有需要在特定选择性条件下培养细胞的缺点,在遭到删除或灭活时不会导致营养缺陷(生物合成)需求的任何必需基因产物(如PDI1、PSE1、PGK1或FBA1)可用作如下宿主细胞中质粒上的选择标记以实现质粒稳定性提高且没有要求在特定选择性条件下培养细胞的缺点,该宿主细胞在缺乏该质粒时不能生成该基因产物。“营养缺陷(生物合成)需求”包括可以通过添加或修改生长培养基而补足的缺陷。因此,优选的“必需标记基因”在本发明的内容中指在宿主细胞中遭到删除或灭活时导致不能通过添加或修改生长培养基而补足的缺陷的基因。
另外,依照本发明第一个、第二个或第三个方面其中任一的质粒可以包含超过一种选择标记。
一种选择技术涉及将编码转化细胞中的可选择性状的DNA序列标记与任何必需的控制元件一起掺入表达载体。这些标记包括用于真核细胞培养的二氢叶酸还原酶、G418或新霉素抗性,及用于培养大肠杆菌和其它细菌的四环素、卡那霉素或氨苄青霉素(即β-内酰胺酶)抗性基因。或者,这些可选择性状的基因可以在用于共转化期望宿主细胞的另一种载体上。
鉴定成功转化细胞的另一种方法涉及培养通过导入本发明质粒而生成的细胞,任选容许表达重组多肽(即由质粒上的多核苷酸序列编码且对于宿主细胞是异源的多肽,就该宿主不天然生成该多肽而言)。可以收获并裂解细胞,并使用诸如Southern,1975,J.Mol.Biol.,98,503或Berent等,1985,Biotech.,3,208描述的方法或者本领域常用的DNA和RNA分析的其它方法对它们的DNA或RNA内容检查重组序列的存在。或者,可以使用抗体来检查转化细胞培养物上清液中多肽的存在。
当重组DNA能够指导蛋白质的表达时,除了直接检验重组DNA的存在以外,可以通过众所周知的免疫学方法来确认成功的转化。例如,用表达载体成功转化的细胞生成展示适当抗原性的蛋白质。收获怀疑得到转化的细胞的样品并使用合适的抗体检验蛋白质。
由此,除了得到转化的宿主细胞自身以外,本发明还涵盖那些细胞在营养培养基中的培养物,优选单克隆(克隆同质的)培养物,或是由单克隆培养物衍生的培养物。或者,转化细胞自身可以代表工业/商业或制药学有用的产品且可以无需进一步纯化就使用,或者可以由培养物培养基纯化,且任选以适合于它们的预定工业/商业或制药学用途的方式与载体或稀释剂一起配制,且任选以适合于该用途的方式包装和展示。例如,可以将全细胞固定化;或用于将细胞培养物直接喷洒到突起的部分(process)、农作物或其它期望目标上/中。类似的,全细胞,诸如酵母细胞,可以以胶囊的形式用于极其多种应用,诸如香料、香精和药物。
可以在本领域技术人员知道的且考虑到本文公开的讲授的适当条件下将经转化宿主细胞培养足够时间,从而容许由质粒编码的蛋白伴侣和异源蛋白质的表达。
培养基可以是非选择性的,或是对质粒的维持施加选择压力。
由此生成的异源蛋白质可以是存在于胞内,或者如果分泌的话,存在于培养物培养基和/或宿主细胞周质空间中。
步骤“由培养的宿主细胞或培养基纯化由此表达的异源蛋白质”任选包括细胞固定化、细胞分离和/或细胞破裂,但是总是包括细胞固定化、分离和/或破裂以外至少一个其它纯化步骤。
本领域众所周知细胞固定化技术,诸如使用藻酸钙珠装入细胞。类似的,本领域众所周知细胞分离技术,诸如离心、过滤(如错流过滤)、膨胀床层析等等。同样的,本领域众所周知细胞破裂技术,包括玻珠研磨、超声处理、酶促暴露等等。
至少一个其它纯化步骤可以是本领域已知的适于蛋白质纯化的任何其它步骤。例如,WO 92/04367“基质衍生染料的清除”、EP 464 590“酵母衍生着色剂的清除”、EP 319 067“清蛋白向亲脂相的碱沉淀和后续应用”及描述完整纯化过程的WO 96/37515、US 5 728 553和WO 00/44772中公开了用于回收重组表达清蛋白的纯化技术(都收入本文作为参考)。
可以通过已经发现可用于纯化这些蛋白质的任何技术由培养物培养基纯化清蛋白以外的蛋白质。
这些方法包括硫酸铵或乙醇沉淀、酸或溶剂萃取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、亲和层析、羟磷灰石层析、凝集素层析、浓缩、稀释、pH调节、渗滤、超滤、高效液相层析(“HPLC”)、反相HPLC、电导率调节等。
在一个实施方案中,可以使用任何一种或多种上述技术进一步纯化由此分离的蛋白质达到商业或工业可接受的纯度水平。商业或工业可接受的纯度水平包括提供浓度为至少0.01g.L-1、0.02g.L-1、0.03g.L-1、0.04g.L-1、0.05g.L-1、0.06g.L-1、0.07g.L-1、0.08g.L-1、0.09g.L-1、0.1g.L-1、0.2g.L-1、0.3g.L-1、0.4g.L-1、0.5g.L-1、0.6g.L-1、0.7g.L-1、0.8g.L-1、0.9g.L-1、1g.L-1、2g.L-1、3g.L-1、4g.L-1、5g.L-1、6g.L-1、7g.L-1、8g.L-1、9g.L-1、10g.L-1、15g.L-1、20g.L-1、25g.L-1、30g.L-1、40g.L-1、50g.L-1、60g.L-1、70g.L-1、80g.L-1、90g.L-1、100g.L-1、150g.L-1、200g.L-1、250g.L-1、300g.L-1、350g.L-1、400g.L-1、500g.L-1、600g.L-1、700g.L-1、800g.L-1、900g.L-1、1000g.L-1或更高的蛋白质。
优选的是,将异源蛋白质纯化以达到制药学可接受的纯度水平。如果蛋白质基本上不含热原且能够以制药学有效数量施用而不引起与该蛋白质的活性无关的医学效应,那么它具有制药学可接受的纯度水平。
由此生成的异源蛋白质可利用任何它的已知功效,在清蛋白的情况中,包括静脉内施用于患者以治疗重度烧伤、休克和失血、补充培养基、及在其它蛋白质的配剂中作为赋形剂。
虽然有可能单独施用通过本发明方法获得的在治疗上有用的异源蛋白质,但是优选作为与一种或多种可接受载体或稀释剂一起的药物配剂的形式提供。就与期望蛋白质相容且对其接受者无害而言,载体或稀释剂必须是“可接受的”。通常,载体或稀释剂是无菌且不含热原的水或盐水。
任选的是,以单位剂量形式提供由此配制的蛋白质,诸如药片、胶囊、注射液等形式。
本发明的又一个实施方案提供了重组编码包含PDI之序列的蛋白质和基于运铁蛋白的蛋白质的宿主细胞。“基于运铁蛋白的蛋白质”指运铁蛋白或运铁蛋白家族的任何其它成员(如乳铁蛋白)或其变体或片段,包括上文所述类型。由此,本发明还提供了重组PDI基因用于提高基于运铁蛋白的蛋白质表达的用途。
PDI基因可以在质粒上提供,诸如上文所述2μm家族质粒。或者,PDI基因可以整合在染色体中。在一个优选的实施方案中,PDI基因在内源编码PDI基因的基因座处整合在染色体中,优选没有破坏内源PDI基因的表达。在此内容中,“没有破坏内源PDI基因的表达”指尽管来自内源PDI基因的蛋白质产量由于整合有些降低可能是可接受的(且优选没有降低),但是经修饰宿主细胞中PDI蛋白质产量的总水平由于来自内源和整合PDI基因的表达的联合效果而相对于宿主细胞在整合事件前的PDI蛋白质生产水平提高了。
编码基于运铁蛋白的蛋白质的基因可以在质粒上提供,诸如上文所述2μm家族质粒,或者可以整合在染色体中,诸如在内源编码PDI基因的基因座处,优选没有破坏内源PDI基因的表达。
在一个实施方案中,PDI基因整合在染色体中且编码基于运铁蛋白的蛋白质的基因在质粒上提供。在另一个实施方案中,PDI基因在质粒上提供且编码基于运铁蛋白的蛋白质的基因整合在染色体中。在另一个实施方案中,PDI基因和编码基于运铁蛋白的蛋白质的基因二者都整合在染色体中。在另一个实施方案中,PDI基因和编码基于运铁蛋白的蛋白质的基因二者都在质粒上提供。
如上所述,Bao等,2000,Yeast,16,329-341报道了过度表达乳克鲁维氏酵母PDI基因KlPDI1对乳克鲁维氏酵母细胞有毒。与此背景相反,我们令人惊讶的发现,不仅有可能过度表达PDI和其它蛋白伴侣且没有Bao等报告的有害后果,而且可以在相同细胞中重组过度表达两种不同蛋白伴侣且能够提高异源蛋白质的表达,达到比单独表达任一蛋白伴侣所获得的更高的水平,而非有毒。这是未预料到的。相反,根据Bao等的讲授,将会认为两种蛋白伴侣的过度表达将会比过度表达一种甚至更加有毒。此外,更加本发明的早期发现,预计通过与单一蛋白伴侣的共表达所获得的异源蛋白质表达的提高将是所用细胞系统可能的最高水平。因此,特别令人惊讶的发现,通过两种不同蛋白伴侣与异源蛋白质的共表达能够获得还要更多的异源蛋白质表达提高。
因此,作为本发明的第五个方面,提供了用于生产异源蛋白质的方法,包括:提供包含编码包含第一伴侣蛋白之序列的蛋白质的第一重组基因、编码包含第二伴侣蛋白之序列的蛋白质的第二重组基因和编码异源蛋白质的第三重组基因的宿主细胞(诸如上文所定义的),其中第一和第二蛋白伴侣是不同的;在容许第一、第二和第三基因表达的条件下在培养基中培养宿主细胞;并任选由培养的宿主细胞或培养基纯化由此表达的异源蛋白质;还任选将由此纯化的蛋白质冻干。
该方法还包括如下步骤:将纯化的异源蛋白质与载体或稀释剂一起配制,并任选以上文所述方式以单位剂量形式提供由此配制的蛋白质。
术语“重组基因”包括作为“孤立”可表达序列独立操作以生成所编码蛋白质的核酸序列,或者联合宿主内内源序列操作(诸如通过整合到内源序列中以生成与内源序列不同的核酸序列)以引起靶蛋白质表达提高的所导入的核酸序列。
第一和第二蛋白伴侣可以是上文讨论的蛋白伴侣,而且是在相同宿主细胞中表达时提供相加效应以提高异源蛋白质表达的蛋白伴侣组合。“相加效应”包括第一和第二重组基因与第三重组基因同时共表达时宿主细胞中异源蛋白质的表达水平比其中(i)第一重组基因与第三重组基因在缺乏第二重组基因的表达时共表达和(ii)第二重组基因与第三重组基因在缺乏第一重组基因的表达时共表达的相同系统更高的含义。
一种优选的蛋白伴侣是蛋白质二硫键异构酶。另一种优选的蛋白伴侣是ORM2或其片段或变体。在一个特别优选的实施方案中,第一和第二蛋白伴侣是蛋白质二硫键异构酶和ORM2或其片段或变体。
第一、第二和第三重组基因可以各自个别存在于宿主细胞内的质粒上(诸如2μm家族质粒,如上所述),或者整合在宿主细胞基因组的染色体中。应当领会,可以使用质粒和整合在染色体中的第一、第二和第三重组基因的任意组合。例如,第一、第二和第三重组基因可以各自个别存在于质粒上,而且这可以是相同质粒或不同质粒。或者,第一重组基因可以存在于质粒上,而第二和第三重组基因可以整合在宿主细胞基因组的染色体中。或者,第一和第二重组基因可以存在于质粒上,而第三重组基因可以整合在宿主细胞基因组的染色体中。或者,第一和第三重组基因可以存在于质粒上,而第二重组基因可以整合在宿主细胞基因组的染色体中。或者,第一和第二重组基因可以整合在宿主细胞基因组的染色体中,而第三重组基因可以存在于质粒上。或者,第一、第二和第三重组基因可以各自个别整合在宿主细胞基因组的染色体中。
特别优选的质粒是上文关于本发明较早方面所定义的那些。因此,本发明还提供了上文定义的质粒,其中质粒包含编码不同蛋白伴侣的两种不同基因(第一和第二重组基因)。在一个优选的实施方案中,质粒可以还包含编码异源蛋白质诸如上文描述的异源蛋白质的基因(第三重组基因)。
在本发明的第六个方面,提供了用于生产异源蛋白质诸如上文关于本发明较早方面定义的异源蛋白质的方法,包括:提供包含编码包含ORM2或其变体之序列的蛋白质的第一重组基因和编码异源蛋白质的第二重组基因的宿主细胞;在容许第一和第二基因表达的条件下在培养基中培养宿主细胞;并由培养的宿主细胞或培养基纯化由此表达的异源蛋白质;并任选将由此纯化的蛋白质冻干;还任选将纯化的异源蛋白质与载体或稀释剂一起配制;还任选以单位剂量形式提供由此配制的蛋白质。
在上文讨论的方式中,宿主细胞还可以包含编码ORM2的候选蛋白伴侣或其变体之序列的蛋白质的另一种重组基因。
可以由质粒且任选由相同质粒表达第一和第二重组基因其中任一或二者。也可以由质粒、优选由与第一和第二重组基因其中任一或二者相同的质粒表达包含ORM2的候选蛋白伴侣或其变体之序列的蛋白质的另一种重组基因。质粒可以是2μm家族质粒,诸如2μm质粒。
在第七个方面,本发明还提供了编码蛋白质ORM2或其变体的核酸序列通过宿主细胞内核酸序列和重组基因的共表达用于提高宿主细胞中由宿主细胞中的重组基因编码的异源蛋白质产量的用途。可以由宿主细胞内的质粒且优选由相同质粒表达核酸序列和编码异源蛋白质的重组基因其中任一或二者。在上文讨论的方式中,宿主细胞还可以包含编码ORM2的候选蛋白伴侣或其变体之序列的蛋白质的重组基因,它可以位于宿主细胞内的质粒上,优选在与核酸序列和编码异源蛋白质的重组基因其中任一或二者相同的质粒上。合适的质粒包括2μm家族质粒,诸如2μm质粒,正如上文所讨论的。
在本发明的第八个方面,还提供了质粒作为表达载体通过在相同质粒上提供编码异源蛋白质的重组基因和编码ORM2或其变体的基因用于提高异源蛋白质产量的用途。在上文讨论的方式中,质粒还可以包含编码ORM2的候选蛋白伴侣或其变体的基因。合适的质粒包括2μm家族质粒,诸如2μm质粒,正如上文所讨论的。
因此,在第九个方面,本发明还提供了包含编码蛋白质ORM2或其变体或片段的第一基因和编码异源蛋白质的第二基因的2μm家族质粒、优选表达质粒,正如上文所讨论的。质粒还可以包含编码ORM2的候选蛋白伴侣或其变体的第三基因。在一个优选的实施方案中,第三基因编码包含蛋白质二硫键异构酶之序列的蛋白质。
我们已经证明,由质粒携带的编码包含“必需”蛋白伴侣诸如PDI之序列的蛋白质的基因可用于在如下宿主细胞中稳定维持质粒,该宿主细胞在缺乏该质粒时不生成该蛋白伴侣,且同时提高由宿主细胞内的重组基因编码的异源蛋白质的表达。该系统是有利的,因为它容许用户将需要质粒携带的重组基因的数目降至最低。例如,典型的现有技术的质粒携带使得质粒能够在宿主细胞培养过程中稳定维持的标记基因(诸如上文所描述的)。除了实现期望效果所需要的任何其它基因以外,还需要在质粒上维持这些标记基因。然而,质粒中掺入外源DNA序列的能力是有限的,因此将实现期望效果所需要的序列插入的数目降至最低是有利的。此外,有些标记基因(诸如营养缺陷型标记基因)需要在特定条件下进行培养过程以获得标记基因的效果。这些特定条件对于细胞生长或蛋白质生产可能不是最佳的,或是可能需要使用低效/无效的或过度昂贵的培养系统。
为了提高异源蛋白质表达的目的,我们发现,出于提高宿主细胞中异源蛋白质产量和质粒上选择标记的任务这双重目的,有可能使用重组编码包含“必需”蛋白伴侣之序列的蛋白质的基因,其中质粒存在于如下细胞内,该细胞在缺乏该质粒时不能生成该蛋白伴侣。该系统的优点在于它将需要质粒携带的重组基因数目降至最低。该系统还具有如下优点,即可以在不必为任何标记基因而改动条件下培养宿主细胞而不会损害质粒稳定性。例如,可以在丰富培养基中培养使用该系统生成的宿主细胞,这可能比常用于给予营养缺陷标记基因其效果的极限培养基更加经济。
因此,在第十个方面,本发明还提供了包含如下质粒的宿主细胞,该质粒包含编码必需蛋白伴侣的基因,其中在缺乏该质粒时该宿主细胞不能生成该蛋白伴侣。优选的是,在缺乏该质粒时,该宿主细胞不能存活。宿主细胞还可以包含编码异源蛋白质的重组基因,诸如上文关于本发明较早方面所描述的那些。
在第十一个方面,本发明还提供了包含编码必需蛋白伴侣的基因作为唯一选择标记的质粒。质粒还可以包含编码异源蛋白质的基因。质粒可以是2μm家族质粒。
在第十二个方面,本发明还提供了用于生产异源蛋白质的方法,包括下列步骤:提供包含如下质粒的宿主细胞,该质粒包含编码必需蛋白伴侣的基因,其中在缺乏该质粒时该宿主细胞不能生成该蛋白伴侣且其中该宿主细胞还包含编码异源蛋白质的重组基因;在容许必需蛋白伴侣和异源蛋白质表达的条件下在培养基中培养宿主细胞;并任选由培养的宿主细胞或培养基纯化由此表达的异源蛋白质;还任选将由此纯化的蛋白质冻干。
该方法还包括如下步骤:将纯化的异源蛋白质与载体或稀释剂一起配制,并任选以上文讨论的方式以单位剂量形式提供由此配制的蛋白质。在一个优选的实施方案中,该方法涉及在非选择性培养基诸如丰富培养基中培养宿主细胞。
我们还令人惊讶的发现,不同PDI基因具有在特定培养条件下将异源蛋白质表达提高不同数量的能力。具体而言,正如实施例8中所讨论的,我们发现在极限培养基中培养宿主细胞时,SKQ2n PDI1基因提供比S288c PDI1基因更高的异源蛋白质表达。
SKQ2n PDI1和S288c PDI1基因所编码的蛋白质之间的唯一差异是SKQ2n在位置506-513(参照基因库编号CAA38402定义的位置,见上文)处包含额外氨基酸EADAEAEA。
图94中给出的序列对比显示了所用基因序列之间的差异,而且可以概括如下:
●SKQ2n的启动子包含一连串的14个“TA”重复,而S288c的启动子只具有12个“TA”重复;
●Ser41在SKQ2n中由TCT编码,但在S288c中由TCC编码;
●Glu44在SKQ2n中由GAA编码,但在S288c中由GAG编码;
●Leu262在SKQ2n中由TTG编码,但在S288c中由TTA编码;
●Asp514在SKQ2n中由GAC编码,但同源Asp506在S288c中由GAT编码;
●SKQ2n的终止子序列含有一连串的8个连续的“A”碱基,而S288c的终止子序列含有一连串的7个连续的“A”碱基且在与SKQ2n基因中位置1880等价的位置不包含“A”碱基;
●SKQ2n的终止子序列在位置1919具有“C”,而S288c的终止子序列在等价位置具有“T”。
可能有利的是,在选择的PDI基因中包含SKQ2n基因的任何或所有上述特征,从而在极限培养基中培养宿主细胞时实现所观察到的异源蛋白质表达的提高。
因此,在第十三个方面,还提供了编码蛋白质二硫键异构酶的核苷酸序列,通过在宿主细胞内表达核苷酸序列用于提高宿主细胞中异源蛋白质的表达,该宿主细胞在极限培养基中培养,其中编码蛋白质二硫键异构酶的核苷酸序列的特征为它具有至少一项下列特征:
●所述核苷酸包含具有天然PDI启动子或其功能性变体之序列的启动子且包含一连串的14个“TA”重复;或
●所编码的蛋白质二硫键异构酶通常在参照基因库编号CAA38402定义的位置506-513处包含氨基酸EADAEAEA或其保守替代变体;或
●所编码的蛋白质二硫键异构酶的残基Ser41是由密码子TCT编码的;或
●所编码的蛋白质二硫键异构酶的残基Glu44是由密码子GAA编码的;或
●所编码的蛋白质二硫键异构酶的残基Leu262是由密码子TTG编码的;或
●所编码的蛋白质二硫键异构酶的残基Asp514是由密码子GAC编码的;或
●所述核苷酸序列包含具有天然PDI终止子或其功能性变体之序列的终止子序列,且包含一连串的8个连续“A”碱基和/或在位置1919(参照天然SKQ2n终止子序列的位置1919定义)处包含碱基“C”。
在第十四个方面,本发明还提供了用于生产异源蛋白质的方法,包括下列步骤:提供包含编码蛋白质二硫键异构酶且具有如上定义的核酸序列之序列的重组基因的宿主细胞,该宿主细胞还包含编码异源蛋白质的重组基因;在容许蛋白质二硫键和异源蛋白质表达的条件下在极限培养基中培养宿主细胞;并任选由培养的宿主细胞或培养基纯化由此表达的异源蛋白质;还任选将由此纯化的蛋白质冻干;还任选将纯化的异源蛋白质与载体或稀释剂一起配制;还任选以上文讨论的方式以单位剂量形式提供由此配制的蛋白质。
可以以上文关于本发明其它实施方案所描述的方式提供编码PDI和异源蛋白质的基因。
我们还发现,可以通过修饰控制蛋白伴侣表达水平的启动子来调控依照本发明其它方面的重组提供的蛋白伴侣的效果。令人惊讶的是,我们发现,在有些情况中,较短的启动子导致异源蛋白质表达提高。不受理论束缚,我们认为这是因为在早就以较高水平表达异源蛋白质的宿主细胞中重组蛋白伴侣的表达能够引起细胞自身超载异源表达的蛋白质,由此实现异源蛋白质总体产量的少许提高或不提高。在那些情况中,与截短的启动子一起提供重组蛋白伴侣基因可能是有益的。
因此,在本发明的第十五个方面,提供了包含与编码蛋白伴侣(诸如上文描述的那些)的编码序列可操作连接的启动子序列的多核苷酸(诸如上文定义的质粒),通过宿主细胞内多核苷酸序列的表达用于提高宿主细胞(诸如上文描述的那些)中异源蛋白质(诸如上文描述的那些)的表达,其中所述启动子的特征为它达到了比编码序列与其天然存在启动子可操作连接时所达到的改良的,诸如更高或更低,蛋白伴侣表达水平。
在第十六个方面,本发明还提供了用于生产异源蛋白质的方法,包括下列步骤:提供包含如下重组基因的宿主细胞,该重组基因包含与编码蛋白伴侣的编码序列可操作连接的启动子序列,所述启动子的特征为它达到了比编码序列与其天然存在启动子可操作连接时所达到的更低的蛋白伴侣表达水平,且所述宿主细胞还包含编码异源蛋白质的重组基因;在容许蛋白伴侣和异源蛋白质表达的条件下培养宿主细胞;并任选由培养的宿主细胞或培养基纯化由此表达的异源蛋白质;还任选将由此纯化的蛋白质冻干;还任选将纯化的异源蛋白质与载体或稀释剂一起配制;还任选以上文讨论的方式以单位剂量形式提供由此配制的蛋白质。
由本申请的实施例显而易见的是,重组表达的PDI和基于运铁蛋白的蛋白质的组合提供了令人惊讶的高水平运铁蛋白表达。例如,在包含染色体编码重组PDI基因的系统中运铁蛋白表达提供了2倍增量(与没有染色体编码重组PDI基因的对照相比)。该增量比包含编码人清蛋白的重组基因代替重组运铁蛋白基因的等价系统大5倍。
宿主可以是任何细胞类型,诸如原核细胞(如细菌细胞,诸如大肠杆菌)或真核细胞。优选的真核细胞包括真菌细胞,诸如酵母细胞,和哺乳动物细胞。上文讨论了例示性的酵母细胞。例示性的哺乳动物细胞包括人细胞。
可以培养上文描述的宿主细胞以生成重组的基于运铁蛋白的蛋白质。可以由培养物分离由此生成的基于运铁蛋白的蛋白质,并纯化,优选达到制药学可接受的纯度水平,例如使用本领域知道的和/或上文列举的技术。可以将纯化的基于运铁蛋白的蛋白质与制药学可接受的载体或稀释剂一起配制,并可以以单位剂量形式提供。
现在将参照下列非限制性实施例和附图例示本发明。
附图简述
图1、2、4、6至15、22、25、27至52、57至71、74、75、77至79、81至83、85至91、95和96显示了各种质粒图谱。
图3显示了质粒插入位点。
图5显示了含有PDI编码序列的DNA片段的限制图谱。
图16显示了伴有PDI1过度表达的提高的重组运铁蛋白(N413Q、N611Q)分泌的火箭免疫电泳(RIE)测定结果。将冷冻的酵母原种在10mlBMMD摇瓶培养中培养4天,每个孔加载5μl上清液。每块火箭免疫电泳凝胶(50ml)使用40μl山羊多克隆抗运铁蛋白(人)抗血清(Calbiochem)。A=对照菌株[pSAC35],双份摇瓶;B=对照菌株[pDB2536],双份摇瓶;C=对照菌株[pDB2711],未掺水至用水稀释40倍;D=对照菌株[pDB2931],双份摇瓶;E=对照菌株[pDB2929],未掺水至用水稀释40倍。
图17显示了伴有和没有PDI1过度表达的重组运铁蛋白(N413Q、N611Q)分泌的RIE分析结果。将冷冻的酵母原种在10ml BMMD摇瓶培养中培养4天,每个孔加载5μl上清液。来自每种菌株的两份单独培养物的上清液进行双份上样。每块火箭免疫电泳凝胶(50ml)使用40μl山羊多克隆抗运铁蛋白(人)抗血清(Calbiochem)。A=对照菌株[pSAC35];B=对照菌株[pDB2536];C=对照菌株[pDB2711];D=对照菌株[pDB2931];E=对照菌株[pDB2929]。
图18显示了伴有和没有PDI1过度表达的重组运铁蛋白分泌的SDS-PAGE分析结果。将BMMD摇瓶培养物培养4天,在含GelCode
Figure GSA00000079559900601
Blue试剂(Pierce)的非还原性SDS-PAGE(4-12%NuPAGE
Figure GSA00000079559900611
,MOPS缓冲液,InVitrogen)上分析10μl上清液。SeeBlue Plus2标志物(InVitrogen)。1=pDB2536;2=pDB2536;3=pDB2711;4=pDB2711;5=pDB2931;6=pDB2931;7=pDB2929;8=pDB2929;9=pSAC35对照。
图19显示了来自具有PDI1额外整合拷贝的酿酒酵母菌株的重组运铁蛋白分泌的RIE分析。以每孔5μl加载5天BMMD摇瓶培养物上清液。菌株含有1)pSAC35(阴性对照);2)pDB2536(重组非糖基化运铁蛋白(N413Q、N611Q));或3)pDB2506(与质粒pDB2536相同但运铁蛋白ORF编码在位置413和611处不含N→Q突变的运铁蛋白,即重组糖基化运铁蛋白)。每个孔含有衍生自各个转化子的样品。标准物是100、50、20、10、5和2mg.L-1的人血浆全运铁蛋白(Calbiochem)。
图20显示了来自在摇瓶培养中培养的菌株A[pDB2536]和菌株A[pDB2506]的重组运铁蛋白分泌的RIE分析。以每孔5μl双份加载5天BMMD或YEPD摇瓶培养物上清液。
图21显示了由在摇瓶培养中培养的菌株A[pDB2536]和菌株A[pDB2506]分泌的重组运铁蛋白的SDS-PAGE分析。将培养物在BMMD中培养5天,在SDS-PAGE(4-12%NuPAGETM,MOPS缓冲液,InVitrogen)上分析30μl上清液,用GelCode Blue试剂(Pierce)染色。1)菌株A[pDB2536]转化子1;2)菌株A[pDB2536]转化子2;3)菌株A[pSAC35]对照;4)菌株A[pDB2506]转化子1;5)SeeBlue Plus2蛋白质标准物(只有近似分子量)。
图23显示了由具有不同PDI1拷贝数的酿酒酵母菌株分泌的重组运铁蛋白的RIE。以每孔5μl加载3天BMMD摇瓶培养物上清液。每块火箭免疫电泳凝胶(50ml)使用30μl山羊多克隆抗运铁蛋白(人)抗血清(Calbiochem)。(A)来自酿酒酵母对照菌株[pDB2711]或[pDB2712]的上清液;(B)来自菌株A[pDB2536]的上清液;(C)来自对照菌株[pDB2536]的上清液。
图24显示了由具有不同PDI1拷贝数的酿酒酵母菌株分泌的重组运铁蛋白的SDS-PAGE分析。4-12%NuPAGE还原性凝胶在每道加载30μl 3天BMMD摇瓶培养物上清液后以MOPS缓冲液(InVitrogen)运行。(泳道1)来自对照菌株[pDB2536]的上清液;(泳道2)来自菌株A[pDB2536]的上清液;(泳道3-6)来自对照菌株[pDB2711]或[pDB2712]的上清液;(泳道7)分子量标志物(SeeBlue Plus2,InVitrogen)。
图26显示了由伴有和没有额外PDI1共表达的酿酒酵母菌株分泌的重组运铁蛋白的RIE。将酵母接种10ml YEPD摇瓶,并于30℃培养4天。火箭免疫电泳凝胶的每个孔加载5μl培养物上清液。血浆Tf标准物浓度以μg/ml计。20μl山羊抗Tf/50ml琼脂糖。沉淀素用考马斯蓝染色。
图53显示了与具有不同长度启动子的PDI1基因共表达时不同酿酒酵母菌株中rHA表达的RIE分析。将酵母接种10ml YEPD摇瓶,并于30℃培养4天。火箭免疫电泳凝胶的每个孔加载4μl培养物上清液。rHA标准物浓度以μg/ml计。400μl山羊抗HA(Sigma产品A-1151,重悬于5ml水)/50ml琼脂糖。沉淀素用考马斯蓝染色。
图54显示了与具有不同长度启动子的PDI1基因共表达时不同酿酒酵母菌株中rHA表达的RIE分析。将酵母接种10ml YEPD摇瓶,并于30℃培养4天。火箭免疫电泳凝胶的每个孔加载4μl培养物上清液。rHA标准物浓度以μg/ml计。400μl山羊抗HA(Sigma产品A-1151,重悬于5ml水)/50ml琼脂糖。沉淀素用考马斯蓝染色。
图55显示了与不同PDI1构建物共表达时rTF表达的RIE分析。将酵母接种10ml BMMD摇瓶,并于30℃培养4天。含有25μl山羊抗Tf/50ml的火箭免疫电泳凝胶的每个孔加载5μl培养物上清液。血浆Tf标准物浓度以μg/ml计。沉淀素用考马斯蓝染色。
图56显示了与不同PDI1构建物共表达时rTF表达的RIE分析。将酵母接种10ml YEPD摇瓶,并于30℃培养4天。含有25μl山羊抗Tf/50ml的火箭免疫电泳凝胶的每个孔加载5μl培养物上清液。血浆Tf标准物浓度以μg/ml计。沉淀素用考马斯蓝染色。
图72显示了伴有和没有共表达重组PDI1的rHA融合蛋白的RIE分析。将经清蛋白融合表达质粒转化的YBX7接种10ml BMMD摇瓶,并于30℃培养4天。火箭免疫电泳凝胶的每个孔加载4μl培养物上清液。rHA标准物浓度以μg/ml计。200μl山羊抗HA(Sigma产品A-1151,重悬于5ml水)/50ml琼脂糖。沉淀素用考马斯蓝染色。
图73显示了伴有和没有表达质粒上存在的PDI1基因的重组清蛋白融合体分泌的SDS-PAGE分析。将酵母接种10ml BMMD摇瓶,并于30℃以200rpm培养4天。在含GelCode
Figure GSA00000079559900621
 Blue试剂(Pierce)的非还原性SDS-PAGE(4-12%NuPAGE
Figure GSA00000079559900622
,MES缓冲液,InVitrogen)上分析30μl上清液。1=SeeBluePlus2标志物(InVitrogen);2=1μg rHA;3=制管张素-rHA;4=制管张素-rHA+PDI1;5=内皮抑制素-rHA;6=内皮抑制素-rHA+PDI1;7=DX-890-(GGS)4GG-rHA;8=DX-890-(GGS)4GG-rHA+PDI1;9=DPI-14-(GGS)4GG-rHA;10=DPI-14-(GGS)4GG-rHA+PDI1;11=AxokineTM(CNTFAx15)-(GGS)4GG-rHA(Lambert等,2001,Proc.Natl.Acad.Sci.USA,98,4652-4657);12=AxokineTM(CNTFAx15)-(GGS)4GG-rHA+PDI1。
图76显示了RIE分析,证明来自由基于2μm的质粒共表达ORM2的酿酒酵母的运铁蛋白分泌提高了。每个孔加载5μl 4天摇瓶培养物上清液。标准物是25、20、15、10、5μg/ml的人血浆全运铁蛋白(Calbiochem),每个孔加载5μl。每块火箭免疫电泳凝胶(50ml)使用20μl山羊多克隆抗运铁蛋白(人)抗血清(Calbiochem)。
图80显示了RIE分析,证明来自由基于2μm的质粒共表达PSE1的酿酒酵母的运铁蛋白分泌提高了。每个孔加载5μl 4天摇瓶培养物上清液。标准物是25、20、15、10、5μg/ml的人血浆全运铁蛋白(Calbiochem),每个孔加载5μl。每块火箭免疫电泳凝胶(50ml)使用20μl山羊多克隆抗运铁蛋白(人)抗血清(Calbiochem)。
图84显示了RIE分析,证明来自由基于2μm的质粒共表达SSA1的酿酒酵母的运铁蛋白分泌提高了。每个孔加载5μl 4天摇瓶培养物上清液。标准物是25、20、15、10、5μg/ml的人血浆全运铁蛋白(Calbiochem),每个孔加载5μl。每块火箭免疫电泳凝胶(50ml)使用20μl山羊多克隆抗运铁蛋白(人)抗血清(Calbiochem)。
图92显示了RIE结果。将用由pDB3078分离的1.40kb NotI/PstIpdi1::TRP1破坏DNA片段转化成色氨酸原养型的DXY1 trp1Δ[pDB2976]、DXY1 trp1Δ[pDB2977]、DXY1 trp1Δ[pDB2978]、DXY1 trp1Δ[pDB2979]、DXY1 trp1Δ[pDB2980]或DXY1 trp1Δ[pDB2981]接种10ml YEPD摇瓶。将转化子于30℃以200rpm培养4天。火箭免疫电泳凝胶的每个孔加载4μl培养物上清液。rHA标准物浓度以μg/ml计。700μl山羊抗HA(Sigma产品A-1151,重悬于5ml水)/50ml琼脂糖。沉淀素用考马斯蓝染色。(*)指示选择用于进一步分析的分离物。
图93显示了RIE结果。将DXY1[pDB2244]、DXY1[pDB2976]、DXY1trp1Δ pdi1::TRP1[pDB2976]、DXY1[pDB2978]、DXY1 trp1Δ pdi1::TRP1[pDB2978]、DXY1[pDB2980]、DXY1 trp1Δpdi1::TRP1[pDB2980]、DXY1[pDB2977]、DXY1 trp1Δpdi1::TRP1[pDB2977]、DXY1[pDB2979]、DXY1trp1Δpdi1::TRP1[pDB2979]、DXY1[pDB2981]和DXY1 trp1Δpdi1::TRP1[pDB2981]接种10ml YEPD摇瓶,并于30℃以200rpm培养4天。火箭免疫电泳凝胶的每个孔加载4μl培养物上清液。rHA标准物浓度以μg/ml计。800μl山羊抗HA(Sigma产品A-1151,重悬于5ml水)/50ml琼脂糖。沉淀素用考马斯蓝染色。(*)指示选择用于进一步分析的分离物。
图94A-C显示了具有长启动子的KSQ2n和S288c基因序列的序列对比,正如实施例6中所述。
实施例
将两类表达盒用于例示来自酿酒酵母的重组人运铁蛋白突变体(N413Q、N611Q)的分泌。一类使用经修饰HSA(pre)/MFα1(pro)前导序列(称为“经修饰融合前导”序列)。第二类表达盒只使用经修饰HSA(pre)前导序列。
“经修饰融合前导”的24个氨基酸的序列是MKWVFIVSILFLFSSAYSRSLDKR。
经修饰HSA(pre)前导序列的18个氨基酸的序列是MKWVFIVSILFLFSSAYS。
使用含有和不含酿酒酵母PDI基因PDI1额外拷贝的2μm表达载体在酿酒酵母中研究了使用这两种盒的运铁蛋白(N413Q、N611Q)表达。
实施例1
表达质粒的构建
通过将寡核苷酸CF86和CF87(见下文)的0.5mM溶液退火,生成52bp接头,并导入2μm质粒pSAC35的US区,位于599bp反向重复片段的XcmI位点处。一个XcmI位点在REP2翻译终止密码子后面51bp处切割,而由于与反向重复片段的交叠,另一个XcmI位点在FLP编码序列末端前面127bp处切割(见图3)。此DNA接头含有核心区“SnaBI-PacI-FseI/SfiI-SmaI-SnaBI”,它编码pSAC35缺乏的限制位点。
XcmI接头(CF86+CF87)
                                  SfiI
                             --------------
                       PacI                     SnaBI
                    ---------                  -------
              SnaBI            FseI       SmaI
             -------         --------    ------
CF86  GGAGTGGTA CGTATTAATT AAGGCCGGCC AGGCCCGGGT ACGTACCAAT TGA
CF87 TCCTCACCAT GCATAATTAA TTCCGGCCGG TCCGGGCCCA TGCATGGTTA AC
将质粒pSAC35用XcmI部分消化,由0.7%(w/v)琼脂糖凝胶分离线性11kb片段,与CF86/CF87 XcmI接头(未掺水的、10-1和10-2稀释度)连接,并转化到大肠杆菌DH5α中。选择氨苄青霉素抗性转化子,并筛选能够通过SmaI消化而线性化的质粒的存在。通过限制酶分析,鉴定出pDB2688(图4)在REP2后面的XcmI位点中克隆了接头。使用寡核苷酸引物CF88、CF98和CF99(表1)进行的DNA测序验证了插入含有正确的接头序列。
表1:寡核苷酸测序引物
Figure GSA00000079559900651
使用改良的醋酸锂法(Sigma酵母转化试剂盒,YEAST-1,方案2;Ito等,1983,J.Bacterol.,153,163;Elble,1992,Biotechniques,13,18),将酵母菌株转化成亮氨酸原养型。在BMMD琼脂板上选择转化子,然后点接到BMMD琼脂板上。通过添加等体积的无菌40%(w/v)海藻糖,由10mlBMMD摇瓶培养物(24小时,30℃,200rpm)制备冷冻海藻糖原种。
Sleep等,2002,Yeast,18,403描述了YEPD和BMMD的组成。YEPS和BMMS的组成与YEPD和BMMD相似,只是以2%(w/v)蔗糖替代2%(w/v)葡萄糖作为唯一的初始碳源。
将酿酒酵母PDI1基因克隆到pDB2688的XcmI接头中。PDI1基因(图5)是在来自含有PDI1基因的较大酿酒酵母基因组SKQ2n DNA片段(在US 6,291,205中描述的质粒pMA3a:C7中提供,在Crouzet和Tuite,1987,Mol.Gen.Genet.,210,581-583及Farquhar等,1991,见上文中也描述成克隆C7)的1.9kb SacI-SpeI片段上克隆的,它已经克隆到YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中,而且具有含SacI限制位点的合成DNA接头,该接头插入PDI1基因3′非翻译区中唯一Bsu36I位点处。用T4DNA聚合酶处理1.9kb SacI-SpeI片段,以填充SpeI的5′突出并切除SacI的3′突出。此PDI1片段包含翻译起始密码子上游的212bp PDI1启动子和翻译终止密码子下游的148bp。将它与经SmaI线性化/小牛小肠碱性磷酸酶处理的pDB2688连接以生成质粒pDB2690(图6),其中PDI1基因以与REP2相同的方向转录。用pDB2690将酿酒酵母菌株转化成亮氨酸原养型。
然后将人运铁蛋白突变体(N413A、N611Q)的表达盒克隆到pDB2690的NotI位点中以生成pDB2711(图7)。pDB2711中的表达盒含有酿酒酵母PRB1启动子、HSA/MFα融合前导序列(EP 387319;Sleep等,1990,Biotechnology(N.Y.),8,42),后面是人运铁蛋白突变体(N413Q、N611Q)的编码序列和酿酒酵母ADH1终止子。通过将相同表达盒插入pSAC35的NotI位点,类似构建质粒pDB2536。
pDB2536和PDB2711中使用的“经修饰融合前导”序列包含经修饰的HSA-pre序列和MFα1-pro序列。所用候选前导序列是经修饰HSA-pre序列,它是通过消除MFα1-pro序列的6个残基而由经修饰融合前导序列衍生的。
pDB2515(图8)中的经修饰融合前导序列用寡核苷酸CF154和CF155突变,以删除MFα1-pro区的6个残基(RSLDKR)。这是依照Stratagene的QuickChangeTM定点诱变试剂盒的操作说明书进行的。pDB2515是含有pDB2529(见下文)的2940bp NotI-HindIII(部分)DNA片段的大肠杆菌克隆载体pGEM-7Z(-)(Promega),所述片段连接在PspOM1和HindIII位点之间。
CF154
5′-GTTCTTGTTCTCCTCTGCTTACTCTGTCCCTGATAAAACTGTGAGATGG-3′
CF155
5′-CCATCTCACAGTTTTATCAGGGACAGAGTAAGCAGAGGAGAACAAGAAC-3′
用突变后的质粒转化感受态大肠杆菌DH5α细胞,并选择氨苄青霉素抗性菌落。通过EcoRI和BglII双重消化来筛选来自这些菌落的质粒DNA。随后在pDB2921(图9)中在前导序列两侧AflII和BamHI位点之间的386bp区域上验证了经修饰HSA-pre前导的正确DNA序列。分离此386bpAflII-BamHI片段,并与通过BamHI部分消化及AflII和小牛小肠碱性磷酸酶完全消化制备的来自pDB2529(图10)的6081bp AflII和BamHI片段连接。pDB2529是含有pDB2536的运铁蛋白表达盒的大肠杆菌克隆载体pBST(+)(Sleep等,2001,Yeast,18,403-441),所述表达盒克隆在唯一NotI位点中。这生成了pDB2928(图11),它是由用连接产物转化得到的氨苄青霉素抗性大肠杆菌DH5α细胞分离的。
由pDB2928分离3256bp NotI表达盒。它含有PRB1启动子、经修饰HSA-pre前导序列的编码序列,后面是运铁蛋白(N413Q、N611Q)和ADH1终止子。将它连接到基于2μm的载体pSAC35和pDB2690的NotI位点中,以生成表达质粒pDB2929、pDB2930、pDB2931和pDB2932(图12-15)。在pDB2929和pDB2931中,运铁蛋白(N413Q、N611Q)序列以与LEU2相同的方向转录,而在pDB2930和pDB2932中,转录方向相反。
实施例2
运铁蛋白的表达
用所有运铁蛋白(N413Q、N611Q)表达质粒将酿酒酵母菌株转化成亮氨酸原养型,并制备冷冻原种。
将菌株在50ml锥形瓶中在10ml BMMD培养基中于30℃以200rpm培养4天。通过火箭免疫电泳(RIE,参阅Weeke,B.,1976,“Rocketimmunoelectrophoresis”,N.H.Azelsen、J.Kroll和B.Weeke编的《A manual ofquantitative immunoelectrophoresis.Methods and applications》,Universitetsforlaget,Oslo,Norway)、反相高效液相层析(RP-HPLC)(表2)和胶态考马斯蓝染色的非还原性SDS聚丙烯酰胺电泳(SDS-PAGE)比较分泌到培养物上清液中的重组运铁蛋白的滴度。估计酿酒酵母PDI1过度表达时所分泌重组运铁蛋白的增量超过10倍。
表2:
Figure GSA00000079559900681
RIE分析指示,存在PDI1额外拷贝时提高的运铁蛋白分泌是大约15倍(图16)。根据RIE分析,经修饰HSA-pre前导序列的增量似乎略微大于经修饰融合前导序列(图17)。
通过RP-HPLC分析测定出,关于运铁蛋白分泌的增量,经修饰融合前导序列达到18倍,而经修饰HSA-pre前导序列达到15倍(表2)。
图18显示了由具有和没有额外PDI1表达的酿酒酵母分泌的重组运铁蛋白的SDS-PAGE比较。
用于测定运铁蛋白表达的RP-HPLC方法
柱:50x4.6mm Phenomenex Jupiter C4 300
Figure GSA00000079559900682
,5μm
柱温:45℃
流速:1ml.min-1
峰检测:214nm处UV吸光度
HPLC流动相A:0.1%TFA,5%乙腈
HPLC流动相B:0.1%TFA,95%乙腈
梯度:0至3分钟      30%B
      3至13分钟     30至55%B,线性梯度
      13至14分钟    55%B
      14至15分钟    55至30%B,线性梯度
      15至20分钟    30%B
注射:通常100μl样品,但是可以注射任何体积
标准曲线:注射0.1至10μg人运铁蛋白对峰面积
用于所示结果的标准曲线直至10μg成线性。
            y=530888.x+10526.7
其中y=峰面积,而x=以μg计的数量。
(r2):0.999953,其中相关系数=r。
实施例3
PDI的染色体过度表达
选择酿酒酵母菌株A来调查来自质粒pDB2506的重组糖基化运铁蛋白表达和来自质粒pDB2536的重组非糖基化运铁蛋白(N413Q、N611Q)的分泌。菌株A具有下列特征:
●整合在宿主PDI1染色体定位处的额外染色体整合PDI基因。
●将URA3基因和含有氨苄青霉素抗性基因的细菌DNA序列也整合到酿酒酵母基因组中,位于上述基因的插入位点处。
对照菌株没有上述插入。
用pDB2506(重组运铁蛋白)、pDB2536(重组非糖基化运铁蛋白(N413Q、N611Q))或pSAC35(对照)将对照菌株[cir0]和菌株A[cir0]转化成亮氨酸原养型。在BMMD琼脂上选择转化子。
通过火箭免疫电泳(RIE)对每种菌株/质粒组合测定BMMD摇瓶培养物中的运铁蛋白分泌的相对水平。图19显示了这两种菌株都将这两种糖基化和非糖基化重组运铁蛋白分泌到培养物上清液中。
由菌株A[pDB2506]和菌株A[pDB2536]分别分泌的这两种糖基化和非糖基化运铁蛋白的水平似乎比由对照菌株分泌的水平高。由此,至少在摇瓶培养中,在菌株A中在PDI1基因座处整合到宿主基因组中的PDI1具有增强的运铁蛋白分泌。
此外,根据RIE,在对照菌株[pDB2536]和菌株A[pDB2536]之间观察到的运铁蛋白分泌的增量似乎是至少100%增量。相反,对照菌株[pDB2305]和菌株A[pDB2305]之间的rHA单体分泌增量是大约20%(数据未显示)。因此,考虑到运铁蛋白具有19个二硫键,而比较而言rHA具有17个二硫键,由菌株A中PDI1额外拷贝引起的运铁蛋白分泌增量大得令人惊讶。对于由酿酒酵母分泌运铁蛋白家族的蛋白质及其衍生物,PDI1基因的额外拷贝可能是特别有利的。
通过RIE对在BMMD和YEPD中培养的转化子比较由菌株A[pDB2536]和菌株A[pDB2506]分泌的运铁蛋白水平(图20)。结果指示,通过在YEPD(10-20mg.L-1血清运铁蛋白等价物)和BMMD(比较而言2-5mg.L-1血清运铁蛋白等价物)中进行培养实现了这两种非糖基化重组运铁蛋白(N413Q、N611Q)和糖基化重组运铁蛋白滴度超过2倍的提高。在YEPD中观察到的这两种糖基化和非糖基化运铁蛋白滴度的提高说明这两种运铁蛋白表达载体在非选择性培养条件下足够稳定,从而容许通常源自在YEPD中培养的预期生物量增加转变为糖基化和非糖基化运铁蛋白生产力提高。
图21显示了由在BMMD摇瓶培养中培养的菌株A[pDB2536]分泌的非糖基化运铁蛋白(N413Q、N611Q)和由菌株A[pDB2506]分泌的糖基化运铁蛋白的SDS-PAGE分析。与菌株A[pSAC35]相比,菌株A[pDB2536]样品清楚显示额外的蛋白质条带。此额外条带在由对照菌株[pDB2536]分泌的重组运铁蛋白(N413Q、N611Q)的预期位置处迁移。菌株A[pDB2506]培养物上清液在运铁蛋白的预期位置处似乎含有不同的蛋白质条带。这说明分泌的重组运铁蛋白是异质的,可能是由于Asp413和/或Asp611处的高甘露糖化。
实施例4
比较来自含有pDB2711的酿酒酵母对照菌株的运铁蛋白分泌与来自酿酒酵母菌株A的运铁蛋白分泌
质粒pDB2711如上所述。质粒pDB2712(图22)也是由NotI盒生成的,只是方向与pDB2711相反。
用pDB2711和pDB2712将对照菌株酿酒酵母[cir0]转化成亮氨酸原养型。在BMMD琼脂上选择转化子,并制备对照菌株[pDB2711]的冷冻海藻糖原种。
在BMMD和YEPD这两种摇瓶培养中比较对照菌株[pDB2711]、对照菌株[pDB2712]、菌株A[pDB2536]、对照菌株[pDB2536]和候选对照菌株[pDB2536]的重组运铁蛋白(N413Q、N611Q)分泌。RIE指示,与具有两个PDI1染色体拷贝的菌株A[pDB2536]和具有单个PDI1基因染色体拷贝的对照菌株[pDB2536]相比,具有多个附加体PDI1拷贝的对照菌株[pDB2711]在重组运铁蛋白分泌中实现了显著提高(图23)。对照菌株[pDB2711]和对照菌株[pDB2712]似乎将相似水平的rTf(N413Q、N611Q)分泌到培养物的培养基中。对照菌株[pDB2711]和对照菌株[pDB2712]转化子在BMMD和YEPD这两种培养基中的的分泌水平较为一致,说明质粒稳定性足够实现高水平的运铁蛋白分泌,甚至在非还原性条件下。这与先前关于重组PDGF-BB和HSA发表的数据相反,其中证明将PDI1导入多拷贝2μm质粒对宿主有害。
表3:来自高细胞密度发酵的重组运铁蛋白滴度
Figure GSA00000079559900711
图24显示了由BMMD摇瓶培养中的对照菌株[pDB2711]、对照菌株[pDB2712]、菌株A[pDB2536]、对照菌株[pDB2536]和候选对照菌株[pDB2536]分泌的运铁蛋白的还原性SDS-PAGE分析。它显示来自对照菌株[pDB2711]和对照菌株[pDB2712]的所有样品在运铁蛋白(N413Q、N611Q)的预期位置处具有高丰度蛋白质条带。来自不同菌株的运铁蛋白(N413Q、N611Q)条带的相对菌株强度说明,菌株A[pDB2536]的产量比对照菌株[pDB2536]和候选对照菌株[pDB2536]高,但是在来自对照菌株[pDB2711]和对照菌株[pDB2712]的分泌中存在甚至更加显著的提高。所观察到的重组运铁蛋白分泌的提高伴随着这些菌株中PDI1拷贝数的增加。这说明Pdi1p水平在对照菌株、菌株A和候选对照菌株中限制运铁蛋白分泌,而且PDI1拷贝数增加是运铁蛋白分泌提高的原因。增加PDI1拷贝数能够提高PDI1的稳定状态表达水平,从而提高Pdi1p活性的数量。有许多候选方法可用于实现此目的且不提高PDI基因的拷贝数,例如可以通过提高转录速率即通过使用更高效的启动子或者通过降低PDI1 mRNA的清除速率来提高稳定状态PDI1mRNA水平。或者,可以通过蛋白质工程来提高Pdi1p蛋白质的比活或周转数。
根据GP-HPLC分析和SDS-PAGE分析这两种测量,在高细胞密度发酵对照菌株[pDB2711]中,重组运铁蛋白(N413Q、N611Q)产量是大约3g.L-1(表3)。这个生产水平比含有[pDB2536]的对照菌株、候选对照菌株或菌株A高数倍。此外,对于用于人体治疗用途的蛋白质的生产而言,表达系统诸如对照菌株[pDB2711]比使用菌株A的有优势,因为它们不含细菌DNA序列。
结论
在含有整合在酵母基因组中的PDI1基因额外拷贝的酿酒酵母菌株中调查了来自多拷贝表达质粒(pDB2536)的重组运铁蛋白分泌。还在经多拷贝表达质粒转化的酿酒酵母中调查了运铁蛋白分泌,其中PDI1基因插入多拷贝附加型运铁蛋白表达质粒(pDB2711)。
与含有单个拷贝PDI1的菌株相比,在内源PDI1基因座处具有整合在基因组中的PDI1基因额外拷贝的酿酒酵母菌株以升高的水平分泌重组运铁蛋白和非糖基化重组运铁蛋白(N413Q、N611Q)。通过使用pDB2711实现了PDI1拷贝数的进一步增加。根据SDS-PAGE和GP-HPLC分析的测量,在用pDB2711转化的菌株的高细胞密度发酵中,重组运铁蛋白(N413Q、N611Q)以大约3g.L-1的水平分泌。因此,增加PDI1基因拷贝数导致由酿酒酵母分泌的重组运铁蛋白的数量大大增加。
得出下列结论:
1.在来自pDB2536(非糖基化运铁蛋白(N413Q、N611Q))和pDB2506(糖基化运铁蛋白)的重组运铁蛋白表达的摇瓶分析中,酿酒酵母菌株A比对照菌株以更高水平将这两种重组运铁蛋白分泌到培养物上清液中。这要归功于整合在PDI1基因座处的PDI1额外拷贝。
2.在多拷贝表达质粒上含有PDI1基因的对照菌株[pDB2711]在摇瓶培养和高细胞密度发酵这两种情况中产生比菌株A[pDB2536]提高数倍的重组运铁蛋白(N413Q、N611Q)分泌。
3.增加酵母诸如酿酒酵母中的PDI1拷贝数在异源蛋白质诸如来自运铁蛋白家族的生产过程中将是有利的。
4.含有PDI1基因额外拷贝的基于pSAC35的质粒对于来自运铁蛋白家族的蛋白质及其衍生物诸如融合体、突变体、结构域和截短形式的生产具有优势。
实施例5
将PDI1基因插入2μm样质粒提高来自多种不同酿酒酵母菌株的重组运铁蛋白分泌
如Rose和Broach,1990,Meth.Enzymol.,185,234-279所述,通过半乳糖诱导的来自Yep351-GAL-FLP1的FLP过度表达,消除酿酒酵母菌株JRY188 cir+(National Collection of Yeast Cultures)和MT302/28B cir+(Finnis等,1993,Eur.J.Biochem.,212,201-210)的天然2μm质粒,分别生成酿酒酵母菌株JRY188 cir0和MT302/28B cir0
用pDB2931(图14)和pDB2929(图12)将酿酒酵母菌株JRY188 cir0、MT302/28B cir0、S150-2B cir0(Cashmore等,1986,Mol.Gen.Genet.,203,154-162)、CB11-63 cir0(Zealey等,1988,Mol.Gen.Genet.,211,155-159)都转化成亮氨酸原养型。在适当补充的缺乏亮氨酸的极限培养基上选择转化子。将每种菌株的转化子接种50ml摇瓶中的10ml YEPD,并在定轨摇床中于30℃以200rpm培养4天。收获培养物上清液,并通过火箭免疫电泳比较重组运铁蛋白滴度(图26)。结果指示,来自所有酵母菌株的上清液中的运铁蛋白滴度在2μm质粒中存在PDI1时(pDB2929)比不存在时(pDB2931)高。
实施例6
在相同2μm样质粒上含有各种PDI1基因和各种异源蛋白质表达盒的表达载体的构建
PDI1基因的PCR扩增和克隆进入YIplac211:
通过PCR扩增来自酿酒酵母S288c和酿酒酵母SKQ2n的PDI1基因,以生成具有含启动子序列的不同长度5’-非翻译区的DNA片段。PCR引物设计成容许将PCR产物克隆到YIplac211(Gietz和Sugino,1988,Gene,74,527-534)的EcoRI和BamHI位点中。PCR引物中还掺入了额外限制性内切核酸酶位点以便于后续克隆。表4描述了所构建的质粒,而表5给出了用于扩增PDI1基因的PCR引物序列。表4描述了这些基于YIplac211的质粒内PDI1启动子长度的差异。
pDB2939(图27)是如下生成的:用寡核苷酸引物DS248和DS250(表5)由酿酒酵母S288c基因组DNA PCR扩增PDI1基因,然后用EcoRI和BamHI消化PCR产物,并将约1.98kb片段克隆到经EcoRI和BamHI切割的YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中。pDB2939的DNA测序鉴定出来自DS248内的“G”缺失,在表5中以粗体标记。表6列出了用于对PDI1基因测序的寡核苷酸引物,它们是根据已发表的S288cPDI1基因序列设计的(染色体III上的PDI1/YCL043C,由坐标50221至48653,加1000碱基对的上游序列和1000碱基对的下游序列。http://www.yeastgenome.org,基因库编号NC001135)。
表4:含有PDI1基因的基于YIplac211的质粒
Figure GSA00000079559900741
表5:用于酿酒酵母PDI1基因的PCR扩增的寡核苷酸引物
Figure GSA00000079559900742
表6:用于酿酒酵母PDI1基因的DNA测序的寡核苷酸引物
Figure GSA00000079559900752
Figure GSA00000079559900761
质粒pDB2941(图28)和pDB2942(图29)是使用表4和5中描述的PCR引物并通过分别将约1.90kb和1.85kb EcoRI-BamHI片段克隆到YIplac211中而类似构建的。验证了pDB2941和pDB2942中PDI1基因的正确DNA序列。
由含有来自pMA3a:C7(US 6,291,205)也称为克隆C7(Crouzet和Tuite,1987,见上文;Farquhar等,1991,见上文)的PDI1基因的质粒DNA PCR扩增酿酒酵母SKQ2n PDI1基因序列。使用寡核苷酸引物DS248和DS250(表4和5)扩增SKQ2n PDI1基因。用EcoRI和BamHI消化约2.01kb PCR产物,并连接到经EcoRI和BamHI切割的YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中以生成质粒pDB2943(图30)。SKQ2n PDI1序列的5’端与补平的SpeI位点相似,延伸以包含EcoRI、SacI、SnaBI、PacI、FseI、SfiI和SmaI位点,3’端延伸至与补平的Bsu36I位点相似的位点,延伸以包含SmaI、SnaBI和BamHI位点。PDI1启动子长度是约210bp。使用表6给出的寡核苷酸引物测定了PDI1片段的整个DNA序列。这证实了酿酒酵母菌株SKQ2n的PDI蛋白质的编码序列(NCBI编号CAA38402)的存在,但是在位置114具有丝氨酸残基(而非先前发表的精氨酸残基)。类似的,与pDB2939中的酿酒酵母S288c序列的方式相似,pDB2943也在来自DS248序列内具有“G”缺失,在表5中以粗体标记。
质粒pDB2963(图31)和pDB2945(图32)是使用表4和5中描述的PCR引物并通过分别将约1.94kb和1.87kb EcoRI-BamHI片段克隆到YIplac211中而类似构建的。验证了pDB2963和pDB2945中PDI1基因的预期DNA序列,其中氨基酸114位置处具有丝氨酸密码子。在REP2后面的XcmI位点处具有插入的不同PDI1基因的基于pSAC35的rHA表达质粒的构建为了与不同PDI1基因共表达rHA,构建基于pSAC35的质粒(表7)。
表7:用于共表达rHA的具有不同PDI1基因的基于pSAC35的质粒
首先在2992bp NotI片段上分离来自pDB2243(图33,如WO 00/44772中所述)的rHA表达盒,然后克隆到pDB2688(图4)的NotI位点中,生成pDB2693(图34)。将pDB2693用SnaBI消化,用小牛小肠碱性磷酸酶处理,并与来自pDB2943、pDB2963、pDB2945、pDB2939、pDB2941和pDB2942的含有PDI1基因的SnaBI片段连接。这生成了质粒pDB2976至pDB2987(图35至46)。将PDI1的转录方向与REP2相同的称为“取向A”,而将PDI1的转录方向与REP2相反的称为“取向B”(表7)。
在REP2后面的XcmI位点处具有插入的不同PDI1基因的基于pSAC35的运铁蛋白表达质粒的构建:
为了与不同PDI1基因共表达重组运铁蛋白(N413Q、N611Q),构建基于pSAC35的质粒(表8)。
表8:用于共表达运铁蛋白的具有不同PDI1基因的基于pSAC35的质粒
Figure GSA00000079559900781
为了实现此目的,首先通过载体主链的NotI消化和环化,由pDB2976、pDB2978和pDB2980删除rHA表达的NotI表达盒。这生成了质粒pDB3081(图47)、pDB3083(图48)和pDB3084(图49),如表9所述。
表9:具有不同PDI1基因的基于pSAC35的质粒
Figure GSA00000079559900782
将来自pDB2928(图1)的3256bp NotI片段克隆到pDB3081、pDB3083和pDB3084的NotI位点中,使得运铁蛋白基因的转录方向与LEU2相同。这生成了质粒pDB3085(图50)、pDB3086(图51)和pDB3087(图52),如表8所述。
实施例7
PDI1基因在2μm样质粒中的插入和优化提高多种不同酿酒酵母菌株的重组人血清清蛋白分泌
使用改良的醋酸锂法(Sigma酵母转化试剂盒,YEAST-1,方案2;Ito等,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),用pDB2244(WO 00/44772)、pDB2976(图35)、pDB2978(图37)或pDB2980(图39)将酿酒酵母菌株JRY188 cir0、MT302/28B cir0、S150-2B cir0、CB11-63cir0(上文都有描述)、AH22 cir0(Mead等,1986,Mol.Gen.Genet.,205,417-421)和DS569 cir0(Sleep等,1991,Bio/Technology,9,183-187)转化成亮氨酸原养型。在具有适当补充物的BMMD琼脂板上选择转化子,然后点接到具有适当补充物的BMMD琼脂板上。
将每种菌株的转化子接种50ml摇瓶中的10ml YEPD,并在定轨摇床中于30℃以200rpm培养4天。收获培养物上清液,并通过火箭免疫电泳比较重组清蛋白滴度(图53和54)。结果指示,来自所有酵母菌株的培养物上清液中的清蛋白滴度在2μm质粒中存在PDI1时比不存在时(pDB2244)高。在质粒上缺乏PDI1时培养物上清液中的清蛋白滴度取决于选择哪种酵母菌株作为表达宿主,然而在大多数测试样品中,在2μm质粒中存在具有长启动子(~210bp)的PDI1时(pDB2976)观察到最大表达增量。通过缩短例如删除调控位点来修饰PDI1启动子,具有控制改进的影响。对于已知是高rHA生产菌株的一种酵母菌株(DS569),较短启动子是最佳表达所优选的。
实施例8
在基于2μm的质粒上共表达时不同PDI基因增强重组运铁蛋白分泌
通过与具有长启动子(~210bp)的酿酒酵母SKQ2n PDI1基因以及具有长、中和短启动子(分别是~210bp、~140bp和~80bp)的酿酒酵母S288c PDI1的共表达,调查重组运铁蛋白(N413Q、N611Q)的分泌。
用pDB2931(不合PDI1的阴性对照质粒)以及pDB2929、pDB3085、pDB3086和pDB3087(表8)将先前实施例(如实施例2)中使用的相同对照菌株转化成亮氨酸原养型。在BMMD琼脂板上选择转化子,并选择5个菌落用于分析。将菌株在10ml BMMD和10ml YEPD摇瓶培养中于30℃以200rpm培养4天,并收获培养物上清液,用于通过火箭免疫电泳进行分析。
图55显示了在极限培养基(BMMD)中,具有长启动子的酿酒酵母SKQ2n PDI1基因给出最高rTF(N413Q、N611Q)滴度。酿酒酵母S288c PDI1基因给出较低rTF(N413Q、N611Q),它随着PDI1启动子长度缩短进一步降低。
图56显示了在丰富培养基(YEPD)中,具有长启动子的酿酒酵母SKQ2nPDI1和酿酒酵母S288c PDI1基因给出相似rTF(N413Q、N611Q)生产水平。同样,酿酒酵母S288c PDI1基因的启动子长度越短,rTF(N413Q、N611Q)生产水平越低。
实施例9
基于2μm的质粒上的PDI1增强重组清蛋白融合体的分泌
调查了具有长启动子(~210bp)的酿酒酵母SKQ2n PDI1基因的共表达对重组清蛋白融合体表达的影响。
先前(WO 03/066085)描述了NotI N端内皮抑制素-清蛋白表达盒(pDB2556)的构建。大体如EP-A-286 424中公开的和Sleep,D.等,1991,Bio/Technology,9,183-187中描述的,通过“非整合”质粒pSAC35提供适当的酵母载体序列。由pDB2556分离3.54kb NotI N端内皮抑制素-清蛋白表达盒,纯化,并克隆到经NotI消化且经小牛小肠磷酸酶处理的pSAC35中,生成以与LEU2选择标记相同取向含有NotI表达盒的质粒pDB3099(图57)。通过“非整合”质粒pDB2690(图6)提供适当的酵母PDI1载体序列。由pDB2556分离3.54kb NotI N端内皮抑制素-清蛋白表达盒,纯化,并连接到经NotI消化且经小牛小肠磷酸酶处理的pDB2690中,生成以与LEU2选择标记相同取向含有NotI表达盒的质粒pDB3100(图58)。
先前(WO 03/066085)描述了NotI N端制管张素-清蛋白表达盒(pDB2556)的构建,正如基于pSAC35的酵母表达载体pDB2765(图59)的构建。由pDB2556分离3.77kb NotI N端制管张素-清蛋白表达盒,纯化,并连接到经NotI消化且经小牛小肠磷酸酶处理的适当酵母PDI1表达载体pDB2690中,生成以与LEU2选择标记相同取向含有NotI表达盒的质粒pDB3107(图60)。
先前(WO 03/066085)描述了NotI N端三环5-(GGS)4GG-清蛋白表达盒(pDB2771)的构建,正如基于pSAC35的酵母表达载体pDB2773(图61)的构建。由pDB2771分离3.27kb NotI N端三环5-(GGS)4GG-清蛋白表达盒,纯化,并连接到经NotI消化且经小牛小肠磷酸酶处理的适当酵母PDI1表达载体pDB2690中,生成以与LEU2选择标记相同取向含有NotI表达盒的质粒pDB3104(图62)。
先前(WO 03/066824)描述了NotI N端DX-890-(GGS)4GG-清蛋白表达盒(pDB2683)的构建。通过“非整合”质粒pSAC35提供适当的酵母载体序列。由pDB2683分离3.20kb NotI N端DX-890-(GGS)4GG-清蛋白表达盒,纯化,并连接到经NotI消化且经小牛小肠磷酸酶处理的pSAC35中,生成以与LEU2选择标记相同取向含有NotI表达盒的质粒pDB3101(图63)。通过“非整合”质粒pDB2690(图6)提供适当的酵母PDI1载体序列。由pDB2683分离3.20kb NotI N端DX-890-(GGS)4GG-清蛋白表达盒,纯化,并连接到经NotI消化且经小牛小肠磷酸酶处理的pDB2690中,生成以与LEU2选择标记相同取向含有NotI表达盒的质粒pDB3102(图64)。
先前(WO 03/066824)描述了NotI N端DPI-14-(GGS)4GG-清蛋白表达盒(pDB2666)的构建,正如基于pSAC35的酵母表达载体pDB2679(图65)的构建。由pDB2666分离3.21kb NotI N端DPI-14-(GGS)4GG-清蛋白表达盒,纯化,并连接到经NotI消化且经小牛小肠磷酸酶处理的适当酵母PDI1表达载体pDB2690中,生成以与LEU2选择标记相同取向含有NotI表达盒的质粒pDB3103(图66)。
使用标准条件,使用针对外显子1和外显子2的下列引物分别扩增两个外显子,由人基因组DNA克隆CNTF。
外显子1引物:
5′-CTCGGTACCCAGCTGACTTGTTTCCTGG-3′;和
5′-ATAGGATTCCGTAAGAGCAGTCAG-3′
外显子2引物:
5′-GTGAAGCATCAGGGCCTGAAC-3′;和
5′-CTCTCTAGAAGCAAGGAAGAGAGAAGGGAC-3′
这两个片段都在标准条件下进行连接,然后使用引物5′-CTCGGTACCCAGCTGACTTGTTTCCTGG-3′和5′-CTCTCTAGAAGCAAGGAAGAGAGAAGGGAC-3′通过PCR再次扩增,并克隆到载体pCR4(Invitrogen)中。为了生成AxokineTM(正如Lambert等,2001,PNAS,98,4652-4657中所公开的),采用定点诱变来导入C17A(TGT→GCT)和Q63R(CAG→AGA)突变。DNA测序还揭示了沉默T→C替代V85V(GTT→GTC)的存在,正如WO 2004/015113中所述。
使用单链寡核苷酸MH33和MH36通过PCR扩增AxokineTM cDNA,生成约0.58kb PCR片段。
MH33
5′-ATGCAGATCTTTGGATAAGAGAGCTTTCACAGAGCATTCACCGCTGACCCC-3′
MH36
5′-CACCGGATCCACCCCCAGTCTGATGAGAAGAAATGAAACGAAGGTCATGG-3′
这是用FastStart Taq DNA聚合酶(Roche)在50μl反应中完成的,首先于95℃保温4分钟,后续25个PCR循环(95℃ 30秒,55℃ 30秒,72℃ 60秒)。在1%琼脂糖凝胶电泳和溴化乙啶染色后,在10μl样品中观察到预期大小的PCR产物。使用QIAquick PCR纯化试剂盒(Qiagen)纯化剩余PCR产物,并用BamHI和BglII完全消化。由溴化乙啶染色的1%琼脂糖凝胶上切下近似预期大小的DNA并纯化。
质粒pDB2573X提供了合适的转录启动子和终止子,以及与人清蛋白N端融合的合适分泌前导序列和编码部分(GGS)4GG肽接头的DNA序列。先前(WO 03/066824)描述了pDB2573X的构建。
将0.57kb经BamHI和BglII消化的PCR产物与经BamHI、BglII和小牛小肠碱性磷酸酶消化的pDB2573X连接,生成质粒pDB2617(图95),并使用寡核苷酸引物CF84、CF85、PRB和DS229验证了PCR生成片段和相邻序列的正确DNA序列。
CF84
5′-CCTATGTGAAGCATCAGGGC-3′
CF85
5′-CCAACATTAATAGGCATCCC-3′
FRB
5′-CGTCCCGTTATATTGGAG-3′
DS229
5′-CTTGTCACAGTTTTCAGCAGATTCGTCAG-3′
用NdeI和NotI消化质粒pDB2617,并由琼脂糖凝胶纯化用于AxokineTM-(GGS)4GG-清蛋白分泌的3.586kb NotI表达盒。
通过“非整合”质粒pSAC35提供适当的酵母载体序列。由pDB2671分离3.586kb NotI N端AxokineTM-(GGS)4GG-清蛋白表达盒,纯化,并连接到经NotI消化且经小牛小肠磷酸酶处理的pSAC35中,生成以与LEU2选择标记相同取向含有NotI表达盒的质粒pDB2618(图96)。通过“非整合”质粒pDB2690(图6)提供适当的酵母PDI1载体序列。由pDB2617分离3.586kbNotI N端AxokineTM-(GGS)4GG-清蛋白表达盒,纯化,并连接到经NotI消化且经小牛小肠磷酸酶处理的pDB2690中,生成以与LEU2选择标记相同取向含有NotI表达盒的质粒pDB3106(图68)。
使用单链寡核苷酸CF68和CF69通过PCR扩增人IL10 cDNA(NCBI编号NM_000572)。
CF68
5′-GCGCAGATCTTTGGATAAGAGAAGCCCAGGCCAGGGCACCCAGTCT
GAGAACAGCTGCAC-3′
CF69
5′-GCTTGGATCCACCGTTTCGTATCTTCATTGTCATGTAGGCTTCTATGTAG-3′
将0.43kb DNA片段用BamHI完全消化且用BglII部分消化,并分离0.42kb BglII-BamHI DNA片段。
质粒pDB2573X提供了合适的转录启动子和终止子,以及与人清蛋白N端融合的合适分泌前导序列和编码部分(GGS)4GG肽接头的DNA序列。先前(WO 03/066824)描述了pDB2573X的构建。
将质粒pDB2573X用BamHI和BglII完全消化,分离6.21kb DNA片段,并用小牛小肠碱性磷酸酶处理,然后与0.42kb BglII-BamHI N端IL10 cDNA连接,生成pDB2620(图69)。通过“非整合”质粒pSAC35提供适当的酵母载体序列。由pDB2620分离3.51kb NotI N端IL10-(GGS)4GG-清蛋白表达盒,纯化,并连接到经NotI消化且经小牛小肠磷酸酶处理的pSAC35中,生成以与LEU2选择标记相同取向含有NotI表达盒的质粒pDB2621(图70)。通过“非整合”质粒pDB2690(图6)提供适当的酵母PDI1载体序列。由pDB2620分离3.51kb NotI N端IL10-(GGS)4GG-清蛋白表达盒,纯化,并连接到经NotI消化且经小牛小肠磷酸酶处理的pDB2690中,生成以与LEU2选择标记相同取向含有NotI表达盒的质粒pDB3105(图71)。
使用改良的醋酸锂法(Sigma酵母转化试剂盒,YEAST-1,方案2;Ito等,1983,J.Bacterol.,153,163;Elble,1992,Biotechniques,13,18),将与先前实施例所用相同的对照酵母菌株转化成亮氨酸原养型。在BMMD琼脂板上选择转化子,然后点接到BMMD琼脂板上。由10ml BMMD摇瓶培养物(24小时,30℃,200rpm)制备冷冻海藻糖原种。
将每种菌株的转化子接种50ml摇瓶中的10ml BMMD,并在定轨摇床中于30℃以200rpm培养4天。收获培养物上清液,并通过火箭免疫电泳比较重组清蛋白融合体滴度(图72)。结果指示,来自酵母菌株的培养物上清液中的清蛋白融合体滴度在2μm质粒中存在PDI1时比不存在时高。
通过SDS-PAGE分析进一步研究了通过火箭免疫电泳检测到的清蛋白融合体的表达提高。将表达各种清蛋白融合体的YBX7的BMMD摇瓶培养物在定轨摇床中于30℃以200rpm培养4天。通过SDS-PAGE分析培养物上清液的样品(图73)。观察到具有所研究清蛋白融合体预期大小的蛋白质条带,且丰度提高。
实施例10
基于2μm的质粒上的酿酒酵母ORM2与重组运铁蛋白的共表达
将来自酿酒酵母S288c的ORM2基因克隆到在UL区中NotI位点处含有rTf(N413Q、N611Q)表达盒的基于pSAC35的质粒上REP2后面的XcmI位点中。
质粒pDB2965(图74)是通过将来自pDB2928(图11)的含有rTf(N413Q、N611Q)表达盒的3256bp NotI片段插入pDB2688(图4)的NotI位点而构建的。将pDB2688通过NotI消化而线性化,并用碱性磷酸酶进行处理。将来自pDB2928的rTf表达盒克隆到pDB2688的NotI位点中,生成以与LEU2相同的方向转录运铁蛋白基因的pDB2965。
使用寡核苷酸引物GS11和GS12(表10),使用Expand高保真PLUS PCR系统(Roche),通过PCR由酿酒酵母S288c基因组DNA扩增ORM2基因。
表10:用于酿酒酵母蛋白伴侣的PCR扩增的寡核苷酸引物
Figure GSA00000079559900851
引物设计成在正向引物的5′端掺入SnaBI和PacI限制性识别位点,而在反向引物的5′端掺入SnaBI和FseI限制性识别位点,用于克隆到载体pDB2965的XcmI位点处的接头中。在如下条件下进行PCR:200μM dNTP混合物、2.5U Expand HiFi酶混合物、1x Expand HiFi反应缓冲液、0.8μg基因组DNA;1个循环的94℃2分钟,30个循环的94℃30秒、55℃30秒、72℃3分钟,和1个循环的72℃7分钟。使用0.4μM每种引物。将所需1195bpPCR产物和pDB2965载体用PacI和FseI消化,连接到一起,并转化到大肠杆菌DH5α细胞中。选择氨苄青霉素抗性转化子。通过由氨苄青霉素抗性克隆分离的质粒DNA的限制酶分析鉴定含有ORM2的构建物。制备了四种质粒克隆,pDB3090、pDB3091、pDB3092和pBD3093,它们都在限制性分析过程中具有相同的预期DNA片段模式(图75)。
选择酿酒酵母对照菌株和菌株A(如实施例3所述)来调查运铁蛋白和ORM2基因由基于2μm的质粒共表达时对运铁蛋白分泌的影响。将对照菌株和菌株A用质粒pDB3090、pDB3092和pBD3093以及含有rTf(N413Q、N611Q)表达盒但没有ORM2的对照质粒pDB2931(图14)转化成亮氨酸原养型。在BMMD琼脂上选择转化子,并点接到BMMD琼脂上,用于后续分析。
为了调查ORM2共表达对运铁蛋白分泌的影响,将含有ORM2/运铁蛋白共表达质粒的菌株接种10ml选择性(BMMD)和非选择性(YEPD)液体培养基。然后将摇瓶培养物于30℃摇动(200rpm)培养4天。通过火箭免疫电泳(RIE)测定运铁蛋白分泌的相对水平(图76)。
在BMMD和YEPS这两种培养基中,由对照菌株[pDB3090]和对照菌株[pDB3092]分泌的运铁蛋白水平都高于对照菌株[pDB2931]的水平。类似的,在BMMD和YEPS这两种培养基中,由菌株A[pDB3090]和菌株A[pDB3093]二者分泌的运铁蛋白水平都高于菌株A[pDB2931]的水平。来自所有菌株A转化子的运铁蛋白分泌高于在相同培养基中培养的对照菌株转化子。菌株A在基因组中含有PDI1的额外拷贝,它增强了运铁蛋白分泌。因此,在菌株A中,ORM2和PDI1表达的升高对运铁蛋白分泌具有累积效应。
实施例11
基于2μm的质粒上的酿酒酵母PSE1与重组运铁蛋白的共表达
将来自酿酒酵母S288c的PSE1基因克隆到在UL区中NotI位点处含有rTf(N413Q、N611Q)表达盒的基于pSAC35的质粒上REP2后面的XcmI位点中。
使用寡核苷酸引物CED009和CED010(表10),使用Expand高保真PCR试剂盒(Roche),通过PCR由酿酒酵母S288c基因组DNA扩增3.25kb野生型PSE1基因。引物设计成在5′端掺入BamHI限制性识别位点,以便于克隆到载体pUC19中。在如下条件下进行PCR:1个循环的94℃2分钟,10个循环的94℃15秒、45℃30秒、68℃4分30秒,20个循环的94℃15秒、45℃30秒、68℃4分30秒(每个循环增加5秒),和1个循环的68℃10分钟。将所需PCR产物用BamHI消化,并连接到经BamHI消化并用碱性磷酸酶处理的pUC19中,生成构建物pDB2848(图77)。与来自染色体XIII上PSE1/YMR308C(坐标892220至888951,加1000碱基对的上游序列和1000碱基对的下游序列,http://www.yeastgenome.org处的糖酵母基因组数据库)的序列进行比较后,pDB2848的测序结果证实了扩增的序列就是预期的酿酒酵母S288c PSE1。然后通过BamHI消化由pDB2848切下PSE1基因,并将由此产生的4096bp片段用酚∶氯仿抽提,用乙醇沉淀,并用DNA聚合酶Klenow片段处理以填充5′突出。将质粒pDB2965(图74)通过SnaBI消化而线性化,并用碱性磷酸酶进行处理。连接线性化的pDB2965载体和PSE1插入片段,并转化到大肠杆菌DH5α细胞中。选择氨苄青霉素抗性转化子。通过由氨苄青霉素抗性克隆分离的质粒DNA的限制酶分析鉴定得出,质粒pDB3097(图78)和pDB3098(图79)含有PSE1基因。在pDB3097中,PSE1基因以与REP2相同的方向转录,而在pDB3098中,PSE1基因以与REP2相反的方向转录。
将酿酒酵母对照菌株用质粒pDB3097和pBD3098以及含有rTf(N413Q、N611Q)表达盒但没有PSE1的对照质粒pDB2931(图14)转化成亮氨酸原养型。在BMMD琼脂上选择转化子,并点接到BMMD琼脂上,用于后续分析。
为了调查PSE1表达对运铁蛋白分泌的影响,将含有PSE1/运铁蛋白共表达质粒的菌株接种装有10ml选择性(BMMD)液体培养基的烧瓶。然后将摇瓶培养物于30℃摇动(200rpm)培养4天。通过火箭免疫电泳(RIE)测定运铁蛋白分泌的相对水平(图80)。
在BMMD培养基中,由对照菌株[pDB3097]和对照菌株[pDB3098]分泌的运铁蛋白水平高于对照菌株[pDB2931]的水平。因此,来自基于2μm的质粒的PSE1表达提高来自酿酒酵母的运铁蛋白分泌。在pDB3097和pDB3098中,以相对于REP2的任意方向转录的PSE1基因都提高运铁蛋白分泌。
实施例12
基于2μm的质粒上的酿酒酵母SSA1与重组运铁蛋白的共表达
将来自酿酒酵母S288c的SSA1基因克隆到在UL区中NotI位点处含有rTf(N413Q、N611Q)表达盒的基于pSAC35的质粒上REP2后面的XcmI位点中。
使用寡核苷酸引物CED037和CED038(表10),使用Expand高保真PCR试剂盒(Roche),通过PCR由酿酒酵母S288c基因组DNA扩增1.93kbSSA1基因。引物设计成在它们的5′端掺入SphI限制性识别位点,以便于克隆到载体pUC19中。在如下条件下进行PCR:1个循环的94℃10分钟,35个循环的94℃1分钟、55℃1分钟、72℃5分钟,和1个循环的72℃10分钟。将所需PCR产物用SphI消化,然后连接到经SphI消化并用碱性磷酸酶处理的pUC19中,生成构建物pDB2850(图81)。pDB2850的测序结果证实了染色体I上SSA1/YAL005C(坐标141433至139505,加1000碱基对的上游序列和1000碱基对的下游序列,糖酵母基因组数据库http://www.yeastgenome.org中公布的)的预期序列。
通过SphI消化由pDB2850切下SSA1基因,并将由此产生的2748bp片段用酚∶氯仿抽提,用乙醇沉淀,并用T4DNA聚合酶处理以切除3′突出。将质粒pDB2965通过SnaBI消化而线性化,并用小牛小肠碱性磷酸酶进行处理。连接线性化的pDB2965载体和SSA1插入片段,并转化到大肠杆菌DH5α细胞中。选择氨苄青霉素抗性转化子。通过由氨苄青霉素抗性克隆分离的质粒DNA的限制酶分析鉴定了SSA1构建物pDB3094(图82)和pDB3095(图83)。在pDB3094中,SSA1基因以与REP2相同的方向转录,而在pDB3095中,SSA1基因以与REP2相反的方向转录。
将酿酒酵母对照菌株用质粒pDB3094和pBD3095以及含有rTf(N413Q、N611Q)表达盒但没有SSA1的对照质粒pDB2931(图14)转化成亮氨酸原养型。在BMMD琼脂上选择转化子,并点接到BMMD琼脂上,用于后续分析。
为了调查SSA1表达对运铁蛋白分泌的影响,将含有SSA1/运铁蛋白共表达质粒的菌株接种装有10ml选择性(BMMD)液体培养基的烧瓶。然后将摇瓶培养物于30℃摇动(200rpm)培养4天。通过火箭免疫电泳(RIE)测定运铁蛋白分泌的相对水平(图84)。
在BMMD培养基中,由对照菌株[pDB3095]分泌的运铁蛋白水平高于对照菌株[pDB2931]和对照菌株[pDB3094]的水平。因此,来自基于2μm的质粒的SSA1表达提高来自酿酒酵母的运铁蛋白分泌。在pDB3094中,以相对于REP2的相反方向转录的SSA1基因提高运铁蛋白分泌。
实施例13
PDI1基因破坏,连同基于2μm的质粒上的PDI1基因,提高重组清蛋白分泌和质粒稳定性
表11中所列单链寡核苷酸DNA引物设计用于扩增酵母PDI1编码区上游的一个区域和酵母PDI1编码区下游的另一个区域。
表11:寡核苷酸引物
Figure GSA00000079559900891
使用衍生自S288c的基因组DNA作为模板,引物DS299和DS300通过PCR扩增PDI1的5’区,而引物DS301和DS302扩增PDI1的3’区。PCR条件如下:1μl S288c模板DNA(0.01ng/μl、0.1ng/μl、1ng/μl、10ng/μl和100ng/μl)、5μl 10X缓冲液(Fast Start Taq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每种引物(2μM)、0.4μl Fast Start Taq,用水补至50μl。使用Perkin-Elmer热循环仪9700进行PCR。条件是:于95℃变性4分钟[保持HOLD],然后[循环CYCLE]于95℃变性30秒、于45℃退火30秒、于72℃延伸45秒,20个循环,然后[保持HOLD]于72℃10分钟,再然后[保持HOLD]4℃。用NotI和HindIII切割0.22kb PDI1 5′PCR产物,而用HindIII和PstI切割0.34kb PDI1 3′PCR产物。
将质粒pMCS5(Hoheisel,1994,Biotechniques,17,456-460)(图85)用HindIII完全消化,用T4DNA聚合酶加dNTP混合物补平末端,并重新连接,生成pDB2964(图86)。
将质粒pDB2964用HindIII消化,用小牛小肠碱性磷酸酶处理,并与经NotI和HindIII消化的0.22kbp PDI1 5′PCR产物和经HindIII和PstI消化的0.34kb PDI1 3′PCR产物连接,生成pDB3069(图87),并用正向和反向通用引物以及DNA测序引物DS303、DS304、DS305和DS306(表11)进行测序。
引物DS234和DS235(表12)用于由YIplac204(Gietz和Sugino,1988,Gene,74,527-534)扩增经修饰的TRP1标记基因,在PCR产物的两个末端掺入HindIII限制性位点。PCR条件如下:1μl模板YIplac204(0.01ng/μl、0.1ng/μl、1ng/μl、10ng/μl和100ng/μl)、5μl 10X缓冲液(Fast Start Taq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每种引物(2μM)、0.4μl Fast Start Taq,用水补至50μl。使用Perkin-Elmer热循环仪9600进行PCR。条件是:于95℃变性4分钟[保持HOLD],然后[循环CYCLE]于95℃变性30秒、于45℃退火30秒、于72℃延伸90秒,20个循环,然后[保持HOLD]于72℃10分钟,再然后[保持HOLD]4℃。将0.86kb PCR产物用HindIII消化,并克隆到pMCS5的HindIII位点中,生成pDB2778(图88)。限制酶分析和使用通用正向和反向引物以及DS236、DS237、DS238和DS239(表12)进行的测序证实了经修饰TRP1基因的序列是正确的。
表12:寡核苷酸引物
Figure GSA00000079559900901
Figure GSA00000079559900911
通过HindIII消化由pDB2778分离0.86kb TRP1基因,并克隆到pDB3069的HindIII位点中,生成pDB3078(图89)和pDB3079(图90)。通过NotI/PstI消化由pDB3078或pDB3079分离1.41kb pdi1::TRP1破坏DNA片段。
以这样一种方式构建掺入TRP1删除(trp1Δ)的酵母菌株,即一旦构建trp1Δ,基因组中不应当剩下与TRP1标记基因(pDB2778)的同源性,从而防止未来含TRP1构建物和TRP1基因座之间的同源重组。为了实现由选定宿主菌株的基因组完全清除天然TRP1序列,设计寡核苷酸,用于扩增整合载体YIplac204(Gietz和Sugino,1988,Gene,74,527-534)上存在的TRP1标记基因外侧的TRP1基因5′UTR和3′UTR区域。YIplac204 TRP1标记基因与天然/染色体TRP1基因有所不同,即通过定点诱变清除了内部HindIII、PstI和XbaI位点(Gietz和Sugino,1988,Gene,74,527-534)。YIplac204经修饰TRP1标记基因是由1.453kb补平基因组片段EcoRI片段构建的,它含有TRP1基因且只有TRP1启动子的102bp(Gietz和Sugino,1988,Gene,74,527-534)。尽管这是较短的启动子序列,然而显然它足以补足trp1营养缺陷型突变(Gietz和Sugino,1988,Gene,74,527-534)。只由位于TRP1ORF起点5’102bp处的EcoRI位点上游的DNA序列用于创建5′TRP1 UTR。3′UTR的选择较不苛刻,只要它在功能性经修饰TRP1标记3’端的外侧,选择的是翻译终止密码子下游85bp。
设计并构建单链寡核苷酸DNA引物,以扩增TRP1基因的5′UTR和3′UTR区,使得在PCR扩增过程中,限制酶位点将添加到后期克隆步骤中将要用到的PCR产物的末端。使用S288c基因组DNA作为模板,引物DS230和DS231(表12)通过PCR扩增TRP1的5′区域,而引物DS232和DS233(表12)扩增TRP1的3′区域。PCR条件如下:1μl模板S288c基因组DNA(0.01ng/μl、0.1ng/μl、1ng/μl、10ng/μl和100ng/μl)、5μl 10X缓冲液(Fast StartTaq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每种引物(2μM)、0.4μl FastStart Taq,用水补至50μl。使用Perkin-Elmer热循环仪9600进行PCR。条件是:于95℃变性4分钟[保持HOLD],然后[循环CYCLE]于95℃变性30秒、于45℃退火45秒、于72℃延伸90秒,20个循环,然后[保持HOLD]于72℃10分钟,再然后[保持HOLD]4℃。
将0.19kb TRP1 5′UTR PCR产物用EcoRI和HindIII切割,而将0.2kbTRP1 3′UTR PCR产物用BamHI和HindIII切割,并连接到用BamHI/EcoRI线性化的pAYE505中,生成质粒pDB2777(图91)。WO 95/33833中描述了pAYE505的构建。使用设计成由质粒主链引发并对所克隆插入片段测序的正向和反向引物进行的DNA测序证实了在这两种情况中所克隆的TPP1基因5′和3′UTR序列具有预期DNA序列。质粒pDB2777含有TRP1破坏的片段,它包含衍生自TRP1 5′和3′UTR的序列的融合体。通过EcoRI完全消化由pDB2777切下此0.383kb TRP1破坏片段。
使用改良的醋酸锂法(Sigma酵母转化试剂盒,YEAST-1,方案2;Ito等,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),将酵母菌株DXY1(Kerry-Williams等,1998,Yeast,14,161-169)用清蛋白表达质粒pDB2244转化成亮氨酸原养型,生成酵母菌株DXY1[pDB2244]。WO 00/44772中描述了清蛋白表达质粒pDB2244的构建。在BMMD琼脂板上选择转化子,然后点接到BMMD琼脂板上。由10ml BMMD摇瓶培养物(24小时,30℃,200rpm)制备冷冻海藻糖原种。
如Toyn等,2000,Yeast,16,553-560所述,使用掺入了对立选择性色氨酸类似物5-氟氨茴酸(5-FAA)的营养琼脂,将DXY1[pDB2244]用来自pDB2777的0.383kb EcoRI TRP1破坏DNA片段转化成色氨酸自养型。挑取对5-FAA的毒性作用有抗性的菌落,并在第二轮5-FAA板上划线,以确认它们确实耐受5-FAA并由任何背景生长中选择出来。然后将生长的那些菌落再次点接到BMMD和BMMD加色氨酸上,以鉴定哪些是色氨酸营养缺陷型。
然后选择证明是色氨酸营养缺陷型的菌落,用于通过YCplac22(Gietz和Sugino,1988,Gene,74,527-534)转化进行进一步分析,以查明哪些分离物是trp1。
使用横跨TRP1基因座的PCR扩增来确认trp-表型是由于该区域中的缺失。由鉴定为耐受5-FAA且不能在未添加色氨酸的极限培养基上生长的分离物制备基因组DNA。如下完成用引物CED005和CED006(表12)对基因组TRP1基因座的PCR扩增:1μl模板基因组DNA、5μl 10X缓冲液(Fast StartTaq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每种引物(2μM)、0.4μl FastStart Taq,用H2O补至50μl。使用Perkin-Elmer热循环仪9600进行PCR。条件是:于94℃变性10分钟[保持HOLD],然后[循环CYCLE]于94℃变性30秒、于55℃退火30秒、于72℃延伸120秒,40个循环,然后[保持HOLD]于72℃10分钟,再然后[保持HOLD]4℃。对野生型TRP1基因座的PCR扩增导致大小为1.34kb的PCR产物,而跨越已删除TRP1区的扩增导致小0.84kb即位于0.50kb处的PCR产物。PCR分析鉴定得出DXY1衍生的trp-菌株(DXY1 trp1Δ[pDB2244])具有预期的删除事件。
如Sleep等,1991,Bio/Technology,9,183-187所述,消除酵母菌株DXY1 trp1Δ[pDB2244]的表达质粒pDB2244。使用改良的醋酸锂法(Sigma酵母转化试剂盒,YEAST-1,方案2;Ito等,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),将DXY1 trp1Δ cir0用pDB2244、pDB2976、pDB2977、pDB2978、pDB2979、pDB2980或pDB2981再次转化成亮氨酸原养型。在补充了色氨酸的BMMD琼脂板上选择转化子,然后点接到补充了色氨酸的BMMD琼脂板上。由10ml补充了色氨酸的BMMD摇瓶培养物(24小时,30℃,200rpm)制备冷冻海藻糖原种。
使用改良的醋酸锂法(Sigma酵母转化试剂盒,YEAST-1,方案2;Ito等,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),用通过NotI/PstI消化由pDB3078分离的1.41kb pdi1::TRP1破坏DNA片段,将酵母菌株DXY1 trp1Δ[pDB2976]、DXY1 trp1Δ[pDB2977]、DXY1 trp1Δ[pDB2978]、DXY1 trp1Δ[pDB2979]、DXY1 trp1Δ[pDB2980]或DXY1 trp1Δ[pDB2981]转化成色氨酸原养型。在BMMD琼脂板上选择转化子,然后点接到BMMD琼脂板上。
将每种菌株的6个转化子接种50ml摇瓶中的10ml YEPD,并在定轨摇床中于30℃以200rpm培养4天。收获培养物上清液和细胞生物量。由色氨酸原养型和DXY1[pDB2244]制备基因组DNA(Lee,1992,Biotechniques,12,677)。如下完成用引物DS236和DS303(表11和12)对基因组PDI1基因座的PCR扩增:1μl模板基因组DNA、5μl 10X缓冲液(Fast StartTaq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每种引物(2μM)、0.4μl FastStart Taq,用H2O补至50μl。使用Perkin-Elmer热循环仪9700进行PCR。条件是:于94℃变性4分钟[保持HOLD],然后[循环CYCLE]于94℃变性30秒、于50℃退火30秒、于72℃延伸60秒,30个循环,然后[HOLD]于72℃10分钟,再然后[HOLD]4℃。对野生型PDI1基因座的PCR扩增导致没有PCR产物,而跨越已删除PDI1区的扩增导致PCR产物0.65kbp。PCR分析鉴定得出测试的所有36个潜在pdi1::TRP1菌株都具有预期的pdi1::TRP1删除。
通过火箭免疫电泳比较了重组清蛋白滴度(图92)。在每个组内,DXY1trp1Δ[pDB2976]、DXY1 trp1Δ[pDB2978]、DXY1 trp1Δ[pDB2980]、DXY1trp1Δ[pDB2977]和DXY1 trp1Δ[pDB2979]的所有6个pdi1::TRP1破坏子(disruptant)都具有非常相似的rHA生产力。只有DXY1 trp1Δ[pDB2981]的6个pdi1::TRP1破坏子显示rHA表达滴度的变化。将图92中所示6个pdi1::TRP1破坏子涂布到YEPD琼脂上以分离单菌落,并再次点接到BMMD琼脂上。
将DXY1 trp1Δ pdi1::TRP1[pDB2976]、DXY1 trp1Δ pdi1::TRP1[pDB2978]、DXY1 trp1Δ pdi1::TRP1[pDB2980]、DXY1 trp1Δ pdi1::TRP1[pDB2977]、DXY1 trp1Δ pdi1::TRP1[pDB2979]和DXY1 trp1Δ pdi1::TRP1[pDB2981]以及DXY1[pDB2244]、DXY1[pDB2976]、DXY1[pDB2978]、DXY1[pDB2980]、DXY1[pDB2977]、DXY1[pDB2979]和DXY1[pDB2981]的3个单细胞分离物接种50ml摇瓶中的10ml YEPD,并在定轨摇床中于30℃以200rpm培养4天。收获培养物上清液,并通过火箭免疫电泳比较重组清蛋白滴度(图93)。将图93中所示13个野生型PDI1和pdi1::TRP1破坏子涂布到YEPD琼脂上以分离单菌落。然后将来自每种菌株的100个单细胞化菌落再次点接到含有山羊抗HSA抗体的BMMD琼脂或YEPD琼脂上以检测重组清蛋白的表达(Sleep等,1991,Bio/Technology,9,183-187),并对每个菌落的Leu+/rHA+、Leu+/rHA-、Leu-/rHA+或Leu-/rHA-表型评分(表13)。
表13:
这些数据指示,当PDI1基因在没有染色体编码PDI的宿主菌株中用作质粒上的选择标记时,甚至在非选择性培养基诸如例示的丰富培养基中,质粒保持得到提高。
序列表
<110>诺维信生物制药丹麦公司(Novozymes Biopharma DK A/S)
<120>基因表达技术
 
<130>DELBE/P32303PC
 
<140>PCT/GB2004/005462
<141>23/12/04
 
<150>0329681.1
<151>23/12/03
 
<160>79
 
<170>SeqWin99
 
<210>1
<211>522
<212>PRT
<213>酿酒酵母(Saccharomyces cerevisiae)蛋白质二硫键异构酶前体
 
<400>1
Met Lys Phe Ser Ala Gly Ala Val Leu Ser Trp Ser Ser Leu Leu Leu
1               5                   10                  15
Ala Ser Ser Val Phe Ala Gln Gln Glu Ala Val Ala Pro Glu Asp Ser
            20                  25                  30
Ala Val Val Lys Leu Ala Thr Asp Ser Phe Asn Glu Tyr Ile Gln Ser
        35                  40                  45
His Asp Leu Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys
    50                  55                  60
Lys Asn Met Ala Pro Glu Tyr Val Lys Ala Ala Glu Thr Leu Val Glu
65                  70                  75                  80
Lys Asn Ile Thr Leu Ala Gln Ile Asp Cys Thr Glu Asn Gln Asp Leu
                85                  90                  95
Cys Met Glu His Asn Ile Pro Gly Phe Pro Ser Leu Lys Ile Phe Lys
            100                 105                 110
Asn Ser Asp Val Asn Asn Ser Ile Asp Tyr Glu Gly Pro Arg Thr Ala
        115                 120                 125
Glu Ala Ile Val Gln Phe Met Ile Lys Gln Ser Gln Pro Ala Val Ala
    130                 135                 140
Val Val Ala Asp Leu Pro Ala Tyr Leu Ala Asn Glu Thr Phe Val Thr
145                 150                 155                 160
Pro Val Ile Val Gln Ser Gly Lys Ile Asp Ala Asp Phe Asn Ala Thr
                165                 170                 175
Phe Tyr Ser Met Ala Asn Lys His Phe Asn Asp Tyr Asp Phe Val Ser
            180                 185                 190
Ala Glu Asn Ala Asp Asp Asp Phe Lys Leu Ser Ile Tyr Leu Pro Ser
        195                 200                 205
Ala Met Asp Glu Pro Val Val Tyr Asn Gly Lys Lys Ala Asp Ile Ala
    210                 215                 220
Asp Ala Asp Val Phe Glu Lys Trp Leu Gln Val Glu Ala Leu Pro Tyr
225                 230                 235                 240
Phe Gly Glu Ile Asp Gly Ser Val Phe Ala Gln Tyr Val Glu Ser Gly
                245                 250                 255
Leu Pro Leu Gly Tyr Leu Phe Tyr Asn Asp Glu Glu Glu Leu Glu Glu
            260                 265                 270
Tyr Lys Pro Leu Phe Thr Glu Leu Ala Lys Lys Asn Arg Gly Leu Met
        275                 280                 285
Asn Phe Val Ser Ile Asp Ala Arg Lys Phe Gly Arg His Ala Gly Asn
    290                 295                 300
Leu Asn Met Lys Glu Gln Phe Pro Leu Phe Ala Ile His Asp Met Thr
305                 310                 315                 320
Glu Asp Leu Lys Tyr Gly Leu Pro Gln Leu Ser Glu Glu Ala Phe Asp
                325                 330                 335
Glu Leu Ser Asp Lys Ile Val Leu Glu Ser Lys Ala Ile Glu Ser Leu
            340                 345                 350
Val Lys Asp Phe Leu Lys Gly Asp Ala Ser Pro Ile Val Lys Ser Gln
        355                 360                 365
Glu Ile Phe Glu Asn Gln Asp Ser Ser Val Phe Gln Leu Val Gly Lys
    370                 375                 380
Asn His Asp Glu Ile Val Asn Asp Pro Lys Lys Asp Val Leu Val Leu
385                 390                 395                 400
Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Arg Leu Ala Pro Thr Tyr
                405                 410                 415
Gln Glu Leu Ala Asp Thr Tyr Ala Asn Ala Thr Ser Asp Val Leu Ile
            420                 425                 430
Ala Lys Leu Asp His Thr Glu Asn Asp Val Arg Gly Val Val Ile Glu
        435                 440                 445
Gly Tyr Pro Thr Ile Val Leu Tyr Pro Gly Gly Lys Lys Ser Glu Ser
    450                 455                 460
Val Val Tyr Gln Gly Ser Arg Ser Leu Asp Ser Leu Phe Asp Phe Ile
465                 470                 475                 480
Lys Glu Asn Gly His Phe Asp Val Asp Gly Lys Ala Leu Tyr Glu Glu
                485                 490                 495
Ala Gln Glu Lys Ala Ala Glu Glu Ala Asp Ala Asp Ala Glu Leu Ala
            500                 505                 510
Asp Glu Glu Asp Ala Ile His Asp Glu Leu
        515                 520
 
<210>2
<211>530
<212>PRT
<213>酿酒酵母候选的蛋白质二硫键异构酶
 
<400>2
Met Lys Phe Ser Ala Gly Ala Val Leu Ser Trp Ser Ser Leu Leu Leu
1               5                   10                  15
Ala Ser Ser Val Phe Ala Gln Gln Glu Ala Val Ala Pro Glu Asp Ser
            20                  25                  30
Ala Val Val Lys Leu Ala Thr Asp Ser Phe Asn Glu Tyr Ile Gln Ser
        35                  40                  45
His Asp Leu Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys
    50                  55                  60
Lys Asn Met Ala Pro Glu Tyr Val Lys Ala Ala Glu Thr Leu Val Glu
65                  70                  75                  80
Lys Asn Ile Thr Leu Ala Gln Ile Asp Cys Thr Glu Asn Gln Asp Leu
                85                  90                  95
Cys Met Glu His Asn Ile Pro Gly Phe Pro Ser Leu Lys Ile Phe Lys
            100                 105                 110
Asn Arg Asp Val Asn Asn Ser Ile Asp Tyr Glu Gly Pro Arg Thr Ala
        115                 120                 125
Glu Ala Ile Val Gln Phe Met Ile Lys Gln Ser Gln Pro Ala Val Ala
    130                 135                 140
Val Val Ala Asp Leu Pro Ala Tyr Leu Ala Asn Glu Thr Phe Val Thr
145                 150                 155                 160
Pro Val Ile Val Gln Ser Gly Lys Ile Asp Ala Asp Phe Asn Ala Thr
                165                 170                 175
Phe Tyr Ser Met Ala Asn Lys His Phe Asn Asp Tyr Asp Phe Val Ser
            180                 185                 190
Ala Glu Asn Ala Asp Asp Asp Phe Lys Leu Ser Ile Tyr Leu Pro Ser
        195                 200                 205
Ala Met Asp Glu Pro Val Val Tyr Asn Gly Lys Lys Ala Asp Ile Ala
    210                 215                 220
Asp Ala Asp Val Phe Glu Lys Trp Leu Gln Val Glu Ala Leu Pro Tyr
225                 230                 235                 240
Phe Gly Glu Ile Asp Gly Ser Val Phe Ala Gln Tyr Val Glu Ser Gly
                245                 250                 255
Leu Pro Leu Gly Tyr Leu Phe Tyr Asn Asp Glu Glu Glu Leu Glu Glu
            260                 265                 270
Tyr Lys Pro Leu Phe Thr Glu Leu Ala Lys Lys Asn Arg Gly Leu Met
        275                 280                 285
Asn Phe Val Ser Ile Asp Ala Arg Lys Phe Gly Arg His Ala Gly Asn
    290                 295                 300
Leu Asn Met Lys Glu Gln Phe Pro Leu Phe Ala Ile His Asp Met Thr
305                 310                 315                 320
Glu Asp Leu Lys Tyr Gly Leu Pro Gln Leu Ser Glu Glu Ala Phe Asp
                325                 330                 335
Glu Leu Ser Asp Lys Ile Val Leu Glu Ser Lys Ala Ile Glu Ser Leu
            340                 345                 350
Val Lys Asp Phe Leu Lys Gly Asp Ala Ser Pro Ile Val Lys Ser Gln
        355                 360                 365
Glu Ile Phe Glu Asn Gln Asp Ser Ser Val Phe Gln Leu Val Gly Lys
    370                 375                 380
Asn His Asp Glu Ile Val Asn Asp Pro Lys Lys Asp Val Leu Val Leu
385                 390                 395                 400
Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Arg Leu Ala Pro Thr Tyr
                405                 410                 415
Gln Glu Leu Ala Asp Thr Tyr Ala Asn Ala Thr Ser Asp Val Leu Ile
            420                 425                 430
Ala Lys Leu Asp His Thr Glu Asn Asp Val Arg Gly Val Val Ile Glu
        435                 440                 445
Gly Tyr Pro Thr Ile Val Leu Tyr Pro Gly Gly Lys Lys Ser Glu Ser
    450                 455                 460
Val Val Tyr Gln Gly Ser Arg Ser Leu Asp Ser Leu Phe Asp Phe Ile
465                 470                 475                 480
Lys Glu Asn Gly His Phe Asp Val Asp Gly Lys Ala Leu Tyr Glu Glu
                485                 490                 495
Ala Gln Glu Lys Ala Ala Glu Glu Ala Glu Ala Asp Ala Glu Ala Glu
            500                 505                 510
Ala Asp Ala Asp Ala Glu Leu Ala Asp Glu Glu Asp Ala Ile His Asp
        515                 520                 525
Glu Leu
    530
 
<210>3
<211>8
<212>PRT
<213>酿酒酵母候选的蛋白质二硫键异构酶氨基酸506-513
 
<400>3
Glu Ala Asp Ala Glu Ala Glu Ala
1               5
 
<210>4
<211>642
<212>PRT
<213>酿酒酵母SSA1蛋白质
 
<400>4
Met Ser Lys Ala Val Gly Ile Asp Leu Gly Thr Thr Tyr Ser Cys Val
1               5                   10                  15
Ala His Phe Ala Asn Asp Arg Val Asp Ile Ile Ala Asn Asp Gln Gly
            20                  25                  30
Asn Arg Thr Thr Pro Ser Phe Val Ala Phe Thr Asp Thr Glu Arg Leu
        35                  40                  45
Ile Gly Asp Ala Ala Lys Asn Gln Ala Ala Met Asn Pro Ser Asn Thr
    50                  55                  60
Val Phe Asp Ala Lys Arg Leu Ile Gly Arg Asn Phe Asn Asp Pro Glu
65                  70                  75                  80
Val Gln Ala Asp Met Lys His Phe Pro Phe Lys Leu Ile Asp Val Asp
                85                  90                  95
Gly Lys Pro Gln Ile Gln Val Glu Phe Lys Gly Glu Thr Lys Asn Phe
            100                 105                 110
Thr Pro Glu Gln Ile Ser Ser Met Val Leu Gly Lys Met Lys Glu Thr
        115                 120                 125
Ala Glu Ser Tyr Leu Gly Ala Lys Val Asn Asp Ala Val Val Thr Val
    130                 135                 140
Pro Ala Tyr Phe Asn Asp Ser Gln Arg Gln Ala Thr Lys Asp Ala Gly
145                 150                 155                 160
Thr Ile Ala Gly Leu Asn Val Leu Arg Ile Ile Asn Glu Pro Thr Ala
                165                 170                 175
Ala Ala Ile Ala Tyr Gly Leu Asp Lys Lys Gly Lys Glu Glu His Val
            180                 185                 190
Leu Ile Phe Asp Leu Gly Gly Gly Thr Phe Asp Val Ser Leu Leu Phe
        195                 200                 205
Ile Glu Asp Gly Ile Phe Glu Val Lys Ala Thr Ala Gly Asp Thr His
    210                 215                 220
Leu Gly Gly Glu Asp Phe Asp Asn Arg Leu Val Asn His Phe Ile Gln
225                 230                 235                 240
Glu Phe Lys Arg Lys Asn Lys Lys Asp Leu Ser Thr Asn Gln Arg Ala
                245                 250                 255
Leu Arg Arg Leu Arg Thr Ala Cys Glu Arg Ala Lys Arg Thr Leu Ser
            260                 265                 270
Ser Ser Ala Gln Thr Ser Val Glu Ile Asp Ser Leu Phe Glu Gly Ile
        275                 280                 285
Asp Phe Tyr Thr Ser Ile Thr Arg Ala Arg Phe Glu Glu Leu Cys Ala
    290                 295                 300
Asp Leu Phe Arg Ser Thr Leu Asp Pro Val Glu Lys Val Leu Arg Asp
305                 310                 315                 320
Ala Lys Leu Asp Lys Ser Gln Val Asp Glu Ile Val Leu Val Gly Gly
                325                 330                 335
Ser Thr Arg Ile Pro Lys Val Gln Lys Leu Val Thr Asp Tyr Phe Asn
            340                 345                 350
Gly Lys Glu Pro Asn Arg Ser Ile Asn Pro Asp Glu Ala Val Ala Tyr
        355                 360                 365
Gly Ala Ala Val Gln Ala Ala Ile Leu Thr Gly Asp Glu Ser Ser Lys
    370                 375                 380
Thr Gln Asp Leu Leu Leu Leu Asp Val Ala Pro Leu Ser Leu Gly Ile
385                 390                 395                 400
Glu Thr Ala Gly Gly Val Met Thr Lys Leu Ile Pro Arg Asn Ser Thr
                405                 410                 415
Ile Ser Thr Lys Lys Phe Glu Ile Phe Ser Thr Tyr Ala Asp Asn Gln
            420                 425                 430
Pro Gly Val Leu Ile Gln Val Phe Glu Gly Glu Arg Ala Lys Thr Lys
        435                 440                 445
Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Ser Gly Ile Pro Pro Ala
    450                 455                 460
Pro Arg Gly Val Pro Gln Ile Glu Val Thr Phe Asp Val Asp Ser Asn
465                 470                 475                 480
Gly Ile Leu Asn Val Ser Ala Val Glu Lys Gly Thr Gly Lys Ser Asn
                485                 490                 495
Lys Ile Thr Ile Thr Asn Asp Lys Gly Arg Leu Ser Lys Glu Asp Ile
            500                 505                 510
Glu Lys Met Val Ala Glu Ala Glu Lys Phe Lys Glu Glu Asp Glu Lys
        515                 520                 525
Glu Ser Gln Arg Ile Ala Ser Lys Asn Gln Leu Glu Ser Ile Ala Tyr
    530                 535                 540
Ser Leu Lys Asn Thr Ile Ser Glu Ala Gly Asp Lys Leu Glu Gln Ala
545                 550                 555                 560
Asp Lys Asp Thr Val Thr Lys Lys Ala Glu Glu Thr Ile Ser Trp Leu
                565                 570                 575
Asp Ser Asn Thr Thr Ala Ser Lys Glu Glu Phe Asp Asp Lys Leu Lys
            580                 585                 590
Glu Leu Gln Asp Ile Ala Asn Pro Ile Met Ser Lys Leu Tyr Gln Ala
        595                 600                 605
Gly Gly Ala Pro Gly Gly Ala Ala Gly Gly Ala Pro Gly Gly Phe Pro
    610                 615                 620
Gly Gly Ala Pro Pro Ala Pro Glu Ala Glu Gly Pro Thr Val Glu Glu
625                 630                 635                 640
Val Asp
 
<210>5
<211>1929
<212>DNA
<213>酿酒酵母SSA1编码序列
 
<400>5
atgtcaaaag ctgtcggtat tgatttaggt acaacatact cgtgtgttgc tcactttgct   60
aatgatcgtg tggacattat tgccaacgat caaggtaaca gaaccactcc atcttttgtc   120
gctttcactg acactgaaag attgattggt gatgctgcta agaatcaagc tgctatgaat   180
ccttcgaata ccgttttcga cgctaagcgt ttgatcggta gaaacttcaa cgacccagaa   240
gtgcaggctg acatgaagca cttcccattc aagttgatcg atgttgacgg taagcctcaa   300
attcaagttg aatttaaggg tgaaaccaag aactttaccc cagaacaaat ctcctccatg   360
gtcttgggta agatgaagga aactgccgaa tcttacttgg gagccaaggt caatgacgct   420
gtcgtcactg tcccagctta cttcaacgat tctcaaagac aagctaccaa ggatgctggt   480
accattgctg gtttgaatgt cttgcgtatt attaacgaac ctaccgccgc tgccattgct   540
tacggtttgg acaagaaggg taaggaagaa cacgtcttga ttttcgactt gggtggtggt   600
actttcgatg tctctttgtt gttcattgaa gacggtatct ttgaagttaa ggccaccgct   660
ggtgacaccc atttgggtgg tgaagatttt gacaacagat tggtcaacca cttcatccaa   720
gaattcaaga gaaagaacaa gaaggacttg tctaccaacc aaagagcttt gagaagatta   780
agaaccgctt gtgaaagagc caagagaact ttgtcttcct ccgctcaaac ttccgttgaa   840
attgactctt tgttcgaagg tatcgatttc tacacttcca tcaccagagc cagattcgaa   900
gaattgtgtg ctgacttgtt cagatctact ttggacccag ttgaaaaggt cttgagagat   960
gctaaattgg acaaatctca agtcgatgaa attgtcttgg tcggtggttc taccagaatt   1020
ccaaaggtcc aaaaattggt cactgactac ttcaacggta aggaaccaaa cagatctatc   1080
aacccagatg aagctgttgc ttacggtgct gctgttcaag ctgctatttt gactggtgac   1140
gaatcttcca agactcaaga tctattgttg ttggatgtcg ctccattatc cttgggtatt   1200
gaaactgctg gtggtgtcat gaccaagttg attccaagaa actctaccat ttcaacaaag   1260
aagttcgaga tcttttccac ttatgctgat aaccaaccag gtgtcttgat tcaagtcttt   1320
gaaggtgaaa gagccaagac taaggacaac aacttgttgg gtaagttcga attgagtggt   1380
attccaccag ctccaagagg tgtcccacaa attgaagtca ctttcgatgt cgactctaac   1440
ggtattttga atgtttccgc cgtcgaaaag ggtactggta agtctaacaa gatcactatt   1500
accaacgaca agggtagatt gtccaaggaa gatatcgaaa agatggttgc tgaagccgaa   1560
aaattcaagg aagaagatga aaaggaatct caaagaattg cttccaagaa ccaattggaa   1620
tccattgctt actctttgaa gaacaccatt tctgaagctg gtgacaaatt ggaacaagct   1680
gacaaggaca ccgtcaccaa gaaggctgaa gagactattt cttggttaga cagcaacacc   1740
actgccagca aggaagaatt cgatgacaag ttgaaggagt tgcaagacat tgccaaccca   1800
atcatgtcta agttgtacca agctggtggt gctccaggtg gcgctgcagg tggtgctcca   1860
ggcggtttcc caggtggtgc tcctccagct ccagaggctg aaggtccaac cgttgaagaa   1920
gttgattaa                                                           1929
 
<210>6
<211>1089
<212>PRT
<213>酿酒酵母PSE1蛋白质
 
<400>6
Met Ser Ala Leu Pro Glu Glu Val Asn Arg Thr Leu Leu Gln Ile Val
1               5                   10                  15
Gln Ala Phe Ala Ser Pro Asp Asn Gln Ile Arg Ser Val Ala Glu Lys
            20                  25                  30
Ala Leu Ser Glu Glu Trp Ile Thr Glu Asn Asn Ile Glu Tyr Leu Leu
        35                  40                  45
Thr Phe Leu Ala Glu Gln Ala Ala Phe Ser Gln Asp Thr Thr Val Ala
    50                  55                  60
Ala Leu Ser Ala Val Leu Phe Arg Lys Leu Ala Leu Lys Ala Pro Pro
65                  70                  75                  80
Ser Ser Lys Leu Met Ile Met Ser Lys Asn Ile Thr His Ile Arg Lys
                85                  90                  95
Glu Val Leu Ala Gln Ile Arg Ser Ser Leu Leu Lys Gly Phe Leu Ser
            100                 105                 110
Glu Arg Ala Asp Ser Ile Arg His Lys Leu Ser Asp Ala Ile Ala Glu
        115                 120                 125
Cys Val Gln Asp Asp Leu Pro Ala Trp Pro Glu Leu Leu Gln Ala Leu
    130                 135                 140
Ile Glu Ser Leu Lys Ser Gly Asn Pro Asn Phe Arg Glu Ser Ser Phe
145                 150                 155                 160
Arg Ile Leu Thr Thr Val Pro Tyr Leu Ile Thr Ala Val Asp Ile Asn
                165                 170                 175
Ser Ile Leu Pro Ile Phe Gln Ser Gly Phe Thr Asp Ala Ser Asp Asn
            180                 185                 190
Val Lys Ile Ala Ala Val Thr Ala Phe Val Gly Tyr Phe Lys Gln Leu
        195                 200                 205
Pro Lys Ser Glu Trp Ser Lys Leu Gly Ile Leu Leu Pro Ser Leu Leu
    210                 215                 220
Asn Ser Leu Pro Arg Phe Leu Asp Asp Gly Lys Asp Asp Ala Leu Ala
225                 230                 235                 240
Ser Val Phe Glu Ser Leu Ile Glu Leu Val Glu Leu Ala Pro Lys Leu
                245                 250                 255
Phe Lys Asp Met Phe Asp Gln Ile Ile Gln Phe Thr Asp Met Val Ile
            260                 265                 270
Lys Asn Lys Asp Leu Glu Pro Pro Ala Arg Thr Thr Ala Leu Glu Leu
        275                 280                 285
Leu Thr Val Phe Ser Glu Asn Ala Pro Gln Met Cys Lys Ser Asn Gln
    290                 295                 300
Asn Tyr Gly Gln Thr Leu Val Met Val Thr Leu Ile Met Met Thr Glu
305                 310                 315                 320
Val Ser Ile Asp Asp Asp Asp Ala Ala Glu Trp Ile Glu Ser Asp Asp
                325                 330                 335
Thr Asp Asp Glu Glu Glu Val Thr Tyr Asp His Ala Arg Gln Ala Leu
            340                 345                 350
Asp Arg Val Ala Leu Lys Leu Gly Gly Glu Tyr Leu Ala Ala Pro Leu
        355                 360                 365
Phe Gln Tyr Leu Gln Gln Met Ile Thr Ser Thr Glu Trp Arg Glu Arg
    370                 375                 380
Phe Ala Ala Met Met Ala Leu Ser Ser Ala Ala Glu Gly Cys Ala Asp
385                 390                 395                 400
Val Leu Ile Gly Glu Ile Pro Lys Ile Leu Asp Met Val Ile Pro Leu
                405                 410                 415
Ile Asn Asp Pro His Pro Arg Val Gln Tyr Gly Cys Cys Asn Val Leu
            420                 425                 430
Gly Gln Ile Ser Thr Asp Phe Ser Pro Phe Ile Gln Arg Thr Ala His
        435                 440                 445
Asp Arg Ile Leu Pro Ala Leu Ile Ser Lys Leu Thr Ser Glu Cys Thr
    450                 455                 460
Ser Arg Val Gln Thr His Ala Ala Ala Ala Leu Val Asn Phe Ser Glu
465                 470                 475                 480
Phe Ala Ser Lys Asp Ile Leu Glu Pro Tyr Leu Asp Ser Leu Leu Thr
                485                 490                 495
Asn Leu Leu Val Leu Leu Gln Ser Asn Lys Leu Tyr Val Gln Glu Gln
            500                 505                 510
Ala Leu Thr Thr Ile Ala Phe Ile Ala Glu Ala Ala Lys Asn Lys Phe
        515                 520                 525
Ile Lys Tyr Tyr Asp Thr Leu Met Pro Leu Leu Leu Asn Val Leu Lys
    530                 535                 540
Val Asn Asn Lys Asp Asn Ser Val Leu Lys Gly Lys Cys Met Glu Cys
545                 550                 555                 560
Ala Thr Leu Ile Gly Phe Ala Val Gly Lys Glu Lys Phe His Glu His
                565                 570                 575
Ser Gln Glu Leu Ile Ser Ile Leu Val Ala Leu Gln Asn Ser Asp Ile
            580                 585                 590
Asp Glu Asp Asp Ala Leu Arg Ser Tyr Leu Glu Gln Ser Trp Ser Arg
        595                 600                 605
Ile Cys Arg Ile Leu Gly Asp Asp Phe Val Pro Leu Leu Pro Ile Val
    610                 615                 620
Ile Pro Pro Leu Leu Ile Thr Ala Lys Ala Thr Gln Asp Val Gly Leu
625                 630                 635                 640
Ile Glu Glu Glu Glu Ala Ala Asn Phe Gln Gln Tyr Pro Asp Trp Asp
                645                 650                 655
Val Val Gln Val Gln Gly Lys His Ile Ala Ile His Thr Ser Val Leu
            660                 665                 670
Asp Asp Lys Val Ser Ala Met Glu Leu Leu Gln Ser Tyr Ala Thr Leu
        675                 680                 685
Leu Arg Gly Gln Phe Ala Val Tyr Val Lys Glu Val Met Glu Glu Ile
    690                 695                 700
Ala Leu Pro Ser Leu Asp Phe Tyr Leu His Asp Gly Val Arg Ala Ala
705                 710                 715                 720
Gly Ala Thr Leu Ile Pro Ile Leu Leu Ser Cys Leu Leu Ala Ala Thr
                725                 730                 735
Gly Thr Gln Asn Glu Glu Leu Val Leu Leu Trp His Lys Ala Ser Ser
            740                 745                 750
Lys Leu Ile Gly Gly Leu Met Ser Glu Pro Met Pro Glu Ile Thr Gln
        755                 760                 765
Val Tyr His Asn Ser Leu Val Asn Gly Ile Lys Val Met Gly Asp Asn
    770                 775                 780
Cys Leu Ser Glu Asp Gln Leu Ala Ala Phe Thr Lys Gly Val Ser Ala
785                 790                 795                 800
Asn Leu Thr Asp Thr Tyr Glu Arg Met Gln Asp Arg His Gly Asp Gly
                805                 810                 815
Asp Glu Tyr Asn Glu Asn Ile Asp Glu Glu Glu Asp Phe Thr Asp Glu
            820                 825                 830
Asp Leu Leu Asp Glu Ile Asn Lys Ser Ile Ala Ala Val Leu Lys Thr
        835                 840                 845
Thr Asn Gly His Tyr Leu Lys Asn Leu Glu Asn Ile Trp Pro Met Ile
    850                 855                 860
Asn Thr Phe Leu Leu Asp Asn Glu Pro Ile Leu Val Ile Phe Ala Leu
865                 870                 875                 880
Val Val Ile Gly Asp Leu Ile Gln Tyr Gly Gly Glu Gln Thr Ala Ser
                885                 890                 895
Met Lys Asn Ala Phe Ile Pro Lys Val Thr Glu Cys Leu Ile Ser Pro
            900                 905                 910
Asp Ala Arg Ile Arg Gln Ala Ala Ser Tyr Ile Ile Gly Val Cys Ala
        915                 920                 925
Gln Tyr Ala Pro Ser Thr Tyr Ala Asp Val Cys Ile Pro Thr Leu Asp
    930                 935                 940
Thr Leu Val Gln Ile Val Asp Phe Pro Gly Ser Lys Leu Glu Glu Asn
945                 950                 955                 960
Arg Ser Ser Thr Glu Asn Ala Ser Ala Ala Ile Ala Lys Ile Leu Tyr
                965                 970                 975
Ala Tyr Asn Ser Asn Ile Pro Asn Val Asp Thr Tyr Thr Ala Asn Trp
            980                 985                 990
Phe Lys Thr Leu Pro Thr Ile Thr Asp Lys Glu Ala Ala Ser Phe Asn
         995                1000                1005
Tyr Gln Phe Leu Ser Gln Leu Ile Glu Asn Asn Ser Pro Ile Val Cys
    1010                1015                1020
Ala Gln Ser Asn Ile Ser Ala Val Val Asp Ser Val Ile Gln Ala Leu
1025                1030                1035                1040
Asn Glu Arg Ser Leu Thr Glu Arg Glu Gly Gln Thr Val Ile Ser Ser
                1045                1050                1055
Val Lys Lys Leu Leu Gly Phe Leu Pro Ser Ser Asp Ala Met Ala Ile
            1060                1065                1070
Phe Asn Arg Tyr Pro Ala Asp Ile Met Glu Lys Val His Lys Trp Phe
        1075                1080                1085
Ala
 
<210>7
<211>3270
<212>DNA
<213>酿酒酵母PSE1编码序列
 
<400>7
atgtctgctt taccggaaga agttaataga acattacttc agattgtcca ggcgtttgct   60
tcccctgaca atcaaatacg ttctgtagct gagaaggctc ttagtgaaga atggattacc   120
gaaaacaata ttgagtatct tttaactttt ttggctgaac aagccgcttt ctcccaagat   180
acaacagttg cagcattatc tgctgttctg tttagaaaat tagcattaaa agctccccct   240
tcttcgaagc ttatgattat gtccaaaaat atcacacata ttaggaaaga agttcttgca   300
caaattcgtt cttcattgtt aaaagggttt ttgtcggaaa gagctgattc aattaggcac   360
aaactatctg atgctattgc tgagtgtgtt caagacgact taccagcatg gccagaatta   420
ctacaagctt taatagagtc tttaaaaagc ggtaacccaa attttagaga atccagtttt   480
agaattttga cgactgtacc ttatttaatt accgctgttg acatcaacag tatcttacca   540
atttttcaat caggctttac tgatgcaagt gataatgtca aaattgctgc agttacggct   600
ttcgtgggtt attttaagca actaccaaaa tctgagtggt ccaagttagg tattttatta   660
ccaagtcttt tgaatagttt accaagattt ttagatgatg gtaaggacga tgcccttgca   720
tcagtttttg aatcgttaat tgagttggtg gaattggcac caaaactatt caaggatatg   780
tttgaccaaa taatacaatt cactgatatg gttataaaaa ataaggattt agaacctcca   840
gcaagaacca cagcactcga actgctaacc gttttcagcg agaacgctcc ccaaatgtgt   900
aaatcgaacc agaattacgg gcaaacttta gtgatggtta ctttaatcat gatgacggag   960
gtatccatag atgatgatga tgcagcagaa tggatagaat ctgacgatac cgatgatgaa   1020
gaggaagtta catatgacca cgctcgtcaa gctcttgatc gtgttgcttt aaagctgggt   1080
ggtgaatatt tggctgcacc attgttccaa tatttacagc aaatgatcac atcaaccgaa   1140
tggagagaaa gattcgcggc catgatggca ctttcctctg cagctgaggg ttgtgctgat   1200
gttctgatcg gcgagatccc aaaaatcctg gatatggtaa ttcccctcat caacgatcct   1260
catccaagag tacagtatgg atgttgtaat gttttgggtc aaatatctac tgatttttca   1320
ccattcattc aaagaactgc acacgataga attttgccgg ctttaatatc taaactaacg   1380
tcagaatgca cctcaagagt tcaaacgcac gccgcagcgg ctctggttaa cttttctgaa   1440
ttcgcttcga aggatattct tgagccttac ttggatagtc tattgacaaa tttattagtt   1500
ttattacaaa gcaacaaact ttacgtacag gaacaggccc taacaaccat tgcatttatt   1560
gctgaagctg caaagaataa atttatcaag tattacgata ctctaatgcc attattatta   1620
aatgttttga aggttaacaa taaagataat agtgttttga aaggtaaatg tatggaatgt   1680
gcaactctga ttggttttgc cgttggtaag gaaaaatttc atgagcactc tcaagagctg   1740
atttctatat tggtcgcttt acaaaactca gatatcgatg aagatgatgc gctcagatca   1800
tacttagaac aaagttggag caggatttgc cgaattctgg gtgatgattt tgttccgttg   1860
ttaccgattg ttataccacc cctgctaatt actgccaaag caacgcaaga cgtcggttta   1920
attgaagaag aagaagcagc aaatttccaa caatatccag attgggatgt tgttcaagtt   1980
cagggaaaac acattgctat tcacacatcc gtccttgacg ataaagtatc agcaatggag   2040
ctattacaaa gctatgcgac acttttaaga ggccaatttg ctgtatatgt taaagaagta   2100
atggaagaaa tagctctacc atcgcttgac ttttacctac atgacggtgt tcgtgctgca   2160
ggagcaactt taattcctat tctattatct tgtttacttg cagccaccgg tactcaaaac   2220
gaggaattgg tattgttgtg gcataaagct tcgtctaaac taatcggagg cttaatgtca   2280
gaaccaatgc cagaaatcac gcaagtttat cacaactcgt tagtgaatgg tattaaagtc   2340
atgggtgaca attgcttaag cgaagaccaa ttagcggcat ttactaaggg tgtctccgcc   2400
aacttaactg acacttacga aaggatgcag gatcgccatg gtgatggtga tgaatataat   2460
gaaaatattg atgaagagga agactttact gacgaagatc ttctcgatga aatcaacaag   2520
tctatcgcgg ccgttttgaa aaccacaaat ggtcattatc taaagaattt ggagaatata   2580
tggcctatga taaacacatt ccttttagat aatgaaccaa ttttagtcat ttttgcatta   2640
gtagtgattg gtgacttgat tcaatatggt ggcgaacaaa ctgctagcat gaagaacgca   2700
tttattccaa aggttaccga gtgcttgatt tctcctgacg ctcgtattcg ccaagctgct   2760
tcttatataa tcggtgtttg tgcccaatac gctccatcta catatgctga cgtttgcata   2820
ccgactttag atacacttgt tcagattgtc gattttccag gctccaaact ggaagaaaat   2880
cgttcttcaa cagagaatgc cagtgcagcc atcgccaaaa ttctttatgc atacaattcc   2940
aacattccta acgtagacac gtacacggct aattggttca aaacgttacc aacaataact   3000
gacaaagaag ctgcctcatt caactatcaa tttttgagtc aattgattga aaataattcg   3060
ccaattgtgt gtgctcaatc taatatctcc gctgtagttg attcagtcat acaagccttg   3120
aatgagagaa gtttgaccga aagggaaggc caaacggtga taagttcagt taaaaagttg   3180
ttgggatttt tgccttctag tgatgctatg gcaattttca atagatatcc agctgatatt   3240
atggagaaag tacataaatg gtttgcataa                                    3270
 
<210>8
<211>216
<212>PRT
<213>酿酒酵母ORM2蛋白质
 
<400>8
Met Ile Asp Arg Thr Lys Asn Glu Ser Pro Ala Phe Glu Glu Ser Pro
1               5                   10                  15
Leu Thr Pro Asn Val Ser Asn Leu Lys Pro Phe Pro Ser Gln Ser Asn
            20                  25                  30
Lys Ile Ser Thr Pro Val Thr Asp His Arg Arg Arg Arg Ser Ser Ser
        35                  40                  45
Val Ile Ser His Val Glu Gln Glu Thr Phe Glu Asp Glu Asn Asp Gln
    50                  55                  60
Gln Met Leu Pro Asn Met Asn Ala Thr Trp Val Asp Gln Arg Gly Ala
65                  70                  75                  80
Trp Leu Ile His Ile Val Val Ile Val Leu Leu Arg Leu Phe Tyr Ser
                85                 90                  95
Leu Phe Gly Ser Thr Pro Lys Trp Thr Trp Thr Leu Thr Asn Met Thr
            100                 105                 110
Tyr Ile Ile Gly Phe Tyr Ile Met Phe His Leu Val Lys Gly Thr Pro
        115                 120                 125
Phe Asp Phe Asn Gly Gly Ala Tyr Asp Asn Leu Thr Met Trp Glu Gln
    130                 135                 140
Ile Asn Asp Glu Thr Leu Tyr Thr Pro Thr Arg Lys Phe Leu Leu Ile
145                 150                 155                 160
Val Pro Ile Val Leu Phe Leu Ile Ser Asn Gln Tyr Tyr Arg Asn Asp
                165                 170                 175
Met Thr Leu Phe Leu Ser Asn Leu Ala Val Thr Val Leu Ile Gly Val
            180                 185                 190
Val Pro Lys Leu Gly Ile Thr His Arg Leu Arg Ile Ser Ile Pro Gly
        195                 200                 205
Ile Thr Gly Arg Ala Gln Ile Ser
    210                 215
 
<210>9
<211>651
<212>DNA
<213>酿酒酵母ORM2编码序列
 
<400>9
atgattgacc gcactaaaaa cgaatctcca gcttttgaag agtctccgct tacccccaat   60
gtgtctaacc tgaaaccatt cccttctcaa agcaacaaaa tatccactcc agtgaccgac   120
cataggagaa gacggtcatc cagcgtaata tcacatgtgg aacaggaaac cttcgaagac   180
gaaaatgacc agcagatgct tcccaacatg aacgctacgt gggtcgacca gcgaggcgcg   240
tggttgattc atatcgtcgt aatagtactc ttgaggctct tctactcctt gttcgggtcg   300
acgcccaaat ggacgtggac tttaacaaac atgacctaca tcatcggatt ctatatcatg   360
ttccaccttg tcaaaggtac gcccttcgac tttaacggtg gtgcgtacga caacctgacc   420
atgtgggagc agattaacga tgagactttg tacacaccca ctagaaaatt tctgctgatt   480
gtacccattg tgttgttcct gattagcaac cagtactacc gcaacgacat gacactattc   540
ctctccaacc tcgccgtgac ggtgcttatt ggtgtcgttc ctaagctggg aattacgcat   600
agactaagaa tatccatccc tggtattacg ggccgtgctc aaattagtta g            651
 
<210>10
<211>24
<212>PRT
<213>人工序列
 
<220>
<223>经修饰的融合体前导序列
 
<400>10
Met Lys Trp Val Phe Ile Val Ser Ile Leu Phe Leu Phe Ser Ser Ala
1               5                   10                  15
Tyr Ser Arg Ser Leu Asp Lys Arg
            20
 
<210>11
<211>18
<212>PRT
<213>人工序列
 
<220>
<223>经修饰的HSA(pre)前导序列
 
<400>11
Met Lys Trp Val Phe Ile Val Ser Ile Leu Phe Leu Phe Ser Ser Ala
1               5                   10                  15
Tyr Ser
 
<210>12
<211>52
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CF86
 
<400>12
ggagtggtac gtattaatta aggccggcca ggcccgggta cgtaccaatt ga           52
 
<210>13
<211>52
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CF87
 
<400>13
caattggtac gtacccgggc ctggccggcc ttaattaata cgtaccactc ct           52
 
<210>14
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CF88
 
<400>14
atcacgtaat acttctaggg                                               20
 
<210>15
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CF98
 
<400>15
agagtgagtt ggaaggaagg                                               20
 
<210>16
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CF99
 
<400>16
agctcgtaag cgtcgttacc                                               20
 
<210>17
<211>49
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CF154
 
<400>17
gttcttgttc tcctctgctt actctgtccc tgataaaact gtgagatgg               49
 
<210>18
<211>49
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CF155
 
<400>18
ccatctcaca gttttatcag ggacagagta agcagaggag aacaagaac               49
 
<210>19
<211>90
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS248
 
<400>19
gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggcta gtctcttttt   60
ccaatttgcc accgtgtagc attttgttgt                                    90
 
<210>20
<211>59
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS249
 
<400>20
gtcaggatcc tacgtacccg gggatatcat tatcatcttt gtcgtggtca tcttgtgtg    59
 
<210>21
<211>54
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS250
 
<400>21
gtcaggatcc tacgtacccg ggtaaggcgt tcgtgcagtg tgacgaatat agcg         54
 
<210>22
<211>99
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS251
 
<400>22
gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggccc gtatggacat    60
acatatatat atatatatat atatatattt tgttacgcg                          99
 
<210>23
<211>90
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS252
 
<400>23
gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggctt gttgcaagca   60
gcatgtctaa ttggtaattt taaagctgcc                                    90
 
<210>24
<211>103
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS267
 
<400>24
gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggccc gtatggacat   60
acatatatat atatatatat atatatatat attttgttac gcg                     103
 
<210>25
<211>17
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS253
 
<400>25
cctccctgct gctcgcc                                                  17
 
<210>26
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS254
 
<400>26
ctgtaagaac atggctcc                                                 18
 
<210>27
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS255
 
<400>27
ctcgatcgat tacgaggg                                                 18
 
<210>28
<211>17
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS256
 
<400>28
aagaaagccg atatcgc                                                  17
 
<210>29
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸DS257
 
<400>29
caactctctg aagaggcg                                                 18
 
<210>30
<211>17
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS258
 
<400>30
caacgccaca tccgacg                                                  17
 
<210>31
<211>19
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS259
 
<400>31
gtaat tctga tcactttgg                                               19
 
<210>32
<211>21
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS260
 
<400>32
gcacttatta ttactacgtg g                                             21
 
<210>33
<211>19
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS261
 
<400>33
gttttccttg atgaagtcg                                                19
 
<210>34
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS262
 
<400>34
gtgaccacac catggggc                                                 18
 
<210>35
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS263
 
<400>35
gttgccggcg tgtctgcc                                                 18
 
<210>36
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS264
 
<400>36
ttgaaatcat cgtctgcg                                                 18
 
<210>37
<211>17
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS265
 
<400>37
cggcagttct aggtccc                                                  17
 
<210>38
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS266
 
<400>38
ccacagcctc ttgttggg                                                 18
 
<210>39
<211>17
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸’M13/pUC引物(-40)’
 
<400>39
gttttcccag tcacgac                                                  17
 
<210>40
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>外显子1引物-1
 
<400>40
ctcggtaccc agctgacttg tttcctgg                                      28
 
<210>41
<211>24
<212>DNA
<213>人工序列
 
<220>
<223>外显子1引物-2
 
<400>41
ataggattcc gtaagagcag tcag                                          24
 
<210>42
<211>21
<212>DNA
<213>人工序列
 
<220>
<223>外显子2引物-1
 
<400>42
gtgaagcatc agggcctgaa c                                             21
 
<210>43
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>外显子2引物-2
 
<400>43
ctctctagaa gcaaggaaga gagaagggac                                    30
 
<210>44
<211>51
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸MH33
 
<400>44
atgcagatct ttggataaga gagctttcac agagcattca ccgctgaccc c            51
 
<210>45
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸MH36
 
<400>45
caccggatcc acccccagtc tgatgagaag aaatgaaacg aaggtcatgg              50
 
<210>46
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CF84
 
<400>46
cctatgtgaa gcatcagggc                                               20
 
<210>47
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CF85
 
<400>47
ccaacattaa taggcatccc                                               20
 
<210>48
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸PRB
 
<400>48
cgtcccgtta tattggag                                                 18
 
<210>49
<211>29
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS229
 
<400>49
cttgtcacag ttttcagcag attcgtcag                                     29
<210>50
<211>60
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CF68
 
<400>50
gcgcagatct ttggataaga gaagcccagg ccagggcacc cagtctgaga acagctgcac   60
 
<210>51
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CF69
 
<400>51
gcttggatcc accgtttcgt atcttcattg tcatgtaggc ttctatgtag              50
 
<210>52
<211>54
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸GS11
 
<400>52
gcgctacgta ttaattaaat tgctcatata tagtgggggg gaatactcat gctg         54
 
<210>53
<211>49
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸GS12
 
<400>53
gcgctacgta ggccggccag agaatataaa gaaagatgat gatgtaagg               49
 
<210>54
<211>70
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CED037
 
<400>54
atacgcgcat gcgaataatt tttttttgcc tatctataaa attaaagtag cagtacttca   60
accattagtg                                                          70
 
<210>55
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CED038
 
<400>55
atacgcgcat gccgacaaat tgttacgttg tgctttgatt tctaaagcgc              50
 
<210>56
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CED009
<400>56
atagcgggat ccaagcttcg acacatacat aataactcga taaggtatgg              50
 
<210>57
<211>39
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CED010
 
<400>57
tatcgcggat cccgtcttca ctgtacatta cacataagc                          39
 
<210>58
<211>38
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS299
 
<400>58
cgtagcggcc gcctgaaagg ggttgaccgt ccgtcggc                           38
 
<210>59
<211>39
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS300
 
<400>59
cgtaaagctt cgccgcccga cagggtaaca tattatcac                          39
 
<210>60
<211>38
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS301
 
<400>60
cgtaaagctt gaccacgtag taataataag tgcatggc                           38
 
<210>61
<211>41
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS302
 
<400>61
cgtactgcag attggatagt gattagagtg tatagtcccg g                       41
 
<210>62
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS303
 
<400>62
ggagcgacaa acctttcg                                                 18
 
<210>63
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸DS304
 
<400>63
accgtaataa aagatggctg                                               20
 
<210>64
<211>24
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS305
 
<400>64
catcttgtgt gtgagtatgg tcgg                                          24
 
<210>65
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS306
 
<400>65
cccaggataa ttttcagg                                                 18
 
<210>66
<211>29
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS230
 
<400>66
tagcgaattc aatcagtaaa aatcaacgg                                     29
 
<210>67
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS231
 
<400>67
gtcaaagctt caaaaaaaga aaagctccgg                                    30
 
<210>68
<211>38
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS232
 
<400>68
tagcggatcc gaattcggcg gttgtttgca agaccgag                           38
 
<210>69
<211>34
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS233
 
<400>69
gtcaaagctt taaagataat gctaaatcat ttgg                               34
 
<210>70
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS234
 
<400>70
tgacaagctt tcggtcgaaa aaagaaaagg agagg                              35
 
<210>71
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS235
 
<400>71
tgacaagctt gatcttttat gcttgctttt c                                  31
 
<210>72
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS236
 
<400>72
aatagttcag gcactccg                                                 18
 
<210>73
<211>17
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS237
 
<400>73
tggaaggcaa gagagcc                                                  17
 
<210>74
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS238
 
<400>74
taaaatgtaa gctctcgg                                                 18
 
<210>75
<211>17
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸DS239
 
<400>75
ccaaccaagt atttcgg                                                  17
 
<210>76
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CED005
 
<400>76
gagctgacag ggaaatggtc                                               20
 
<210>77
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>寡核苷酸CED006
 
<400>77
tacgaggata cggagagagg                                               20
 
<210>78
<211>1923
<212>DNA
<213>具有长启动子的酿酒酵母菌株S288c PDI1基因序列
 
<400>78
ctagtctctt tttccaattt ccaccgtgta gcattttgtt gtgctgttac aaccacaaca   60
aaacgaaaaa cccgtatgga catacatata tatatatata tatatatata ttttgttacg   120
cgtgcatttt cttgttgcaa gcagcatgtc taattggtaa ttttaaagct gccaagctct   180
acataaagaa aaacatacat ctatcccgtt atgaagtttt ctgctggtgc cgtcctgtca   240
tggtcctccc tgctgctcgc ctcctctgtt ttcgcccaac aagaggctgt ggcccctgaa   300
gactccgctg tcgttaagtt ggccaccgac tccttcaatg agtacattca gtcgcacgac   360
ttggtgcttg cggagttttt tgctccatgg tgtggccact gtaagaacat ggctcctgaa   420
tacgttaaag ccgccgagac tttagttgag aaaaacatta ccttggccca gatcgactgt   480
actgaaaacc aggatctgtg tatggaacac aacattccag ggttcccaag cttgaagatt   540
ttcaaaaaca gcgatgttaa caactcgatc gattacgagg gacctagaac tgccgaggcc   600
attgtccaat tcatgatcaa gcaaagccaa ccggctgtcg ccgttgttgc tgatctacca   660
gcttaccttg ctaacgagac ttttgtcact ccagttatcg tccaatccgg taagattgac   720
gccgacttca acgccacctt ttactccatg gccaacaaac acttcaacga ctacgacttt   780
gtctccgctg aaaacgcaga cgatgatttc aagctttcta tttacttgcc ctccgccatg   840
gacgagcctg tagtatacaa cggtaagaaa gccgatatcg ctgacgctga tgtttttgaa   900
aaatggttgc aagtggaagc cttgccctac tttggtgaaa tcgacggttc cgttttcgcc   960
caatacgtcg aaagcggttt gcctttgggt tacttattct acaatgacga ggaagaattg   1020
gaagaataca agcctctctt taccgagttg gccaaaaaga acagaggtct aatgaacttt   1080
gttagcatcg atgccagaaa attcggcaga cacgccggca acttgaacat gaaggaacaa   1140
ttccctctat ttgccatcca cgacatgact gaagacttga agtacggttt gcctcaactc   1200
tctgaagagg cgtttgacga attgagcgac aagatcgtgt tggagtctaa ggctattgaa   1260
tctttggtta aggacttctt gaaaggtgat gcctccccaa tcgtgaagtc ccaagagatc   1320
ttcgagaacc aagattcctc tgtcttccaa ttggtcggta agaaccatga cgaaatcgtc   1380
aacgacccaa agaaggacgt tcttgttttg tactatgccc catggtgtgg tcactgtaag   1440
agattggccc caacttacca agaactagct gatacctacg ccaacgccac atccgacgtt   1500
ttgattgcta aactagacca cactgaaaac gatgtcagag gcgtcgtaat tgaaggttac   1560
ccaacaatcg tcttataccc aggtggtaag aagtccgaat ctgttgtgta ccaaggttca   1620
agatccttgg actctttatt cgacttcatc aaggaaaacg gtcacttcga cgtcgacggt   1680
aaggccttgt acgaagaagc ccaggaaaaa gctgctgagg aagccgatgc tgacgctgaa   1740
ttggctgacg aagaagatgc cattcacgat gaattgtaat tctgatcact ttggtttttc   1800
attaaataga gatatataag aaattttcta ggaagttttt ttaaaaaaat cataaaaaga   1860
taaacgttaa aattcaaaca caatagttgt tcgctatatt cgtcacactg cacgaacgcc   1920
tta                                                                 1923
 
<210>79
<211>1952
<212>DNA
<213>具有长启动子的酿酒酵母菌株SKQ2n PDI1基因序列
 
<400>79
ctagtctctt tttccaattt ccaccgtgta gcattttgtt gtgctgttac aaccacaaca   60
aaacgaaaaa cccgtatgga catacatata tatatatata tatatatata tatattttgt   120
tacgcgtgca ttttcttgtt gcaagcagca tgtctaattg gtaattttaa agctgccaag   180
ctctacataa agaaaaacat acatctatcc cgttatgaag ttttctgctg gtgccgtcct   240
gtcatggtcc tccctgctgc tcgcctcctc tgttttcgcc caacaagagg ctgtggcccc   300
tgaagactcc gctgtcgtta agttggccac cgactctttc aatgaataca ttcagtcgca   360
cgacttggtg cttgcggagt tttttgctcc atggtgtggc cactgtaaga acatggctcc   420
tgaatacgtt aaagccgccg agactttagt tgagaaaaac attaccttgg cccagatcga   480
ctgtactgaa aaccaggatc tgtgtatgga acacaacatt ccagggttcc caagcttgaa   540
gattttcaaa aacagcgatg ttaacaactc gatcgattac gagggaccta gaactgccga   600
ggccattgtc caattcatga tcaagcaaag ccaaccggct gtcgccgttg ttgctgatct   660
accagcttac cttgctaacg agacttttgt cactccagtt atcgtccaat ccggtaagat   720
tgacgccgac ttcaacgcca ccttttactc catggccaac aaacacttca acgactacga   780
ctttgtctcc gctgaaaacg cagacgatga tttcaagctt tctatttact tgccctccgc   840
catggacgag cctgtagtat acaacggtaa gaaagccgat atcgctgacg ctgatgtttt   900
tgaaaaatgg ttgcaagtgg aagccttgcc ctactttggt gaaatcgacg gttccgtttt   960
cgcccaatac gtcgaaagcg gtttgccttt gggttacttg ttctacaatg acgaggaaga   1020
attggaagaa tacaagcctc tctttaccga gttggccaaa aagaacagag gtctaatgaa   1080
ctttgttagc atcgatgcca gaaaattcgg cagacacgcc ggcaacttga acatgaagga   1140
acaattccct ctatttgcca tccacgacat gactgaagac ttgaagtacg gtttgcctca   1200
actctctgaa gaggcgtttg acgaattgag cgacaagatc gtgttggagt ctaaggctat   1260
tgaatctttg gttaaggact tcttgaaagg tgatgcctcc ccaatcgtga agtcccaaga   1320
gatcttcgag aaccaagatt cctctgtctt ccaattggtc ggtaagaacc atgacgaaat   1380
cgtcaacgac ccaaagaagg acgttcttgt tttgtactat gccccatggt gtggtcactg   1440
taagagattg gccccaactt accaagaact agctgatacc tacgccaacg ccacatccga   1500
cgttttgatt gctaaactag accacactga aaacgatgtc agaggcgtcg taattgaagg   1560
ttacccaaca atcgtcttat acccaggtgg taagaagtcc gaatctgttg tgtaccaagg   1620
ttcaagatcc ttggactctt tattcgactt catcaaggaa aacggtcact tcgacgtcga   1680
cggtaaggcc ttgtacgaag aagcccagga aaaagctgct gaggaagccg aagctgacgc   1740
cgaagccgaa gctgacgctg acgctgaatt ggctgacgaa gaagatgcca ttcacgatga   1800
attgtaattc tgatcacttt ggtttttcat taaatagaga tatataagaa attttctagg   1860
aagttttttt aaaaaaaatc ataaaaagat aaacgttaaa attcaaacac aatagtcgtt   1920
cgctatattc gtcacactgc acgaacgcct ta                                 1952

Claims (36)

1.包含编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因和编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因的宿主细胞。
2.依照权利要求1的宿主细胞,其中基于运铁蛋白的蛋白质包含运铁蛋白或运铁蛋白家族任何其它成员或其变体或片段或包含运铁蛋白或其变体或片段的融合蛋白的序列。
3.依照权利要求2的宿主细胞,其中基于运铁蛋白的蛋白质包含乳铁蛋白或其变体或片段或包含乳铁蛋白或其变体或片段的融合蛋白。
4.依照权利要求1、2或3任一项的宿主细胞,其中编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因在质粒上提供。
5.依照权利要求4的宿主细胞,其中所述质粒是2μm家族质粒。
6.依照权利要求5的宿主细胞,其中所述质粒基于pSR1、pSB3或pSB4且所述宿主细胞是鲁氏接合糖酵母(Zygosaccharomyces rouxii);所述质粒基于pSB1或pSB2且所述宿主细胞是拜列氏接合糖酵母(Zygosaccharomycesbailii);所述质粒基于pSM1且所述宿主细胞是发酵接合糖酵母(Zygosaccharomyces fermentati);所述质粒基于pKD1且所述宿主细胞是果蝇克鲁维氏酵母(Kluyveromyces drosophilarum);所述质粒基于pPM1且所述宿主细胞是膜醭毕赤氏酵母(Pichia membranaefaciens);或所述质粒基于2μm质粒且所述宿主细胞是酿酒酵母(Saccharomyces cerevisiae)或卡尔斯伯糖酵母(Saccharomyces carlsbergensis)。
7.依照权利要求1、2、3或4的宿主细胞,其中编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因整合在染色体中。
8.依照权利要求7的宿主细胞,其中编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因在内源编码PDI基因的基因座处整合在染色体中。
9.依照权利要求8的宿主细胞,其中编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因在内源编码PDI基因的基因座处整合在染色体中而没有破坏内源PDI基因的表达。
10.依照权利要求1至9任一项的宿主细胞,其中编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因在质粒上提供。
11.依照权利要求10的宿主细胞,其中所述质粒是2μm家族质粒。
12.依照权利要求11的宿主细胞,其中所述质粒基于pSR1、pSB3或pSB4且所述宿主细胞是鲁氏接合糖酵母;所述质粒基于pSB1或pSB2且所述宿主细胞是拜列氏接合糖酵母;所述质粒基于pSM1且所述宿主细胞是发酵接合糖酵母;所述质粒基于pKD1且所述宿主细胞是果蝇克鲁维氏酵母;所述质粒基于pPM1且所述宿主细胞是膜醭毕赤氏酵母;或所述质粒基于2μm质粒且所述宿主细胞是酿酒酵母或卡尔斯伯糖酵母。
13.依照权利要求1至9任一项的宿主细胞,其中编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因整合在染色体中。
14.依照权利要求13的宿主细胞,其中编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因在内源编码PDI基因的基因座处整合在染色体中。
15.依照权利要求14的宿主细胞,其中编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因在内源编码PDI基因的基因座处整合在染色体中而没有破坏内源PDI基因的表达。
16.依照权利要求1至15任一项的宿主细胞,其中所述PDI来自人、酵母、小麦、莱茵衣藻(Chlamydomonas reinhardii)、大鼠、牛或鸡。
17.依照权利要求16的宿主细胞,其中所述PDI包含SEQ ID No.1或SEQ ID No.2或它们的变体或片段。
18.编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的重组基因用于提高基于运铁蛋白的蛋白质表达的用途。
19.依照权利要求18的用途,其中基于运铁蛋白的蛋白质包含运铁蛋白或运铁蛋白家族任何其它成员或其变体或片段或包含运铁蛋白或其变体或片段的融合蛋白的序列。
20.依照权利要求19的用途,其中基于运铁蛋白的蛋白质包含乳铁蛋白或其变体或片段或包含乳铁蛋白或其变体或片段的融合蛋白。
21.依照权利要求17、18或19任一项的用途,其中编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因在质粒上提供。
22.依照权利要求21的用途,其中所述质粒是2μm家族质粒。
23.依照权利要求22的用途,其中所述质粒基于pSR1、pSB3或pSB4且用于鲁氏接合糖酵母宿主细胞中;所述质粒基于pSB1或pSB2且用于拜列氏接合糖酵母宿主细胞中;所述质粒基于pSM1且用于发酵接合糖酵母宿主细胞中;所述质粒基于pKD1且用于果蝇克鲁维氏酵母宿主细胞中;所述质粒基于pPM1且用于膜醭毕赤氏酵母宿主细胞中;或所述质粒基于2μm质粒且用于酿酒酵母或卡尔斯伯糖酵母宿主细胞中。
24.依照权利要求18、19或20任一项的用途,其中编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因整合在染色体中。
25.依照权利要求24的用途,其中编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因在内源编码PDI基因的基因座处整合在染色体中。
26.依照权利要求25的用途,其中编码包含蛋白质二硫键异构酶(PDI)之序列的蛋白质的第一重组基因在内源编码PDI基因的基因座处整合在染色体中而没有破坏内源PDI基因的表达。
27.依照权利要求18至26任一项的用途,其中编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因在质粒上提供。
28.依照权利要求27的用途,其中所述质粒是2μm家族质粒。
29.依照权利要求28的用途,其中所述质粒基于pSR1、pSB3或pSB4且用于鲁氏接合糖酵母宿主细胞中;所述质粒基于pSB1或pSB2且用于拜列氏接合糖酵母宿主细胞中;所述质粒基于pSM1且用于发酵接合糖酵母宿主细胞中;所述质粒基于pKD1且用于果蝇克鲁维氏酵母宿主细胞中;所述质粒基于pPM1且用于膜醭毕赤氏酵母宿主细胞中;或所述质粒基于2μm质粒且用于酿酒酵母或卡尔斯伯糖酵母宿主细胞中。
30.依照权利要求18至26任一项的用途,其中编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因整合在染色体中。
31.依照权利要求30的用途,其中编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因在内源编码PDI基因的基因座处整合在染色体中。
32.依照权利要求31的用途,其中编码包含基于运铁蛋白的蛋白质之序列的蛋白质的第二重组基因在内源编码PDI基因的基因座处整合在染色体中而没有破坏内源PDI基因的表达。
33.依照权利要求18至32任一项的用途,其中所述PDI来自人、酵母、小麦、莱茵衣藻、大鼠、牛或鸡。
34.依照权利要求33的用途,其中所述PDI包含SEQ ID No.1或SEQID No.2或它们的变体或片段。
35.包含与编码蛋白伴侣的编码序列可操作连接的启动子序列的多核苷酸通过在宿主细胞内表达该多核苷酸序列用于提高宿主细胞中非2μm家族质粒蛋白质表达的用途,其中所述启动子的特征是它所达到的蛋白伴侣表达水平比所述编码序列与其天然存在启动子可操作连接时所达到的低。
36.用于生产非2μm家族质粒蛋白质的方法,包括下列步骤:
(a)提供包含如下重组基因的宿主细胞,该重组基因包含与编码蛋白伴侣的编码序列可操作连接的启动子序列,所述启动子的特征是它所达到的蛋白伴侣表达水平比所述编码序列与其天然存在启动子可操作连接时所达到的低,且宿主细胞还包含编码非2μm家族质粒蛋白质的重组基因;和
(b)在容许蛋白伴侣和非2μm家族质粒蛋白质表达的条件下培养宿主细胞。
CN201010156552A 2003-12-23 2004-12-23 基因表达技术 Pending CN101818121A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0329681.1 2003-12-23
GBGB0329681.1A GB0329681D0 (en) 2003-12-23 2003-12-23 Gene expression technique

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2004800420214A Division CN1922325B (zh) 2003-12-23 2004-12-23 基因表达技术

Publications (1)

Publication Number Publication Date
CN101818121A true CN101818121A (zh) 2010-09-01

Family

ID=30776264

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2004800420214A Expired - Fee Related CN1922325B (zh) 2003-12-23 2004-12-23 基因表达技术
CN201010156552A Pending CN101818121A (zh) 2003-12-23 2004-12-23 基因表达技术

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2004800420214A Expired - Fee Related CN1922325B (zh) 2003-12-23 2004-12-23 基因表达技术

Country Status (16)

Country Link
US (3) US20070275889A1 (zh)
EP (2) EP2048236B1 (zh)
JP (1) JP5052899B2 (zh)
KR (1) KR101262682B1 (zh)
CN (2) CN1922325B (zh)
AT (1) ATE421994T1 (zh)
AU (2) AU2004303601C1 (zh)
CA (1) CA2551503A1 (zh)
DE (1) DE602004019304D1 (zh)
DK (1) DK2048236T3 (zh)
ES (1) ES2321948T3 (zh)
GB (2) GB0329681D0 (zh)
HK (1) HK1099938A1 (zh)
SG (2) SG149003A1 (zh)
WO (1) WO2005061718A1 (zh)
ZA (1) ZA200605588B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103436516A (zh) * 2013-08-23 2013-12-11 华南理工大学 利用大肠杆菌原核表达系统生产的小麦蛋白质二硫键异构酶及方法和应用

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003066824A2 (en) * 2002-02-07 2003-08-14 Aventis Behring Gmbh Albumin-fused kunitz domain peptides
US9057061B2 (en) 2003-12-23 2015-06-16 Novozymes Biopharma Dk A/S Gene expression technique
GB0329722D0 (en) * 2003-12-23 2004-01-28 Delta Biotechnology Ltd Modified plasmid and use thereof
GB0512707D0 (en) * 2005-06-22 2005-07-27 Delta Biotechnology Ltd Gene expression technique
AU2007278994B2 (en) 2006-07-24 2013-08-15 Biorexis Pharmaceutical Corporation Exendin fusion proteins
GB0711424D0 (en) * 2007-06-13 2007-07-25 Novozymes Delta Ltd Recombinant transferrin mutants
CN101835801B (zh) 2007-08-08 2014-09-10 诺维信生物制药丹麦公司 转铁蛋白变体和偶联物
ES2537806T5 (es) 2007-10-31 2018-10-09 Daiichi Sankyo Company, Limited Método para la secreción y producción de alto nivel de proteína
DK2337849T3 (en) 2008-09-15 2018-10-01 Uniqure Biopharma B V FACTOR IX POLYPEPTIME MUTANT, APPLICATIONS THEREOF AND METHOD OF PRODUCING THEREOF
WO2010034708A1 (en) * 2008-09-23 2010-04-01 Unilever Plc A polynucleotide expression cassette
SG2014012918A (en) 2009-02-11 2014-04-28 Novozymes Biopharma Dk As Albumin variants and conjugates
US9403898B2 (en) 2009-05-07 2016-08-02 Novozymes Biopharma Dk A/S Method for purifying albumin
EP2258854A1 (en) 2009-05-20 2010-12-08 FH Campus Wien Eukaryotic host cell comprising an expression enhancer
FI20095615A0 (fi) 2009-06-02 2009-06-02 Oulun Yliopisto Menetelmä luonnollisesti laskostuneiden proteiinien tuottamiseksi prokaryootti-isännässä
RU2607374C2 (ru) 2009-10-30 2017-01-10 Новозаймс Байофарма Дк А/С Варианты альбумина
CN103641896B (zh) * 2009-11-19 2015-08-05 浙江大学 明胶样单元的用途
GB201000587D0 (en) * 2010-01-14 2010-03-03 Ucb Pharma Sa Bacterial hoist strain
WO2011124718A1 (en) 2010-04-09 2011-10-13 Novozymes A/S Albumin derivatives and variants
CN102533839B (zh) * 2010-12-21 2017-06-20 上海开阳生物科技有限公司 融合表达含有二硫键蛋白质的方法
EP2565262A1 (en) * 2011-08-31 2013-03-06 VTU Holding GmbH Protein expression
US20140315817A1 (en) 2011-11-18 2014-10-23 Eleven Biotherapeutics, Inc. Variant serum albumin with improved half-life and other properties
PL2825556T3 (pl) 2012-03-16 2018-10-31 Albumedix A/S Warianty albuminy
CA2890766A1 (en) 2012-11-08 2014-05-15 Novozymes Biopharma Dk A/S Albumin variants
CN102994541B (zh) * 2012-12-19 2015-04-15 江南大学 一种共表达upr关键基因和下游靶基因增强葡萄糖氧化酶分泌的方法
WO2014132497A1 (ja) 2013-02-28 2014-09-04 株式会社日立ハイテクノロジーズ データ解析装置、及びその方法
WO2015158800A1 (en) 2014-04-17 2015-10-22 Boehringer Ingelheim Rcv Gmbh & Co Kg Recombinant host cell for expressing proteins of interest
CA2948369C (en) 2014-04-17 2023-09-26 Boehringer Ingelheim Rcv Gmbh & Co Kg Recombinant host cell engineered to overexpress helper proteins
CA2989966C (en) 2015-08-20 2024-04-30 Albumedix A/S Albumin variants and conjugates
WO2017112847A1 (en) 2015-12-22 2017-06-29 Albumedix A/S Improved protein expression strains
CA3023046A1 (en) * 2016-05-04 2017-11-09 Shenzhen Protgen Ltd. Construction of engineering bacteria for high expression of recombinant human serum albumin
CN106834322B (zh) * 2017-03-14 2020-09-04 中国科学院南海海洋研究所 抗毒素so_1445或其编码基因在提高质粒在宿主细胞中的稳定性中的应用
CA3064037A1 (en) 2017-06-20 2018-12-27 Albumedix Ltd Improved protein expression strains
WO2019006348A1 (en) * 2017-06-30 2019-01-03 Western University Of Health Sciences IX-TRANSFERRIN FACTOR FUSION PROTEINS
CN112004931A (zh) 2018-03-26 2020-11-27 诺维信公司 真菌伴侣蛋白
CN112391402B (zh) * 2020-11-17 2023-03-28 华中科技大学 一种提高解脂耶氏酵母中目的蛋白表达水平的方法
CN116981778A (zh) * 2021-03-10 2023-10-31 住友制药株式会社 半胱氨酸结蛋白的制造方法
CN114410496B (zh) * 2022-02-16 2023-10-03 江南大学 一种提高毕赤酵母外源蛋白产量的方法

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9019919D0 (en) 1990-09-12 1990-10-24 Delta Biotechnology Ltd Purification of proteins
US4302386A (en) * 1978-08-25 1981-11-24 The Ohio State University Antigenic modification of polypeptides
NZ199722A (en) 1981-02-25 1985-12-13 Genentech Inc Dna transfer vector for expression of exogenous polypeptide in yeast;transformed yeast strain
IL66614A (en) 1981-08-28 1985-09-29 Genentech Inc Method of constructing a dna sequence encoding a polypeptide,microbial production of human serum albumin,and pharmaceutical compositions comprising it
CA1205935A (en) 1981-09-14 1986-06-10 Union Carbide Corporation Process for producing a polymer water-in-oil emulsion
GB8615701D0 (en) * 1986-06-27 1986-08-06 Delta Biotechnology Ltd Stable gene integration vector
GB8620926D0 (en) 1986-08-29 1986-10-08 Delta Biotechnology Ltd Yeast promoter
IE63424B1 (en) * 1987-04-09 1995-04-19 Delta Biotechnology Ltd Yeast vector
IL86455A0 (en) 1987-06-01 1988-11-15 Takeda Chemical Industries Ltd Polypeptide and production thereof
IL88326A (en) 1987-11-18 1993-03-15 Gist Brocades Nv Purification of serum albumin
EP0387319B1 (en) 1988-07-23 1996-03-06 Delta Biotechnology Limited Secretory leader sequences
FR2649991B2 (fr) * 1988-08-05 1994-03-04 Rhone Poulenc Sante Utilisation de derives stables du plasmide pkd1 pour l'expression et la secretion de proteines heterologues dans les levures du genre kluyveromyces
US5759802A (en) 1988-10-26 1998-06-02 Tonen Corporation Production of human serum alubumin A
GB8909916D0 (en) 1989-04-29 1989-06-14 Delta Biotechnology Ltd Polypeptides
US5571691A (en) * 1989-05-05 1996-11-05 Baylor College Of Medicine Production of recombinant lactoferrin and lactoferrin polypeptides using CDNA sequences in various organisms
GB8927480D0 (en) 1989-12-05 1990-02-07 Delta Biotechnology Ltd Mutant fungal strain detection and new promoter
JP3230091B2 (ja) 1990-06-25 2001-11-19 ウェルファイド株式会社 ヒト血清アルブミンの着色抑制方法
JPH05508547A (ja) * 1990-07-13 1993-12-02 トランスカリオティック セラピーズ,インコーポレイテッド ライブラリースクリーニング法
EP0509841A3 (en) 1991-04-18 1993-08-18 Tonen Corporation Co-expression system of protein disulfide isomerase gene and useful polypeptide gene and process for producing the polypeptide using its system
US6291205B1 (en) 1992-06-12 2001-09-18 Merck & Co., Inc. Method of increasing production of disulfide bonded recombinant proteins by saccharomyces cerevisiae
WO1994003617A1 (en) * 1992-07-29 1994-02-17 Unilever N.V. Process for producing anti-freeze peptides
DE4244915C2 (de) 1992-08-14 1998-12-03 Widmar Prof Dr Tanner DNA-Moleküle codierend Proteine, die an der O-Glykosylierung von Proteinen beteiligt sind
US5728553A (en) 1992-09-23 1998-03-17 Delta Biotechnology Limited High purity albumin and method of producing
EP0663010B1 (en) * 1992-10-02 2000-08-09 Research Corporation Technologies, Inc. Methods for increasing secretion of overexpressed proteins
GB9404270D0 (en) 1994-03-05 1994-04-20 Delta Biotechnology Ltd Yeast strains and modified albumins
GB9411356D0 (en) * 1994-06-07 1994-07-27 Delta Biotechnology Ltd Yeast strains
JP3945866B2 (ja) * 1996-09-04 2007-07-18 サントリー株式会社 メタノール酵母由来のプロテインジスルフィドイソメラーゼ遺伝子
KR20010023688A (ko) 1997-09-05 2001-03-26 카스파르 스튀름, 아를레테 슐레퍼 효모에서 폴리펩티드를 생산하는 발현 벡터
CN1111602C (zh) * 1998-05-15 2003-06-18 中国科学院上海生物化学研究所 一种使用分子伴侣促进蛋白质分泌的方法
GB9902000D0 (en) 1999-01-30 1999-03-17 Delta Biotechnology Ltd Process
EP1077263A1 (de) * 1999-07-29 2001-02-21 F.Hoffmann-La Roche Ag Verfahren zur Herstellung von natürlich gefalteten und sekretierten Proteinen durch Co-Sekretion von Chaperonen
AU2001266557A1 (en) 2000-04-12 2001-10-23 Human Genome Sciences, Inc. Albumin fusion proteins
US6358733B1 (en) * 2000-05-19 2002-03-19 Apolife, Inc. Expression of heterologous multi-domain proteins in yeast
DE10121235A1 (de) * 2001-04-30 2002-10-31 Roche Diagnostics Gmbh Verfahren zur Expression von Proteinen in in vitro Translations-Systemen unter Ko-Expression von Faltungshelferproteinen
US20030226155A1 (en) 2001-08-30 2003-12-04 Biorexis Pharmaceutical Corporation Modified transferrin-antibody fusion proteins
US7176278B2 (en) 2001-08-30 2007-02-13 Biorexis Technology, Inc. Modified transferrin fusion proteins
DE10145694A1 (de) * 2001-09-17 2003-04-03 Roche Diagnostics Gmbh Verfahren zur Erhöhung der Löslichkeit, der Expressionsrate und der Aktivität von Proteinen während der rekombinanten Herstellung
WO2003057897A2 (en) * 2002-01-07 2003-07-17 European Molecular Biology Laboratory Recombinant protein expression
WO2003066824A2 (en) 2002-02-07 2003-08-14 Aventis Behring Gmbh Albumin-fused kunitz domain peptides
KR20050065519A (ko) 2002-08-07 2005-06-29 델타 바이오테크놀로지 리미티드 알부민-융합 섬모 신경영양 인자
US6939676B2 (en) * 2002-12-30 2005-09-06 The United States Of America As Represented By The Secretary Of Argriculture Selection procedure for identifying transgenic cells, embryos, and plants without the use of antibiotics
US7244616B2 (en) * 2003-06-27 2007-07-17 Bayer Pharmaceuticals Corporation Use of molecular chaperones for the enhanced production of secreted, recombinant proteins in mammalian cells
US7226781B1 (en) * 2003-07-24 2007-06-05 Belyaev Alexander S Chaperone expression genomes
WO2006014899A2 (en) * 2004-07-26 2006-02-09 Dow Global Technologies Inc. Process for improved protein expression by strain engineering

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103436516A (zh) * 2013-08-23 2013-12-11 华南理工大学 利用大肠杆菌原核表达系统生产的小麦蛋白质二硫键异构酶及方法和应用

Also Published As

Publication number Publication date
GB0329681D0 (en) 2004-01-28
KR101262682B1 (ko) 2013-05-15
AU2008202538A1 (en) 2008-06-26
AU2004303601A1 (en) 2005-07-07
EP2048236B1 (en) 2013-03-20
ZA200605588B (en) 2009-02-25
AU2004303601C1 (en) 2009-01-08
DK2048236T3 (da) 2013-05-21
JP2007515962A (ja) 2007-06-21
HK1099938A1 (en) 2007-08-31
US20180105818A1 (en) 2018-04-19
ES2321948T3 (es) 2009-06-15
CN1922325B (zh) 2010-06-09
EP1709181B1 (en) 2009-01-28
CN1922325A (zh) 2007-02-28
SG149003A1 (en) 2009-01-29
SG182155A1 (en) 2012-07-30
DE602004019304D1 (de) 2009-03-19
EP2048236A1 (en) 2009-04-15
WO2005061718A1 (en) 2005-07-07
AU2004303601B2 (en) 2008-03-06
GB0614614D0 (en) 2006-08-30
JP5052899B2 (ja) 2012-10-17
CA2551503A1 (en) 2005-07-07
US20120231503A1 (en) 2012-09-13
GB2424889A (en) 2006-10-11
US20070275889A1 (en) 2007-11-29
KR20070005568A (ko) 2007-01-10
EP1709181A1 (en) 2006-10-11
ATE421994T1 (de) 2009-02-15

Similar Documents

Publication Publication Date Title
CN1922325B (zh) 基因表达技术
CN101128587B (zh) 基因表达技术
EP2330200B1 (en) Gene expression technique
CN101203610B (zh) 基因表达技术

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100901