发明内容
因此,作为本发明的第一方面,提供了生产期望的蛋白质如异源蛋白质的方法,其包括提供宿主细胞,所述宿主细胞包含第一重组基因、第二重组基因和第三基因,所述第一重组基因编码包含第一分子伴侣蛋白的序列的蛋白,所述第二重组基因编码包含第二分子伴侣蛋白的序列的蛋白,所述第三基因(任选地,第三基因是重组的)编码期望的蛋白质(任选为异源蛋白质),其中第一和第二分子伴侣不同;和在允许表达第一、第二和第三基因的条件下,在培养基中培养宿主细胞。
任选地,可以,或者可以不将由此表达的期望的蛋白质从培养的宿主细胞或培养基中纯化出来。
任选地,可以,或者可以不将由此纯化的期望的蛋白质冻干。
所述方法可以,或者可以不进一步包括用载体或稀释剂将纯化的期望的蛋白质进行配制的步骤,可任选地以单位剂型,以上文所讨论的方式提供(present)由此配制的蛋白质。
术语“重组基因”包括作为“孤立(stand alone)”可表达的序列独立起作用以产生编码的蛋白质的核酸序列,可替换的是在宿主内引入的与内源性序列组合起作用的核酸序列(如通过整合入内源性序列以产生与该内源性序列不同的核酸序列)以增加目标蛋白质的表达。
“重组基因”通常是不天然存在于所用背景(context)中的基因。例如,在整合位点整合入宿主生物染色体的基因如果包含不天然存在于整合位点的序列,就可以称为“重组基因”。因此,“重组基因”可以,或者可以不包含基因的编码、调控或任何其它区域中的非天然序列,或者可以,或可以不包含天然存在的基因序列,但在该序列不天然存在的整合位点引入宿主生物染色体。相同的问题,已作必要修正,也适用于将“重组基因”插入到质粒中。
术语“染色体整合”和“整合入宿主细胞的染色体”是本领域中熟知的术语。为避免疑问,这些术语包括将多核苷酸序列整合入宿主细胞中天然存在的任何可遗传的核物质,天然存在的质粒除外。因此,“整合入宿主细胞染色体”的多核苷酸序列可以,或者可以不,被整合入原核(如细菌)细胞的染色体,或者整合入真核细胞基因组的任何部分,如整合入核遗传物质,其包括染色体(或者染色体中的一条)、线粒体基因组或叶绿体基因组。
第一和第二分子伴侣可以,或者可以不,每个单独为如下讨论的具体列出的分子伴侣之一,并且为在同一个宿主细胞中共表达时,能至少提供相加效应(additive effect)以增加期望的蛋白质的表达的分子伴侣的组合。我们用“相加效应”表示宿主细胞中,当第一和第二重组基因同时和第三基因共表达时,期望的蛋白质的表达水平高于同样系统中下述情况的表达水平:(i)第一重组基因与第三基因共表达而不表达第二重组基因和(ii)第二重组基因与第三基因共表达而不表达第一重组基因。
此处使用术语“分子伴侣”表示结合另一种蛋白质的其它不稳定构象异构体并使其稳定的蛋白质,而且通过受控的结合与释放,可促进蛋白质在体内的正确结果,其进行折叠、低聚体装配,并转运到特定的亚细胞小室,或通过降解而处理。因此分子伴侣也是涉及蛋白质折叠的,或具有分子伴侣活性的或涉及未折叠蛋白应答的蛋白质。这类分子伴侣蛋白质在本领域众所周知,例如在斯坦福基因组数据库(Stanford Genome Database)(SGD)、http://db.yeastgenome.org或者http://www.yeastgenome.org中的分子伴侣蛋白质。优选的分子伴侣是真核分子伴侣,特别优选的分子伴侣是酵母分子伴侣,包括AHA1、CCT2、CCT3、CCT4、CCT5、CCT6、CCT7、CCT8、CNS1、CPR3、CPR6、ERO1、EUG1、FMO1、HCH1、HSP10、HSP12、HSP104、HSP26、HSP30、HSP42、HSP60、HSP78、HSP82、JEM1、MDJ1、MDJ2、MPD1、MPD2、PDI1、PFD1、ABC1、APJ1、ATP11、ATP12、BTT1、CDC37、CPR7、HSC82、KAR2、LHS1、MGE1、MRS11、NOB1、ECM10、SSA1、SSA2、SSA3、SSA4、SSC1、SSE2、SIL1、SLS1、ORM1、ORM2、PER1、PTC2、PSE1、UBI4和HAC1,或者截短的无内含子(truncated intronless)HAC1(Valkonen等2003,Applied Environ.Micro.,69,2065),以及TIM9、PAM18(也称作TIM14)和TCP1(也称作CCT1)。
本发明的实践中有用的分子伴侣可以是,也可以不是:
●热激蛋白质,如作为hsp70蛋白家族(包括Kar2p,SSA和SSB蛋白,如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2编码的蛋白)的成员的蛋白质、作为HSP90-家族的成员的蛋白质,或者作为HSP40-家族的成员的蛋白质,或涉及它们的调节(modulation)的蛋白质(如Sil1p),包括DNA-J和DNA-J-样蛋白(如Jem1p和Mdj2p);
●作为核周蛋白(karyopherin)/输入蛋白(importin)家族的成员的蛋白,如核周蛋白/输入蛋白的α或β家族,例如核周β蛋白PSE1;
●作为Hjelmqvist等,2002,Genome Biology,3(6),research0027.1-0027.16中描述的ORMDL家族的成员的蛋白质,如Orm2p。
●天然位于内质网中或分泌途径中其他位置如高尔基体中的蛋白。例如在内质网(ER)的腔室中,尤其是分泌细胞中天然起作用的蛋白,如PDI。
●作为锚定在ER中的跨膜蛋白的蛋白质,如前述Hjelmqvist等,2002中描述的ORMDL家族的成员(例如Orm2p);
●在胞质溶胶(cytosol)中起作用的蛋白质,如hsp70蛋白,包括SSA和SSB蛋白,如蛋白质产品SSA1、SSA2、SSA3、SSA4、SSB1和SSB2;
●在细胞核、核被膜和/或细胞质中起作用的蛋白质,如Pse1p;
●对于细胞生存“必需的”蛋白,如PDI,或者由下述基因中的一个编码的蛋白:CCT2、CCT3、CCT4、CCT5、CCT6、CCT7、CCT8、CNS1、ERO1、HSP10、HSP60、PDI1、CDC37、KAR2、MGE1、MRS11、NOB1、SSC1、TIM9、PAM18和TCP1,或作为必需的核周蛋白的蛋白质,如Pse1p;
●涉及巯基氧化或者二硫基形成、断裂或异构化的蛋白质,或者催化,特别是在分泌蛋白和细胞表面蛋白的生物合成过程中催化蛋白质中硫醇:二硫化物交换反应的蛋白质,如蛋白质二硫键异构酶(如Pdi1p和Mpd1p)、同源物(如Eug1p)和/或相关蛋白质(如Mpd2p、Fmo1p、Ero1p);
●涉及蛋白质合成、装配或折叠的蛋白质,如PDI和Ssa1p;
●优先或排他地与未折叠蛋白,而不是成熟蛋白质结合的蛋白质,如hsp70蛋白质,包括SSA和SSB蛋白质,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2编码的蛋白质;
●防止前体蛋白质在胞质溶胶中聚合的蛋白质,如hsp70蛋白质,包括SSA和SSB蛋白质,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2编码的蛋白质;
●与受损蛋白质结合并使其稳定的蛋白质,如Ssa1p;
●涉及非折叠蛋白质应答或提供对引起未折叠蛋白质应答的试剂(如衣霉素和二硫苏糖醇)的抗性增加的蛋白质,如前述Hjelmqvist等,2002中描述的ORMDL家族的成员(例如Orm2p)或涉及应激反应(stressresponse)的蛋白质(如Ubi4p);
●作为共分子伴侣的蛋白质和/或间接涉及蛋白质折叠和/或未折叠蛋白质应答的蛋白质(如hsp104p和Mdj1p);
●参与大分子核质转运的蛋白质,如Pse1p;
●通过识别核位置序列和核输出序列、并与核孔复合物相互作用来介导大分子跨核膜转运的蛋白质,如PSE1;
●如EP 0 746 611和Hillson等,1984,Methods Enzymol.,107,281-292中描述的能够对乱序的(scrambled)核糖核酸梅RNA恢复核糖核酸酶活性的蛋白质,如PDI;
●具有酸性pI(如4.0-4.5)的蛋白质,如PDI;
●作为Hsp70家族的成员的蛋白质,和任选具有N末端ATP结合域和C末端肽结合域的蛋白质,如Ssa1p。
●作为肽酰-脯氨酰顺反异构酶的蛋白质(如Cpr3p和Cpr6p);
●作为已知分子伴侣的同源物的蛋白质(如Hsp10p);
●作为线粒体分子伴侣的蛋白质(如Cpr3p);
●作为细胞质或核分子伴侣的蛋白质(如Cns1p);
●作为结合膜的分子伴侣的蛋白质(如Orm2p和Fmo1p);
●具有分子伴侣激活剂活性或者分子伴侣调控活性的蛋白质(如Aha1p、Hac1p和Hch1p);
●与不成熟形式的多肽短暂结合,以造成正确的折叠运输和/或分泌的蛋白质,包括有效易位到内质网所需的蛋白质(如Lhs1p)或有效易位到它们在细胞内的作用位点所需的蛋白质(如PseIp);
●参与蛋白质复合体装配和/或核糖体装配的蛋白质(如Atp11p、PseIp和Nob1p);
●伴侣素T复合物的蛋白质(如Cct2p);
●前折叠体(prefoldin)复合物的蛋白质(如Pfd1p);
●线粒体膜间隙蛋白质,如Tim9p;
●能在体内与Mrs11p/Tim10p形成复合体的蛋白质,如Tim9p;
●参与介导多处内膜蛋白(polytopic inner membrane proteins)的输入与插入的蛋白质,如Tim9p;
●防止进入的(incoming)蛋白质聚合的蛋白质,如Tim9p;
●能作为与前序列易位酶(presequence translocase,连同Ssc1p、Tim44p、Mge1p和Pam16p一起)有关的线粒体输入驱动物(motor)中的功能性组成部分的蛋白质,如Pam18p;
●能刺激Sscqp的ATP酶活性,如驱动线粒体输入的蛋白质,如Pam18p;
●包含J域的蛋白质,如Pam18p;
●能作为介导胞质溶胶中蛋白质折叠的包含伴侣素的T复合体的α亚基起作用的蛋白质,如Tcp1p;
●能在保持肌动蛋白细胞骨架中起作用的蛋白质,如Tcp1p,或
●作为黑腹果蝇(Drosophila melanogaster)或无尾鼠(mouse tailless)复合多肽或其同源物的蛋白质,如Tcp1p。
优选的分子伴侣使蛋白质二硫键异构酶(PDI)或其具有在内质网(ER)腔室中催化形成二硫键的相同能力的片段或变体。我们使用“PDI”包括了具有对乱序的(scrambled)核糖核酸梅RNA恢复核糖核酸酶活性的能力的蛋白质,如EP0 746 611和Hillson等,1984,Methods Enzymol.,107,281-292中所述。
PDI是通常催化硫醇:二硫化物交换反应的酶,并且是分泌细胞中ER腔室的主要常驻蛋白质组分。大量证据表明PDI在分泌蛋白质的生物合成中起作用(Freedman,1984,Trends Biochem.Sci.,9,438-41),而这得到了原位直接交联(direct cross-linking)研究的支持(Roth和Pierce,1987,Biochemistry,26,4179-82)。研究发现,微粒体膜缺少PDI显示共翻译的蛋白质二硫化物中有特定的缺陷(Bulleid和Freedman,1988,Nature,335,649-51),这暗示了在分泌蛋白质和细胞表面蛋白质的生物合成过程中,酶作为天然二硫键形成的催化剂起作用。这种作用与酶已知的在体外的催化性质一致;PDI可催化硫醇:二硫化物交换反应,导致净蛋白质二硫键形成、断裂或者异构化,并可通常在很多种被还原、未折叠蛋白质底物中催化蛋白质折叠和天然二硫键的形成(Freedman等,1989,Biochem.Soc.Symp.,55,167-192)。PDI还可作为分子伴侣起作用,因为缺少异构酶活性的突变PDI可以加速蛋白质折叠(Hayano等,1995,FEBSLetters,377,505-51)。最近,报道了巯基氧化而不是二硫化物异构是酿酒酵母中蛋白质二硫键异构酶的主要功能(Solovyov等,2004,J.Biol.Chem.,279(33)34095-34100)。所述酶的DNA和氨基酸序列对于几个物种是已知的(Scherens等,1991,Yeast,7,185-193;Farquhar等,1991,Gene,108,81-89;EP074661;EP0293793;EP0509841),而且关于纯化的酶对哺乳动物肝脏均质性的作用机制的信息正在增加(Creighton等,1980,J.Mol.Biol.,142,43-62;Freedman等,1988,Biochem.Soc.Trans.,16,96-9;Gilbert,1989,Biochemistry,28,7298-7305;Lundstrom和Holmgren,1990,J.Biol.Chem.,265,9114-9120;Hawkins和Freedman,1990,Biochem.J.,275,335-339)。在当前暗示作为细胞中蛋白质折叠、装配和易位的介导物的很多蛋白质因子中(Rothman,1989,Cell,59,591-601),PDI具有明确的催化活性。
宿主中缺失内源的PDI基因或使其失活导致产生不能生存的宿主。换句话说,内源的PDI基因是“必需”基因。
从哺乳动物组织中容易地分离PDI,且均质酶是同型二聚体(2×57kD),具有特征性的酸性pI(4.0-4.5)(前面引用的Hillson等,1984)。还从小麦和藻类Chlamydomonas reinhardii(Kaska等,1990,Biochem.J.,268,63-68)、大鼠(Edman等,1985,Nature,317,267-270)、牛(Yamauchi等,1987,Biochem.Biophys.Res.Comm.,146,1485-1492)、人(Pihlajaniemi等,1987,EMBO J.,6,643-9)、酵母(前述Scherens等和前面引用的Farquhar等)和鸡(chick)(Parkkonen等,1988,Biochem.J.,256,1005-1011)中纯化了该酶。从这些脊椎动物物种中得到的蛋白质显示从头到尾的高度的序列保守性,而且所有都显示了在大鼠PDI序列中首次发现的几个整体特性(前面引用的Edman等,1985)。
优选的PDI序列包括来自人和来自酵母物种,如酿酒酵母的PDI序列。
酵母蛋白质二硫键异构酶前体PDI1可作为Genbank登录号(accession no.)CAA42373或者BAA00723找到,并具有522个氨基酸的序列,如WO2005/061718中所述,其内容通过引用并入本文。
另一种酵母蛋白质二硫键异构酶序列可作为Genbank登录号CAA38402找到,其如WO 2005/061718所述具有530个氨基酸的序列,该文献的内容通过引用并入本文。
WO 2005/061718(其内容通过引用并入本文)中这些序列(第一个序列是Genbank登录号CAA42373或BAA00723的序列,第二个序列是Genbank登录号CAA38402的序列)的比对(alignment),显示这两个序列之间的区别是在114位置(加粗突出表示)的单个氨基酸差异,而且Genbank登录号CAA38402所述序列在位置506-513包含额外的氨基酸EADAEAEA。
本发明也包括上述PDI序列的变体和片段,和其它天然存在的PDI序列的变体。在PDI的上下文中,“变体”指其中在一个或多个位置存在氨基酸插入、缺失或者保守或非保守取代的蛋白质,只要这样的变化产生的蛋白质的基本性质,例如酶活(典型活性和比活性(type ofand specific activity))、热稳定性、在一定pH范围内的活性(pH稳定性)没有明显变化。此上下文中的“明显”指本领域的技术人员能够判定变体的性质仍然可以是,或者可以不是不同的,但与初始蛋白质的性质相比将是明显的。
“保守取代”是预定的组合,如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;和Phe、Tyr、Trp。优选的保守取代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;和Phe、Tyr。
“变体”通常与衍生得到该变体的多肽具有至少25%、至少50%、至少60%或至少70%,优选至少80%,更优选至少90%,甚至更优选至少95%,还更优选至少99%,最优选至少99.5%的序列同一性。
可以使用合适的计算机程序确定两个多肽之间的百分比序列同一性,如下所述。这样的变体可以是,或者可以不是天然的或者使用本领域所熟知的蛋白质工程和定点诱变方法制备的。
在PDI的上下文中,“片段”指其中在一个或多个位置具有缺失的蛋白质。因此片段可以包括,或者可以不包括完全成熟的PDI蛋白质的完整序列的最多5、10、20、30、40或者50%,通常多达60%,更通常多达70%,优选多达80%,更优选多达90%,甚至更优选多达95%,还更优选多达99%。PDI蛋白质的特别优选片段包括期望的蛋白质的一个或多个完整域。
PDI的变体或者片段可以是,或者可以不是这样的蛋白质,当其在宿主细胞中重组表达时能够补充宿主细胞,如酿酒酵母中内源编码的PDI基因中缺失;也可以是,或者可以不是,例如天然存在的PDI同源物,如由其它生物编码的同源物,所述生物如其它酵母或其它真菌,或其它真核生物,如人或其它脊椎动物,或动物或植物。
当第一分子伴侣是PDI,尤其是哺乳动物或酵母PDI时,在一个实施方案中,第二分子伴侣不是hsp70分子伴侣蛋白质(如酵母KAR2、HSP70、BiP、SSA1-4、SSB1、SSC1、SSD1或真核的hsp70蛋白质,如HSP68、HSP72、HSP73、HSC70、网格蛋白去包被ATP酶(clathrin uncoating ATPase)、IgG重链结合蛋白(BiP)、葡萄糖调节蛋白质75、78和80(GRP75、GRP78和GRP80)等)。具体地在一个实施方案中,第一分子伴侣不是酵母PDI,此时第二分子伴侣是酵母KAR2。特别地在另一个实施方案中,第一分子伴侣不是哺乳动物PDI,此时第二分子伴侣是哺乳动物BiP。
或者,当第一和第二分子伴侣分别是,例如PDI,特别是哺乳动物或酵母PDI,和如上所述的hsp70分子伴侣蛋白质时,期望的蛋白质可为异源蛋白质,其可以是或可以不是选自下组的蛋白质-
●哺乳动物基因产品,如酶、细胞因子(cytokine)、生长因子、激素、疫苗、抗体等;红细胞生成素(erythropoietin)、胰岛素、生长激素(somatotropin)、生长激素释放因子、血小板衍生的生长因子、表皮生长因子、转化生长因子α、转化生长因子β、表皮生长因子、成纤维细胞生长因子、神经生长因子、胰岛素-样生长因子I、胰岛素-样生长因子II、凝固因子VIII、超氧化物歧化酶、α-干扰素、γ-干扰素、白细胞介素-1、白细胞介素-2、白细胞介素-3、白细胞介素-4、白细胞介素-5、白细胞介素-6、粒细胞集落刺激因子(granulocyte colonystimulating factor)、多谱系集落刺激因子(multi-lineage colonystimulating activity)、粒细胞-巨噬细胞刺激因子(granulocyte-macrophage stimulating factor)、巨噬细胞集落刺激因子(macrophage colony stimulating factor)、T细胞生长因子、淋巴毒素(lymphotoxin)等;或者人基因产品;
●可以用作疫苗的任何基因产品,包括哺乳动物病原体的任何结构的、膜关联的、膜结合的或分泌的基因产品,其包括能够感染或者侵袭哺乳动物的病毒、细菌、单细胞或多细胞寄生虫,特别是病毒,如人免疫缺陷病毒(HIV)、立氏立克次氏体(R.rickettsii)、牛痘、志贺氏菌属(Shigella)、脊髓灰质炎病毒(poliovirus)、腺病毒、流行性感冒病毒、甲型肝炎(hepatitis A)、乙型肝炎(hepatitis B)、登革热病毒(denguevirus)、日本乙型脑炎(Japanese B encephalitis)、水痘-带状疱疹(Varicella zoster)、细胞巨化病毒(cytomegalovirus)、甲型肝炎、轮状病毒(rotavirus),以及抗病毒病的疫苗,所述病毒病如莱姆病(Lymedisease)、麻疹(measles)、黄热病(yellow fever)、腮腺炎(mumps)、狂犬病(rabies)、疱疹(herpes)、流行性感冒(influenza)、副流行性感冒(parainfluenza)等;或者细菌,如霍乱弧菌(Vibrio cholerae)、伤寒沙门菌(Salmonella typhi)、百日咳博德特氏菌(Bordetella pertussis)、肺炎链球菌(Streptococcus pneumoniae)、流感嗜血菌(Hemophilusinfluenza)、破伤风梭菌(Clostridium tetani)、白喉棒杆菌(Corynebacterium diphtheriae)、麻风分枝杆菌(Mycobacterium leprae)、Neisseria qonorrhoeae、脑膜炎奈瑟氏球菌(Neisseria meningitidis)、粗球孢菌(Coccidioides immitis)等。
另一个优选的分子伴侣是包含由基因SSA1编码的蛋白质序列的蛋白质,或其具有等同的分子伴侣-样活性的片段或变体。SSA1,也叫做YG100,位于酿酒酵母基因组的染色体I上,大小为1.93kbp。
WO 2005/061718中描述了由基因SSA1编码的蛋白质的一个已发表的蛋白质序列,此文献的内容通过引用并入本文。
WO 2005/061718中还描述了SSA1的已发表的编码序列,此文献内容通过引用并入本文,但是可理解的是,该序列可以通过简并取代进行修饰,以获得编码同样蛋白质产品的可选的核苷酸序列。
蛋白质Ssa1p属于Hsp70家族的蛋白质,位于胞质溶胶中。Hsp70蛋白质族具有表现许多分子伴侣活性的能力;帮助蛋白质合成、装配和折叠;调节多肽向各种胞内位置易位和分解蛋白质聚集体(Becker & Craig,1994,Eur.J.Biochem.219,11-23)。Hsp70基因是高度保守的,具有N末端ATP结合域和C末端肽结合域。Hsp70蛋白质族与蛋白质(主要是未折叠的蛋白质)的肽骨架反应。通过hsp70蛋白质族来结合并释放肽是ATP依赖性的过程,并伴有hsp70中的构象变化(前述Becker & Craig,1994)。
胞质溶胶hsp70蛋白质族特别涉及蛋白质的合成、折叠和分泌(前述Becker & Craig,1994)。在酿酒酵母中,将胞质溶胶hsp70蛋白质族分为两组:SSA(SSA1-4)和SSB(SSB1和SSB2)蛋白质,它们在功能上彼此不同。SSA家族是“必需的”,来自该组的至少一个蛋白质必须是活性的以维持细胞生存力(前述Becker & Craig,1994)。胞质溶胶hsp70蛋白质族优选与未折叠和不成熟的蛋白质结合。这表明它们可以通过在胞质溶胶中装配成多分子复合体之前使蛋白质维持在未折叠状态和/或促进它们向各种细胞器易位,从而防止前体蛋白质的聚集(前述Becker & Craig,1994)。SSA蛋白质特别涉及翻译后的生物发生(biogenesis)和维持易位到内质网和线粒体的前体(Kim等,1998,Proc.Natl.Acad.Sci.USA.95,12860-12865;Ngosuwan等,2003,J.Biol.Chem.278(9),7034-7042)。已显示Ssa1p可结合受损蛋白质,使它们以部分未折叠的形式稳定,并使再折叠或降解发生(前述Becker & Craig,1994;Glover & Lindquist,1998,Cell.94,73-82)。
Demolder等,1994,J.Biotechnol.,32,179-189报道,SSA1在酵母中的过量表达使在染色体上重组整合的编码人干扰素-β的基因的表达增加。未说明如果SSA1和人干扰素-β由同一质粒上的重组基因编码,异源基因表达是否得到提高。实际上,根据在酵母中过量表达分子伴侣的领域近来的发展(如前面引用的Robinson等,1994;Hayano等,1995;Shusta等,1998;Parekh &Wittrup,1997;Bao & Fukuhara,2001;和Bao等,2000),技术人员根本不愿由2μm-家族质粒表达SSA1,更不愿由2μm-家族质粒表达SSA1和异源蛋白质来增加异源蛋白质的表达水平。
本发明也包括了蛋白的变体和片段,所述蛋白包含由SSA1基因编码的蛋白质的序列。在由基因SSA1编码的蛋白质的上下文中,“变体”指具有天然Ssa1p序列的蛋白质,除了其中在一个或多个位点具有氨基酸插入、缺失或保守或者不保守取代,只要这样的变化产生的蛋白质的基本性质,如酶活(典型活性和比活性)、热稳定性、在一定pH范围内的活性(pH稳定性)没有显著的变化。此上下文中的“显著”是指本领域的技术人员可判定变体的性质可仍然不同,但与初始蛋白质的性质相比将是明显的。
“保守取代”是预定的组合如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;和Phe、Tyr、Trp。优选的保守取代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;和Phe、Tyr。
Ssa1p的“变体”通常与天然的Ssa1p的序列具有至少25%、至少50%、至少60%或至少70%,优选至少80%,更优选至少90%,甚至更优选至少95%,还更优选至少99%,最优选至少99.5%的序列同一性。
可以用合适的计算机程序确定两个多肽之间的百分比序列同一性,如下面讨论的。这样的变体可以是,或者可以不是天然的或者用本领域所熟知的蛋白质工程和定点诱变方法制备的。
在Ssa1p的上下文中,“片段”指具有天然Ssa1p序列的蛋白质,除了其中在一个或多个位点具有缺失。因此片段可以包括,或者可以不包括完全成熟的Ssa1p蛋白质的完整序列的最多5、10、20、30、40或者50%,通常多达60%,更通常多达70%,优选多达80%,更优选多达90%,甚至更优选多达95%,还更优选多达99%。Ssa1p蛋白质的特别优选的片段包括期望的蛋白质的一个或多个完整域。
Ssa1p的变体或者片段可以是,或者可以不是这样的蛋白质,当其在宿主细胞如酿酒酵母中重组表达时能够补充宿主细胞中内源编码的SSA1基因(或其同源物)的缺失;而且可以是,或者可以不是,例如天然存在的Ssa1p同源物,如由其它生物编码的同源物,所述其它生物如其它酵母或其它真菌,或其它真核生物,如人或其它脊椎动物,或动物或植物。
另一种优选的分子伴侣是包含由PSE1基因编码的蛋白质序列的蛋白质,或其具有等同的分子伴侣-样活性的片段或变体。
PSE1,也称为KAP121,是必需基因,位于染色体XIII上。
WO 2005/061718中描述了蛋白质Pse1p的已发表的蛋白序列,此文献的内容通过引用并入本文。
WO 2005/061718中还描述了PSE1的已发表的核苷酸编码序列,此文献的内容通过引用并入本文,但可理解的是,该序列可以通过简并取代进行修饰以获得编码同样的蛋白质产品的可选的核苷酸序列。
PSE1基因长3.25kbp。Pse1p参与大分子的核质转运(Seedorf & Silver,1997,Proc.Natl.Acad.Sci.USA.94,8590-8595)。这个过程通过嵌入核包被中并由核孔蛋白组成的核孔复合体(NPC)进行(Ryan & Wente,2000,Curr.Opin.Cell Biol.12,361-371)。蛋白质具有特殊序列,其包含核输入、核定位序列(NLS)与输出、核输出序列(NES)所需的信息(Pemberton等,1998,Curr.Opin.CellBiol.10,392-399)。Pse1p是核周蛋白(karyopherin)/输入蛋白(importin),是分为α家族和β家族的一组蛋白质。核周蛋白是通过识别NLS和NES来介导大分子跨核膜转运的可溶的转运因子,并与NPC相互作用(前述Seedorf &Silver,1997;Pemberton等,1998;Ryan & Wente,2000)。通过核孔的易位由GTP水解驱动,由小GTP结合蛋白Ran催化进行(前述Seedorf & Silver,1997)。已将Pse1p鉴定为核周蛋白β。已在酿酒酵母中鉴定了14个核周蛋白β蛋白质,其中只有4个是“必需”蛋白质。这可能是因为多个核周蛋白可以介导单个大分子的转运(Isoyama等,2001,J.Biol.Chem.276(24),21863-21869)。Pse1p位于细胞核,处于核包被,距离细胞质有一定距离。这表明蛋白可以移入和移出核,作为其转运功能的一部分(前述Seedorf & Silver,1997)。Pse1p涉及转录因子的核输入(前述Isoyama等,2001,supra;Ueta等,2003,J.Biol.Chem.278(50),50120-50127)、组蛋白的核输入(Mosammaparast等,2002,J.Biol.Chem.277(1),862-868)和核糖体蛋白质在装配成核糖体之前的核输入(前述Pemberton等,1998)。它还介导mRNA从核输出。核周蛋白识别RNA结合蛋白上发现的不同的NES并与其结合,所述RNA结合蛋白质在从核输出之前包被(coat)RNA(前述Seedorf & Silver,1997,Pemberton等,1998)。
因为大分子的核质转运对于通过细胞循环的适当进程是必需的,所以核转运因子,如Pse1p是用于生长控制的新候选目标(前述Seedorf & Silver,1997)。
也显示在酿酒酵母中过量表达Pse1p(蛋白质分泌增强子)可增加生物活性蛋白谱(repertoire)的内源蛋白质分泌水平(Chow等,1992;J.Cell.Sci.101(3),709-719)。未说明如果Pse1p和异源蛋白两者都通过同一质粒上的重组基因编码,异源基因表达是否得到提高。实际上,根据酵母中过量表达分子伴侣方面近来的发展(如前面引用的Robinson等,1994;Hayano等,1995;Shusta等,1998;Parekh & Wittrup,1997;Bao & Fukuhara,2001;和Bao等,2000),技术人员根本不会尝试从2μm-家族质粒过量表达PSE1基因,更不会从2μm-家族质粒表达Pse1p和异源蛋白质来增加异源蛋白质的表达水平。
本发明也包括了包含Pse1p的变体和片段。在Pse1p的上下文中,“变体”指具有天然Ssa1p序列的蛋白质,除了其中在一个或多个位点具有氨基酸插入、缺失或保守或者不保守取代,只要这样的变化产生的蛋白质的基本性质,如酶活(典型活性和比活性)、热稳定性、在一定pH范围内的活性(pH稳定性)没有显著的变化。这里的“显著”表示本领域的技术人员可判定该变体的性质可仍然不同,但与初始蛋白质的性质相比将是明显的。
“保守取代”是预定的组合如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;和Phe、Tyr、Trp。优选的保守取代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;和Phe、Tyr。
Pse1p的“变体”通常与天然的Pse1p的序列具有至少25%、至少50%、至少60%或至少70%,优选至少80%,更优选至少90%,甚至更优选至少95%,还更优选至少99%,最优选至少99.5%的序列同一性。
可以使用合适的计算机程序确定两个多肽之间的百分比序列同一性,如下面讨论的。这样的变体可以是,或者可以不是天然的或者用本领域所熟知的蛋白质工程和定点诱变方法制备的。
在Pse1p的上下文中,“片段”指具有天然Pse1p序列的蛋白质,除了其中在一个或多个位置具有缺失。因此片段可以包括,或者可以不包括完全成熟的Pse1p蛋白质的完整序列的最多5、10、20、30、40或者50%,通常多达60%,更通常多达70%,优选多达80%,更优选多达90%,甚至更优选多达95%,还更优选多达99%。Pse1p蛋白质的特别优选的片段包括期望的蛋白质的一个或多个完整域。
Pse1p的变体或者片段可以是,或者可以不是这样的蛋白质,当其在宿主细胞如酿酒酵母中重组表达时能够补充宿主细胞中内源PSE1基因的缺失;而且可以是,或者可以不是例如天然存在的Pse1p同源物,如由其它生物编码的同源物,所述其它生物如其它酵母或其它真菌,或其它真核生物,如人或其它脊椎动物,或动物或植物。
另一种优选的分子伴侣是包含由ORM2基因编码的蛋白质序列的蛋白质,或其具有等同的分子伴侣-样活性的片段或变体。
ORM2,也称为YLR350W,位于酿酒酵母基因组的染色体XII(828729到829379位)上,并编码与酵母蛋白Orm1p相似的进化上保守的蛋白。Hjelmqvist等,2002,Genome Biology,3(6),research 0027.1-0027.16报道,ORM2属于包含三个人基因(ORMDL1、ORMDL2和ORMDL3)和微孢子、植物、果蝇、尾索动物(urochordates)和脊椎动物中的同源物的基因家族。据报道ORMDL基因族编码锚定于蛋白内质网(ER)中的跨膜蛋白质。
蛋白质Orm2p是对于引起未折叠蛋白质应答的试剂的抗性所需要的。Hjelmqvist等,2002(前述)报道了两种酿酒酵母ORMDL同源物(ORM1和ORM2)的双敲除导致生长速率降低和对衣霉素和二硫苏糖醇的敏感性增大。
Orm2p的一种已发表的序列如WO 2005/061718中所述,此文献的内容通过引用并入本文。
也如WO 2005/061718中所述,上述蛋白质在酿酒酵母中由编码核苷酸序列编码,此文献的内容通过引用并入本文,但可理解的是,该序列可以通过简并取代来修饰以获得编码同样的蛋白质产品的可选的核苷酸序列。
本发明也包括了Orm2p的变体和片段。在Orm2p的上下文中,“变体”指具有天然Orm2p序列的蛋白质,除了其中在一个或多个位点存在氨基酸插入、缺失或保守或者不保守取代,只要这样的变化产生的蛋白质的基本性质,如酶活(典型活性和比活性)、热稳定性、在一定pH范围内的活性(pH稳定性)没有显著的变化。这里的“显著”是指本领域的一名技术人员可判定该变体的性质可仍然不同,但与初始蛋白质的性质相比将是明显的。
“保守取代”是预定的组合,如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;和Phe、Tyr、Trp。优选的保守取代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;和Phe、Tyr。
Orm2p的“变体”通常与天然的Orm2p的序列具有至少25%、至少50%、至少60%或至少70%,优选至少80%,更优选至少90%,甚至更优选至少95%,还更优选至少99%,最优选至少99.5%的序列同一性。
可以用合适的计算机程序确定两个多肽之间的百分比序列同一性,如下面讨论的。这样的变体可以是,或者可以不是天然的或者用本领域所熟知的蛋白质工程和定点诱变方法制备的。
在Orm2p的上下文中,“片段”指具有天然Orm2p序列的蛋白质,除了其中在一个或多个位置具有缺失。因此片段可以包括,或者可以不包括完全成熟的Orm2p蛋白质的完整序列的最多5、10、20、30、40或者50%,通常多达60%,更通常多达70%,优选多达80%,更优选多达90%,甚至更优选多达95%,还更优选多达99%。Orm2p蛋白质的特别优选的片段包括期望的蛋白质的一个或多个完整域。
Orm2p的变体或者片段可以是,或者可以不是这样的蛋白质,当其在宿主细胞如酿酒酵母中重组表达时能够补充宿主细胞中内源ORM2基因的缺失;而且可以是,或者可以不是,例如天然存在的Orm2p同源物,如由其它生物编码的同源物,所述其它生物如其它酵母或其它真菌,或其它真核生物,如人或其它脊椎动物,或动物或植物。
编码包含分子伴侣序列的蛋白质的基因可以,或者可以不以类似于下面讨论的用于编码异源蛋白的基因的形式形成,特别强调ORF和调控区的组合。
因此,一种优选的分子伴侣是蛋白质二硫键异构酶;另一种优选的分子伴侣是Orm2p或其片段或变体。在具体的优选实施方案中,第一和第二分子伴侣是蛋白质二硫键异构酶和Orm2p或其片段或变体。
此外,第一和第二分子伴侣的优选组合可以,或者可以不,分别由下述基因编码:AHA1和CCT2;AHA1和CCT3;AHA1和CCT4;AHA1和CCT5;AHA1和CCT6;AHA1和CCT7;AHA1和CCT8;AHA1和CNS1;AHA1和CPR3;AHA1和CPR6;AHA1和ERO1;AHA1和EUG1;AHA1和FMO1;AHA1和HCH1;AHA1和HSP10;AHA1和HSP12;AHA1和HSP104;AHA1和HSP26;AHA1和HSP30;AHA1和HSP42;AHA1和HSP60;AHA1和HSP78;AHA1和HSP82;AHA1和JEM1;AHA1和MDJ1;AHA1和MDJ2;AHA1和MPD1;AHA1和MPD2;AHA1和PDI1;AHA1和PFD1;AHA1和ABC1;AHA1和APJ1;AHA1和ATP11;AHA1和ATP12;AHA1和BTT1;AHA1和CDC37;AHA1和CPR7;AHA1和HSC82;AHA1和KAR2;AHA1和LHS1;AHA1和MGE1;AHA 1和MRS11;AHA1和NOB1;AHA1和ECM10;AHA1和SSA1;AHA1和SSA2;AHA1和SSA3;AHA1和SSA4;AHA1和SSC1;AHA1和SSE2;AHA1和SIL1;AHA1和SLS1;AHA1和ORM1;AHA1和ORM2;AHA1和PER1;AHA1和PTC2;AHA1和PSE1;AHA1和UBI4;AHA1和HAC1或截短的无内含子HAC1;CCT2和CCT3;CCT2和CCT4;CCT2和CCT5;CCT2和CCT6;CCT2和CCT7;CCT2和CCT8;CCT2和CNS1;CCT2和CPR3;CCT2和CPR6;CCT2和ERO1;CCT2和EUG1;CCT2和FMO1;CCT2和HCH1;CCT2和HSP10;CCT2和HSP12;CCT2和HSP104;CCT2和HSP26;CCT2和HSP30;CCT2和HSP42;CCT2和HSP60;CCT2和HSP78;CCT2和HSP82;CCT2和JEM1;CCT2和MDJ1;CCT2和MDJ2;CCT2和MPD1;CCT2和MPD2;CCT2和PDI1;CCT2和PFD1;CCT2和ABC1;CCT2和APJ1;CCT2和ATP11;CCT2和ATP12;CCT2和BTT1;CCT2和CDC37;CCT2和CPR7;CCT2和HSC82;CCT2和KAR2;CCT2和LHS1;CCT2和MGE1;CCT2和MRS11;CCT2和NOB1;CCT2和ECM10;CCT2和SSA1;CCT2和SSA2;CCT2和SSA3;CCT2和SSA4;CCT2和SSC1;CCT2和SSE2;CCT2和SIL1;CCT2和SLS1;CCT2和ORM1;CCT2和ORM2;CCT2和PER1;CCT2和PTC2;CCT2和PSE1;CCT2和UBI4;CCT2和HAC1或截短的无内含子HAC1;CCT3和CCT4;CCT3和CCT5;CCT3和CCT6;CCT3和CCT7;CCT3和CCT8;CCT3和CNS1;CCT3和CPR3;CCT3和CPR6;CCT3和ERO1;CCT3和EUG1;CCT3和FMO1;CCT3和HCH1;CCT3和HSP10;CCT3和HSP12;CCT3和HSP104;CCT3和HSP26;CCT3和HSP30;CCT3和HSP42;CCT3和HSP60;CCT3和HSP78;CCT3和HSP82;CCT3和JEM1;CCT3和MDJ1;CCT3和MDJ2;CCT3和MPD1;CCT3和MPD2;CCT3和PDI1;CCT3和PFD1;CCT3和ABC1;CCT3和APJ1;CCT3和ATP11;CCT3和ATP12;CCT3和BTT1;CCT3和CDC37;CCT3和CPR7;CCT3和HSC82;CCT3和KAR2;CCT3和LHS1;CCT3和MGE1;CCT3和MRS11;CCT3和NOOB1;CCT3和ECM10;CCT3和SSA1;CCT3和SSSA2;CCT3和SSA3;CCT3和SSA4;CCT3和SSC1;CCT3和SSE2;CCT3和SIL1;CCT3和SLS1;CCT3和ORM1;CCT3和ORM2;CCT3和PER1;CCT3和PTC2;CCT3和PSE1;CCT3和UBI4;CCT3和HAC1或截短的无内含子HAC1;CCT4和CCT5;CCT4和CCT6;CCT4和CCT7;CCT4和CCT8;CCT4和CNS1;CCT4和CPR3;CCT4和CPR6;CCT4和ERO1;CCT4和EUG1;CCT4和FMO1;CCT4和HCH1;CCT4和HSP10;CCT4和HSP12;CCT4和HSP104;CCT4和HSP26;CCT4和HSP30;CCT4和HSP42;CCT4和HSP60;CCT4和HSP78;CCT4和HSP82;CCT4和JEM1;CCT4和MDJ1;CCT4和MDJ2;CCT4和MPD1;CCT4和MPD2;CCT4和PDI1;CCT4和PFD1;CCT4和ABC1;CCT4和APJ1;CCT4和ATP11;CCT4和ATP12;CCT4和BTT1;CCT4和CDC37;CCT4和CPR7;CCT4和HSC82;CCT4和KAR2;CCT4和LHS1;CCT4和MGE1;CCT4和MRS11;CCT4和NOB1;CCT4和ECM10;CCT4和SSA1;CCT4和SSA2;CCT4和SSA3;CCT4和SSA4;CCT4和SSC1;CCT4和SSE2;CCT4和SIL1;CCT4和SLS1;CCT4和ORM1;CCT4和ORM2;CCT4和PER1;CCT4和PTC2;CCT4和PSE1;CCT4和UBI4;CCT4和HAC1或截短的无内含子HAC1;CCT5和CCT6;CCT5和CCT7;CCT5和CCT8;CCT5和CNS1;CCT5和CPR3;CCT5和CPR6;CCT5和ERO1;CCT5和EUG1;CCT5和FMO1;CCT5和HCH1;CCT5和HSP10;CCT5和HSP12;CCT5和HSP104;CCT5和HSP26;CCT5和HSP30;CCT5和HSP42;CCT5和HSP60;CCT5和HSP78;CCT5和HSP82;CCT5和JEM1;CCT5和MDJ1;CCT5和MDJ2;CCT5和MPD1;CCT5和MPD2;CCT5和PDI1;CCT5和PFD1;CCT5和ABC1;CCT5和APJ1;CCT5和ATP11;CCT5和ATP12;CCT5和BTT1;CCT5和CDC37;CCT5和CPR7;CCT5和HSC82;CCT5和KAR2;CCT5和LHS1;CCT5和MGE1;CCT5和MRS11;CCT5和NOB1;CCT5和ECM10;CCT5和SSA1;CCT5和SSA2;CCT5和SSA3;CCT5和SSA4;CCT5和SSC1;CCT5和SSE2;CCT5和SSIL1;CCT5和SLS1;CCT5和ORM1;CCT5和ORM2;CCT5和PER1;CCT5和PTC2;CCT5和PSE1;CCT5和UBI4;CCT5和HAC1或截短的无内含子HAC1;CCT6和CCT7;CCT6和CCT8;CCT6和CNS1;CCT6和CPR3;CCT6和CPR6;CCT6和ERO1;CCT6和EUG1;CCT6和FMO1;CCT6和HCH1;CCT6和HSP10;CCT6和HSP12;CCT6和HSP104;CCT6和HSP26;CCT6和HSP30;CCT6和HSP42;CCT6和HSP60;CCT6和HSP78;CCT6和HSP82;CCT6和JEM1;CCT6和MDJ1;CCT6和MDJ2;CCT6和MPD1;CCT6和MPD2;CCT6和PDI1;CCT6和PFD1;CCT6和ABC1;CCT6和APJ1;CCT6和ATP11;CCT6和ATP12;CCT6和BTT1;CCT6和CDC37;CCT6和CPR7;CCT6和HSC82;CCT6和KAR2;CCT6和LHS1;CCT6和MGE1;CCT6和MRS11;CCT6和NOB1;CCT6和ECM10;CCT6和SSA1;CCT6和SSA2;CCT6和SSA3;CCT6和SSA4;CCT6和SSC1;CCT6和SSE2;CCT6和SIL1;CCT6和SLS1;CCT6和ORM1;CCT6和OR2;CCT6和PER1;CCT6和PTC2;CCT6和PSE1;CCT6和UBI4;CCT6和HAC1或截短的无内含子HAC1;CCT7和CCT8;CCT7和CNS1;CCT7和CPR3;CCT7和CPR6;CCT7和ERO1;CCT7和EUG1;CCT7和FMO1;CCT7和HCH1;CCT7和HSP10;CCT7和HSP12;CCT7和HSP104;CCT7和HSP26;CCT7和HSP30;CCT7和HSP42;CCT7和HSP60;CCT7和HSP78;CCT7和HSP82;CCT7和JEM1;CCT7和MDJ1;CCT7和MDJ2;CCT7和MPD1;CCT7和MPD2;CCT7和PDI1;CCT7和PFD1;CCT7和ABC1;CCT7和APJ1;CCT7和ATP11;CCT7和ATP12;CCT7和BTT1;CCT7和CDC37;CCT7和CPR7;CCT7和HSC82;CCT7和KAR2;CCT7和LHS1;CCT7和MGE1;CCT7和MRS11;CCT7和NOB1;CCT7和ECM10;CCT7和SSA1;CCT7和SSA2;CCT7和SSA3;CCT7和SSA4;CCT7和SSC1;CCT7和SSE2;CCT7和SIL1;CCT7和SLS1;CCT7和ORM1;CCT7和ORM2;CCT7和PER1;CCT7和PTC2;CCT7和PSE1;CCT7和UBI4;CCT7和HAC1或截短的无内含子HAC1;CCT8和CNS1;CCT8和CPR3;CCT8和CPR6;CCT8和ERO1;CCT8和EUG1;CCT8和FMO1;CCT8和HCH1;CCT8和HSP10;CCT8和HSP12;CCT8和HSP104;CCT8和HSP26;CCT8和HSP30;CCT8和HSP42;CCT8和HSP60;CCT8和HSP78;CCT8和HSP82;CCT8和JEM1;CCT8和MDJ1;CCT8和MDJ2;CCT8和MPD1;CCT8和MPD2;CCT8和PDI1;CCT8和PFD1;CCT8和ABC1;CCT8和APJ1;CCT8和ATP11;CCT8和ATP12;CCT8和BTT1;CCT8和CDC37;CCT8和CPR7;CCT8和HSC82;CCT8和KAR2;CCT8和LHS1;CCT8和MGE1;CCT8和MRS11;CCT8和NOB1;CCT8和ECM10;CCT8和SSSA1;CCT8和SSA2;CCT8和SSA3;CCT8和SSA4;CCT8和SSC1;CCT8和SSE2;CCT8和SIL1;CCT8和SLS1;CCT8和ORM1;CCT8和ORM2;CCT8和PER1;CCT8和PTC2;CCT8和PPSE1;CCT8和UBI4;CCT8和HAC1或截短的无内含子HAC1;CNS1和CPR3;CNS1和CPR6;CNS1和ERO1;CNS1和EUG1;CNS1和FMO1;CNS1和HCH1;CNS1和HSP10;CNS1和HSP12;CNS1和HSP104;CNS1和HSP26;CNS1和HSP30;CNS1和HSP42;CNS1和HSP60;CNS1和HSP78;CNS1和HSP82;CNS1和JEM1;CNS1和MDJ1;CNS1和MDJ2;CNS1和MPD1;CNS1和MPD2;CNS1和PDI1;CNS1和PFD1;CNS1和ABC1;CNS1和APJ1;CNS1和ATP11;CNS1和ATP12;CNS1和BTT1;CNS1和CDC37;CNS1和CPR7;CNS1和HSC82;CNS1和KAR2;CNS1和LHS1;CNS1和MGE1;CNS1和MRS11;CNS1和NOB1;CNS1和ECM10;CNS1和SSA1;CNS1和SSA2;CNS1和SSA3;CNS1和SSAA4;CNS1和SSC1;CNS1和SSE2;CNS1和SIL1;CNS1和SLS1;CNS1和ORM1;CNS1和ORM2;CNS1和PER1;CNS1和PTC2;CNS1和PSE1;CNS1和UBI4;CNS1和HAC1或截短的无内含子HAC1;CPR3和CPR6;CPR3和ERO1;CPR3和EUG1;CPR3和FMO1;CPR3和HCH1;CPR3和HSP10;CPR3和HSP12;CPR3和HSP104;CPR3和HSP26;CPR3和HSP30;CPR3和HSP42;CPR3和HSP60;CPR3和HSP78;CPR3和HSP82;CPR3和JEM1;CPR3和MDJ1;CPR3和MDJ2;CPR3和MPD1;CPR3和MPD2;CPR3和PDI1;CPR3和PFD1;CPR3和ABC1;CPR3和APJ1;CPR3和ATP11;CPR3和ATP12;CPR3和BTT1;CPR3和CDC37;CPR3和CPR7;CPR3和HSC82;CPR3和KAR2;CPR3和LHS1;CPR3和MGE1;CPR3和MRS11;CPR3和NOB1;CPR3和ECM10;CPR3和SSA1;CPR3和SSA2;CPR3和SSA3;CPR3和SSA4;CPR3和SSC1;CPR3和SSE2;CPR3和SIL1;CPR3和SLS1;CPR3和ORM1;CPR3和ORM2;CPR3和PER1;CPR3和PTC2;CPR3和PSE1;CPR3和UBI4;CPR3和HAC1或截短的无内含子HAC1;CPR6和ERO1;CPR6和EUG1;CPR6和FMO1;CPR6和HCH1;CPR6和HSP10;CPR6和HSP12;CPR6和HSP104;CPR6和HSP26;CPR6和HSP30;CPR6和HSP42;CPR6和HSP60;CPR6和HSP78;CPR6和HSP82;CPR6和JEM1;CPR6和MDJ1;CPR6和MDJ2;CPR6和MPD1;CPR6和MPD2;CPR6和PDI1;CPR6和PFD1;CPR6和ABC1;CPR6和APJ1;CPR6和ATP11;CPR6和ATP12;CPR6和BTT1;CPR6和CDC37;CPR6和CPR7;CPR6和HSC82;CPR6和KAR2;CPR6和LHS1;CPR6和MGE1;CPR6和MRS11;CPR6和NOB1;CPR6和ECM10;CPR6和SSA1;CPR6和SSA2;CPR6和SSA3;CPR6和SSA4;CPR6和SSC1;CPR6和SSE2;CPR6和SIL1;CPR6和SLS1;CPR6和ORM1;CPR6和ORM2;CPR6和PER1;CPR6和PTC2;CPR6和PSE1;CPR6和UBI4;CPR6和HAC1或截短的无内含子HAC1;ERO1和EUG1;ERO1和FMO1;ERO1和HCH1;ERO1和HSP10;ERO1和HSP12;ERO1和HSP104;ERO1和HSP26;ERO1和HSP30;ERO1和HSP42;ERO1和HSP60;ERO1和HSP78;ERO1和HSP82;ERO1和JEM1;ERO1和MDJ1;ERO1和MDJ2;ERO1和MPD1;ERO1和MPD2;ERO1和PDI1;ERO1和PFD1;ERO1和ABC1;ERO1和APJ1;ERO1和ATP11;ERO1和ATP12;ERO1和BTT1;ERO1和CDC37;ERO1和CPR7;ERO1和HSC82;ERO1和KAR2;ERO1和LHS1;ERO1和MGE1;ERO1和MRS11;ERO1和NOB1;ERO1和ECM10;ERO1和SSA1;ERO1和SSA2;ERO1和SSA3;ERO1和SSA4;ERO1和SSC1;ERO1和SSE2;ERO1和SIL1;ERO1和SLS1;ERO1和ORM1;ERO1和ORM2;ERO1和PER1;ERO1和PTC2;ERO1和PSE1;ERO1和UBI4;ERO1和HAC1或截短的无内含子HAC1;EUG1和FMO1;EUG1和HCH1;EUG1和HSP10;EUG1和HSP12;EUG1和HSP104;EUG1和HSP26;EUG1和HSP30;EUG1和HSP42;EUG1和HSP60;EUG1和HSP78;EUG1和HSP82;EUG1和JEM1;EUG1和MDJ1;EUG1和MDJ2;EUG1和MPD1;EUG1和MPD2;EUG1和PDI1;EUG1和PFD1;EUG1和ABC1;EUG1和AJ1;EUG1和ATP11;EUG1和ATP12;EUG1和BTT1;EUG1和CDC37;EUG1和CPR7;EUG1和HSG82;EUG1和KAR2;EUG1和LHS1;EUG1和MGE1;EUG1和MRS11;EUG1和NOB1;EUG1和ECM10;EUG1和SSA1;EUG1和SSSA2;EUG1和SSA3;EUG1和SSA4;EUG1和SSC1;EUG1和SSE2;EUG1和SIL1;EUG1和SLS1;EUG1和ORM1;EUG1和ORM2;EUG1和PER1;EUG1和PTC2;EUG1和PSE1;EUG1和UBI4;EUG1和HAC1或截短的无内含子HAC1;FMO1和HCH1;FMO1和HSP10;FMO1和HSP12;FMO1和HSP104;FMO1和HSP26;FMO1和HSP30;FMO1和HSP42;FMO1和HSP60;FMO1和HSP78;FMO1和HSP82;FMO1和JEM1;FMO1和MDJ1;FMO1和MDJ2;FMO1和MPD1;FMO1和MPD2;FMO1和PDI1;FMO1和PFD1;FMO1和ABC1;FMO1和APJ1;FMO1和ATP11;FMO1和ATP12;FMO1和BTT1;FMO1和CDC37;FMO1和CPR7;FMO1和HSC82;FMO1和KAR2;FMO1和LHS1;FMO1和MGE1;FMO1和MRS11;FMO1和NOB1;FMO1和ECM10;FMO1和SSA1;FMO1和SSA2;FMO1和SSA3;FMO1和SS4;FMO1和SSC1;FMO1和SSE2;FMO1和SIL1;FMO1和SLS1;FMO1和ORM1;FMO1和ORM2;FMO1和PER1;FMO1和PTC2;FMO1和PSE1;FMO1和UBI4;FMO1和HAC1或截短的无内含子HAC1;HCH1和HSP10;HCH1和HSP12;HCH1和HSP104;HCH1和HSP26;HCH1和HSP30;HCH1和HSP42;HCH1和HSP60;HCH1和HSP78;HCH1和HSP82;HCH1和JEM1;HCH1和MDJ1;HCH1和MDJ2;HCH1和MPD1;HCH1和MPD2;HCH1和PDI1;HCH1和PFD1;HCH1;和ABC1;HCH1和APJ1;HCH1和ATP11;HCH1和ATP12;HCH1和BTT1;HCH1和CDC37;HCH1和CPR7;HCH1和HSC82;HCH1和KAR2;HCH1和LHS1;HCH1和MGE1;HCH1和MRS11;HCH1和NOB1;HCH1和ECM10;HCH1和SSA1;HCH1和SSA2;HCH1和SSA3;HCH1和SSA4;HCH1和SSC1;HCH1和SSE2;HCH1和SIL1;HCH1和SLS1;HCH1和ORM1;HCH1和ORM2;HCH1和PER1;HCH1和PTC2;HCH1和PSE1;HCH1和UBI4;HCH1和HAC1或截短的无内含子HAC1;HSP10和HSP12;HSP10和HSP104;HSP10和HSP26;HSP10和HSP30;HSP10和HSP42;HSP10和HSP60;HSP10和HSP78;HSP10和HSP82;HSP10和JEM1;HSP10和MDJ1;HSP10和MDJ2;HSP10和MPD1;HSP10和MPD2;HSP10和PDI1;HSP10和PFD1;HSP10和ABC1;HSP10和APJ1;HSP10和ATP11;HSP10和ATP12;HSP10和BTT1;HSP10和CDC37;HSP10和CPR7;HSP10和HSC82;HSP10和KAR2;HSP10和LHS1;HSP10和MGE1;HSP10和MRS11;HSP10和NOB1;HSP10和ECM10;HSP10和SSA1;HSP10和SSA2;HSP10和SSA3;HSP10和SSA4;HSP10和SSC1;HSP10和SSE2;HSP10和SIL1;HSP10和SLS1;HSP10和ORM1;HSP10和ORM2;HSP10和PER1;HSP10和PTC2;HSP10和PSE1;HSP10和UBI4;HSP10和HAC1或截短的无内含子HAC1;HSP12和HSP104;HSP12和HSP26;HSP12和HSP30;HSP12和HSP42;HSP12和HSP60;HSP12和HSP78;HSP12和HSP82;HSP12和JEM1;HSP12和MDJ1;HSP12和MDJ2;HSP12和MPD1;HSP12和MPD2;HSP12和PDI1;HSP12和PFD1;HSP12和ABC1;HSP12和APJ1;HSP12和ATP11;HSP12和ATP12;HSP12和BTT1;HSP12和CDC37;HSP12和CPR7;HSP12和HSC82;HSP12和KAR2;HSP12和LHS1;HSP12和MGE1;HSP12和MRS11;HSP12和NOB1;HSP12和ECM10;HSP12和SSA1;HSP12和SSA2;HSP12和SSA3;HSP12和SSA4;HSP12和SSC1;HSP12和SSE2;HSP12和SIL1;HSP12和SLS1;HSP12和ORM1;HSP12和ORM2;HSP12和PER1;HSP12和PTC2;HSP12和PSE1;HSP12和UBI4;HSP12和HAC1或截短的无内含子HAC1;HSP104和HSP26;HSP104和HSP30;HSP104和HSP42;HSP104和HSP60;HSP104和HSP78;HSP104和HSP82;HSP104和JEM1;HSP104和MDJ1;HSP104和MDJ2;HSP104和MPD1;HSP104和MPD2;HSP104和PDI1;HSP104和PFD1;HSP104和ABC1;HSP104和APJ1;HSP104和ATP11;HSP104和ATP12;HSP104和BTT1;HSP104和CDC37;HSP104和CPR7;HSP104和HSC82;HSP104和KAR2;HSP104和LHS1;HSP104和MGE1;HSP104和MRS11;HSP104和NOB1;HSP104和ECM10;HSP104和SSA1;HSP104和SSA2;HSP104和SSA3;HSP104和SSA4;HSP104和SSC1;HSP104和SSE2;HSP104和SIL1;HSP104和SLS1;HSP104和ORM1;HSP104和ORM2;HSP104和PER1;HSP104和PTC2;HSP104和PSE1;HSP104和UBI4;HSP104和HAC1或截短的无内含子HAC1;HSP26和HSP30;HSP26和HSP42;HSP26和HSP60;HSP26和HSP78;HSP26和HSP82;HSP26和JEM1;HSP26和MDJ1;HSP26和MDJ2;HSP26和MPD1;HSP26和MPD2;HSP26和PDI1;HSP26和PFD1;HSP26和ABC1;HSP26和APJ1;HSP26和ATP11;HSP26和ATP12;HSP26和BTT1;HSP26和CDC37;HSP26和CPR7;HSP26和HSC82;HSP26和KAR2;HSP26和LHS1;HSP26和MGE1;HSP26和MRS11;HSP26和NOB1;HSP26和ECM10;HSP26和SSA1;HSP26和SSA2;HSP26和SSA3;HSP26和SSA4;HSP26和SSC1;HSP26和SSE2;HSP26和SIL1;HSP26和SLS1;HSP26和ORM1;HSP26和ORM2;HSP26和PER1;HSP26和PTC2;HSP26和PSE1;HSP26和UBI4;HSP26和HAC1或截短的无内含子HACI;HSP30和HSP42;HSP30和HSP60;HSP30和HSP78;HSP30和HSP82;HSP30和JEM1;HSP30和MDJ1;HSP30和MDJ2;HSP30和MPD1;HSP30和MPD2;HSP30和PDI1;HSP30和PFD1;HSP30和ABC1;HSP30和APJ1;HSP30和ATP11;HSP30和ATP12;HSP30和BTT1;HSP30和CDC37;HSP30和CPR7;HSP30和HSC82;HSP30和KAR2;HSP30和LHS1;HSP30和MGE1;HSP30和MRS11;HSP30和NOB1;HSP30和ECM10;HSP30和SSA1;HSP30和SSA2;HSP30和SSA3;HSP30和SSA4;HSP30和SSC1;HSP30和SSE2;HSP30和SIL1;HSP30和SLS1;HSP30和ORM1;HSP30和ORM2;HSP30和PER1;HSP30和PTC2;HSP30和PSE1;HSP30和UBI4;HSP30和HAC1或截短的无内含子HAC1;HSP42和HSP60;HSP42和HSP78;HSP42和HSP82;HSP42和JEM1;HSP42和MDJ1;HSP42和MDJ2;HSP42和MPD1;HSP42和MPD2;HSP42和PDI1;HSP42和PFD1;HSP42和ABC1;HSP42和APJ1;HSP42和ATP11;HSP42和ATP12;HSP42和BTT1;HSP42和CDC37;HSP42和CPR7;HSP42和HSC82;HSP42和KAR2;HSP42和LHS1;HSP42和MGE1;HSP42和MRS11;HSP42和NOB1;HSP42和ECM10;HSP42和SSA1;HSP42和SSA2;HSP42和SSA3;HSP42和SSA4;HSP42和SSC1;HSP42和SSE2;HSP42和SIL1;HSP42和SLS1;HSP42和ORM1;HSP42和ORM2;HSP42和PER1;HSP42和PTC2;HSP42和PSE1;HSP42和UBI4;HSP42和HAC1或截短的无内含子HAC1;HSP60和HSP78;HSP60和HSP82;HSP60和JEM1;HSP60和MDJ1;HSP60和MDJ2;HSP60和MPD1;HSP60和MPD2;HSP60和PDI1;HSP60和PFD1;HSP60和ABC1;HSP60和APJ1;HSP60和ATP11;HSP60和ATP12;HSP60和BTT1;HSP60和CDC37;HSP60和CPR7;HSP60和HSC82;HSP60和KAR2;HSP60和LHS1;HSP60和MGE1;HSP60和MRS11;HSP60和NOB1;HSP60和ECM10;HSP60和SSA1;HSP60和SSA2;HSP60和SSA3;HSP60和SSA4;HSP60和SSC1;HSP60和SSE2;HSP60和SIL1;HSP60和SLS1;HSP60和ORM1;HSP60和ORM2;HSP60和PER1;HSP60和PTC2;HSP60和PSE1;HSP60和UBI4;HSP60和HAC1或截短的无内含子HAC1;HSP78和HSP82;HSP78和JEM1;HSP78和MDJ1;HSP78和MDJ2;HSP78和MPD1;HSP78和MPD2;HSP78和PDI1;HSP78和PFD1;HSP78和ABC1;HSP78和APJ1;HSP78和ATP11;HSP78和ATP12;HSP78和BTT1;HSP78和CDC37;HSP78和CPR7;HSP78和HSC82;HSP78和KAR2;HSP78和LHS1;HSP78和MGE1;HSP78和MRS11;HSP78和NOB1;HSP78和ECM10;HSP78和SSA1;HSP78和SSA2;HSP78和SSA3;HSP78和SSA4;HSP78和SSC1;HSP78和SSE2;HSP78和SIL1;HSP78和SLS1;HSP78和ORM1;HSP78和ORM2;HSP78和PER1;HSP78和PTC2;HSP78和PSE1;HSP78和UBI4;HSP78和HAC1或截短的无内含子HAC1;HSP82和JEM1;HSP82和MDJ1;HSP82和MDJ2;HSP82和MPD1;HSP82和MPD2;HSP82和PDI1;HSP82和PFD1;HSP82和ABC1;HSP82和APJ1;HSP82和ATP11;HSP82和ATP12;HSP82和BTT1;HSP82和CDC37;HSP82和CPR7;HSP82和HSC82;HSP82和KAR2;HSP82和LHS1;HSP82和MGE1;HSP82和MRS11;HSP82和NOB1;HSP82和ECM10;HSP82和SSA1;HSP82和SSA2;HSP82和SSA3;HSP82和SSA4;HSP82和SSC1;HSP82和SSE2;HSP82和SIL1;HSP82和SLS1;HSP82和ORM1;HSP82和ORM2;HSP82和PER1;HSP82和PTC2;HSP82和PSE1;HSP82和UBI4;HSP82和HAC1或截短的无内含子HAC1;JEM1和MDJ1;JEM1和MDJ2;JEM1和MPD1;JEM1和MPD2;JEM1和PDI1;JEM1和PFD1;JEM1和ABC1;JEM1和APJ1;JEM1和ATP11;JEM1和ATP12;JEM1和BTT1;JEM1和CDC37;JEM1和CPR7;JEM1和HSC82;JEM1和KAR2;JEM1和LHS1;JEM1和MGE1;JEM1和MRS11;JEM1和NOB1;JEM1和ECM10;JEM1和SSA1;JEM1和SSA2;JEM1和SSA3;JEM1和SSA4;JEM1和SSC1;JEM1和SSE2;JEM1和SIL1;JEM1和SLS1;JEM1和ORM1;JEM1和ORM2;JEM1和PER1;JEM1和PTC2;JEM1和PSE1;JEM1和UBI4;JEM1和HAC1或截短的无内含子HAC1;MDJ1和MDJ2;MDJ1和MPD1;MDJ1和MPD2;MDJ1和PDI1;MDJ1和PFD1;MDJ1和ABC1;MDJ1和APJ1;MDJ1和ATP11;MDJ1和ATP12;MDJ1和BTT1;MDJ1和CDC37;MDJ1和CPR7;MDJ1和HSC82;MDJ1和KAR2;MDJ1和LHS1;MDJ1和MGE1;MDJ1和MRS11;MDJ1和NOB1;MDJ1和ECM10;MDJ1和SSA1;MDJ1和SSA2;MDJ1和SSA3;MDJ1和SSA4;MDJ1和SSC1;MDJ1和SSE2;MDJ1和SIL1;MDJ1和SLS1;MDJ1和ORM1;MDJ1和ORM2;MDJ1和PER1;MDJ1和PTC2;MDJ1和PSE1;MDJ1和UBI4;MDJ1和HAC1或截短的无内含子HAC1;MDJ2和MPD1;MDJ2和MPD2;MDJ2和PDI1;MDJ2和PFD1;MDJ2和ABC1;MDJ2和APJ1;MDJ2和ATP11;MDJ2和ATP12;MDJ2和BTT1;MDJ2和CDC37;MDJ2和CPR7;MDJ2和HSC82;MDJ2和KAR2;MDJ2和LHS1;MDJ2和MGE1;MDJ2和MRS11;MDJ2和NOB1;MDJ2和ECM10;MDJ2和SSA1;MDJ2和SSA2;MDJ2和SSA3;MDJ2和SSA4;MDJ2和SSC1;MDJ2和SSE2;MDJ2和SIL1;MDJ2和SLS1;MDJ2和ORM1;MDJ2和ORM2;MDJ2和PER1;MDJ2和PTC2;MDJ2和PSE1;MDJ2和UBI4;MDJ2和HAC1或截短的无内含子HAC1;MPD1和MPD2;MPD1和PDI1;MPD1和PFD1;MPD1和ABC1;MPD1和APJ1;MPD1和ATP11;MPD1和ATP12;MPD1和BTT1;MPD1和CDC37;MPD1和CPR7;MPD1和HSC82;MPD1和KAR2;MPD1和LHS1;MPD1和MGE1;MPD1和MRS11;MPD1和NOB1;MPD1和ECM10;MPD1和SSA1;MPD1和SSA2;MPD1和SSA3;MPD1和SSA4;MPD1和SSC1;MPD1和SSE2;MPD1和SIL1;MPD1和SLS1;MPD1和ORM1;MPD1和ORM2;MPD1和PER1;MPD1和PTC2;MPD1和PSE1;MPD1和UBI4;MPD1和HAC1或截短的无内含子HAC1;MPD2和PDI1;MPD2和PFD1;MPD2和ABC1;MPD2和APJ1;MPD2和ATP11;MPD2和ATP12;MPD2和BTT1;MPD2和CDC37;MPD2和CPR7;MPD2和HSC82;MPD2和KAR2;MPD2和LHS1;MPD2和MGE1;MPD2和MRS11;MPD2和NOB1;MPD2和ECM10;MPD2和SSA1;MPD2和SSA2;MPD2和SSA3;MPD2和SSA4;MPD2和SSC1;MPD2和SSE2;MPD2和SIL1;MPD2和SLS1;MPD2和ORM1;MPD2和ORM2;MPD2和PER1;MPD2和PTC2;MPD2和PSE1;MPD2和UBI4;MPD2和HAC1或截短的无内含子HAC1;PDI1和PFD1;PDI1和ABC1;PDI1和APJ1;PDI1和ATP11;PDI1和ATP12;PDI1和BTT1;PDI1和CDC37;PDI1和CPR7;PDI1和HSC82;PDI1和KAR2;PDI1和LHS1;PDI1和MGE1;PDI1和MRS11;PDI1和NOB1;PDI1和ECM10;PDI1和SSA1;PDI1和SSA2;PDI1和SSA3;PDI1和SSA4;PDI1和SSC1;PDI1和SSE2;PDI1和SIL1;PDI1和SLS1;PDI1和ORM1;PDI1和ORM2;PDI1和PER1;PDI1和PTC2;PDI1和PSE1;PDI1和UBI4;PDI1和HAC1或截短的无内含子HAC1;PFD1和ABC1;PFD1和APJ1;PFD1和ATP11;PFD1和ATP12;PFD1和BTT1;PFD1和CDC37;PFD1和CPR7;PFD1和HSC82;PFD1和KAR2;PFD1和LHS1;PFD1和MGE1;PFD1和MRS11;PFD1和NOB1;PFD1和ECM10;PFD1和SSA1;PFD1和SSA2;PFD1和SSA3;PFD1和SSA4;PFD1和SSC1;PFD1和SSE2;PFD1和SIL1;PFD1和SLS1;PFD1和ORM1;PFD1和ORM2;PFD1和PER1;PFD1和PTC2;PFD1和PSE1;PFD1和UBI4;PFD1和HAC1或截短的无内含子HAC1;ABC1和APJ1;ABC1和ATP11;ABC1和ATP12;ABC1和BTT1;ABC1和CDC37;ABC1和CPR7;ABC1和HSC82;ABC1和KAR2;ABC1和LHS1;ABC1和MGE1;ABC1和MRS11;ABC1和NOB1;ABC1和ECM10;ABC1和SSA1;ABC1和SSA2;ABC1和SSA3;ABC1和SSA4;ABC1和SSC1;ABC1和SSE2;ABC1和SIL1;ABC1和SLS1;ABC1和ORM1;ABC1和ORM2;ABC1和PER1;ABC1和PTC2;ABC1和PSE1;ABC1和UBI4;ABC1和HAC1或截短的无内含子HAC1;APJ1和ATP11;APJ1和ATP12;APJ1和BTT1;APJ1和CDC37;APJ1和CPR7;APJ1和HSC82;APJ1和KAR2;APJ1和LHS1;APJ1和MGE1;APJ1和MRS11;APJ1和NOB1;APJ1和ECM10;APJ1和SSA1;APJ1和SSA2;APJ1和SSA3;APJ1和SSA4;APJ1和SSC1;APJ1和SSE2;APJ1和SIL1;APJ1和SLS1;APJ1和ORM1;APJ1和ORM2;APJ1和PER1;APJ1和PTC2;APJ1和PSE1;APJ1和UBI4;APJ1和HAC1或截短的无内含子HAC1;ATP11和ATP12;ATP11和BTT1;ATP11和CDC37;ATP11和CPR7;ATP11和HSC82;ATP11和KAR2;ATP11和LHS1;ATP11和MGE1;ATP11和MRS11;ATP11和NOB1;ATP11和ECM10;ATP11和SSA1;ATP11和SSA2;ATP11和SSA3;ATP11和SSA4;ATP11和SSC1;ATP11和SSE2;ATP11和SIL1;ATP11和SLS1;ATP11和ORM1;ATP11和ORM2;ATP11和PER1;ATP11和PTC2;ATP11和PSE1;ATP11和UBI4;ATP11和HAC1或截短的无内含子HAC1;ATP12和BTT1;ATP12和CDC37;ATP12和CPR7;ATP12和HSC82;ATP12和KAR2;ATP12和LHS1;ATP12和MGE1;ATP12和MRS11;ATP12和NOB1;ATP12和ECM10;ATP12和SSA1;ATP12和SSA2;ATP12和SSA3;ATP12和SSA4;ATP12和SSC1;ATP12和SSE2;ATP12和SIL1;ATP12和SLS1;ATP12和ORM1;ATP12和ORM2;ATP12和PER1;ATP12和PTC2;ATP12和PSE1;ATP12和UBI4;ATP12和HAC1或截短的无内含子HAC1;BTT1和CDC37;BTT1和CPR7;BTT1和HSC82;BTT1和KAR2;BTT1和LHS1;BTT1和MGE1;BTT1和MRS11;BTT1和NOB1;BTT1和ECM10;BTT1和SSA1;BTT1和SSA2;BTT1和SSA3;BTT1和SSA4;BTT1和SSC1;BTT1和SSE2;BTT1和SIL1;BTT1和SLS1;BTT1和ORM1;BTT1和ORM2;BTT1和PER1;BTT1和PTC2;BTT1和PSE1;BTT1和UBI4;BTT1和HAC1或截短的无内含子HAC1;CDC37和CPR7;CDC37和HSC82;CDC37和KAR2;CDC37和LHS1;CDC37和MGE1;CDC37和MRS11;CDC37和NOB1;CDC37和ECM10;CDC37和SSA1;CDC37和SSA2;CDC37和SSA3;CDC37和SSA4;CDC37和SSC1;CDC37和SSE2;CDC37和SIL1;CDC37和SLS1;CDC37和ORM1;CDC37和ORM2;CDC37和PER1;CDC37和PTC2;CDC37和PSE1;CDC37和UBI4;CDC37和HAC1或截短的无内含子HAC1;CPR7和HSC82;CPR7和KAR2;CPR7和LHS1;CPR7和MGE1;CPR7和MRS11;CPR7和NOB1;CPR7和ECM10;CPR7和SSA1;CPR7和SSA2;CPR7和SSA3;CPR7和SSA4;CPR7和SSC1;CPR7和SSE2;CPR7和SIL1;CPR7和SLS1;CPR7和ORM1;CPR7和ORM2;CPR7和PER1;CPR7和PTC2;CPR7和PSE1;CPR7和UBI4;CPR7和HAC1或截短的无内含子HAC1;HSC82和KAR2;HSC82和LHS1;HSC82和MGE1;HSC82和MRS11;HSC82和NOB1;HSC82和ECM1O;HSC82和SSA1;HSC82和SSA2;HSC82和SSA3;HSC82和SSA4;HSC82和SSC1;HSC82和SSE2;HSC82和SIL1;HSC82和SLS1;HSC82和ORM1;HSC82和ORM2;HSC82和PER1;HSC82和PTC2;HSC82和PSE1;HSC82和UB14;HSC82和HAC1或截短的无内含子HAC1;KAR2和LHS1;KAR2和MGE1;KAR2和MRS11;KAR2和NOB1;KAR2和ECM10;KAR2和SSA1;DAR2和SSSA2;KAR2和SSA3;KAR2和SSA4;KAR2和SSC1;KAR2和SSE2;DAR2和SIL1;KAR2和SLS1;KAR2和ORM1;KAR2和ORM2;KAR2和PER1;KAR2和PTC2;KAR2和PSE1;KAR2和UBI4;KAR2和HAC1或截短的无内含子HAC1;LHS1和MGE1;LHS1和MRS11;LHS1和NOB1;LHS1和ECM10;LHS1和SSA1;LHS1和SSA2;LHS1和SSA3;LHS1和SSA4;LHS1和SSC1;LHS1和SSE2;LHS1和SIL1;LHS1和SLS1;LHS1和ORM1;LHS1和ORM2;LHS1和PER1;LHS1和PTC2;LHS1和PSE1;LHS1和UBI4;LHS1和HAC1或截短的无内含子HAC1;MGE1和MRS11;MGE1和NOB1;MGE1和ECM10;MGE1和SSA1;MGE1和SSA2;MGE1和SSA3;MGE1和SSA4;MGE1和SSC1;MGE1和SSE2;MGE1和SIL1;MGE1和SLS1;MGE1和ORM1;MGE1和ORM2;MGE1和PER1;MGE1和PTC2;MGE1和PSE1;MGE1和UB44;MGE1和HAC1或截短的无内含子HAC1;MRS11和NOB1;MRS11和ECM10;MRS11和SSA1;MRS11和SSA2;MRS11和SSA3;MRS11和SSA4;MRS11和SSC1;MRS11和SSE2;MRS11和SIL1;MRS11和SLS1;MRS11和ORM1;MRS11和ORM2;MRS11和PER1;MRS11和PTC2;MRS11和PSE1;MRS11和UBI4;MRS11和HAC1或截短的无内含子HAC1;NOB1和ECM10;N0B1和SSA1;NOB1和SSA2;NOB1和SSA3;NOB1和SSA4;NOB1和SSC1;NOB1和SSE2;NOB1和SIL1;NOB1和SLS1;NOB1和ORM1;NOB1和ORM2;NOB1和PER1;NOB1和PTC2;NOB1和PSE1;NOB1和UBI4;NOB1和HAC1或截短的无内含子HAC1;ECM10和SSA1;ECM10和SSA2;ECM10和SSA3;ECM10和SSA4;ECM10和SSC1;ECM10和SSE2;ECM10和SIL1;ECM10和SLS1;ECM10和ORM1;ECM10和ORM2;ECM10和PER1;ECM10和PTC2;ECM10和PSE1;ECM10和UBI4;ECM10和HAC1或截短的无内含子HAC1;SSA1和SSA2;SSA1和SSA3;SSA1和SSA4;SSA1和SSC1;SSA1和SSE2;SSA1和SIL1;SSA1和SLS1;SSA1和ORM1;SSA1和ORM2;SSA1和PER1;SSA1和PTC2;SSA1和PSE1;SSA1和UBI4;SSA1和HAC1或截短的无内含子HAC1;SSA2和SSA3;SSA2和SSA4;SSA2和SSC1;SSA2和SSE2;SSA2和SIL1;SSA2和SLS1;SSA2和ORM1;SSA2和ORM2;SSA2和PER1;SSA2和PTC2;SSA2和PSE1;SSA2和UBI4;SSA2和HAC1或截短的无内含子HAC1;SSA3和SSA4;SSA3和SSC1;SSA3和SSE2;SSA3和SIL1;SSA3和SLS1;SSA3和ORM1;SSA3和ORM2;SSA3和PER1;SSA3和PTC2;SSA3和PSE1;SSA3和UBI4;SSA3和HAC1或截短的无内含子HAC1;SSA4和SSC1;SSA4和SSE2;SSA4和SIL1;SSA4和SLS1;SSA4和ORM1;SSA4和ORM2;SSA4和PER1;SSA4和PTC2;SSA4和PSE1;SSA4和UBI4;SSA4和HAC1或截短的无内含子HAC1;SSC1和SSE2;SSC1和SIL1;SSC1和SLS1;SSC1和ORM1;SSC1和ORM2;SSC1和PER1;SSC1和PTC2;SSC1和PSE1;SSC1和UBI4;SSC1和HAC1或截短的无内含子HAC1;SSE2和SIL1;SSE2和SLS1;SSE2和ORM1;SSE2和ORM2;SSE2和PER1;SSE2和PTC2;SSE2和PSE1;SSE2和UBI4;SSE2和HAC1或截短的无内含子HAC1;SIL1和SLS1;SIL1和ORMI;SIL1和ORM2;SIL1和PER1;SIL1和PTC2;SIL1和PSE1;SIL1和UBI4;SIL1和HAC1或截短的无内含子HAC1;SLS1和ORM1;SLS1和ORM2;SLS1和PER1;SLS1和PTC2;SLS1和PSE1;SLS1和UBI4;SLS1和HAC1或截短的无内含子HAC1;ORM1和ORM2;ORM1和PER1;ORM1和PTC2;ORM1和PSE1;ORM1和UBI4;ORM1和HAC1或截短的无内含子HAC1;ORM2和PER1;ORM2和PTC2;ORM2和PSE1;ORM2和UBI4;ORM2和HAC1或截短的无内含子HAC1;PER1和PTC2;PER1和PSE1;PER1和UBI4;PER1和HAC1或截短的无内含子HAC1;PTC2和PSE1;PTC2和UBI4;PTC2和HAC1或截短的无内含子HAC1;PSE1和UBI4;PSE1和HAC1或截短的无内含子HAC1;UBI4和HAC1或截短的无内含子HAC1;TIM9和AHA1;TIM9和CCT2;TIM9和CCT3;TIM9和CCT4;TIM9和CCT5;TIM9和CCT6;TIM9和CCT7;TIM9和CCT8;TIM9和CNS1;TIM9和CPR3;TIM9和CPR6;TIM9和ERO1;TIM9和EUG1;TIM9和FMO1;TIM9和HCH1;TIM9和HSP10;TIM9和HSP12;TIM9和HSP104;TIM9和HSP26;TIM9和HSP30;TIM9和HSP42;TIM9和HSP60;TIM9和HSP78;TIM9和HSP82;TIM9和JEM1;TIM9和MDJ1;TIM9和MDJ2;TIM9和MPD1;TIM9和MPD2;TIM9和PDI1;TIM9和PFD1;TIM9和ABC1;TIM9和APJ1;TIM9和ATP11;TIM9和ATP12;TIM9和BTT1;TIM9和CDC37;TIM9和CPR7;TIM9和HSC82;TIM9和KAR2;TIM9和LHS1;TIM9和MGE1;TIM9和MRS11;TIM9和NOB1;TIM9和ECM10;TIM9和SSA1;TIM9和SSA2;TIM9和SSA3;TIM9和SSA4;TIM9和SSC1;TIM9和SSE2;TIM9和SIL1;TIM9和SLS1;TIM9和ORM1;TIM9和ORM2;TIM9和PER1;TIM9和PTC2;TIM9和PSE1;TIM9和UBI4;TIM9和HAC1或截短的无内含子HAC1;PAM18和AHA1;PAM18和CCT2;PAM18和CCT3;PAM18和CCT4;PAM18和CCT5;PAM18和CCT6;PAM18和CCT7;PAM18和CCT8;PAM18和CNS1;PAM18和CPR3;PAM18和CPR6;PAM18和ERO1;PAM18和EUG1;PAM18和FMO1;PAM18和HCH1;PAM18和HSP10;PAM18和HSP12;PAM18和HSP104;PAM18和HSP26;PAM18和HSP30;PAM18和HSP42;PAM18和HSP60;PAM18和HSP78;PAM18和HSP82;PAM18和JEM1;PAM18和MDJ1;PAM18和MDJ2;PAM18和MPD1;PAM18和MPD2;PAM18和PDI1;PAM18和PFD1;PAM18和ABC1;PAM18和APJ1;PAM18和ATP11;PAM18和ATP12;PAM18和BTT1;PAM18和CDC37;PAM18和CPR7;PAM18和HSC82;PAM18和KAR2;PAM18和LHS1;PAM18和MGE1;PAM18和MRS11;PAM18和NOB1;PAM18和ECM10;PAM18和SSA1;PAM18和SSA2;PAM18和SSA3;PAM18和SSA4;PAM18和SSC1;PAM18和SSE2;PAM18和SIL1;PAM18和SLS1;PAM18和ORM1;PAM18和ORM2;PAM18和PER1;PAM18和PTC2;PAM18和PSE1;PAM18和UBI4;PAM18和HAC1或截短的无内含子HAC1;TCP1和AHA1;TCP1和CCT2;TCP1和CCT3;TCP1和CCT4;TCP1和CCT5;TCP1和CCT6;TCP1和CCT7;TCP1和CCT8;TCP1和CNS1;TCP1和CPR3;TCP1和CPR6;TCP1和ERO1;TCP1和EUG1;TCP1和FMO1;TCP1和HCH1;TCP1和HSP10;TCP1和HSP12;TCP1和HSP104;TCP1和HSP26;TCP1和HSP30;TCP1和HSP42;TCP1和HSP60;TCP1和HSP78;TCP1和HSP82;TCP1和JEM1;TCP1和MDJ1;TCP1和MDJ2;TCP1和MPD1;TCP1和MPD2;TCP1和PDI1;TCP1和PFD1;TCP1和ABC1;TCP1和APJ1;TCP1和ATP11;TCP1和ATP12;TCP1和BTT1;TCP1和CDC37;TCP1和CPR7;TCP1和HSC82;TCP1和KAR2;TCP1和LHS1;TCP1和MGE1;TCP1和MRS11;TCP1和NOB1;TCP1和ECM10;TCP1和SSA1;TCP1和SSA2;TCP1和SSA3;TCP1和SSA4;TCP1和SSC1;TCP1和SSE2;TCP1和SIL1;TCP1和SLS1;TCP1和ORM1;TCP1和ORM2;TCP1和PER1;TCP1和PTC2;TCP1和PSE1;TCP1和UB14;TCP1和HAC1或截短的无内含子HAC1;TIM9和PAM18;TIM9和TCP1;或PAM18和TCP1。
第一、第二和第三重组基因可以,或者可以不,每个单独存在于宿主细胞内的质粒(其可以是,或者可以不是2μm-家族质粒,如上所述)上,或者整合到宿主细胞基因组的染色体上。可以理解的是可使用质粒整合和在染色体上整合的第一、第二和第三重组基因的任何组合。例如,第一、第二和第三重组基因可以,或者可以不,每个单独存在于质粒上,而该质粒可以是,或者可以不是相同的或者不同的质粒。或者,第一重组基因可以,或者可以不存在于质粒上,而第二和第三重组基因可以,或者可以不整合入宿主细胞基因组的染色体上。或者,第一和第二重组基因可以,或者可以不存在于质粒上,而第三重组基因可以,或者可以不整合入宿主细胞基因组的染色体上。或者,第一和第三重组基因可以,或者可以不存在于质粒上,而第二重组基因可以,或者可以不整合入宿主细胞基因组的染色体上。或者,第一和第二重组基因可以,或者可以不整合入宿主细胞基因组的染色体上,而第三重组基因可以,或者可以不存在于质粒上。或者,第一、第二和第三重组基因可以,或者可以不,每个单独整合入宿主细胞基因组的染色体上。
用于此目的的质粒可以是,或者可以不是如下限定的质粒,如2μm-家族质粒。因此,在一个实施方案中,根据本发明第一方面的方法不涉及其中第一、第二和第三重组基因都存在于2μm-家族质粒上的宿主细胞。
因此,作为第二方面,本发明也提供质粒,其中所述质粒包含编码不同分子伴侣的两种不同基因(第一和第二重组基因)。在一个优选的实施方案中,质粒可以,或者可以不,进一步包含编码异源蛋白的基因(第三重组基因),如上面描述的异源蛋白。根据本发明的第二方面的质粒可以是,或者可以不是2μm-家族质粒。
本发明的第三方面提供了使用本发明的第二方面的质粒作为表达载体以增加期望的蛋白质,包括异源蛋白质,如真菌(或者酵母)或脊椎动物蛋白质的产量。期望的蛋白质可以,或者可以不由重组基因编码,所述重组基因作为质粒的一部分存在,或者存在于宿主细胞中的不同质粒上,或者作为整合到宿主细胞的染色体中的转基因存在于宿主细胞中。
本发明的第四部分提供包含如上所述的质粒的宿主细胞。宿主细胞可以,或者可以不,另外包含编码期望的异源蛋白质的重组基因。此处编码期望的异源蛋白质的重组基因(所述的“第三重组基因”)不作为编码第一和第二分子伴侣的同一质粒的部分而存在,宿主细胞可以包含,或者可以不包含不同质粒上的第三重组基因,或者作为整合入宿主细胞染色体的转基因。
作为第五方面,本发明提供包含第一、第二和第三重组基因的宿主细胞。第一、第二和第三重组基因可以,或者可以不,每个单独存在于宿主细胞中的质粒(可以是,或者可以不是2μm-家族质粒,如上所述)上,或者整合入宿主细胞基因组的染色体上。可以理解的是,可以使用质粒和整合到染色体上的第一、第二和第三重组基因的任何组合,如上所述。因此,宿主细胞可以包含,或者可以不包含每个单独位于质粒上的第一、第二和第三重组基因,而且质粒可以是,或者可以不是同一质粒或者不同的质粒。或者,宿主细胞可以包含,或者可以不包含质粒上的第一重组基因,和整合入宿主细胞染色体的第二和第三重组基因。或者,宿主细胞可以包含,或者可以不包含质粒上的第一和第二重组基因,和整合入宿主细胞染色体的第三重组基因。或者,宿主细胞可以包含,或者可以不包含质粒上的第一和第三重组基因,和整合入宿主细胞染色体的第二重组基因。或者,宿主细胞可以包含,或者可以不包含整合入宿主细胞染色体的第一和第二重组基因,和质粒上的第三重组基因。或者,宿主细胞可以包含,或者可以不包含每个单独整合入宿主细胞基因组的染色体的第一、第二和第三重组基因。
2μm-家族质粒:
就本发明而言,质粒可以是,或者可以不是2μm-家族质粒。已显示某些紧密相关的芽殖酵母的菌种包含天然存在的环状双链DNA质粒。这些质粒,统称为2μm-家族质粒,包括来自鲁氏接合酵母(Zygosaccharomyces rouxii,以前被命名为双孢接合酵母,Zygosaccharomyces bisporus)的pSR1、pSB3和pSB4,来自拜列氏接合酵母(Zygosaccharomyces bailii)的质粒pSB1和pSB2、来自发酵接合酵母(Zygosaccharomyces fermentati)的质粒pSM1、来自果蝇克鲁维酵母(Kluyveromyces drosphilarum)的质粒pKD1、来自膜醭毕赤酵母(Pichia membranaefaciens)的未命名质粒(后文称为“pPM1”)和来自酿酒酵母的2μm质粒(如图1所示)和变体(如Scp1、Scp2和Scp3)(Volkert,等,1989,Microbiological Reviews,53,299;Murray等,1988,J.Mol.Biol.200,601;Painting,等,1984,J.Applied Bacteriology,56,331)。
作为一族质粒,这些分子具有一系列共有的特性,它们通常在质粒的相对侧(opposite side)具有两个反向重复序列,大小相似,大约6kbp(从4757到6615-bp),三个开放阅读框,其中一个编码位点特异性的整合酶(FLP)和自主复制的序列(ARS),也称为复制起点(ori),位置接近于一个反向重复序列的末端(Futcher,1988,Yeast,4,27;前面引用的Murray等和Toh-e等,1986,BasicLife Sci.40,425)。尽管它们缺少可识别的DNA序列同源性,它们共享的分子结构和三个开放阅读框的保守功能证明家族成员之间有共同的祖先联系。
上述天然存在的2μm-家族质粒可以,或者可以不用于本发明中,但是本发明不限于使用天然存在的2μm-家族质粒。就本发明而言,2μm-家族质粒可以,或者可以不,如下所述。
2μm-家族质粒是环状、双链的DNA质粒。它通常很小,如3000到10000bp之间,任选地4500到7000bp之间,不包括重组插入的序列。
2μm-家族质粒通常包含至少三个开放阅读框(“ORFs”),每个编码蛋白,所述蛋白在将2μm-家族质粒稳定维持为多拷贝质粒方面发挥功能。由这三个ORFs编码的蛋白质可以被定名为FLP、REP1和REP2。2μm-家族质粒不包含所有三个编码FLP、REP1和REP2的ORFs时,那么应该在另一个质粒上或者通过染色体重组来反向(in trans)提供编码缺失蛋白质的ORFs。
“FLP”蛋白是能够催化在由FLP识别的反向重复序列之间的位点特异性重组的蛋白。反向重复序列被称为FLP重组目标(FRT)位点,且每个序列通常作为更大的反向重复序列的部分而存在(见下文)。优选的FLP蛋白包含由质粒pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒之一编码的FLP蛋白的序列,例如前面引用的Volkert等,Murray等和Painting等所描述的。本发明也包括这些FLP蛋白的变体和片段。“片段”和“变体”是那些保持了天然蛋白质催化相同FRT序列之间的位点特异性重组的能力的片段和变体。这样的变体和片段通常和由质粒pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒之一编码的FLP蛋白具有至少50%、60%、70%、80%、90%、95%、98%、99%,或者更多的同源性。不同的FLP蛋白可以有不同的FRT序列特异性。通常的FRT位点可以包含,或者可以不包含反向重复序列侧翼的核心核苷酸序列。在2μm质粒中,FRT核心序列长8个核苷酸,侧翼的反向重复序列长13个核苷酸(前面引用的Volkert等)。但是由任何给定的FLP蛋白识别的FRT位点可以,或者可以不,与2μm质粒FRT位点不同。
REP1和REP2是涉及细胞分裂过程中质粒拷贝分配的蛋白质,并可以,或者可以不,也在FLP表达的调控中具有作用。在来自不同的2μm-家族质粒的REP1蛋白质之间已经观察到了相当大的序列分散性,但是在由不同的2μm-家族质粒得到的REP2蛋白质之间不可能进行序列比对。优选的REP1和REP2蛋白质包含由质粒pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒之一编码的REP1和REP2蛋白质序列,例如前面引用的Volkert等,Murray等,和Painting等所描述的。本发明也包括这些REP1和REP2蛋白质的变体和片段。REP1和REP2的“片段”和“变体”是那些由质粒代替天然ORF编码时不显著破坏质粒在合适的酵母群体中的多拷贝稳定维持的片段和变体。这样的REP1和REP2的变体和片段通常分别与由质粒pSR1、pSB 1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒之一编码的REP1和REP2蛋白质具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%,或者更多的同源性。
由质粒上的ORFs编码的REP1和REP2蛋白质必须相容。优选的是REP1和REP2蛋白质具有由同一个天然存在的2μm-家族质粒,如pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒编码的REP1和REP2蛋白质的序列,或者其变体或片段。
2μm-家族质粒通常包含两个反向重复序列。反向重复序列可以是任何大小,只要它们每个包含FRT位点(见上文)。反向重复序列通常是高度同源的。它们可以,或者可以不,分享高于50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.5%或者更高的序列同一性。在优选实施方案中,它们是相同的。通常反向重复序列每个长度为200到1000bp。优选的反向重复序列每个长度可以是,或者可以不是200到300bp、300到400bp、400到500
bp、500到600bp、600到700bp、700到800bp、800到900bp,或者900到1000bp。特别优选的反向重复序列是质粒pSR1(959bp)、pSB1(675bp)、pSB2(477bp)、pSB3(391bp)、pSM1(352bp)、pKD1(346bp)、2μm质粒(599bp)、pSB4或者pPM1上的反向重复序列。
反向重复序列可以是,或者可以不是变化的。然而,每个反向重复序列中FRT位点的序列应该与由质粒编码的FLP蛋白的特异性相容,从而使编码的FLP蛋白能够起到催化质粒的反向重复序列之间的位点特异性重组的作用。反向重复序列之间的重组(和由此FLP蛋白识别质粒上FRT位点的能力)可以通过本领域公知的方法确定。例如,在利于FLP表达的条件下,可以通过检验质粒中限制性谱(restriction profile)的变化来检验酵母细胞中的质粒,所述的变化是由质粒区域的方向相对于质粒其它区域的变化导致的。检测到限制性谱的变化说明FLP蛋白能够识别质粒中的FRT位点,因此每个反向重复序列中的FRT位点都与由质粒编码的FLP蛋白的特异性相容。
在特别优选的实施方案中,反向重复序列,包括FRT位点源自与编码FLP蛋白的ORF相同的2μm-家族质粒,所述ORF如pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1或者2μm质粒。
反向重复序列通常定位于2μm-家族质粒以使反向重复序列之间确定的两个区域(如2μm质粒中称为UL和US的区域)具有大致类似的大小,不包括外源引入的序列,如转基因。例如,两个区域中的一个可以具有,或者可以不具有相当于另一个区域长度的至少40%、50%、60%、70%、80%、90%、95%或者更多,高达100%的长度。
2μm-家族质粒通常包含编码FLP的ORF和一个反向重复序列(可任意命名为“IR1”,以与下段提到的其它反向重复序列相区别),它们以这样的方式并置,以使IR1出现在FLP ORF的远端(distal end),而无任何插入的编码序列,如2μm质粒中所见到的。此上下文中,我们用“远端”表示FLP ORF与启动子启动其转录的末端相对的末端。在优选的实施方案中,FLP ORF的远端与IR1重叠。
2μm-家族质粒通常包含编码REP2的ORF和其它反向重复序列(可任意命名为“IR2”,以与前一段提到的IR1相区别),它们以这样的方式并置,以使IR2出现在REP2 ORF的远端,而无任何插入的编码序列,如2μm质粒中所见到的。此上下文中,我们用“远端”表示REP2 ORF与启动子启动其转录的末端相对的末端。
在一个实施方案中,编码REP2和FLP的ORF可以,或者可以不,与2μm-家族质粒的反向重复序列之间确定的两个区域位于同样的区域上,所述的同样区域可为那两个区域中较大的或者较小的(如果两个区域之间的大小有任何差异)。
在一个实施方案中,编码REP2和FLP的ORF可以,或者可以不,由不同的启动子转录。
通常,2μm-家族质粒的反向重复序列之间确定的区域(如2μm质粒中称为UL和US的区域)可以包含,或者可以不包含不多于两个编码蛋白质的内源基因,所述蛋白质在将2μm-家族质粒稳定维持为多拷贝质粒中起作用。因此在优选的实施方案中,质粒的反向重复序列之间确定的一个区域可以包含,或者可以不包含不多于编码FLP和REP2、FLP和REP1、或者REP1和REP2的ORF作为内源编码序列。
2μm-家族质粒通常包含复制起点(也称作“自主复制序列”-“ARS”),其通常是双向的。任何合适的ARS序列都可以存在。酵母染色体复制起点的通常的共有序列可以是,或者可以不是适合的(Broach等,1982,Cold Spring HarborSymp.Quant.Biol.,47,1165-1174;Williamson,Yeast,1985,1,1-14)。优选的ARS包括那些从pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒中分离的ARS。
因此,优选的2μm-家族质粒可以包含,或者可以不包含编码FLP、REP1和REP2的ORF,两个反向重复序列,每个反向重复序列都包含ARS序列和与编码的FLP蛋白相容的FRT位点。优选地,FRT位点源自与编码的FLP蛋白的序列相同的2μm-家族质粒。更优选地,编码的REP1和REP2蛋白质的序列源自彼此相同的2μm-家族质粒。甚至更优选地,FRT位点源自与编码的FLP、REP1和REP2蛋白质的序列相同的2μm-家族质粒。还更优选地,编码FLP、REP1和REP2的ORF序列,和反向重复序列(包括FRT位点)源自相同的2μm-家族质粒。此外,ARS位点可以,或者可以不,源自与FLP、REP1和REP2的一个或多个ORF相同的2μm-家族质粒,和反向重复序列(包括FRT位点)。
术语“源自”包括与来源的序列具有相同序列的序列。然而,其变体和片段,如上文所述,也包括在内。例如,与天然存在的基因相比,具有源自2μm质粒的FLP基因的序列的FLP基因可以具有,或者可以不具有修饰的启动子或其它调控序列。另外或可替换地,具有源自2μm质粒的FLP基因的序列的FLP基因可以,或者可以不,在开放阅读框中具有修饰的核苷酸序列,所述核苷酸序列可以编码,或者可以不编码与天然存在的基因相同的蛋白质,或可以编码,或者可以不编码修饰的FLP蛋白质。同样的考虑适用于具有源自特殊来源的序列的2μm-家族质粒上的其它序列。
任选地,2μm-家族质粒可以包含,或者可以不包含源自2μm质粒的STB区域的区域(也称作REP3),如前面引用的Volkert等中所限定的。本发明的2μm-家族质粒中的STB区域可以包含,或者可以不包含两个或者更多个串联重复序列(tandem repeat sequence),如三个、四个、五个或者更多。或者,不存在串联重复序列。串联重复的长度可为任意大小,如10、20、30、40、50、60、70、80、90、100bp或者更长。2μm质粒的STB区域中的串联重复长为62bp。串联重复序列不一定相同。可以容许有微小的序列变化。可以,或者可以不,优选地选择来自与REP1和REP2 ORF之一或两者相同的质粒的STB区域。STB区域被认为是顺式作用元件(cis-acting element),优选地不被转录。
任选地,2μm-家族质粒可以包含,或者可以不包含额外的编码蛋白质的ORF,所述蛋白质在将2μm-家族质粒稳定维持为多拷贝质粒中起作用。可以将额外的蛋白质命名为RAF或者D。编码RAF或D基因的ORF可见于例如2μm质粒和pSM1上。因此RAF或D ORF可以包含适合编码由2μm质粒或pSM1编码的RAF或D基因ORFs的蛋白质产品,或其变体和片段的序列。因此2μm质粒或pSM1的RAF或D基因的ORFs蛋白质产品的变体和片段也包括在本发明中。2μm质粒或pSM1的RAF或D基因的蛋白质产品的“变体”和“片段”是那些由2μm质粒或pSM1代替天然ORF编码时不会破坏合适的酵母群体中质粒的稳定多拷贝维持的变体和片段。这样的变体和片段通常与由2μm质粒或pSM1编码的RAF或D基因ORFs的蛋白质产品具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或者更高的同源性。
天然存在的2μm-家族质粒可以是,或者可以不是优选的。天然存在的2μm-家族质粒是具有上述特点的任何质粒,这些质粒在酵母中天然存在,即未进行重组修饰以包括异源序列。任意地,天然存在的2μm-家族质粒选自从鲁氏接合酵母得到的pSR1(登录号X02398)、pSB3(登录号X02608)或者pSB4,均从拜列氏接合酵母得到的pSB1或pSB2(登录号NC_002055或M18274),从发酵接合酵母得到的pSM1(登录号NC_002054),从果蝇克鲁维酵母得到的pKD1(登录号X03961),从膜醭毕赤酵母得到的pPM1,或者优选从酿酒酵母得到的2μm质粒(登录号NC_001398或者J01347)。本段的登录号指NCBI保藏物。
2μm质粒(图1)是6,318-bp的双链DNA质粒,以每个单倍体基因组60-100个拷贝内生于大多数酿酒酵母菌株中。2μm质粒包含小独特(smallunique,US)区和大独特(large unique,UL)区,通过两个599-bp的反向重复序列分隔。反向重复序列的位点特异性重组导致体内质粒在A形式和B形式之间转变(Volkert & Broach,1986,Cell,46,541)。2μm的这两种形式仅在它们的独特区的相对方向上有差异。
虽然从酿酒酵母克隆的2μm质粒(也称作Scp1)的DNA测序给出6,318-bp的大小(Hartley和Donelson,1980,Nature,286,860),已知2μm、Scp2和Scp3的其它略小的变体,分别作为在称为STB的区域中125-bp和220-bp小缺失的结果而存在(Cameron等,1977,Nucl.Acids Res.,4,1429:Kikuchi,1983,Cell,35,487和Livingston & Hahne,1979,Proc.Natl.Acad.Sci.USA,76,3727)。在一项研究中,世界上大约80%的天然酵母菌株包含与2μm同源的DNA(通过Southem印迹分析)(Hollenberg,1982,Current Topics inMicrobiology and Immunobiology,96,119)。此外,酿酒酵母和卡尔酵母中发现的2μm质粒的天然群体中存在变异(遗传多态性),NCBI序列(登录号NC_001398)为一个实例。
2μm质粒具有核定位(nuclear localisation)并表现出高水平的有丝分裂稳定性(Mead等,1986,Molecular & GeneralGenetics,205,417)。2μm质粒的内在稳定性由质粒编码的拷贝数扩增和分配机制产生,这些机制在嵌合载体的发展过程中可为有害的(compromised)(Futcher & Cox,1984,J.Bacteriol.,157,283;Bachmair & Ruis,1984,Monatshefte für Chemie,115,1229)。包含2μm质粒的酵母菌株被称为[cir+],而不包含2μm质粒的酵母菌株被称为[cir0]。
2μm质粒的US区包含REP2和FLP基因,而UL区包含REP1和D (也称作RAF)基因、STB-基因座和复制起点(Broach & Hicks,1980,Cell,21,501;Sutton & Broach,1985,Mol.Cell.Biol.,5,2770)。Flp重组酶与反向重复序列中的FRT-位点(Flp识别目标)结合以介导位点特异性重组,这是体内天然质粒扩增和质粒拷贝数控制所必需的(Senecoff等,1985,Proc.Natl.Acad.Sci.U.S.A.,82,7270;Jayaram,1985,Proc.Natl.Acad Sci.U.S.A.,82,5875)。2μm-家族质粒的拷贝数可以受到Flp重组酶活性变化的显著影响(Sleep等,2001,Yeast,18,403;Rose & Broach,1990,Methods Enzymol.,185,234)。Rep1和Rep2蛋白质介导质粒聚集,尽管它们的作用模式是不清楚的(Sengupta等,2001,J.Bacteriol.,183,2306)。它们也抑制FLP基因的转录(Reynolds等,1987,Mol.Cell.Biol.,7,3566)。
2μm质粒的FLP和REP2基因从不同的启动子转录,它们之间显然没有确定的插入序列。FLP和REP2转录物都在反向重复序列中相同的序列基序(motif),分别在它们的翻译终止密码子之后的24-bp和178-bp处终止(Sutton&Broach,1985,Mol.Cell.Biol.,5,2770)。
在FLP的情况下,C末端编码序列也位于反向重复序列中。此外,两个反向重复序列在599bp内高度保守,这一特性被认为对于在体内有效地复制和扩增质粒是有利的,尽管只有FRT-位点(小于65-bp)对体外的位点特异性重组是必需的(Senecoff等,1985,Proc.Natl.Acad.Sci.U.S.A.,82,7270;Jayaram,1985,Proc.Natl.Acad.Sci.U.S.A.,82,5875;Meyer-Leon等,1984,Cold SpringHarbor Symposia On Quantitative Biology,49,797)。Flp的关键催化残基是具有由组氨酸-309和组氨酸345促进的链剪切的精氨酸-308和酪氨酸-343(其为必需的)(Prasad等,1987,Proc.Natl.Acad Sci.U.S.A.,84,2189;Chen等,1992,Cell,69,647;Grainge等,2001,J.Mol.Biol.,314,717)。
描述了Rep2中的两个功能域。残基15-58形成了Rep1-结合域,残基50-296包含自结合和STB-结合区(Sengupta等,2001,J Bacteriol.,183,2306)。
缺少2μm质粒的许多必需功能区,但保留了功能顺式元件ARS和STB的2μn的嵌合或大缺失突变衍生物,在细胞分裂时不能有效地在母细胞和子细胞之间分配。如果这些功能以反式提供,如通过提供宿主,如[cir+]宿主中的功能性2μm质粒,这样的质粒能产生上述作用(can do so)。
先前已将目标基因插入2μm质粒的UL-区中。例如,参见EP 0286424中的质粒pSAC3U1和WO 2005/061718的图2中显示的质粒,其中包括β-内酰胺酶基因(氨苄青霉素抗性)、LEU2选择性标记和寡核苷酸接头(linker),将后两个插入2μm-样分解载体pSAC3(参见EP 0286424)的UL-区中唯一的SnaBI位点中。XbaI位点之间包含氨苄青霉素抗性基因的大肠杆菌DNA在转化入酵母后从WO 2005/061718中图2所示的质粒上丢失。这在Chinery &Hinchliffe,1989,Curr.Genet.,16,21和EP 0286424中都有描述,其中这些类型的载体被命名为“分解载体(disintegration vector)”。在接头中的NotI-位点可以插入其它的多核苷酸(Sleep等,1991,Biotechnology (NY),9,183)。
2μm质粒中的其它插入位点在本领域中是公知的,包括Rose & Broach(1990,Methods Enzymol.,185,234-279)中描述的那些,如质粒pCV19、pCV20、CVneo,其利用FLP中EcoRI的插入;质粒pCV21、pGT41和pYE,其利用D中的EcoRI作为插入位点;质粒pHKB52,其利用D中的PstI作为插入位点;质粒pJDB248,其利用D中的PstI和D中的EcoRI的插入;质粒pJDB219,其使用其中D中的PstI和FLP中的EcoRI作为插入位点;质粒G18、质粒pAB 18,其利用FLP中的ClaI的插入;质粒pGT39和pA3、质粒pYT11、pYT14和pYT11-LEU,其使用D中的PstI作为插入位点;和质粒PTY39,其使用FLP中的EcoRI作为插入位点。其它2μm质粒包括pSAC3、pSAC3U1、pSAC3U2、pSAC300、pSAC310、pSAC3C1、pSAC3PL1、pSAC3SL4和pSAC3SC1,在EP 0 286 424和Chinery & Hinchliffe(1989,Curr.Genet.,16,21-25)中描述,其也描述了PstI、EagI或SnaBI作为适当的2μm插入位点。更多的2μm质粒包括pAYE255、pAYE316、pAYE443、pAYE522(Kerry-Williams等,1998,Yeast,14,161-169)、pDB2244(WO 00/44772)和pAYE329(Sleep等,2001,Yeast,18,403-421)。
在一个优选实施方案中,将一个或者多个基因插入2μm-家族质粒上ARS序列附近的未转录区中。例如,在从酿酒酵母中获得的2μm质粒中,ARS序列附近的未转录区从D基因末端延伸至ARS序列的开始。Chinery &Hinchliffe,1989,Curr.Genet.,16,21-25中描述了在SnaBI(复制序列ARS起点附近)的插入。技术人员将理解的是,基因插入也可以在Chinery & Hinchliffe中描述的未转录区中在SnaBI位点的相邻位置进行。
在另一个优选实施方案中,2μm-家族质粒中的REP2和FLP基因每个都有邻近它们的反向重复序列,并将一个或多个基因插入2μm-家族质粒中REP2基因或FLP基因最后的功能密码子之后的第一个碱基和邻近所述基因的反向重复序列中FRT位点之前的最后一个碱基之间的区域。REP2基因或FLP基因最后的功能密码子是基因开放阅读框中的密码子,所述基因在基因启动子下游最远处,所述基因启动子被终止密码子代替将导致质粒的多拷贝稳定性的不可接受的损失,如此处所述。因此,通过多核苷酸序列的插入、缺失或取代在REP2或FLP任一基因中最后的功能密码子下游的任一点破坏REP2或FLP基因,将不会导致质粒的多拷贝稳定性的不可接受的损失。
例如,可以在密码子59之后破坏2μm质粒的REP2基因,而且可以在密码子344之后破坏2μm质粒的FLP基因,每个都不会带来质粒的多拷贝稳定性的损失。可以通过制备FLP或REP2基因的质粒突变体,然后进行此处提出的下述测试来常规地确定其它2μm-家族质粒的同义基因(equivalentgene)中最后的功能密码子,从而确定质粒是否保持多拷贝稳定性。因此,WO2005/061719中所述的质粒插入位点可以,或者可以不,用于携带根据本发明的任何方面的一个或多个重组基因。
可以用如Chinery & Hinchliffe(1989,Curr.Genet.,16,21-25)所述的测试确定质粒是否保留了多拷贝稳定性。对于在Chinery & Hinchliffe(1989,Curr.Genet.,16,21-25)中描述的非选择性培养基(YPD,也叫YEPD)中不生长的酵母,可以使用其它合适的非选择性培养基。质粒稳定性可以定义为在确定的传代数目后,对选择性标记保持原养型的细胞的百分比。传代数目将优选地足以显示对照质粒,如pSAC35或pSAC310之间的差异,或者显示与这样的对照质粒的可比较的稳定性。传代数目可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100或更多。优选较高的数目。可接受的质粒稳定性可以是1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或基本上100%。优选较高的百分比。技术人员将理解的是,尽管质粒在非选择性培养基上生长时的稳定性小于100%,但是质粒在选择性培养基中培养时仍然有用。例如,当按照WO 2005/061719的实施例2的测试确定实施例中描述的质粒pDB2711稳定性时,其为仅仅10%稳定的,但是在选择性生长条件下的摇瓶培养中,在重组转铁蛋白生产能力上提供了15倍增加。
因此一个或多个基因插入可以,或者可以不,出现在REP2基因最后的功能密码子之后的第一个碱基和邻近所述基因的反向重复序列中FRT位点之前的最后一个碱基之间,优选出现在反向重复序列的第一个碱基和FRT位点之前的最后一个碱基之间,更优选出现在REP2基因的翻译终止密码子之后和FRT位点前的最后一个碱基之前的位置。
另外或可替换地,一个或多个基因插入可以,或者可以不,出现在FLP基因最后的功能密码子之后的第一个碱基和邻近所述基因的反向重复序列中FRT位点之前的最后一个碱基之间,优选出现在反向重复序列的第一个碱基和FRT位点之前的最后一个碱基之间,更优选出现在FLP编码序列末端之后的第一个碱基和FRT位点前的最后一个碱基之间,如出现在FLP编码序列末端之后的第一个碱基。
在一个优选实施方案中,其中2μm-家族质粒基于酿酒酵母的2μm质粒,是本领域所知的分解载体(例如,参见EP 286 424,其内容通过引用并入本文)。分解载体可以是,或者可以不是2μm质粒载体,其包含意欲通过重组丢失的DNA序列、三个2μm FRT位点,其中一对FRT位点处于正向(in directorientation),其它两对处于反向(in indirect orientation),以及目标DNA序列(如大肠杆菌复制起点和细菌选择性标记),待丢失的所述序列位于处于反向的所述位点之间。
因此,待丢失的序列可以包含,或者可以不包含选择性标记DNA序列。
优选的分解载体可以包含,或者可以不包含另外携带下述序列的完整的2μm质粒:(i)载体在细菌宿主中繁殖所必需的细菌质粒DNA序列;(ii)另外的2μm FRT位点;和酵母转化的选择性标记DNA序列;所述细菌质粒DNA序列存在于和另外的FRT位点产生于在2μm质粒的两个反向重复序列之一中的限制性位点,如XbaI,所述另外的FRT位点相对于所述的一个重复序列的内源FRT位点处于正向,且细菌质粒DNA序列夹心在另外的FRT位点和所述的一个重复序列的内源FRT位点之间。在优选的分解载体中,所有细菌质粒DNA序列可以,或者可以不,如所述被夹在中间。特别优选的2μm质粒载体基本上具有如EP 286424中所示的pSAC3的构型。
此处使用的术语“分解载体”也包括US 6,451,559中描述的质粒,该文献的内容通过引用并入本文。因此分解载体可以是,或者可以不是2μm载体,其除了编码非酵母多肽的DNA序列外不含有细菌(特别是大肠杆菌)复制起点,或者更优选不包含细菌(特别是大肠杆菌)序列,优选地,所述载体中的所有DNA除了编码非酵母多肽的DNA序列外,是酵母衍生的DNA。
本发明所述的期望的蛋白质和其它蛋白质:
如本文使用的术语“蛋白质”和“期望的蛋白质”包括所有天然和非天然的蛋白质、多肽和肽。就本发明而言,“异源蛋白质”是由如上所述的“重组基因”编码的蛋白质。“异源蛋白质”可以,或者可以不,与所用表达系统(我们使用“表达系统”包括了宿主细胞的基因组(通常是染色体)或质粒的含义,在所述宿主细胞的基因组中“重组基因”整合到染色体上,而在所述质粒中“重组基因”由质粒编码)中天然存在的一个或多个其它基因编码的蛋白质在序列上相同。例如,在由2μm-家族质粒上携带的“重组基因”编码的“异源蛋白质”的上下文中,“异源蛋白质”可以是,或者可以不是这样的蛋白质,其不由2μm-家族质粒天然地编码,也可以描述为“非2μm-家族质粒蛋白质”。为了方便起见,术语“异源蛋白质”和“非2μm-家族质粒蛋白质”在本申请中同义地使用。任选地因此,当由2μm-家族编码时,异源蛋白质不是FLP、REP1、REP2,或者由从鲁氏接合酵母中获得的pSR1、pSB3或者pSB4、均从拜列氏接合酵母中获得的pSB1或pSB2、从发酵接合酵母中获得的pSM1、从果蝇克鲁维酵母中获得的pKD1、从膜醭毕赤酵母中获得的pPM1或从酿酒酵母中获得的2μm质粒中的任何一个编码的RAF/D蛋白质。
编码期望的异源或其它蛋白质的基因包括编码异源蛋白质的多核苷酸序列(通常根据任何给定生物的标准密码子使用方法),指定的开放阅读框(ORF)。基因可以,或者可以不,另外包含一些不编码开放阅读框的多核苷酸序列(称为“非编码区”)。
基因中的非编码区可以包含,或者可以不包含一个或多个与ORF操作相连的调控序列,其允许开放阅读框的转录和/或生成的转录物的翻译。
术语“调控序列”指调节(即,促进或减少)与其可操作连接的ORF的表达(即,转录和/或翻译)的序列。调控区通常包括启动子、终止子、核糖体结合位点等。技术人员将理解的是,调控区的选择取决于所用的表达系统。例如,启动子可以是,或者可以不是组成型或诱导型的,而且可以是,或者可以不是细胞-或组织-类型特异性的或非特异性的。
合适的调控区的长度可以是,或者可以不是5bp、10bp、15bp、20bp、25bp、30bp、35bp、40bp、45bp、50bp、60bp、70bp、80bp、90bp、100bp、120bp、140bp、160bp、180bp、200bp、220bp、240bp、260bp、280bp、300bp、350bp、400bp、450bp、500bp、550bp、600bp、650bp、700bp、750bp、800bp、850bp、900bp、950bp、1000bp、1100bp、1200bp、1300bp、1400bp、1500bp或者更长。
本领域的那些技术人员将识别编码分子伴侣,例如PDI的基因,可以或者可以不,另外包含非编码区和/或调控区。这样的非编码区和调控区不限于与分子伴侣ORF正常关联的天然的非编码区和/或调控区。
当表达系统是酵母,如酿酒酵母时,对于酿酒酵母合适的启动子包括那些与如下基因有关的启动子:PGK1基因、GAL1或GAL10基因、TEF1、TEF2、PYK1、PMA1、CYC1、PHO5、TRP1、ADH1、ADH2、如下酶的基因:3-磷酸甘油醛脱氢酶、己糖激酶、丙酮酸脱羧酶、磷酸果糖激酶、磷酸丙糖异构酶、磷酸葡萄糖异构酶、葡萄糖激酶、α-交配因子信息素、a-交配因子信息素、PRB1启动子、PRA1启动子、GPD1启动子和包括部分5’调控区与其它启动子的部分5’调控区或与上游活化位点的杂合体的杂合启动子(如EP-A-258067的启动子)。
合适的转录终止信号是本领域中熟知的。当宿主细胞是真核细胞时,转录终止信号任选地源自真核细胞基因的3’侧翼序列(flanking sequence),其包含用于转录终止和聚腺苷酸化的适当信号。合适的3’侧翼序列可以,或者可以不,例如,是与所用的表达控制序列天然相连的基因的那些序列,即可以,或者可以不,与启动子相对应。或者,它们可以不同。在那种情况下,而且其中宿主是酵母,任选为酿酒酵母时,酿酒酵母ADH1、ADH2、CYC1或PGK1基因的终止信号是优选的。
基因,如编码分子伴侣(如PDI1)或期望的蛋白质(如异源的期望的蛋白质)的基因,其启动子和开放阅读框侧翼连接转录终止序列,以使转录终止序列位于启动子和开放阅读框的上游和下游,以防止转录通读进入邻近的基因,如2μm基因中,反之亦然,这可以是,或者可以不是有益的。
在一个实施方案中,酵母如酿酒酵母中有利的调控序列包括:酵母启动子(如酿酒酵母PRB1启动子),如EP 431 880中教导的;和转录终止子,任选为来自酵母ADH1的终止子,如EP 60 057中教导的。任选地,载体并入了至少两个翻译终止密码子。
非编码区并入一个以上编码翻译终止密码子,如UAA、UAG或者UGA的DNA序列,以使翻译通读(read-through)最小化,并由此避免产生延长的非天然融合蛋白,这可以是,或者可以不是有益的。翻译终止密码子UAA是优选的。
术语“可操作连接”其含义中包括调控序列位于基因中的任何非编码区内,以使其与ORF形成联系,允许调控区以它预期的方式对ORF产生作用。因此与“可操作连接”于ORF的调控区以这样的方式定位,以使调控区能够以预期的方式,在与调控序列相容的条件下影响ORF的转录和/或翻译。
在一个优选实施方案中,分泌期望的蛋白质(如异源的期望的蛋白质)。在此情况下,编码分泌前导序列的序列,其如WO 90/01063中教导包含大多数天然HSA分泌前导序列,加上小部分酿酒酵母α-交配因子分泌前导序列,可以,或者可以不,包括在开放阅读框中。
或者,期望的蛋白质(如异源的期望的蛋白质)可以是,或者可以不是胞内的。
期望的蛋白质(如异源的期望的蛋白质)可以包含,或者可以不包含真核蛋白质的序列,或者其片段或变体。合适的真核生物包括真菌、植物和动物。在一个实施方案中,异源蛋白质可以是,或者可以不是真菌蛋白质,如酵母蛋白质。在另一个优选实施方案中,期望的蛋白质(如异源的期望的蛋白质)可以是,或者可以不是动物蛋白质。代表性的动物包括脊椎动物和无脊椎动物。代表性的脊椎动物包括哺乳动物,如人和非人哺乳动物。
因此期望的蛋白质(如异源的期望的蛋白质)可以包含,或者可以不包含酵母蛋白质的序列。例如,它可以包含,或者可以不包含来自与得到2μm-家族质粒的宿主相同的宿主中的酵母蛋白质序列,特别是如果将编码异源蛋白质的基因整合入所述2μm-家族质粒时。本领域的那些技术人员将识别本发明的方法、用途或者质粒可以包含,或者可以不包含编码一种以上异源蛋白质、一种以上分子伴侣,或者一种以上异源蛋白质和一种以上分子伴侣的DNA序列。
在另一个实施方案中,期望的蛋白质(如期望的异源蛋白质)可以包含,或者可以不包含下述蛋白质的序列:白蛋白、单克隆抗体、依托泊苷(etoposide)、血清蛋白(如凝血因子)、antistasin、蜱抗凝肽、转铁蛋白、乳铁蛋白、内皮他丁、血管他丁、胶原、免疫球蛋白或基于免疫球蛋白的分子或每一种的片段(如Small Modular ImmunoPharmaceuticalTM(“SMIP”)或dAb,Fab’片段,F(ab’)2,scAb,scFv或scFv片段)、Kunitz域蛋白(如WO 03/066824中描述的那些,带有或者没有白蛋白融合)、干扰素、白介素、IL10、IL11、IL12、干扰素α种类和亚种、干扰素β种类和亚种、干扰素γ种类和亚种、瘦素(leptin)、CNTF、CNTFAx15、IL1受体拮抗剂、红细胞生成素(EPO)和EPO模拟物、血小板生成素(TPO)和TPO模拟物、prosaptide、cyanovirin-N、5-螺旋、T20肽、T1249肽、HIV gp41、HIV gp120、尿激酶、尿激酶原、tPA、水蛭素、血小板衍生的生长因子、甲状旁腺素、胰岛素原、胰岛素、胰高血糖素、胰高血糖素样肽、胰岛素样生长因子、降钙素、生长激素、转化生长因子β、肿瘤坏死因子、G-CSF、GM-CSF、M-CSF、FGF、以活化前和活化形式存在的凝结因子,包括但不限于血纤维蛋白溶酶原、纤维蛋白原、凝血酶、前凝血酶、凝血酶原、血管性血友病因子、α1-抗胰蛋白酶、血纤维蛋白溶酶原活化剂、因子VII、因子VIII、因子IX、因子X和因子XIII、神经生长因子、LACI、血小板衍生的内皮细胞生长因子(PD-ECGF)、葡萄糖氧化酶、血清胆碱酯酶、抑肽酶、淀粉样前体蛋白、间-α胰蛋白酶抑制剂、抗凝血酶III、载脂蛋白类、蛋白质C、蛋白质S、代谢物、抗生素或者任何上面的变体或片段。
在上述列出的蛋白质的上下文中,“变体”指其中一个或多个位置具有氨基酸插入、缺失或者保守或者不保守取代的蛋白质,只要这样的变化得到的蛋白质的基本性质,如酶活性或受体结合(典型活性和比活性)、热稳定性、在一定pH范围内的活性(pH稳定性)没有显著的变化。此上下文中的“显著”指本领域一名技术人员能够判定变体的性质可仍然不同,但与初始蛋白质的性质相比将是明显的。
“保守取代”是预定的组合,如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;和Phe、Tyr、Trp。优选的保守取代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;和Phe、Tyr。
“变体”通常与得到它的多肽具有至少25%、至少50%、至少60%或至少70%,优选至少80%,更优选至少90%,甚至更优选至少95%,还更优选至少99%,最优选至少99.5%的序列同一性。
可以用合适的计算机程序,例如威斯康辛大学遗传计算组的GAP程序,来确定两个多肽之间的百分比序列同一性,而且可理解的是,相对于已将其序列进行了最佳比对的多肽来计算百分比同一性。
可替换地,可以使用Clustal W程序(Thompson等,(1994)Nucleic AcidsRes.,22(22),4673-80)进行序列比对。所用参数可以,或者可以不,如下所述:
●快速配对比对参数:K-tuple(字)大小;1,窗口大小;5,空隙罚分(gappenalty);3,顶部对角线(top diagonal)数;5。评分方法:x百分比。
●多重比对参数:缺口开放罚分(gap open penalty);10,缺口延伸罚分(gapextension penalty);0.05。
●评分矩阵:BLOSUM。
这样的变体可以是,或者可以不是天然的或者使用本领域所熟知的蛋白质工程和定点诱变方法制备的。
在上述列出的蛋白质的上下文中,“片段”指其中在一个或多个位点具有缺失的蛋白质。因此片段可以包含,或者可以不包含完全成熟的多肽的完整序列的最多5、10、20、30、40或者50%,通常地,片段包含完全成熟的多肽的完整序列的多达60%,更通常多达70%,优选多达80%,更优选多达90%,甚至更优选多达95%,还更优选多达99%。蛋白质的特别优选的片段包括蛋白质的一个或多个完整域。
在一个特别优选的实施方案中,期望的蛋白质(如期望的异源蛋白质)包含白蛋白或其变体或片段的序列。
我们使用的“白蛋白”包括了包含由任何来源获得的白蛋白序列的蛋白质。通常来源是哺乳动物。在一个优选实施方案中,血清白蛋白是人血清白蛋白(“HSA”)。术语“人血清白蛋白”包括具有人体中天然存在的氨基酸序列的血清白蛋白及其变体的含义。任选地,白蛋白具有WO 90/13653中公开的氨基酸序列或其变体。可通过用于分离对应于人类基因的cDNA的已知方法来获得HSA编码序列,并且该序列也公开于,例如EP 73 646和EP 286 424中。
在另一个优选实施方案中,“白蛋白”包括牛血清白蛋白的序列。术语“牛血清白蛋白”包括具有牛中天然存在的氨基酸序列,例如Swissprot登录号P02769的血清白蛋白及其如下所述的变体的含义。术语“牛血清白蛋白”也包括全长牛血清白蛋白的片段或其变体的含义,如下所述。
在另一个优选实施方案中,白蛋白包括源自来自下述动物的一种血清白蛋白的白蛋白序列:狗(例如参见Swissprot登录号P49822)、猪(例如参见Swissprot登录号P08835)、山羊(例如可由Sigma得到,产品号A2514或A4164)、火鸡(例如参见Swissprot登录号O73860)、狒狒(例如可由Sigma得到,产品号A1516)、猫(例如参见Swissprot登录号P49064)、鸡(例如参见Swissprot登录号P19121)、卵清蛋白(鸡卵清蛋白)(例如参见Swissprot登录号P01012)、驴(例如参见Swissprot登录号P39090)、圭亚那猪(例如可由Sigma得到,产品号A3060、A2639、O5483或A6539)、仓鼠(例如可由Sigma得到,产品号A5409)、马(例如参见Swissprot登录号P35747)、猕猴(例如参见Swissprot登录号Q28522)、小鼠(例如参见Swissprot登录号O89020)、鸽子(例如Khan等,2002,Iht.J.Biol.Macromol.,30(3-4),171-8所述)、兔(例如参见Swissprot登录号P49065)、大鼠(例如参见Swissprot登录号P36953)和绵羊(例如参见Swissprot登录号P14639),并且包括如下所述的其变体和片段。
已知白蛋白的很多天然存在的突变形式。Peters(1996,All About Albumin:Biochemistry,Geneticsand Medical Applications,Academic Press,Inc.,San Diego,California,p.170-181)中描述了很多。如上所述的变体可以是,或者可以不是这些天然存在的突变体之一。
“变体白蛋白”指其中在一个或多个位置具有氨基酸插入、缺失或者保守或者不保守取代的白蛋白,只要这样的变化得到的白蛋白的至少一种基本性质,例如结合活性(典型活性和比活性,例如与胆红素(bilirubin)结合)、渗量(osmolarity)(膨胀压(oncotic pressure)、胶体渗透压(colloid osmotic pressure))、在一定pH范围内的行为(pH稳定性)没有显著的变化。此上下文中的“显著”指本领域一名技术人员会判定变体的性质可仍然不同,但与初始蛋白质的性质相比将是明显的。
“保守取代”是预定的组合,如Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;和Phe、Tyr。这样的变体可以是,或者可以不是通过本领域所熟知的技术制备的,如通过1981年11月24日颁布给(issued to)Stevens的美国专利4,302,386中公开的定点诱变制备的,该文献通过引用并入本文。
通常地,白蛋白变体与天然存在的白蛋白具有高于40%,通常至少50%、更通常至少60%,优选至少70%,更优选至少80%,还更优选至少90%,甚至更优选至少95%,最优选至少98%或更高的序列同一性。可以用合适的计算机程序,例如威斯康辛大学遗传计算组的GAP程序来确定两个多肽之间的百分比序列同一性,而且可理解的是,相对于已将其序列进行了最佳比对的多肽计算百分比同一性。可替换地,可以使用Clustal W程序(Thompson等,1994)进行序列比对。所用参数可以,或者可以不,如下所述:
快速配对比对参数:K-tuple(字)大小;1,窗口大小;5,空隙罚分(gappenalty);3,顶部对角线(top diagonal)数;5。评分方法:x百分比。多重比对参数:缺口开放罚分(gap open penalty);10,缺口延伸罚分(gap extensionpenalty);0.05。评分矩阵:BLOSUM。
上文所用的术语“片段”包括全长白蛋白或其变体的任何片段,只要至少一种基本性质,例如结合活性(典型活性和比活性,如与胆红素结合)、渗量(膨胀压、胶体渗透压)、在一定pH范围内的行为(pH稳定性)没有显著的变化。此处的“显著”指本领域一名技术人员会判定变体的性质可仍然不同,但与初始蛋白质的性质相比将是明显的。片段通常为至少50个氨基酸长。片段可以包含,或者可以不包含白蛋白的至少一个完整子域。已将HSA域表达为重组蛋白质(Dockal,M.等,1999,J.Biol.Chem.,274,29303-29310),其中域I定义为由氨基酸1-197组成,域II定义为由氨基酸189-385组成,域III定义为由氨基酸381-585组成。存在域的部分重叠,因为延伸的α-螺旋结构(h10-h1)存在于域I和域II之间以及域II和域III之间(前面引用的Peters,1996,表2-4)。HSA也包括6个子域(子域IA、IB、IIA、IIB、IIIA和IIIB)。子域IA包括氨基酸6-105,子域IB包括氨基酸120-177,子域IIA包括氨基酸200-291,子域IIB包括316-369,子域IIIA包括氨基酸392-491,子域IIIB包括氨基酸512-583。片段可以包含,或者可以不包含如上所述的一个或多个域或子域的部分或全部,或者这些域和/或子域的任何组合。
在另一个特别优选的实施方案中,期望的蛋白质(如期望的异源蛋白质)包括转铁蛋白或其变体或片段的序列。本文使用的术语“转铁蛋白”包括转铁蛋白家族的所有成员(Testa,Proteins of iron metabolism,CRC Press,2002;Harris & Aisen,Iron carriers and iron proteins,Vol.5,Physical BioinorganicChemistry,VCH,1991)和它们的衍生物,如转铁蛋白、突变转铁蛋白(Mason等,1993,Biochemistry,32,5472;Mason等,1998,Biochem.J.,330(1),35)、截短的转铁蛋白、转铁蛋白裂片(lobe)(Mason等,1996,Protein Expr.Purif.,8,119;Mason等,1991,Protein Expr.Purif.,2,214)、乳铁蛋白、突变乳铁蛋白、截短的乳铁蛋白、乳铁蛋白裂片或上述任何一种与其它肽、多肽或蛋白质的融合体(Shin等,1995,Proc.Natl.Acad.Sci.USA,92,2820;Ali等,1999,J.Biol.Chem.,274,24066;Mason等,2002,Biochemistry,41,9448)。
转铁蛋白可以是,或者可以不是人转铁蛋白。术语“人转铁蛋白”在本文中用来表示与来自人的转铁蛋白无法区分的物质或者作为其变体或片段的物质。“变体”包括插入、缺失和保守或者不保守取代,其中这样的变化基本上不改变转铁蛋白的有用的配体结合或免疫性质。
本发明也包括了转铁蛋白的突变体。这样的突变体可以,或者可以不,具有改变的免疫原性。例如,转铁蛋白突变体可以,或者可以不,显示改变的(如减少的)糖基化。转铁蛋白分子的N端连接(N-linked)的糖基化形式可以通过在N、X或S/T位置的任何一个或全部加入/去除氨基酸糖基化共有序列,如N-X-S/T来进行修饰。转铁蛋白突变体可以,或者可以不,改变它们与金属离子和/或其它蛋白质,如转铁蛋白受体的天然结合。以这种方式修饰的转铁蛋白突变体的例子在下面说明。
我们也包括了人转铁蛋白或人转铁蛋白类似物的天然存在的多态的变体。通常,人转铁蛋白的变体或片段将具有至少5%、10%、15%、20%、30%、40%或50%(优选至少80%、90%或95%)的人转铁蛋白的配体结合活性(例如铁结合),按照重量百分比计算(weight for weight)。转铁蛋白或者测试样品的铁结合活性可以通过蛋白质在无铁状态和完全负载铁的状态下470nm∶280nm的吸光度比值由分光光度法测定。除非另外说明,试剂应是不含铁的。可以通过对于0.1M柠檬酸盐、0.1M醋酸盐、10mM EDTA,pH4.5透析从转铁蛋白或者测试样品中除去铁。蛋白质应以大约20mg/mL溶于100mMHEPES、10mM NaHCO3、pH8.0中。测定在水中稀释的脱辅基转铁蛋白(apo-transferrin)的470nm∶280nm吸光度的比值(Calbiochem,CN Biosciences,Nottingham,UK),从而可以由分光光度法准确地测定280nm处的吸光度(0%铁结合)。通过将191mg硝基三乙酸溶解于2mL的1M NaOH中来制备20mM的铁-硝基三乙酸盐(FeNTA)溶液,然后加入2mL 0.5M三氯化铁。用去离子水稀释到50mL。通过加入足够过量的新鲜制备的20mM FeNTA来用铁完全负载脱辅基转铁蛋白(100%铁结合),然后将全-转铁蛋白制备物对于100mMHEPES、10mM NaHCO3、pH8.0完全透析,以在测定470nm∶280nm处的吸光度比值之前去除残留的FeNTA。使用测试样品重复所述步骤,该测试样品最初应该不含铁,然后将最终的比值与对照相比较。
此外,可以,或者可以不,使用包含上述任何一种的单个或多个异源融合体,或者与白蛋白、转铁蛋白或免疫球蛋白或这些蛋白质中任何一个的变体或片段形成的单个或多个异源融合体。这样的融合体包括白蛋白N末端融合体、白蛋白C末端融合体和N末端及C末端白蛋白共融合体,如通过WO01/79271例示的,和转铁蛋白N末端融合体、转铁蛋白C末端融合体和N末端及C末端转铁蛋白共融合体。
美国专利申请US2003/0221201和US2003/0226155、Shin,等,1995,ProcNatl Acad Sci USA,92,2820,Ali,等,1999,J Biol Chem,274,24066,Mason,等,2002,Biochemistry,41,9448中给出了转铁蛋白融合体的例子,这些文献的内容通过引用并入本文。
技术人员还可理解的是,可以采用任何其它基因或变体的开放阅读框,或部分或其中之一作为开放阅读框用于本发明。例如,开放阅读框可以,或者可以不,编码包含任何序列的蛋白质,其为天然蛋白质(包括酶原)或天然蛋白质的变体或片段(例如,其可以是,或者可以不是域),或者是完全合成的蛋白质,或者是不同蛋白质(天然或合成的)的单融合体或多融合体。这样的蛋白质可以,但并不唯一,来自WO 01/79258、WO 01/79271、WO 01/79442、WO 01/79443、WO 01/79444和WO 01/79480中提供的列表,或其变体或片段;所述文献的公开通过引用并入本文。尽管这些专利申请提供了在白蛋白融合配偶体(fusion partner)的上下文中的蛋白质列表,但是就本发明而言,本发明不限于此,在其中列出的任何蛋白质可以,或者可以不,单独提供或作为白蛋白、免疫球蛋白的Fc区、转铁蛋白、乳铁蛋白或其它任何蛋白质或上述任一种的片段或变体的融合配偶体提供,作为期望的多肽。
期望的蛋白质(如期望的异源蛋白质)可以是,或者可以不是有治疗活性的蛋白质。换言之,它可以,或者可以不,对个体如人,具有公认的医疗作用。很多不同类型的治疗活性蛋白质是本领域中熟知的。
期望的蛋白质(如期望的异源蛋白质)可以是,或者可以不是在诊断技术上有用的蛋白质。很多不同类型的在诊断上有作用的蛋白质是本领域中熟知的。
期望的蛋白质(如期望的异源蛋白质)可以是,或者可以不是与保健(healthcare)无关的蛋白质。例如,它可以是,或者可以不是,作为工业、民用或营养(如作为食品或添加剂)剂有效用的蛋白。很多不同类型的具有工业、民用和/或营养效用的蛋白质也是本领域中熟知的。
期望的蛋白质(如期望的异源蛋白质)可以包含,或者可以不包含有效引起在宿主细胞,如酵母细胞中分泌的前导序列。
已使用或开发很多天然或人造的多肽信号序列(也称作分泌前区)用于从宿主细胞的分泌蛋白质。信号序列将初生蛋白(nascent protein)导向细胞机器(machinery ofcell),该细胞机器将蛋白质从细胞输出到周围的培养基或者,在某些情况下,输出到周质空间中。信号序列通常,尽管并不必需,位于初级翻译产物的N-末端,而且通常,尽管并不必需,在分泌过程中将蛋白质切割以得到“成熟”蛋白质。
在一些蛋白质的情况下,初始分泌的实体在去除信号序列后,在其N末端包括额外的氨基酸,称为“原”序列,中间物实体称为“原蛋白”。这些原序列可以,或者可以不,帮助最终蛋白质折叠并成为有功能的,而且通常之后被切割。在其它例子中,原区域仅仅提供酶的切割位点,以切掉前-原区域(pre-pro region),且不知道具有其它功能。
可以在蛋白质从细胞分泌的过程中或在从细胞输出到周围培养基或周质空间之后将原序列去除。
指导蛋白质分泌的多肽序列,无论它们是否类似信号序列(即前序列)或前-原分泌序列,都称为前导序列。蛋白质的分泌是涉及翻译、易位和翻译后加工的动态过程,在另一个步骤启动或者完成之前,这些步骤中的一个或多个不必需完成。
对于真核生物种类,如酵母,酿酒酵母、接合酵母属的菌种、乳酸克鲁维酵母和巴斯德毕赤酵母中生产蛋白质,已知的前导序列包括那些来自酿酒酵母酸性磷酸酶蛋白质(Pho5p)(参见EP 366 400)、转化酶蛋白(Suc2p)(参见Smith等(1985)Science,229,1219-1224)和热激蛋白-150(Hsp150p)(参见WO95/33833)的前导序列。另外,已使用了来自酿酒酵母交配因子α-1蛋白(MFα-1)和来自人溶菌酶与人血清白蛋白(HSA)蛋白质的前导序列,已将后者特别地,尽管不是专门地,用于分泌人白蛋白。WO 90/01063公开了MFα-1和HSA前导序列的融合体,与使用MFα-1前导序列相比,它有利地减少了人白蛋白中杂质片段的产生。WO 2004/009819和本申请的实施例中还公开了修饰的前导序列;读者将理解的是,那些前导序列可以与除转铁蛋白之外的蛋白质一起使用。此外,天然转铁蛋白前导序列可以,或者可以不,用于指导转铁蛋白和其它异源蛋白质的分泌。
当根据本发明进行重组表达的分子伴侣是蛋白质二硫键异构酶时,那么任选地期望的蛋白质(如期望的异源蛋白质)可以,或者可以不,在其成熟形式中包含二硫键。任何二硫键可以是,或者可以不是分子内的和/或分子间的。
期望的蛋白质(如期望的异源蛋白质)可以是,或者可以不是商业上有用的蛋白质,如有医药上、诊断上、工业上、家庭中或者营养上有用的蛋白质。一些蛋白质,如异源表达的蛋白质,意欲与它们在其中表达的细胞相互作用以对细胞的活性产生有益作用。这些蛋白质以其本身来说并不是商业上有用的。商业上有用的蛋白质是对于它们在其中表达的细胞具有离体(ex vivo)作用的蛋白质。然而,技术人员将理解的是,商业上有用的蛋白质可以,或者可以不,还对表达它(如异源蛋白质)的宿主细胞具有生物效应,但是该效应不是在其中表达蛋白质的主要或唯一原因。
商业上有用的蛋白质可以包括用作代谢物或抗生素等的蛋白质。
在一个实施方案中,优选期望的蛋白质(如期望的异源蛋白质)不是β-内酰胺酶。在另一个实施方案中,优选期望的蛋白质(如期望的异源蛋白质)不是antistasin。然而,读者可理解的是,上述这些条件都没从本发明的宿主细胞中或质粒上排除编码β-内酰胺酶或antistasin的基因,只不过编码期望的蛋白质(如期望的异源蛋白质)的基因编码除β-内酰胺酶和/或antistasin之外的蛋白质。
在本发明的实施中有用的质粒可以,除非另外说明,是任何类型的质粒。就本发明而言,“质粒”还可以,或者可以不,包括其它类型的载体。基于将在其中使用质粒的宿主细胞系统来选择合适的质粒是适当的。
已知很多质粒和其它载体用于各种表达系统的转化,包括使用下述物质的系统:用例如重组噬菌体、质粒或者粘粒DNA表达载体转化的细菌(如枯草芽孢杆菌或大肠杆菌);用例如酵母表达载体转化的酵母(如酿酒酵母或巴斯德毕赤酵母);用例如病毒表达载体(如杆状病毒)转化的昆虫细胞系统;用例如病毒或细菌表达载体转染的植物细胞系统;在细胞培养、转基因或者作为基因治疗中,用诸如腺病毒表达载体转染的动物细胞系统。
通常的原核细胞载体质粒为:可由Biorad Laboratories(Richmond,CA,USA)得到的pUC18、pUC19、pBR322和pBR329;可由Pharmacia(Piscataway,NJ,USA)得到的pTrc99A、pKK223-3、pKK233-3、pDR540和pRIT5;可由Stratagene Cloning Systems(La Jolla,CA92037,USA)得到的pBS载体、Phagescript载体、Bluescript载体、pNH8A、pNH16A、pNH18A和pNH46A。
通常的哺乳动物细胞载体质粒是可由Pharmacia(Piscataway,NJ,USA)得到的pSVL。这一载体使用SV40后期启动子(late promoter)以驱动克隆基因的表达,在产生T抗原的细胞如COS-1细胞中发现了最高水平的表达。诱导型哺乳动物表达载体的例子是pMSG,也由Pharmacia(Piscataway,NJ,USA)得到,这一载体使用糖皮质激素(glucocorticoid)诱导的小鼠乳腺肿瘤病毒长末端重复的启动子以驱动克隆基因的表达。
有用的酵母质粒载体包括2μm-家族质粒(如上所述),以及通常可由Stratagene Cloning Systems(La Jolla,CA92037,USA)得到的pRS403-406和pRS413-416。质粒pRS403、pRS404、pRS405和pRS406是酵母整合质粒(YIps),且并入了酵母选择性标记HIS3、TRP1、LEU2和URA3。质粒pRS413-416是酵母着丝粒质粒(YCps)。也可以使用其它Yips和YCps质粒。
可通过如下方法制备本发明任何方面所使用的质粒:通过使用本领域所熟知的技术,如Sambrook等,Molecular Cloning:A Laboratory Manual,2001,3rd edition所描述的(其内容通过引入并入本文),插入所需的序列(例如,一个或多个编码分子伴侣的基因和/或一个或多个编码异源蛋白的基因)来修饰本领域已知的质粒如2μm-家族质粒。例如,一种这样的方法涉及通过粘性末端连接。通过合适的限制性酶的作用可以在质粒和待插入的DNA片段上产生相容的粘性末端。这些末端可以通过互补的碱基对迅速退火,而剩余的缺口可以通过DNA连接酶的作用封闭。
另外的方法使用了合成的双链寡核苷酸接头(linker)和连接物(adaptor)。通过可以去除突出的3’端和补平凹陷的3’端的噬菌体T4DNA聚合酶或大肠杆菌DNA聚合酶I产生具有平端的DNA片段。可以通过T4DNA连接酶将包含确定的限制性酶的识别序列的合成接头和平端双链DNA部分连接到平端化的DNA片段上。然后将它们用适当的限制性酶消化以产生粘性末端并连接到具有相容的末端的表达载体上。连接物也是化学合成的DNA片段,其包含用于连接的一个平末端,但也具有一个预形成的粘性末端。可替换地,可以通过DNA连接酶的作用在存在或者不存在一个或多个任选含有粘性末端的合成的双链寡核苷酸的情况下将一个或多个DNA片段连接在一起。
包含各种限制性内切酶位点的合成的接头商业上可由很多来源得到,包括Sigma-Genosys Ltd,London Road,Pampisford,Cambridge,United Kingdom。
质粒(如2μm-家族质粒)中适当的插入位点包括,但不限于,上述讨论的那些位点。
宿主细胞
本发明还提供根据本发明的任何方面包含重组基因和/或质粒的宿主细胞。宿主细胞可以是任何类型的细胞。已知很多合适的宿主细胞表达系统,包括细菌(例如大肠杆菌和枯草芽孢杆菌)、酵母(例如酿酒酵母、巴斯德毕赤酵母和乳酸克鲁维酵母)、丝状真菌(例如曲霉属)、植物细胞、全植物(wholeplant)、动物细胞和昆虫细胞。细菌和酵母宿主细胞可以是,或者可以不是优选的。细菌宿主细胞可以用于克隆目的。酵母宿主细胞可以用于表达质粒中存在的基因。
在一个实施方案中,宿主细胞可以是,或者可以不是酵母细胞,如下列菌属的成员:酵母属(Saccharomyces)、克鲁维酵母属、Arxula、亚罗酵母属(Yarrowia)、假丝酵母属(Candida)、裂殖酵母属(Schizosaccharomyces)、德巴利酵母属(Drbaryomyces)、Xanthophyllomyces、地霉属(Geotrichum)、阿舒囊霉属(Ashbya)、何德菌属(Hortaea)、许旺酵母属(Schwanniomyces)、丝孢酵母属(Trichosporon)、Xanthophyllomyces或毕赤酵母属。酵母如酿酒酵母、乳酸克鲁维酵母、巴斯德毕赤酵母、膜醭毕赤酵母、鲁氏接合酵母、拜列氏接合酵母、发酵接合酵母、果蝇克鲁维酵母、甲醇毕赤酵母、多形汉逊酵母(Hansenula polymorpha)(也称作Pichia augusta)、Arxula adeninivorans、解脂亚罗酵母(Yarrowia lipolytica)、博伊丁假丝酵母(Candida boidinii)、产朊假丝酵母(Candida utilis)、粟酒裂殖酵母(Schizosaccharomyces pombe)可以是,或者可以不是优选的。其它合适的酵母可以,或者可以不,包括汉逊德巴利酵母(Debaryomyces hansenii)、Xanthophyllomyces dendrorhous、白地霉(Geotrichum candidum)、棉阿舒囊霉(Ashbya gossypii)、Hortaea werneckii、许旺酵母(Schwanniomyces occidentalis)、Trichosporon domesticum和/或Xanthophyllomyces dendrorhous。
使用例如通过破坏基因编码序列,在涉及蛋白质的O-糖基化的一个或多个蛋白质甘露糖基转移酶中有缺陷的酵母,如WO 2004/083245中所讨论的(其内容通过引用并入本文)可以是,或者可以不是特别有利的。
在另一个实施方案中,宿主细胞可以是,或者可以不是动物细胞。例如,动物细胞可以是,或者可以不是哺乳动物细胞,如人细胞类型。
可以,或者可以不选择宿主细胞类型与所用质粒类型的相容性。从一种酵母类型获得的质粒可以在其它酵母类型中维持(Irie等,1991,Gene,108(1),139-144;Irie等,1991,Mol.Gen.Genet.,225(2),257-265)。例如,来自鲁氏接合酵母的pSR1可以在酿酒酵母中维持。任选地,宿主细胞与2μm-家族质粒相容(参见对下述质粒的详细说明)。例如,当质粒基于pSR1、pSB3或者pSB4时,则合适的酵母细胞是鲁氏接合酵母;当质粒基于pSB1或者pSB2时,则合适的酵母细胞是拜列氏接合酵母;当质粒基于pSM1时,则合适的酵母细胞是发酵接合酵母;当质粒基于pKD1时,则合适的酵母细胞是果蝇克鲁维酵母;当质粒基于pPM1时,则合适的酵母细胞是膜醭毕赤酵母;当质粒基于2μm质粒时,则合适的酵母细胞是酿酒酵母或卡尔酵母。特别优选的是质粒基于2μm质粒,且酵母细胞是酿酒酵母。
本发明的2μm-家族质粒如果包含具有源自天然存在的质粒的序列的FLP、REP1和REP2基因中的一个、两个或优选三个,就可将其称为“基于”该天然存在的质粒。
使用例如通过破坏基因编码序列,在涉及蛋白质的O-糖基化的一个或多个蛋白质甘露糖基转移酶中有缺陷的酵母,可以是,或者可以不是特别有利的。
重组表达蛋白可以由生产宿主细胞进行不期望的翻译后修饰。例如,白蛋白的蛋白质序列不包含N-连接糖基化的任何位点,并且未有通过O-连接糖基化实际上被修饰的报道。然而,已发现很多酵母种类中产生的重组人白蛋白(“rHA”)可以通过通常涉及甘露糖的O-连接糖基化来修饰。甘露糖基化的白蛋白能够与血凝素伴刀豆球蛋白A结合。酵母产生的甘露糖基化的白蛋白的量可以通过使用在一个或多个PMT基因中有缺陷的酵母菌株来降低(WO 94/04687)。实现其最方便的方法是产生基因组中有缺陷以使产生的一种Pmt蛋白质水平降低的酵母。例如,可以,或者可以不,在编码序列或调控区(或者在调控一种PMT基因表达的其它基因)中存在缺失、插入或转座,以产生很少或者不产生Pmt蛋白质。或者,可以转化酵母以产生抗-Pmt物质,如抗-Pmt抗体。
如果使用除酿酒酵母之外的酵母,破坏一个或多个等同于酿酒酵母的PMT基因的基因也是有利的,例如在巴斯德毕赤酵母或乳酸克鲁维酵母中。从酿酒酵母中分离的PMT1(或任何其它PMT基因)的序列可以,或者可以不,用于鉴定或破坏其它真菌种类中编码相似酶活性的基因。WO 94/04687中描述了乳酸克鲁维酵母的PMT1同源物的克隆。
酵母可以,或者可以不,如分别在WO 95/33833和WO 95/23857中教导的,缺失HSP150和/或YAP3。
可以,或者可以不,通过标准技术将上述质粒引入宿主中。关于原核宿主细胞的转化,参见例如Cohen等(1972)Proc.Natl.Acad.Sci.USA 69,2110and Sambrook等(2001)Molecular Cloning,A Laboratory Manual,3rd Ed.ColdSpring Harbor Laboratory,Cold Spring Harbor,NY。Sherman等(1986)MethodsIn Yeast Genetics,A Laboratory Manual,Cold Spring Harbor,NY中描述了酵母细胞的转化。Beggs(1978)Nature 275,104-109中的方法也是有用的。EP 251744、EP 258067和WO 90/01063中一般地教导了转化酿酒酵母的方法,所有这些文献通过引用并入本文。关于脊椎动物细胞,用于转染这样的细胞的试剂,例如磷酸钙和DEAE-葡聚糖或脂质体制剂,可由Stratagene CloningSystems或Life Technologies Inc.,Gaithersburg,MD 20877,USA得到。
电穿孔也用于转化细胞,而且是在本领域中熟知的用于转化酵母细胞、细菌细胞和脊椎动物细胞。Becker & Guarente(1990)Methods Enzymol.194,182中公开了通过电穿孔转化酵母的方法。
通常,在使用质粒时,它并不转化所有宿主,因此必需选择用于转化的宿主细胞。由此,质粒可以包含,或者可以不包含选择性标记,其包括但不限于细菌选择性标记和/或酵母选择性标记。尽管本领域中已知有很多其它选择性标记,但通常的细菌选择性标记是β-内酰胺酶基因。酵母选择性标记包括LEU2、TRP1、HIS3、HIS4、URA3、URA5、SFA1、ADE2、MET15、LYS5、LYS2、ILV2、FBA1、PSE1、PDI1和PGK1。本领域的那些技术人员可理解的是,基因的染色体缺失或失活导致宿主不能生存的任何基因,所谓的“必需”基因,当功能基因在质粒上提供时可以用作选择性标记,如在pgk1酵母菌株中的PGK1所显示的(Piper and Curran,1990,Curr.Genet.17,119)。可以在Stanford Genome Database(SGD,http:://db.yeastgenome.org)中发现合适的“必需”基因。任何“必需”基因产品(如PKDI1、PSE1、PGK1或FBA1基因之一的产品,和本申请中其它部分描述的其它产品),当其缺失或失活时,不会产生营养缺陷(生物合成)需要,可以用作宿主细胞中质粒上的选择性标记,当缺少所述质粒时,宿主细胞不能产生该基因产品,从而获得增加的质粒稳定性而没有需要在特定的选择性条件下培养细胞的缺点。我们使用“营养缺陷(生物合成)需要”,包括可以通过营养或对生长培养基进行其它添加或对改变来补足的缺陷。然而,不能表达功能性Pgk1p或Fba1p的细胞可以通过向生长培养基中适当添加物质而得到补足,而且这样的基因产品可以不是根据本发明的优选的“必需蛋白质”。因此,本发明的上下文中优选的“必需标记基因”是那些基因,当其在宿主细胞中缺失或失活时导致不能通过对生长培养基进行任何添加或改变来补足的缺陷,其中这些添加或改变预期是例如能恢复宿主细胞表达“必需”标记基因产品的能力的多核苷酸或者“必需”标记基因本身的产品。
因此,本发明提供的质粒,本发明的方法中使用的质粒或本发明的宿主细胞中包含的质粒可以包含,或者可以不包含一个以上选择性标记。
一种选择技术涉及将在转化细胞中编码选择特性的DNA序列标记和任何必需的控制元件并入表达载体。这些标记包括用于真核细胞培养的二氢叶酸还原酶、G418或者新霉素抗性,和用于在大肠杆菌和其它细菌中培养的四环素、卡那霉素或者氨苄青霉素(即β-内酰胺酶)抗性基因。或者,这些选择特性的基因可在另一个载体上,该载体用于共转化期望的宿主细胞。
鉴定转化成功的细胞的另一个方法涉及培养引入质粒得到的细胞,任选地以使重组多肽(即由质粒上的多核苷酸序列编码且不是由宿主天然产生的多肽)表达。可富集和裂解细胞,并使用如Southern(1975)J.Mol.Biol.98,503或Berent等(1985)Biotech中描述的方法或者本领域中常用的DNA和RNA分析的其它方法,检验它们的DNA或RNA内容物(content)中是否存在重组序列。或者,可以使用抗体检测转化后细胞的培养物上清中是否存在多肽。
除了直接测定重组DNA的存在之外,当重组DNA能够指导蛋白质表达时,可以通过熟知的免疫方法来确定成功的转化。例如,用表达载体成功转化的细胞可以产生显示适当抗原性的蛋白质。收获怀疑被转化的细胞样品,并用适当的抗体检验蛋白质。
因此,除了转化后的宿主细胞本身,本发明还考虑到那些细胞的培养物,任选为营养培养基中的单克隆(同种细胞均一的(clonally homogeneous))培养物,或者是由单克隆培养物衍生的培养物。或者,转化后的细胞可以,或者可以不,作为工业上/商业上或制药上有用的产品,并可以使用而在不进行进一步纯化或从培养基中纯化,和任选地以适于它们预期的工业/商业或制药用途的方式用载体或稀释剂配制,和任选地以适合于这些用途的方式包装和提供。例如,可将全细胞固定化;或者用于将细胞培养物直接喷到应用过程(process)、作物(crop)或其它期望的靶物上/中。类似地,可使用全细胞,如酵母细胞,作为胶囊用于很多不同的应用,如香料、调味料和药物。
转化后的宿主细胞可以,或者可以不,在本领域技术人员公知的适当的条件下培养足够的时间,并考虑到本文公开的教导,以允许表达一个或多个重组分子伴侣和期望的蛋白质(如期望的异源蛋白质)。
培养基可以是,或者可以不是非选择性的,或者可以,或可以不,施加选择压力来维持质粒。
如此产生的期望的蛋白质(如期望的异源蛋白质)可以,或者可以不,存在于胞内,或者,如果分泌,则存在于培养基中和/或宿主细胞的周质空间。
蛋白质回收和配制
从培养的宿主细胞或者培养基中纯化表达的期望的蛋白质(如期望的异源蛋白质)的步骤任选地包括细胞固定化、细胞分离和/或细胞破碎,但是总是包含至少一种不同于细胞固定化、分离和/或破碎步骤的其它纯化步骤。
细胞固定化技术,如用海藻酸钙珠包被(encase)细胞,是本领域中熟知的。类似地,细胞分离技术,如离心、过滤(例如错流过滤、膨胀床层析等)是本领域中熟知的。同样地,细胞破碎方法,包括珠磨、声处理、酶处理等是本领域中熟知的。
至少一种其它纯化步骤可以是本领域中已知的适于蛋白质纯化的任何其它步骤。例如下述文献中公开的用于回收重组表达的白蛋白的纯化技术:WO 92/04367,去除源自基质的染料;EP 464 590,去除源自酵母的着色剂;EP 319 067,碱沉淀和之后将白蛋白施用于亲脂相;和WO 96/37515、US 5728 553和WO 00/44772,描述了完整的纯化过程;上述所有文献通过引用并入本文。
可以通过已发现用于纯化除白蛋白之外的蛋白质的任何技术从培养基中纯化这些蛋白质。
合适的方法包括硫酸铵或乙醇沉淀、酸或者溶剂萃取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、亲和层析、羟基磷灰石层析、凝集素层析、浓缩、稀释、pH调节、渗滤(diafiltration)、超滤、高效液相色谱(“HPLC”)、反相HPLC、电导率调节等。
在一个实施方案中,可以,或者可以不,将上述技术中的任何一种或多种用于进一步将分离的蛋白质纯化到商业或者工业上可以接受的纯度水平。所谓商业或者工业上可以接受的纯度,我们包括提供以下浓度的蛋白质:至少0.01g.L-1,0.02g.L-1,0.03g.L-1,0.04g.L-1,0.05g.L-1,0.06g.L-1,0.07g.L-1,0.08g.L-1,0.09g.L-1,0.1g.L-1,0.2g.L-1,0.3g.L-1,0.4g.L-1,0.5g.L-1,0.6g.L-1,0.7g.L-1,0.8g.L-1,0.9g.L-1,1g.L-1,2g.L-1,3g.L-1,4g.L-1,5g.L-1,6g.L-1,7g.L-1,8g.L-1,9g.L-1,10g.L-1,15g.L-1,20g.L-1,25g.L-1,30g.L-1,40g.L-1,50g.L-1,60g.L-1,70g.L-1,70g.L-1,90g.L-1,100g.L-1,150g.L-1,200g.L-1,250g.L-1,300g.L-1,350g.L-1,400g.L-1,500g.L-1,600g.L-1,700g.L-1,800g.L-1,900g.L-1,1000g.L-1,或者更高。
优选纯化期望的蛋白质(如期望的异源蛋白质)以获得药学上可以接受的纯度水平。如果蛋白质基本上无热原,并可以以药学上的有效量施用而不引起与蛋白活性无关的医疗作用,那么蛋白质就具有药学上可接受的纯度水平。
得到的期望的蛋白质(如期望的异源蛋白质)可以,或者可以不,用于其任何已知的应用,在白蛋白的情况下,所述应用包括对病人静脉注射(i.v.)施用以治疗严重的烧伤、休克和失血,补充培养基和在其它蛋白质的配制物中作为赋型剂。
尽管通过本发明的方法获得的在医疗上、诊断上、工业上、家庭中或者营养上有用的期望的蛋白质(如期望的异源蛋白质)可能单独提供或施用,但是优选将其作为配制物(如药物配制物,特别是在医疗上和/或诊断上有用的蛋白质的情况中),连同一种或者多种可接受的载体或稀释剂一起提供。在与期望的蛋白质相容的意义上,载体或稀释剂必须是“可接受的”,其中意欲将配制物施用于受体时,则对其受体是无害的。通常,载体或稀释剂是无菌而且无热原的水或盐水(saline)。
任选地,将以单位剂型(unit dosage form),如片剂、胶囊、注射液等形式提供配制的蛋白质。
在本发明的第六方面中提供了生产期望的蛋白质(如期望的异源蛋白质),如本发明较早方面所述的期望的蛋白质的方法,其包括:提供包含第一重组基因和第二基因的宿主细胞,所述第一重组基因编码包含Orm2p或其变体的序列的蛋白质,所述第二基因,任选为第二重组基因,其编码期望的蛋白质(如期望的异源蛋白质),任选地条件是第一和第二基因不都存在于宿主细胞中相同的2μm-家族质粒上;和在允许表达第一和第二基因的条件下,在培养基中培养宿主细胞。所述方法可以,或者可以不,另外包含从培养的宿主细胞或培养基中纯化表达的期望的蛋白质(如期望的异源蛋白质)的步骤;和任选地,将纯化的蛋白质冻干;和任选地,用载体或稀释剂配制纯化的期望的蛋白质(如期望的异源蛋白质);和任选地,以单位剂型提供配制的蛋白质。
在上面讨论的方式中,宿主细胞可以,或者可以不,另外包含其它重组基因,所述其它重组基因编码包含Orm2p的替代分子伴侣或其变体的序列的蛋白质。
本发明的第六部分中的第一和第二基因中的任何一个或者两者可以是,或者可以不是从质粒,任选从相同的质粒表达的重组基因,只要当两个基因从相同的质粒表达时,所述质粒不是2μm-家族质粒。编码包含Orm2p的替代分子伴侣或其变体的序列的蛋白质的其它重组基因也可以,或者可以不,从质粒表达,任选从与第一和第二重组基因中的一个或两者相同的质粒表达。除了当第一和第二基因两者都是从相同的质粒共表达的重组基因之外,其中一种可以,或者可以不,从2μm-家族质粒,如2μm质粒单独表达。或者,本发明的第六方面中的第一和第二基因的一种或两者可以,或者可以不,整合入宿主细胞的染色体中。编码包含Orm2p的替代分子伴侣或其变体的序列的蛋白质的其它重组基因可以,或者可以不,整合入宿主细胞的染色体中,无论第一和第二基因是否从质粒表达或者是否整合到染色体上。
本发明在第七方面中还提供如上面第六方面所述的宿主细胞,该宿主细胞包含第一重组基因和第二基因,所述第一重组基因编码包含Orm2p或其变体或片段的序列的蛋白质,所述第二基因,如重组基因,编码期望的蛋白质(如期望的异源蛋白质),任选地条件是第一和第二基因不存在于宿主细胞中相同的2μm-家族质粒上。
本发明还在第八方面提供了编码蛋白质Orm2p或其变体的核酸序列的用途,通过将所述核酸序列和宿主细胞内的基因共表达(但任选地不包括来自相同的2μm-家族质粒的这些基因的共表达)来增加宿主细胞(如上述宿主细胞)中所述由宿主中的基因,如重组基因编码的期望的蛋白质(如期望的异源蛋白质)的生产。核酸序列和编码期望的蛋白质的基因中的一种或两者可以,或者可以不,从宿主细胞中的质粒表达,和任选从相同的质粒表达。在上述讨论的方式中,宿主细胞可以,或者可以不,另外包括编码Orm2p的替代分子伴侣或其变体的重组基因,其可以,或者可以不,位于宿主细胞中的质粒上,任选地位于与所述核酸序列和编码期望的蛋白质的基因中的一种或者两者相同的质粒上。合适的质粒包括2μm-家族质粒,如2μm质粒,如上面所讨论的。
在本发明的第九方面中还提供了质粒作为表达载体以通过如下方法增加异源蛋白质生产的用途:在同样的质粒上提供编码异源蛋白质的重组基因和编码Orm2p或其变体的基因,任选地条件是该质粒不是2μm-家族质粒。所述质粒还可以,或者可以不,在上述讨论的方式中包含编码Orm2p的替代分子伴侣或其变体的基因。
因此,在第十方面中,本发明还提供质粒,任选地是表达质粒,其包含第一基因和第二基因,所述第一基因编码蛋白质Orm2p或其变体或片段,所述第二基因编码异源蛋白质,如上所讨论的,任选地条件是该质粒不是2μm-家族质粒。所述质粒可以,或者可以不,另外包括编码Orm2p的替代分子伴侣或其变体的第三基因。在优选实施方案中,第三基因编码包含蛋白质二硫键异构酶的序列的蛋白质。
我们还说明了,可将编码包含“必需”蛋白质序列的蛋白质的含质粒基因(plasmid-borne gene)用于在宿主细胞中稳定地维持质粒,所述宿主细胞在缺少所述质粒的情况下不产生所述“必需”蛋白质。这具有确保微生物在选择的培养条件下的遗传稳定性的优势,并由此改进个体培养物的重现性和可靠性,此外还可以进行长期的培养,而不会因为质粒丢失而降低产量。
优选的“必需”蛋白质是分子伴侣,其可以或可以不提供其它优势,如作为选择性标记起作用以提高质粒稳定性,其表达同时增加一个或多个期望的蛋白质,如宿主细胞中由重组基因编码的异源蛋白质的表达。这一系统是有优势的,因为它允许使用者将质粒需要携带的重组基因的数目最小化。例如,通常的现有技术的质粒携带使质粒在宿主细胞培养过程中稳定维持的标记基因(如上所述的那些标记基因)。除了实现期望效果所需的任何其它基因之外,这样的标记基因也需要保留在质粒上。然而,质粒并入外源DNA序列的能力是有限的,因此将实现期望效果所需的序列插入的数目最小化是有利的。此外,一些标记基因(如营养缺陷型标记基因)需要培养过程在特定的条件下进行,以获得标记基因的效果。这样的特定条件对于细胞生长或者蛋白质生产可不是最优的,或者可需要使用低效的或者过度昂贵的生长系统。
因此,可能使用编码包含“必需”蛋白质序列的蛋白质的基因作为含质粒基因以增加质粒稳定性,其中质粒存在于细胞中,所述细胞在缺少该质粒的情况下,不能产生所述“必需”蛋白质。可理解的是,蛋白质是否“必需”的问题将取决于所使用的系统;在一个宿主生物中不“必需”的蛋白质,当在相同的宿主中缺失、破坏、失活、修饰或影响一个或多个其它基因时,可能会成为“必需”的,从而用作“必需”的含质粒基因,如上所述;同样地,蛋白质是否“必需”可取决于确定的物理条件,如培养宿主细胞的pH、温度和/或氧水平。
优选地,“必需蛋白质”是当它的编码基因在宿主细胞中缺失或失活时,不会导致宿主细胞形成(develop)营养缺陷(生物合成)需要的蛋白质。使用“营养缺陷(生物合成)需要”,我们包括可以通过对生长培养基进行添加或改变,特别是对生长培养基的营养物组成进行添加或改变而补足的缺陷。因此,“必需蛋白质”可为营养缺陷型标记蛋白质,如果它的编码基因在宿主细胞中失活,会导致营养缺陷型突变体的产生,即为了生长和存活,突变体生物需要正常(未突变的菌株)所不需要的特定的附加营养物——优选的是,“必需蛋白质”不是营养缺陷型标记蛋白质。因此,在本发明的上下文中,编码“必需蛋白质”的“必需标记基因”是这样的基因,当其在宿主细胞中缺失或失活时会导致通过对生长培养基的进行添加或改变,通常是营养物添加或改变,无法补足的缺陷,除了其中这些添加或改变例如为多核苷酸,其能恢复宿主细胞表达“必需”标记基因的产品或“必需”标记本身的产品的能力。换言之,可以,或者可以不优选,“必需蛋白质”不是事实上涉及宿主细胞的营养物的代谢转化的蛋白质。这种系统的优点在于可将“必需标记基因”用作宿主细胞中质粒上的选择标记,当所述宿主细胞缺少该质粒时,不能够产生该基因产物,以获得增加的质粒稳定性而无需要在特定的选择性(如选择性营养物)条件下培养细胞的缺点。因此,可以在不需适合于任何特定的标记基因的条件下培养宿主细胞,而不损失质粒稳定性。例如,可将用此系统产生的宿主细胞在非选择性培养基,如复合或丰富培养基中并在非选择性生长条件(如pH、温度和/或氧水平)下培养,这可为比通常用来使营养缺陷和其它标记基因产生作用的基本培养基和/或特别适合的生长条件更经济,和/或更有支持力的(moresupportive)生长培养基/条件。
例如,细胞可以具有,或者可以不具有编码缺失或以其它方式失活的“必需”蛋白质的基因的内源拷贝。
特别优选的是,如果“必需蛋白质”是“必需”分子伴侣,因为这可以提供双重优势,提高质粒稳定性而不需要选择性生长条件,和在宿主细胞中增加期望的蛋白质,如内源编码的或异源蛋白质的产量。如果选择使用“必需”分子伴侣的过量表达来增加宿主细胞中蛋白质的产量,则此系统也具有将质粒需要携带的重组基因数目最小化的优点。
用于本发明此方面中的优选的“必需蛋白质”包括由基因PDI1和PSE1编码的“必需”分子伴侣,当编码这些蛋白质的内源基因在宿主细胞中缺失或失活时,不会导致宿主细胞形成营养缺陷(生物合成)需要。
优选的“必需”分子伴侣是真核分子伴侣,特别优选的“必需”分子伴侣是酵母分子伴侣,包括含有蛋白质序列的分子伴侣,所述蛋白质由选自下组的基因编码:CCT2,CCT3,CCT4,CCT5,CCT6,CCT7,CCT8,CNS1,ERO1(在缺少二酰胺(diamide)的情况下),HSP10,HSP60,PDI1,CDC37,KAR2,MGE1,MRS11,NOB1,SSC1,PSE1,TIM9,PAM18和TCP1。
要指出的是,突变失活ERO1的宿主细胞可以通过在氧化剂二酰胺存在的情况下的生长来补足(Frand & Kaiser,1998,Molecular Cell,1,161-170),但是二酰胺不是上述营养缺陷型突变讨论的“营养物”添加的类型。二酰胺不是生长培养基通常使用的成分,用包含ERO1基因的质粒转化后的ERO1突变体可以在丰富培养基中生长而不损失质粒稳定性。
因此,在第十一方面,本发明还提供了包含质粒(如本发明前面任意部分所述质粒)的宿主细胞,所述质粒包含编码“必需”蛋白质,如分子伴侣的基因,其中,在缺少所述质粒的情况下,宿主细胞不能够产生“必需”蛋白质。优选地,在缺少所述质粒时,宿主细胞不能生存。通常,已将宿主细胞进行遗传修饰,以使其不能从染色体编码的(或者其它内源的)基因产生“必需”蛋白质的功能拷贝。宿主细胞可以,或者可以不,另外包含编码异源蛋白质,如本发明前面部分所述的那些异源蛋白质的重组基因。
本发明还在第十二方面提供包含作为唯一的酵母选择标记,任选地作为唯一的选择标记的,编码“必需”蛋白质如“必需”分子伴侣的基因的质粒。质粒可以,或者可以不,另外包含编码异源蛋白质的基因。质粒可以是,或者可以不是2μm-家族质粒。
在第十三方面,本发明还提供产生期望的蛋白质(如期望的异源蛋白质)的方法,其包括如下步骤:提供包含质粒的宿主细胞,质粒包含编码“必需”蛋白质如分子伴侣的基因,其中,在缺少质粒的情况下,宿主细胞不能产生“必需”蛋白质,而且其中的宿主细胞还包含编码期望的蛋白质(如期望的异源蛋白质)的基因,如重组基因;在允许表达“必需”蛋白质和期望的蛋白质的条件下,在培养基中培养宿主细胞;和任选地,从培养的宿主细胞或培养基中纯化表达的期望的蛋白质;和另外任选地,将纯化的蛋白质冻干。因此,本方法使用的宿主细胞可以是,或者可以不是根据本发明的第十一方面的宿主细胞和/或宿主细胞可以用,或者可以不用根据本发明的第十二方面的质粒转化。
方法可以,或者可以不,另外包括如下步骤:用载体或稀释剂配制纯化的期望的蛋白质(如期望的异源蛋白质)的步骤,和任选地以单位剂型,用上述方式提供配制的蛋白质。
在一个优选实施方案中,“在允许表达‘必需’蛋白质和期望的蛋白质的条件下,在培养基中培养宿主细胞”的步骤涉及在培养基中培养宿主细胞,所述培养基不特定地适于对质粒上的任何基因的存在有选择性,除了对编码“必需”蛋白质的基因的存在有选择性。因此,在一个实施方案中,培养宿主细胞的步骤可以,或者可以不,在非选择性培养基,如复合或丰富培养基中和/或在不特定地适于选择存在“必需”蛋白质的条件(如pH、温度和/或氧水平)下进行。如果培养基不特定地适于使产品,通常是营养物产物的宿主细胞丧失(deprive)的,可以将培养基描述为适于本情况目的的非选择性培养基,通常提供所述营养物产物以使未进行修饰的宿主细胞的生长最大化,或者以其它方式允许其生长,以防止“必需”蛋白质的表达。例如,就本发明而言如果,将在“测试培养基”中生长的第一宿主细胞类型中的质粒稳定性与在“测试培养基”中生长的第二细胞类型中的质粒稳定性进行比较时,当在“测试培养基”中每种细胞类型生长5、10、15、20、25或者30代时,培养基(“测试培养基”)可以是非选择性培养基,其中-
(1)第一宿主细胞类型是根据本发明第十一方面的宿主细胞;
(2)第二宿主细胞类型是根据本发明第十一方面的宿主细胞,除了已将它修饰以恢复宿主细胞在缺少质粒的情况下产生“必需”蛋白质的能力(不是说第二宿主细胞类型不包括编码“必需”蛋白质的质粒,而是指它可以产生“必需”蛋白质,即使当质粒不存在时);
在第二细胞类型中观察到的质粒稳定性为在第一细胞类型中观察到的质粒稳定性的少于99%、98%、95%、90%、80%、70%、60%、50%、40%、30%、20%、15%、10%、5%、4%、3%、2%、1%或者更少。因此,在这个实施方案中,尽管在非选择性条件下生长,优选本发明的第十三方面的方法产生宿主细胞,其在5、10、15、20、25或者30代之后显示基本上100%的质粒稳定性。
本发明的第十四方面还提供了编码“必需”蛋白质(如上所述)的多核苷酸通过如下方法提高宿主细胞中质粒的稳定性的用途:特别是在非选择性条件下,将多核苷酸整合入质粒中以产生修饰的质粒,其中宿主细胞不能在缺少修饰的质粒的条件下产生“必需”蛋白质。稳定性的增加可以,或者可以不,在非选择性条件下生长至少5代时,比经修饰以产生“必需”蛋白质的相同宿主细胞中未修饰的质粒的稳定性水平高至少1%(即1.01倍)、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%(即2倍)、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍或更高。
在本发明第十四方面的一个实施方案中,质粒可以,或者可以不,另外包含基因,其编码其它期望的异源蛋白质,如前面本发明较早方面所述的异源蛋白质。在那种情况下,所述用途可以,或者可以不,改进期望的异源蛋白质的产量,如当包含质粒的宿主细胞在非选择性条件下生长时。
在一个优选实施方案中,“必需”蛋白质是分子伴侣,而且可以,或者可以不,用于同时增加宿主细胞中质粒的稳定性,并提高宿主细胞生产期望的蛋白质产物的能力。期望的蛋白质产物可以是,或者可以不是内源编码的蛋白质,或者可以是,或可以不是如本发明较早方面所述的异源蛋白质。当蛋白质产品是异源蛋白质时,它可以,或者可以不,由已整合入宿主细胞染色体的重组基因编码,或由宿主细胞中存在于质粒上的基因编码,所述质粒如修饰的质粒,其包含编码如上所述的“必需”蛋白质的多核苷酸。
我们还发现根据本发明的其它实施方案,可以通过修饰控制分子伴侣表达水平的启动子来调节重组-提供的分子伴侣的作用。我们意外地发现,在某些情况下,较短的启动子导致期望的蛋白质表达增加。不受理论的限制,我们认为这是因为在已经以高水平表达期望的蛋白质的宿主细胞中表达重组分子伴侣可以使细胞自身超负荷承载(overload)期望的蛋白质(如期望的异源蛋白质),从而使期望的蛋白质产量的总体增加很小或者没有总体增加。在那些情况下,提供带有截短的启动子的重组分子伴侣基因可以是,或者可以不是有益的。
因此,在本发明的第十五方面中,提供了包含启动子序列的多核苷酸(如上所述的质粒),所述启动子与编码分子伴侣(如上所述的那些分子伴侣)的编码序列可操作连接,用于通过在宿主细胞中表达多核苷酸序列来增加宿主细胞(如上所述的宿主细胞)中期望的蛋白质(如期望的异源蛋白质),如上所述的那些蛋白质的表达,其中启动子的特征在于它能得到改变的分子伴侣表达水平,如比编码序列与其天然存在的启动子可操作连接时所得到的分子伴侣表达水平更高或更低的分子伴侣表达水平。
本发明还在第十六方面提供产生期望的蛋白质(如期望的异源蛋白质)的方法,其包括如下步骤:提供包含重组基因的宿主细胞,所述重组基因包含与编码分子伴侣的编码序列可操作连接的启动子序列,所述启动子的特征在于它能得到比编码序列与其天然存在的启动子可操作连接时所得到的分子伴侣表达水平更低的分子伴侣表达水平,而且宿主细胞还包含编码期望的蛋白质(如期望的异源蛋白质)的基因,如重组基因;在允许表达分子伴侣和期望的蛋白质的条件下培养宿主细胞;和任选地从培养的宿主细胞或培养基中纯化表达的期望的蛋白质;和另外任选地将纯化的蛋白质冻干;和任选地用载体或稀释剂进一步配制纯化的期望的蛋白质;和任选地以单位剂型,以上述所讨论的方式提供配制的蛋白质。
从本申请的实施例中明显看出,重组表达的PDI和基于转铁蛋白的蛋白质的组合提供了令人惊讶的转铁蛋白表达的高水平。例如,包括染色体编码的重组PDI基因的系统中转铁蛋白的表达提供了2倍的增长(与其中没有染色体编码的重组PDI基因的对照相比)。这种增长比包含编码人白蛋白的重组基因代替重组转铁蛋白基因的等效系统高5倍。
宿主可以是任何细胞类型,如原核细胞(例如细菌细胞,如大肠杆菌)或者真核细胞。优选的真核细胞包括真菌细胞,如酵母细胞,和哺乳动物细胞。上面讨论了代表性的酵母细胞。代表性的哺乳动物细胞包括人细胞。
可以培养如上所述的宿主细胞以产生基于转铁蛋白的重组蛋白质。可将产生的基于转铁蛋白的蛋白质从培养物中分离并纯化,任选地纯化到制药上可以接受的纯度水平,例如用本领域已知的和/或如上面所列出的技术。纯化的基于转铁蛋白的蛋白质可以,或者可以不,用制药上可以接受的载体或稀释剂进行配制,并可以,或者可以不,以单位剂型提供。
现在将参考下述非限制性实施例和附图举例说明本发明。
实施例
已使用两类表达盒(expression cassette)来举例说明重组人转铁蛋白突变体(N413Q、N611Q)从酿酒酵母的分泌。一种类型使用修饰的HSA(前)/MFα1(原)前导序列(称为“修饰的融合前导物”序列)。第二类表达盒只使用修饰的HSA(前)前导序列。
“修饰的融合前导物”的24个氨基酸的序列是MKWVFIVSILFLFSSAYSRSLDKR。
修饰的HSA(前)前导序列的18个氨基酸的序列是MKWVFIVSILFLFSSAYS。
已经使用具有和不具有酿酒酵母PDI基因PDI1的附加拷贝的2μm表达载体在酿酒酵母中研究了使用这两种盒的转铁蛋白(N413Q、N611Q)表达。
实施例1
构建表达质粒
如WO 2005/061718的实施例1中所述,构建质粒pDB2515,pDB2529,pDB2536,pDB2688,pDB2690,pDB2711,pDB2921,pDB2928,pDB2929,pDB2930,pDB2931,pDB2932和pDB2690,该文献的内容通过引用并入本文。
实施例2
表达转铁蛋白
用所有的转铁蛋白(N413Q、N611Q)表达质粒转化酿酒酵母对照菌株以成为亮氨酸原养型,并制备冻存的储备物。
将菌株在以200rpm摇动的50mL锥形瓶中的10mL BMMD培养物中、在30℃培育4天。通过火箭免疫电泳(RIE如Weeke,B.,1976,“Rocketimmunoelectrophoresis”In N.H.Azelsen,J.Kroll,和B.Weeke[eds.],A manualof quantitative immunoelectrophoresis.Methods and applications.Universitetsforlaget,Oslo,Norway中所述)、反相高效液相色谱(RP-HPLC)(表1)和用胶体考马斯蓝染色剂染色的非还原性SDS聚丙烯酰胺电泳(SDS-PAGE)来比较分泌到培养物上清中的重组转铁蛋白的效价(titres)。当酿酒酵母PDI1过量表达时,估计分泌的重组转铁蛋白的增加多于10倍。
通过RP-HPLC分析(使用WO 2005/061718实施例2中所述的方法,该文献的内容通过引用并入本文),确定对于修饰的融合前导序列,转铁蛋白分泌增加18倍,对于修饰的HSA-前前导序列,转铁蛋白分泌增加15倍(表1)。
图4显示具有和不具有额外的PDI1表达的酿酒酵母菌株分泌的重组转铁蛋白的SDS-PAGE比较。
表1:
质粒 |
分泌前导物 |
额外PDI1 |
平均转铁蛋白效价(μg.mL-1)(n=2) |
估计的由于额外的PDI1而造成的增加 |
pSAC35 |
无 |
无 |
0.4 |
- |
pDB2536 |
融合前导物 |
无 |
6.2 |
- |
pDB2711 |
融合前导物 |
有 |
112.8 |
18倍 |
pDB2931 |
修饰的HSA-前前导物 |
无 |
5.1 |
- |
pDB2929 |
修饰的HSA-前前导物 |
有 |
76.1 |
15倍 |
RIE分析表明,在存在额外的PDI1拷贝的情况下,增加的转铁蛋白分泌为大约15倍(图2)。通过RIE分析,对于修饰的HSA-前前导序列的增加量比对于修饰的融合前导序列的增加量看起来略高(图3)。
实施例3
PDI的染色体过量表达
选择酿酒酵母菌株A研究来自质粒pDB2506的重组糖基化转铁蛋白表达和来自质粒pDB2536的重组非糖基化转铁蛋白(N413Q、N611Q)的分泌。菌株A具有下述特征:
●额外的整合在染色体上的PDI1基因整合在宿主PDI1染色体的位置。
●也将URA3基因和包含氨苄青霉素抗性基因的细菌DNA序列在上述
基因的插入位点整合入酿酒酵母基因组。
对照菌株没有上述任何一种插入。
用pDB2506(重组转铁蛋白)、pDB2536(重组非糖基化转铁蛋白(N413Q、N611Q))或pSAC35(对照)转化对照菌株[cir0]和菌株A[cir0]以成为亮氨酸原养型。在BMMD-琼脂上选择转化体。
通过火箭免疫电泳(RIE)对于每种菌株/质粒组合测定BMMD摇瓶培养物中转铁蛋白分泌的相对水平。图5显示两株菌都将糖基化和非糖基化的重组转铁蛋白分泌到培养物上清中。
分别从菌株A[pDB2506]和菌株A[pDB2536]分泌的糖基化和非糖基化转铁蛋白的水平显示高于从对照菌株分泌的水平。因此,至少在摇瓶培养物中,在菌株A的PDI1基因座整合入宿主基因组的PDI1增强了转铁蛋白分泌。
此外,在对照菌株[pDB2536]和菌株A[pDB2536]之间观察到的转铁蛋白分泌的增加通过RIE显示为至少100%的增加。相比之下,在对照菌株[pDB2305]和菌株A[pDB2305]之间rHA单体分泌的增加为大约20%(数据未显示)。考虑到转铁蛋白有19个二硫键,因此,与17个二硫键的rHA相比,由于菌株A中额外的PDI1拷贝而引起的转铁蛋白分泌的增加大得令人吃惊。额外的PDI1基因的拷贝可对于从酿酒酵母分泌来自转铁蛋白家族的蛋白质和它们的衍生物是特别有益的。
通过RIE比较生长在BMMD和YEPD的转化体从菌株A[pDB2536]和菌株A[pDB2506]分泌的铁传递的水平(图6)。结果表明,与BMMD(2-5mg.L-1血清转铁蛋白当量)相比,通过在YEPD中生长得到的非糖基化的重组转铁蛋白(N413Q、N611Q)和糖基化的重组转铁蛋白的效价(10-20mg.L-1血清转铁蛋白当量)增加大于2倍。在YEPD中观察到的糖基化和非糖基化转铁蛋白效价的增加,说明两种转铁蛋白表达质粒在非选择性生长条件下足够稳定,以使期望的生物质(biomass)的增加(通常由在YEPD中生长所致)得以转化为糖基化和非糖基化转铁蛋白的生产率的增加。
图7显示了从生长在BMMD摇瓶培养物中的菌株A[pDB2536]分泌的非糖基化转铁蛋白(N413Q、N611Q)和从生长在BMMD摇瓶培养物中的菌株A
[pDB2506]分泌的糖基化转铁蛋白的SDS-PAGE分析。与菌株A[pSAC35]对照相比,菌株A[pDB2536]样品清晰地显示一条额外的蛋白质条带。这条额外的条带迁移到从对照菌株[pDB2536]分泌的重组转铁蛋白(N413Q、N611Q)的预期位置。菌株A[pDB2506]培养物上清显示在转铁蛋白的预期位置包含一条扩散的蛋白质条带。这说明分泌的重组转铁蛋白是不均一的,可能是因为Asp413和/或Asp611处的超-甘露糖基化(hyper-mannosylation)导致的。
实施例4
比较从包含pDB2711的酿酒酵母对照菌株的转铁蛋白分泌和从酿酒酵母菌株A的转铁蛋白分泌
质粒pDB2711如上所述。还制备了具有与pDB2711相反的方向的NotI盒的质粒pDB2712(WO 2005/061718的图22)。
用pDB2711和pDB2712转化对照菌株酿酒酵母[cir0]以成为亮氨酸原养型。在BMMD-琼脂上选择转化体,并制备对照菌株[pDB2711]的冻存的海藻糖储备物。
在BMMD和YEPD摇瓶培养物中比较了对照菌株[pDB2711]、对照菌株[pDB2712]、菌株A[pDB2536]、对照菌株[pDB2536]和可选的对照菌株[pDB2536]的重组转铁蛋白(N413Q、N611Q)的分泌。RIE显示,与具有PDI1的两个染色体拷贝的菌株A[pDB2536]和具有PDI1基因的单个染色体拷贝的对照菌株[pDB2536]相比,从具有多个游离的PDI1拷贝的对照菌株[pDB2711]得到的重组转铁蛋白分泌明显增加(图8)。对照菌株[pDB2711]和对照菌株[pDB2712]似乎将相似水平的rTf(N413Q、N611Q)分泌到培养基中。在BMMD和YEPD培养基中,对照菌株[pDB2711]和对照菌株[pDB2712]转化体之间分泌的水平相对一致,这说明即使在非选择性条件下,质粒稳定性对于高水平转铁蛋白分泌也是足够的。这与先前发表的有关重组PDGF-BB和HSA的数据形成对比,在先前发表的数据中显示将PDI1引入多拷贝2μm质粒对宿主有害。
表2:高细胞密度发酵的重组转铁蛋白效价
菌株 |
上 清(g.L-1) |
GP-HPLC |
SDS-PAGE |
对照[pDB2536] |
0.5/0.4 |
- |
可选择的对照[pDB2536] |
1.5/1.6 |
0.6 |
0.9/0.9 |
0.4/0.4/0.5 |
菌株A[pDB2536] |
0.7 |
0.6 |
0.6 |
- |
对照[pDB2711] |
3.5 |
3.6 |
图9显示在BMMD摇瓶培养物中从对照菌株[pDB2711]、对照菌株[pDB2712]、菌株A[pDB2536]、对照菌株[pDB2536]和可选的对照菌株[pDB2536]中分泌的转铁蛋白的还原性SDS-PAGE分析。来自对照菌株[pDB2711]和对照菌株[pDB2712]的所有样品在转铁蛋白(N413Q、N611Q)预期的位置显示丰富的蛋白质条带。来自不同菌株的转铁蛋白(N413Q、N611Q)条带的相对染色强度显示,菌株A[pDB2536]比对照菌株[pDB2536]和可选的对照菌株[pDB2536]产生更多的转铁蛋白,但是从对照菌株[pDB2711]和对照菌株[pDB2712]的分泌有更显著的增长。观察到的增加的重组转铁蛋白分泌伴随着这些菌株中增加的PDI1拷贝数。这表明Pdi1p水平在对照菌株、菌株A和可选择的对照菌株中限制转铁蛋白分泌,而增加的PDI1拷贝数是转铁蛋白分泌增加的原因。增加的PDI1拷贝数会增加PDI1的稳态表达水平,因此增加Pdi1p活性的量。这可以通过使用很多替代方法,在不增加PDI1基因拷贝数的情况下实现,例如可以通过增加转录速率(transcription rate),如使用更高效的启动子,或通过降低PDI1mRNA的清除速率(clearance rate)来增加稳态PDI1mRNA水平。或者,可以使用蛋白质工程来增强Pdi1p蛋白质的比活性或者转换数(turnover number)。
在高细胞密度发酵中,通过GP-HPLC分析和SDS-PAGE分析测得对照菌株[pDB2711]重组转铁蛋白(N413Q、N611Q)产量为大约3g.L-1(表2)。此生产水平比对照菌株、可选的对照菌株或包含pDB2536的菌株A高数倍。此外,对于生产用于人的治疗用途的蛋白质,表达系统如对照菌株[pDB2711]比使用菌株A的那些系统有优势,因为它们不包含细菌DNA序列。
结论
在包含整合入酵母基因组的PDI1基因额外拷贝的酿酒酵母菌株中研究了从多拷贝表达质粒(pDB2536)分泌重组转铁蛋白。也在用多拷贝表达质粒转化的酿酒酵母中研究了转铁蛋白分泌,其中已将PDI1基因插入多拷贝游离的转铁蛋白表达质粒(pDB2711)中。
与含有PDI1单拷贝的菌株相比,具有在内源的PDI1基因座整合入基因组的额外的PDI1基因拷贝的酿酒酵母菌株以更高的水平分泌重组转铁蛋白和非糖基化重组转铁蛋白(N413Q、N611Q)。通过使用pDB2711可实现PDI1拷贝数的进一步增加。如通过SDS-PAGE和GP-HPLC分析测定的,在用pDB2711转化的菌株的高细胞密度发酵中,以大约3g.L-1分泌重组转铁蛋白(N413Q、N611Q)。因此,增加的PDI1基因拷贝数可使从酿酒酵母分泌的重组转铁蛋白的数量大幅增加。
得出下述结论-
1.在从pDB2536的重组转铁蛋白表达(非糖基化转铁蛋白(N413Q、N611Q))和pDB2506的重组转铁蛋白表达(糖基化转铁蛋白)的摇瓶分析中,酿酒酵母菌株A将比对照菌株更高水平的两种重组转铁蛋白分泌到培养物上清中。这归因于整合在PDI1基因座的PDI1的额外拷贝。
2.与菌株A[pDB2536]相比,在多拷贝表达质粒上包含PDI1基因的对照菌株[pDB2711]在摇瓶培养和高细胞密度发酵中重组转铁蛋白(N413Q、N611Q)分泌都得到几倍的增加。
3.酵母如酿酒酵母中增加的PDI1拷贝数在产生期望的蛋白质(如期望的异源蛋白质),如来自转铁蛋白家族的那些蛋白质的过程中有优势。
4.包含额外的PDI1基因拷贝的基于pSAC35的质粒有利于生产来自转铁蛋白家族的蛋白质,及它们的衍生物,如融合体、突变体、域和截短形式。
实施例5
将PDI1基因插入2μm-样质粒中可增加从各种不同酿酒酵母菌株中重组转铁蛋白的分泌
酿酒酵母菌株JRY188 cir+(National Collection of Yeast Cultures)和MT302/28B cir+(Finnis等,1993,Eur.J.Biochem.,212,201-210)通过半乳糖诱导FLP从Yep351-GAL-FLP1中过量表达,消除(cure of)天然的2μm质粒,如Rose和Broach所述(1990,Meth.Enzymol.,185,234-279),以分别产生酿酒酵母菌株JRY188 cir0和MT302/28B cir0。
用pDB2931(WO 2005/061718的图14)和pDB2929(WO 2005/061718的图12)全部转化酿酒酵母菌株JRY188 cir0,MT302/28B cir0,S150-2B cir0(Cashmore等,1986,Mol.Gen.Genet.,203,154-162),CB11-63cir0(Zealey等,1988,Mol.Gen.Genet.,211,155-159)以成为亮氨酸原养型。在适当补充的缺少亮氨酸的基本培养基上选择转化体。将每个菌株的转化体接种到50mL摇瓶中的10mL YEPD中,在定轨摇床(orbital shaker)上于30℃、200rpm培育4天。收获培养物上清,通过火箭免疫电泳比较重组转铁蛋白效价(图10)。结果表明当PDI1存在于2μm质粒上时(pDB2929),所有酵母菌株上清中的转铁蛋白效价都高于其不存在于2μm质粒上时(pDB2931)的情况。
实施例6
构建在同一2μm-样质粒上包含各种PDI1基因和各种异源蛋白质的表达盒的表达载体
PCR扩增和将PDI1基因克隆进YIplac211:
通过PCR扩增来自酿酒酵母S288c和酿酒酵母SKQ2n的PDI1基因,以产生具有包含启动子序列的不同长度的5’非翻译区的DNA片段。设计PCR引物以将PCR产物克隆入YIplac211的EcoRI和BamHI位点中(Gietz&Sugino,1988,Gene,74,527-534)。也将其它限制性内切酶位点并入PCR引物中以促进随后的克隆。表3描述了构建的质粒,表4给出了用于扩增PDI1基因的PCR引物序列。表3描述了在这些基于YIplac211的质粒中PDI1启动子长度的差异。
通过如下方法产生pDB2939(WO 2005/061718的图27):用寡核苷酸引物DS248和DS250(表5)从酿酒酵母S288c基因组DNA中PCR扩增PDI1基因,然后用EcoRI和BamHI消化PCR产物并将大约1.98-kb片段克隆入已用EcoRI和BamHI切割的YIplac211(Gietz & Sugino,1988,Gene,74,527-534)。pDB2939的DNA测序鉴定了DS248序列中缺少的‘G’,其在表4中用粗体标记。用于PDI1基因测序的寡核苷酸引物列于表5中,并由公布的S288c的PDI基因序列(染色体III上的PDI1/YCL043C从坐标(coordinate)50221到48653,加上上游序列的1000个碱基对和下游序列的1000个碱基对。http://www.yeastgenome.org/,Genebank登录号NC001135)设计。
表3:包含PDI1基因的基于YIplac211的质粒
质粒 |
质粒基础 |
PDI1基因 |
PCR引物 |
来源 |
启动子 |
终止子 |
pDB2939 |
Yiplac211 |
S288c |
长(~210bp) |
→Bsu36I |
DS248+DS250 |
pDB2941 |
Yiplac211 |
S288c |
中(~140bp) |
→Bsu36I |
DS251+DS250 |
pDB2942 |
Yiplac211 |
S288c |
短(~80bp) |
→Bsu36I |
DS252+DS250 |
pDB2943 |
Yiplac211 |
SKQ2n |
长(~210bp) |
→Bsu36I |
DS248+DS250 |
pDB2963 |
Yiplac211 |
SKQ2n |
中(~140bp) |
→Bsu36I |
DS267+DS250 |
pDB2945 |
Yiplac211 |
SKQ2n |
短(~80bp) |
→Bsu36I |
DS252+DS250 |
表4:用于PCR扩增酿酒酵母PDI1基因的寡核苷酸引物
引物 |
序列 |
DS248 |
5’-GTCAGAATTCGAGCTCTACGTATTAATTAAGGCCGGCCAGGCCCGGGCTAGTCTCTTTTTCCAATTTGCCACCGTGTAGCATTTTGTTGT-3’ |
DS249 |
5’-GTCAGGATCCTACGTACCCGGGGATATCATTATCATCTTTGTCGTGGTCATCTTGTGTG-3’ |
DS250 |
5’-GTCAGGATCCTACGTACCCGGGTAAGGCGTTCGTGCAGTGTGACGAATATAGCG-3’ |
DS251 |
5’-GTCAGAATTCGAGCTCTACGTATTAATTAAGGCCGGCCAGGCCCGGGCCCGTATGGACATACATATATATATATATATATATATATATTTTGTTACGCG-3’ |
DS252 |
5’-GTCAGAATTCGAGCTCTACGTATTAATTAAGGCCGGCCAGGCCCGGGCTTGTTGCAAGCAGCATGTCTAATTGGTAATTTTAAAGCTGCC-3’ |
DS267 |
5’-GTCAGAATTCGAGCTCTACGTATTAATTAAGGCCGGCCAGGCCCGGGCCCGTATGGACATACATATATATATATATATATATATATATATATTTTGTTACGCG-3’ |
表5:用于酿酒酵母PDI1基因DNA测序的寡核苷酸引物
引物 |
序列 |
DS253 |
5’-CCTCCCTGCTGCTCGCC-3’ |
DS254 |
5’-CTGTAAGAACATGGCTCC-3’ |
DS255 |
5’-CTCGATCGATTACGAGGG-3’ |
DS256 |
5’-AAGAAAGCCGATATCGC-3’ |
DS257 |
5’-CAACTCTCTGAAGAGGCG-3’ |
DS258 |
5’-CAACGCCACATCCGACG-3’ |
DS259 |
5’-GTAATTCTGATCACTTTGG-3’ |
DS260 |
5’-GCACTTATTATTACTACGTGG-3’ |
DS261 |
5’-GTTTTCCTTGATGAAGTCG-3’ |
DS262 |
5’-GTGACCACACCATGGGGC-3’ |
DS263 |
5’-GTTGCCGGCGTGTCTGCC-3’ |
DS264 |
5’-TTGAAATCATCGTCTGCG-3’ |
DS265 |
5’-CGGCAGTTCTAGGTCCC-3’ |
DS266 |
5’-CCACAGCCTCTTGTTGGG-3’ |
M13/pUC引物(-40) |
5’-GTTTTCCCAGTCACGAC-3’ |
使用表3和表4中描述的PCR引物,并通过分别将大约1.90-kb和1.85-kb的EcoRI-BamHI片段克隆入YIplac211,相似地构建质粒pDB2941(WO2005/061718图28)和pDB2942(WO 2005/061718图29)。验证pDB2941和pDB2942中PDI1基因的DNA序列正确。
从包含来自pMA3a:C7(US 6,291,205)的PDI1基因的质粒DNA PCR扩增酿酒酵母SKQ2n PDI1基因序列,所述pMA3a:C7也称作Clone C7(前文中的Crouzet & Tuite,1987;前文中的Farquhar等,1991)。使用寡核苷酸引物DS248和DS250(表3和表4)扩增SKQ2n PDI1基因。用EcoRI和BamHI消化大约2.01-kb PCR产物并连接入已用EcoRI和BamHI切割的YIplac211(Gietz & Sugino,1988,Gene,74,527-534)以产生质粒pDB2943(WO2005/061718的图30)。SKQ2n PDI1序列的5’端类似于延长以包括EcoRI、SacI、SnaBI、PacI、FseI、SfiI和SmaI位点的平端化的SpeI位点,3’端延长至类似于平端Bsu36I位点的位点,其延伸以包括SmaI、SnaBI和BamHI位点。PDI1启动子长度为约210bp。使用表5中给出的寡核苷酸引物确定PDI1片段的完整DNA序列。这证实了存在酿酒酵母菌株SKQ2n的PDI蛋白质的编码序列(NCBI登录号CAA38402),但是在位置114有丝氨酸残基(而不是如先前发表的精氨酸残基)。类似地,以与pDB2939中的酿酒酵母S288c序列中相同的方式,pDB2943在DS248序列中也缺少“G”,其在表4中以粗体标记。
使用表3和表4中描述的PCR引物,并通过分别将大约1.94-kb和1.87-kb的EcoRI-BamHI片段克隆入YIplac211,相似地构建质粒pDB2963(WO2005/061718的图31)和pDB2945(WO 2005/061718的图32)。在pDB2963和pDB2945中确认PDI1基因的预期的DNA序列,其在氨基酸114的位置为丝氨酸密码子。
构建在REP2之后的XcmI位点插入不同的PDI1基因的基于pSAC35的rHA表达质粒:
构建基于pSAC35的质粒用于rHA与不同的PDI1基因的共表达(表6)。
表6:用于rHA与不同的PDI1基因共表达的基于pSAC35的质粒
质粒 |
质粒基础 |
在REP2之后XcmI位点的PDI1基因 |
异源蛋白表达盒(在NotI位点) |
来源 |
启动子 |
终止子 |
方向 |
pDB2982 |
pSAC35 |
SKQ2n |
长 |
→Bsu36I |
A |
rHA |
pDB2983 |
pSAC35 |
SKQ2n |
长 |
→Bsu36I |
B |
rHA |
pDB2984 |
pSAC35 |
SKQ2n |
中 |
→Bsu36I |
A |
rHA |
pDB2985 |
pSAC35 |
SKQ2n |
中 |
→Bsu36I |
B |
rHA |
pDB2986 |
pSAC35 |
SKQ2n |
短 |
→Bsu36I |
A |
rHA |
pDB2987 |
pSAC35 |
SKQ2n |
短 |
→Bsu36I |
B |
rHA |
pDB2976 |
pSAC35 |
S288c |
长 |
→Bsu36I |
A |
rHA |
pDB2977 |
pSAC35 |
S288c |
长 |
→Bsu36I |
B |
rHA |
pDB2978 |
pSAC35 |
S288c |
中 |
→Bsu36I |
A |
rHA |
pDB2979 |
pSAC35 |
S288c |
中 |
→Bsu36I |
B |
rHA |
pDB2980 |
pSAC35 |
S288c |
短 |
→Bsu36I |
A |
rHA |
pDB2981 |
pSAC35 |
S288c |
短 |
→Bsu36I |
B |
rHA |
首先将来自pDB2243(WO 2005/061718的图33,也如WO 00/44772所述)的rHA表达盒分离在2992-bp NotI片段上,随后将该片段克隆入pDB2688(WO 2005/061718的图4)的NotI位点以产生pDB2693(WO 2005/061718的图34)。将pDB2693用SnaBI消化,用小牛小肠碱性磷酸酶处理,并与包含来自pDB2943、pDB2963、pDB2945、pDB2939、pDB2941和pDB2942的PDI1基因的SnaBI片段连接。这产生质粒pDB2976到pDB2987(WO 2005/061718图35到46)。以与REP2相同的方向转录的PDI1被称作“方向A”,而以与REP2相反的方向转录的PDI1被称作“方向B”(表6)。
构建在REP2之后的XcmI位点插入不同PDI1基因的基于pSAC35的转铁蛋白表达质粒:
构建基于pSAC35的质粒用于重组转铁蛋白(N413Q、N611Q)与不同的PDI1基因的共表达(表7)。
表7:用于转铁蛋白与不同的PDI1基因共表达的基于pSAC35的质粒
质粒 |
质粒基础 |
在REP2之后XcmI位点的PDI1基因 |
异源蛋白表达盒(在NotI位点) |
来源 |
启动子 |
终止子 |
方向 |
pDB2929 |
pSAC35 |
SKQ2n |
长 |
→Bsu36I |
A |
rTf(N413Q、N611Q) |
pDB3085 |
pSAC35 |
S288c |
长 |
→Bsu36I |
A |
rTf(N413Q、N611Q) |
pDB3086 |
pSAC35 |
S288c |
由 |
→Bsu36I |
A |
rTf(N413Q、N611Q) |
pDB3087 |
pSAC35 |
S288c |
短 |
→Bsu36I |
A |
rTf(N413Q、N611Q) |
为了达到这目的,首先通过NotI消化和载体骨架环化从pDB2976、pDB2978和pDB2980缺失用于rHA表达的NotI表达盒。这产生质粒pDB3081(WO 2005/061718的图47)、pDB3083(WO 2005/061718的图48)和pDB3084(WO 2005/061718的图49),如表8所述。
表8:带有不同PDI1基因的基于pSAC35的质粒
质粒 |
质粒基础 |
在REP2之后XcmI位点的PDI1基因 |
异源蛋白表达盒(在NotI位点) |
来源 |
启动子 |
终止子 |
方向 |
pDB2690 |
pSAC35 |
SKQ2n |
长 |
→Bsu36I |
A |
无 |
pDB3081 |
pSAC35 |
S288c |
长 |
→Bsu36I |
A |
无 |
pDB3083 |
pSAC35 |
S288c |
中 |
→Bsu36I |
A |
无 |
pDB3084 |
pSAC35 |
S288c |
短 |
→Bsu36I |
A |
无 |
将来自pDB2928(WO 2005/061718的图11)的3256-bp NotI片段克隆入pDB3081、pDB3083和pDB3084的NotI位点,使得从转铁蛋白基因的转录与LEU2同向。这产生了如表7所示的质粒pDB3085(WO 2005/061718的图50)、pDB3086(WO 2005/061718的图51)和pDB3087(WO 2005/061718的图52)。
实施例7
在2μm-样质粒中插入并优化PDI1基因增加了由各种不同的酿酒酵母菌株分泌重组人血清白蛋白
使用修正的醋酸锂方法(Sigma酵母转化试剂盒,YEAST-1,规程2;(Ito等,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18)),用pDB2244(WO 00/44772)、pDB2976(WO 2005/061718的图35)、pDB2978(WO2005/061718的图37)或者pDB2980(WO 2005/061718的图39)转化酿酒酵母菌株JRY188 cir0、MT302/28B cir0、S150-2B cir0、CB11-63 cir0(均在前文描述)、AH22cir0(Mead等,1986,Mol.Gen.Genet.,205,417-421)和DS569 cir0(Sleep等,1991,Bio/Technology,9,183-187)以成为亮氨酸原养型。在具有适当补充物的BMMD-琼脂平板上选择转化体,然后点种(patch out)到具有适当补充物的BMMD-琼脂平板上。
将每个菌株的转化体接种到50mL摇瓶中的10mLYEPD中,在定轨摇床上于30℃、200rpm培育4天。收获培养物上清,用火箭免疫电泳比较重组白蛋白效价(图11和12)。结果表明,当PDI1存在于2μm质粒上时,来自所有酵母菌株的培养物上清中的白蛋白效价都高于PDI1基因不存在时的情况(pDB2244)。当质粒上缺少PDI1时培养物上清中的白蛋白效价取决于将哪个酵母菌株选作表达宿主,然而,当具有长启动子(~210-bp)的PDI1存在于2μm质粒(pDB2976)中时,观察到在大多数实例中测试到表达的最大增长。通过缩短,例如缺失调控位点,来修饰PDI1启动子具有控制该改进的作用。对于一株酵母菌株,已知为高产rHA的菌株(DS569),优选较短的启动子用于最佳的表达。
实施例8
基于2μm的质粒上的PDI1增强重组白蛋白融合体的分泌
研究了酿酒酵母SKQ2n PDI1基因与长启动子(~210-bp)的共表达对于重组白蛋白融合体表达的影响。
如WO 2005/061718的实施例9所述产生下面表9中所述质粒,所述文献的内容通过引用并入本文。
表9:编码白蛋白融合蛋白质的质粒的总结
白蛋白融合体 |
质粒名称 |
有PDI1 |
无PDI1 |
内皮他丁-白蛋白 |
pDB3100 |
pDB3099 |
血管他丁-白蛋白 |
pDB3107 |
pDB2765 |
Kringle5-(GGS)4GG-白蛋白 |
pDB3104 |
pDB2773 |
DX-890-(GGS)4GG-白蛋白 |
pDB3102 |
pDB3101 |
DPI-14-(GGS)4GG-白蛋白 |
pDB3103 |
pDB2679 |
AxokineTM-(GGS)4GG-白蛋白 |
pDB3106 |
pDB2618 |
人IL10-(GGS)4GG-白蛋白 |
pDB3105 |
pDB2621 |
使用修正的醋酸锂方法(Sigma酵母转化试剂盒,YEAST-1,规程2;(Ito等,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18))转化与前面实施例中所用的相同的对照酵母菌株以成为亮氨酸原养型。在BMMD-琼脂平板上选择转化体,随后点种到BMMD-琼脂平板上。
从10mL BMMD摇瓶培养物(24小时,30℃、200rpm)制备冻存的海藻糖储备物。
将每个菌株的转化体接种到50mL摇瓶中的10mL BMMD,并在定轨摇床上于30℃、200rpm培育4天。收获培养物上清并通过火箭免疫电泳比较重组白蛋白效价(图13)。结果表明,当PDI1存在于2μm质粒中时,来自所有酵母菌株的培养物上清中的白蛋白效价都高于PDI1不存在时的情况。
用SDS-PAGE分析进一步研究通过火箭免疫电泳检测到的白蛋白融合体表达的增加。将表达各种白蛋白融合体的YBX7的BMMD摇瓶培养物在定轨摇床上于30℃、200rpm培育4天。通过SDS-PAGE分析培养物上清的样品(图14)。观察到所研究的白蛋白融合体期望大小的蛋白质条带的丰度(abundance)增加。
实施例9
酿酒酵母ORM2和重组转铁蛋白在基于2μm质粒上的共表达
选择酿酒酵母对照菌株和菌株A(如实施例3所述)以研究转铁蛋白和ORM2基因从基于2μm质粒共表达时对转铁蛋白分泌的影响。通过质粒pDB3090、pDB3092和pDB3093(其包含rTf(N413Q、N611Q)和ORM2的表达盒)以及对照质粒pDB2931(其包含rTf(N413Q、N611Q)表达盒而无ORM2)将对照菌株和菌株A转化为亮氨酸原养型。这些质粒的构建在WO2005/061718的实施例10中描述,该文献的内容通过引用并入本文。在BMMD琼脂上选择转化体,并点种到BMMD琼脂上用于后续分析。
为了研究ORM2共表达对转铁蛋白分泌的作用,用包含ORM2/转铁蛋白共表达质粒的菌株接种10mL选择性(BMMD)和非选择性(YEPD)液体培养基。然后将摇瓶培养物在30℃振荡(200rpm)下培育4天。通过火箭凝胶免疫电泳(RIE)确定转铁蛋白分泌的相对水平(图15)。
在BMMD和YEPS培养基中,由对照菌株[pDB3090]和对照菌株[pDB3092]分泌的转铁蛋白的水平均高于由对照菌株[pDB2931]分泌的水平。相似地,在BMMD和YEPS培养基中,由菌株A[pDB3090]和菌株A[pDB3093]分泌的转铁蛋白的水平均高于由菌株A[pDB2931]分泌的水平。来自所有菌株A转化体的转铁蛋白分泌均高于同样培养基中生长的对照菌株转化体。菌株A在基因组上包含PDI1的额外拷贝,其增强了转铁蛋白分泌。因此在菌株A中,ORM2和PDI1表达的增加对转铁蛋白分泌具有累积效应。
实施例10
酿酒酵母PSE1和重组转铁蛋白在基于2μm质粒上的共表达
通过质粒pDB3097和pDB3098(其包含rTf(N413Q、N611Q)和PSE1的表达盒),以及对照质粒pDB2931(其包含rTf(N413Q、N611Q)的表达盒而无PSE1)将酿酒酵母对照菌株转化为亮氨酸原养型。WO 2005/061718的实施例11中描述了这些质粒的构建,该文献的内容通过引用并入本文。在BMMD琼脂上选择转化体并点种到BMMD琼脂上用于后续分析。
为了研究PSE1表达对转铁蛋白分泌的作用,用包含PSE1/转铁蛋白共表达质粒的菌株接种含有10mL选择性(BMMD)液体培养基的摇瓶。然后将摇瓶培养物在30℃振荡(200rpm)下培育4天。通过火箭凝胶免疫电泳(RIE)确定转铁蛋白分泌的相对水平(图16)。
在BMMD培养基中,由对照菌株[pDB3097]和对照菌株[pDB3098]分泌的转铁蛋白的水平高于由对照菌株[pDB2931]分泌的水平。因此,从基于2μm质粒表达PSE1增强了酿酒酵母的转铁蛋白分泌。在pDB3097和pDB3098中以相对于REP2基因的任一方向转录的PSE1基因改进了转铁蛋白分泌。
实施例11
酿酒酵母SSA1和重组转铁蛋白在基于2μm质粒上的共表达
用质粒pDB3094和pDB3095(其包含rTf(N413Q、N611Q)和SSA1的表达盒),以及对照质粒pDB2931(其包含rTf(N413Q、N611Q)的表达盒而无SSA1)将酿酒酵母对照菌株转化为亮氨酸原养型。WO 2005/061718的实施例12中描述了这些质粒的构建,该文献的内容通过引用并入本文。在BMMD琼脂上选择转化体并点种到BMMD琼脂上用于后续分析。
为了研究SSA1表达对转铁蛋白分泌的作用,用包含SSA1/转铁蛋白共表达质粒的菌株接种含有10mL选择性(BMMD)液体培养基的摇瓶。然后将摇瓶培养物在30℃振荡(200rpm)下培育4天。通过火箭凝胶免疫电泳(RIE)确定转铁蛋白分泌的相对水平(图17)。
在BMMD培养基中,由对照菌株[pDB3095]分泌的转铁蛋白的水平高于由对照菌株[pDB2931]和对照菌株[pDB3094]分泌的水平。因此,从基于2μm质粒表达SSA1增强了酿酒酵母的转铁蛋白分泌。在pDB3094中以相对于REP2基因相反方向转录的SSA1基因改进了转铁蛋白分泌。
实施例12
PDI1基因的破坏结合基于2μm质粒上的PDI1基因,增强了重组白蛋白的分泌和质粒稳定性
设计表11中列出的单链寡核苷酸DNA引物以扩增酵母PDI1编码区上游的区域和酵母PDI1编码区下游的另一个区域。
表11:寡核苷酸引物
引物 |
描述 |
序列 |
DS299 |
5’PDI1引物,38个碱基 |
5’-CGTAGCGGCCGCCTGAAAGGGGTTGACCGTCCGTCGGC-3’ |
DS300 |
5’PDI1引物,40个碱基 |
5’-CGTAAAGCTTCGCCGCCCGACAGGGTAACATATTATCAC-3’ |
DS301 |
3’PDI1引物,38个碱基 |
5’-CGTAAAGCTTGACCACGTAGTAATAATAAGTGCATGGC-3’ |
DS302 |
3’PDI1引物,41个碱基 |
5’-CGTACTGCAGATTGGATAGTGATTAGAGTGTATAGTCCCGG-3’ |
DS303 |
18个碱基 |
5’-GGAGCGACAAACCTTTCG-3’ |
DS304 |
20个碱基 |
5’-ACCGTAATAAAAGATGGCTG-3’ |
DS305 |
24个碱基 |
5’-CATCTTGTGTGTGAGTATGGTCGG-3’ |
DS306 |
14个碱基 |
5’-CCCAGGATAATTTTCAGG-3’ |
使用源自S288c基因组DNA作为模板,DNA引物DS299和DS300通过PCR扩增PDI1的5’区,而引物DS301和DS302扩增PDI1的3’区。PCR条件如下:1μL S288c模板DNA(0.01ng/μL、0.1ng/μL、1ng/μL、10ng/μL和100ng/μL)、5μL10×Buffer(Fast Start Taq+Mg,(Roche))、1μL 10mMdNTP’s、5μL每种引物(2μM)、0.4μLFast Start Taq,用水加至50μL。使用Perkin-Elmer Thermal Cycler 9700进行PCR。条件为:95℃变性4分钟[HOLD],然后[CYCLE]95℃变性30秒,45℃退火30秒,72℃延伸45秒的20个循环,然后[HOLD]72℃10分钟,之后[HOLD]4℃。用NotI和HindIII切割0.22kbp的PDI15’PCR产物,而用HindIII和PstI切割0.34kbp的PDI13’PCR产物。
用HindIII将质粒pMCS5(Hoheisel,1994,Biotechniques17,456-460)(WO2005/061718的图85)消化至完全,用T4DNA聚合酶和dNTPs平端化,并再连接以产生pDB2964(WO 2005/061718的图86)。
用HindIII消化质粒pDB2964,用小牛小肠磷酸酶处理,并与用NotI和PindIII消化的0.22kbp的PDI15’PCR产物和用HindIII和PstI消化的0.34kbp的PDI13’PCR产物连接以产生pDB3069(WO 2005/061718的图87),用正向和反向的通用引物和DNA测序引物DS303、DS304、DS305和DS306(表11)测定其序列。
用引物DS234和DS235(表12)从YIplac204(Gietz&Sugino,1988,Gene,74,527-534)扩增修饰的TRP1标记基因,其在PCR产物的任意一端并入HindIII限制位点。PCR条件如下:1μL模板YIplac204(0.01ng/μL、0.1ng/μL、1ng/μL、10ng/μL和100ng/μL)、5μL 10×Buffer(Fast Start Taq+Mg,(Roche))、1μL10mM dNTP’s、5μL每种引物(2μM)、0.4μLFast Start Taq,用水加至50μL。使用Perkin-Elmer Thermal Cycler 9600进行PCR。条件为:95℃变性4分钟[HOLD],然后[CYCLE]95℃变性30秒,45℃退火45秒,72℃延伸90秒的20个循环,然后[HOLD]72℃10分钟,之后[HOLD]4℃。用HindIII消化0.86kbp的PCR产物,并克隆进pMCS5的HindIII位点以产生pDB2778(WO 2005/061718的图88)。限制酶消化和用通用的正向与反向引物以及DS236、DS237、DS238和DS239(表12)测序确认修饰的TRP1基因的序列是正确的。
表12:寡核苷酸引物
引物 |
描述 |
序列 |
DS230 |
TRP15’UTR |
5’-TAGCGAATTC AATCAGTAAAAATCAACGG-3’ |
DS231 |
TRP15’UTR |
5’-GTCAAAGCTTCAAAAAAAGA AAAGCTCCGG-3’ |
DS232 |
TRP13’UTR |
5’-TAGCGGATCCGAATTCGGCGGTTGTTTGCAAGACCGAG-3’ |
DS233 |
TRP13’UTR |
5’-GTCAAAGCTTTAAAGATAATGCTAAATCATTTGG-3’ |
DS234 |
TRP1 |
5’-TGACAAGCTTTCGGTCGAAAAAAGAAAAGGAGAGG-3’ |
DS235 |
TRP1 |
5’-TGACAAGCTTGATCTTTTATGCTTGCTTTTC-3’ |
DS236 |
TRP1 |
5’-AATAGTTCAGGCACTCCG-3’ |
DS237 |
TRP1 |
5’-TGGAAGGCAAGAGAGCC-3’ |
DS238 |
TRP1 |
5’-TAAAATGTAAGCTCTCGG-3’ |
DS239 |
TRP1 |
5’-CCAACCAAGTATTTCGG-3’ |
CED005 |
ΔTRP1 |
5’-GAGCTGACAGGGAAATGGTC-3’ |
CED006 |
ΔTRP1 |
5’-TACGAGGATACGGAGAGAGG-3’ |
通过用HindIII消化从pDB2778分离0.86kbp的TRP1基因,并克隆进pDB3069的HindIII位点以产生pDB3078(WO 2005/061718的图89)和pDB3079(WO 2005/061718的图90)。通过用NotI/PstI消化,从pDB3078或pDB3079分离1.41kb的pdi1::TRP1破坏的DNA片段。
并入TRP1缺失的酵母菌株(trp1Δ)以这样的方式构建,使得一旦生成trp1Δ,基因组中就不应保留与TRP1标记基因(pDB2778)的同源性,以防止将来包含TRP1的构建体和TRP1基因座之间的同源重组。为了实现从选择的宿主菌株的基因组中完全去除天然的TRP1序列,设计寡核苷酸以扩增存在于整合载体YIplac204(Gietz & Sugino,1988,Gene,74,527-534)上的TRP1标记基因之外的TRP1基因的5’UTR和3’UTR。YIplac204的TRP1标记基因与天然/染色体的TRP1基因不同之处在于通过定点诱变将内部的HindIII、PstI和XbaI位点去除(Gietz & Sugino,1988,Gene,74,527-534)。从1.453kbp平端化的基因组片段EcoRI片段构建YIplac204修饰的TRP1标记基因,所述EcoRI片段包含TRP1基因和TRP1启动子的仅仅102bp(Gietz & Sugino,1988,Gene,74,527-534)。尽管这是相对短的启动子序列,但是显然足够补足trp1营养缺陷型突变(Gietz & Sugino,1988,Gene,74,527-534)。只使用距离TRP1 ORF起始位置5’方向102bp处的EcoRI位点上游的DNA序列产生5’TRP1UTR。3’UTR的选择是较不重要的,只要它在功能性修饰的TRP1标记3’端之外,将其选择在翻译终止密码子下游的85bp。
设计并构建单链寡核苷酸DNA引物以扩增TRP1基因的5’UTR和3’UTR区,使得在PCR扩增过程中可在后面克隆步骤要使用的PCR产物的末端增加限制酶位点。使用S288c基因组DNA作为模板,引物DS230和DS231(表12)通过PCR扩增TRP1的5’区,而引物DS232和DS233(表12)扩增TRP1的3’区。PCR条件如下:1μL模板S288c基因组DNA(0.01ng/μL、0.1ng/μL、1ng/μL、10ng/μL和100ng/μL),5μL 10×Buffer(Fast Start Taq+Mg,(Roche))、1μL10mM dNTP’s、5μL每种引物(2μM)、0.4μL Fast Start Taq,用水加至50μL。使用Perkin-Elmer Thermal Cycler 9600进行PCR。条件为:95℃变性4分钟[HOLD],然后[CYCLE]95℃变性30秒,45℃退火45秒,72℃延伸90秒的20个循环,然后[HOLD]72℃10分钟,之后[HOLD]4℃。
用EcoRI和HindIII切割0.19kbp的TRP15’UTR PCR产物,而用BamHI和HindIII切割0.2kbp的TRP13’UTR PCR产物,并连接入用BamHI/EcoRI线性化的pAYE505以产生质粒pDB2777(WO 2005/061718的图91)。WO95/33833中描述了pAYE505的构建。用正向和反向引物测定DNA序列,设计所述引物以从质粒骨架和克隆的插入物序列引发,通过测序确认了在两种情况下克隆的TRP1基因的5’和3’UTR序列具有期望的DNA序列。质粒pDB2777包含TRP1破坏的片段,所述片段含有源自TRP1的5’和3’UTR的序列的融合体。通过用EcoRI的完全消化将此0.383kbp的TRP1破坏的片段从pDB2777切除。
使用修正的醋酸锂方法(Sigma酵母转化试剂盒,YEAST1,规程2;(Ito等,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18)),用白蛋白表达质粒pDB2244转化酵母菌株DXY1(Kerry-Williams等,1998,Yeast,14,161-169)以成为亮氨酸原养型,从而产生酵母菌株DXY1[pDB2244]。WO00/44772中描述了白蛋白表达质粒pDB2244的构建。在BMMD-琼脂平板上选择转化体,随后点种到BMMD-琼脂平板上。从10mL BMMD摇瓶培养物(24小时,30℃,200rpm)制备冻存的海藻糖储备物。
使用掺入如Toyn等,(2000Yeast 16,553-560)所述的反选择性色氨酸类似物,5-氟邻氨基苯甲酸(5-FAA)的营养琼脂,用来自pDB2777的0.383kbpEcoRI TRP1破坏的DNA片段转化DXY1[pDB2244]以成为色氨酸营养缺陷型(autotrophy)。挑取对5-FAA的毒性作用有抗性的菌落并在第二轮5-FAA平板上划线以确认它们真的对5-FAA有抗性,并筛除任何背景生长(backgroundgrowth)。然后将这些生长的菌落重新点种到BMMD和加色氨酸的BMMD,以鉴定哪些是色氨酸营养缺陷型。
随后选择已显示为色氨酸营养缺陷型的菌落,通过用YCplac22(Gietz &Sugino,1988,Gene,74,527-534)转化来进一步分析,以确认哪个分离物是trp1。
使用跨越TRP1基因座的PCR扩增来确认trp-表型是由于此区域中的缺失造成的。从确认为对于5-FAA有抗性且在不添加色氨酸的情况下不能在基本培养基上生长的分离物制备基因组DNA。用引物CED005和CED006(表12)如下进行基因组TRP1基因座PCR扩增:1μL模板基因组DNA,5μL10×Buffer(Fast Start Taq+Mg,(Roche)),1μL 10mM dNTP’s,5μL每种引物(2μM)、0.4μL Fast Start Taq,用水加至50μL。用Perkin-Elmer Thermal Cycler9600进行PCR。条件是:94℃变性10分钟[HOLD],然后[CYCLE]94℃变性30秒,55℃退火30秒,72℃延伸120秒的40个循环,然后[HOLD]72℃10分钟,然后[HOLD]4℃。野生型TRP1基因座的PCR扩增得到大小为1.34kbp的PCR产物,而跨越缺失的TRP1区的扩增得到少0.50kbp的0.84kbp PCR产物。PCR分析将源自一株DXY1的trp-菌株(DXY1 trp1Δ[pDB2244])鉴定为经历了期望的缺失事件。
如Sleep等,(1991,Bio/Technology,9,183-187)所述,将酵母菌株DXY1trp1Δ[pDB2244]消除表达质粒pDB2244。使用修正的醋酸锂方法(Sigma酵母转化试剂盒,YEAST-1,规程2;(Ito等,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18)),用pDB2244、pDB2976、pDB2977、pDB2978、pDB2979、pDB2980或pDB2981重新转化DXY1trp1Δcir0以成为亮氨酸原养型。在补充色氨酸的BMMD-琼脂平板上选择转化体,并随后点种到补充色氨酸的BMMD-琼脂平板上。从补充色氨酸的10mL BMMD摇瓶培养物(24小时,30℃,200rpm)制备冻存的海藻糖储备物。
使用修正的醋酸锂方法(Sigma酵母转化试剂盒,YEAST-1,规程2;(Ito等,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18)),用通过NotI/PstI消化从pDB3078分离的1.41kb pdi1::TRP1破坏的DNA片段转化酵母菌株DXY1 trp1Δ[pDB2976]、DXY1 trp1Δ[pDB2977]、DXY1 trp1Δ[pDB2978]、DXY1 trp1Δ[pDB2979]、DXY1 trp1Δ[pDB2980]或DXY1 trp1Δ[pDB2981]以成为色氨酸原养型。在BMMD-琼脂平板上选择转化体,并随后点种到BMMD-琼脂平板上。
将每株菌的6个转化体接种到50mL摇瓶中的10mL YEPD,并在定轨摇床上于30℃、200rpm培育4天。收获培养物上清和细胞生物量。从色氨酸原养型和DXY1[pDB2244]制备基因组DNA(Lee,1992,Biotechniques,12,647)。用引物DS236和DS303(表11和12)通过如下PCR扩增基因组PDI1基因座:1μL模板基因组DNA,5μL10×Buffer(Fast Start Taq+Mg,(Roche)),1μL 10mM dNTP’s,5μL每种引物(2μM)、0.4μL Fast Start Taq,用水加至50μL。用Perkin-Elmer Thermal Cycler 9700进行PCR。条件为:94℃变性4分钟[HOLD],然后[CYCLE]94℃变性30秒,50℃退火30秒,72℃延伸60秒的30个循环,然后[HOLD]72℃10分钟,然后[HOLD]4℃。野生型PDI1基因座的PCR扩增未得到PCR产物,而跨越缺失的PDI1区的扩增得到0.65
kbp的PCR产物。PCR分析鉴定测试的所有36个可能的pdi1::TRP1菌株都具有期望的pdi1::TRP1缺失。
通过火箭免疫电泳比较重组白蛋白效价(图18)。在每组中,DXY1 trp1Δ[pDB2976]、DXY1 trp1Δ[pDB2978]、DXY1 trp1Δ[pDB2980]、DXY1 trp1Δ[pDB2977]和DXY1 trp1Δ[pDB2979]的所有六个pdi1::TRP1破坏株具有非常相似的rHA生产能力。只有DXY1 trp1Δ[pDB2981]的六个pdi1::TRP1破坏株显示rHA表达效价的变化。将图18中所示的六个pdi1::TRP1破坏株涂布到YEPD琼脂上以分离单菌落,然后重新点种到BMMD琼脂上。
将DXY1 trp1Δpdi1::TRP1[pDB2976]、DXY1 trp1Δpdi1::TRP1[pDB2978]、DXY1 trp1Δpdi1::TRP1[pDB2980]、DXY1 trp1Δpdi1::TRP1[pDB2977]、DXY1 trp1Δpdi1::TRP1[pDB2979]和DXY1 trp1Δpdi1::TRP1[pDB2981],以及DXY 1[pDB2244]、DXY1[pDB2976]、DXY 1[pDB2978]、DXY1[pDB2980]、DXY1[pDB2977]、DXY1[pDB2979]和DXY1[pDB2981]的三个单细胞的分离物接种到50mL摇瓶中的10mL YEPD中并在定轨摇床上于30℃、200rpm培养4天。收获培养物上清,并通过火箭免疫电泳比较重组白蛋白效价(图19)。将图19中所示的13个野生型PDI1和pdi1::TRP1破坏株涂布到YEPD琼脂上以分离单菌落。然后将每个菌株的100个单细胞的菌落重新点样到包含山羊抗HAS抗体的BMMD琼脂或者YEPD琼脂上以检测重组白蛋白的表达(Sleep等,1991,Bio/Technology,9,183-187)并对每个菌落的Leu+/rHA+、Leu+/rHA-、Leu-/rHA+或Leu-/rHA-表型进行评分(表13)。
表13:
|
PDI1 |
pdi1::TRP1 |
|
Leu+rHA+ |
Leu-rHA+ |
Leu+rHA- |
Leu-rHA- |
Leu+rHA+ |
Leu-rHA+ |
Leu+rHA- |
Leu-rHA- |
pDB2244 |
100 |
0 |
0 |
0 |
|
|
|
|
pDB2976 |
7 |
0 |
47 |
46 |
97 |
0 |
3 |
0 |
pDB2978 |
86 |
0 |
0 |
14 |
100 |
0 |
0 |
0 |
pDB2980 |
98 |
0 |
0 |
2 |
100 |
0 |
0 |
0 |
pDB2977 |
0 |
0 |
4 |
96 |
100 |
0 |
0 |
0 |
pDB2979 |
69 |
0 |
6 |
25 |
100 |
0 |
0 |
0 |
pDB2981 |
85 |
0 |
0 |
15 |
92 |
0 |
0 |
8 |
这些数据说明当将PDI1基因用作无染色体编码的PDI的宿主菌株中质粒上的选择标记时,甚至在非选择性培养基如示例的丰富培养基中,质粒保留得到增加。
实施例13
构建基于pSAC35的表达载体pDB3175-pDB3182用于PDI1与来自2μmUL-区中SnaBI/NotI-位点的重组人白蛋白或转铁蛋白(N413Q、N611Q)的共表达
将来自设计用于分泌重组人白蛋白的基于pSAC35的表达载体pAYE316(Sleep等,1991,Biotechnology(NY),9,183-187)的NotI表达盒克隆入大肠杆菌克隆载体pBST(+)(Sleep等,2001,Yeast,18,403-421)的唯一的NotI-位点,以产生质粒pQC262e。随后用寡核苷酸LRE49(表14)通过定点诱变(Kunkel等,1987,Methods Enzymol.,154,367-382),修饰pQC262e以在表达盒的ADH1终止子区NotI位点紧邻上游导入唯一的Asp718I-位点。
表14:突变的寡核苷酸
引物 |
描述 |
序列 |
LRE49 |
突变的45个碱基的ADH1终止子区 |
5’-GCTAGCGTCGACAAGCTTGCGGCGCGGTACCGTGTGGAAGAACG-3’ |
这产生质粒pAYE560(图21)。将具有长(~210-bp)启动子的酿酒酵母SKQ2n PDI1基因从pDB2952(WO 2005/061719的图46,该文献的内容通过引用并入本文)分离到1.96-kb SmaI片段上。在用Asp718I消化,用T4DNA聚合酶填充3’-凹入端,并用小牛小肠碱性磷酸酶处理平端化的产物后,将pDB2952 PDI1片段克隆入pAYE560的唯一的Asp718I-位点。这产生质粒pDB3171(图22),其具有以与rNA相同的方向转录的PDI1基因,和pDB3172(图23),其具有PDI1和rHA基因的会聚转录(converging transcription)。
通过将来自pDB3171的~5.1kb rHA→PDI1→NotI表达盒克隆入已用NotI和小牛小肠碱性磷酸酶消化的pSAC35以产生pDB3175和pDB3176(图24和25)。通过类似地将来自pDB3172的~5.1kb NotI rHA→←PDI1表达盒克隆入已用NotI和小牛小肠碱性磷酸酶消化的pSAC35以产生pDB3177和pDB3178(图26和27)。
为了构建NotI表达盒用于重组未糖基化的人转铁蛋白(N413Q、N611Q)与具有长(~210-bp)启动子的酿酒酵母SKQ2n PDI1基因的共表达,将来自pDB3171的~6.1-kb AflII-SphI片段与来自pDB2928(WO 2005/061718的图11,该文献的内容通过引用并入本文)的~2.4-kb AflII-SphI片段相连接,从而将rHA编码和邻近序列替换为用于转铁蛋白(N413Q、N611Q)分泌的那些序列。这产生质粒pDB3173(图28),其具有以与rTf(N413Q、N611Q)相同的方向转录的PDI1基因,和pDB3174(图29),其具有PDI1和rTf(N413Q、N611Q)基因的会聚转录。
通过将来自pDB3173的~5.2kb rTf→PDI1→NotI表达盒克隆入已用NotI和牛小肠碱性磷酸酶消化的pSAC35以产生pDB3179和pDB3180(图30和31)。通过将来自pDB3174的~5.2kb NotI rTf→←PDI1表达盒克隆入已用NotI和牛小肠碱性磷酸酶消化的pSAC35以产生pDB3181和pDB3182(图32和33)。
实施例14
在基于pSAC35的表达载体UL区域中的SnaBI/NotI-位点的酿酒酵母PDI1作为酿酒酵母菌株DXY1Δtrp1 pdi1.:TRP1中的选择标记
使用修正的醋酸锂方法(Sigma酵母转化试剂盒,YEAST1,规程2;(Ito等,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18)),用基于pSAC35的质粒pAYE316、pDB3175、pDB3176、pDB3177、pDB3178、pDB2931、pDB3179、pDB3180、pDB3181和pDB3182转化酵母菌株DXY1(Kerry-Williams等,1998,Yeast,14,161-169)和DXY1 Δtrp1(参见WO2005/061718的实施例13,该文献的内容通过引用并入本文)以成为亮氨酸原养型。在具有适当补充物的BMMD-琼脂平板上选择转化体,并随后点种到具有适当补充物的BMMD琼脂平板上。
使用修正的醋酸锂方法(Sigma酵母转化试剂盒,YEAST-1,规程2;(Ito等,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18)),用通过NotI/PstI消化从pDB3078分离的1.41kb pdi1::TRP1破坏的DNA片段转化DXY1 Δtrp1[pDB3175]、DXY1 Δtrp1[pDB3176]、DXY1 Δtrp1[pDB3177]、DXY1 Δtrp1[pDB3178]、DXY1 Δtrp1[pDB3179]、DXY1 Δtrp1[pDB3180]、DXY1 Δtrp1[pDB3181]和DXY1 Δtrp1[pDB3182]以成为色氨酸原养型(参见WO 2005/061718的实施例13)。在BMMD-琼脂平板上选择转化体,并随后点种到BMMD-琼脂平板上。
使用寡核苷酸引物CF247和DS236(表15)通过诊断PCR扩增大约810-bp的产物来证实用TRP1标记破坏PDI1基因。CF247结合在破坏位点上游的PDI1启动子区,而DS236结合在TRP1基因中。
表15:寡核苷酸测序引物
引物 |
描述 |
序列 |
CF247 |
PDI1启动子区,20个碱基 |
5’-GCGCGTTTTCATTAGTGCCC-3’ |
DS236 |
TRP1编码区,19个碱基 |
5’-AAATAGTTCAGGCACTCCG-3’ |
将DXY1 Δtrp1、包含pDB3175-pDB3182的DXY1 Δtrp1和推定的pdi1::TRP1破坏株接种到50mL摇瓶中的10mL YEPD,在定轨摇床中于30℃、200rpm培育4天。从生物质制备基因组DNA(Lee,1992,Biotechniques,12,677)以随后用作诊断PCR中的模板DNA。
将0.5μL模板基因组DNA,2.5μL 10×Buffer(Fast Start Taq+Mg,(Roche)),0.5μL 10mM dNTP’s,2.5μL每种引物(2μM),0.2μL Fast Start Taq混合并加水至25μL。使用DyadTM DNA Engine Peltier thermal cycler(GRI)进行如下PCR:在95℃变性4分钟,然后95℃30秒、55℃30秒和72℃1分钟的25个循环,然后在72℃延伸10分钟。只有从包含整合在pdi1基因座的TRP1基因的DNA中扩增了~810-bp的PCR产物。成功地鉴定了包含pDB3175-pDB3182的DXY1 Δtrp1 pdi1::TRP1。如所期望的,对照DXY1 Δtrp1或者包含pDB3175-pDB3182的DXY1 Δtrp1没有产生PCR产物。
比较包含pDB3175-pDB3182的DXY1和包含pDB3175-pDB3182的DXY1 Δtrp1 pdi1::TRP1的质粒稳定性和在YEPD摇瓶培养物中重组人白蛋白或转铁蛋白(N413Q、N611Q)的分泌。用上述菌株接种10mL摇瓶并在30℃、200rpm生长4天。将样品涂布到YEPD-琼脂平板上并长成单菌落。将50个随机选择的菌落影印点种到BMMD和YEPD平板上并于30℃培育。将在两种培养基上都能生长的菌落百分比作为质粒稳定性的评分。表16和17中所示的结果说明所有质粒pDB3175-pDB3182在DXY1中的稳定性都小于100%,不管克隆在SnaBI/NotI位点的PDI1和rTf/rHA基因的相对方向如何。然而,在包含pDB3175-pDB3182的DXY1 Δtrp1 pdi1::TRP1的所有情况中都测定出100%的质粒稳定性。因此,使用PDI1作为基于pSAC35的载体的SnaBI/NotI位点的唯一选择性标记在丰富培养基中得到100%的质粒稳定性。
表16:在UL区域中的SnaBI/NotI位点包含重组白蛋白基因和酿酒酵母PDI1基因的基于pSAC35的载体在菌株DXY1和DXY1 Δtrp1 pdi1::TRP1中的质粒稳定性。用DXY1[pDB3175]、DXY1[pDB3176]、DXY1[pDB3177]、DXY1[pDB3178]、DXY1 Δtrp1 pdi1::TRP1[pDB3175]、DXY1 Δtrp1pdi1::TRP1[pDB3176]、DXY1 Δtrp1 pdi1::TRP1[pDB3177]和DXY1 Δtrp1pdi1::TRP1[pDB3178]接种10mL YEPD摇瓶,并于30℃、200rpm生长4天。将样品涂布到YEPD-琼脂平板上并生长成单菌落。将50个随机选择的菌落影印点种到BMMD和YEPD平板上并于30℃培育。将在两种培养基上都能生长的菌落百分比作为质粒稳定性的评分。
质粒 |
SnaBI/NotI盒* |
质粒稳定性(%原养型) |
DXY1 |
DXY1 Δtrp1 |
DXY1 Δtrp1pdi1::TRP1 |
pDB3175 |
LEU2 rHA PDI1→→→ |
96 |
0 |
100 |
pDB3176 |
LEU2 PDI1 rHA→←← |
68 |
0 |
100 |
pDB3177 |
LEU2 rHA PDI1→→← |
86 |
0 |
100 |
pDB3178 |
LEU2 PDI1 rHA→→← |
28 |
0 |
100 |
*箭头表示相对于LEU2基因的转录方向。
表17:在UL区域中的SnaBI/NotI位点包含重组转铁蛋白基因和酿酒酵母PDI1基因的基于pSAC35的载体在菌株DXY1和DXY1 Δtrp1 pdi1::TRP1中的质粒稳定性。用DXY1[pDB3179]、DXY1[pDB3180]、DXY1[pDB3181]、DXY1[pDB3182]、DXY1 Δtrp1 pdi1::TRP1[pDB3179]、DXY1 Δtrp1pdi1::TRP1[pDB3180]、DXY1 Δtrp1 pdi1::TRP1[pDB3181]和DXY1 Δtrp1pdi1::TRP1[pDB3182]接种10mL YEPD摇瓶,并于30℃、200rpm生长4天。将样品涂布到YEPD-琼脂平板上并生长成单菌落。将50个随机选择的菌落影印点种到BMMD和YEPD平板上并于30℃培育。将在两种培养基上都能生长的菌落百分比作为质粒稳定性的评分。
质粒 |
SnaBI/NotI盒 |
质粒稳定性(%原养型) |
DXY1 |
DXY1 Δtrp1 |
DXY1pdi1::TRP1 |
pDB3179 |
LEU2 rTf PDI1→→→ |
56 |
0 |
100 |
pDB3180 |
LEU2 PDI1 rTf→←← |
36 |
0 |
100 |
pDB3181 |
LEU2 rTf PDI1→→← |
28 |
0 |
100 |
pDB3182 |
LEU2 PDI1 rTf→→← |
15 |
0 |
100 |
*箭头表示相对于LEU2基因的转录方向。
比较包含pDB3175-pDB3182的DXY1和包含pDB3175-pDB3182的DXY1 Δtrp1 pdi1::TRP1的重组人白蛋白和转铁蛋白(N413Q、N611Q)的分泌。图34显示在用TRP1破坏基因组PDI1基因将质粒稳定性提高到100%之后(表16),对于插入SnaBI位点的PDI1,重组人白蛋白效价有所降低。然而,这一点完全通过基因组中破坏PDI1之后基因稳定性的增加得到了补偿,基因稳定性的增加可增加异源蛋白质分泌的可重复性和可靠性,从而产生在稳定的蛋白质生产,特别是在长时间培养,如间歇式(fill and draw)发酵或连续培养发酵周期(campaign)中更有用的工业生物体。此外,当PDI1位于pSAC35的REP2之后的XcmI位点时(实施例12),用TRP1破坏基因组PDI1基因以增强质粒稳定性后rHA效价没有明显下降(表13)。这表明对于在表达rHA的基于2μm质粒上的PDI1来说,XcmI位点相比SnaBI位点是优选的(但不是必需的)。然而,可例如通过改变PDI1启动子的长度(实施例7)来调节PDI1的表达,从而观察到重组蛋白质分泌的增加。在上述实验中使用的是长PDI1启动子,这不是紧密相关的rHA高产菌株DS569中最佳rHA分泌的优选启动子长度:该菌株中短启动子导致了rHA分泌增加。在pSAC35的REP2之后的XcmI位点的PDI1中包含长PDI1启动子的DXY1[pDB2977]中破坏基因组PDI1的情况中(图19),分析包括了三个单独分离物(不是图34所示的一个分离物的三次重复),并显示rHA效价没有降低。此外,破坏基因组PDI1基因后,这些培养物清楚地显示一致性(consistency)和可重复性增加。
图35中,在基于pSAC35的载体(其自身不是100%稳定的)上不含PDI1的DXY1[pDB2931]和包含质粒pDB3179-pDB3182、在SnaBI/NotI位点含有PDI1的菌株之间观察到重组转铁蛋白分泌有大的增加。在包含质粒pDB3179-pDB3182的DXY1 Δtrp1 pdi1::TRP1中,质粒上的PDI1充当唯一的选择性标记并导致遗传稳定性的改善(参见表17),其中观察到100%的质粒稳定性而没有减少重组转铁蛋白分泌。因此,通过将PDI1置于转铁蛋白表达质粒上并破坏基因组中的PDI1,总体作用是增强重组蛋白质的分泌,也可改善生产生物体的遗传稳定性。