CN1922326A - 2μm家族质粒及其用途 - Google Patents

2μm家族质粒及其用途 Download PDF

Info

Publication number
CN1922326A
CN1922326A CNA2004800420229A CN200480042022A CN1922326A CN 1922326 A CN1922326 A CN 1922326A CN A2004800420229 A CNA2004800420229 A CN A2004800420229A CN 200480042022 A CN200480042022 A CN 200480042022A CN 1922326 A CN1922326 A CN 1922326A
Authority
CN
China
Prior art keywords
protein
plasmid
sequence
gene
plasmids
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800420229A
Other languages
English (en)
Other versions
CN1922326B (zh
Inventor
达雷尔·斯利普
克里斯托弗·J·A·芬尼斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerbumeidikesi Medical Co
Original Assignee
Delta Biotechnology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Delta Biotechnology Ltd filed Critical Delta Biotechnology Ltd
Publication of CN1922326A publication Critical patent/CN1922326A/zh
Application granted granted Critical
Publication of CN1922326B publication Critical patent/CN1922326B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • A61P17/02Drugs for dermatological disorders for treating wounds, ulcers, burns, scars, keloids, or the like
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/08Plasma substitutes; Perfusion solutions; Dialytics or haemodialytics; Drugs for electrolytic or acid-base disorders, e.g. hypovolemic shock

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Mycology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hematology (AREA)
  • Diabetes (AREA)
  • Dermatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明提供了在REP2基因或FLP基因中至少其一的最后一个功能性密码子后面的第一个碱基和与所述基因相邻的反向重复片段中FRT位点前面的最后一个碱基之间包含多核苷酸序列插入、删除和/或替代的2μm家族质粒。

Description

2μm家族质粒及其用途
                            发明领域
本申请涉及改良的质粒及其用途。
                            发明背景
已经证明,某些密切相关的芽殖酵母(budding yeast)物种含有天然存在的环状双链DNA质粒。这些质粒统称为2μm家族质粒,包括来自鲁氏接合糖酵母(Zygosaccharomyces rouxii,以前归入双孢接合糖酵母Zygosaccharomyces bisporus)的pSR1、pSB3或pSB4,来自拜列氏接合糖酵母(Zygosaccharomyces bailii)的pSB1或pSB2,来自发酵接合糖酵母(Zygosaccharomyces fermentati)的pSM1,来自果蝇克鲁维氏酵母(Kluyveromyces drosophilarum)的pKD1,来自膜醭毕赤氏酵母(Pichiamembranaefaciens)的未命名质粒(下文称为“pPM1”),及来自啤酒糖酵母(Saccharomyces cerevisiae)(Volkert等人,1989,Microbiological Reviews,53,299;Painting等人,1984,J.Applied Bacteriology,56,331)和其它糖酵母物种诸如卡尔斯伯糖酵母(S.carlsbergensis)的2μm质粒和变体(诸如Scp1、Scp2和Scp3)。作为一个质粒家族,这些分子共享一系列共有特征,即它们通常在质粒的对边(opposite sides)具有两个反向重复片段,具有6kb左右(范围为4757至6615bp)的相似大小,至少三个开放读码框,其中一个编码位点特异性重组酶(诸如2μm中的FLP),以及自主复制序列(ARS),也称为复制起点(ori),位于反向重复片段之一的末端附近(Futcher,1988,Yeast,4,27;Murray等人,1988,J.Mol.Biol.,200,601;及Toh-e等人,1986,Basic Life Sci.,40,425)。尽管它们缺乏可辨认的DNA序列同源性,然而它们共享的开放读码框的分子构造和功能保守性证明了家族成员之间的共有联系。
2μm质粒(图1)是6318bp双链DNA质粒,在大多数啤酒糖酵母菌株中是内源的,每个单倍体基因组有60-100个拷贝。2μm质粒包含由两个599bp反向重复序列分开的小独特(US)区和大独特(UL)区。反向重复序列的位点特异重组导致A型和B型质粒之间的体内互变(Volkert和Broach,1986,Cell,46,541)。两种形式的2μm质粒只有它们独特区的相对取向不同。
尽管来自啤酒糖酵母的克隆2μm质粒(也称为Scp1)的DNA测序给出了6318bp的大小(Hartley和Donelson,1980,Nature,286,860),然而已知存在其它略微较小的2μm变体Scp2和Scp3,分别是称为STB的区域中125bp和220bp小段删除的结果(Cameron等人,1977,Nucl.Acids Res.,4,1429;Kikuchi,1983,Cell,35,487;及Livingston和Hahne,1979,Proc.Natl.Acad.Sci.USA,76,3727)。在一项研究中,来自世界各地的天然糖酵母菌株中约80%含有与2μm同源的DNA(根据Southern印迹分析)(Hollenberg,1982,Current Topics in Microbiology and Immunobiology,96,119)。此外,在啤酒糖酵母和卡尔斯伯糖酵母中发现的天然2μm质粒群内存在变异(遗传多态性),NCBI序列(编号NC 001398)是一个实例。
2μm质粒具有核定位,而且展示高水平的有丝分裂稳定性(Mead等人,1986,Molecular & General Genetics,205,417)。2μm质粒的固有稳定性源自质粒编码的拷贝数扩增和分配机制,它在嵌合载体的开发过程中易于受到损害(Futcher和Cox,1984,J.Bacteriol.,157,283;Bachmair和Ruis,1984,Monatshefte für Chemie,115,1229)。将含有2μm质粒的酵母菌株称为[cir+],而将不含2μm质粒的酵母菌株称为[cir0]。
2μm质粒的US区含有REP2和FLP基因,而UL区含有REP1和D(也称为RAF)基因、STB基因座和复制起点(Broach和Hicks,1980,Cell,21,501;Sutton和Broach,1985,Mol.Cell.Biol.,5,2770)。Flp重组酶结合反向重复片段内的FRT位点(Flp识别靶)以介导位点特异重组,这对于体内天然质粒扩增和质粒拷贝数控制是至关重要的(Senecoff等人,1985,Proc.Natl.Acad.Sci.USA,82,7270;Jayaram,1985,Proc.Natl.Acad.Sci.USA,82,5875)。Flp重组酶活性的变化能够显著影响2μm家族质粒的拷贝数(Sleep等人,2001,Yeast,18,403;Rose和Broach,1990,MethodsEnzymol.,185,234)。Rep1和Rep2蛋白质介导质粒分离,尽管它们的作用模式尚不清楚(Sengupta等人,2001,J.Bacteriol.,183,2306)。它们还抑制FLP基因的转录(Reynolds等人,1987,Mol.Cell.Biol.,7,3566)。
2μm质粒的FLP和REP2基因由不同的启动子转录,且它们之间显然没有已定义的居间序列。FLP和REP2转录本都在反向重复序列内的相同序列基序处终止,分别在它们翻译终止密码子后面的24bp和178bp处(Sutton和Broach,1985,Mol.Cell.Biol.,5,2770)。
在FLP的情况中,C端编码序列也位于反向重复序列内。此外,两个反向重复序列在599bp上高度保守,认为这种特征有利于体内的高效质粒复制和扩增,尽管只有FRT位点(少于65bp)是体内位点特异重组所必需的(Senecoff等人,1985,Proc.Natl.Acad.Sci.USA,82,7270;Jayaram,1985,Proc.Natl.Acad.Sci.USA,82,5875;Meyer-Leon等人,1984,Cold SpringHarbor Symposia On Quantitative Biology,49,797)。Flp的关键催化残基是精氨酸308和酪氨酸343(其是必需的),而组氨酸309和组氨酸345促进链切割(Prasad等人,1987,Proc.Natl.Acad.Sci.USA,84,2189;Chen等人,1992,Cell,69,647;Grainge等人,2001,J.Mol.Biol.,314,717)。
在Rep2中描述了两个功能性结构域。残基15-58形成Rep1结合结构域,而残基59-296含有自我缔合和STB结合区(Sengupta等人,2001,J.Bacteriol.,183,2306)。
缺乏2μm质粒的许多必需功能区但保留功能性顺式元件ARS和STB的2μm质粒的嵌合或大段删除的突变衍生物不能在细胞分裂时在母细胞和子细胞之间有效分配。如果通过例如在宿主内提供功能性2μm质粒而反式提供这些功能即所谓的[cir+]宿主,那么这些质粒就能这样做。
先前已经将目的基因插入2μm质粒的UL区。例如,参阅EP 0 286 424中的质粒pSAC3U1。然而,对于能够有效插入2μm质粒的UL区且在US和UL区之间不产生过度不对称性的DNA数量很可能存在限制。因此,2μm质粒的US区对于插入额外DNA序列特别有吸引力,因为这趋向于使反向重复片段两侧的DNA片段的长度相等。
其中质粒早就因导入酵母选择标记和相邻DNA序列而塞满的表达载体,诸如图2所示,尤其如此。例如,图2所示质粒包含β-内酰胺酶基因(用于氨苄青霉素抗性)、LEU2选择标记和寡核苷酸接头,其中后两种插入2μm家族非整合载体pSAC3UL区内唯一SnaBI位点(参阅EP 0 286 424)。图2所示质粒在转化到酵母中后遗失XbaI位点之间含有氨苄青霉素抗性基因的大肠杆菌DNA。这在Chinery和Hinchliffe,1989,Curr.Genet.,16,21和EP 0 286 424中有所描述,其中这些类型的载体称为“非整合载体”。在图2所示塞满状态中,不太容易看出哪里可以进行进一步的多核苷酸插入。接头内的NotI位点已经用于插入额外的多核苷酸,但是这促成了UL和US区之间的进一步不对称性(Sleep等人,1991,Biotechnology(NY),9,183)。
我们先前试图将额外DNA插入2μm质粒的US区并维持其高度固有质粒稳定性。在2μm家族非整合质粒pSAC300中,含有URA3基因的1.1kb DNA片段以这样一种方式插入US区中REP2和FLP之间的EagI位点,使得URA3基因的转录与REP2转录方向相同(参阅EP 0 286 424)。在通过pSAC300将S150-2B[cir0]转化成尿嘧啶原养型后,它显示出显著不如URA3插入2μmUL区的可比较载体(在30代内损失0-10%质粒)来得稳定(在30代内损失50%质粒)(Chinery和Hinchliffe,1989,Curr.Genet.,16,21;EP 0 286424)。由此,EagI位点处的插入可能干扰FLP表达,并得出结论,即插入位置可能对由此产生的质粒的稳定性具有深远影响,这个结论得到了Bijvoet等人,1991,Yeast,7,347的证实。
希望将其它多核苷酸序列插入2μm家族质粒。例如,可能希望插入编码宿主衍生蛋白质、重组蛋白、或是非编码的反义或RNA干扰(RNAi)转录本的多核苷酸序列。此外,希望将多种其它多核苷酸序列导入2μm家族质粒,从而提供这样的质粒,它们编码例如多种分开编码的多亚基蛋白质、相同代谢途径的不同成员、额外选择标记或重组蛋白(单个或多个亚基)及帮助重组蛋白表达的蛋白伴侣。
然而,6318bp的2μm质粒和其它2μm家族质粒塞满了功能性异源元件(Sutton和Broach,1985,Mol.Cell.Biol.,5,2770;Broach导入,1979,Cell,16,827),没有明显的位置可用于插入额外的DNA序列而不伴随着质粒稳定性的损失。事实上,除了复制起点和D基因座之间的区域,整个2μm质粒基因组转录成至少一种且常常更多poly(A)+种类(Sutton和Broach,1985,Mol.Cell.Biol.,5,2770)。因此,预计大多数插入可能对体内质粒功能具有有害影响。
事实上,本领域技术人员已经放弃将异源多核苷酸序列插入2μm家族质粒。
Robinson等人,1994,Bio/Technology,12,381-384报告了啤酒糖酵母中重组的额外PDI基因拷贝可用于将人血小板衍生生长因子(PDGF)B同型二聚体的重组表达提高10倍,将粟酒裂殖酵母酸性磷酸酶提高4倍。Robinson使用额外的整合在染色体中的PDI基因拷贝在PDGF和粟酒裂殖酵母酸性磷酸酶的表达中获得了观察到的增加。Robinson报告了使用多拷贝2μm表达载体来提高PDI蛋白质水平的尝试对异源蛋白分泌具有有害作用。
Shusta等人,1998,Nature Biotechnology,16,773-777描述了啤酒糖酵母中单链抗体片段(scFv)的重组表达。Shusta报告了在酵母系统中将转基因整合到宿主染色体中或使用附加型表达载体之间的选择能够大大影响分泌,而且参照Parekh和Wittrup,1997,Biotechnol.Prog.,13,117-122,使用δ整合载体将scFv基因稳定整合到宿主染色体中优于使用基于2μm的表达质粒。Parekh和Wittrup,前述引用先前讲授了使用δ整合载体比基于2μm的表达载体将牛胰腺胰蛋白酶抑制物(BPTI)的表达提高了一个数量级。基于2μm的表达载体据说对异源分泌性蛋白质生产产生反面作用。
Bao等人,2000,Yeast,16,329-341报告了已经将KlPDI1基因在多拷贝质粒pKan707上导入乳克鲁维氏酵母,而且质粒的存在致使菌株的生长情况很差。根据Bao等人,2000中的早期发现,Bao和Fukuhara,2001,Gene,272,103-110选择在宿主染色体上导入KlPDI1的单个副本。
因此,现有技术教授技术人员将转基因整合到酵母染色体中,而非导入多拷贝载体中。因此,对转化酵母的候选方法存在需求。
                            发明描述
本发明涉及2μm家族质粒的重组改良形式。
2μm家族质粒是环状双链DNA质粒。它通常较小,诸如在排除重组插入序列时的3,000至10,000bp之间,优选4,500至7,000bp之间。优选用于本发明的2μm家族质粒包含衍生自如下一种或多种质粒的序列:自由鲁氏接合糖酵母获得的pSR1、pSB3或pSB4,由拜列氏接合糖酵母获得的pSB1或pSB2,由发酵接合糖酵母获得的pSM1,由果蝇克鲁维氏酵母获得的pKD1,由膜醭毕赤氏酵母获得的pPM1,及由啤酒糖酵母获得的2μm质粒和变体(诸如Scp1、Scp2和Scp3)例如Volkert等人,1989,MicrobiologicalReviews,53(3),299-317;Murray等人,1988,Mol.Biol.,200,601-607;及Painting等人,1984,J.Applied Bacteriology,56,331中所述的。
2μm家族质粒能够在酵母群中实现稳定的多拷贝维持,尽管不必所有的2μm家族质粒都能够在所有类型的酵母群中实现稳定的多拷贝维持。例如,2μm质粒格外能够在啤酒糖酵母和卡尔斯伯糖酵母中实现稳定的多拷贝维持。
“多拷贝维持”指质粒在每个酵母细胞中以多个拷贝存在。将包含2μm家族质粒的酵母细胞称为[cir+],而将不含2μm家族质粒的酵母细胞称为[cir0]。[cir+]酵母细胞通常每个单倍体基因组包含10-100个拷贝的[ci+],诸如每个单倍体基因组包含20-90个、更通常的是30-80个、优选的是40-70个、更优选的是50-60个拷贝。此外,宿主的遗传背景能够影响质粒的拷贝数,它能够将2μm样质粒的拷贝数提高至每个单倍体基因组100个以上(Gerbaud和Guerineau,1980,Curr.Genetics,1,219;Holm,1982,Cell,29,585;Sleep等人,2001,Yeast,18,403;及WO99/00504)。多拷贝稳定性的定义见下文。
2μm家族质粒通常包含至少三个开放读码框(“ORF”),它们各自编码在2μm家族质粒作为多拷贝质粒而稳定维持中发挥功能的蛋白质。可以将由这三个ORF编码的蛋白质称为FLP、REP1和REP2。当2μm家族质粒没有包含编码FLP、REP1和REP2的所有三个ORF时,应当反式提供编码缺失蛋白质的ORF,或是在另一种质粒上或是通过染色体整合。
“FLP”蛋白质是能够在受到FLP识别的反向重复序列之间催化位点特异重组的蛋白质。该反向重复序列称为FLP重组靶(FRT)位点,而且各自通常作为更大反向重复片段的一部分存在(见下文)。优选的FLP蛋白质包含由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒其中一种质粒编码的FLP蛋白质的序列,例如Volkert等人,前述引用;Murray等人,前述引用;及Painting等人,前述引用中所述。本发明还包括这些FLP蛋白质的变体和片段。“片段”和“变体”指保留天然蛋白质在相同FRT序列之间催化位点特异重组能力的那些。这些变体和片段常常与由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒其中一种质粒编码的FLP蛋白质具有至少50%、60%、70%、80%、90%、95%、98%、99%或更高同源性。不同的FLP蛋白质可以具有不同的FRT序列特异性。典型的FRT位点可以包含侧翼为反向重复序列的核心核苷酸序列。在2μm质粒中,FRT核心序列的长度是8个核苷酸,而侧翼反向重复序列的长度是13个核苷酸(Volkert等人,前述引用)。然而,由任何指定FLP蛋白质识别的FRT位点可以与2μm质粒的FRT位点不同。
REP1和REP2是参与在细胞分裂过程中分配质粒拷贝的蛋白质,而且可能还在FLP表达的调控中发挥作用。在来自不同2μm家族质粒的REP1蛋白质间观察到可观的序列趋异,而目前不可能在来自不同2μm家族质粒的REP2蛋白质间进行序列对比。优选的REP1和REP2蛋白质包含由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒其中一种质粒编码的REP1和REP2蛋白质的序列,例如Volkert等人,前述引用;Murray等人,前述引用;及Painting等人,前述引用中所述。本发明还包括这些REP1和REP2蛋白质的变体和片段。REP1和REP2的“片段”和“变体”指在由该质粒代替天然ORF编码时在合适酵母群内不破坏质粒的稳定多拷贝维持的那些。这些REP1和REP2变体和片段常常分别与由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒其中一种质粒编码的REP1和REP2蛋白质具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或更高同源性。
由质粒上的ORF编码的REP1和REP2蛋白质必须是相容的。如果REP1和REP2在联合质粒的其它功能元件时有助于编码它们的质粒的稳定多拷贝维持,那么它们是相容的。可以通过制备其中REP1和REP2ORF各自特异破坏的突变型质粒来测定REP1和REP2 ORF是否有助于编码它们的质粒的稳定多拷贝维持。如果ORF的破坏削弱质粒的稳定多拷贝维持,那么可以得出结论,该ORF在非突变形式有助于质粒的稳定多拷贝维持。优选的是,REP1和REP2蛋白质具有由相同天然存在2μm家族质粒诸如pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒编码的REP1和REP2蛋白质或其变体或片段的序列。
2μm家族质粒包含两个反向重复序列。反向重复片段可以是任何大小,只要它们各自含有FRT位点(见上文)。反向重复片段通常是高度同源的。它们可以共享超过50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.5%或更高序列同一性。在一个优选的实施方案中,它们是相同的。通常,反向重复片段的长度各自是200至1000bp。优选的反向重复序列可以各自具有200至300bp、300至400bp、400至500bp、500至600bp、600至700bp、700至800bp、800至900bp、或900至1000bp的长度。特别优选的反向重复片段是质粒pSR1(959bp)、pSB1(675bp)、pSB2(477bp)、pSB3(391bp)、pSM1(352bp)、pKD1(346bp)、2μm质粒(599bp)、pSB4和pPM1的那些。
反向重复片段的序列可以有所变化。然而,每个反向重复片段中FRT位点的序列应当与由质粒编码的FLP蛋白质的特异性相容,从而使得所编码FLP蛋白质能够发挥作用,即在质粒的反向重复序列之间催化位点特异重组。可以通过本领域知道的方法来测定反向重复序列之间的重组(及由此FLP蛋白质识别质粒内FRT位点的能力)。例如,可以在促进FLP表达的条件下对酵母细胞中的质粒测定质粒限制图谱的变化,而这是由质粒中一个区域相对于质粒中另一个区域的取向变化引起的。若检测出限制图谱有变化,则指示FLP蛋白质能够识别质粒中的FRT位点,而且因此每个反向重复片段中的FRT位点与由质粒编码的FLP蛋白质的特异性相容。
在一个特别优选的实施方案中,包括FRT位点在内的反向重复片段的序列衍生自与编码FLP蛋白质的ORF相同的2μm家族质粒,诸如pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1或2μm质粒。
反向重复片段通常位于2μm家族质粒内,使得在排除外源导入的序列诸如转基因时,反向重复片段之间定义的两个区域(如诸如在2μm质粒中定义为UL和US)具有大致相似的大小。例如,两个区域其中之一所具有的长度可以相当于另一个区域的长度的至少40%、50%、60%、70%、80%、90%、95%或更多、可多达100%。
2μm家族质粒包含编码FLP的ORF以及以这样一种方式并置的一个反向重复片段(任意的称为“IR1”,使之与下一段中提及的另一个反向重复片段有所区别),使得IR1存在于FLP ORF的远端且没有任何居间编码序列,例如在2μm质粒中所看到的。“远端”在此语境中指FLP ORF中与启动子起始其转录的末端相反的末端。在一个优选的实施方案中,FLP ORF的远端与IR1交叠。
2μm家族质粒包含编码REP2的ORF以及以这样一种方式并置的另一个反向重复片段(任意的称为“IR2”,使之与上一段中提及的IR1有所区别),使得IR2存在于REP2 ORF的远端且没有任何居间编码序列,例如在2μm质粒中所看到的。“远端”在此语境中指REP2 ORF中与启动子起始其转录的末端相反的末端。
在一个实施方案中,编码REP2和FLP的ORF可以存在于2μm家族质粒的反向重复片段之间所定义的两个区域中的相同区域上,该区域可以是两个区域中的较大者或较小者(如果两个区域的大小之间存在任何不平等的话)。
在一个实施方案中,编码REP2和FLP的ORF可以由不同的启动子转录。
通常,2μm家族质粒的反向重复片段之间定义的区域(如诸如在2μm质粒中定义为UL和US)可以包含不超过两种内源基因,它们所编码的蛋白质在2μm家族质粒作为多拷贝质粒的稳定维持中发挥功能。由此,在一个优选的实施方案中,质粒中反向重复片段之间定义的一个区域可以包含不超过编码FLP和REP2;FLP和REP1;或REP1和REP2的ORF作为内源编码序列。
2μm家族质粒包含复制起点(也称为自主复制序列-“ARS”),它通常是双向的。可以存在任何合适的ARS序列。共有序列,通常是酵母染色体复制起点,可能是合适的(Broach等人,1982,Cold Spring Harbor Symp.Quant.Biol.,47,1165-1174;Williamson,1985,Yeast,1,1-14)。优选的ARS包括由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm质粒分离的那些。
由此,2μm家族质粒通常包含至少编码FLP和REP2的ORF、两个反向重复序列(每个反向重复片段包含与FLP蛋白质相容的FRT位点)、和ARS序列。优选的是,质粒还包含编码REP1的ORF,尽管它可以反式提供,正如上文所讨论的。优选的是,FRT位点衍生自与编码FLP蛋白质的序列相同的2μm家族质粒。优选的是,所编码REP1和REP2蛋白质的序列衍生自彼此相同的2μm家族质粒。更加优选的是,FRT位点衍生自与所编码FLP、REP1和REP2蛋白质的序列相同的2μm家族质粒。甚至更加优选的是,编码FLP、REP1和REP2的ORF的序列和反向重复片段(包括FRT位点)的序列衍生自相同的2μm家族质粒。仍然更加优选的是,ARS位点是由与FLP、REP1和REP2的ORF和反向重复片段(包括FRT位点)的序列其中一种或多种相同的2μm家族质粒获得的。优选的质粒包括由鲁氏接合糖酵母获得的pSR1、pSB3或pSB4,由拜列氏接合糖酵母获得的pSB1或pSB2,由发酵接合糖酵母获得的pSM1,由果蝇克鲁维氏酵母获得的pKD1,由膜醭毕赤氏酵母获得的pPM1,及由啤酒糖酵母获得的2μm质粒,例如Volkert等人,1989,前述引用;Murray等人,前述引用;及Painting等人,前述引用。
任选的是,2μm家族质粒可以包含相当于2μm质粒中STB区域(也称为REP3)的区域,正如Volkert等人,前述引用中所定义的。本发明2μm家族质粒中的STB区域可以包含两个或多个串联重复序列,诸如3个、4个、5个或更多。或者,可以不存在串联重复序列。串联重复片段可以是任何大小,诸如长度为10、20、30、40、50、60、70、80、90、100bp或更长。2μm质粒STB区域中的串联重复片段的长度是62bp。串联重复片段的序列是否相同并不重要。可以承受轻微的序列变异。由与REP1和REP2 ORF其中任一或二者兼之相同的质粒选择STB区域可能是优选的。认为STB区域是顺式作用元件且优选是不转录的。
任选的是,2μm家族质粒可以包含额外ORF,它所编码的蛋白质在2μm家族质粒作为多拷贝质粒的稳定维持中发挥功能。额外的蛋白质可以命名为RAF或D。在例如2μm质粒和pSM1上可以看到编码RAF或D基因的ORF。由此,RAF或D的ORF可以包含适于编码由2μm质粒或pSM1编码的RAF或D基因ORF的蛋白质产物或其变体和片段的序列。由此,本发明还包括2μm质粒或pSM1的RAF或D基因的蛋白质产物的变体和片段。2μm质粒或pSM1的RAF或D基因的蛋白质产物的“片段”和“变体”指在由2μm质粒或pSM1代替天然ORF编码时不破坏质粒在合适酵母群中的稳定多拷贝维持的那些。这些变体和片段通常与由2μm质粒或pSM1编码的RAF或D基因ORF的蛋白质产物具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或更高同源性。
本发明提供了在REP2基因或FLP基因至少其一的最后一个功能性密码子后面的第一个碱基和与所述基因相邻的反向重复片段中FRT位点前面的最后一个碱基之间包含多核苷酸序列插入、删除和/或替代的2μm家族质粒。
多核苷酸序列插入指在质粒中插入任何额外多核苷酸序列。下文描述了优选的多核苷酸序列插入。删除指一个或多个碱基对的清除,诸如可多达2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个或更多碱基对的清除,它可以是单个连续序列或是来自DNA序列内间隔分开的区域。替代指一个或多个碱基对的替换,诸如可多达2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个或更多碱基对的替换,它可以是单个连续序列或是来自DNA序列内间隔分开的区域。一个区域受到插入、删除或替代其中任何两种或所有三种的修饰也是可能的。
REP2基因或FLP基因其中任一的最后一个功能性密码子指基因开放读码框中基因启动子下游距离最远的密码子,且根据诸如Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中定义的测试方法其终止密码子替代将导致不可接受的质粒多拷贝稳定性损失。修改Chinery和Hinchcliffe定义的测试方法可能是合适的,例如向接种体或亚培养物方案中引入修改,从而将指数对数生长维持在超过期望的代数。这可能有助于说明所分析宿主菌株与Chinery和Hinchcliffe所用啤酒糖酵母S150-2B之间的差异,和/或为可以通过插入位点在2μm样质粒小US区中的同一性和/或2μm样质粒中的其它差异诸如2μm样质粒中插入序列的大小和本质和/或2μm样质粒中其它部位的插入测定的所测定质粒的个别特征优化测试方法。对于在Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中定义的非选择性培养基(YPD,也称为YEPD)中不生长的酵母,可以使用其它合适的非选择性培养基。合适的候选非选择性培养基通常容许指数对数生长达到期望的代数。例如,蔗糖或葡萄糖可以用作候选碳源。质粒稳定性可以定义为在限定代数后对选择标记保持原养型的细胞百分比。代数优选足以显示对照质粒诸如pSAC35或pSAC310之间的差异,或是显示与这样一种对照质粒可比的稳定性。代数可以是1代、2代、3代、4代、5代、6代、7代、8代、9代、10代、11代、12代、13代、14代、15代、16代、17代、18代、19代、20代、25代、30代、35代、40代、45代、50代、60代、70代、80代、90代、100代或更多。优选较高数目。可接受的质粒稳定性可以是1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或基本上100%。优选较高百分比。技术人员将认识到,即使质粒在非选择性培养基上生长时可能具有低于100%的稳定性,质粒仍然能够在选择性培养基中培养时使用。例如,实施例中描述的质粒pDB2711在依照实施例1测定稳定性时只有10%是稳定的,但是在选择性生长条件下在摇瓶培养中在重组运铁蛋白生产力中提供15倍增量。
由此,通过插入多核苷酸序列插入、删除或替代,在REP2或FLP基因最后一个功能性密码子下游的任何点破坏任一基因不会导致不可接受的质粒多拷贝稳定性损失。我们出乎意料的发现,可以在密码子59后面破坏2μm质粒的REP2基因,而且可以在密码子344后面破坏2μm质粒的FLP基因,各自不会导致不可接受的质粒多拷贝稳定性损失。可以通过如上所述修饰相关基因并测定稳定性,常规确定其它2μm家族质粒中等价基因的最后一个功能性密码子。因此,就对其进行的修饰不会导致不可接受的质粒多拷贝稳定性损失而言,本发明的改良质粒通常是稳定的。
本发明2μm质粒的REP2和FLP基因各自具有与之相邻的反向重复片段。反向重复片段可以是相同的(在倒转时),因为它与相同质粒内的另一个反向重复片段的序列匹配。“相邻”指FLP或REP2基因及其反向重复片段以这样一种方式并置,使得反向重复片段存在于基因的远端且没有任何居间编码序列,例如在2μm质粒中所看到的。“远端”在此语境中指基因中与启动子起始其转录的末端相反的末端。在一个优选的实施方案中,基因的远端与反向重复片段交叠。
在本发明的第一个优选方面,多核苷酸序列插入、删除和/或替代存在于REP2基因最后一个功能性密码子后面的第一个碱基和与所述基因相邻的反向重复片段中FRT位点前面的最后一个碱基之间,优选反向重复片段的第一个碱基和FRT位点前面的最后一个碱基之间,甚至更加优选REP2基因翻译终止密码子后面且FRT位点前面最后一个碱基前面的位置。
术语“之间”在此语境中包括该定义的外限,因此例如“REP2基因最后一个功能性密码子后面的第一个碱基和FRT位点前面的最后一个碱基之间”的插入、删除和/或替代包括REP2基因最后一个功能性密码子后面的第一个碱基处的插入、删除和/或替代和FRT位点前面的最后一个碱基处的插入、删除和/或替代。
在本发明的第二个优选方面,多核苷酸序列插入、删除和/或替代存在于FLP基因最后一个功能性密码子后面的第一个碱基和与所述基因相邻的反向重复片段中FRT位点前面的最后一个碱基之间,优选反向重复片段的第一个碱基和FRT位点前面的最后一个碱基之间,更加优选FLP编码序列末端后面的第一个碱基和FRT位点前面的最后一个碱基之间,诸如FLP编码序列末端后面的第一个碱基处。多核苷酸序列插入、删除和/或替代可以存在于FLP末端后面的第一个碱基和反向重复片段中的FspI位点之间,但任选不在FspI位点内。
在一个实施方案中,除了多核苷酸序列插入、删除和/或替代,FLP基因和/或REP2基因分别具有衍生自天然存在2μm家族质粒的FLP基因和/或REP2基因序列。
术语“衍生自”包括与衍生它的序列具有相同序列的序列。然而,还包括上文定义的它们的变体和片段。例如,具有衍生自2μm质粒FLP基因之序列的FLP基因可以具有与天然存在基因相比经过修饰的启动子或其它调控序列。或者,具有衍生自2μm质粒FLP基因之序列的FLP基因可以在开放读码框中具有经过修饰的核苷酸序列,它可以编码与天然存在基因相同的蛋白质,或者可以编码经过修饰的FLP蛋白质。相同考虑应用于具有衍生自特定来源之序列的REP2基因。
天然存在2μm家族质粒指具有上述特征的任何质粒,所述特征是发现在酵母中天然存在的,即尚未经过重组修饰以包含异源序列的2μm家族质粒的本质特征。优选的是,天然存在2μm家族质粒选自由鲁氏接合糖酵母获得的pSR1(编号X02398)、pSB3(编号X02608)或pSB4,由拜列氏接合糖酵母获得的pSB1或pSB2(编号NC_002055或M18274),由发酵接合糖酵母获得的pSM1(编号NC_002054),由果蝇克鲁维氏酵母获得的pKD1(编号X03961),由膜醭毕赤氏酵母获得的pPM1,或最优选的是由啤酒糖酵母获得的2μm质粒(编号NC_001398或J01347)。编号指NCBI的保藏物。
优选的是,除了多核苷酸序列插入、删除和/或替代,与所述FLP和/或REP2基因相邻的反向重复片段的序列衍生自与衍生该基因的序列相同的天然存在2μm家族质粒中相应反向重复片段的序列。由此,例如,如果FLP基因衍生自由啤酒糖酵母获得的2μm质粒,那么优选的是与FLP基因相邻的反向重复片段具有衍生自由啤酒糖酵母获得的2μm质粒中与FLP基因相邻的反向重复片段的序列。如果REP2基因衍生自由啤酒糖酵母获得的2μm质粒,那么优选的是与REP2基因相邻的反向重复片段具有衍生自由啤酒糖酵母获得的2μm质粒中与REP2基因相邻的反向重复片段的序列。
如果在本发明的第一个优选方面中,除了多核苷酸序列插入、删除和/或替代,REP2基因和相邻反向重复序列具有衍生自由啤酒糖酵母获得的2μm质粒中相应区域的序列的话,那么优选的是该多核苷酸序列插入、删除和/或替代存在于REP2基因密码子59的第一个碱基和相邻反向重复片段中FRT位点前面的最后一个碱基之间的位置,更加优选反向重复片段的第一个碱基和FRT位点前面的最后一个碱基之间的位置,甚至更加优选REP2基因翻译终止密码子后面且FRT位点前面最后一个碱基前面的位置,诸如REP2编码序列末端后面的第一个碱基处。
如果除了多核苷酸序列插入、删除和/或替代,REP2基因和相邻反向重复序列具有衍生自由啤酒糖酵母获得的2μm质粒中相应区域的序列的话,那么在一个实施方案中,除了多核苷酸序列插入、删除和/或替代,REP2基因和相邻反向重复片段的序列由SEQ ID NO:1或其变体定义。在SEQ IDNO:1中,REP2基因密码子59的第一个碱基表述为碱基数目175,而FRT位点前面的最后一个碱基表述为碱基数目1216。这里给出的FRT序列是来自Sadowski等人,1986,第7-10页,Mechanisms of Yeast Recombination,《Current Communications in Molecular Biology》,CSHL,Klar,A.、Strathern,J.N.的55bp的序列。在SEQ ID NO:1中反向重复片段的第一个碱基表述为碱基数目887,而REP2基因翻译终止密码子后面的第一个碱基表述为碱基数目892。
在本发明第一个方面的一个甚至更加优选的实施方案中,除了多核苷酸序列插入、删除和/或替代,REP2基因和相邻反向重复序列具有衍生自由啤酒糖酵母获得的2μm质粒相应区域的序列,且在不存在多核苷酸序列插入、删除和/或替代的破坏时在反向重复片段内包含XcmI位点或FspI位点且该多核苷酸序列插入、删除和/或替代存在于XcmI位点或FspI位点处。在SEQ IDNO:1中,XcmI位点表述为碱基数目935-949,而FspI位点表述为碱基数目1172-1177。
如果在本发明的第二个优选方面中,除了多核苷酸序列插入、删除和/或替代,FLP基因和相邻反向重复序列具有衍生自由啤酒糖酵母获得的2μm质粒中相应区域的序列的话,那么优选的是该多核苷酸序列插入、删除和/或替代存在于FLP基因密码子344的第一个碱基与FRT位点前面的最后一个碱基之间的位置,更加优选反向重复片段的第一个碱基和FRT位点前面的最后一个碱基之间的位置,仍然更加优选FLP编码序列末端后面的第一个碱基和FRT位点前面的最后一个碱基之间的位置,诸如FLP编码序列末端后面的第一个碱基处。可以避开FLP基因和FRT位点之间的FspI位点作为插入位点。
如果除了多核苷酸序列插入、删除和/或替代,FLP基因和相邻反向重复序列具有衍生自由啤酒糖酵母获得的2μm质粒中相应区域的序列的话,那么在一个实施方案中,除了多核苷酸序列插入、删除和/或替代,FLP基因和跟随FLP基因的反向重复片段的序列由SEQ ID NO:2或其变体定义。在SEQ ID NO:2中,FLP基因密码子344的第一个碱基表述为碱基数目1030,而FRT位点前面的最后一个碱基表述为碱基数目1419,反向重复片段的第一个碱基表述为碱基数目1090,而FLP编码序列末端后面的第一个碱基表述为碱基数目1273。
在本发明第二个方面的一个甚至更加优选的实施方案中,除了多核苷酸序列插入、删除和/或替代,FLP基因和相邻反向重复序列具有衍生自由啤酒糖酵母获得的2μm质粒相应区域的序列,且在不存在多核苷酸序列插入、删除和/或替代时在反向重复片段内包含HgaI位点或FspI位点且该多核苷酸序列插入、删除和/或替代存在于通过HgaI作用于HgaI位点而形成的切口处(HgaI切割它所识别的5bp序列的外侧)或FspI位点处。在SEQ ID NO:2中,HgaI位点表述为碱基数目1262-1266,而FspI位点表述为碱基数目1375-1380。
技术人员将认识到,由本发明第一个和第二个优选方面定义的质粒的特征并不互相排斥。由此,依照本发明第三个优选方面的质粒可以在REP2基因和FLP基因二者最后一个功能性密码子后面的第一个碱基和与所述每一种基因相邻的反向重复片段中FRT位点前面的最后一个碱基之间包含多核苷酸序列插入、删除和/或替代,所述多核苷酸序列插入、删除和/或替代可以是相同的或不同的。例如,除了多核苷酸序列插入、删除和/或替代,依照本发明第三个方面的质粒可以包含SEQ ID NO:1或其变体的序列和SEQ IDNO:2或其变体的序列,各自分别在上文关于本发明第一个和第二个优选方面所定义的位置包含多核苷酸序列插入、删除和/或替代。
技术人员将认识到,由本发明第一个、第二个和第三个优选方面定义的质粒的特征并不排除质粒还具有其它序列修饰的可能性。由此,例如,本发明第一个、第二个和第三个优选方面的2μm家族质粒可以在上文定义以外的位置额外包含多核苷酸序列插入、删除和/或替代。因此,质粒可以在本发明插入位点以外的位点额外携带转基因。
本领域知道2μm质粒中的候选插入位点,但是它们不提供使用本发明定义的插入位点所具有的优势。无论如何,通过在本领域第一个、第二个和第三个优选方面定义的一个或多个位点处进行一处或多处进一步修饰,可以进一步修饰在本领域知道的位点处早就包含多核苷酸序列插入、删除和/或替代的质粒。技术人员将认识到,正如本申请导言中所讨论的,在2μm家族质粒中本发明第一个和第二个方面所定义以外的位点处插入转基因存在可观的技术限制。
本领域知道的典型的改良2μm质粒包括Rose和Broach,1990,MethodsEnzymol.,185,234-279中描述的那些,诸如利用FLP中EcoRI处插入的质粒pCV19、pCV20、CVneo,利用D中EcoRI作为插入位点的质粒pCV21、pGT41和pYE,利用D中PstI作为插入位点的质粒pHKB52,利用D中PstI和D中EcoRI处插入的质粒pJDB248,利用D中PstI和FLP中EcoRI作为插入位点的质粒pJDB219,利用FLP中ClaI处插入的质粒G18、质粒pAB18,利用D中PstI作为插入位点的质粒pGT39和pA3、质粒pYT11、pYT14和pYT11-LEU,及利用FLP中EcoRI作为插入位点的质粒pTY39。其它2μm质粒包括EP 0 286 424及Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中描述的pSAC3、pSAC3U1、pSAC3U2、pSAC300、pSAC310、pSAC3C1、pSAC3PL1、pSAC3SL4和pSAC3SC1,它们还将PstI、EagI或SnaBI描述为适当的2μm插入位点。其它2μm质粒包括pAYE255、pAYE316、pAYE443、pAYE522(Kerry-Williams等人,1998,Yeast,14,161-1690)、pDB2244(WO00/44772)和pAYE329(Sleep等人,2001,Yeast,18,403-421)。
在一个优选的实施方案中,本发明第一个、第二个和第三个优选方面定义的2μm样质粒额外包含多核苷酸序列插入、删除和/或替代,它存在于ARS序列周围的非转录区内。例如,在由啤酒糖酵母获得的2μm质粒中,ARS序列周围的非转录区由D基因的末端延伸至ARS序列的开端。Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中描述了SnaBI处(复制起点序列ARS附近)的插入。技术人员将认识到,额外的多核苷酸序列插入、删除和/或替代也可以位于非转录区内,位于由Chinery和Hinchliffe描述的SnaBI位点的附近位置。
依照任何本发明第一个、第二个或第三个方面的质粒可以是能够在酵母中自主复制的质粒,诸如糖酵母属、克鲁维氏酵母属、接合糖酵母属或毕赤氏酵母属的成员,诸如啤酒糖酵母、卡尔斯伯糖酵母、乳克鲁维氏酵母(Kluyveromyces lactis)、巴斯德毕赤氏酵母(Pichia pastoris)、膜醭毕赤氏酵母、鲁氏接合糖酵母、拜列氏糖酵母、发酵结合糖酵母或果蝇克鲁维氏酵母。认为啤酒糖酵母和卡尔斯伯糖酵母为所有已知的2μm质粒提供了合适的宿主细胞。
在一个优选的实施方案中,本发明2μm家族质粒中包含的多核苷酸序列插入、删除和/或替代是或至少其一是多核苷酸序列插入。可以使用任何多核苷酸序列插入,只要它对质粒的稳定性没有不可接受的损害,也就是说与未经修饰的质粒(赋值100%稳定性)相比,该质粒在非选择性培养基诸如YEPD培养基上至少1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或基本上100%是稳定的。优选的是,上文所述稳定性水平是在培养基中分开培养包含已修饰和未修饰质粒的酵母细胞达到1代、2代、3代、4代、5代、6代、7代、8代、9代、10代、11代、12代、13代、14代、15代、16代、17代、18代、19代、20代、25代、30代、35代、40代、45代、50代、60代、70代、80代、90代、100代或更多代数后看到的。
如果质粒包含选择标记,那么在选择性条件(如在极限培养基中)下培养转化子时可以获得较高水平的稳定性,因为培养基可以对宿主施加选择压力以保持质粒。
可以使用上文所述方法测定在非选择性和选择性(如极限)培养基中的稳定性。可以通过质粒转化酵母以获得原养型的观察结果来证明在选择性培养基中的稳定性。
通常,多核苷酸序列插入的长度是至少4个、6个、8个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个或更多碱基对。通常,多核苷酸序列插入的长度可长达1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb或更长。技术人员将认识到,本发明的2μm质粒可以在质粒内的不同位点包含多个多核苷酸序列插入。通常,多核苷酸序列插入的总长度不超过5kb、10kb、15kb、20kb、25kb或30kb,尽管更大总长度的插入也是可能的。
多核苷酸序列可以是或者不是用于引入新限制位点的接头序列。例如,可以在FLP基因后面的FspI位点处引入或不引入合成接头,诸如引入其它限制位点(如BamHI)。
多核苷酸序列插入可以包含转录区,或者可以包含非转录区。转录区可以编码开放读码框,或者可以是非编码的。多核苷酸序列插入可以包含转录和非转录两种区域。
转录区指可以由RNA聚合酶,通常指酵母RNA聚合酶,转录的DNA区域。转录区可以编码功能性RNA分子,诸如核糖体或转运RNA,或是能够作为有义或RNA干扰(“RNAi”)分子发挥功能的RNA分子。或者,转录区可以编码信使RNA分子(mRNA),该mRNA可以包含能够在体内翻译而生成蛋白质的开放读码框(ORF)。术语“蛋白质”在用于本文时包括所有天然的和非天然的蛋白质、多肽和肽。优选的是,ORF编码异源蛋白。“异源蛋白”指不是天然由2μm家族质粒编码的蛋白质(即“非2μm家族质粒蛋白质”)。为了方便,术语“异源蛋白”和“非2μm家族质粒蛋白质”在整篇本说明书中同义使用。因此,优选的是,异源蛋白不是由如下任一质粒编码的FLP、REP1、REP2、或RAF/D蛋白质自鲁氏接合糖酵母获得的pSR1、pSR3或pSR4,自拜列氏接合糖酵母获得的pSB1或pSB2,自发酵接合糖酵母获得的pSM1,自果蝇克鲁维氏酵母获得的pKD1,自膜醭毕赤氏酵母获得的pPM1,及自啤酒糖酵母获得的2μm质粒。
如果多核苷酸序列插入编码开放读码框的话,那么它可以额外包含一些不编码开放读码框的多核苷酸序列(称为“非编码区”)。
多核苷酸序列插入中的非编码区可以包含一种或多种与开放读码框可操作连接的调控序列,它们容许开放读码框的转录和/或由此得到的转录本的翻译。
术语“调控序列”指调控(即促进或降低)与之可操作连接的开放读码框的表达(即转录和/或翻译)的序列。调控序列通常包括启动子、终止子、核糖体结合位点等等。技术人员将认识到,调控区的选择将取决于预定的表达系统。例如,启动子可以是组成性的或诱导型的,而且可以是细胞或组织类型特异的或非特异的。
如果表达系统是酵母诸如啤酒糖酵母的话,那么适合于啤酒糖酵母的启动子包括与PGK1基因、GAL1或GAL10基因、TEF1、TEF2、PYK1、PMA1、CYC1、PHO5、TRP1、ADH1、ADH2、甘油醛-3-磷酸脱氢酶、己糖激酶、丙酮酸脱羧酶、果糖磷酸激酶、丙糖磷酸异构酶、葡萄糖磷酸异构酶、葡糖激酶的基因、α-交配因子信息素、a-交配因子信息素有关的启动子、PRB1启动子、PRA1启动子、GPD1启动子、和涉及部分5’调控区与部分其它启动子5’调控区或与上游激活位点(如EP-A-258 067的启动子)的杂合体的杂合启动子。
本领域众所周知合适的转录终止信号。如果宿主细胞是真核的话,那么转录终止信号优选衍生自真核基因的3’侧翼序列,它包含转录终止和多聚腺苷酸化的正确信号。合适的3’侧翼序列可以是例如与所用表达控制序列天然相连的那些,即可以与启动子相对应。或者,它们可以是不同的。在那种情况中,而且如果宿主是酵母优选啤酒糖酵母的话,那么优选啤酒糖酵母ADH1、ADH2、CYC1、或PGK1基因的终止信号。
可能有利的是,异源基因的启动子和开放读码框诸如蛋白伴侣PDI1的那些的侧翼是转录终止序列,使得转录终止序列位于启动子和开放读码框的上游和下游两处,从而防止转录通读进入相邻基因,诸如2μm基因,反之亦然。
在一个实施方案中,在酵母诸如啤酒糖酵母中偏爱的调控序列包括:酵母启动子(如啤酒糖酵母PRB1启动子),正如EP 431 880中所讲授的;以及转录终止子,优选来自糖酵母ADH1的终止子,正如EP 60 057中所讲授的。
可能有利的是,在非编码区中掺入超过一个编码翻译终止密码子的DNA序列,诸如UAA、UAG或UGA,从而将翻译通读降至最低,并由此避免延长的、非天然融合蛋白的生成。优选翻译终止密码子UAA。优选的是,掺入至少两个翻译终止密码子。
术语“可操作连接”在其含义中包括调控序列位于任何非编码区内,使之与开放读码框形成如下关系,即容许调控区以其预定方式对开放读码框发挥作用。由此,与开放读码框“可操作连接”的调控区以这样一种方式安置,使得调控区能够在与调控序列相容的条件下以预定方式影响开放读码框的转录和/或翻译。
如果本发明第一个、第二个或第三个方面定义的多核苷酸序列插入包含编码蛋白质的开放读码框的话,那么可能有利的是所编码的蛋白质是分泌性的。在那种情况中,开放读码框中可以包含编码分泌前导序列的序列。
关于在真核物种诸如酵母啤酒糖酵母、接合糖酵母物种、乳克鲁维氏酵母和巴斯德毕赤氏酵母中生成蛋白质,已知的前导序列包括来自啤酒糖酵母酸性磷酸酶蛋白质(Pho5p)(见EP 366 400)、转化酶蛋白质(Suc2p)(见Smith等人,1985,Science,229,1219-1224)和热休克蛋白-150(Hsp150p)(见WO 95/33833)的那些。另外,已经使用了来自啤酒糖酵母交配因子α-1蛋白质(MFα-1)以及来自人溶菌酶和人血清清蛋白(HSA)蛋白质的前导序列,后者尤其已经用于分泌人清蛋白,尽管不是排他的。WO 90/01063公开了MFα-1与HSA前导序列的融合体,相对于MFα-1前导序列的使用,它有利的降低了人清蛋白杂质片段的生成。另外,可以使用天然运铁蛋白前导序列来指导运铁蛋白和其它异源蛋白的分泌。
或者,所编码蛋白质可以是胞内的。
在一个优选的实施方案中,至少一个本发明第一个、第二个或第三个方面定义的多核苷酸序列插入包含如下开放读码框,它包含编码酵母蛋白质的序列。在另一个优选的实施方案中,至少一个本发明第一个、第二个或第三个方面定义的多核苷酸序列插入包含如下开放读码框,它包含编码酵母蛋白质的序列,该酵母蛋白质来自与衍生2μm样质粒的宿主相同的宿主。
在另一个优选的实施方案中,至少一个本发明第一个、第二个或第三个方面定义的多核苷酸序列插入包含如下开放读码框,它包含编码参与蛋白质折叠或是具有蛋白伴侣活性或参与未折叠蛋白质应答的蛋白质的序列(斯坦福基因组数据库即Stanford Genome Database(SGD),http://yeastgenome.org)。优选的蛋白质可以选自由AHA1、CCT2、CCT3、CCT4、CCT5、CCT6、CCT7、CCT8、CNS1、CPR3、CPR6、EPS1、ERO1、EUG1、FMO1、HCH1、HSP10、HSP12、HSP104、HSP26、HSP30、HSP42、HSP60、HSP78、HSP82、JEM1、MDJ1、MDJ2、MPD1、MPD2、PDI1、PFD1、ABC1、APJ1、ATP11、ATP12、BTT1、CDC37、CPR7、HSC82、KAR2、LHS1、MGE1、MRS11、NOB1、ECM10、SSA1、SSA2、SSA3、SSA4、SSC1、SSE2、SIL1、SLS1、UBI4、ORM1、ORM2、PER1、PTC2、PSE1和HAC1或截短的无内含子HAC1编码的蛋白质(Valkonen等人,2003,Applied Environ.Micro.,69,2065)。
优选的参与蛋白质折叠的蛋白质或是具有蛋白伴侣活性的蛋白质或参与未折叠蛋白质应答的蛋白质可以是:
●热休克蛋白,诸如作为hsp70蛋白质家族成员的蛋白质(包括Kar2p、SSA和SSB蛋白质,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2编码的蛋白质)、作为HSP90家族成员的蛋白质、或作为HSP40家族成员的蛋白质或参与其调控的蛋白质(如Sillp),包括DNA-J和DNA-J样蛋白质(如Jem1p、Mdj2p);
●作为核周蛋白/输入蛋白蛋白质家族成员的蛋白质,诸如α或β核周蛋白/输入蛋白蛋白质家族,例如由PSE1编码的核周蛋白β蛋白质;
●作为Hjelmqvist等人,2002,Genome Biology,3(6),research0027.1-0027.16描述的ORMDL家族成员的蛋白质,诸如Orm2p;
●天然位于内质网中或分泌途径中其它部位诸如高尔基体中的蛋白质,例如天然在内质网(ER)内腔中特别是在分泌细胞中发挥作用的蛋白质,诸如PDI;
●作为锚定在ER中的跨膜蛋白质的蛋白质,诸如Hjelmqvist等人,2002,前述引用描述的ORMDL家族的成员(例如Orm2p);
●在细胞溶胶中发挥作用的蛋白质,诸如hsp70蛋白质,包括SSA和SSB蛋白质,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2编码的蛋白质;
●在细胞核、核被膜和/或细胞质中发挥作用的蛋白质,诸如Pse1p;
●细胞存活所必需的蛋白质,诸如PDI或必需的核周蛋白蛋白质,诸如Pse1p;
●参与巯基氧化或二硫键形成、断裂或异构化的蛋白质、或是催化蛋白质中硫醇:二硫化物互换反应的蛋白质,特别是在分泌和细胞表面蛋白的生物合成过程中,诸如蛋白质二硫键异构酶(如Pdi1p、Mpd1p)、同源物(如Eug1p)和/或相关蛋白质(如Mpd2p、Fmo1p、Erolp);
●参与蛋白质合成、装配或折叠的蛋白质,诸如PDI和Ssa1p;
●优先或专门结合未折叠而非成熟蛋白质的蛋白质,诸如hsp70蛋白质,包括SSA和SSB蛋白质,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2编码的蛋白质;
●防止蛋白质前体在细胞溶胶中聚集的蛋白质,诸如hsp70蛋白质,包括SSA和SSB蛋白质,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2编码的蛋白质;
●结合并稳定受损蛋白质的蛋白质,例如Ssa1p;
●参与未折叠蛋白质应答或对诱导未折叠蛋白质应答的试剂(诸如衣霉素和二硫苏糖醇)提供升高的抗性的蛋白质,诸如Hjelmqvist等人,2002,前述引用描述的ORMDL家族的成员(例如Orm2p)或参与压力应答的蛋白质(如Ubi4p);
●作为辅伴侣蛋白的蛋白质和/或间接参与蛋白质折叠和/或未折叠蛋白质应答的蛋白质(如hsp104p、Mdj1p);
●参与高分子核质转运的蛋白质,诸如Pse1p;
●通过识别核定位序列和核输出序列并与核孔复合体相互作用来介导高分子穿过核膜转运的蛋白质,诸如Pse1p;
●EP 0 746 611及Hillson等人,1984,Methods Enzymol.,107,281-292中描述的能够重新激活被扰乱核糖核酸酶针对RNA的核糖核酸酶活性的蛋白质,诸如PDI;
●具有酸性pI(例如4.0-4.5)的蛋白质,诸如PDI;
●作为Hsp70家族成员且优选具有N端ATP结合结构域和C端肽结合结构域的蛋白质,诸如Ssa1p;
●作为肽基脯氨酸顺反异构酶的蛋白质(如Cpr3p、Cpr6p);
●与已知蛋白伴侣同源的蛋白质(如Hsp10p);
●作为线粒体蛋白伴侣的蛋白质(如Cpr3p);
●作为细胞质或细胞核蛋白伴侣的蛋白质(如Cns1p);
●作为膜结合蛋白伴侣的蛋白质(如Orm2p、Fmo1p);
●具有蛋白伴侣激活物活性或蛋白伴侣调控活性的蛋白质(如Aha1p、Hac1p、Hch1p);
●瞬时结合未成熟形式的多肽以引起正确折叠、转运和/或分泌的蛋白质,包括高效易位进入内质网(如Lhs1p)或它们在细胞内的作用位点(如Pse1p)所需要的蛋白质;
●参与蛋白质复合体装配和/或核糖体装配的蛋白质(例如Atp11p、Pse1p、Nob1p);
●陪伴蛋白T复合体的蛋白质(例如Cct2p);或
●prefoldin复合体的蛋白质(例如Pfd1p)。
一种优选的蛋白伴侣是蛋白质二硫键异构酶(PDI)或其在内质网(ER)内腔中具有催化二硫键形成的等价能力的片段或变体。“PDI”包括EP 0 746611及Hillson等人,1984,Methods Enzymol.,107,281-292中描述的具有重新激活被扰乱核糖核酸酶针对RNA的核糖核酸酶活性的能力的任何蛋白质。
蛋白质二硫键异构酶指通常催化硫醇:二硫化物互换反应的酶,它是分泌细胞中内质网内腔中的主要驻留蛋白质成分。大量证据表明它在分泌性蛋白质的生物合成中发挥作用(Freedman,1984,Trends Biochem.Sci.,9,438-41),而且这得到了原位直接交联研究的支持(Roth和Pierce,1987,Biochemistry,26,4179-82)。PDI缺陷的微粒体膜在共翻译蛋白质二硫键形成中显示特异缺陷的发现(Bulleid和Freedman,1988,Nature,335,649-51)暗示,该酶在分泌和细胞表面蛋白的生物合成过程中发挥天然二硫键形成催化物的功能。这种作用与已知的该酶在体外的催化特性是一致的;它催化硫醇:二硫化物互换反应,导致净余蛋白质二硫键形成、断裂或异构化,而且通常能够在极其多种还原的、未折叠的蛋白质底物中催化蛋白质折叠和天然二硫键形成(Freedman等人,1989,Biochem.Soc.Symp.,55,167-192)。PDI还作为蛋白伴侣发挥作用,因为缺乏异构酶活性的突变型PDI加速蛋白质折叠(Hayano等人,1995,FEBS Letters,377,505-511)。最近,有报道说巯基氧化而非二硫键异构化是蛋白质二硫键异构酶在啤酒糖酵母中的主要功能(Solovyov等人,2004,J.Biol.Chem.,279(33),34095-34100)。已经知道数个物种的该酶的DNA和氨基酸序列(Scherens等人,1991,Yeast,7,185-193;Farquhar等人,1991,Gene,108,81-89;EP 074 661;EP 0 293 793;EP 0 509 841),而且关于由哺乳动物肝脏纯化至同质的酶的作用机制的信息日益增加(Creighton等人,1980,J.Mol.Biol.,142,43-62;Freedman等人,1988,Biochem.Soc.Trans.,16,96-9;Gilbert,1989,Biochemistry,28,7298-7305;Lundstrom和Holmgren,1990,J.Biol.Chem.,265,9114-9120;Hawkins和Freedman,1990,Biochem.J.,275,335-339)。在目前涉及在细胞中作为蛋白质折叠、装配和易位的介导物的许多蛋白质因子中(Rothman,1989,Cell,59,591-601),PDI具有充分鉴定的催化活性。
宿主中内源PDI基因的删除或灭活导致不能生存的宿主的生成。换言之,内源PDI基因是“必需”基因。
PDI易于由哺乳动物组织分离,而且同质的酶是具有特征性酸性pI(4.0-4.5)的二聚体(2×57kD)(Hillson等人,1984,Methods Enzymol.,107,281-292)。还已经由小麦和藻类莱茵衣藻(Chlamydomonas reinhardii)(Kaska等人,1990,Biochem.J.,268,63-68)、大鼠(Edman等人,1985,Nature,317,267-270)、牛(Yamauchi等人,1987,Biochem.Biophys.Res.Comm.,146,1485-1492)、人(Pihlajaniemi等人,1987,EMBO J.,6,643-9)、酵母(Scherens等人,前述引用;Farquhar等人,前述引用)和鸡(Parkkonen等人,1988,Biochem.J.,256,1005-1011)纯化得到该酶。来自这些脊椎动物物种的蛋白质整个显示高度的序列保守性,而且都显示数项最初在大鼠PDI序列中注意到的总体特征(Edman等人,1985,前述引用)。
酵母蛋白质二硫键异构酶前体PDI1可以以基因库编号CAA42373或BAA00723找到。它具有522个氨基酸的如下序列:
1   mkfsagavls wsslllassv faqqeavape dsavvklatd sfneyiqshd lvlaeffapw
61  cghcknmape yvkaaetlve knitlaqidc tenqdlcmeh nipgfpslki fknsdvnnsi
121 dyegprtaea ivqfmikqsq pavavvadlp aylanetfvt pvivqsgkid adfnatfysm
181 ankhfndydf vsaenadddf klsiylpsam depvvyngkk adiadadvfe kwlqvealpy
241 fgeidgsvfa qyvesglplg ylfyndeeel eeykplftel akknrglmnf vsidarkfgr
301 hagnlnmkeq fplfaihdmt edlkyglpql seeafdelsd kivleskaie slvkdflkgd
361 aspivksqei fenqdssvfq lvgknhdeiv ndpkkdvlvl yyapwcghck rlaptyqela
421 dtyanatsdv liakldhten dvrgvviegy ptivlypggk ksesvvyqgs rsldslfdfi
481 kenghfdvdg kalyeeaqek aaeeadadae ladeedaihd el
候选PDI序列可以以基因库编号CAA38402找到。它具有530个氨基酸的如下序列:
1   mkfsagavls wsslllassv faqqeavape dsavvklatd sfneyiqshd lvlaeffapw
61  cghcknmape yvkaaetlve knitlaqidc tenqdlcmeh nipgfpslki fknrdvnnsi
121 dyegprtaea ivqfmikqsq pavavvadlp aylanetfvt pvivqsgkid adfnatfysm
181 ankhfndydf vsaenadddf klsiylpsam depvvyngkk adiadadvfe kwlqvealpy
241 fgeidgsvfa qyvesglplg ylfyndeeel eeykplftel akknrglmnf vsidarkfgr
301 hagnlnmkeq fplfaihdmt edlkyglpql seeafdelsd kivleskaie slvkdflkgd
361 aspivksqei fenqdssvfq lvgknhdeiv ndpkkdvlvl yyapwcghck rlaptyqela
421 dtyanatsdv liakldhten dvrgvviegy ptivlypggk ksesvvyqgs rsldslfdfi
481 kenghfdvdg kalyeeaqek aaeeaeadae aeadadaela deedaihdel
本发明还包括上述PDI序列的变体和片段,以及其它天然存在PDI序列的变体。“变体”在PDI的语境中指其中一个或多个位置存在或保守的或非保守的氨基酸插入、删除或替代的蛋白质,只要这些变化产生其基本特性例如酶促活性(类型和比活)、热稳定性、在某些pH范围中的活性(pH稳定性)没有显著变化的蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。优选的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
“变体”通常与衍生它的多肽具有至少25%、至少50%、至少60%或至少70%、优选至少80%、更加优选至少90%、甚至更加优选至少95%、仍然更加优选至少99%、最优选至少99.5%的序列同一性。
可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,正如下文所讨论的。这些变体可以是天然的,或是使用本领域众所周知的蛋白质工程和定点诱变的方法人造的。
“片段”在PDI的语境中指一个或多个位置存在删除的蛋白质。由此,片段可以包含完整成熟PDI蛋白质的完整序列的至多5%、10%、20%、30%、40%或50%、通常可高达60%、更典型的是可高达70%、优选可高达80%、更加优选可高达90%、甚至更加优选可高达95%、仍然更加优选可高达99%。特别优选的PDI蛋白质的片段包含期望蛋白质的一个或多个完整结构域。
PDI的片段或变体可以是在宿主细胞诸如啤酒糖酵母中重组表达时能够补足宿主细胞中内源编码PDI基因的删除的蛋白质,而且可以是例如PDI的天然存在同系物,诸如由另一种生物体诸如另一种酵母或其它真菌、或另一种真核生物诸如人或其它脊椎动物、或动物或由植物编码的同系物。
另一种优选的蛋白伴侣是SSA1或其具有等价蛋白伴侣样活性的片段或变体。SSA1,也称为YG100,位于啤酒糖酵母的染色体I上,且大小为1.93kb。
SSA1的一种已发表蛋白质序列如下:
MSKAVGIDLGTTYSCVAHFANDRVDIIANDQGNRTTPSFVAFTDTERLIGDAAKNQAAMN
PSNTVFDAKRLIGRNFNDPEVQADMKHFPFKLIDVDGKPQIQVEFKGETKNFTPEQISSM
VLGKMKETAESYLGAKVNDAVVTVPAYFNDSQRQATKDAGTIAGLNVLRTINEPTAAAIA
YGLDKKGKEEHVLIFDLGGGTFDVSLLFIEDGIFEVKATAGDTHLGGEDFDNRLVNHFIQ
EFKRKNKKDLSTNQRALRRLRTACERAKRTLSSSAQTSVEIDSLFEGIDFYTSITRARFE
ELCADLFRSTLDPVEKVLRDAKLDKSQVDEIVLVGGSTRIPKVQKLVTDYFNGKEPNRSI
NPDEAVAYGAAVQAAILTGDESSKTQDLLLLDVAPLSLGIETAGGVMTKLIPRNSTISTK
KFEIFSTYADNQPGVLIQVFEGERAKTKDNNLLGKFELSGIPPAPRGVPQIEVTFDVDSN
GILNVSAVEKGTGKSNKITITNDKGRLSKEDIEKMVAEAEKFKEEDEKESQRIASKNQLE
SIAYSLKNTISEAGDKLEQADKDTVTKKAEETISWLDSNTTASKEEFDDKLKELQDIANP
IMSKLYQAGGAPGGAAGGAPGGFPGGAPPAPEAEGPTVEEVD
SSA1的一种已发表编码序列如下,但是应当认识到,可以通过简并替代来修饰序列以获得编码相同蛋白质产物的候选核苷酸序列:
ATGTCAAAAGCTGTCGGTATTGATTTAGGTACAACATACTCGTGTGTTGCTCACTTTGCT
AATGATCGTGTGGACATTATTGCCAACGATCAAGGTAACAGAACCACTCCATCTTTTGTC
GCTTTCACTGACACTGAAAGATTGATTGGTGATGCTGCTAAGAATCAAGCTGCTATGAAT
CCTTCGAATACCGTTTTCGACGCTAAGCGTTTGATCGGTAGAAACTTCAACGACCCAGAA
GTGCAGGCTGACATGAAGCACTTCCCATTCAAGTTGATCGATGTTGACGGTAAGCCTCAA
ATTCAAGTTGAATTTAAGGGTGAAACCAAGAACTTTACCCCAGAACAAATCTCCTCCATG
GTCTTGGGTAAGATGAAGGAAACTGCCGAATCTTACTTGGGAGCCAAGGTCAATGACGCT
GTCGTCACTGTCCCAGCTTACTTCAACGATTCTCAAAGACAAGCTACCAAGGATGCTGGT
ACCATTGCTGGTTTGAATGTCTTGCGTATTATTAACGAACCTACCGCCGCTGCCATTGCT
TACGGTTTGGACAAGAAGGGTAAGGAAGAACACGTCTTGATTTTCGACTTGGGTGGTGGT
ACTTTCGATGTCTCTTTGTTGTTCATTGAAGACGGTATCTTTGAAGTTAAGGCCACCGCT
GGTGACACCCATTTGGGTGGTGAAGATTTTGACAACAGATTGGTCAACCACTTCATCCAA
GAATTCAAGAGAAAGAACAAGAAGGACTTGTCTACCAACCAAAGAGCTTTGAGAAGATTA
AGAACCGCTTGTGAAAGAGCCAAGAGAACTTTGTCTTCCTCCGCTCAAACTTCCGTTGAA
ATTGACTCTTTGTTCGAAGGTATCGATTTCTACACTTCCATCACCAGAGCCAGATTCGAA
GAATTGTGTGCTGACTTGTTCAGATCTACTTTGGACCCAGTTGAAAAGGTCTTGAGAGAT
GCTAAATTGGACAAATCTCAAGTCGATGAAATTGTCTTGGTCGGTGGTTCTACCAGAATT
CCAAAGGTCCAAAAATTGGTCACTGACTACTTCAACGGTAAGGAACCAAACAGATCTATC
AACCCAGATGAAGCTGTTGCTTACGGTGCTGCTGTTCAAGCTGCTATTTTGACTGGTGAC
GAATCTTCCAAGACTCAAGATCTATTGTTGTTGGATGTCGCTCCATTATCCTTGGGTATT
GAAACTGCTGGTGGTGTCATGACCAAGTTGATTCCAAGAAACTCTACCATTTCAACAAAG
AAGTTCGAGATCTTTTCCACTTATGCTGATAACCAACCAGGTGTCTTGATTCAAGTCTTT
GAAGGTGAAAGAGCCAAGACTAAGGACAACAACTTGTTGGGTAAGTTCGAATTGAGTGGT
ATTCCACCAGCTCCAAGAGGTGTCCCACAAATTGAAGTCACTTTCGATGTCGACTCTAAC
GGTATTTTGAATGTTTCCGCCGTCGAAAAGGGTACTGGTAAGTCTAACAAGATCACTATT
ACCAACGACAAGGGTAGATTGTCCAAGGAAGATATCGAAAAGATGGTTGCTGAAGCCGAA
AAATTCAAGGAAGAAGATGAAAAGGAATCTCAAAGAATTGCTTCCAAGAACCAATTGGAA
TCCATTGCTTACTCTTTGAAGAACACCATTTCTGAAGCTGGTGACAAATTGGAACAAGCT
GACAAGGACACCGTCACCAAGAAGGCTGAAGAGACTATTTCTTGGTTAGACAGCAACACC
ACTGCCAGCAAGGAAGAATTCGATGACAAGTTGAAGGAGTTGCAAGACATTGCCAACCCA
ATCATGTCTAAGTTGTACCAAGCTGGTGGTGCTCCAGGTGGCGCTGCAGGTGGTGCTCCA
GGCGGTTTCCCAGGTGGTGCTCCTCCAGCTCCAGAGGCTGAAGGTCCAACCGTTGAAGAA
GTTGATTAA
蛋白质Ssa1p属于Hsp70蛋白质家族,而且驻留在细胞溶胶中。Hsp70具有执行许多蛋白伴侣活性的能力;帮助蛋白质合成、装配和折叠;介导多肽易位至多种胞内位置和分解蛋白质聚集体(Backer和Craig,1994,Eur.J.Biochem.,219,11-23)。Hsp70基因高度保守,具有N端ATP结合结构域和C端肽结合结构域。Hsp70蛋白质与蛋白质(主要是未折叠的)的肽主链相互作用。hsp70蛋白质对肽的结合和释放是依赖ATP的过程,而且伴随着hsp70的构象变化(Becher和Craig,1994,前述引用)。
细胞溶胶hsp70蛋白质特别参与蛋白质的合成、折叠和分泌(Becher和Craig,1994,前述引用)。在啤酒糖酵母中,已经将细胞溶胶hsp70蛋白质分成两组,SSA(SSA 1-4)和SSB(SSB 1和2)蛋白质,它们在功能上彼此截然不同。SSA家族是必需的,即为了维持细胞的存活至少一种来自该组的蛋白质必须是有活性的(Becher和Craig,1994,前述引用)。细胞溶胶hsp70蛋白质优先结合未折叠的和不成熟的蛋白质。这说明它们通过将蛋白质前体在细胞溶胶中在装配成多分子复合体前维持未折叠状态和/或推动它们易位至多种细胞器来防止其聚集(Becher和Craig,1994,前述引用)。SSA蛋白质特别参与前体易位进入内质网和线粒体的翻译后生物发生和维持(Kim等人,1998,Proc.Natl.Acad.Sci.USA,95,12860-12865;Ngosuwan等人,2003,J.Biol.Chem.,278(9),7034-7042)。已经证明Ssa1p结合受损蛋白质,使之稳定于部分未折叠形式并容许发生重新折叠或降解(Becher和Craig,1994,前述引用;Glover和Lindquist,1998,Cell,94,73-82)。
本发明还包括SSA1的变体和片段。“变体”在SSA1的语境中指具有天然SSA1的序列,只是一个或多个位置存在或保守的或非保守的氨基酸插入、删除或替代的蛋白质,只要这些变化产生其基本特性例如酶促活性(类型和比活)、热稳定性、在某些pH范围中的活性(pH稳定性)没有显著变化的蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。优选的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
SSA1的“变体”通常与天然SSA1的序列具有至少25%、至少50%、至少60%或至少70%、优选至少80%、更加优选至少90%、甚至更加优选至少95%、仍然更加优选至少99%、最优选至少99.5%的序列同一性。
可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,正如下文所讨论的。这些变体可以是天然的,或是使用本领域众所周知的蛋白质工程和定点诱变的方法人造的。
“片段”在SSA1的语境中指具有天然SSA1的序列,只是一个或多个位置存在删除的蛋白质。由此,片段可以包含完整成熟SSA1蛋白质的完整序列的至多5%、10%、20%、30%、40%或50%、通常可高达60%、更典型的是可高达70%、优选可高达80%、更加优选可高达90%、甚至更加优选可高达95%、仍然更加优选可高达99%。特别优选的SSA1蛋白质的片段包含期望蛋白质的一个或多个完整结构域。
SSA1的片段或变体可以是在宿主细胞诸如啤酒糖酵母中重组表达时能够补足宿主细胞中内源编码SSA1基因的删除的蛋白质,而且可以是例如SSA1的天然存在同系物,诸如由另一种生物体诸如另一种酵母或其它真菌、或另一种真核生物诸如人或其它脊椎动物、或动物或由植物编码的同系物。
另一种优选的蛋白伴侣是PSE1或其具有等价蛋白伴侣样活性的片段或变体。
PSE1,也称为KAP121,是一种必需基因,位于染色体XIII上。
蛋白质Pse1p的一种已发表蛋白质序列如下:
MSALPEEVNRTLLQIVQAFASPDNQIRSVAEKALSEEWITENNIEYLLTFLAEQAAFSQD
TTVAALSAVLFRKLALKAPPSSKLMIMSKNITHIRKEVIAQIRSSLLKGFLSERADSIRH
KLSDAIAECVQDDLPAWPELLQALIESLKSGNPNFRESSFRILTTVPYLITAVDINSILP
IFQSGFTDASDNVKIAAVTAFVGYFKQLPKSEWSKLGILLPSLLNSLPRFLDDGKDDALA
SVFESLIELVELAPKLFKDMFDQIIQFTDMVIKNKDLEPPARTTALELLTVFSENAPQMC
KSNQNYGQTLVMVTLIMMTEVSIDDDDAAEWIESDDTDDEEEVTYDHARQALDRVALKLG
GEYLAAPLFQYLQQMITSTEWRERFAAMMALSSAAEGCADVLIGEIPKILDMVIPLINDP
HPRVQYGCCNVLGQISTDFSPFIQRTAHDRILPALISKLTSECTSRVQTHAAAALVNFSE
FASKDILEPYLDSLLTNLLVLLQSNKLYVQEQALTTIAFIAEAAKNKFIKYYDTLMPLLL
NVLKVNNKDNSVLKGKCMECATLIGFAVGKEKFHEHSQELISILVALQNSDIDEDDALRS
YLEQSWSRICRILGDDFVPLLPIVIPPLLITAKATQDVGLIEEEEAANFQQYPDWDVVQV
QGKHIAIHTSVLDDKVSAMELLQSYATLLRGQFAVYVKEVMEEIALPSLDFYLHDGVRAA
GATLIPILLSCLLAATGTQNEELVLLWHKASSKLIGGLMSEPMPEITQVYHNSLVNGIKV
MGDNCLSEDQLAAFTKGVSANLTDTYERMQDRHGDGDEYNENIDEEEDFTDEDLLDEINK
SIAAVLKTTNGHYLKNLENIWPMINTFLLDNEPILVIFALVVIGDLIQYGGEQTASMKNA
FIPKVTECLISPDARIRQAASYIIGVCAQYAPSTYADVCIPTLDTLVQIVDFPGSKLEEN
RSSTENASAAIAKILYAYNSNIPNVDTYTANWFKTLPTITDKEAASFNYQFLSQLIENNS
PIVCAQSNISAVVDSVIQALNERSLTEREGQTVISSVKKLLGFLPSSDAMAIFNRYPADI
MEKVHKWFA*
PSE1的一种已发表核苷酸编码序列如下,但是应当认识到,可以通过简并替代来修饰序列以获得编码相同蛋白质产物的候选核苷酸序列:
ATGTCTGCTTTACCGGAAGAAGTTAATAGAACATTACTTCAGATTGTCCAGGCGTTTGCT
TCCCCTGACAATCAAATACGTTCTGTAGCTGAGAAGGCTCTTAGTGAAGAATGGATTACC
GAAAACAATATTGAGTATCTTTTAACTTTTTTGGCTGAACAAGCCGCTTTCTCCCAAGAT
ACAACAGTTGCAGCATTATCTGCTGTTCTGTTTAGAAAATTAGCATTAAAAGCTCCCCCT
TCTTCGAAGCTTATGATTATGTCCAAAAATATCACACATATTAGGAAAGAAGTTCTTGCA
CAAATTCGTTCTTCATTGTTAAAAGGGTTTTTGTCGGAAAGAGCTGATTCAATTAGGCAC
AAACTATCTGATGCTATTGCTGAGTGTGTTCAAGACGACTTACCAGCATGGCCAGAATTA
CTACAAGCTTTAATAGAGTCTTTAAAAAGCGGTAACCCAAATTTTAGAGAATCCAGTTTT
AGAATTTTGACGACTGTACCTTATTTAATTACCGCTGTTGACATCAACAGTATCTTACCA
ATTTTTCAATCAGGCTTTACTGATGCAAGTGATAATGTCAAAATTGCTGCAGTTACGGCT
TTCGTGGGTTATTTTAAGCAACTACCAAAATCTGAGTGGTCCAAGTTAGGTATTTTATTA
CCAAGTCTTTTGAATAGTTTACCAAGATTTTTAGATGATGGTAAGGACGATGCCCTTGCA
TCAGTTTTTGAATCGTTAATTGAGTTGGTGGAATTGGCACCAAAACTATTCAAGGATATG
TTTGACCAAATAATACAATTCACTGATATGGTTATAAAAAATAAGGATTTAGAACCTCCA
GCAAGAACCACAGCACTCGAACTGCTAACCGTTTTCAGCGAGAACGCTCCCCAAATGTGT
AAATCGAACCAGAATTACGGGCAAACTTTAGTGATGGTTACTTTAATCATGATGACGGAG
GTATCCATAGATGATGATGATGCAGCAGAATGGATAGAATCTGACGATACCGATGATGAA
GAGGAAGTTACATATGACCACGCTCGTCAAGCTCTTGATCGTGTTGCTTTAAAGCTGGGT
GGTGAATATTTGGCTGCACCATTGTTCCAATATTTACAGCAAATGATCACATCAACCGAA
TGGAGAGAAAGATTCGCGGCCATGATGGCACTTTCCTCTGCAGCTGAGGGTTGTGCTGAT
GTTCTGATCGGCGAGATCCCAAAAATCCTGGATATGGTAATTCCCCTCATCAACGATCCT
CATCCAAGAGTACAGTATGGATGTTGTAATGTTTTGGGTCAAATATCTACTGATTTTTCA
CCATTCATTCAAAGAACTGCACACGATAGAATTTTGCCGGCTTTAATATCTAAACTAACG
TCAGAATGCACCTCAAGAGTTCAAACGCACGCCGCAGCGGCTCTGGTTAACTTTTCTGAA
TTCGCTTCGAAGGATATTCTTGAGCCTTACTTGGATAGTCTATTGACAAATTTATTAGTT
TTATTACAAAGCAACAAACTTTACGTACAGGAACAGGCCCTAACAACCATTGCATTTATT
GCTGAAGCTGCAAAGAATAAATTTATCAAGTATTACGATACTCTAATGCCATTATTATTA
AATGTTTTGAAGGTTAACAATAAAGATAATAGTGTTTTGAAAGGTAAATGTATGGAATGT
GCAACTCTGATTGGTTTTGCCGTTGGTAAGGAAAAATTTCATGAGCACTCTCAAGAGCTG
ATTTCTATATTGGTCGCTTTACAAAACTCAGATATCGATGAAGATGATGCGCTCAGATCA
TACTTAGAACAAAGTTGGAGCAGGATTTGCCGAATTCTGGGTGATGATTTTGTTCCGTTG
TTACCGATTGTTATACCACCCCTGCTAATTACTGCCAAAGCAACGCAAGACGTCGGTTTA
ATTGAAGAAGAAGAAGCAGCAAATTTCCAACAATATCCAGATTGGGATGTTGTTCAAGTT
CAGGGAAAACACATTGCTATTCACACATCCGTCCTTGACGATAAAGTATCAGCAATGGAG
CTATTACAAAGCTATGCGACACTTTTAAGAGGCCAATTTGCTGTATATGTTAAAGAAGTA
ATGGAAGAAATAGCTCTACCATCGCTTGACTTTTACCTACATGACGGTGTTCGTGCTGCA
GGAGCAACTTTAATTCCTATTCTATTATCTTGTTTACTTGCAGCCACCGGTACTCAAAAC
GAGGAATTGGTATTGTTGTGGCATAAAGCTTCGTCTAAACTAATCGGAGGCTTAATGTCA
GAACCAATGCCAGAAATCACGCAAGTTTATCACAACTCGTTAGTGAATGGTATTAAAGTC
ATGGGTGACAATTGCTTAAGCGAAGACCAATTAGCGGCATTTACTAAGGGTGTCTCCGCC
AACTTAACTGACACTTACGAAAGGATGCAGGATCGCCATGGTGATGGTGATGAATATAAT
GAAAATATTGATGAAGAGGAAGACTTTACTGACGAAGATCTTCTCGATGAAATCAACAAG
TCTATCGCGGCCGTTTTGAAAACCACAAATGGTCATTATCTAAAGAATTTGGAGAATATA
TGGCCTATGATAAACACATTCCTTTTAGATAATGAACCAATTTTAGTCATTTTTGCATTA
GTAGTGATTGGTGACTTGATTCAATATGGTGGCGAACAAACTGCTAGCATGAAGAACGCA
TTTATTCCAAAGGTTACCGAGTGCTTGATTTCTCCTGACGCTCGTATTCGCCAAGCTGCT
TCTTATATAATCGGTGTTTGTGCCCAATACGCTCCATCTACATATGCTGACGTTTGCATA
CCGACTTTAGATACACTTGTTCAGATTGTCGATTTTCCAGGCTCCAAACTGGAAGAAAAT
CGTTCTTCAACAGAGAATGCCAGTGCAGCCATCGCCAAAATTCTTTATGCATACAATTCC
AACATTCCTAACGTAGACGTACACACGGCTAATTGGTTCAAAACGTTACCAACAATAACT
GACAAAGAAGCTGCCTCATTCAACTATCAATTTTTGAGTCAATTGATTGAAAATAATTCG
CCAATTGTGTGTGCTCAATCTAATATCTCCGCTGTAGTTGATTCAGTCATACAAGCCTTG
AATGAGAGAAGTTTGACCGAAAGGGAAGGCCAAACGGTGATAAGTTCAGTTAAAAAGTTG
TTGGGATTTTTGCCTTCTAGTGATGCTATGGCAATTTTCAATAGATATCCAGCTGATATT
ATGGAGAAAGTACATAAATGGTTTGCATAA
PSE1基因的大小是3.25kb。Pse1p参与高分子的核质转运(Seedorf和Silver,1997,Proc.Natl.Acad.Sci.USA,94,8590-8595)。该过程经由包埋在核被膜中且由核孔蛋白构成的核孔复合体(NPC)发生(Ryan和Wente,2000,Curr.Opin.Cell Biol.,12,361-371)。蛋白质具有包含核输入(核定位序列(NLS))和输出(核输出序列(NES))所需要的信息的特异序列(Pemberton等人,1998,Curr.Opin.Cell Biol.,10,392-399)。Pse1p是核周蛋白/输入蛋白,分成α和β家族的一组蛋白质。核周蛋白是通过识别NLS和NES并与NPC相互作用来介导高分子转运穿过核膜的可溶性转运因子(Seedorf和Silver,1997,前述引用;Pemberton等人,1998,前述引用;Ryan和Wente,2000,前述引用)。穿过核孔的易位是由GTP水解驱动的,后者是由小GTP结合蛋白质Ran催化的(Seedorf和Silver,1997,前述引用)。已经将Pse1p鉴定为核周蛋白β。已经在啤酒糖酵母中鉴定了14种核周蛋白B蛋白质,其中只有4种是必需的。这可能是因为多种核周蛋白可以介导一种高分子的转运(Isoyama等人,2001,J.Biol.Chem.,276(24),21863-21869)。Pse1p定位于细胞核,位于核被膜,而且在某种程度上延伸至细胞质。这说明该蛋白质移动出入细胞核作为其转运功能的一部分(Seedorf和Silver,1997,前述引用)。Pse1p参与转录因子(Isoyama等人,2001,前述引用;Ueta等人,2003,J.Biol.Chem.,278(50),50120-50127)、组蛋白(Mosammaparast等人,2002,J.Biol.Chem.,277(1),862-868)和核糖体蛋白质(在它们装配成核糖体前)(Pemberton等人,1998,前述引用)的核输入。它还介导mRNA由细胞核的输出。核周蛋白识别并结合在RNA结合蛋白上找到的NES,该RNA结合蛋白在RNA由细胞核输出前将其包被(Seedorf和Silver,1997,前述引用;Pemberton等人,1998,前述引用)。
由于高分子的核质转运对于正确进行细胞周期是至关重要的,因此核转运因子,诸如Pse1p,成为生长控制的新型候选靶(Seedorf和Silver,1997,前述引用)。
已经证明啤酒糖酵母中多拷贝质粒上Pse1p(蛋白质分泌增强子)的过度表达提高一系列生物学活性蛋白质的蛋白质分泌水平(Chow等人,1992,J.Cell.Sci.,101(3),709-719)。
本发明还包括PSE1的变体和片段。“变体”在PSE1的语境中指具有天然PSE1的序列,只是其中一个或多个位置存在或保守的或非保守的氨基酸插入、删除或替代的蛋白质,只要这些变化产生其基本特性例如酶促活性(类型和比活)、热稳定性、在某些pH范围中的活性(pH稳定性)没有显著变化的蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。优选的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
PSE1的“变体”通常与天然PSE1的序列具有至少25%、至少50%、至少60%或至少70%、优选至少80%、更加优选至少90%、甚至更加优选至少95%、仍然更加优选至少99%、最优选至少99.5%的序列同一性。
可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,正如下文所讨论的。这些变体可以是天然的,或是使用本领域众所周知的蛋白质工程和定点诱变的方法人造的。
“片段”在PSE1的语境中指具有天然PSE1的序列,只是一个或多个位置存在删除的蛋白质。由此,片段可以包含完整成熟PSE1蛋白质的完整序列的至多5%、10%、20%、30%、40%或50%、通常可高达60%、更典型的是可高达70%、优选可高达80%、更加优选可高达90%、甚至更加优选可高达95%、仍然更加优选可高达99%。特别优选的PSE1蛋白质的片段包含期望蛋白质的一个或多个完整结构域。
PSE1的片段或变体可以是在宿主细胞诸如啤酒糖酵母中重组表达时能够补足宿主细胞中内源PSE1基因的删除的蛋白质,而且可以是例如PSE1的天然存在同系物,诸如由另一种生物体诸如另一种酵母或其它真菌、或另一种真核生物诸如人或其它脊椎动物、或动物或由植物编码的同系物。
另一种优选的蛋白伴侣是ORM2或其具有等价蛋白伴侣样活性的片段或变体。
ORM2,也称为YLR350W,位于啤酒糖酵母基因组的染色体XII上(位置828729至829379),且编码与酵母蛋白质Orm1p具有相似性的进化保守的蛋白质。Hjelmqvist等人,2002,Genome Biology,3(6),research0027.1-0027.16报告了ORM2属于包括三种人类基因(ORMDL1、ORMDL2和ORMDL3)以及微孢子虫、植物、果蝇、尾索动物和脊椎动物中的同系物的基因家族。有报道说ORMDL基因编码锚定在内质网(ER)中的跨膜蛋白质。
蛋白质Orm2p是针对诱导未折叠蛋白质应答的试剂的抗性所需要的。Hjelmqvist等人,2002,前述引用,报告了两种啤酒糖酵母ORMDL同系物(ORM1和ORM2)的双重敲除导致生长速率降低以及针对衣霉素(tunicamycin)和二硫苏糖醇的敏感性增加。
Orm2p的一种已发表序列如下:
MIDRTKNESPAFEESPLTPNVSNLKPFPSQSNKISTPVTDHRRRRSSSVISHVEQETFED
ENDQQMLPNMNATWVDQRGAWLIHIVVIVLLRLFYSLFGSTPKWTWTLTNMTYIIGFYIM
FHLVKGTPFDFNGGAYDNLTMWEQINDETLYTPTRKFLLIVPIVLFLISNQYYRNDMTLF
LSNLAVTVLIGVVPKLGITHRLRISIPGITGRAQIS*
上述蛋白质在啤酒糖酵母中是由如下编码核苷酸序列编码的,但是应当认识到,可以通过简并替代来修饰序列以获得编码相同蛋白质产物的候选核苷酸序列:
ATGATTGACCGCACTAAAAACGAATCTCCAGCTTTTGAAGAGTCTCCGCTTACCCCCAAT
GTGTCTAACCTGAAACCATTCCCTTCTCAAAGCAACAAAATATCCACTCCAGTGACCGAC
CATAGGAGAAGACGGTCATCCAGCGTAATATCACATGTGGAACAGGAAACCTTCGAAGAC
GAAAATGACCAGCAGATGCTTCCCAACATGAACGCTACGTGGGTCGACCAGCGAGGCGCG
TGGTTGATTCATATCGTCGTAATAGTACTCTTGAGGCTCTTCTACTCCTTGTTCGGGTCG
ACGCCCAAATGGACGTGGACTTTAACAAACATGACCTACATCATCGGATTCTATATCATG
TTCCACCTTGTCAAAGGTACGCCCTTCGACTTTAACGGTGGTGCGTACGACAACCTGACC
ATGTGGGAGCAGATTAACGATGAGACTTTGTACACACCCACTAGAAAATTTCTGCTGATT
GTACCCATTGTGTTGTTCCTGATTAGCAACCAGTACTACCGCAACGACATGACACTATTC
CTCTCCAACCTCGCCGTGACGGTGCTTATTGGTGTCGTTCCTAAGCTGGGAATTACGCAT
AGACTAAGAATATCCATCCCTGGTATTACGGGCCGTGCTCAAATTAGTTAG
本发明还包括ORM2的变体和片段。“变体”在ORM2的语境中指具有天然ORM2的序列,只是其中一个或多个位置存在或保守的或非保守的氨基酸插入、删除或替代的蛋白质,只要这些变化产生其基本特性例如酶促活性(类型和比活)、热稳定性、在某些pH范围中的活性(pH稳定性)没有显著变化的蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。优选的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
ORM2的“变体”通常与天然ORM2的序列具有至少25%、至少50%、至少60%或至少70%、优选至少80%、更加优选至少90%、甚至更加优选至少95%、仍然更加优选至少99%、最优选至少99.5%的序列同一性。
可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,正如下文所讨论的。这些变体可以是天然的,或是使用本领域众所周知的蛋白质工程和定点诱变的方法人造的。
“片段”在ORM2的语境中指具有天然ORM2的序列,只是一个或多个位置存在删除的蛋白质。由此,片段可以包含完整成熟ORM2蛋白质的完整序列的至多5%、10%、20%、30%、40%或50%、通常可高达60%、更典型的是可高达70%、优选可高达80%、更加优选可高达90%、甚至更加优选可高达95%、仍然更加优选可高达99%。特别优选的ORM2蛋白质的片段包含期望蛋白质的一个或多个完整结构域。
ORM2的片段或变体可以是在宿主细胞诸如啤酒糖酵母中重组表达时能够补足宿主细胞中内源ORM2基因的删除的蛋白质,而且可以是例如ORM2的天然存在同系物,诸如由另一种生物体诸如另一种酵母或其它真菌、或另一种真核生物诸如人或其它脊椎动物、或动物或由植物编码的同系物。
特别优选的是,依照本发明第一个、第二个或第三个方面的质粒或在多核苷酸序列插入中或在质粒的其它部位包含编码如下蛋白质的开放读码框,该蛋白质包含清蛋白或其片段或变体的序列。或者,该质粒转化其中的宿主细胞可以在其基因组内包含编码如下蛋白质的多核苷酸序列作为或内源的或异源的序列,该蛋白质包含清蛋白或其片段或变体的序列。
“清蛋白”包括具有由任何来源获得的清蛋白蛋白质之序列的蛋白质。通常,来源指哺乳动物。在一个优选的实施方案中,血清清蛋白指人血清清蛋白(“HSA”)。术语“人血清清蛋白”包括具有在人类中天然存在的氨基酸序列的血清清蛋白及其变体的含义。优选的是,清蛋白具有WO 90/13653中公开的氨基酸序列或其变体。可以通过用于分离与人类基因对应的cDNA的已知方法获得HSA编码序列,正如例如EP 73 646和EP 286 424中所公开的。
在另一个优选的实施方案中,“清蛋白”具有牛血清清蛋白的序列。术语“牛血清清蛋白”包括具有在牛中天然存在的氨基酸序列的血清清蛋白(例如来自Swissprot编号P02769)及其变体的含义,正如下文所定义的。术语“牛血清清蛋白”还包括全长牛血清清蛋白或其变体的片段的含义,正如下文所定义的。
在另一个优选的实施方案中,清蛋白指由来自犬(如参阅Swissprot编号P49822)、猪(如参阅Swissprot编号P08835)、山羊(如可由Sigma以产品编号A2514或A4164获得)、火鸡(如参阅Swissprot编号O73860)、狒狒(如可由Sigma以产品编号A1516获得)、猫(如参阅Swissprot编号P49064)、鸡(如参阅Swissprot编号P19121)、卵清蛋白(如鸡卵清蛋白)(如参阅Swissprot编号P01012)、驴(如参阅Swissprot编号P39090)、豚鼠(如可由Sigma以产品编号A3060、A2639、O5483或A6539获得)、仓鼠(如可由Sigma以产品编号A5409获得)、马(如参阅Swissprot编号P35747)、猕猴(如参阅Swissprot编号Q28522)、小鼠(如参阅Swissprot编号O89020)、鸽子(如Khan等人,2002,Int.J.Biol.Macromol.,30(3-4),171-8所定义的)、兔(如参阅Swissprot编号P49065)、大鼠(如参阅Swissprot编号P36953)和绵羊(如参阅Swissprot编号P14639)的血清清蛋白其中之一衍生(具有其序列)的清蛋白,且包括其变体和片段,正如下文所定义的。
已知清蛋白的许多天然存在的突变形式。Peters,1996,《All AboutAlbumin:Biochemistry,Genetics and Medical Applications》,Academic PressInc.,San Diego,California,第170-181页描述了许多。如上定义的变体可以是这些天然存在变体之一。
“变体清蛋白”指其中一个或多个位置存在或保守的或非保守的氨基酸插入、删除或替代的清蛋白蛋白质,只要这些变化产生其至少一项基本特性例如结合活性(类型和比活,如与胆红素结合)、渗透性(渗透压、胶体渗透压)、在某些pH范围中的表现(pH稳定性)没有显著变化的清蛋白蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。可以通过本领域众所周知的技术来制备这些变体,正如通过1981年11月24日发布给Stevens的美国专利号4,302,386中公开的定点诱变,收入本文作为参考。
通常,清蛋白变体与天然存在的清蛋白具有超过40%、通常至少50%、更加典型的是至少60%、优选至少70%、更加优选至少80%、仍然更加优选至少90%、甚至更加优选至少95%、最优选至少98%或更高序列同一性。
可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,例如威斯康星大学(University of Wisconsin)遗传计算小组(GeneticComputing Group)的GAP程序,而且应当认识到,同一性百分比是关于其序列得到最佳对比的多肽计算得出的。或者可以使用Clustal W程序(Thompson等人,1994)来进行对比。可以使用如下参数:快速成对对比参数:K-tuple(词)大小;1,窗口大小;5,缺口罚分;3,最高对角线数目;5。评分方法:x百分比。M多重对比参数:缺口打开罚分;10,缺口延伸罚分;0.05。评分矩阵:BLOSUM。
术语“片段”如上所用包括全长清蛋白或其变体的任何片段,只要至少一项基本特性例如结合活性(类型和比活,如与胆红素结合)、渗透性(渗透压、胶体渗透压)、在某些pH范围中的表现(pH稳定性)没有显著变化。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。片段的长度通常是至少50个氨基酸。片段可以包含清蛋白的至少一个完整亚结构域。已经作为重组蛋白表达HSA的结构域(Dockal,M.等人,1999,J.Biol.Chem.,274,29303-29310),其中结构域I定义为由氨基酸1-197组成,结构域II定义为由氨基酸189-385组成,而结构域III定义为由氨基酸381-585组成。存在结构域的部分交叠是因为结构域I和II之间、结构域II和III之间存在延伸的α-螺旋结构(Peters,1996,前述引用,表2-4)。HSA还包含六个亚结构域(亚结构域IA、IB、IIA、IIB、IIIA和IIIB)。亚结构域IA包含氨基酸6-105,亚结构域IB包含氨基酸120-177,亚结构域IIA包含氨基酸200-291,亚结构域IIB包含氨基酸316-369,亚结构域IIIA包含氨基酸392-491,而亚结构域IIIB包含氨基酸512-583。片段可以包含如上定义的一个或多个结构域或亚结构域的整个或部分,或是那些结构域和/或亚结构域的任意组合。
由此,多核苷酸插入可以包含编码清蛋白或其变体或片段的开放读码框。
或者,优选的是,依照本发明第一个、第二个或第三个方面的质粒在多核苷酸序列插入内或在质粒的其它部位包含编码如下蛋白质的开放读码框,该蛋白质包含运铁蛋白或其变体或片段的序列。或者,该质粒转化其中的宿主细胞可以在其基因组内包含编码如下蛋白质的多核苷酸序列作为或内源的或异源的序列,该蛋白质包含运铁蛋白或其变体或片段的序列。
术语“运铁蛋白”在用于本文时包括运铁蛋白家族的所有成员(Testa,《Proteins ofiron metabolism》,CRC Press,2002;Harris和Aisen,《Iron carriersand iron proteins》,第5卷,Physical Bioinorganic Chemistry,VCH,1991)及其衍生物,诸如运铁蛋白、运铁蛋白突变体(Mason等人,1993,Biochemistry,32,5472;Mason等人,1998,Biochem.J.,330(1),35)、截短的运铁蛋白、运铁蛋白叶(Mason等人,1996,Protein Expr.Purif.,8,119;Mason等人,1991,Protein Expr.Purif.,2,214)、乳铁蛋白、乳铁蛋白突变体、截短的乳铁蛋白、乳铁蛋白叶(lobe)、或任何上述与其它肽、多肽或蛋白质的融合体(Shin等人,1995,Proc.Natl.Acad.Sci.USA,92,2820;Ali等人,1999,J.Biol.Chem.,274,24066;Mason等人,2002,Biochemistry,41,9448)。
运铁蛋白可以是人运铁蛋白。术语“人运铁蛋白”在用于本文时指与衍生自人的运铁蛋白不能区别或是其变体或片段的物质。“变体”包括或保守的或非保守的插入、删除和替代,其中这些变化不显著改变运铁蛋白的有用的配体结合或免疫原性特性。
本发明包括运铁蛋白的突变体。这些突变体可以具有改变的免疫原性。例如,运铁蛋白突变体可以展示经过修饰的(如降低的)糖基化。可以通过添加/消除氨基酸糖基化共有序列来修饰运铁蛋白分子的N连接糖基化模式,诸如N-X-S/T,在N、X、或S/T的任何或所有位置。对运铁蛋白突变体可以改变其与金属离子和/或其它蛋白质诸如运铁蛋白受体的天然结合。下文例示了以这种方式修饰的运铁蛋白突变体的一个实例。
本发明还包括人运铁蛋白或人运铁蛋白类似物的天然存在多态变体。通常,人运铁蛋白的变体或片段具有人运铁蛋白的配体结合活性(例如铁结合)的至少50%(优选至少80%、90%或95%),重量对重量。可以通过分光光度法测定运铁蛋白或测试样品的铁结合活性,对蛋白质测量它们没有铁和满载铁状态的470nm∶280nm吸光度比值。试剂应当不含铁,除非另有说明。可以通过在0.1M柠檬酸盐、0.1M醋酸盐、10mM EDTA pH4.5中进行透析而由运铁蛋白或测试样品中清除铁。蛋白质应当以约20mg/ml溶于100mMHEPES、10mM NaHCO3 pH8.0。测量在水中稀释的脱铁运铁蛋白(Calbiochem,CN Biosciences,Nottingham,UK)的470nm∶280nm吸光度比值,从而能够通过分光光度法精确测定280nm吸光度(0%铁结合)。将191mg次氮基三乙酸溶于2ml 1M NaOH,然后添加2ml 0.5M氯化铁,由此制备20mM次氮基三乙酸铁(FeNTA)溶液。用去离子水稀释至50ml。添加充分过量的新鲜制备的20mM FeNTA使脱铁运铁蛋白满载铁(100%铁结合),然后在100mM HEPES、10mM NaHCO3pH8.0中彻底透析全运铁蛋白,从而在测量470nm∶280nm吸光度比值前清除剩余FeNTA。用测试样品重复此流程,它应当是最初不含铁,并将最终比值与对照进行比较。
另外,可以使用包含任何上述的单一或多重异源融合体;或是与清蛋白、运铁蛋白或免疫球蛋白或其变体或片段的一种或多种异源融合体。这些融合体包括清蛋白N端融合体、清蛋白C端融合体和WO 01/79271例示的清蛋白N端和C端共融合体、及运铁蛋白N端融合体、运铁蛋白C端融合体和运铁蛋白N端和C端共融合体。
技术人员还将领会,任何其它基因的开放读码框或变体或部分或其中任一在形成用于本发明的多核苷酸序列插入时可用于形成整个或部分开放读码框。例如,开放读码框可以编码包含任何序列的蛋白质,它可以是天然蛋白质(包括酶原)、或天然蛋白质的变体、或片段(它可以是例如结构域);或是完全人工合成的蛋白质;或是不同蛋白质(天然的或合成的)的单一或多重融合体。不排他的,这些蛋白质可以来自WO 01/79258、WO 01/79271、WO 01/79442、WO 01/79443、WO 01/79444和WO 01/79480中提供的列表或其变体或片段;将其公开书收入本文作为参考。尽管这些专利申请提供了关于清蛋白融合配偶体的内容的列表,本发明不受此限制,而且出于本发明的目的,可以单独提供其中所列的任何蛋白质或者以清蛋白、免疫球蛋白Fc区、运铁蛋白、乳铁蛋白或任何其它蛋白质或任何上述的片段或变体的融合配偶体,包括包含任何上述的融合蛋白的形式,作为期望多肽。美国专利申请US2003/0221201和US2003/0226155给出了运铁蛋白融合体的其它实例。
通过本发明表达的期望蛋白质的其它优选实例包括包含单克隆抗体、鬼臼亚乙苷(etoposide)、血清蛋白质(诸如血液凝结因子)、antistasin、蜱抗凝肽(tick anticoagulant peptide)、运铁蛋白、乳铁蛋白、内皮抑制素(endostatin)、抑管张素(angiostatin)、胶原蛋白、免疫球蛋白或基于免疫球蛋白的分子或二者片段(如Small Modular ImmunoPharmaceuticalTM(小模块免疫药物,“SMIP”)或dAb、Fab′片段、F(ab′)2、scAb、scFv或scFv片段)、Kunitz结构域蛋白质(诸如WO 03/066824中所描述的,含或不含清蛋白融合体)、干扰素、白介素、IL10、IL11、IL2、干扰素α的各个种类和亚类、干扰素β各个种类和亚类、干扰素γ的各个种类和亚类、瘦蛋白(leptin)、CNTF、CNTFAX15、IL1受体拮抗物、红细胞生成素(EPO)和EPO模拟物、血小板生成素(TPO)和TPO模拟物、prosaptide、蓝藻抗病毒蛋白N(cyanovirin-N)、5-螺旋、T20肽、T1249肽、HIV gp41、HIV gp120、尿激酶、尿激酶原、tPA(组织型纤溶酶原激活物)、水蛭素、血小板衍生生长因子、甲状旁腺激素、胰岛素原、胰岛素、胰高血糖素、胰高血糖素样肽、胰岛素样生长因子、降钙素、生长激素、转化生长因子β、肿瘤坏死因子、G-CSF、GM-CSF、M-CSF、FGF、前体和活性形式的凝血因子包括但不限于纤溶酶原、纤维蛋白原、凝血酶、前凝血酶、凝血酶原、von Willebrand氏因子、α1-抗胰蛋白酶、纤溶酶原激活物、因子VII、因子VIII、因子IX、因子X和因子XIII、神经生长因子、LACI(脂蛋白相关促凝抑制物,也称为组织因子途经抑制物或外部途经抑制物)、血小板衍生内皮细胞生长因子(PD-ECGF)、葡萄糖氧化酶、血清胆碱酯酶、抑酶肽(aprotinin)、淀粉状蛋白前体蛋白(amyloid precursor)、inter-α胰蛋白酶抑制物(inter-alpha typsin)、抗凝血酶III、脱脂载脂蛋白各种类、蛋白C、蛋白S或任何上述的变体或片段或融合蛋白之序列的序列。上述蛋白可以是也可以不是hirudin。
“变体”在上文所列蛋白质的语境中指其中一个或多个位置存在或保守的或非保守的氨基酸插入、删除或替代的蛋白质,只要这些变化产生其基本特性例如酶促活性或受体结合(类型和比活)、热稳定性、在某些pH范围中的活性(pH稳定性)没有显著变化的蛋白质。“显著”在此语境中指本领域技术人员将认为变体的特性仍然与最初的蛋白质有所不同,但不是不明显的。
“保守替代”指预定组合,诸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。优选的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
“变体”通常与衍生它的多肽具有至少25%、至少50%、至少60%或至少70%、优选至少80%、更加优选至少90%、甚至更加优选至少95%、仍然更加优选至少99%、最优选至少99.5%的序列同一性。
可以使用合适的计算机程序来测定两种多肽之间的序列同一性百分比,例如威斯康星大学(University of Wisconsin)遗传计算小组Genetic ComputingGroup的GAP程序,而且应当认识到,同一性百分比是关于其序列得到最佳对比的多肽计算得出的。
或者,可以使用Clustal W程序(Thompson等人,1994,Nucleic Acids Res.,22(22),4673-80)来进行对比。可以使用如下参数:
●快速成对对比参数:K-tuple(词)大小;1,窗口大小;5,缺口罚分;3,最高对角线数目;5。评分方法:x百分比。
●多重对比参数:缺口打开罚分;10,缺口延伸罚分;0.05。
●评分矩阵:BLOSUM。
这些变体可以是天然的,或是使用本领域众所周知的蛋白质工程和定点诱变的方法人造的。
“片段”在上文所列蛋白质的语境中指一个或多个位置存在删除的蛋白质。由此,片段可以包含完整成熟多肽的完整序列的至多5%、10%、20%、30%、40%或50%。通常,片段包含完整期望多肽的完整序列的可高达60%、更典型的是可高达70%、优选可高达80%、更加优选可高达90%、甚至更加优选可高达95%、仍然更加优选可高达99%。特别优选的期望蛋白质的片段包含期望蛋白质的一个或多个完整结构域。
特别优选的是,依照本发明第一个、第二个或第三个方面的质粒或在多核苷酸序列插入中或在质粒的其它部位包含编码如下蛋白质的开放读码框,该蛋白质包含清蛋白或其片段或变体或是来自上文实例的任何其它蛋白质(与融合配偶体融合的或未融合的)的序列和至少一种其它异源序列,其中至少一种其它异源序列可以包含转录区,诸如开放读码框。在一个实施方案中,开放读码框可以编码包含酵母蛋白质之序列的蛋白质。在另一个实施方案中,开放读码框可以编码包含参与蛋白质折叠或是具有蛋白伴侣活性或参与未折叠蛋白质应答的蛋白质之序列的蛋白质,优选蛋白质二硫键异构酶。
由此生成的质粒在US和UL区之间可以具有或没有对称性。例如,在US与UL之间或在UL与US区之间可以达到1∶1、5∶4、5∶3、5∶2、5∶1或5∶<1的大小比例。本发明的好处不依赖所维持的对称性。
本发明还提供了制备本发明质粒的方法,该方法包括:
(a)提供包含REP2基因或FLP基因和与所述基因相邻的反向重复片段的2μm家族质粒;
(b)提供多核苷酸序列并在依照本发明第一个、第二个或第三个优选方面的位置将多核苷酸序列插入质粒;和/或
(c)作为步骤(b)的附加/候选,在依照本发明第一个、第二个或第三个优选方面的位置删除一些或所有核苷酸碱基;和/或
(d)作为步骤(b)和(c)的附加/候选,在依照本发明第一个、第二个或第三个优选方面的位置用候选核苷酸碱基替代一些或所有核苷酸碱基。
可以使用本领域众所周知的技术来完成步骤(b)、(c)和(d),包括克隆技术、定点诱变等,诸如Sambrook等人,《Molecular Cloning:A LaboratoryManual》,2001,第3版(将其内容收入本文作为参考)中所描述的。例如,这样一种方法涉及经由粘端的连接。可以通过合适限制酶的作用在用于插入的DNA片段和质粒上生成相容粘端。这些末端将经由互补碱基配对而快速退火,而且可以通过DNA连接酶的作用来关闭剩余的切口。
另一种方法使用合成的双链寡核苷酸接头和衔接头。通过消除突出的3’末端并补平凹入的3’末端的噬菌体T4DNA聚合酶或大肠杆菌DNA聚合酶I生成具有平端的DNA片段。可以通过T4DNA连接酶将含有指定限制酶的识别序列的合成接头和平端双链DNA碎片与末端补平的DNA片段连接。然后用合适的限制酶消化它们以生成粘端,并与具有相容末端的表达载体连接。衔接头也是化学合成的DNA片段,它含有一个用于连接的平端,但也具有一个预先形成的粘端。或者,可以在存在或不含一种或多种合成双链寡核苷酸(任选含有粘端的)时通过DNA连接酶的作用将DNA片段连接到一起。
可以通过商业途经由许多来源获得含有多种限制性内切核酸酶位点的合成接头,包括Sigma-Genosys Ltd,London Road,Pampisford,Cambridge,United Kingdom。
因此,本发明还提供了可通过上述方法获得的质粒。
本发明还提供了包含上文定义的质粒的宿主细胞。宿主细胞可以是任何类型的细胞。优选细菌和酵母宿主细胞。细菌宿主细胞可用于克隆目的。酵母宿主细胞可用于表达质粒中存在的基因。
在一个实施方案中,宿主细胞是质粒在其中作为多拷贝质粒稳定的细胞。由一种酵母类型获得的质粒可以在其它酵母类型中得到维持(Irie等人,1991,Gene,108(1),139-144;Irie等人,1991,Mol.Gen.Genet.,225(2),257-265)。例如,来自鲁氏接合糖酵母的pSR1可以在啤酒糖酵母中维持。如果质粒是基于pSR1、pSB3或pSB4的,那么宿主细胞可以是鲁氏接合糖酵母;如果质粒是基于pSB1或pSB2的,那么宿主细胞可以是拜列氏接合糖酵母;如果质粒是基于pPM1的,那么宿主细胞可以是膜醭毕赤氏酵母;如果质粒是基于pSM1的,那么宿主细胞可以是发酵接合糖酵母;如果质粒是基于pKD1的,那么宿主细胞可以是果蝇克鲁维氏酵母;而如果质粒是基于2μm质粒的,那么宿主细胞可以是啤酒糖酵母或卡尔斯伯糖酵母。如果本发明的2μm家族质粒包含具有衍生自该天然存在质粒之序列的基因FLP、REP1和REP2中的一种、两种或优选三种,那么可以将它说成是“基于”该天然存在质粒的。
可以经由标准技术将如上定义的质粒导入宿主。关于原核宿主细胞的转化,参阅例如Cohen等人,1972,Proc.Natl.Acad.Sci.USA,69,2110及Sambrook等人,2001,《Molecular Cloning,A Laboratory Manual》,第3版,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY。酵母细胞的转化参阅Sherman等人,1986,《Methods In Yeast Genetics,A Laboratory Manual》,Cold Spring Harbor,NY。也可以使用Beggs,1978,Nature,275,104-109的方法。EP 251744、EP 258067和WO 90/01063中概括讲授了用于转化啤酒糖酵母的方法,将它们都收入本文作为参考。关于脊椎动物细胞,可用于转染这些细胞的试剂例如磷酸钙和DEAE-右旋糖苷或脂质体配剂可以由Stratagene Cloning System或Life Technologies Inc.,Gaithersburg,MD 20877,USA获得。
电穿孔也可用于转化细胞,而且在本领域众所周知用于转化酵母细胞、细菌细胞和脊椎动物细胞。Becker和Guarente,1990,Methods Enzymol.,194,182中公开了通过电穿孔转化酵母的方法。
一般而言,质粒不会转化所有的宿主,因此必须选择得到转化的宿主细胞。由此,依照本发明第一个、第二个或第三个方面其中任一的质粒可以或在多核苷酸序列插入中或在质粒的其它部位包含选择标记,包括但不限于细菌选择标记和/或酵母选择标记。典型的细菌选择标记是β-内酰胺酶基因,尽管本领域还知道许多其它的。合适的酵母选择标记包括LEU2(或编码具有β-内酰胺酶或苹果酸脱氢酶活性的蛋白质的等价基因)、TRP1、HIS3、HIS4、URA3、URA5、SFA1、ADE2、MET15、LYS5、LYS2、ILV2、FBA1、PSE1、PDI1和PGK1。根据可以获得的不同选项,可以选择最合适的选择标记。如果希望这么做,可以消除URA3和/或LEU2。本领域技术人员将领会,其染色体删除或灭活将导致宿主不可存活的任何基因,即所谓的必需基因,都可用作选择标记,如果在质粒上提供功能性基因的话,正如PGK1在pgk1酵母菌株中所演示的(Piper和Curran,1990,Curr.Genet.,17,119)。合适的必需基因可以在斯坦福基因组数据库(Stanford Genome Database,SGD)中找到,http://db.yeastgenome.org。
另外,依照本发明第一个、第二个或第三个方面其中任一的质粒可以或在多核苷酸序列插入中或在质粒的其它部位包含超过一种选择标记。
一种选择技术涉及将编码转化细胞中的可选择性状的DNA序列标记与任何必需的控制元件一起掺入表达载体。这些标记包括用于真核细胞培养的二氢叶酸还原酶、G418或新霉素抗性,及用于培养大肠杆菌和其它细菌的四环素、卡那霉素或氨苄青霉素(即β-内酰胺酶)抗性基因。或者,这些可选择性状的基因可以在用于共转化期望宿主细胞的另一种载体上。
鉴定受到成功转化的细胞的另一种方法涉及培养通过导入本发明质粒而生成的细胞,任选容许表达重组多肽(即由质粒上的多核苷酸序列编码且对于宿主细胞是异源的多肽,就该宿主不天然生成该多肽而言)。可以收获并裂解细胞,并使用诸如Southern,1975,J.Mol.Biol.,98,503或Berent等人,1985,Biotech.,3,208描述的方法或者本领域常用的DNA和RNA分析的其它方法,对它们的DNA或RNA内容检查重组序列的存在。或者,可以使用抗体来检查转化细胞培养物上清液中多肽的存在。
当重组DNA能够指导蛋白质的表达时,除了直接检验重组DNA的存在以外,可以通过众所周知的免疫学方法来确认成功的转化。例如,用表达载体成功转化的细胞生成展示适当抗原性的蛋白质。收获怀疑得到转化的细胞的样品并使用合适的抗体检验蛋白质。
由此,除了得到转化的宿主细胞自身以外,本发明还涵盖那些细胞在营养培养基中的培养物,优选单克隆(克隆同质的)培养物,或是由单克隆培养物衍生的培养物。或者,转化细胞自身可以代表工业/商业或制药学有用的产品,而且可以由培养物的培养基纯化,并任选以适合于它们的预定工业/商业或制药学用途的方式与载体或稀释剂一起配制,且任选以适合于该用途的方式包装和展示。例如,可以将全细胞固定化;或用于将细胞培养物直接喷洒到突起的部分(process)、农作物或其它期望目标上/中。类似的,全细胞,诸如酵母细胞,可以胶囊的形式用于极其多种应用,诸如香料、香精和药物。
然后,可以在本领域技术人员知道的且考虑到本文公开的技术的适当条件下将经转化宿主细胞培养足够时间,从而容许质粒内一个或多个多核苷酸序列插入中任何ORF的表达。
本发明由此还提供了用于生产蛋白质的方法,包括下列步骤:(a)提供如上定义的依照本发明第一个、第二个或第三个方面的质粒;(b)提供合适的宿主细胞;(c)用所述质粒转化所述宿主细胞;并(d)在培养基中培养经转化宿主细胞,由此生成蛋白质。
已知许多表达系统,包括细菌(例如大肠杆菌和枯草芽孢杆菌)、酵母、丝状真菌(例如曲霉)、植物细胞、完整植株、动物细胞和昆虫细胞。
在一个实施方案中,优选的宿主细胞是质粒能够在其中作为稳定多拷贝质粒维持的酵母。这些酵母包括啤酒糖酵母、乳克鲁维氏酵母、巴斯德毕赤氏酵母、鲁氏接合糖酵母、拜列氏接合糖酵母、发酵接合糖酵母和果蝇克鲁维氏酵母。
如果质粒含有或经过修饰后含有选择标记(如LEU2)且通过标记遗失测量的稳定性在1代、2代、3代、4代、5代、6代、7代、8代、9代、10代、11代、12代、13代、14代、15代、16代、17代、18代、19代、20代、25代、30代、35代、40代、45代、50代、60代、70代、80代、90代、100代或更多代后是至少1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或基本上100%,那么它能够在宿主中作为稳定多拷贝质粒维持。可以如上所述参考Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25来评估标记的遗失。
特别有利的是利用参与蛋白质O-糖基化的一种或多种蛋白质甘露糖基转移酶缺陷的酵母,例如通过破坏基因编码序列。
重组表达的蛋白质可能由生产宿主细胞进行不想要的翻译后修饰。例如,清蛋白蛋白质序列不含N-连接糖基化的任何位点,且没有报道说在自然条件下受到O-连接糖基化的修饰。然而,发现在许多酵母物种中生成的重组人清蛋白(“rHA”)可以受到O-连接糖基化的修饰,通常涉及甘露糖。甘露糖化清蛋白能够结合凝集素伴刀豆球蛋白A。由酵母生成的甘露糖化清蛋白的数量可以通过使用一种或多种PMT基因缺陷的酵母菌株而降低(WO94/04687)。实现这一目的的最方便方式是创建其基因组具有缺陷使得一种或多种Pmt蛋白质的水平降低的酵母。例如,编码序列或调控区(或调节PMT基因之一表达的另一种基因)中可以存在缺失、插入或转座,使得生成少许Pmt蛋白质或不生成。或者,可以转化酵母以生成抗Pmt试剂,诸如抗Pmt抗体。
如果使用啤酒糖酵母以外的酵母,那么破坏啤酒糖酵母PMT基因的一种或多种等价基因也是有利的,例如在巴斯德毕赤氏酵母或乳克鲁维氏酵母中。由啤酒糖酵母分离的PMT1(或任何其它PMT基因)的序列可用于鉴定或破坏在其它真菌物种中编码相似酶促活性的基因。WO 94/04687中描述了乳克鲁维氏酵母PMT1同系物的克隆。
有利的是,酵母具有HSP150和/或YAP3基因的缺失,正如WO 95/33833和WO 95/23857中分别讲授的。
本发明还提供了生产蛋白质的方法,包括下列步骤:提供如上定义的宿主细胞,该宿主细胞包含本发明的质粒,并在培养基中培养所述宿主细胞,由此生成蛋白质。培养基可以是非选择性的,或是对质粒的稳定多拷贝维持施加选择压力。
生产由本发明质粒表达的蛋白质的方法优选还包括以下步骤:由培养的宿主细胞或培养基分离由此生成的蛋白质。
由此生成的蛋白质可以是存在于胞内,或者如果分泌的话,存在于培养基和/或宿主细胞周质空间中。可以通过本领域知道的许多方法由细胞和/或培养物的培养基分离蛋白质。例如,WO 92/04367“基质衍生染料的清除”、EP 464 590“酵母衍生着色剂的清除”、EP 319 067“清蛋白向亲脂相的碱沉淀和后续应用”及描述完整纯化过程的WO 96/37515、US 5 728 553和WO00/44772中公开了用于回收重组表达清蛋白的纯化技术(都收入本文作为参考)。可以通过已经发现可用于纯化这些蛋白质的任何技术由培养物的培养基纯化清蛋白以外的蛋白质。
这些众所周知的方法包括硫酸铵或乙醇沉淀、酸或溶剂萃取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、亲和层析、羟磷灰石层析、凝集素层析、浓缩、稀释、pH调节、渗滤、超滤、高效液相层析(“HPLC”)、反相HPLC、电导率调节等。
在一个实施方案中,可以使用任何一种或多种上述技术进一步纯化由此分离的蛋白质,达到商业可接受的纯度水平。商业可接受的纯度水平包括提供浓度为至少0.01g.L-1、0.02g.L-1、0.03g.L-1、0.04g.L-1、0.05g.L-1、0.06g.L-1、0.07g.L-1、0.08g.L-1、0.09g.L-1、0.1g.L-1、0.2g.L-1、0.3g.L-1、0.4g.L-1、0.5g.L-1、0.6g.L-1、0.7g.L-1、0.8g.L-1、0.9g.L-1、1g.L-1、2g.L-1、3g.L-1、4g.L-1、5g.L-1、6g.L-1、7g.L-1、8g.L-1、9g.L-1、10g.L-1、15g.L-1、20g.L-1、25g.L-1、30g.L-1、40g.L-1、50g.L-1、60g.L-1、70g.L-1、80g.L-1、90g.L-1、100g.L-1、150g.L-1、200g.L-1、250g.L-1、300g.L-1、350g.L-1、400g.L-1、500g.L-1、600g.L-1、700g.L-1、800g.L-1、900g.L-1、1000g.L-1或更高的蛋白质。
可以将由此纯化的蛋白质冻干。或者,可以将它与载体或稀释剂一起配制,且任选以单位剂量形式提供。
优选的是,分离蛋白质,达到制药学可接受的纯度水平。如果蛋白质基本上不含热原且能够以制药学有效数量施用而不引起与该蛋白质的活性无关的医学效应,那么它具有制药学可接受的纯度水平。
由此生成的蛋白质可利用任何它的已知功效,在清蛋白的情况中,包括静脉内施用于患者以治疗重度烧伤、休克和失血、补充培养基及在其它蛋白质的配剂中作为赋形剂。
虽然有可能单独施用通过本发明方法获得的在治疗上有用的期望蛋白质,但是优选作为与一种或多种可接受载体或稀释剂一起的药物配剂的形式提供。就与期望蛋白质相容且对其接受者无害而言,载体或稀释剂必须是“可接受的”。通常,载体或稀释剂是无菌且不含热原的水或盐水。
任选的是,以单位剂量形式提供由此生成的配剂,诸如药片、胶囊、注射液等形式。
我们已经证明,由质粒携带的编码包含“必需”蛋白质之序列的蛋白质的基因可用于在如下宿主细胞中稳定维持质粒,该宿主细胞在缺乏该质粒时不生成该必需蛋白质。一种优选的必需蛋白质是必需的蛋白伴侣,它可以提供如下更多优势,在担当选择标记以提高质粒稳定性的同时,其表达同时提高宿主细胞内由重组基因编码的异源蛋白的表达。该系统是有利的,因为它容许用户将需要质粒携带的重组基因的数目降至最低。例如,典型的现有技术的质粒携带使得质粒能够在宿主细胞培养过程中稳定维持的标记基因(诸如上文所描述的)。除了实现期望效果所需要的任何其它基因以外,还需要在质粒上维持这些标记基因。然而,质粒中掺入外源DNA序列的能力是有限的,因此将实现期望效果所需要的序列插入的数目降至最低是有利的。此外,有些标记基因(诸如营养缺陷型标记基因)需要在特定条件下进行培养过程以获得标记基因的效果。这些特定条件对于细胞生长或蛋白质生产可能不是最佳的,或是可能需要使用低效/无效的或过度昂贵的培养系统。
由此,有可能使用重组编码如下蛋白质的基因作为质粒携带的基因来提高质粒稳定性,该蛋白质包含“必需蛋白质”的序列,其中该质粒存在于在缺乏该质粒时不能生成该“必需蛋白质”的细胞中。
优选的是,“必需蛋白质”指其编码基因在宿主细胞中遭到删除或灭活时不会导致宿主细胞形成营养缺陷(生物合成)需求的蛋白质。“营养缺陷(生物合成)需求”包括可以通过添加或修改生长培养基而补足的缺陷。因此,编码“必需蛋白质”的“必需标记基因”在本发明的内容中指在宿主细胞中遭到删除或灭活时导致不能通过添加或修改生长培养基而补足的缺陷的基因。该系统的优势在于“必需标记基因”可用作如下宿主细胞中质粒上的选择标记以实现质粒稳定性提高且没有要求在特定选择性(如选择性营养物)条件下培养细胞的缺点,该宿主细胞在缺乏该质粒时不能生成该基因产物。因此,可以在不必为任何具体标记基因改动的条件下培养宿主细胞而质粒稳定性没有损失。例如,可以在非选择性培养基诸如复合或丰富培养基中培养使用该系统生成的宿主细胞,它可能比常用于给予营养缺陷标记基因其效果的极限培养基更加经济。
例如,细胞的内源基因可以是删除的或是以其它方式灭活的。
特别优选的是“必需蛋白质”是“必需”蛋白伴侣,因为这能够提供双重优势,既在宿主细胞中在不需要选择性培养条件下提高质粒稳定性,又提高蛋白质产量,诸如内源编码的或异源的蛋白质。该系统还具有如下优势,即如果选择使用必需蛋白伴侣的过表达来提高宿主细胞的蛋白质产量,那么它将需要质粒携带的重组基因的数目降至最低。
用于本发明这个方面的优选“必需蛋白质”包括“必需”蛋白伴侣PDI1和PSE1,及其它“必需”基因产物诸如PGK1或FBA1,它们在宿主细胞中编码这些蛋白质的内源基因遭到删除或灭活时不会导致宿主细胞形成营养缺陷(生物合成)需求。
因此,在第四个方面,本发明还提供了包含如下质粒(诸如依照本发明第一个、第二个或第三个方面其中任一的质粒)的宿主细胞,该质粒包含编码必需蛋白伴侣的基因,其中在缺乏该质粒时,宿主细胞不能生成该蛋白伴侣。优选的是,在缺乏该质粒时,宿主细胞不能存活。宿主细胞还可以包含编码异源(或同源,就重组基因编码其序列与由宿主细胞编码的蛋白质的序列相同的蛋白质而言)蛋白的重组基因,诸如上文关于本发明较早方面所描述的。
在第五个方面,本发明还提供了包含编码必需蛋白伴侣的基因作为唯一选择标记的质粒。该质粒还可以包含编码异源蛋白的基因。质粒可以是2μm家族质粒,且优选是依照本发明第一个、第二个或第三个方面其中任一的质粒。
在第六个方面,本发明还提供了用于生产异源蛋白的方法,包括下列步骤:提供包含如下质粒的宿主细胞,该质粒包含编码必需蛋白伴侣的基因,其中在缺乏该质粒时宿主细胞不能生成该蛋白伴侣且其中宿主细胞还包含编码异源蛋白的重组基因;在容许必需蛋白伴侣和异源蛋白表达的条件下在培养基中培养所述宿主细胞;并任选由培养的宿主细胞或培养基纯化由此表达的异源蛋白;还任选将由此纯化的蛋白质冻干。
该方法还可以包括如下步骤:将纯化的异源蛋白与载体或稀释剂一起配制并任选人上文讨论的方式以单位剂量形式提供由此配制的蛋白质。在一个优选的实施方案中,该方法涉及在非选择性培养基中培养宿主细胞,诸如丰富培养基。
                            附图简述
图1显示了2μm质粒的质粒图谱。
图2显示了pSAC35的质粒图谱。
图3显示了一些例示性FLP插入位点。
图4至8、10、11、13至32、36至42、44至46、48至54、和57至76显示了各种质粒的图谱。
图9显示了含有PDI1基因的pDB2429的DNA片段。
图12显示了一些例示性REP2插入位点。
图33显示了实施例中提到的表3。
图34显示了SEQ ID NO:1。
图35显示了SEQ ID NO:2。
图43显示了PCR引物DS248和DS250的序列。
图47显示了含有各种pSAC35衍生质粒的啤酒糖酵母在非选择性液体培养中培养时代数渐增的质粒稳定性。
图55显示了RIE结果。将10ml YEPD摇瓶接种经自pDB3078分离的1.41kb NotI/PstI pdi1::TRP1中断DNA片段转化成为色氨酸原养型的DXY1trp1Δ[pDB2976]、DXY1 trp1Δ[pDB2977]、DXY1 trp1Δ[pDB2978]、DXY1trp1Δ[pDB2979]、DXY1 trp1Δ[pDB2980]或DXY1 trp1Δ[pDB2981]。将转化子于30℃以200rpm培养4天。火箭免疫电泳凝胶(Weeke,B.,1976,Rocketimmunoelectrophoresis,在N.H.Azelsen、J.Kroll和B.Weeke编的《A Manualof quantitative immunoelectrophoresis.Methods and applications》,Universitetsforlaget,Oslo,Norway)的每个孔加载4μl培养物上清液。rHA标准物浓度以μg/ml计。700μl山羊抗HA(Sigma产品A-1151,重悬于5ml水)/50ml琼脂糖。沉淀素(precipitin)用考马斯蓝染色。(*)指示选择用于进一步分析的分离物。
图56显示了RIE结果。将10ml YEPD摇瓶接种DXY1[pDB2244]、DXY1[pDB2976]、DXY1 trp1Δpdi1::TRP1[pDB2976]、DXY1[pDB2978]、DXY1trp1Δ pdi1::TRP1[pDB2978]、DXY1[pDB2980]、DXY1 trp1Δpdi1::TRP1[pDB2980]、DXY1[pDB2977]、DXY1 trp1Δpdi1::TRP1[pDB2977]、DXY1[pDB2979]、DXY1 trp1Δpdi1::TRP1[pDB2979]、DXY1[pDB2981]、和DXY1trp1Δpdi1::TRP1[pDB2981],并于30℃以200rpm培养4天。火箭免疫电泳凝胶的每个孔加载4μl培养物上清液。rHA标准物浓度以μg/ml计。800μl山羊抗HA(Sigma产品A-1151,重悬于5ml水)/50ml琼脂糖。沉淀素用考马斯蓝染色。(*)指示选择用于进一步分析的分离物。
                        实施例
这些实施例描述了将额外DNA序列插入在图2所示类型且通常称为pSAC35的2μm家族质粒US区内由限制性内切核酸酶位点定义的许多位置,所述质粒包含β-内酰胺酶基因(用于氨苄青霉素抗性,在转化到酵母中后由质粒遗失)、LEU2选择标记和寡核苷酸接头,其中后两种插入2μm家族非整合载体pSAC3的UL区内唯一SnaBI位点(参阅EP 0 286 424)。选择的位点指向REP2和FLP编码区的3’端,或在反向重复序列的下游。将短合成DNA接头插入每个位点,并在非选择性培养基上进行的培养过程中比较经过修饰的质粒的相对稳定性。鉴定得出DNA插入的优选位点。通过将包含PDI1基因的DNA片段插入REP2后面的XcmI位点,演示了含有“目的基因”的较大DNA片段的插入。
实施例1
将合成DNA接头插入pSAC35小独特区的XcmI位点中
最初评估的用于将额外DNA插入pSAC35US区中的位点是599bp反向重复片段中的XcmI位点。一个XcmI位点在REP2翻译终止密码子后面51bp处切割,而由于与反向重复片段的交叠,另一个XcmI位点在FLP编码序列末端前面127bp处切割(见图3)。
插入的序列是通过将寡核苷酸CF86和CF87的0.5mM溶液退火而得到的52bp接头。此DNA接头含有核心区“SnaBI-PacI-PseI/SfiI-SmaI-SnaBI”,它编码pSAC35缺乏的限制位点。
XcmI接头(CF86+CF87)
                                    SfiI
                               --------------
                         PacI                   SnaBI
                      ---------                -------
                SnaBI          FseI       SmaI
               -------      --------    ------
CF86  GGAGTGGTA CGTATTAATT AAGGCCGGCC AGGCCCGGGT ACGTACCAAT TGA
CF87 TCCTCACCAT GCATAATTAA TTCCGGCCGG TCCGGGCCCA TGCATGGTTA AC
                                                  将质粒pSAC35用XcmI部分消化,由0.7%(w/v)琼脂糖凝胶分离线性11kb片段,与CF86/CF87XcmI接头(未掺水的、10-1和10-2稀释度)连接,并转化到大肠杆菌DH5a中。选择氨苄青霉素抗性转化子,并筛选能够通过SmaI消化而线性化的质粒的存在。限制酶分析鉴定出pDB2688(图4)在REP2后面的XcmI位点中克隆了接头。使用寡核苷酸引物CF88、CF98和CF99(表1)进行的DNA测序确认了插入含有正确的接头序列。
表1:寡核苷酸测序引物
  引物   描述   序列
  CF88   REP2引物,20聚物   5′-ATCACGTAATACTTCTAGGG-3′
  CF98   REP2引物,20聚物   5′-AGAGTGAGTTGGAAGGAAGG-3′
  CF99   REP2引物,20聚物   5′-AGCTCGTAAGCGTCGTTACC-3′
  CF90   FLP引物,20聚物   5′-CTAGTTTCTCGGTACTATGC-3′
  CF91   FLP引物,20聚物   5′-GAGTTGACTAATGTTGTGGG-3′
  CF100   FLP引物,20聚物   5′-AAAGCTTTGAAGAAAAATGC-3′
  CF101   FLP引物,20聚物   5′-GCAAGGGGTAGGATCGATCC-3′
  CF123   pDB2783MCS,24聚物   5′-ATTCGAGCTCGGTACCTACGTACT-3′
  CF126   pDB2783MCS,24聚物   5′-CCCGGGCACGTGGGATCCTCTAGA-3′
  M13正向   pDB2783MCS,17聚物   5′-GTAAAACGACGGCCAGT-3′
  M13反向   pDB2783MCS,16聚物   5′-AACAGCTATGACCATG-3′
  CF129   反向重复片段引物,19聚物   5′-GTGTTTATGCTTAAATGCG-3′
  CF130   REP2引物,20聚物   5′-TCCTCTTGCATTTGTGTCTC-3′
  引物   描述   序列
  CF131   REP2引物,19聚物   5′-ATCTTCCTATTATTATAGC-3′
限制酶分析还鉴定出pDB2689(图5)在FLP中的XcmI位点中克隆了接头。然后,通过使用引物CF90和CF91进行的DNA测序证明,pDB2689中的接头在FseI/SfiI位点内缺少G:C碱基对(上文在CF86+CF97接头中以粗体标记)。这生成了其翻译终止密码子前的39个C端氨基酸残基以56个不同氨基酸代替的突变型Flp蛋白的编码序列。
矫正pDB2689接头序列中缺少的碱基对,生成pDB2786(图6)。为此,由寡核苷酸CF104和CF105制备31bp 5’-磷酸化SnaBI接头。将它连接到事先用小牛小肠碱性磷酸酶处理过的pDB2689的SnaBI位点中。使用寡核苷酸引物CF90、CF91、CF100和CF101进行的DNA测序确认了pDB2786中的正确DNA接头序列。这生成了其翻译终止密码子前的39个C端残基以14个不同残基代替的突变型Flp蛋白的编码序列。
SnaBI接头(CF104+CF105)
                          SfiI
                     --------------
                       FseI
                     --------
               PacI               SmaI
            ---------            ------
CF104 Pi-GTATTAATTA AGGCCGGCCA GGCCCGGGTA C
CF105    CATAATTAAT TCCGGCCGGT CCGGGCCCAT G-Pi
                                                 还通过将SnaBI接头以与pDB2786以相反的方向连接而生成了另一种质粒pDB2798(图7)。通过DNA测序确认了pDB2798中的接头序列。质粒pDB2798含有其翻译终止密码子前的39个C端残基以8个不同残基代替的突变型Flp蛋白的编码序列。
还将一种接头克隆到FLP基因中的XcmI位点中,从而在插入位点处截短Flp蛋白。所用接头是由寡核苷酸CF120和CF121制备的45bp 5’-磷酸化XcmI接头。
XcmI接头(CF120+CF121)
                                     SfiI
                                --------------
                          PacI                     SnaBI
                       ---------                  -------
                 SnaBI             FseI      SmaI
                -------    --------    ------
CF120 Pi-GTAATAATA CGTATTAATT AAGGCCGGCC AGGCCCGGGT ACGTAA
CF121   TCATTATTAT GCATAATTAA TTCCGGCCGG TCCGGGCCCA TGCAT-Pi
将该CF120/CF121XcmI接头与通过XcmI部分消化及后续小牛小肠碱性磷酸酶处理生成的11kb pSAC35片段连接。氨苄青霉素抗性大肠杆菌DH5α转化子的分析鉴定出含有pDB2823(图8)的克隆。使用引物CF90、CF91、CF100和CF101进行的DNA测序确认了pDB2823中的接头序列。插入的接头内的翻译终止将导致Flp(1-382)的生成,它缺乏41个C端残基。
对pDB2688和pDB2689评估了在pSAC35US区内XcmI位点中插入接头序列对质粒稳定性的影响。通过YEPS上非选择性培养过程中LEU2标记的遗失,在啤酒糖酵母菌株中测定了质粒稳定性。使用经pSAC35转化的相同酵母菌株作为对照,pSAC35在结构上与pSAC3相似,但是在SnaBI位点处包含插入的额外DNA,它包含LEU2选择标记(Chinery和Hinchliffe,1989,Curr.Genet.,16,21)。
使用改良的醋酸锂法(Sigma酵母转化试剂盒,YEAST-1,方案2;Ito等人,1983,J.Bacterol.,153,163;Elble,1992,Biotechniques,13,18),将酵母菌株转化成亮氨酸原养型。在BMMD琼脂板上选择转化子,然后点接到BMMD琼脂板上。由10ml BMMD摇瓶培养物(24小时,30℃,200rpm)制备冷冻海藻糖原种。
Sleep等人,2002,Yeast,18,403描述了YEPD和BMMD的组成。YEPS和BMMS的组成与YEPD和BMMD相似,只是以2%(w/v)蔗糖替代2%(w/v)葡萄糖作为唯一的初始碳源。
为了测定质粒稳定性,将1ml冷冻原种解冻,接种250ml锥形瓶中的100ml YEPS(初始OD600≈0.04-0.09),并在定轨摇床(200rpm,Innova 4300摇床,New Brunswick Scientific)中于30℃培养约72小时(70-74小时)。
由每个烧瓶中取出样品,在YEPS培养基中稀释(10-2至10-5稀释度),并以双份将100μl小样涂布到YEPS琼脂板上。将细胞于30℃培养3-4天以容许单菌落形成。对于分析的每种酵母原种,以复制方式将100个随机菌落点接到BMMS琼脂板上,然后是YEPS琼脂板。于30℃培养3-4天后,测定在BMMS琼脂板和YEPS琼脂板上都生长的菌落的百分比作为质粒稳定性的度量。
在用于测量转化子遗失LEU2标记的上述分析中,pSAC35和pDB2688表现出100%稳定,而pDB2689是72%稳定。由此,将接头插入REP2后面的XcmI位点中对质粒稳定性没有明显影响,尽管改变了转录序列并破坏了599bp反向重复片段之间的同源性。在FLP中的XcmI位点处插入接头也导致令人惊讶的稳定的质粒,尽管既破坏了反向重复片段又突变了Flp蛋白。
实施例2
将PDI1基因插入pDB2688的XcmI接头中
通过将啤酒糖酵母PDI1基因克隆到pDB2688的XcmI接头中,演示了将大DNA片段插入2μm样载体的US区。PDI1基因(图9)是在来自含有PDI1基因的较大啤酒糖酵母SKQ2n基因组DNA片段(在US 6,291,205中描述的质粒pMA3a:C7中提供,在Crouzet和Tuite,1987,Mol.Gen.Genet.,210,581-583及Farquhar等人,1991,见上文中也描述成克隆C7)的1.9kbSacI-SpeI片段上克隆的,它已经克隆到YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中,而且具有含SacI限制位点的合成DNA接头,该接头插入PDI1基因3′非翻译区中唯一Bsu36I位点处。用T4DNA聚合酶处理1.9kb SacI-SpeI片段,填充SpeI的5′突出并切除SacI的3′突出。此PDI1片段包含翻译起始密码子上游的212bp PDI1启动子和翻译终止密码子下游的148bp。将它与经SmaI线性化/小牛小肠碱性磷酸酶处理的pDB2688连接,生成质粒pDB2690(图10),其中PDI1基因以与REP2相同的方向转录。用pDB2690将啤酒糖酵母菌株转化成亮氨酸原养型。
然后将人运铁蛋白突变体(N413Q、N611Q)的表达盒克隆到pDB2690的NotI位点中,生成pDB2711(图11)。pDB2711中的表达盒含有啤酒糖酵母PRB1启动子、HSA/MFα融合前导序列(EP 387319;Sleep等人,1990,Biotechnology(N.Y.),8,42),后面是人运铁蛋白突变体(N413Q、N611Q)的编码序列和啤酒糖酵母ADH1终止子。通过将相同表达盒插入pSAC35的NotI位点,类似构建质粒pDB2536(图36)。
经pDB2711转化的酵母在发酵过程中与经pDB2536转化的相同酵母相比将重组运铁蛋白(N413Q、N611Q)分泌提高约7倍,这演示了将“目的基因”插入2μm载体US区的优点。在摇瓶培养中观察到重组运铁蛋白(N413Q、N611Q)分泌提高约15倍(数据未显示)。
使用上文描述的方法,在YEPS培养基中培养的相同酵母菌株中测定了质粒pDB2688、pDB2690、pDB2711、pDB2536和pSAC35的相对稳定性(表2)。
在此项分析中,pDB2690是32%稳定的,比较而言不含PDI1插入片段的pDB2688是100%稳定的。质粒稳定性的这种降低小于对pDB2536观察到的质粒稳定性降低,它是由将rTF(N413Q、N611Q)表达盒插入pSAC35大独特区内的NotI位点引起的(表2)。
此外,在高细胞密度发酵过程中在极限培养基中进行的选择性培养能够压倒在YEPS培养基中观察到的由PDI1插入引起的质粒稳定性提高,因为来自经pDB2711转化的相同酵母的rTF(N413Q、N611Q)产量与经pDB2536转化的相同酵母所达到的相比没有降低。
表2:关于将PDI1插入pSAC35小独特区的质粒稳定性数据的总结。数据来自在涂布到YEPS琼脂上之前非选择性摇瓶培养的3天培养物。
 质粒   插入位点   额外详情   相对稳定性
 pSAC35   -   -   100%
 pDB2688   XcmI   接头在反向重复片段中   100%
 pDB2690   XcmI   PDI1在XcmI接头中   32%
 pDB2711   XcmI、NotI   PDI1在XcmI接头中,rTf盒在NotI处   10%
 pDB2536   NotI   rTF盒在NotI处   17%
实施例3
将DNA接头插入pSAC35的REP2基因和反向重复片段中的下游序列
为了定义将额外DNA插入REP2基因及其下游反向重复片段中的序列的有用限制,将其它接头插入pSAC35。图12指示了用于这些插入的限制性位点以及在这些位点处翻译终止对Rep2蛋白的影响。
插入REP2中XmnI位点处的接头是由寡核苷酸CF108和CF109制备的44bp序列。
XmnI接头(CF108+CF109)
                                  SfiI
                             --------------
                       PacI                     SnaBI
                    ---------                  -------
              SnaBI            FseI       SmaI
             -------         --------    ------
CF108 ATAATAATAC GTATTAATTA AGGCCGGCCA GGCCCGGGTA CGTA
CF109 TATTATTATG CATAATTAAT TCCGGCCGGT CCGGGCCCAT GCAT
为了避免插入pSAC35中的其它XmnI位点,首先将含有REP2和FLP基因的来自pSAC35的3076bp XbaI片段亚克隆到大肠杆菌克隆载体pDB2685(图13)中,生成pDB2783(图14)。
质粒pDB2685是衍生自pCF17的pUC18样克隆载体,含有来自肺炎克雷伯氏菌(Klebsiella pneumoniae)的阿泊拉霉素抗性基因aac(3)IV(Rao等人,1983,Antimicrob.Agents Chemother.,24,689)和来自pMCS5的多克隆位点(Hoheisel,1994,Biotechniques,17,456)。pCF17是如下由pIJ8600(Sun等人,1999,Microbiology,145(9),2221-7)制备的,用EcoRI、NheI和DNA聚合酶的Klenow片段消化,并自我连接,然后通过感受态大肠杆菌DH5α转化和硫酸阿泊拉霉素选择由反应产物进行分离。质粒pDB2685是通过将来自pMCS5的439bp SspI-SwaI片段克隆到经MscI切割并用小牛小肠碱性磷酸酶处理的pCF17中而构建的。蓝/白选择不依赖IPTG诱导。
将pDB2783用XmnI线性化,并与CF108/CF109XmnI接头连接,生成pDB2799(图15)和pDB2780(未显示)。质粒pDB2799以在插入位点处翻译终止而生成Rep2(1-244)的正确取向含有CF108/CF109XmnI接头,而pDB2780含有以相反方向克隆的接头。使用引物CF98和CF99进行的DNA测序确认了正确的接头序列。
然后将来自pDB2799的3120bp XbaI片段与通过部分XbaI消化和小牛小肠碱性磷酸酶处理生成的7961bp pSAC35片段连接,生成质粒pDB2817(B型)和pDB2818(A型)非整合载体(分别是图16和17)。
在pSAC35中ApaI位点处插入接头是经过和未经T4DNA聚合酶的3’-5’外切核酸酶消化进行的。这生成了翻译终止前Rep2(1-271)或Rep2(1-269)的编码序列。在下图中,以斜线标记的序列GGCC由ApaI消化后生成的3’-突出删除,导致甘氨酸-170(GGC)和脯氨酸-171密码子的核苷酸的消除。
未经外切核酸酶消化在ApaI位点处插入的接头是由寡核苷酸CF116和CF117制备的50bp 5’-磷酸化接头。
4paI接头(CF116+CF 117)
                                       SfiI
                                  --------------
                           PacI                      SnaBI
                         ---------                   ------
                   SnaBI            FseI       SmaI
                   ------         ---------   -------
CF116  Pi-CTTAAT AATACGTATT AATTAAGGCC GGCCAGGCCC GGGTACGTAG GGCC
CF117 CCGGGAATTA TTATGCATAA TTAATTCCGG CCGGTCCGGG CCCATGCATC-Pi
将它与用ApaI线性化并用小牛小肠碱性磷酸酶处理的pSAC35连接,生成pDB2788(图18)和pDB2789(未显示)。在pDB2788内,接头处于脯氨酸-271后翻译终止的正确取向,而在pDB2789内,接头处于相反取向。
经过T4DNA聚合酶的外切核酸酶消化在ApaI位点处插入的接头是由寡核苷酸CF106和CF107制备的43bp 5’-磷酸化接头,称为核心终止接头。核心终止接头(CF106+CF107)
                                    SfiI
                                --------------
                        PacI                      SnaBI
                      --------                  --------
                SnaBI            FseI       SmaI
               -------         --------    ------
CF106 Pi-TAATAATACG TATTAATTAA GGCCGGCCAG GCCCGGGTAC GTA
CF107    ATTATTATGC ATAATTAATT CCGGCCGGTC CGGGCCCATG CAT-Pi
                                            35将核心终止接头与用ApaI线性化、用T4 DNA聚合酶消化并用小牛小肠碱性磷酸酶处理的pSAC35连接。此连接生成其中接头以在谷氨酸-269后翻译终止的正确取向克隆的pDB2787(图19)。
使用寡核苷酸引物CF98和CF99确认了含有ApaI接头的所有克隆中的正确DNA序列。
核心终止接头(CF106+CF107)还用于插入pDB2783(图14)中的FspI位点。将核心终止接头(CF106+CF107)连接到通过部分FspI消化而线性化并用小牛小肠碱性磷酸酶处理的pDB2783中。通过FspI消化筛选由阿泊拉霉素抗性大肠杆菌DH5α转化子分离的质粒,并用M13正向和反向引物对选择的克隆测序。
鉴定出质粒pDB2801(未显示)含有以正确取向(PacI位点距REP2基因最近)克隆的两个拷贝的接头。然后通过首先由多克隆位点区删除含FseI位点的116bp NruI-HpaI片段,随后用FseI消化并自我连接而生成pDB2802(图20),由此消除接头的额外拷贝。使用寡核苷酸CF126进行的DNA测序确认了正确的接头序列。
然后将3119bp pDB2802XbaI片段与通过部分XbaI消化和小牛小肠碱性磷酸酶处理生成的7961bp pSAC35片段连接,生成pDB2805(B型)和pDB2806(A型)非整合载体(分别是图21和22)。
实施例4
将DNA接头插入pSAC35的FLP基因和反向重复片段中的下游序列
为了定义将额外DNA插入FLP基因及下游反向重复片段中的序列的有用限制,将DNA接头插入pSAC35。图3指示了用于这些插入的限制性位点以及在这些位点处翻译终止对Flp蛋白的影响。
插入BclI位点处的接头是由寡核苷酸CF118和CF119制备的49bp 5’-磷酸化接头。
BclI接头(CF118+CF119)
                                      SfiI
                                  -------------
                            PacI                    SnaBI
                          --------                  ------
                     SnaBI          FseI       SmaI
                     -----         -------    ------
CF118 Pi-GATCACTAATAATACGTATTAATTAAGGCCGGCCAGGCCCGGGTACGTA
CF119        TGATTATTATGCATAATTAATTCCGGCCGGTCCGGGCCCATGCATCTAG-Pi
由于pSAC35中BclI位点的Dam甲基化,将BclI接头克隆到由大肠杆菌菌株ET12567pUZ8002(MacNeil等人,1992,Gene,111,61;Kieser等人,2000,Practical Streptomyces Genetics,The John Innes Foundation,Norwich)分离的非甲基化pSAC35DNA中。将质粒pSAC35用BclI线性化,用小牛小肠碱性磷酸酶处理,并与BclI接头连接,生成pDB2816(图23)。使用寡核苷酸引物CF91和CF100进行的DNA测序显示,pDB2816中存在3个拷贝的BclI接头,都处于在组氨酸-353后Flp翻译终止的正确取向。
将pDB2816用PacI消化,然后自我连接,生成分别含有一个和两个拷贝BclI接头的pDB2814和pDB2815(分别是图24和25)。使用引物CF91和CF100确认了接头的DNA序列。在啤酒糖酵母中,经pDB2814、pDB2815或pDB2816转化的酵母将生成截短型Flp(1-353)。
还通过将单个拷贝的BclI接头以与pDB2814相反的方向连接而生成了另一种质粒pDB2846(数据未显示)。它具有来自Flp的前352个残基然后是翻译终止前的14个不同残基的编码序列。
在HgaI位点处插入的接头是由寡核苷酸CF114和CF115制备的47bp 5’-磷酸化接头。
HgaI接头(CF114+CF115)
                                     SfiI
                                -------------
                           PacI                    SnaBI
                         --------                  -----
                    SnaBI          FseI      SmaI
                   ------        --------   ------
CF114 Pi-AGTACTATAATACGTATTAATTAAGGCCGGCCAGGCCCGGGTACGTA
CF115         ATATTATGCATAATTAATTCCGGCCGGTCCGGGCCCATGCATTCATG-Pi
将hgaI接头与通过部分HgaI消化而线性化并用小牛小肠碱性磷酸酶处理的pDB2783连接,生成pDB2811(图26)。使用寡核苷酸CF90、CF91和CF100进行的DNA测序确认了正确的接头插入。
然后将来自pDB2811的3123bp XbaI片段与通过部分XbaI消化和小牛小肠碱性磷酸酶处理生成的7961bp pSAC35片段连接,生成在HgaI位点处含有插入的DNA的pDB2812(B形式)和pDB2813(A形式)非整合载体(分别是图27和28)。
通过用于构建pDB2801的相同方法,分离在FLP后面的FspI处具有插入的核心终止接头(CF106+CF107)的质粒pDB2803和pDB2804(分别是图29和30)。通过DNA测序确认了正确的接头插入。质粒pDB2804含有以正确取向(PacI位点距FLP基因最近)插入的接头,而pDB2803含有处于相反取向的接头。
将pDB28043119bpXbaI片段与通过部分XbaI消化和小牛小肠碱性磷酸酶处理生成的7961bp pSAC片段连接,生成在FLP后面的FspI位点处含有插入的DNA的pDB2807(B型)和pDB2808(A型)非整合载体(分别是图31和32)。
实施例5
经含有插入小独特区和反向重复片段的DNA接头的pSAC35样质粒转化的酵母中LEU2标记的相对稳定性
用在US区和反向重复片段中含有插入的DNA接头的pSAC35样质粒转化啤酒糖酵母菌株。制备冷冻的海藻糖原种用于测试质粒稳定性(表3)。如上文关于在pSAC35中XcmI位点处插入的接头所述分析质粒稳定性。对分析的每一种插入位点建立双份烧瓶。另外,为了分析由在摇瓶中培养3天后的细胞衍生的菌落,由进一步4天摇瓶培养的细胞培养并分析菌落。为此,由每个3天旧烧瓶取出100μl样品,并在100ml YEPS培养基中进行传代培养,即在定轨摇床中于30.0℃再培养约96小时(94-98小时),然后获取单菌落并分析LEU2标记的遗失。在这种情况中,分析限制于来自选定菌株的单个烧瓶,由它挑取50个菌落。表4总结了总体结果。
表4:关于将DNA插入pSAC35的质粒稳定性数据的总结。
第1组代表来自在非选择性摇瓶培养中培养3天的数据。
第2组代表来自在非选择性摇瓶培养中培养7天的数据。
A)REP2插入位点
  质粒   插入位点   额外详情     相对稳定性
  第1组   第2组
  pSAC35   -   对照   99%   100%
  pDB2817和pDB2818   XcmI   REP2(1-244)   39%   16%
  pDB2787   ApaI/T4pol.   REP2(1-269)   45%   0%
  pDB2788   ApaI   REP2(1-271)   33%   0%
  pDB2688   XcmI   反向重复片段   100%   100%
  pDB2805知pDB2806   FspI   反向重复片段   100%   100%
B)FLP插入位点
  质粒   插入位点   额外详情      相对稳定性
  第1组   第2组
  pDB2814   BclI   FLP(1-353)   67%   64%
  pDB2823   XcmI   FLP(1-382)   64%   53%
  pDB2812和pDB2813   HgaI   反向重复片段   100%   100%
  pDB2808   FspI   反向重复片段   100%   100%
所有经过修饰的pSAC35质粒都能够将酵母转化成亮氨酸原养型,指示尽管额外DNA插入2μm DNA功能性聚集区内,但是它们都能在啤酒糖酵母中复制和分配。这适用于在2μm US区中所有位点具有插入的43-52bp接头以及含有PDI1基因的较大DNA插入的质粒。
关于接头插入位点,数据在试验和副本之间是可再现的。REP2或FLP开放读码框以外但反向重复片段以内的所有位点在所用测试条件下表现为100%稳定。对插入REP2或FLP开放读码框内位点的接头观察到质粒不稳定性(即质粒遗失)。对REP2插入观察到的质粒不稳定性大于FLP插入。对于REP2插入,LEU2标记的遗失随非选择性培养基中的生长期延长而继续,而对于FLP插入只有少许差异。
REP2基因中的插入生成在已知在自缔合和结合2μm STB基因座中发挥功能的区域内截短的Rep2多肽(Sengupta等人,2001,J.Bacteriol.,183,2306)。
FLP基因中的插入导致截短的Flp蛋白。所有插入位点都在C端结构域中酪氨酸-343后面,它是Flp蛋白正确发挥功能所必需的(Prasad等人,1987,Proc.Natl.Acad.Sci.USA,84,2189;Chen等人,1992,Cell,69,647;Grainge等人,2001,J.Mol.Biol.,314,717)。
反向重复区中的插入都不导致检出的质粒不稳定性,除了FLP XcmI位点中的插入,它也截短Flp蛋白产物。反向重复区中FspI位点处的插入最接近对质粒复制重要的FRT(Flp识别靶)区。
构建了将43-52bp DNA接头插入REP2开放读码框、或FLP开放读码框或反向重复序列中的pSAC35样质粒。另外,将含有PDI1基因的1.9kbDNA片段插入REP2后面XcmI位点处的DNA接头。
具有插入的额外DNA的所有pSAC35样载体都能够将酵母转化成亮氨酸原养型。因此,尽管将DNA插入2μm质粒DNA的功能性聚集区,但是质粒复制和分配机制未受破坏。
通过在非选择性培养基中进行的培养过程中测量LEU2选择标记的遗失而测定质粒稳定性指示,将DNA接头插入反向重复片段没有使质粒不稳定,而REP2和FLP开放读码框中的插入降低了质粒稳定性。然而,尽管在REP2和FLP开放读码框中在由本发明第一个和第二个方面定义的一些位置进行插入时在非选择性培养基的培养条件下质粒稳定性降低了,由此生成的质粒仍然具有足够高的稳定性,用于在选择性培养基上培养的酵母。
实施例6
在pSAC35小独特区中紧挨着REP2基因后面插入DNA序列
为了进一步定义将额外DNA插入REP2基因及其下游反向重复片段中的序列的有用限制,紧挨着REP2翻译终止密码子(TGA)后面将合成DNA接头插入pSAC35。因为2μm(或pSAC35)中紧挨着REP2编码序列后面没有天然存在的方便的限制性内切核酸酶位点,通过寡核苷酸指导的诱变将SnaBI位点引入该位置。将紧挨着REP2下游具有唯一SnaBI位点的pSAC35衍生物命名为pDB2938(图37)。在pDB2938中,反向重复片段的末端通过插入SnaBI位点而由反向重复片段的其余部分替换。然后将由寡核苷酸CF104和CF105(见上文)制备的与SnaBI接头相同的31bp序列插入pDB2938的唯一SnaBI位点而构建pDB2954(图38),使得紧挨着REP2的TGA翻译终止密码子后面的限制性内切核酸酶位点的顺序是SnaBI-PacI-FseI/SfiI-SmaI-SnaBI。
为了构建pDB2938,首先将来自pDB2783(图14)的1085bp NcoI-BamHI片段亚克隆到经过NcoI、BamHI和小牛小肠碱性磷酸酶消化的pMCS5(Hoheisel,1994,Biotechniques,17,456)中。这生成了pDB2809(图39),然后使用寡核苷酸CF127和CF128诱变,生成pDB2920(图40)。51bp诱变寡核苷酸CF127和CF128
SnaBI识别序列标有下划线。
CF1275′-CGTAATACTTCTAGGGTATGA TACGTATCCAATATCAAAGGAAATGATAGC-3′
CF1285′-GCTATCATTTCCTTTGATATTGGA TACGTATCATACCCTAGAAGTATTACG-3′
依照Statagene的QuickChangeTM定点诱变试剂盒的操作说明书进行寡核苷酸指导的诱变。通过质粒DNA的SnaBI和HindIII限制性消化来鉴定含有pDB2920的氨苄青霉素抗性大肠杆菌转化子。通过使用寡核苷酸引物CF98、CF99、CF129、CF130、CF131及M13正向和反向引物(表1)进行的DNA测序验证了pDB2920中插入的SnaBI限制性位点的6bp序列和整个1091bp NcoI-BamHI片段的正确DNA序列。
通过琼脂糖凝胶电泳分离来自pDB2920的1091bp NcoI-BamHI片段,纯化,并与来自pDB2783的约4.7kb NcoI-BamHI片段连接,生成pDB2936(图41)。pDB27834.7kb NcoI-BamHI片段是通过首先经NcoI部分消化而线性化的pDB2783DNA的完全BamHI消化而分离的,并通过琼脂糖凝胶电泳纯化。用连接产物将大肠杆菌DH5α细胞转化成阿泊拉霉素抗性。通过由阿泊拉霉素抗性克隆分离的质粒DNA的SnaBI消化鉴定了pDB2936。
然后将来自pDB2936的3082bp XbaI片段与通过部分XbaI消化和小牛小肠碱性磷酸酶处理生成的7961bp pSAC35片段连接,生成非整合载体pDB2938(2μm B型,图37)。
将pDB2938用SnaBI和小牛小肠碱性磷酸酶消化,并与来自pDB2939(图42)的约2kb SnaBI片段连接。pDB2939是如下生成的,使用寡核苷酸引物DS248和DS250(图43)由啤酒糖酵母S288c基因组DNA PCR扩增PDI1基因,然后用EcoRI和BamHI消化PCR产物,并将约1.98kb片段克隆到经EcoRI和BamHI切割的YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中。pDB2939的DNA测序鉴定出来自DS248序列内的一个“G”缺失,在图43中以粗体标记。然后将来自pDB2939的约2kb SnaBI片段克隆到pDB2938的唯一SnaBI位点中,生成质粒pDB2950(图44)。pDB2950中的PDI1基因以与REP2基因相同的方向转录。
然后用SmaI消化pDB2950,并将约11.1kb DNA片段环化以删除S288cPDI1序列。这生成了紧挨着REP2的TGA翻译终止密码子后面具有SnaBI-PacI-FseI/SfiI-SmaI-SnaBI接头的质粒pDB2954(图38)。
除了将啤酒糖酵母S288c PDI1基因克隆到pDB2938的唯一SnaBI位点中,类似的将啤酒糖酵母SKQ2n PDI1基因插入该位点。由含有来自pMA3a:C7(US 6,291,205)也称为克隆C7(Crouzet和Tuite,1987,见上文;Farquhar等人,1991,见上文)的PDI1基因的质粒DNA PCR扩增啤酒糖酵母SKQ2n PDI1基因序列。使用寡核苷酸引物DS248和DS250(图43)扩增SKQ2n PDI1基因。将约2kb PCR产物用EcoRI和BamHI消化,并连接到经EcoRI和BamHI切割的YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中,生成质粒pDB2943(图45)。SKQ2n PDI1序列的5’端与补平的SpeI位点相似,延伸以包含EcoRI、SacI、SnaBI、PacI、FseI、SfiI和SmaI位点,3’端延伸至与补平的Bsu36I位点相似的位点,延伸以包含SmaI、SnaBI和BamHI位点。PDI1启动子长度是约210bp。测定了PDI1片段的整个DNA序列,并证明它编码啤酒糖酵母菌株SKQ2n的PDI蛋白质序列(NCBI编号CAA38402),但是在位置114具有丝氨酸残基(而非精氨酸残基)。与pDB2939中的啤酒糖酵母S288c序列相似,pDB2943也在来自DS248序列内具有一个“G”缺失,在图43中以粗体标记。然后将来自pDB2943的约1989bp SnaBI片段克隆到pDB2938中唯一SnaBI位点中。这生成了质粒pDB2952(图46),其中SKQ2n PDI1基因以与REP2相同的方向转录。
实施例7
用紧挨着REP2基因后面含有插入的DNA的pSAC35样质粒转化的酵母中LEU2标记的相时稳定性
对pDB2954评估在pSAC35中REP2基因后面引入的SnaBI位点处插入接头序列对质粒稳定性的影响。这是在与较早实施例中所用相同的啤酒糖酵母菌株中通过在YEPS上进行的非选择性培养过程中LEU2标记的遗失而测定的。通过实施例1中描述的方法将pDB2954的稳定性与pSAC35(对照质粒)、pDB2688(XcmI接头)和pDB2817(XmnI接头)的稳定性进行比较。
使用改良的醋酸锂法(Sigma酵母转化试剂盒,YEAST-1,方案2;Ito等人,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),将酵母菌株转化成亮氨酸原养型。在BMMD琼脂板上选择转化子,然后点接到BMMD琼脂板上。通过与等体积的无菌40%(w/v)海藻糖混合并以小份冻存于-80℃(即零下80℃),由10ml BMMD摇瓶培养物(24小时,30℃,200rpm)制备冷冻海藻糖原种。
为了测定质粒稳定性,将1ml冷冻原种解冻,接种250ml锥形瓶中的100ml YEPS(初始OD600≈0.04-0.09),并在定轨摇床(200rpm,Innova 4300摇床,New Brunswick Scientific)中于30℃培养约72小时(70-74小时)。每种菌株分析双份。
由每个烧瓶中取出样品,在YEPS培养基中稀释(10-2至10-5稀释度),并以双份将100μl小样涂布到YEPS琼脂板上。将细胞于30℃培养3-4天以容许单菌落形成。对于分析的每种酵母原种,以复制方式将100个随机菌落点接到BMMS琼脂板上,然后是YEPS琼脂板。于30℃培养3-4天后,测定在BMMS琼脂板和YEPS琼脂板上都生长的菌落的百分比作为质粒稳定性的度量。
下文表5A给出了上述分析的结果。这些结果指示,pDB2954本质上与pSAC35对照和pDB2688一样稳定。在这种类型的分析中,偶尔能够检出低水平的不稳定性,甚至是pSAC35对照(见表4)。由此,紧挨着REP2翻译终止密码子后面人为引入反向重复序列的SnaBI位点表现出与反向重复片段中的XcmI位点等价用于插入合成接头序列。然而,XcmI位点表现出比SnaBI位点优选用于插入含PDI1基因的约2kb DNA片段。
表5A:含有各种DNA插入的基于pSAC35的载体的相对稳定性
  质粒   US区中的插入位点   US区中插入的基因   在UL区中SnaBI/NotI位点处插入的基因   相对稳定性(%)
  pSAC35   -   -   LEU2   100
  pDB2688   XcmI   -   LEU2   99.5
  pDB2954   SnaBI   -   LEU2   99
  pDB2817   XmnI   -   LEU2   27
  pDB2690   XcmI   PDI1(SKQ2n)   LEU2   39.5
  pDB2952   SnaBI   PDI1(SKQ2n)   LEU2   0
  pDB2950   SnaBI   PDI1(SKQ2n)   LEU2   0
此项试验关于质粒pDB2952和pDB2950的“零百分比稳定性”结果是在指示相对质粒稳定性的非选择性培养基中得到的。此项试验经过优化用于比较不同接头插入片段的相对稳定性。在选择性培养基中,在SnaBI位点处具有PDI1的质粒(甚至在NotI位点处包含额外运铁蛋白基因时,已知它使质粒(诸如下文描述的pDB2959和pDB2960)进一步不稳定)在含有抗运铁蛋白抗体的非选择性YEPD琼脂和选择性BMMD琼脂板上都生成所分泌运铁蛋白的“沉淀素晕圈(precipitin halos)”。对于在SnaBI位点没有插入PDI1基因的pDB2961,没有观察到所分泌运铁蛋白的沉淀素晕圈。这些结果证明SnaBI位点可用于插入能够提高异源蛋白分泌的大型基因诸如PDI1。这些结果都是在对照菌株中产生的。对于含有pDB2959和pDB2960的菌株A也看到了提高,但是在这种情况中对pDB2961也观察到低水平的分泌(由于菌株A基因组中的额外PDI1基因)。下文表5B总结了来自对照菌株的结果。所用抗体板每25ml BMMD琼脂或YEPD琼脂含有100μl山羊多克隆抗运铁蛋白抗血清(Calbiochem)。将菌株点接到抗体板上,并于30℃培养48-72小时,然后在分泌高水平重组运铁蛋白的菌落周围的琼脂内观察到沉淀素“晕圈”。在这种试验中没有观察到低水平的运铁蛋白分泌。
通过将在pDB2711(图11)中找到的rTf(N413Q、N611Q)的相同3.27kbNotI盒以与pDB2711相同的取向插入唯一NotI位点,分别由pDB2950(图44)、pDB2952(图46)和pDB2954(图38)构建质粒pDB2959、pDB2960和pDB2961。
表5B:来自经在紧挨着REP2后面的位点处含有各种PDI1基因插入的基于pSAC35的载体转化的对照菌株的提高的运铁蛋白分泌
  质粒   US区中的插入位点   US区中插入的基因   在UL区中SnaBI/NotI位点处插入的基因   在抗运铁蛋白Ab板上检测的运铁蛋白分泌
  BMMD-抗Tf   YEPD-抗Tf
  pDB2960   SnaBI   PDI1(SKQ2n)   LEU2+rTf   是   是
  pDB2959   SnaBI   PDI1(S288c)   LEU2+rTf   是   是
  pDB2961   SnaBI -   LEU2+rTf   否   否
实施例8
在非选择性条件下培养30代后测定的经pSAC35样质粒转化的酵母中LEU2
标记的稳定性
使用与Chinery和Hinchcliffe,1989,Curr.Genet.,16,21-25所定义的类似的方法测定US区中插入了DNA的pSAC35样质粒稳定性。这是在与较早实施例中所用相同的啤酒糖酵母菌株中通过在非选择性YEPS培养基上限定代数后对数生长过程中LEU2标记的遗失而测定的。30代适于显示对照质粒pSAC35之间的差异,或是显示与对照质粒的可比稳定性。选择用于通过这种试验分析的质粒是:pSAC35(对照)、pDB2688(XcmI接头)、pDB2812(HgaI接头)、pDB2817(XmmI接头)、pDB2960(PDI1基因插入REP2后面的XcmI位点)和pDB2711(PDI1基因插入REP2后面的XcmI位点且运铁蛋白表达盒插入UL区中的NotI位点)。
将菌株在选择性(BMMS)培养基中于30℃培养至对数期,并用于接种250ml锥形瓶中预先温热至30℃的100ml非选择性(YEPS)培养基,以得到1.25×105至5×105个细胞/ml。使用血球计对培养物样品中的细胞数目计数,从而精确测定每个烧瓶中接种的细胞数目。将小样涂布到非选择性(YEPS)琼脂上,并于30℃培养3-4天,然后对于分析的每种原种,以复制方式将100个随机菌落点接到选择性(BMMS)和非选择性(YEPS)琼脂上以评估保留质粒的细胞的比例。于30℃培养3-4天后,测定在BMMS琼脂和YEPS琼脂上都生长的菌落百分率作为质粒稳定性的度量。
将非选择性液体培养物于30℃以200rpm摇动培养24小时以达到1×107个细胞/ml,通过血球计计数测定。然后将培养物再接种预先温热的新鲜非选择性培养基以得到1.25×105至5×105个细胞/ml。再次将小样涂布到非选择性琼脂上,然后以复制方式点接到选择性琼脂和非选择性琼脂上以评估质粒的保持。由此,有可能计算细胞在非选择性液体培养基中传代的次数。将指数对数生长在液体培养中维持30代,这足以显示与对照质粒诸如pSAC35的可比稳定性。质粒稳定性定义为保留LEU2选择标记的细胞百分率。
表6和图47显示了用于测量质粒编码表型经过非选择性培养基中培养后的保持情况的上述分析的结果。
表6:选定pSAC35样质粒在非选择性培养基中培养30代的啤酒糖酵母菌株中的相对稳定性
  质粒   US区中的接头插入位点   US区中插入的基因   在UL区中SnaBI/NotI位点处插入的基因   30代后的稳定性百分率
  pSAC35   -   -   LEU2   100
  pDB2688   REP2后面的XcmI   -   LEU2   100
  pDB2812   FLP后面的HgaI   -   LEU2   100
  pDB2817   REP2中的XmnI   -   LEU2   1
  pDB2690   REP2后面的XcmI   PDI1(SKQ2n)   LEU2   33
  pDB2711   REP2后面的XcmI   PDI1(SKQ2n)   LEU2+rTy   2
图47显示了所分析每种菌株在非选择性液体培养基中随着代数增加的LEU2标记的遗失。
对照质粒pSAC35在此项试验的整个30代后保持100%稳定。质粒pBD2688和pDB2812都表现出与pSAC35一样稳定。因此,分别将接头插入REP2后面的XcmI位点或FLP后面的HgaI位点对质粒稳定性没有明显影响。相反,将XmnI接头插入REP2基因内表现出降低质粒稳定性。
在REP2后面的XcmI接头中含有啤酒糖酵母PDI1基因的质粒pDB2690在培养30代后约33%稳定,指示将此DNA大片段插入基于2μm的载体的US区引起质粒稳定性降低。然而,稳定性的这种降低小于对pDB2711观察到的,其中将重组运铁蛋白(N413Q、N611Q)表达盒插入pSAC35的大独特区内的NotI位点产生进一步使质粒不稳定的作用。这些观察结果与实施例2的结果(见表2)一致。
通过上述方法在啤酒糖酵母候选菌株中评估了质粒pDB2711的稳定性,并得到了相似结果(数据未显示)。这指示质粒的稳定性不依赖菌株。
实施例9
PDI1基因破坏,连同基于2μm的质粒上的PDI1基因,提高质粒稳定性
表7中所列单链寡核苷酸DNA引物设计用于扩增酵母PDI1编码区上游的一个区域和酵母PDI1编码区下游的另一个区域。
表7:寡核苷酸引物
  引物   描述   序列
  DS299   5′PDI1引物,38聚物   5′-CGTA GCGGCCGCCTGAAAG
  GGGTTGACCGTCCGTCGGC-3′
  DS300   5′PDI1引物,40聚物   5′-CGTA AAGCTTCGCCGCCCG
  ACAGGGTAACATATTATCAC-3′
  DS301   3′PDI1引物,38聚物   5′-CGTA AAGCTTGACCACGTA
  GTAATAATAAGTGCATGGC-3′
  DS302   3′PDI1引物,41聚物   5′-CGTA CTGCAGATTGGATAGTG
  ATTAGAGTGTATAGTCCCGG-3′
  DS303   18聚物   5′-GGAGCGACAAACCTTTCG-3′
  DS304   20聚物   5′-ACCGTAATAAAAGATGGCTG-3′
  DS305   24聚物   5′-CATCTTGTGTGTGAGTATGGTCGG-3′
  DS306   14聚物   5′-CCCAGGATAATTTTCAGG-3′
使用衍生自S288c的基因组DNA作为模板,引物DS299和DS300通过PCR扩增PDI1的5’区,而引物DS301和DS302扩增PDI1的3’区。PCR条件如下:1μl S288c模板DNA(0.01ng/μl、0.1ng/μl、1ng/μl、10ng/μl和100ng/μl)、5μl 10X缓冲液(Fast Start Taq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每种引物(2μM)、0.4μl Fast Start Taq,用H2O补至50μl。使用Perkin-Elmer热循环仪9700进行PCR。条件是:于95℃变性4分钟[保持HOLD],然后[循环CYCLE]于95℃变性30秒、于45℃退火30秒、于72℃延伸45秒,20个循环,然后[保持HOLD]于72℃10分钟,再然后[保持HOLD]4℃。用NotI和HindIII切割0.22kb PDI1 5′PCR产物,而用HindIII和PstI切割0.34kb PDI1 3′PCR产物。
将质粒pMCS5(Hoheisel,1994,Biotechniques,17,456-460)(图48)用HindIII完全消化,用T4DNA聚合酶加dNTP混合物补平末端,并重新连接,生成pDB2964(图49)。
将质粒pDB2964用HindIII消化,用小牛小肠磷酸酶处理,并与经NotI和HindIII消化的0.22kbp PDI1 5′PCR产物和经HindIII和PstI消化的0.34kbPDI1 3′PCR产物连接,生成pDB3069(图50),并用正向和反向通用引物以及DNA测序引物DS303、DS304、DS305和DS306(表7)进行测序。
引物DS234和DS235(表8)用于由YIplac204(Gietz和Sugino,1988,Gene,74,527-534)扩增经修饰的TRP1标记基因,在PCR产物的两个末端掺入HindIII限制性位点。PCR条件如下:1μl模板YIplac204(0.01ng/μl、0.1ng/μl、1ng/μl、10ng/μl和100ng/μl)、5μl 10X缓冲液(Fast Start Taq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每种引物(2μM)、0.4μl Fast Start Taq,用H2O补至50μl。使用Perkin-Elmer热循环仪9600进行PCR。条件是:于95℃变性4分钟[保持HOLD],然后[循环CYCLE]于95℃变性30秒、于45℃退火45秒、于72℃延伸90秒,20个循环,然后[保持HOLD]于72℃10分钟,再然后[保持HOLD]4℃。将0.86kb PCR产物用HindIII消化,并克隆到pMCS5的HindIII位点中,生成pDB2778(图51)。限制酶分析和使用通用正向和反向引物以及DS236、DS237、DS238和DS239(表8)进行的测序证实了经修饰TRP1基因的序列是正确的。
表8:寡核苷酸引物
  引物   描述   序列
  DS230   TRP1 5′UTR   5′-TAGCGAATTCAATCAGTAAAAATCAACGG-3′
  DS231   TRP1 5′UTR   5′-GTCAAAGCTTCAAAA
  AAAGAAAAGCTCCGG-3′
  DS232   TRP1 3′UTR   5′-TAGCGGATCCGAATTCGGCGGTTGTTTGCAAGACCGAG-3′
  DS233   TRP1 3′UTR   5′-GTCAAAGCTTTAAAGATAATGCTAAATCATTTGG-3′
  DS234   TRP1   5′-TGACAAGCTTTCGGTCGAAAAAAGAAAAGGAGAGG-3′
  DS235   TRP1   5′-TGACAAGCTTGATCTTTTATGCTTGCTTTTC-3′
  DS236   TRP1   5′-AATAGTTCAGGCACTCCG-3′
  DS237   TRP1   5-TGGAAGGCAAGAGAGCC-3′
  DS238   TRP1   5′-TAAAATGTAAGCTCTCGG-3′
  DS239   TRP1   5′-CCAACCAAGTATTTCGG-3′
  CED005   ΔTRP1   5′-GAGCTGACAGGGAAATGGTC-3′
  CED006   ΔTRP1   5′-TACGAGGATACGGAGAGAGG-3′
通过HindIII消化由pDB2778分离0.86kb TRP1基因,并克隆到pDB3069的HindIII位点中,生成pDB3078(图52)和pDB3079(图53)。通过NotI/PstI消化由pDB3078或pDB3079分离1.41kb pdi1::TRP1破坏的DNA片段。
以这样一种方式构建掺入TRP1删除(trp1Δ)的酵母菌株,即一旦构建trp1Δ,基因组中不应当剩下与TRP1标记基因(pDB2778)的同源性,从而防止未来含TRP1构建物和TRP1基因座之间的同源重组。为了实现由选定宿主菌株的基因组完全清除天然TRP1序列,设计寡核苷酸,用于扩增整合载体YIplac204(Gietz和Sugino,1988,Gene,74,527-534)上存在的TRP1标记基因外侧的TRP1基因5′UTR和3′UTR区域。YIplac204 TRP1标记基因与天然/染色体TRP1基因有所不同,即通过定点诱变清除了内部HindIII、PstI和XbaI位点(Gietz和Sugino,1988,Gene,74,527-534)。YIplac204经修饰TRP1标记基因是由1.453kb补平基因组片段EcoRI片段构建的,它含有TRP1基因且只有TRP1启动子的102bp(Gietz和Sugino,1988,Gene,74,527-534)。尽管这是较短的启动子序列,然而显然它足以补足trp1营养缺陷型突变(Gietz和Sugino,1988,Gene,74,527-534)。只由位于TRP1ORF起点5’102bp处的EcoRI位点上游的DNA序列用于创建5′TRP1 UTR。3′UTR的选择较不苛刻,只要它在功能性经修饰TRP1标记3’端的外侧,选择的是翻译终止密码子下游85bp。
设计并构建单链寡核苷酸DNA引物,以扩增TRP1基因的5′UTR和3′UTR区,使得在PCR扩增过程中,限制酶位点将添加到后期克隆步骤中将要用到的PCR产物的末端。使用S288c基因组DNA作为模板,引物DS230和DS231(表8)通过PCR扩增TRP1的5′区域,而引物DS232和DS233(表8)扩增TRP1的3′区域。PCR条件如下:1μl模板S288c基因组DNA(0.01ng/μl、0.1ng/μl、1ng/μl、10ng/μl和100ng/μl)、5μl 10X缓冲液(Fast StartTaq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每种引物(2μM)、0.4μl FastStart Taq,用H2O补至50μl。使用Perkin-Elmer热循环仪9600进行PCR。条件是:于95℃变性4分钟[保持HOLD],然后[循环CYCLE]于95℃变性30秒、于45℃退火45秒、于72℃延伸90秒,20个循环,然后[保持HOLD]于72℃10分钟,再然后[保持HOLD]4℃。
将0.19kb TRP1 5′UTR PCR产物用EcoRI和HindIII切割,而将0.2kbTRP13′UTR PCR产物用BamHI和HindIII切割,并连接到用BamHI/EcoRI线性化的pAYE505中,生成质粒pDB2777(图54)。WO 95/33833中描述了pAYE505的构建。使用设计成由质粒主链引发并对所克隆插入片段测序的正向和反向引物进行的DNA测序证实了在这两种情况中所克隆的TPP1基因5′和3′UTR序列具有预期DNA序列。质粒pDB2777含有TRP1破坏的片段,它包含衍生自TRP1 5′和3′UTR的序列的融合体。通过EcoRI完全消化由pDB2777切下此0.383kb TRP1破坏片段。
使用改良的醋酸锂法(Sigma酵母转化试剂盒,YEAST-1,方案2;Ito等人,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),将酵母菌株DXY1(Kerry-Williams等人,1998,Yeast,14,161-169)用清蛋白表达质粒pDB2244转化成亮氨酸原养型,生成酵母菌株DXY1[pDB2244]。WO 00/44772中描述了清蛋白表达质粒pDB2244的构建。在BMMD琼脂板上选择转化子,然后点接到BMMD琼脂板上。由10mlBMMD摇瓶培养物(24小时,30℃,200rpm)制备冷冻海藻糖原种。
如Toyn等人,2000,Yeast,16,553-560所述,使用掺入了对立选择性色氨酸类似物5-氟氨茴酸(5-FAA)的营养琼脂,将DXY1[pDB2244]用来自pDB2777的0.383kb EcoRI TRP1破坏DNA片段转化成色氨酸自养型。挑取对5-FAA的毒性作用有抗性的菌落,并在第二轮5-FAA板上划线,以确认它们确实耐受5-FAA并由任何背景生长中选择出来。然后将生长的那些菌落再次点接到BMMD和BMMD加色氨酸上,以鉴定哪些是色氨酸营养缺陷型。
然后选择证明是色氨酸营养缺陷型的菌落,用于通过YCplac22(Gietz和Sugino,1988,Gene,74,527-534)转化进行进一步分析,以查明哪些分离物是trp1。
使用横跨TRP1基因座的PCR扩增来确认trp-表型是由于该区域中的缺失。由鉴定为耐受5-FAA且不能在未添加色氨酸的极限培养基上生长的分离物制备基因组DNA。如下完成用引物CED005和CED006(表8)对基因组TRP1基因座的PCR扩增:1μl模板基因组DNA、5μl 10X缓冲液(Fast StartTaq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每种引物(2μM)、0.4μl FastStart Taq,用H2O补至50μl。使用Perkin-Elmer热循环仪9600进行PCR。条件是:于94℃变性10分钟[保持HOLD],然后[循环CYCLE]于94℃变性30秒、于55℃退火30秒、于72℃延伸120秒,40个循环,然后[保持HOLD]于72℃10分钟,再然后[保持HOLD]4℃。对野生型TRP1基因座的PCR扩增导致大小为1.34kb的PCR产物,而跨越已删除TRP1区的扩增导致小0.84kb即位于0.50kb处的PCR产物。PCR分析鉴定得出DXY1衍生的trp-菌株(DXY1 trp1Δ[pDB2244])具有预期的删除事件。
如Sleep等人,1991,Bio/Technology,9,183-187所述,消除酵母菌株DXY1 trp1Δ[pDB2244]的表达质粒pDB2244。使用改良的醋酸锂法(Sigma酵母转化试剂盒,YEAST-1,方案2;Ito等人,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),将DXY1 trp1Δcir0用pDB2244、pDB2976、pDB2977、pDB2978、pDB2979、pDB2980或pDB2981再次转化成亮氨酸原养型pDB2244、pDB2976、pDB2977、pDB2978、pDB2979、pDB2980或pDB2981在实施例10中进一步讨论。在补充了色氨酸的BMMD琼脂板上选择转化子,然后点接到补充了色氨酸的BMMD琼脂板上。由10ml补充了色氨酸的BMMD摇瓶培养物(24小时,30℃,200rpm)制备冷冻海藻糖原种。
使用改良的醋酸锂法(Sigma酵母转化试剂盒,YEAST-1,方案2;Ito等人,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),用通过NotI/PstI消化由pDB3078分离的1.41kb pdi1::TRP1破坏DNA片段,将酵母菌株DXY1 trp1Δ[pDB2976]、DXY1 trp1Δ[pDB2977]、DXY1 trp1Δ[pDB3078]、DXY1 trp1Δ[pDB3079]、DXY1 trp1Δ[pDB2980]或DXY1 trp1Δ[pDB2981]转化成色氨酸原养型。在BMMD琼脂板上选择转化子,然后点接到BMMD琼脂板上。
将每种菌株的6个转化子接种50ml摇瓶中的10ml YEPD,并在定轨摇床中于30℃以200rpm培养4天。收获培养物上清液和细胞生物量。由色氨酸原养型和DXY1[pDB2244]制备基因组DNA(Lee,1992,Biotechniques,12,677)。如下完成用引物DS236和DS303(表7和8)对基因组PDI1基因座的PCR扩增:1μl模板基因组DNA、5μl 10X缓冲液(Fast Start Taq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每种引物(2μM)、0.4μl Fast Start Taq,用H2O补至50μl。使用Perkin-Elmer热循环仪9700进行PCR。条件是:于94℃变性4分钟[保持HOLD],然后[循环CYCLE]于94℃变性30秒、于50℃退火30秒、于72℃延伸60秒,30个循环,然后[HOLD]于72℃10分钟,再然后[HOLD]4℃。对野生型PDI1基因座的PCR扩增导致没有PCR产物,而跨越已删除PDI1区的扩增导致PCR产物0.65kbp。PCR分析鉴定得出测试的所有36个潜在pdi1::TRP1菌株都具有预期的pdi1::TRP1删除。
通过火箭免疫电泳比较了重组清蛋白滴度(图55)。在每个组内,DXY1trp1Δ[pDB2976]、DXY1 trp1Δ[pDB2978]、DXY1 trp1Δ[pDB2980]、DXY1trp1Δ[pDB2977]和DXY1 trp1Δ[pDB2979]的所有6个pdi1::TRP1破坏子(disruptant)都具有非常相似的rHA生产力。只有DXY1 trp1Δ[pDB2981]的6个pdi1::TRP1破坏子显示rHA表达滴度的变化。将图55中所示6个pdi1::TRP1破坏子涂布到YEPD琼脂上以分离单菌落,并再次点接到BMMD琼脂上。
将DXY1 trp1Δpdi1::TRP1[pDB2976]、DXY1 trp1Δpdi1::TRP1[pDB2978]、DXY1 trp1Δ pdi1::TRP1[pDB2980]、DXY1 trp1Δpdi1::TRP1[pDB2977]、DXY1 trp1Δ pdi1::TRP1[pDB2979]和DXY1 trp1Δ pdi1::TRP1[pDB2981]以及DXY1[pDB2244]、DXY1[pDB2976]、DXY1[pDB2978]、DXY1[pDB2980]、DXY1[pDB2977]、DXY1[pDB2979]和DXY1[pDB2981]的3个单细胞分离物接种50ml摇瓶中的10ml YEPD,并在定轨摇床中于30℃以200rpm培养4天。收获培养物上清液,并通过火箭免疫电泳比较重组清蛋白滴度(图56)。将图56中所示13个野生型PDI1和pdi1::TRP1破坏子涂布到YEPD琼脂上以分离单菌落。然后将来自每种菌株的100个单细胞化菌落再次点接到含有山羊抗HSA抗体的BMMD琼脂或YEPD琼脂上以检测重组清蛋白的表达(Sleep等人,1991,Bio/Technology,9,183-187),并对每个菌落的Leu+/rHA+、Leu+/rHA-、Leu-/rHA+或Leu-/rHA-表型评分(表9)。
表9:
                    PDI1                pdi1::TRP1
  Leu+rHA+   Leu-rHA+   Leu+rHA-   Leu-rHA-   Leu+rHA+   Leu-rHA+   Leu+rHA-   Leu-rHA-
  pDB2244   100   0   0   0
  pDB2976   7   0   47   46   97   0   3   0
  pDB2978   86   0   0   14   100   0   0   0
  pDB2980   98   0   0   2   100   0   0   0
  pDB2977   0   0   4   96   100   0   0   0
  pDB2979   69   0   6   25   100   0   0   0
  pDB2981   85   0   0   15   92   0   0   8
这些数据指示,当PDI1基因在没有染色体编码PDI的宿主菌株中用作质粒上的选择标记时,甚至在非选择性培养基诸如此丰富培养基中,质粒保持得到提高。这些证明了在遭到删除或灭活时不会导致营养缺陷(生物合成)需求的“必需”蛋白伴侣(如PDI1或PSE1)或是任何其它的任何“必需”基因产物(如PGK1或FBA1)可以在如下宿主细胞中用作质粒上的选择标记,即该宿主细胞在缺乏该质粒时不能生成该基因产物,从而实现质粒稳定性提高且没有要求在特定选择性条件下培养细胞的缺点。“营养缺陷(生物合成)需求”包括可以通过添加或修改生长培养基而补足的缺陷。因此,“必需标记基因”在本发明的内容中指在宿主细胞中遭到删除或灭活时导致不能通过添加或修改生长培养基而补足的缺陷的基因。
实施例10
在相同2μm样质粒上含有各种PDI1基因和各种异源蛋白表达盒的表达载体的构建
PDI1基因的PCR扩增和克隆进入YIplac211:
通过PCR扩增来自啤酒糖酵母S288c和啤酒糖酵母SKQ2n的PDI1基因,以生成具有含启动子序列的不同长度5’-非翻译区的DNA片段。PCR引物设计成容许将PCR产物克隆到YIplac211(Gietz和Sugino,1988,Gene,74,527-534)的EcoRI和BamHI位点中。PCR引物中还掺入了额外限制性内切核酸酶位点以便于后续克隆。表10描述了所构建的质粒,而表11给出了用于扩增PDI1基因的PCR引物序列。表10描述了这些基于YIplac211的质粒内PDI1启动子长度的差异。
pDB2939(图57)是如下生成的:用寡核苷酸引物DS248和DS250(表11)由啤酒糖酵母S288c基因组DNA PCR扩增PDI1基因,然后用EcoRI和BamHI消化PCR产物,并将约1.98kb片段克隆到经EcoRI和BamHI切割的YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中。pDB2939的DNA测序鉴定出来自DS248内的“G”缺失,在表5中以粗体标记。表6列出了用于对PDI1基因测序的寡核苷酸引物,它们是根据已发表的S288cPDI1基因序列设计的(染色体III上的PDI1/YCL043C,由坐标50221至48653,加1000碱基对的上游序列和1000碱基对的下游序列。http://www.yeastgenome.org,基因库编号NC001135)。
表10:含有PDI1基因的基于YIplac211的质粒
  质粒   质粒基础   PDI1基因   PCR引物
  来源   启动子   终止子
  pDB2939   YIplac211   S288c   长(~210bp)   →Bsu36I   DS248+DS250
  pDB2941   YIplac211   S288c   中(~140bp)   →Bsu36I   DS251+DS250
  pDB2942   YIplac211   S288c   短(~80bp)   →Bsu36I   DS252+DS250
  pDB2943   YIplac211   SKQ2n   长(~210bp)   →Bsu36I   DS248+DS250
  pDB2963   YIplac211   SKQ2n   中(~140bp)   →Bsu36I   DS267+DS250
  pDB2945   YIplac211   SKQ2n   短(~80bp)   →Bsu36I   DS252+DS250
表11:用于啤酒糖酵母PDI1基因的PCR扩增的寡核苷酸引物
  引物   序列
  DS248   5′-GTCAGAATTCGAGCTCTACGTATTAATTAAGGCCGGCCAGGCCCGGGCTAGTCTCTTTTTCCAATTTGCCACCGTGTAGCATTTTGTTGT-3′
  DS249   5′-GTCAGGATCCTACGTACCCGGGGATATCATTATCATCTTTGTCGTGGTCATCTTGTGTG-3′
  DS250   5′-GTCAGGATCCTACGTACCCGGGTAAGGCGTTCGTGCAGTGTGACGAATATAGCG-3′
  DS251   5′-GTCAGAATTCGAGCTCTACGTATTAATTAAGGCCGGCCAGGCCCGGGCCCGTATGGACATACATATATATATATATATATATATATATTTTGTTACGCG-3′
  DS252   5′-GTCAGAATTCGAGCTCTACGTATTAATTAAGGCCGGCCAGGCCCGGGCTTGTTGCAAGCAGCATGTCTAATTGGTAATTTTAAAGCTGCC-3′
  DS267   5′-GTCAGAATTCGAGCTCTACGTATTAATTAAGGCCGGCCAGGCCCGGGCCCGTTGGACATACATATATATATATATATATATATATATATATTTTGTTACGCG-3′
表12:用于啤酒糖酵母PDI1基因的DNA测序的寡核苷酸引物
  引物   序列
  DS253   5′-CCTCCCTGCTGCTCGCC-3′
  DS254   5′-CTGTAAGAACATGGCTCC-3′
  DS255   5′-CTCGATCGATTACGAGGG-3′
  DS256   5′-AAGAAAGCCGATATCGC-3′
  DS257   5′-CAACTCTCTGAAGAGGCG-3′
  DS258   5′-CAACGCCACATCCGACG-3′
  DS259   5′-GTAATTCTGATCACTTTGG-3′
  DS260   5′-GCACTTATTATTACTACGTGG-3′
  DS261   5′-GTTTTCCTTGATGAAGTCG-3′
  DS262   5′-GTGACCACACCATGGGGC-3′
  DS263   5′-GTTGCCGGCGTGTCTGCC-3′
  DS264   5′-TTGAAATCATCGTCTGCG-3′
  DS265   5′-CGGCAGTTCTAGGTCCC-3′
  DS266   5′-CCACAGCCTCTTGTTGGG-3′
  M13/pUC引物(-40)   5′-GTTTTCCCAGTCACGAC-3′
质粒pDB2941(图58)和pDB2942(图59)是使用表10和11中描述的PCR引物并通过分别将约1.90kb和1.85kb EcoRI-BamHI片段克隆到YIplac211中而类似构建的。验证了pDB2941和pDB2942中PDI1基因的正确DNA序列。
由含有来自pMA3a:C7(US 6,291,205)也称为克隆C7(Crouzet和Tuite,1987,见上文;Farquhar等人,1991,见上文)的PDI1基因的质粒DNAPCR扩增啤酒糖酵母SKQ2n PDI1基因序列。使用寡核苷酸引物DS248和DS250(表10和11)扩增SKQ2n PDI1基因。用EcoRI和BamHI消化约2.01kb PCR产物,并连接到经EcoRI和BamHI切割的YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中以生成质粒pDB2943(图60)。SKQ2n PDI1序列的5’端与补平的SpeI位点相似,延伸以包含EcoRI、SacI、SnaBI、PacI、FseI、SfiI和SmaI位点,3’端延伸至与补平的Bsu36I位点相似的位点,延伸以包含SmaI、SnaBI和BamHI位点。PDI1启动子长度是约210bp。使用表12给出的寡核苷酸引物测定了PDI1片段的整个DNA序列。这证实了啤酒糖酵母菌株SKQ2n的PDI蛋白质的编码序列(NCBI编号CAA38402)的存在,但是在位置114具有丝氨酸残基(而非先前发表的精氨酸残基)。类似的,与pDB2939中的啤酒糖酵母S288c序列的方式相似,pDB2943也在来自DS248序列内具有“G”缺失,在表5中以粗体标记。
质粒pDB2963(图61)和pDB2945(图62)是使用表10和11中描述的PCR引物并通过分别将约1.94kb和1.87kb EcoRI-BamHI片段克隆到YIplac211中而类似构建的。验证了pDB2963和pDB2945中PDI1基因的预期DNA序列,其中氨基酸114位置处具有丝氨酸密码子。
在REP2后面的XcmI位点处具有插入的不同PDI1基因的基于pSAC35的rHA表达质粒的构建
为了与不同PDI1基因共表达rHA,构建基于pSAC35的质粒(表13)。
表13:用于共表达rHA的具有不同PDI1基因的基于pSAC35的质粒
  质粒   质粒基础         REP2后面XcmI位点处的PDI1基因   异源蛋白表达盒(位于NotI位点处)
  来源   启动子   终止子   取向
  pDB2982   pSAC35   SKQ2n   长   →Bsu36I   A   rHA
  pDB2983   pSAC35   SKQ2n   长   →Bsu36I   B   rHA
  pDB2984   pSAC35   SKQ2n   中   →Bsu36I   A   rHA
  pDB2985   pSAC35   SKQ2n   中   →Bsu36I   B   rHA
  pDB2986   pSAC35   SKQ2n   短   →Bsu36I   A   rHA
  pDB2987   pSAC35   SKQ2n   短   →Bsu36I   B   rHA
  pDB2976   pSAC35   S288c   长   →Bsu36I   A   rHA
  pDB2977   pSAC35   S288c   长   →Bsu36I   B   rHA
  pDB2978   pSAC35   S288c   中   →Bsu36I   A   rHA
  pDB2979   pSAC35   S288c   中   →Bsu36I   B   rHA
  pDB2980   pSAC35   S288c   短   →Bsu36I   A   rHA
  pDB2981   pSAC35   S288c   短   →Bsu36I   B   rHA
首先在2992bp NotI片段上分离来自pDB2243(图63,如WO 00/44772中所述)的rHA表达盒,然后克隆到pDB2688(图4)的NotI位点中,生成pDB2693(图64)。将pDB2693用SnaBI消化,用小牛小肠碱性磷酸酶处理,并与来自pDB2943、pDB2963、pDB2945、pDB2939、pDB2941和pDB2942的含有PDI1基因的SnaBI片段连接。这生成了质粒pDB2976至pDB2987(图65至76)。将PDI1的转录方向与REP2相同的称为“取向A”,而将PDI1的转录方向与REP2相反的称为“取向B”(表13)。

Claims (63)

1.在REP2基因或FLP基因中至少其一的最后一个功能性密码子后面的第一个碱基和与所述基因相邻的反向重复片段中FRT位点前面的最后一个碱基之间包含多核苷酸序列插入、删除和/或替代的2μm家族质粒。
2.权利要求1的2μm家族质粒,其中除了所述多核苷酸序列插入、删除和/或替代,所述FLP基因和/或REP2基因分别具有衍生自天然存在2μm家族质粒的FLP基因和/或REP2基因的序列。
3.权利要求1的2μm家族质粒,其中所述天然存在2μm家族质粒选自:由鲁氏接合糖酵母(Zygosaccharomyces rouxii)获得的pSR1、pSB3或pSB4,由拜列氏接合糖酵母(Zygosaccharomyces bailii)获得的pSB1或pSB2,由发酵接合糖酵母(Zygosaccharomyces fermentati)获得的pSM1,由果蝇克鲁维氏酵母(Kluyveromyces drosophilarum)获得的pKD1,由膜醭毕赤氏酵母(Pichia membranaefaciens)获得的pPM1,及由啤酒糖酵母(Saccharomycescerevisiae)获得的2μm质粒。
4.权利要求2或3的2μm家族质粒,其中与所述FLP和/或REP2基因相邻的反向重复片段的序列衍生自与衍生所述基因的序列相同的天然存在2μm家族质粒中的相应反向重复片段的序列。
5.权利要求2至4任一项的2μm家族质粒,其中所述天然存在2μm家族质粒是由啤酒糖酵母获得的2μm质粒。
6.权利要求5的2μm家族质粒,其中所述多核苷酸序列插入、删除和/或替代存在于REP2基因密码子59的第一个碱基与相邻反向重复片段中FRT位点前面的最后一个碱基之间的位置。
7.权利要求5或6的2μm家族质粒,其中除了所述多核苷酸序列插入、删除和/或替代,所述REP2基因和相邻反向重复片段的序列由SEQ IDNO:1或其变体定义。
8.权利要求1至7任一项的2μm家族质粒,其中所述多核苷酸序列插入、删除和/或替代存在于反向重复片段的第一个碱基与FRT位点前面的最后一个碱基之间的位置。
9.权利要求1至7任一项的2μm家族质粒,其中所述多核苷酸序列插入、删除和/或替代存在于REP2编码序列末端后面的第一个碱基与FRT位点前面的最后一个碱基之间,诸如位于REP2编码序列末端后面的第一个碱基处。
10.权利要求1至7任一项的2μm家族质粒,其中除了所述多核苷酸序列插入、删除和/或替代,跟随REP2编码序列的反向重复片段具有衍生自由啤酒糖酵母获得的2μm质粒的相应区域的序列,且优选的是所述多核苷酸序列插入、删除和/或替代存在于反向重复片段内的XcmI位点或FspI位点处。
11.权利要求5的2μm家族质粒,其中所述多核苷酸序列插入、删除和/或替代存在于FLP基因密码子344的第一个碱基与相邻反向重复片段中FRT位点前面的最后一个碱基之间的位置。
12.权利要求5或11的2μm家族质粒,其中除了所述多核苷酸序列插入、删除和/或替代,所述FLP编码序列和相邻反向重复片段的序列由SEQ IDNO:2或其变体定义。
13.权利要求11或12的2μm家族质粒,其中所述多核苷酸序列插入、删除和/或替代存在于反向重复片段的第一个碱基与FRT位点前面的最后一个碱基之间的位置。
14.权利要求13的2μm家族质粒,其中所述多核苷酸序列插入、删除和/或替代存在于FLP编码序列末端后面的第一个碱基与FRT位点前面的最后一个碱基之间的位置。
15.权利要求14的2μm家族质粒,其中所述多核苷酸序列插入、删除和/或替代存在于FLP编码序列末端后面的第一个碱基处。
16.权利要求11至15任一项的2μm家族质粒,其中除了所述多核苷酸序列插入、删除和/或替代,跟随FLP基因的反向重复片段具有衍生自由啤酒糖酵母获得的2μm质粒的相应区域的序列,且优选的是多核苷酸序列插入、删除和/或替代存在于反向重复片段内的HgaI位点或FspI位点处。
17.前述权利要求任一项的2μm家族质粒,它在REP2基因和FLP基因二者的最后的功能性密码子后面的第一个碱基和与每一种所述基因相邻的反向重复片段中FRT位点前面的最后一个碱基之间包含多核苷酸序列插入、删除和/或替代,所述多核苷酸序列插入、删除和/或替代可以是相同的或不同的。
18.任何前述权利要求的2μm家族质粒,它在前述权利要求任一项定义以外的位置额外包含多核苷酸序列插入、删除和/或替代。
19.权利要求18的2μm家族质粒,其中所述多核苷酸序列插入、删除和/或替代存在于ARS序列周围的非转录区内。
20.前述权利要求任一项的2μm家族质粒,其中所述多核苷酸序列插入、删除和/或替代或至少其一是多核苷酸序列插入。
21.权利要求20的2μm家族质粒,其中所述多核苷酸序列插入编码开放读码框。
22.权利要求21的2μm家族质粒,其中所述开放读码框编码非2μm家族质粒蛋白质。
23.权利要求22的2μm家族质粒,其中所述非2μm家族质粒蛋白质包含参与蛋白质折叠或是具有蛋白伴侣活性或参与未折叠蛋白质应答的蛋白质、清蛋白、单克隆抗体、鬼臼亚乙苷、血清蛋白质(诸如血液凝结因子)、antistasin、蜱抗凝肽、运铁蛋白、乳铁蛋白、内皮抑制素、抑管张素、胶原蛋白、免疫球蛋白或基于免疫球蛋白的分子或二者任一的片段(如dAb、Fab′片段、F(ab′)2、scAb、scFv或scFv片段)、Kunitz结构域蛋白质、干扰素、白介素、IL10、IL11、IL2、干扰素α的各个类和亚类、干扰素β的各个类和亚类、干扰素γ的各个类和亚类、瘦蛋白、CNTF、CNTFAX15、IL1受体拮抗物、红细胞生成素(EPO)和EPO模拟物、血小板生成素(TPO)和TPO模拟物、prosaptide、蓝藻抗病毒蛋白N(cyanovirin-N)、5-螺旋、T20肽、T1249肽、HIV gp41、HIV gp120、尿激酶、尿激酶原、tPA、水蛭素、血小板衍生的生长因子、甲状旁腺激素、胰岛素原、胰岛素、胰高血糖素、胰高血糖素样肽、胰岛素样生长因子、降钙素、生长激素、转化生长因子β、肿瘤坏死因子、G-CSF、GM-CSF、M-CSF、FGF、前体和活性形式的凝血因子包括但不限于纤溶酶原、纤维蛋白原、凝血酶、前凝血酶、凝血酶原、von Willebrand氏因子、α1-抗胰蛋白酶、纤溶酶原激活物、因子VII、因子VIII、因子IX、因子X和因子XIII、神经生长因子、LACI、血小板衍生的内皮细胞生长因子(PD-ECGF)、葡萄糖氧化酶、血清胆碱酯酶、抑酶肽、淀粉状蛋白前体蛋白、inter-α胰蛋白酶抑制物、抗凝血酶III、脱脂载脂蛋白各个种类、蛋白C、蛋白S或任何上述的变体或片段的序列。
24.权利要求23的2μm家族质粒,其中所述非2μm家族质粒蛋白质包含清蛋白或其变体或片段的序列,或是包含任何这些之序列的融合蛋白的序列。
25.权利要求23的2μm家族质粒,其中所述非2μm家族质粒蛋白质包含运铁蛋白或其变体或片段的序列,或是包含任何这些之序列的融合蛋白的序列。
26.权利要求23的2μm家族质粒,其中所述非2μm家族质粒蛋白质包含乳铁蛋白或其变体或片段的序列,或是包含任何这些之序列的融合蛋白的序列。
27.权利要求23的2μm家族质粒,其中所述非2μm家族质粒蛋白质包含Fc或其变体或片段的序列,或是包含任何这些之序列的融合蛋白的序列。
28.权利要求23的2μm家族质粒,其中所述非2μm家族质粒蛋白质包含如下任何之一编码的参与蛋白质折叠或是具有蛋白伴侣活性或参与未折叠蛋白质应答的蛋白质的序列:AHA1、CCT2、CCT3、CCT4、CCT5、CCT6、CCT7、CCT8、CNS1、CPR3、CPR6、EPS1、ERO1、EUG1、FMO1、HCH1、HSP10、HSP12、HSP104、HSP26、HSP30、HSP42、HSP60、HSP78、HSP82、JEM1、MDJ1、MDJ2、MPD1、MPD2、PDI1、PFD1、ABC1、APJ1、ATP11、ATP12、BTT1、CDC37、CPR7、HSC82、KAR2、LHS1、MGE1、MRS11、NOB1、ECM10、SSA1、SSA2、SSA3、SSA4、SSC1、SSE2、SIL1、SLS1、UBI4、ORM1、ORM2、PER1、PTC2、PSE1和HAC1或截短的无内含子的HAC1。
29.权利要求23或28的2μm家族质粒,其中所述蛋白伴侣是蛋白质二硫键异构酶(PDI),或是由ORM2、SSA1或PSE1编码的蛋白质。
30.权利要求22至29任一项的2μm家族质粒,其中所述非2μm家族质粒蛋白质包含分泌前导序列。
31.权利要求22的2μm家族质粒,其中所述非2μm家族质粒包含细菌选择标记和/或酵母选择标记的序列。
32.权利要求31的2μm家族质粒,其中所述细菌选择标记是β-内酰胺酶基因和/或所述酵母选择标记是LEU2选择标记。
33.依照前述权利要求任一项的2μm家族质粒,该质粒包含(i)编码非2μm家族质粒蛋白质的异源序列;(ii)编码包含参与蛋白质折叠的蛋白质、蛋白伴侣或参与未折叠蛋白质应答的蛋白质优选蛋白质二硫键异构酶之序列的蛋白质的异源序列;和(iii)编码包含选择标记之序列的蛋白质的异源序列;其中至少一种异源序列存在于由权利要求1至16任一项定义的位置。
34.制备由前述权利要求任一项定义的质粒的方法,包括
(a)提供包含REP2基因和跟随REP2基因的反向重复片段,或者包含FLP基因和跟随FLP基因的反向重复片段的序列的质粒,在每种情况中反向重复片段包含FRT位点;
(b)提供多核苷酸序列并在权利要求1至16任一项定义的位置将多核苷酸序列插入质粒;和/或
(c)在权利要求1至16任一项定义的位置删除一些或所有核苷酸碱基;和/或
(d)在权利要求1至16任一项定义的位置用候选核苷酸碱基替代一些或所有核苷酸碱基。
35.通过权利要求34的方法获得的质粒。
36.包含由权利要求1至33和35任一项定义的质粒的宿主细胞。
37.依照权利要求36的宿主细胞,它是酵母细胞。
38.依照权利要求36或37的宿主细胞,其中所述质粒作为多拷贝质粒是稳定的。
39.依照权利要求38的宿主细胞,其中所述质粒基于pSR1、pSB3或pSB4且所述酵母细胞是鲁氏接合糖酵母;所述质粒基于pSB1或pSB2且所述酵母细胞是拜列氏接合糖酵母;所述质粒基于pSM1且所述酵母细胞是发酵接合糖酵母;所述质粒基于pKD1且所述酵母细胞是果蝇克鲁维氏酵母;所述质粒基于pPM1且所述酵母细胞是膜醭毕赤氏酵母;或所述质粒基于2μm质粒且所述酵母细胞是啤酒糖酵母或卡尔斯伯糖酵母(Saccharomycescarlsbergensis)。
40.依照权利要求38或39的宿主细胞,其中如果所述质粒含有或经过修饰后含有选择标记,那么通过标记遗失测量的稳定性在5代后是至少1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或基本上100%。
41.生产蛋白质的方法,包括下列步骤:
(a)提供权利要求1至33或35任一项定义的质粒;
(b)提供合适的宿主细胞;
(c)用所述质粒转化所述宿主细胞;
(d)在培养基中培养经转化的宿主细胞;
由此生成蛋白质。
42.生产蛋白质的方法,包括下列步骤:提供权利要求36至40任一项定义的宿主细胞,该宿主细胞包含权利要求1至33或35任一项定义的质粒;并在培养基中培养所述宿主细胞,由此生成蛋白质。
43.依照权利要求41或42的方法,还包括以下步骤:由培养的宿主细胞或培养基分离由此生成的蛋白质。
44.依照权利要求43的方法,还包括以下步骤:将由此分离的蛋白质纯化至商业可接受的纯度水平。
45.依照权利要求44的方法,还包括以下步骤:将由此纯化的蛋白质与载体或稀释剂一起配制,并任选以单位剂量形式提供由此配制的蛋白质。
46.依照权利要求43的方法,还包括以下步骤:将由此分离的蛋白质纯化至制药学可接受的纯度水平。
47.依照权利要求44的方法,还包括以下步骤:将由此纯化的蛋白质与制药学可接受载体或稀释剂一起配制,并任选以单位剂量形式提供由此配制的蛋白质。
48.包含编码宿主酵母细胞存活所必需的蛋白质的基因作为唯一酵母选择标记的质粒,其意义在于如果宿主酵母细胞中编码该必需蛋白质的基因遭到删除或灭活,那么该宿主细胞在培养中不能存活且该缺陷不能通过添加或更改培养基而补足。
49.权利要求48的质粒,其中编码必需蛋白质的基因是由所述质粒编码的唯一选择标记。
50.权利要求48或49的质粒,其中所述必需蛋白质是蛋白伴侣。
51.权利要求51的质粒,其中所述蛋白伴侣是蛋白质二硫键异构酶或Pse1p。
52.权利要求48至51任一项的质粒,它还包含编码非2μm家族质粒蛋白质诸如由权利要求23至27任一项定义的蛋白质的基因。
53.权利要求48至52任一项的质粒,它是2μm家族质粒。
54.权利要求53的质粒,它是权利要求1至33任一项定义的质粒。
55.包含如下质粒的宿主细胞,该质粒包含编码宿主细胞存活所必需的蛋白质的基因,且其中在缺乏该质粒时,该宿主细胞不能生成该必需蛋白质且不能通过添加或更改培养基而变得可存活。
56.依照权利要求55的宿主细胞,其中所述质粒是依照权利要求1至33或48至54任一项的质粒。
57.依照权利要求55或56的宿主细胞,其中在缺乏所述质粒时,所述宿主细胞不能存活。
58.权利要求55至57任一项的宿主细胞,其中所述宿主细胞还包含编码期望蛋白质诸如权利要求23至27任一项定义的蛋白质的重组基因。
59.权利要求58的宿主细胞,其中所述期望蛋白质是权利要求23至27任一项定义的非2μm家族质粒蛋白质。
60.权利要求59的宿主细胞,其中所述必需蛋白质是蛋白伴侣,诸如蛋白质二硫键异构酶或PSE1。
61.权利要求59或60的宿主细胞,其中所述重组基因位于与编码必需蛋白质的基因相同的质粒上。
62.生产期望重组蛋白的方法,包括下列步骤:提供权利要求59至61任一项定义的宿主细胞;在容许所述必需蛋白质和期望蛋白质表达的条件下在培养基中培养所述宿主细胞;并任选由培养的宿主细胞或培养基分离由此表达的期望蛋白质;并任选将由此分离的期望蛋白质纯化至商业可接受的纯度水平;还任选将由此纯化的蛋白质冻干或将纯化的期望蛋白质与载体或稀释剂(诸如制药学可接受的载体或稀释剂)一起配制;并任选以单位剂量形式提供由此配制的期望蛋白质。
63.权利要求62的方法,其中所述培养宿主细胞的步骤涉及在非选择性培养基诸如复合或丰富培养基中培养所述宿主细胞。
CN2004800420229A 2003-12-23 2004-12-23 2μm家族质粒及其用途 Expired - Fee Related CN1922326B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0329722.3 2003-12-23
GBGB0329722.3A GB0329722D0 (en) 2003-12-23 2003-12-23 Modified plasmid and use thereof
PCT/GB2004/005435 WO2005061719A1 (en) 2003-12-23 2004-12-23 2-micron family plasmid and use thereof

Publications (2)

Publication Number Publication Date
CN1922326A true CN1922326A (zh) 2007-02-28
CN1922326B CN1922326B (zh) 2011-02-09

Family

ID=30776295

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2004800420229A Expired - Fee Related CN1922326B (zh) 2003-12-23 2004-12-23 2μm家族质粒及其用途
CN200580048615.0A Expired - Fee Related CN101128587B (zh) 2003-12-23 2005-12-23 基因表达技术

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN200580048615.0A Expired - Fee Related CN101128587B (zh) 2003-12-23 2005-12-23 基因表达技术

Country Status (14)

Country Link
US (1) US8252551B2 (zh)
EP (1) EP1711602B1 (zh)
JP (1) JP4964596B2 (zh)
KR (1) KR101298157B1 (zh)
CN (2) CN1922326B (zh)
AT (1) ATE483812T1 (zh)
AU (1) AU2004303597C1 (zh)
CA (1) CA2551496C (zh)
DE (1) DE602004029503D1 (zh)
DK (1) DK1711602T3 (zh)
GB (2) GB0329722D0 (zh)
NZ (1) NZ548154A (zh)
WO (1) WO2005061719A1 (zh)
ZA (1) ZA200605589B (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003244516A1 (en) * 2002-02-07 2003-09-02 Novozymes Delta Limited Hiv inhibiting proteins
GB0329722D0 (en) 2003-12-23 2004-01-28 Delta Biotechnology Ltd Modified plasmid and use thereof
EP1766002B1 (en) * 2004-06-21 2015-11-18 Novozymes A/S Stably maintained multiple copies of at least two orf in the same orientation
DK2330200T3 (en) 2004-12-23 2017-07-24 Albumedix As GENE EXPRESSION TECHNIQUE
GB0512707D0 (en) * 2005-06-22 2005-07-27 Delta Biotechnology Ltd Gene expression technique
EP2604623A3 (en) 2007-08-08 2013-10-02 Novozymes Biopharma DK A/S Transferrin variants and conjugates
WO2010089385A1 (en) 2009-02-06 2010-08-12 Novozymes Biopharma Dk A/S Purification process
EP3243835B1 (en) 2009-02-11 2024-04-10 Albumedix Ltd Albumin variants and conjugates
GB2488077A (en) 2009-10-30 2012-08-15 Novozymes Biopharma Dk As Albumin variants
JP5969458B2 (ja) 2010-04-09 2016-08-17 アルブミディクス アクティーゼルスカブ アルブミン誘導体及び変異体
CN101974547B (zh) * 2010-07-30 2012-06-27 天津大学 含FLP的pBBR1MCS-2重组质粒及运动发酵单胞菌基因组DNA修饰的方法
NZ722791A (en) 2010-09-07 2018-12-21 Butamax Tm Advanced Biofuels Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion
EP2622080A4 (en) * 2010-09-30 2014-04-02 Codexis Inc USE OF 2 ENDOGENIC MICROMETER YEAST PLASMID FOR GENE OVEREXPRESSION
JP6099623B2 (ja) 2011-03-24 2017-03-22 ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー イソブタノール生成のための宿主細胞及び方法
US20140315817A1 (en) 2011-11-18 2014-10-23 Eleven Biotherapeutics, Inc. Variant serum albumin with improved half-life and other properties
CN104284980A (zh) 2011-12-30 2015-01-14 布特马斯先进生物燃料有限责任公司 用于丁醇生产的基因开关
CN104066841B (zh) 2012-01-23 2018-01-02 旭硝子株式会社 表达载体和蛋白质的制造方法
MX2014010278A (es) 2012-03-16 2015-03-05 Novozymes Biopharma Dk As Variantes de albumina.
CN104902929A (zh) * 2012-05-21 2015-09-09 沈维强 使用蛋白质前体作为前药的方法
CA2890766A1 (en) 2012-11-08 2014-05-15 Novozymes Biopharma Dk A/S Albumin variants
CN103898142B (zh) * 2014-03-04 2016-03-02 北京理工大学 一种硫醇过氧化物酶提高毕赤酵母外源蛋白质表达量的方法
WO2015176641A1 (zh) * 2014-05-21 2015-11-26 中国科学院上海生命科学研究院 一种促进重组极端耐热α-淀粉酶可溶性表达的方法
CN104946659A (zh) * 2015-03-27 2015-09-30 杭州北斗生物技术有限公司 重组人生长激素的制备方法及其peg化修饰物的制备方法
AU2016308504A1 (en) 2015-08-20 2018-01-18 Albumedix Ltd. Albumin variants and conjugates
CA3005953A1 (en) * 2015-12-22 2017-06-29 Albumedix Ltd Improved protein expression strains
EP3404098B1 (en) * 2016-01-12 2021-06-30 Agc Inc. Transformant, and transferrin manufacturing method
CN107367619A (zh) * 2017-08-30 2017-11-21 福建师范大学 Tcp1蛋白在制备乳腺癌术后预后评估试剂盒中的应用、乳腺癌预后评估试剂盒及方法
CN112004931A (zh) * 2018-03-26 2020-11-27 诺维信公司 真菌伴侣蛋白
CN110184292B (zh) * 2019-06-17 2023-01-20 湖北大学 一种利用分子伴侣提高酵母细胞表面展示功能性Infliximab Fab片段的方法
CN112680371A (zh) * 2019-10-18 2021-04-20 广东利世康低碳科技有限公司 一种水解餐厨垃圾中蛋白成分的产朊假丝酵母双基因共表达菌株及其构建方法
CN110592090A (zh) * 2019-10-30 2019-12-20 福建师范大学 Ssa4基因启动子及利用该启动子驱动外源基因转录的毕赤酵母表达载体
US11739166B2 (en) 2020-07-02 2023-08-29 Davol Inc. Reactive polysaccharide-based hemostatic agent
CN112501141A (zh) * 2020-10-22 2021-03-16 重庆中元汇吉生物技术有限公司 一种增加人甲状腺过氧化物酶产量的试剂和表达方法
CN114410496B (zh) * 2022-02-16 2023-10-03 江南大学 一种提高毕赤酵母外源蛋白产量的方法
CN114957488A (zh) * 2022-05-19 2022-08-30 中国科学院生物物理研究所 芳香烃受体蛋白稳定高效表达的方法及其应用

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9019919D0 (en) 1990-09-12 1990-10-24 Delta Biotechnology Ltd Purification of proteins
US4302386A (en) * 1978-08-25 1981-11-24 The Ohio State University Antigenic modification of polypeptides
NZ199722A (en) 1981-02-25 1985-12-13 Genentech Inc Dna transfer vector for expression of exogenous polypeptide in yeast;transformed yeast strain
IL66614A (en) 1981-08-28 1985-09-29 Genentech Inc Method of constructing a dna sequence encoding a polypeptide,microbial production of human serum albumin,and pharmaceutical compositions comprising it
GB8615701D0 (en) 1986-06-27 1986-08-06 Delta Biotechnology Ltd Stable gene integration vector
GB8620926D0 (en) 1986-08-29 1986-10-08 Delta Biotechnology Ltd Yeast promoter
HU213344B (en) 1987-04-09 1997-05-28 Delta Biotechnology Ltd Process for producing of stable dezintegrating plasmid-vectors
IL86455A0 (en) 1987-06-01 1988-11-15 Takeda Chemical Industries Ltd Polypeptide and production thereof
IL88326A (en) 1987-11-18 1993-03-15 Gist Brocades Nv Purification of serum albumin
AU626288B2 (en) 1988-02-05 1992-07-30 Commonwealth Scientific And Industrial Research Organisation Gene expression system (particularly for rotavirus vp7 protein) involving a foreign signal peptide and optionally a transmembrane anchor sequence
AU633020B2 (en) 1988-07-23 1993-01-21 Novozymes Delta Limited New secretory leader sequences
US5759802A (en) 1988-10-26 1998-06-02 Tonen Corporation Production of human serum alubumin A
GB8909916D0 (en) 1989-04-29 1989-06-14 Delta Biotechnology Ltd Polypeptides
US5571691A (en) * 1989-05-05 1996-11-05 Baylor College Of Medicine Production of recombinant lactoferrin and lactoferrin polypeptides using CDNA sequences in various organisms
GB8927480D0 (en) 1989-12-05 1990-02-07 Delta Biotechnology Ltd Mutant fungal strain detection and new promoter
JP3230091B2 (ja) 1990-06-25 2001-11-19 ウェルファイド株式会社 ヒト血清アルブミンの着色抑制方法
KR930701625A (ko) * 1990-07-13 1993-06-12 리처드 에프. 셀든 라이브러리 스크리닝 방법
GB2249096A (en) * 1990-10-11 1992-04-29 Ciba Geigy Saccharomyces cerevisiae strains lacking carboxypeptidase yscY activity for expression of proteins at high yields
JPH07502723A (ja) 1991-02-08 1995-03-23 ザ・ユニバーシテイ・オブ・バーモント・アンド・ステイト・アグリカルチユラル・カレツジ 組み替えトランスフェリン、トランスフェリン半−分子、及びそれらの突然変異体
EP0501914A1 (en) * 1991-02-25 1992-09-02 Ciba-Geigy Ag Improved yeast vectors
EP0509841A3 (en) 1991-04-18 1993-08-18 Tonen Corporation Co-expression system of protein disulfide isomerase gene and useful polypeptide gene and process for producing the polypeptide using its system
ZA932568B (en) 1992-04-24 1993-11-12 Baylor College Midecine A Non Production of recombinant human lactoferrin
US6291205B1 (en) * 1992-06-12 2001-09-18 Merck & Co., Inc. Method of increasing production of disulfide bonded recombinant proteins by saccharomyces cerevisiae
WO1994003617A1 (en) 1992-07-29 1994-02-17 Unilever N.V. Process for producing anti-freeze peptides
DE4226971C2 (de) 1992-08-14 1997-01-16 Widmar Prof Dr Tanner Modifizierte Pilzzellen und Verfahren zur Herstellung rekombinanter Produkte
US5728553A (en) 1992-09-23 1998-03-17 Delta Biotechnology Limited High purity albumin and method of producing
WO1994008012A1 (en) * 1992-10-02 1994-04-14 Research Corporation Technologies, Inc. Methods for increasing secretion of overexpressed proteins
GB9404270D0 (en) 1994-03-05 1994-04-20 Delta Biotechnology Ltd Yeast strains and modified albumins
GB9411356D0 (en) 1994-06-07 1994-07-27 Delta Biotechnology Ltd Yeast strains
JP3945866B2 (ja) 1996-09-04 2007-07-18 サントリー株式会社 メタノール酵母由来のプロテインジスルフィドイソメラーゼ遺伝子
GB9703406D0 (en) 1997-02-19 1997-04-09 Chiron Spa Expression of heterologous proteins
WO1998056928A1 (en) 1997-06-13 1998-12-17 Stichting Instituut Voor Dierhouderij En Diergezondheid Increased production of proteins by using chaperone-like proteins
GB9713412D0 (en) 1997-06-26 1997-08-27 Delta Biotechnology Ltd Improved protein expression strains
HUP0003541A3 (en) * 1997-09-05 2003-08-28 Pentapharm Ag Expression vector for improved production of polypeptides in yeast
IT1306207B1 (it) 1999-01-15 2001-05-30 Biopolo S C A R L Produzione di proteine eterologhe da zygosaccharomyces bailii.
GB9902000D0 (en) * 1999-01-30 1999-03-17 Delta Biotechnology Ltd Process
JP2003530838A (ja) 2000-04-12 2003-10-21 ヒューマン ゲノム サイエンシズ インコーポレイテッド アルブミン融合タンパク質
US20030226155A1 (en) * 2001-08-30 2003-12-04 Biorexis Pharmaceutical Corporation Modified transferrin-antibody fusion proteins
US7176278B2 (en) * 2001-08-30 2007-02-13 Biorexis Technology, Inc. Modified transferrin fusion proteins
AU2003244516A1 (en) 2002-02-07 2003-09-02 Novozymes Delta Limited Hiv inhibiting proteins
JP2005534330A (ja) 2002-08-07 2005-11-17 デルタ バイオテクノロジー リミテッド アルブミン融合繊毛様神経栄養因子
DE10252245A1 (de) 2002-11-07 2004-05-27 Prof. Dr. Danilo Porro Università degli Studi di Milano-Bicocca Dipartimento die Biotechnologie e Bioscienze Verfahren zur Expression und Sekretion von Proteinen mittels der nicht-konventionellen Hefe Zygosaccharomyces bailii
US6939676B2 (en) * 2002-12-30 2005-09-06 The United States Of America As Represented By The Secretary Of Argriculture Selection procedure for identifying transgenic cells, embryos, and plants without the use of antibiotics
GB0305989D0 (en) 2003-03-15 2003-04-23 Delta Biotechnology Ltd Agent
GB0329681D0 (en) * 2003-12-23 2004-01-28 Delta Biotechnology Ltd Gene expression technique
GB0329722D0 (en) 2003-12-23 2004-01-28 Delta Biotechnology Ltd Modified plasmid and use thereof
GB0402660D0 (en) 2004-02-06 2004-03-10 Medical Res Council Heterologous protein expression
WO2005113768A1 (ja) * 2004-05-21 2005-12-01 Takara Bio Inc. ポリペプチドの製造方法
DK2330200T3 (en) 2004-12-23 2017-07-24 Albumedix As GENE EXPRESSION TECHNIQUE

Also Published As

Publication number Publication date
KR101298157B1 (ko) 2013-08-21
GB2424888A (en) 2006-10-11
CN101128587A (zh) 2008-02-20
KR20070004585A (ko) 2007-01-09
AU2004303597C1 (en) 2009-05-14
CN101128587B (zh) 2014-02-12
WO2005061719A1 (en) 2005-07-07
GB0329722D0 (en) 2004-01-28
AU2004303597B2 (en) 2008-09-25
CN1922326B (zh) 2011-02-09
DE602004029503D1 (de) 2010-11-18
EP1711602B1 (en) 2010-10-06
GB0614610D0 (en) 2006-08-30
ATE483812T1 (de) 2010-10-15
CA2551496C (en) 2014-12-09
US8252551B2 (en) 2012-08-28
NZ548154A (en) 2009-05-31
DK1711602T3 (da) 2011-01-31
JP4964596B2 (ja) 2012-07-04
CA2551496A1 (en) 2005-07-07
US20080261861A1 (en) 2008-10-23
AU2004303597A1 (en) 2005-07-07
JP2007515961A (ja) 2007-06-21
GB2424888B (en) 2008-03-26
ZA200605589B (en) 2007-12-27
EP1711602A1 (en) 2006-10-18

Similar Documents

Publication Publication Date Title
CN1922326A (zh) 2μm家族质粒及其用途
CN1922325A (zh) 基因表达技术
CN1230537C (zh) 来自曲霉属融合产物中经加工的重组乳铁蛋白和乳铁蛋白多肽片断的表达
CN1249239C (zh) 合成有机产物的方法和材料
JP5631533B2 (ja) 遺伝子発現技術
CN1026994C (zh) 在克鲁维酵母宿主生产所需肽的方法
CN100347301C (zh) 无选择标志重组基因的菌株,得到这些菌株的方法及应用
CN85109718A (zh) 酵母菌异质基因表达的调节区
CN1950496A (zh) 在低等真核生物中产生半乳糖基化糖蛋白
CN1044298A (zh) 合成杀虫的晶状蛋白质基因
CN1062169A (zh) 巴斯德毕赤酵母酸性磷酸酶基因
CN1798848A (zh) 在缺乏酶的黑曲霉突变体中生产生物物质的方法
JP7448977B2 (ja) 組換えヒト血清アルブミンの高発現のための遺伝子工学操作された細菌の構築
CN1875029A (zh) 蛋白酶抑制剂及其变异体在丝状真菌中的表达
CN1852983A (zh) 蛋白质从酵母的分泌
CN1681930A (zh) 具有包含fivsi基序的信号序列的多肽以及编码该基序的寡核苷酸
CN1237208A (zh) 用于产朊假丝酵母转化的方法和材料
CN1156575C (zh) 分泌人粒细胞集落刺激因子(g-csf)的大肠杆菌菌株
Krasovska et al. Glucose‐induced production of recombinant proteins in Hansenulapolymorpha mutants deficient in catabolite repression
CN1213146C (zh) 从新的融合蛋白制造重组胰岛素的方法
CN101061225A (zh) 浓缩分泌的重组蛋白的方法和组合物
CN1894404A (zh) 有机酸存在下的启动子及其用途
CN1149291C (zh) 利用来自酿酒酵母的表达载体制备重组蛋白质的方法
CN1246459C (zh) 人复合α干扰素改构基因及其表达和生产
CN1125180C (zh) 启动子

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: NOVOZYMES BIOPOLYMER AS

Free format text: FORMER OWNER: NOVOZYMES BIOPHARMACEUTICAL UK CO., LTD.

Effective date: 20121203

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20121203

Address after: Denmark bagsvaerd

Patentee after: Novozymes Biopharma DK A/S

Address before: British Nottinghamshire

Patentee before: Novozymes Pharmaceutical U.K.

C56 Change in the name or address of the patentee
CP03 Change of name, title or address

Address after: Denmark rimbey

Patentee after: Aerbumeidikesi medical company

Address before: Denmark bagsvaerd

Patentee before: Novozymes Biopharma DK A/S

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110209

Termination date: 20171223

CF01 Termination of patent right due to non-payment of annual fee