CN101511994A - 使用真核细胞系生成蛋白质 - Google Patents

使用真核细胞系生成蛋白质 Download PDF

Info

Publication number
CN101511994A
CN101511994A CNA2007800276912A CN200780027691A CN101511994A CN 101511994 A CN101511994 A CN 101511994A CN A2007800276912 A CNA2007800276912 A CN A2007800276912A CN 200780027691 A CN200780027691 A CN 200780027691A CN 101511994 A CN101511994 A CN 101511994A
Authority
CN
China
Prior art keywords
site
recombinase
recombination site
phage
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800276912A
Other languages
English (en)
Inventor
W·J·拉特
M·P·卡洛斯
J·Z·张
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HIPROCELL LLC
Original Assignee
HIPROCELL LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HIPROCELL LLC filed Critical HIPROCELL LLC
Publication of CN101511994A publication Critical patent/CN101511994A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/12Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria
    • C07K16/1267Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria
    • C07K16/1285Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria from Corynebacterium (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Cell Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Mycology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Virology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明提供了位点特异性整合系统和用于产生用于蛋白质生产的真核细胞系的方法。所提供的系统包括第一位点特异性整合靶载体和包含感兴趣基因的第二位点特异性整合供体载体。还提供了由本方法和系统生成的哺乳动物细胞系以及包括本系统的试剂盒。

Description

使用真核细胞系生成蛋白质
交叉引用
本申请要求2006年5月22日提交的美国临时申请第60/802,719号的权益,该申请通过引用整体并入本文。
发明背景
蛋白质例如抗体,正作为多种疾病的治疗和/或预防选择而新兴起。例如,治疗抗体的施用为治疗和/或预防癌症个体或已暴露于病毒疾病物质或已被病毒疾病物质感染的个体提供了重要策略。
但是,产生生成高水平的重组蛋白例如抗体的细胞系的现有方法需要劳动密集的克隆和筛选步骤。能够生成高产率蛋白的细胞系的鉴定是乏味耗时的过程,其需要筛选数百种细胞系。该选择过程妨碍了筛选大量蛋白质治疗或预防候选物的潜力。而且,该选择过程还减缓了以及时且成本有效的方式生产蛋白质。
表达治疗蛋白质例如抗体的大部分现有哺乳动物细胞系是通过编码所述蛋白质的转基因的随机基因组整合而开发的。然而,随机整合方法具有明显缺点。例如,由于转基因的表达取决于整合位点的染色体环境,转基因在不希望位置的整合导致相对低的转基因表达。此外,整合在“永久”转染细胞的传代过程中容易切除。而且,转基因的表达通常由于转基因在染色体中不希望位置的随机整合而变得“沉默”。
因此,快速产生和鉴定能够生成高水平的用作治疗剂和诊断剂的重组蛋白的稳定细胞系的方法是必需的。本发明解决了该需求。
相关文献
Thyagarajan等,Mol Cell Biol 21,3926-34(2001);Groth等,Proc NatlAcad Sci USA 97,5995-6000(2000);Groth等,J Mol Biol 335,667-78(2004);Olivares等,Nat Biotechnol 20,1124-8(2002);Ortiz-Urda等,Nat Med 8,1166-70(2002);Ortiz-Urda等,Hum Gene Ther 14,923-8(2003);Ortiz-Urda等.J Clin Invest 111,251-5(2003);Thyagarajan等,Methods Mol Bio 308,99-106(2005);Olivares等,Gene 278,167-76(2001);Urlaub等,Proc Natl AcadSci USA 77,4216-20(1980);Traggiai等,Nat Med 10,871-5(2004);Wurm等,Nat Biotechnol 22,1393-8(2004);Andersen等,Curr Opin Biotechnol 13,117-23(2002);Wirth等,Gene 73,419-26(1988);Kim等,Biotechnol Bioeng58,73-84(1998);Gandor等,FEBS Lett 377,290-4(1995);Kito等,ApplMicrobiol Biotechnol 60,442-8(2002);Coquelle等,Cell 89,215-25(1997);Stark等,Cell 57,901-8(1989);Wurm等,Ann N Y Acad Sci 782,70-8(1996);Wurm等,Biologicals 22,95-102(1994);Kim等,Biotechnol Prog 17,69-75(2001);Chappell等,J Biol Chem 278,33793-800(2003);Owens等,Proc NatlAcad Sci USA 98,1471-6(2001);Chappell等,Proc.Natl.Acad.Sci.U.S.A.,97,1536-1541(2000);Weber等,Nat Biotechnol 22,1440-4(2004);Weber等,Metab Eng 7,174-81(2005);Chalberg等,J Mol Biol,357,28-48(2006);Jones等,Biotechnol Prog 19,163-8(2003);Marks等,J Mol Biol 222,581-97(1991);Sblattero等,Immunotech 3,271-8(1998);和Yamanaka等,J Biochem117,1218-27(1995)。
发明概述
本发明提供了位点特异性整合系统和用于产生用于蛋白质生成的真核细胞系的方法。所提供的系统包括第一位点特异性整合靶载体和包含感兴趣基因的第二位点特异性整合供体载体。还提供了由所述方法和系统生成的真核细胞系以及包括所述系统的试剂盒。
本发明一方面提供了位点特异性整合靶载体,该载体包括:第一载体重组位点,其在第一单向位点特异性重组酶存在下与基因组重组位点重组;第二载体重组位点,其在不同于所述第一单向位点特异性重组酶的第二单向位点特异性重组酶存在下与供体重组位点重组;与所述第二载体重组位点的3’端相邻的第一选择性标记的第一部分;和不同于所述第一选择性标记的第二选择性标记。
在一些实施方案中,所述基因组重组位点是真核基因组重组位点。在一些实施方案中,第一载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。在其他实施方案中,所述第一载体重组位点是细菌基因组重组位点(attB)并且所述基因组重组位点是拟噬菌体(pseudo-phage)基因组重组位点(拟attP)。在某些实施方案中,所述第一载体重组位点是噬菌体基因组重组位点(attP)并且所述基因组重组位点是拟细菌(pseudo-bacterial)基因组重组位点(拟attB)。在其他实施方案中,所述第一载体重组位点是拟细菌基因组重组位点(拟attB)或拟噬菌体基因组重组attP位点(拟attP)。在一些实施方案中,所述第二载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。在一些实施方案中,所述第二载体重组位点是拟细菌基因组重组位点(拟attB)或拟噬菌体基因组重组attP位点(拟attP)。
在一些实施方案中,所述第一单向位点特异性重组酶是
Figure A200780027691D00101
噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691D00102
噬菌体重组酶、
Figure A200780027691D00103
噬菌体重组酶或
Figure A200780027691D00104
噬菌体重组酶。在某些实施方案中,所述第一单向位点特异性重组酶是
Figure A200780027691D00105
噬菌体重组酶。在某些实施方案中,所述第二单向位点特异性重组酶是R4噬菌体重组酶。在某些实施方案中,
Figure A200780027691D00106
噬菌体重组酶包括改变的
Figure A200780027691D00107
噬菌体重组酶,TP901-1噬菌体重组酶包括改变的TP901-1噬菌体重组酶,并且R4噬菌体重组酶包括改变的R4噬菌体重组酶。
本发明另一方面提供了通过如下步骤将编码感兴趣蛋白质的多核苷酸位点特异性地整合在真核细胞基因组中的方法:将靶载体导入包含第一单向位点特异性重组酶的真核细胞,并使所述细胞保持在足以发生由所述第一单向位点特异性重组酶介导的在第一载体重组位点和基因组重组位点之间重组事件的条件下,以将所述靶载体位点特异性地整合入所述细胞的基因组;将供体载体导入包含第二单向位点特异性重组酶的靶细胞,其中所述供体载体包含编码感兴趣蛋白质的多核苷酸和供体重组位点,并使所述靶细胞保持在足以发生由所述第二单向位点特异性重组酶介导的在供体重组位点和所述靶载体的第二载体重组位点之间重组事件的条件下,以将编码感兴趣蛋白质的多核苷酸位点特异性地整合入所述细胞的基因组;其中所述第一单向位点特异性重组酶不同于所述第二单向位点特异性重组酶。在进一步实施方案中,该方法包括选择表达感兴趣蛋白质的细胞。
在一些实施方案中,所述第一载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。在其他实施方案中,所述第一载体重组位点是细菌基因组重组位点(attB)并且所述基因组重组位点是拟噬菌体基因组重组位点(拟attP)。在某些实施方案中,所述第一载体重组位点是噬菌体基因组重组位点(attP)并且所述基因组重组位点是拟细菌基因组重组位点(拟attB)。在其他实施方案中,所述第一载体重组位点是拟细菌基因组重组位点(拟attB)或拟噬菌体基因组重组attP位点(拟attP)。在一些实施方案中,所述第二载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。在其他实施方案中,所述第二载体重组位点是拟细菌基因组重组位点(拟attB)或拟噬菌体基因组重组attP位点(拟attP)。在一些实施方案中,所述供体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。在一些实施方案中,所述供体重组位点是拟细菌基因组重组位点(拟attB)或拟噬菌体基因组重组attP位点(拟attP)。
在一些实施方案中,所述第一单向位点特异性重组酶是噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691D00112
噬菌体重组酶、
Figure A200780027691D00113
噬菌体重组酶或噬菌体重组酶。在某些实施方案中,所述第一单向位点特异性重组酶是
Figure A200780027691D00115
噬菌体重组酶。在某些实施方案中,所述第二单向位点特异性重组酶是R4噬菌体重组酶。在一些实施方案中,所述蛋白质是能够用于生成营养物或用于进行酶促化学反应的酶,或者是有益和有价值作为营养物或用于治疗或预防人类或动物疾病的多肽(例如激素),具有免疫调节活性、抗病毒和/或抗肿瘤性质的多肽(例如乳腺丝抑蛋白),抗体,病毒抗原,疫苗,凝血因子,酶抑制剂,食物成分等。在某些实施方案中,所述蛋白质是分泌的蛋白质,例如抗体。在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述哺乳动物细胞是啮齿动物细胞,例如CHO细胞或二氢叶酸还原酶缺陷型CHO衍生细胞系如DG44。在其他实施方案中,所述哺乳动物细胞是人类细胞,例如PER.C6TM细胞。
本发明另一方面提供了分离的细胞,其包括基因组整合的多核苷酸盒,所述盒包括位于下述位点侧翼的第一杂合重组位点和第二杂合重组位点:在单向位点特异性重组酶存在下与供体重组位点重组的载体重组位点;与所述载体重组位点的3’端相邻的第一选择性标记的第一部分;和不同于所述第一选择性标记的第二选择性标记。
在一些实施方案中,所述载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。在一些实施方案中,所述供体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。在一些实施方案中,所述单向位点特异性重组酶是噬菌体重组酶、TP901-1噬菌体重组酶或R4噬菌体重组酶。在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述哺乳动物细胞是啮齿动物细胞,例如CHO细胞或二氢叶酸还原酶缺陷型CHO衍生细胞系,例如DG44。在其他实施方案中,所述哺乳动物细胞是人类细胞,例如PER.C6TM细胞。
本发明另一方面提供了用于在体外将多核苷酸位点特异性地整合入细胞基因组的试剂盒,该试剂盒包括:靶载体;和供体载体,其包括两个启动子、分泌感兴趣蛋白质时的两个信号序列、两个控制基因表达的基因调控开关、两个增加表达的翻译增强子、两个多克隆位点、供体重组位点和与所述供体重组位点的5’端相邻的第一选择性标记的第二部分(例如启动子)。在一些实施方案中,所述试剂盒进一步包括第一单向位点特异性重组酶或编码其的核酸。在进一步实施方案中,所述试剂盒还包括不同于所述第一单向位点特异性重组酶的第二单向位点特异性重组酶或编码其的核酸。
在一些实施方案中,所述第一单向位点特异性重组酶是
Figure A200780027691D00122
噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691D00123
噬菌体重组酶、
Figure A200780027691D00124
噬菌体重组酶或噬菌体重组酶。在一些实施方案中,所述第二单向位点特异性重组酶是
Figure A200780027691D00126
噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691D00127
噬菌体重组酶、
Figure A200780027691D00128
噬菌体重组酶或
Figure A200780027691D00129
噬菌体重组酶。
本发明另一方面提供了用于在真核细胞中生成蛋白质的试剂盒,该试剂盒包括:分离的真核细胞,其包括基因组整合的多核苷酸盒和供体载体,所述多核苷酸盒包括位于下述位点侧翼的第一杂合重组位点和第二杂合重组位点:在单向位点特异性重组酶存在下与供体重组位点重组的载体重组位点;与所述载体重组位点的3’端相邻的第一选择性标记的第一部分;和不同于所述第一选择性标记的第二选择性标记;所述供体载体包括多克隆位点、供体重组位点和与所述供体重组位点的5’端相邻的第一选择性标记的第二部分(例如启动子)。
在一些实施方案中,所述试剂盒还包括单向位点特异性重组酶或编码其的核酸。在一些实施方案中,所述单向位点特异性重组酶是
Figure A200780027691D001210
噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691D00131
噬菌体重组酶、
Figure A200780027691D00132
噬菌体重组酶或
Figure A200780027691D00133
噬菌体重组酶。
本发明的这些和其他目的、优点和特征对于本领域技术人员而言在阅读下文更全面描述的本发明细节后将变得明显。
附图简述
当结合附图阅读时,本发明通过下文详述得到最好的理解。要强调的是,根据惯例,附图的各种特征不是按规定比例。相反,为了清晰,各种特征的尺寸被随意放大或减小。附图包括下述图:
图1是示例性靶载体的图示。该示例性靶载体包括第一载体重组位点(例如 attB位点)、第二载体重组位点(例如R4 attP位点)、R4 attP位点下游的第一选择性标记的第一部分(例如无启动子的第一选择性标记(例如zeocin抗性基因))和第二选择性标记(例如潮霉素抗性基因)。
图2是示例性供体载体的图示。该示例性供体载体包括供体重组位点(例如R4 attB位点)、感兴趣基因和刚好在R4 attB位点上游的启动子(例如CMV启动子)。
图3是靶载体上存在的
Figure A200780027691D00135
 attB位点与靶细胞基因组中存在的
Figure A200780027691D00136
拟attP位点之间的示例性初次位点特异性整合事件的图示。所述整合事件由
Figure A200780027691D00137
整合酶介导。
图4是供体载体上存在的R4 attB位点与由于靶载体整合而整合入细胞基因组的R4 attP之间示例性位点特异性整合事件的图示。第二次整合事件由R4整合酶介导。
图5是示例性DHFR-靶载体的图示。该示例性DHFR-靶载体包括R4attP位点、
Figure A200780027691D00138
 attB位点、潮霉素抗性基因、DHFR基因和R4 attP位点下游的zeocin抗性基因的第一部分(例如无启动子的)。
图6是示例性DHFR-供体载体的图示。该示例性供体载体包括R4 attB位点、感兴趣基因、DHFR基因和刚好在R4 attB位点上游的CMV启动子。
图7是示例性IRES-供体载体的图示。该示例性供体载体包括R4 attB位点、感兴趣基因、刚好在R4 attB位点上游的CMV启动子和所述感兴趣基因的转录起始位点和编码区之间的IRES。
图8是靶载体pR1的图示。该靶载体pR1包括第一载体重组位点(例如R4 attB 295位点)、第二载体重组位点(例如
Figure A200780027691D00141
 attP 103位点)、
Figure A200780027691D00142
 attP103位点下游的第一选择性标记的第一部分(例如无启动子的选择性标记(例如嘌呤霉素抗性基因))和完整的第二选择性标记(例如潮霉素抗性基因盒)。其还包括ColE1 DNA复制起点和氨苄青霉素抗性基因盒,分别用于在大肠杆菌(E.coli)中保持和选择。星号指示唯一的限制酶切位点。
图9是示例性供体表达载体骨架(pHPC-4)的图示。该示例性供体表达载体骨架包括供体重组位点(例如
Figure A200780027691D00143
 attB 285 AAA位点)、两个CMV启动子、两个用于分泌蛋白质的信号序列、两个用于插入感兴趣基因的多聚接头和两个牛生长激素多腺苷酸化信号。其还包括刚好在用于选择供体表达载体整合入靶载体的
Figure A200780027691D00144
 att B285 AAA位点上游的较弱的启动子(例如SV40启动子)。此外,所述载体还包括ColE 1DNA复制起点和氨苄青霉素抗性基因盒,分别用于在大肠杆菌中保持和选择。星号指示唯一的限制酶切位点。
图10是示例性供体表达载体(pD1-DTX-1)的图示。该示例性供体表达载体包括供体重组位点(例如
Figure A200780027691D00145
 attB 285 AAA位点)、两个CMV启动子、两个信号序列、抗白喉毒素抗体的重链和轻链以及两个牛生长激素多腺苷酸化信号。该载体还包括刚好在用于选择供体表达载体整合入靶载体的
Figure A200780027691D00146
 attB 285 AAA位点上游的较弱的启动子(例如SV40启动子)。此外,所述载体还包括ColE1 DNA复制起点和氨苄青霉素抗性基因盒,分别用于在大肠杆菌中保持和选择。
图11是用以验证四个载体中每一个的功能的快速测试程序的图示,所述载体用以产生用于高水平蛋白质生成的细胞系。第一步使用由R4整合酶表达载体(例如pCMV sre)编码的R4整合酶来介导靶载体整合入R4拟attP位点。使整合进行48小时,无选择(例如潮霉素选择)。
第二步使用由突变整合酶表达载体(例如pCS-M3J)编码的
Figure A200780027691D00148
突变整合酶介导供体载体整合入靶载体。使整合进行48小时,然后使用嘌呤霉素选择来分离稳定的细胞池(pool)。分析这些细胞的蛋白质表达。高水平蛋白质表达取决于所使用的四种质粒中每一种的适当功能。可以通过使用或不使用R4整合酶表达载体做这些实验来评估靶载体是否在第一步中随机或位点特异性地整合在R4拟attP位点。如果不使用R4整合酶表达载体,则蛋白质表达水平将明显更低,因为未整合的靶载体将随着细胞在实验期间(>17天)的分裂而稀释。
图12是靶载体上存在的R4 attB 295位点和靶细胞基因组中存在的R4拟attP位点之间示例性首次位点特异性整合事件的图示。该整合事件由质粒pCMV sre编码的R4整合酶介导。潮霉素选择用以分离靶载体在R4拟attP位点整合的稳定克隆(例如
Figure A200780027691D00151
 attP或
Figure A200780027691D00152
 attP细胞系)。
图13是在
Figure A200780027691D00153
 attP细胞系中发生的在供体载体上存在的 attB285AAA位点与由于靶载体整合而整合入细胞基因组的
Figure A200780027691D00155
 attP 103位点之间示例性第二次位点特异性整合事件的图示。该第二次整合事件由
Figure A200780027691D00156
突变整合酶(例如由质粒pCS-M3J编码的突变整合酶)介导。重建的药物抗性表达盒用以选择其中供体表达载体已整合入靶载体的整合体,并针对其中供体载体已经整合入
Figure A200780027691D00158
拟attP位点的那些细胞系来选择。
图14描绘了
Figure A200780027691D00159
 attB、attP和att L88位点的序列。野生型
Figure A200780027691D001510
 attB和
Figure A200780027691D001511
 attP的序列在上半部分中给出。上半部分中带下划线的序列表示重组后将形成attL位点的来自attB和attP的序列。按照惯例,attL根据衍生自attB的重组交叉点的侧面而命名。例如在attL中,重组交叉点的左侧序列衍生自attB的重组交叉点左(5′)侧的序列。attL中重组交叉点的右侧序列衍生自attP的重组交叉点右(3′)侧的序列。
该图下半部分描绘了attB和attP序列如何被改变以生成分别用于靶载体和供体载体的 attP 103和
Figure A200780027691D001513
 attB 285 AAA位点。还指示了在供体载体中的
Figure A200780027691D001514
 attB 285 AAA位点整合入靶载体中的
Figure A200780027691D001515
 attP 103位点之后得到的
Figure A200780027691D001516
 attL 88位点的序列。
图15是示例性靶-DHFR载体(pR1-DHFR)的图示。该示例性靶-DHFR载体包括
Figure A200780027691D001517
 attP 103位点、R4 attB 295位点、潮霉素抗性基因、DHFR基因和位于
Figure A200780027691D001518
 attP 103位点下游的(例如无启动子的)嘌呤霉素抗性基因的第一部分。该载体还包括分别用于在大肠杆菌中保持和选择的ColE1DNA复制起点和氨苄青霉素抗性基因盒。
图16是示例性供体-DHFR表达载体(pD1-DHFR)的图示。该示例性供体-DHFR表达载体包括供体重组位点(例如
Figure A200780027691D001519
 attB 285 AAA位点)、两个CMV启动子、两个信号序列、抗白喉毒素抗体的重链和轻链、两个牛生长激素多腺苷酸化信号、DHFR表达盒和刚好在用于选择供体载体整合入靶载体的
Figure A200780027691D00161
 attB 285 AAA位点上游的启动子(例如SV40启动子)。该载体还包括分别用于在大肠杆菌中保持和选择的ColE1 DNA复制起点和氨苄青霉素抗性基因盒。
图17是示例性IRES-供体表达载体(pD1-IRES)的图示。该示例性IRES-供体表达载体包括供体重组位点(例如
Figure A200780027691D00162
 attB 285 AAA位点)、两个CMV启动子、5′未翻译区中的两个内部核糖体进入位点(IRES)、两个信号序列、抗白喉毒素抗体的重链和轻链、两个牛生长激素多腺苷酸化信号和刚好在用于选择供体载体整合入靶载体的
Figure A200780027691D00163
 attB 285 AAA位点上游的启动子(例如SV40启动子)。该载体还包括分别用于在大肠杆菌中保持和选择的ColE1 DNA复制起点和氨苄青霉素抗性基因盒。
图18是示例性调控靶载体(pR1reg)的图示。该示例性调控靶载体包括第一载体重组位点(例如R4 attB 295位点)、第二载体重组位点(例如
Figure A200780027691D00164
attP 103位点)、位于 attP 103位点下游的第一选择性标记的第一部分(例如无启动子的选择性标记(例如嘌呤霉素抗性基因))、完整的第二选择性标记(例如潮霉素抗性基因盒)和编码能够对可调控供体表达载体(例如pD1reg)上存在的一个或多个基因提供可控基因调控的蛋白质(例如RheoActivator和RheoReceptor)的盒,所述可调控供体表达载体具有的基因以它们能够被调控的方式布置。该载体还包括分别用于在大肠杆菌中保持和选择的ColE1 DNA复制起点和氨苄青霉素抗性基因盒。
图19是示例性调控靶-DHFR载体(pR1reg-DHFR)的图示。该示例性调控靶-DHFR载体包括第一载体重组位点(例如R4 attB 295位点)、第二载体重组位点(例如
Figure A200780027691D00166
 attP 103位点)、位于
Figure A200780027691D00167
 attP 103位点下游的第一选择性标记的第一部分(例如无启动子的选择性标记(例如嘌呤霉素抗性基因))、完整的第二选择性标记(例如潮霉素抗性基因盒)、DHFR基因和编码能够对可调控供体表达载体(例如pD1reg)上存在的一或多个基因提供可控基因调控的蛋白质(例如RheoActivator和RheoReceptor)的盒,所述可调控供体表达载体具有的基因以它们能够被调控的方式布置。该载体还包括分别用于在大肠杆菌中保持和选择的ColE1DNA复制起点和氨苄青霉素抗性基因盒。
图20是示例性可调控供体表达载体骨架(pD1reg)的图示。该示例性可调控供体表达载体骨架包括供体载体重组位点(例如
Figure A200780027691D00168
 attB 285 AAA位点)、两个防止通读转录到基因调控序列的序列(例如SV40多腺苷酸化区)、两个介导基因调控的序列(例如5x GAL4 UAS、TATA框和5′UTR)、两个信号序列、用于插入感兴趣基因的多聚接头、两个牛生长激素多腺苷酸化信号以及刚好在用于选择供体载体整合入靶载体的 attB 285 AAA位点上游的启动子(例如SV40启动子)。该载体还包括分别用于在大肠杆菌中保持和选择的ColE1 DNA复制起点和氨苄青霉素抗性基因盒。星号指示唯一的限制酶切位点。
图21是示例性选择性供体表达载体(pD1-DTX1-G418)的图示。该示例性选择性供体表达载体包括供体表达载体(图10)的所有元件,但还包括完整的选择性标记基因(例如G418)。
图22证明靶载体与供体表达载体在瞬时转染后的位点特异性重组。
图23显示从细胞分离的R4拟att位点的序列,在所述细胞中靶载体使用R4整合酶被位点特异性整合。发生重组的R4核心序列以大写字母显示。图24显示了从DG44细胞分离的杂合
Figure A200780027691D00172
 att位点的序列,在所述细胞中供体表达载体被位点特异性地整合入靶载体。图A显示杂合attL位点,图B显示杂合attR位点。上面的核酸序列显示供体表达载体区的预测序列,随后是attL,然后是嘌呤霉素抗性序列,其产生自靶载体。下面的序列是来自细胞系的实际序列。如图中所示,实际的核酸序列与预测序列准确对应。图25显示了从PER.C6TM细胞分离的杂合
Figure A200780027691D00173
 att位点的序列,在所述细胞中供体表达载体被位点特异性地整合入靶载体。图A显示杂合attL位点,图B显示杂合attR位点。上面的核酸序列显示供体表达载体区的预测序列,随后是attL,然后是嘌呤霉素抗性序列,其产生自靶载体。下面的序列是来自细胞系的实际序列。如图中所示,实际的核酸序列与预测序列准确对应。
图26显示了聚合酶链式反应介导的attB位点扩增(图A)和attR(图B)位点扩增,所述位点来自位点特异性地整合了供体表达载体的细胞的基因组DNA。
图27A显示位点特异性供体表达载体整合后来自CHO dhfr-克隆池的抗体的表达。
图27B显示位点特异性供体表达载体整合后来自PER.C6TM克隆池的抗体的表达。
图28A和28B显示来自含有位点特异性地整合的供体表达载体的CHOdhfr-池#2G7的单细胞克隆的抗体的表达。
图29显示其中供体表达载体位点特异性地整合入DHFR-靶载体、然后细胞群暴露于增加浓度的氨甲蝶呤的细胞池的抗体的表达(pg/细胞/天)。
图30是示例性报道供体表达载体(pD3-DTX1)的图示。该示例性报道供体表达载体包括供体表达载体(图10)的所有元件,还包括编码报道分子例如绿色荧光蛋白的基因。报道基因的存在能够容易识别表达感兴趣蛋白质的个体细胞。
图31显示在DG44细胞和PER.C6TM细胞中表达的抗白喉毒素抗体的相当的特异性结合活性。
图32显示从DG44细胞或PER.C6TM细胞表达的抗白喉毒素抗体的体外中和活性,与所述抗体基因从其克隆的人类B细胞系(D2.2)相比较。
图33A-33B显示pR1载体的核酸序列。
图34A-34C显示pD1-DTX-1载体的核酸序列。
图35A-35C显示pR1-DHFR载体的核酸序列。
图36A-36D显示pD1-DTX1-G418载体的核酸序列。
图37A-37D显示pD3-DTX1载体的核酸序列。
定义
"重组酶"是介导由重组酶识别的特定DNA序列之间位点特异性重组的酶家族(Esposito,D.,和Scocca,J.J.,Nucleic Acids Research 25,3605-3614(1997);Nunes-Duby,S.E.等,Nucleic Acids Research 26,391-406(1998);Stark,W.M.等,Trends in Genetics 8,432-439(1992))。在该组体中有几个亚家族,包括"整合酶"或酪氨酸重组酶(包括例如Cre和λ整合酶)以及"解离酶/转化酶"或丝氨酸重组酶(包括例如
Figure A200780027691D00181
整合酶、R4整合酶和TP-901整合酶)。该术语还包括与野生型相比被改变的重组酶,例如在美国专利公布20020094516中描述的,其公开内容通过引用整体并入本文。
"单向位点特异性重组酶"是天然存在的重组酶例如
Figure A200780027691D00182
整合酶、突变或改变的重组酶例如突变或改变的
Figure A200780027691D00183
整合酶(其保留了单向位点特异性重组活性)或被改变以成为单向的双向重组酶例如cre重组酶(其已经被改变成为单向的)。
"改变的重组酶"和"突变重组酶"在本文可互换使用,指其中来源生物体中存在的天然野生型重组酶基因在一或多个位置相对于亲本重组酶已经突变(例如在一或多个核苷酸,其可以导致改变的重组酶中一或多个氨基酸相对于亲本重组酶的改变)。"亲本重组酶"用来指从其产生改变的重组酶的重组酶的核苷酸和/或氨基酸序列。亲本重组酶可以是天然存在的酶(即天然或野生型的酶)或非天然存在的酶(例如遗传工程化的酶)。本发明感兴趣的改变的重组酶表现出不同于野生型酶或其他亲本酶的DNA结合特异性和/或活性水平。这种改变的结合特异性允许重组酶不同于亲本酶地与给定DNA序列反应,而改变的活性水平允许重组酶以更高或更低的效率进行反应。重组酶反应通常包括与识别序列结合和进行一致的切割和连接,导致两个重组识别位点之间的链交换。
本文使用的"位点特异性整合"或"位点特异性地整合"指第一核酸与第二核酸的序列特异性重组和整合,通常由重组酶介导。一般而言,位点特异性重组或整合发生在由重组酶识别的特定序列。与随机整合相比,位点特异性整合以更高的效率在特定序列(例如重组酶附着位点)发生。
噬菌体
Figure A200780027691D00191
(即细菌噬菌体
Figure A200780027691D00192
)的天然attB和attP识别位点长度一般为约34至40个核苷酸(Groth等.Proc Natl Acad Sci USA 97:5995-6000(2000))。这些位点通常排列如下:attB包括第一DNA序列attB5′、核心区和第二DNA序列attB3′,相对顺序为从5′到3′attB5′-核心区-attB3′。attP包括第一DNA序列attP5′、核心区和第二DNA序列attP3′,相对顺序为从5′到3′attP5′-核心区-attP3′。
Figure A200780027691D00193
的attP和attB的核心区具有序列5′-TTG-3′。其他噬菌体整合酶(例如R4噬菌体整合酶)及其识别序列可以适用于本发明。
整合酶对这些识别位点的作用是单向的,因为酶促反应生成的核酸重组产物不是该整合酶的有效底物。这导致稳定的整合,很少或没有可检测的重组酶介导的切除,即是"单向"的重组。整合酶对识别位点对作用的重组产物包括例如以5′至3′顺序:attB5′-重组产物位点序列-attP3′,以及attP5′-重组产物位点序列-attB3′。因此,当靶载体包括attB位点且靶基因组包括attP序列时,典型的重组产物包括如下序列(5′至3′):attP5′-TTG-attB3′{靶向载体序列}attB5′-TTG-attP3′。因为attB和attP位点是不同的序列,重组导致杂合位点特异性重组位点(左和右指定为attL或attR),其不是attB序列也不是attP序列,并且在功能上不可识别为相关单向位点特异性重组酶的位点特异性重组位点(例如attB或attP),从而消除单向位点特异性重组酶催化将逆转首次重组反应的attL和attR之间的第二次重组反应的可能性。
本文使用的"天然识别位点"指细胞基因组中天然存在的识别位点(即所述位点不是例如通过重组方式导入基因组)。
本文使用的"野生型重组位点"指通常被整合酶或重组酶利用的重组位点。例如,λ噬菌体是温和的细菌噬菌体,其感染大肠杆菌。该噬菌体具有一个用于重组的附着位点(attP),而大肠杆菌细菌基因组具有一个用于重组的附着位点(attB)。这些位点都是λ整合酶的野生型重组位点。在本发明上下文中,野生型重组位点存在于同源噬菌体/细菌系统中。因此,野生型重组位点可以从同源系统衍生并与异源序列结合,例如attB位点可以放入其他系统中以用作整合酶的底物。
本文使用的"拟位点(pseudo-site)"或"拟重组位点(pseudo-recombinationsite)"指包含被重组酶结合的识别位点的DNA序列,其中所述识别位点与野生型重组酶识别序列有一或多个核苷酸的不同和/或以基因组中的内源性序列存在,该内源性序列不同于其中存在重组酶的野生型识别序列的基因组序列。对于给定的重组酶,拟重组序列功能上等价于野生型重组序列,以不同于其中重组酶自然存在的方式存在于生物体中,并且相对野生型重组序列可以具有序列改变。在一些实施方案中,对于噬菌体整合酶例如噬菌体
Figure A200780027691D00201
而言,"拟attP位点"或"拟attB位点"分别指与野生型噬菌体(attP)或细菌(attB)附着位点序列的识别位点类似的拟位点。在本发明的许多实施方案中,拟attP位点存在于宿主细胞的基因组中,而野生型ttB位点存在于本发明系统中的靶向载体上。"拟att位点"是更概括的术语,其可以指拟attP位点或拟attB位点。应理解,att位点或拟att位点可以存在于线状或环状核酸分子上。在某些实施方案中,靶细胞基因组中"拟重组位点"的存在消除了对将重组位点导入基因组的需要。
本文使用的"杂合重组位点"指由部分野生型和/或拟重组位点构建的重组位点。作为例子,野生型重组位点可以具有侧翼有回文序列的短核心区。在"杂合重组位点"的一个实施方案中,杂合重组位点的核心区序列的5′序列与拟重组位点匹配,杂合重组位点的核心区序列的3′序列与野生型重组位点匹配。在替代实施方案中,杂合重组位点可以包括来自野生型attB位点的核心的5′区和来自野生型attP重组位点的核心的3′区,或者反之亦然。鉴于本说明书的教导,这种杂合重组位点的其他组合对于本领域普通技术人员而言是明显的。
"感兴趣的核酸片段"指任何适于插入基因组的核酸片段。感兴趣的核酸片段的适当实例包括启动子元件、治疗基因、标记基因、调控区、性状生成片段、实现基因破坏的核酸元件等。
转染细胞的方法是现有技术公知的。“转染”指通过吸收外源核酸(通常为DNA)而导致的细胞变化。术语“转染”的使用不是要将外源核酸的导入限制在任何特定方法。适合的方法包括病毒感染、接合、电穿孔、基因枪技术、磷酸钙沉淀、直接显微注射等等。方法的选择一般根据被转染的细胞类型以及进行转染的环境(即体外、离体或体内)。这些方法的概论可以参阅Ausubel等,Short Protocols in Molecular Biology,第3版,Wiley & Sons,1995。
术语"核酸分子"和"多核苷酸"被互换使用并指任何长度的脱氧核糖核苷酸或核糖核苷酸或其类似物的核苷酸的聚合物形式。多核苷酸可以具有已知或未知的任何三维结构并且可以行使已知或未知的任何功能。多核苷酸的非限制性实例包括基因、基因片段、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离DNA、调控区、任何序列的分离RNA、核酸探针和引物。核酸分子可以是线状或环状的。
多核苷酸通常包括四种核苷酸碱基的特异序列:腺嘌呤(A);胞嘧啶(C);鸟嘌呤(G);和胸腺嘧啶(T)(当多核苷酸是RNA时,尿嘧啶(U)替代胸腺嘧啶(T))。因此,术语多核苷酸序列是多核苷酸分子的字母顺序表示。该字母顺序表示可以输入具有中央处理单元的计算机中的数据库并用于生物信息学应用,例如功能基因组学和同源性搜索。
"编码序列"或"编码"选择的多肽的序列是核酸分子,其在置于适当调控序列(或"调控元件")的控制下时例如在体内被转录(为DNA时)和翻译(为mRNA时)成多肽。编码序列的边界通常由5’(氨基)末端的起始密码子和3′(羧基)末端的翻译终止密码子确定。编码序列可以包括但不限于病毒cDNA、原核或真核mRNA、来自病毒或原核DNA的基因组DNA序列以及合成的DNA序列。转录终止序列可以位于编码序列的3′。其他“调控元件”也可以与编码序列联合。编码多肽的DNA序列可以使用选择的细胞偏好的代表所需多肽编码序列的DNA拷贝的密码子来优化,以在选择的细胞中表达。
"由......编码"指编码多肽序列的核酸序列,其中所述多肽序列或其部分含有由所述核酸序列编码的多肽的至少3至5个氨基酸、更优选至少8至10个氨基酸和还更优选至少15至20个氨基酸的氨基酸序列。还包括与所述序列编码的多肽在免疫学上可确认的多肽序列。
"可操纵地连接"指其中如此描述的各部分被配置以发挥它们的通常功能的元件排列。因此与编码序列(例如报道表达盒)可操纵地连接的给定启动子能够在适当酶存在时实现所述编码序列的表达。启动子或其他调控元件不需要与编码序列连续,只要它们作用以指导其表达。例如,插入的不翻译但转录的序列可以存在于启动子序列和编码序列之间,而启动子序列依然可以被认为是与编码序列“可操纵地连接”。
"基因组结构域"指包括一或多个、通常多个外显子的基因组区域,其中外显子通常在转录过程中被剪接在一起以产生mRNA,其中mRNA通常编码蛋白质产物,例如治疗蛋白等。在许多实施方案中,基因组结构域包括给定基因的外显子,并且在本文还可以被称为“基因”。对于其中至少一些靶向的基因组结构域的转录在控制下发生的那些情况,根据本方法的基因组结构域的转录调节导致至少约2倍、有时至少约5倍和有时至少约10倍的调节,例如与对照相比增加或减少靶向的基因组结构域的转录。例如,在其中给定基因组结构域在非改良的靶细胞(用作对照)中仅低水平表达的情况下,本方法可以用于与对照相比获得至少2倍的转录增加。转录水平可以使用任何常规方法测定,其中用于测定转录水平的代表性方法包括但不限于:RNA印迹杂交、RT PCR、RNA酶保护等等。
"核酸构建体"指已被构建为包括自然界中不共同存在的一或多个功能单元的核酸序列。实例包括环状、线状、双链、染色体外DNA分子(质粒)、粘粒(含有来自λ噬菌体的COS序列的质粒)、包含非天然核酸序列的病毒基因组等等。
"载体"能够使基因序列转移至靶细胞。通常,"载体构建体"、"表达载体"和"基因转移载体"指任何能够指导感兴趣基因表达并能转移基因序列至靶细胞的核酸构建体。因此,该术语包括克隆载体和表达载体以及整合载体。
"表达盒"包括任何能够指导感兴趣基因/编码序列表达的核酸构建体。这样的盒可以构建成"载体"、"载体构建体"、"表达载体"或"基因转移载体"以将表达盒转移入靶细胞。因此,该术语包括克隆载体和表达载体以及病毒载体。
在本发明中,当重组酶"衍生自噬菌体"时,重组酶不需要明确由噬菌体本身生成,只是认为噬菌体是该重组酶及其编码序列的起源。重组酶可以例如通过本领域已知方法重组或合成生成,或者可选择地,重组酶可以从噬菌体感染的细菌培养物纯化。
"基本纯化的"一般指物质(化合物、多核苷酸、蛋白质、多肽、多肽组合物)的分离,以便该物质占其存在其中的样品的主要百分比。通常在样品中基本纯化的组分占样品的50%、优选80%-85%、更优选90-95%。用于纯化感兴趣多核苷酸和多肽的技术是本领域公知的,包括例如离子交换层析、亲合层析和根据密度沉降。
术语"外源"在这里定义为通过本发明方法例如使用本文定义的DNA构建体导入细胞的DNA。外源DNA可以具有与转染前的细胞中存在的内源DNA相同或不同的序列。
"转基因"或"转基因元件"指宿主生物体基因组中存在的人工导入的染色体整合的核酸序列。
术语"转基因动物"指具有整合入动物一或多种细胞的基因组的转基因元件的非人类动物。因此,本文使用的"转基因动物"包括具有全部或几乎全部含有遗传修饰的细胞的动物(例如完全转基因动物,尤其是具有可遗传转基因的转基因动物)以及嵌合转基因动物,其中动物细胞亚群被修饰为含有基因组整合的转基因。
本文使用的"靶细胞"指其中需要遗传修饰的细胞。靶细胞可以是分离的(例如在培养物中)或者在多细胞生物体中(例如在胚泡中、在胎中、在出生后动物中等等)。本申请中特别感兴趣的靶细胞包括但不限于培养的哺乳动物细胞,包括CHO细胞,和干细胞(例如胚胎干细胞(例如具有胚胎干细胞表型的细胞)、成人干细胞、多能干细胞、造血干细胞、间质干细胞等等)。
发明详述
本发明提供了一种位点特异性整合系统和用于产生用于蛋白质生成的真核细胞系的方法。所提供的系统包括第一位点特异性整合靶载体和包含感兴趣基因的第二位点特异性整合供体载体。还提供了由本方法和系统生成的真核细胞系以及包括本系统的试剂盒。
在描述本发明之前,应该理解本发明不限于所描述的特定实施方案,因此当然可以改变。还应理解本文使用的术语仅是为描述特定实施方案的目的,并不是要限制,因为本发明的范围将仅由所附权利要求书来限定。
当提供值的范围时,应理解除非上下文另有明确说明,该范围上限和下限值之间至下限值单位的十分之一的每个中间值也被明确公开。在所陈述的范围内任何陈述值或中间值与所述范围内任何其他陈述值或中间值之间的每一个更小范围包括在本发明范围内。受所述范围中任何特别排除的界限值的影响,这些更小范围的上限和下限值可以独立地包括或排除在范围外,其中界限值任一、都不或都包括在更小范围内的每个范围也包括在本发明范围内。当所陈述的范围包括界限值中的一个或两个时,排除那些包括的界限值的任一个或两个的范围也包括在本发明内。
除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域普通技术人员普遍理解相同的含义。尽管在实施或试验本发明中可以使用与本文描述相类似或等价的任何方法和材料,现在描述一些潜在优选的方法和材料。本文提到的所有出版物通过引用并入本文以公开和描述与引用出版物相关的方法和/或材料。应理解本公开内容超越了所并入的出版物的任何公开内容,达到相抵触的程度。
必须注意,如本文和所附权利要求书中使用的,单数形式"一个"、"一种"和"该"包括复数指示,除非上下文另有明确说明。因此,例如对“一个细胞”的提及包括多个这样的细胞,对“该载体”的提及包括对一或多个载体及本领域技术人员已知的其等价物的提及等等。
在本申请的申请日之前提供本文讨论的出版物仅用于公开。这决不被解释为承认本发明没有早于在先发明公开之前。而且,所提供的出版日期可能不同于实际出版日期,这可能需要单独确认。
概况
总体而言,本发明提供了第一位点特异性整合靶载体和包含感兴趣基因的第二位点特异性整合供体载体,用于产生能够生成蛋白质的哺乳动物细胞系。选择靶载体的元件,以便第一单向位点特异性整合酶识别靶载体上存在的第一载体位点特异性重组位点和靶细胞基因组中的基因组位点特异性重组位点,致使具有第二单向位点特异性整合酶的靶位点特异性重组位点的靶载体整合入靶细胞基因组中。
所得到的具有第二单向位点特异性整合酶的靶位点特异性重组位点的细胞系则能够用于有效产生能够生成所需蛋白质的细胞系。具有编码感兴趣蛋白质的多核苷酸和第二单向位点特异性整合酶的供体位点特异性重组位点的供体载体可被导入细胞系,致使供体载体整合入靶细胞基因组。由于转基因整合能够以位点特异性方式指导,本发明用于提供在希望位置的转基因整合并避免由于在不希望位置的整合而导致的转基因的低表达。
现在更详细描述本发明。
载体
如上所述,所述系统包括用于将位点特异性重组位点整合入靶细胞基因组的靶载体和用于将编码感兴趣蛋白质的多核苷酸整合入所导入的位点特异性重组位点的供体载体。载体通常是环状的,还可以含有选择性标记、复制起点和其他元件例如启动子、启动子-增强子序列、选择标记序列、复制起点、诱导型元件序列、表位标签序列等等。参见例如美国专利第6,632,672号,其公开内容通过引用整体并入本文。
本发明提供了靶载体,其包括:(a)第一载体位点特异性重组位点,其能够在第一单向位点特异性重组酶存在下与真核细胞基因组中基因组重组位点重组;(b)第二载体位点特异性重组位点,其能够在第二单向位点特异性重组酶存在下与供体载体上的供体位点特异性重组位点重组;(c)与第二载体位点特异性重组位点的3′端相邻的第一选择性标记的第一部分(例如无启动子的第一选择性标记);和(d)不同于第一选择性标记的第二选择性标记,且所述第一单向位点特异性重组酶不同于所述第二单向位点特异性重组酶。示例性靶载体示于图1。
本发明还提供了供体载体,其包括(a)多克隆位点;(b)供体位点特异性重组位点,其能够在第二单向位点特异性重组酶存在下与靶载体的第二载体位点特异性重组位点重组;和(c)与供体位点特异性重组位点的5′端相邻的第一选择性标记的第二部分(例如启动子)。在某些实施方案中,供体载体进一步包括多克隆位点中存在的编码感兴趣蛋白质的多核苷酸。示例性供体载体示于图2。
已经描述了来自细菌和单细胞酵母的单向位点特异性重组酶的两个主要家族:整合酶或酪氨酸重组酶家族包括Cre、Flp、R和λ整合酶(Argos等,EMBO J.5:433-440,(1986))和解离酶/转化酶或丝氨酸重组酶家族包括一些噬菌体整合酶例如噬菌体
Figure A200780027691D00261
、R4和TP901-1的那些(Hallet和Sherratt,FEMS Microbiol.Rev.21:157-178(1997))。关于适合的位点特异性重组酶的进一步描述参见美国专利第6,632,672号和美国专利公布第20030050258号,其公开内容通过引用整体并入本文。
在某些实施方案中,单向位点特异性重组酶是丝氨酸整合酶。可用于体外和体内重组的丝氨酸整合酶包括但不限于来自噬菌体
Figure A200780027691D00262
R4、TP901-1、phiBT1、Bxb1、RV-1、A118、U153和phiFC1的整合酶以及丝氨酸整合酶大家族中的其他整合酶(Gregory,Till和Smith,J.BacterioL,185:5320-5323(2003);Groth和Calos,J.Mol.Biol.335:667-678(2004);Groth等.PNAS 97:5995-6000(2000);Olivares,Hollis和Calos,Gene 278:167-176(2001);Smith和Thorpe,Molec.Microbiol,4:122-129(2002);Stoll,Ginsberg和Calos,J.BacterioL,184:3657-3663(2002))。除了这些野生型整合酶以外,已经生成了带有突变的改变的整合酶(Sclimenti,Thyagarajan和Calos,NAR,29:5044-5051(2001))。这些整合酶可以具有与野生型相比改变的活性或特异性并也用于体外重组反应和整合反应入真核基因组。
在代表性实施方案中,所述第一单向位点特异性重组酶和所述第二单向位点特异性重组酶是不同的。每个单向位点特异性重组酶具有不同的位点特异性重组位点(att或附着位点),其不与其他单向位点特异性重组酶的附着位点重组。通过使用序列不同的两种单向位点特异性重组酶,一个用于整合靶载体而另一个用于整合供体载体,初始靶载体内用于靶载体基因组整合的附着位点与用于供体载体整合的附着位点之间不存在不期望的分子内重组的机会。需要避免这种分子内重组事件,因为它们不仅会产生不能整合入靶细胞基因组的杂合位点,而且可能导致靶载体中重要序列元件的缺失。
因此,第一和第二单向位点特异性重组酶应该衍生自不同的噬菌体,例如R4、TP901-1、phiBT1、Bxb1、RV-1、A118、U153和phiFC1,或者可以衍生自相同的噬菌体但是第一和第二单向位点特异性重组酶中至少一个是改变的单向位点特异性重组酶,其识别的位点特异性重组位点不同于由相应的野生型单向位点特异性重组酶识别的位点特异性重组位点。
总体而言,细菌基因组中由位点特异性重组酶识别的位点特异性重组位点是指定的细菌附着位点(″attB″),而细菌噬菌体中存在的相应位点特异性重组位点是指定的噬菌体附着位点("attP")。这些位点最小长度约34-40个碱基对(bp)Groth,A.C等,Proc.Natl.Acad.Sci.USA 97,5995-6000(2000))。这些位点通常布置如下:attB包括第一DNA序列attB5′、核心区和第二DNA序列attB3′,相对顺序为attB5′-核心区-attB3′;attP包括第一DNA序列(attP5′)、核心区和第二DNA序列(attP3′),相对顺序为attP5′-核心区-attP3′。
例如,对于噬菌体
Figure A200780027691D00271
 attP(噬菌体附着位点),核心区是5′-TTG-3′,在任一侧的侧翼序列表示为attP5′和attP3′,attP重组位点的结构相应为attP5′-TTG-attP3′。相应地,对于天然细菌基因组靶位点(attB),核心区是5′-TTG-3′,在任一侧的侧翼序列表示为attB5′和attB3′,attB重组位点的结构相应为attB5′-TTG-attB3′。
因为attB和attP位点是不同的序列,重组生成杂合位点特异性重组位点(左和右指定为attL或attR),其不是attB序列也不是attP序列,并且在功能上不可识别为相关单向位点特异性重组酶的位点特异性重组位点(例如attB或attP),从而消除单向位点特异性重组酶催化将逆转首次重组反应的attL和attR之间的第二次重组反应的可能性。例如,在单位点
Figure A200780027691D00272
整合酶介导的重组事件发生后,得到如下重组产物:attB5′-TTG-attP3′
Figure A200780027691D00273
载体序列}attP5′-TTG-attB3′。通常,在重组之后,重组后重组位点不再能够用作
Figure A200780027691D00274
重组酶的底物。这导致很少或没有重组酶介导的切除的稳定整合。
已经发现在多种生物体的基因组中存在天然重组位点,其中天然重组位点不必需具有与野生型重组序列相同的核苷酸序列(对于给定的重组酶);但是这种天然重组位点足以促进由重组酶介导的重组。这样的重组位点序列在本文称为"拟重组序列"。对于给定的重组酶,拟重组序列在功能上等价于野生型重组序列,以不同于重组酶天然存在的方式存在于生物体中,并且相对于野生型重组序列可以具有序列改变。
拟重组序列的鉴定可以例如通过使用序列比对和分析来实现,其中查询序列是感兴趣的重组位点(例如attP和/或attB)。
可以检索靶细胞基因组中与对于给定重组酶选定的重组位点(例如
Figure A200780027691D00281
或R4的attP和/或attB)具有序列相同性的序列。例如可以通过计算机来检索核酸序列数据库。Genetics Computer Group(GCG;Madison,Wis.)开发的Wisconsin软件包9.0版的findpatterns算法是程序化用以筛选GenBank数据库中所有序列的实例(Benson等,1998,Nucleic Acids Res.26,1-7)。在该方面,当在靶细胞中选择拟重组位点时,使用与特定重组酶或改变的重组酶有关的attP或attB序列可以检索靶细胞的基因组序列中适合的拟重组位点。这些重组序列中可以耐受的异质性(heterogeneity)的功能大小和量可以凭经验评估,例如评估使用本发明改变的重组酶的靶向构建体的整合效率(有关评估整合事件的示例性方法参见WO 00/11155,2000年3月2日公布)。
功能性拟位点也可以凭经验发现。例如,支持本发明而进行的实验已经显示与其中没有attB或整合酶基因的共转染相比较,携带
Figure A200780027691D00282
 attB和新霉素抗性基因的质粒连同表达
Figure A200780027691D00283
整合酶的质粒共转染入人类细胞后获得了增加数量的新霉素抗性集落。这些集落的大部分反映了整合入天然拟attP位点。这些位点例如通过质粒拯救而恢复,并在DNA序列水平上进行分析,得到了例如来自人类基因组的拟attP位点的DNA序列。可以使用这种鉴定拟位点的经验方法,即使重组酶识别位点以及与它们结合的重组酶性质的详细知识是未知的。
在一些实施方案中,靶载体的第一载体重组位点是由第一位点特异性重组酶识别的细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。在这样的实施方案中,靶细胞基因组中存在的基因组重组位点是相应的拟重组位点。例如,当靶载体的第一载体重组位点是细菌基因组重组位点(attB)时,靶细胞基因组中存在的基因组拟重组位点是拟噬菌体基因组重组位点(拟attP)。类似地,当靶载体的第一载体重组位点是噬菌体基因组重组位点(attP)时,靶细胞基因组中存在的基因组拟重组位点是拟细菌基因组重组位点(拟attB)。
一些单向位点特异性重组酶优先整合入拟细菌重组位点(例如拟attB)而非拟噬菌体重组位点(例如拟attP)。在这些情况下,靶载体携带噬菌体重组位点(attP)并且将整合入拟attB位点。具有这种偏好的酶的实例有phiBT1整合酶和A118整合酶。在这种实施方案中,靶载体的第一载体重组位点是attP位点,靶细胞基因组中基因组重组位点是拟attB位点。其他单向位点特异性重组酶例如
Figure A200780027691D00291
和R4优先整合入拟噬菌体附着位点(拟attP位点)而非拟细菌重组位点(拟attB位点),因此靶载体携带attB位点并将整合入拟attP位点(Groth等,2000;Olivares,Hollis和Calos 2001)。在这种实施方案中,靶载体的第一载体重组位点是attB位点并且靶细胞基因组中基因组重组位点是拟attP位点。
另外,在某些实施方案中,靶载体的第一载体重组位点是拟重组位点并且靶细胞基因组中存在的基因组重组位点是相应的拟重组位点,其由第一位点特异性重组酶识别。例如,当靶载体的载体重组位点是拟细菌基因组重组位点(拟attB)时,靶细胞基因组中存在的拟重组位点是拟噬菌体基因组重组位点(拟attP)。类似地,当靶载体的第一载体重组位点是拟噬菌体基因组重组位点(拟attP)时,靶细胞基因组中存在的拟重组位点是拟细菌基因组重组位点(拟attB)。
在一些实施方案中,靶载体的第二载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP),其由第二位点特异性重组酶识别。在这样的实施方案中,供体载体上的供体重组位点是相应的重组位点。例如,在其中靶载体的第二载体重组位点是细菌基因组重组位点(attB)的实施方案中,供体载体上存在的供体重组位点是噬菌体基因组重组位点(attP)。类似地,当靶载体的第二载体重组位点是噬菌体基因组重组位点(attP)时,供体载体上存在的供体重组位点是细菌基因组重组位点(attB)。
如上所述,靶载体包括与第二载体重组位点的3’端相邻的第一选择性标记的第一部分,而供体载体包括与供体重组位点的5’端相邻的第一选择性标记的第二部分。在第二单向位点特异性重组酶存在下,靶载体上的第二载体重组位点与供体载体上存在的供体重组位点重组产生杂合重组位点。作为重组的结果,靶载体上的选择性标记的第一部分和供体载体上选择性标记的第二部分紧密接近,提供重建的功能性第一选择性标记。因此利用第一选择标记的选择可以用于筛选靶细胞基因组中存在的靶载体与具有编码感兴趣蛋白质的多核苷酸的供体载体之间的成功重组事件。
在重建的第一选择性标记基因的一个实施方案中,启动子由供体载体提供,选择性标记基因的编码区和多腺苷酸化信号由靶载体提供。在重建的选择性标记基因的另一个实施方案中,供体载体可以含有启动子、编码区的N末端部分和内含子的5′半部分,而靶载体可以含有内含子的3′半部分、编码区的C末端部分和多腺苷酸化信号。在重建的选择性标记基因的另一个实施方案中,供体载体可以含有启动子和编码区的N末端部分,而靶载体可以含有编码区的C末端部分和多腺苷酸化信号。而在另一实施方案中,供体载体包括启动子,靶载体包括无启动子的选择性标记。在重建的选择性标记基因的所有这些实施方案中,关键特征是单独靶载体和供体载体中存在的遗传元件不能产生相互独立的药物抗性。但当供体载体整合入靶载体时,完整的功能基因表达盒被组装,含有这种构型的细胞将对用以选择重建的选择性标记基因的存在的药物是抗性的。
启动子和启动子-增强子序列是RNA聚合酶与之结合并启动转录的DNA序列。启动子通过指定哪条链将被转录来确定转录物的极性。细菌启动子由共有序列(相对于转录起始-35和-10核苷酸)组成,其被特定σ因子和RNA聚合酶结合。
真核启动子更复杂。表达载体中使用的大部分真核启动子由RNA聚合酶II转录。通用转录因子(GTFS)首先结合转录起始位点附近的特异序列,然后募集结合RNA聚合酶II。除了这些最小启动子元件,小序列元件由模块DNA结合、调节给定启动子活性的反式激活蛋白(例如AP-1、SP-1)特异性识别。病毒启动子行使与细菌启动子或真核启动子相同的功能,并且需要启动子特异性反式RNA聚合酶(例如细菌中的细菌噬菌体T7RNA聚合酶)或募集细胞因子和RNA聚合酶II(真核细胞中)。病毒启动子(例如SV40、RSV和CMV启动子)可以是优选的,因为它们通常是特别强的启动子。
启动子可以进一步为组成型或可调控的。组成型启动子恒定地表达感兴趣基因。相反,可调控启动子(即去阻抑型(derepressible)或诱导型)仅在某些可被控制的条件下表达感兴趣基因。去阻抑型元件是与启动子结合作用并结合阻抑物(例如大肠杆菌中lacO/lacIq阻抑物系统)的DNA序列元件。诱导型元件是与启动子结合作用并结合诱导物(例如酵母中的gal1/gal4诱导物系统)的DNA序列元件。在任一情况下,转录实际上是“关闭”的,直至启动子通过改变环境条件而被去阻抑或被诱导(例如向lacO/lacIq系统添加IPTG或向gal1/gal4系统添加半乳糖),此时转录被“开启”。
另一种类型的调控启动子是"阻抑型"启动子,其中基因开始被表达,然后可以通过改变环境条件而被关闭。在阻抑型系统中,转录是组成型开启的,直至阻抑物结合小调控分子,此时转录被“关闭”。该类型启动子的实例是四环素/四环素阻抑物系统。在该系统中,当四环素结合四环素阻抑物时,阻抑物结合启动子中的DNA元件并关闭基因表达。
组成型原核启动子的实例包括细菌噬菌体λ的int启动子、pBR322的β-内酰胺酶基因序列的bla启动子、pPR325的氯霉素乙酰转移酶基因序列的CAT启动子等等。
诱导型原核启动子的实例包括:细菌噬菌体的主要右和左启动子(PL和PR),大肠杆菌的trp、recA、lacZ、AraC和gal启动子,枯草芽孢杆菌(B.subtilis)的α-淀粉酶(Ulmanen Ett at.,J.Bacteriol.162:176-182,1985)和σ-28-特异性启动子(Gilman等,Gene sequence 32:11-20(1984)),杆菌噬菌体的启动子(Gryczan,The Molecular Biology of the Bacilli,Academic Press,Inc.,NY(1982)),链霉菌启动子(Ward等,Mol.Gen.Genet.203:468-478,1986)等等。示例性原核启动子由Glick(J.Ind.Microtiot.1:277-282,1987);Cenatiempo(Biochimie 68:505-516,1986);和Gottesman(Ann.Rev.Genet.18:415-442,1984)综述。
示例性组成型真核启动子包括但不限于下述:小鼠金属硫蛋白I基因序列的启动子(Hamer等,J.Mol.Appl.Gen.1:273-288,1982);疱疹病毒的TK启动子(McKnight,Cell 31:355-365,1982);SV40早期启动子(Benoist等,Nature(London)290:304-310,1981);酵母gall基因序列启动子(Johnston等,Proc.Natl.Acad.Sci.(USA)79:6971-6975,1982);Silver等,Proc.Natl.Acad.Sci.(USA)81:5951-59SS,1984),CMV启动子、EF-1启动子。
诱导型真核启动子的实例包括但不限于下述:蜕皮激素应答启动子,四环素应答启动子,由使转录因子两部分结合在一起的"二聚物"调控的启动子,雌激素应答启动子,黄体酮应答启动子,核开关(riboswitch)调控的启动子,抗生素调控的启动子,乙醛调控的启动子等等。
一些被调控的启动子可以介导阻抑和激活。例如,在RheoSwitch系统中,蛋白质(RheoReceptor)结合启动子中的DNA元件(UAS,上游激活序列)并介导阻抑。但是当某些蜕皮激素样诱导物存在时,另一蛋白(RheoActivator)将结合所述诱导物。诱导物结合的RheoActivator能够结合DNA结合的RheoReceptor。RheoReceptor/诱导物/RheoActivator则能够激活基因表达。
普通的选择性标记基因包括对抗生素有抗性的那些基因,所述抗生素例如氨苄青霉素、四环素、卡那霉素、博来霉素、链霉素、潮霉素、新霉素、嘌呤霉素、G418、博来霉素、杀稻瘟素、ZeocinTM等等。选择性营养缺陷型基因包括例如hisD,其允许在组氨醇存在下在不含组氨酸的培养基中生长。
用于表达载体中的其他元件是复制起点。复制起点是独特的DNA区段,其含有多个由多聚体起点结合蛋白识别的短重复序列,并且在将DNA复制酶组装在起始位点中起关键作用。用于本文使用的表达载体中的适合的复制起点包括大肠杆菌oriC、ColE1质粒起点、2μ和ARS(都用于酵母系统)、sf1、SV40、EBV oriP(用于真核系统例如哺乳动物系统)等等。
如上所述,供体载体包括多克隆位点或多聚接头。多克隆位点或多聚接头是插入供体载体的编码一系列限制内切核酸酶识别位点的合成DNA,并实现方便地将编码感兴趣蛋白质的多核苷酸克隆入供体载体的特定位置。
可通过本发明组合物和方法生成的有用蛋白质是例如可用于生成营养物和用于进行酶促化学反应的酶,或者作为营养物有用且有价值的或用于治疗或预防人类或动物疾病的多肽(例如激素),具有免疫调节活性、抗病毒和/或抗肿瘤性质的多肽(例如乳腺丝抑蛋白),抗体,病毒抗原,疫苗,凝血因子,酶抑制剂,食物成分等等。其他可通过本发明方法生成的有用多肽是例如编码如下物质的多肽:激素例如促胰液素、胸腺素、松弛素、黄体生成素、甲状旁腺激素、促皮质素、促黑激素、β-促脂解素、尿抑胃素或胰岛素,生长因子例如表皮生长因子、胰岛素样生长因子(IGF)(例如IGF-I和IGF-II)、肥大细胞生长因子、神经生长因子、神经胶质细胞系衍生神经营养因子(GDNF)或转化生长因子(TGF)例如TGF-α或TGF-β(例如TGF-β1、β2或β3),生长激素例如人或牛生长激素,白介素例如白介素-1或-2,人巨噬细胞游走抑制因子(MIF),干扰素例如人α-干扰素(例如干扰素-αA、αB、αD或αF)、α-干扰素、γ-干扰素或杂合干扰素(例如αA-αD-或αB-αD-杂合干扰素,特别是杂合干扰素BDBB),蛋白酶抑制剂例如α1-抗胰蛋白酶、SLPI、α1-抗胰凝乳蛋白酶、C1抑制剂,肝炎病毒抗原例如乙型肝炎病毒表面或核心抗原或甲型肝炎病毒抗原或非甲型-非乙型肝炎(即丙型肝炎)病毒抗原,纤溶酶原激活物例如组织纤溶酶原激活物或尿激酶,肿瘤坏死因子(例如TNF-α或TNF-β),生长抑素,肾素,β-内啡肽,免疫球蛋白例如免疫球蛋白A、D、E、G或M或人-小鼠杂合免疫球蛋白的轻链和/或重链,免疫球蛋白结合因子例如免疫球蛋白E结合因子例如sCD23等等,降钙素,人降钙素相关肽,凝血因子例如因子IX或VIIIc,促红细胞生成素,水蛭抑制剂例如水蛭抑制剂C,desulphatohirudin例如desulphatohirudin变体HV1、HV2或PA,人超氧化物歧化酶,病毒胸腺嘧啶激酶,β-内酰胺酶,葡萄糖异构酶,转运蛋白例如人血浆蛋白例如血清白蛋白和运铁蛋白。上述的融合蛋白也可通过本发明方法生成。
另外,所表达的感兴趣蛋白质的水平可通过载体扩增而增加(参见Bebbington和Hentschel,"The use of vectors based on gene amplification forthe expression of cloned genes in mammalia cells in"DNA cloning",第3卷,Academic Press,New York,1987)。当表达蛋白质的载体系统中的标记可扩增时,存在于宿主细胞培养物中该标记的抑制剂的水平增加将增加标记基因的拷贝数。因为扩增区与蛋白质编码基因关联,感兴趣蛋白质的生成将随之增加(Crouse等,1983,Mol.Cell.Biol,3:257)。示例性扩增系统包括但不限于二氢叶酸还原酶(DHFR),其产生对其抑制剂氨甲蝶呤的抗性。其他适合的扩增系统包括但不限于谷氨酰胺合成酶(及其抑制剂甲硫氨酸磺基肟)、胸腺嘧啶合酶(及其抑制剂5-氟尿苷)、氨甲酰基-P-合成酶/天冬氨酸转氨甲酰基酶/二氢乳清酸酶(及其抑制剂N-(磷酰乙酰基)-L-天冬氨酸)、核糖核苷还原酶(及其抑制剂羟基脲)、鸟氨酸脱羧酶(及其抑制剂二氟甲基鸟氨酸)、腺苷脱氨酶(及其抑制剂脱氧助间型霉素)等等。
这些系统的每一个需要使用缺乏被扩增的标记基因的细胞系。例如使用DHFR基因作为可扩增基因,使用DHFR-缺陷型细胞系例如DHFR-缺陷型CHO细胞(例如DG44)。可获得用于分离这种标记基因缺陷型细胞系的方法。不使用标记基因缺陷型细胞系的基因扩增系统是使用2型腺伴随病毒(AAV-2)rep蛋白和rep蛋白结合位点的系统。
大多数可扩增标记基因也可用作选择性标记基因。例如DHFR基因的存在可以通过使用缺乏甘氨酸、胸腺嘧啶和次黄嘌呤的细胞生长培养基在DHFR-缺陷型细胞中选择。谷氨酰胺合成酶基因的存在可以通过使用缺乏谷氨酰胺的培养基在谷氨酰胺合成酶-缺陷型细胞中选择等等。以这种方式,可以保证可扩增标记基因的存在,以介导基因扩增,特别是在任何基因扩增程序之前。
因此,在某些实施方案中,靶载体进一步包括编码可选择和可扩增标记基因DHFR的多核苷酸。包含DHFR的示例性靶载体示于图5。在这样的实施方案中,整合入靶细胞基因组的靶载体使用增加浓度的氨甲蝶呤扩增。由于靶载体包括用于整合供体载体的第二位点特异性重组酶位点,靶细胞基因组中靶载体序列的扩增将导致靶细胞基因组中存在的第二位点特异性重组酶位点数目的扩增。这提供了多个其中可整合供体载体的位置。
在其他实施方案中,供体表达载体在暴露于增加浓度的氨甲蝶呤之前任选整合入靶-DHFR载体。在这种实施方案中,位于供体表达载体上编码感兴趣蛋白质的基因将变得与位于靶-DHFR载体上的DHFR基因紧密连锁(~4000碱基对内)。由于暴露于氨甲蝶呤,编码感兴趣蛋白质的基因拷贝数将通过在增加浓度的氨甲蝶呤中选择细胞而扩增。
在传统的基因扩增方法中,DHFR基因用过量(通常100倍)蛋白质表达载体共转染,以致其通常变得与蛋白质表达载体连锁,但是仅在两个载体通过细胞机制片段化并连接之后。与传统基因扩增方法相反,该任选方法提供了能够在暴露于氨甲蝶呤之前控制DHFR基因相对蛋白质表达基因的排列、组成和位置的优点。结果,这将提供更高频率的成功基因扩增并得到更少的不表达感兴趣基因或随时间减少感兴趣基因表达的不稳定细胞系。
或者,在其他实施方案中,具有编码感兴趣蛋白质的多核苷酸的供体载体还包括编码可选择和可扩增标记基因DHFR的多核苷酸。包括DHFR的示例性供体载体示于图6。在这种实施方案中,整合入基因组的包括编码感兴趣蛋白质的多核苷酸的完整序列使用增加浓度的氨甲蝶呤扩增。
在某些实施方案中,供体载体进一步包括置于转录起始位点和感兴趣蛋白质的翻译起始密码子之间的内部核糖体进入位点(IRES)。包括IRES的示例性供体载体示于图7。如果它们是翻译增强子,这种载体可以允许增加的基因表达,或者它们也能实现从单个转录物生成多个感兴趣蛋白质,只要IRES位于每个感兴趣编码区的5′。
鉴于本说明书的教导,本文描述的载体可以使用分子生物学领域已知的方法构建(参见例如Ausubel或Maniatis)。获得包括适当调控序列(例如启动子)的多核苷酸的示例性方法是PCR。PCR的一般程序在MacPherson等,PCR:A PRACTICAL APPROACH,(IRL Press at Oxford University Press,(1991))中教导。每次扩增反应的PCR条件可依经验确定。许多参数影响反应的成功。这些参数包括退火温度和时间、延伸时间、Mg2+和ATP浓度、pH以及引物、模板和脱氧核糖核苷酸的相对浓度。在扩增后,所得片段可以通过琼脂糖凝胶电泳随后用溴化乙锭染色和紫外线照射来检测。
方法
本发明还提供了通过将编码感兴趣蛋白质的多核苷酸位点特异性地整合入真核细胞例如哺乳动物细胞的基因组来产生生成感兴趣蛋白质的细胞系的方法。大体上,该方法包括:首先利用第一单向位点特异性重组酶将本文所述靶载体导入真核细胞,并使所述细胞保持在足以发生由所述第一单向位点特异性重组酶介导的在第一载体重组位点和基因组重组位点之间重组事件的条件下,以将所述靶载体位点特异性地整合入所述细胞的基因组。由第一单向位点特异性重组酶介导的靶载体成功整合事件可以通过使用靶载体上存在的选择性标记基因来选择。
然后利用第二单向位点特异性重组酶将包含编码感兴趣蛋白质的多核苷酸和供体重组位点的供体载体导入靶细胞。然后将所述靶细胞保持在足以使由第二单向位点特异性重组酶介导的重组事件发生的条件下。结果,供体重组位点与靶载体的第二载体重组位点之间的重组事件使编码感兴趣蛋白质的多核苷酸位点特异性地整合入细胞基因组。由第二单向位点特异性重组酶介导的供体载体成功整合事件可以通过使用重建的第一选择性标记基因来选择。在重建的第一选择性标记基因的一个实施方案中,启动子由供体载体提供,选择性标记基因的编码区和多腺苷酸化信号由靶载体提供。在重建的选择性标记基因的另一个实施方案中,供体载体可以含有启动子、编码区的N末端部分和内含子的5′半部分,而靶载体可以含有内含子的3′半部分、编码区的C末端部分和多腺苷酸化信号。在重建的选择性标记基因的另一实施方案中,供体载体可以含有启动子和编码区的N末端部分,而靶载体可以含有编码区的C末端部分和多腺苷酸化信号。而在另一实施方案中,供体载体包括启动子,而靶载体包括无启动子的选择性标记。在重建的选择性标记基因的所有这些实施方案中,关键特征是单独靶载体和供体载体中存在的遗传元件不能产生相互独立的药物抗性。但当供体载体整合入靶载体时,完整的功能性基因表达盒被组装,含有这种构型的细胞将对用以选择重建的选择性标记基因存在的药物是抗性的。
大体上,单向位点特异性整合酶与位点特异性重组位点的相互作用产生不含作为单向位点特异性整合酶的有效底物的序列的重组产物。因此,本发明方法中使用的整合事件是单向的,很少或没有可检测的由单向位点特异性整合酶介导的所导入核酸的切除。该特征保证与其他整合系统相比更高的感兴趣蛋白质表达稳定性,所述其他整合系统可由双向位点特异性重组酶(例如lox/cre整合系统)提供或者含有同向重复序列(例如长末端重复序列),其可以导致编码感兴趣蛋白质的基因缺失(例如在逆转录病毒或慢病毒整合系统中)。
载体可以通过本领域技术人员熟练的任何一种标准方法被导入宿主细胞以生成本发明的细胞系。核酸载体的递送可以使用例如阳离子脂质(Goddard等,Gene Therapy,4:1231-1236,1997;Gorman等,Gene Therapy 4:983-992,1997;Chadwick等,Gene Therapy 4:937-942,1997;Gokhale等,GeneTherapy 4:1289-1299,1997;Gao,和Huang,Gene Therapy 2:710-722,1995,其全部通过引用并入本文),使用病毒载体(Monahan等,Gene Therapy 4:40-49,1997;Onodera等,Blood 91:30-36,1998,其全部通过引用并入本文),通过"裸DNA"摄取、化学方法(例如磷酸钙)、电穿孔方法等等。
用于实施本发明的第一和第二单向位点特异性重组酶可以在导入靶载体或供体载体之前、同时或之后被导入靶细胞。第一和第二单向位点特异性重组酶可以以编码单向位点特异性重组酶的DNA(Olivares,Hollis和Calos,Gene,278:167-176(2001);Thyagarajan等.MCB 21:3926-3934(2001))或编码单向位点特异性重组酶的mRNA(Groth等.JMB 335:667-678(2004);Hollis等.Repr.Biol.Endocrin.1:79(2003))或作为单向位点特异性重组酶蛋白的形式被导入。
第一和第二单向位点特异性重组酶的表达通常期望是瞬时的。这是因为重组酶长期表达可以促进基因组中不同位置上存在的拟att位点之间的重组。这将导致染色体重排并最终导致细胞死亡。因此,提供重组酶瞬时表达的载体和方法是实施本发明所优选的。然而,第一和第二单向位点特异性重组酶的稳定表达如果被调控则是可以接受的,例如通过使重组酶表达处于可调控启动子(即其表达可以被选择性诱导或阻抑的启动子)的控制之下。
第一和第二单向位点特异性重组酶作为蛋白质导入具有几个优点。蛋白质半衰期短,所以细胞暴露于单向位点特异性重组酶的时间是有限的。而且,单向位点特异性重组酶基因没有机会整合入基因组。避免了单向位点特异性重组酶转录或翻译的限制,反应动力学可以更快速。蛋白质导入细胞一般比DNA导入毒性小。因此,噬菌体单向位点特异性重组酶作为蛋白质导入真核细胞可能是优选的。
蛋白质例如噬菌体单向位点特异性重组酶可以通过许多手段导入细胞,包括电穿孔、肽转运蛋白(Siprashvili,Reuter和Khavari,Mol.Ther.,9:721-728(2004))或蛋白转导结构域的结合,所述蛋白转导结构域例如衍生自单纯疱疹病毒VP22蛋白、触角足衍生肽、各种富含精氨酸的肽或者人类免疫缺陷病毒tat蛋白的那些。编码单向位点特异性重组酶的DNA或RNA也可以通过许多手段导入细胞,包括电穿孔、与化学试剂络合如与转运蛋白分子静电相互作用或细胞内吞作用。
适用于本发明方法的细胞一般是任何较高级真核细胞,例如哺乳动物细胞和酵母细胞。在一些实施方案中,所述细胞是容易操纵、容易培养的哺乳动物细胞系。在其他实施方案中,所述细胞是容易操纵、容易培养的酵母细胞系。能够表达重组DNA分子的适合细胞包括但不限于哺乳动物细胞例如啮齿动物细胞例如中国仓鼠卵巢(CHO)细胞、BHK细胞、小鼠细胞包括SP2/0细胞和NS-0骨髓瘤细胞、灵长类细胞例如COS和Vero细胞、MDCK细胞、BRL3A细胞、杂交瘤、肿瘤细胞、永生原代细胞、人类细胞例如W138、HepG2、HeLa、HEK293、HT1080或PER.C6TM等等。
在一些实施方案中,所述细胞是PER.C6TM细胞。在其他实施方案中,所述细胞是CHO细胞或二氢叶酸还原酶缺陷型细胞例如DG44细胞。CHO细胞已经成为用于产生生物药物蛋白和诊断目的蛋白的常规、方便的生成系统。许多特征使CHO细胞适合作为宿主细胞。CHO细胞中可以达到的生成水平极高。该细胞系提供了安全的生成系统,其可以不含感染原和感染病毒颗粒。CHO细胞已经被广泛表征,能够利用不含血清的培养基在生物反应器中悬浮生长直至达到高密度,并且CHO细胞的DHFR-缺陷型突变体(DG-44克隆.Urlaub等,Cell.33(2):405-12(1983))已经被开发以获得容易的选择和扩增系统,通过导入外源DHFR基因、选择其存在、然后使用增加浓度的氨甲蝶呤进行DHFR基因和任何连锁的感兴趣基因的控制良好的分步扩增进行。
细胞系
本发明还提供通过将上述靶载体整合入靶细胞的基因组重组位点而产生的细胞系。因此,该细胞具有基因组整合的多核苷酸盒,该多核苷酸盒包括位于下述侧翼的第一杂合重组位点和第二杂合重组位点:在单向位点特异性重组酶存在下与供体重组位点重组的载体重组位点;与载体重组位点的3’端相邻的无启动子的第一选择性标记;和与第一选择性标记不同的第二选择性标记。
在一些实施方案中,所述载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。在一些实施方案中,供体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。在一些实施方案中,单向位点特异性重组酶是
Figure A200780027691D00381
 噬菌体重组酶、TP901-1噬菌体重组酶或R4噬菌体重组酶。在一些实施方案中,哺乳动物细胞是啮齿动物细胞。在其他实施方案中,哺乳动物细胞是CHO细胞。而在其他实施方案中,哺乳动物细胞是PER.C6TM细胞。
试剂盒
本发明还提供了用于实施上述方法的试剂盒。在某些实施方案中,所述试剂盒至少包括上述靶载体以及供体载体的一或多个且通常全部。在一些实施方案中,所述试剂盒进一步包括第一和第二单向位点特异性重组酶组分,其中重组酶组分可以任何适当形式(例如作为蛋白质,其被配置为用于导入靶细胞或重组酶载体中,所述重组酶载体提供所需重组酶在导入靶细胞后的表达)提供。
在其他实施方案中,本试剂盒至少包括具有上述整合靶载体和供体载体的分离细胞系的一种或多种且通常全部。在一些实施方案中,所述试剂盒进一步包括第一和第二单向位点特异性重组酶组分,其中重组酶组分可以任何适当形式(例如作为蛋白质,其被配置为用于导入靶细胞或重组酶载体中,所述重组酶载体提供所需重组酶在导入靶细胞后的表达)提供。
试剂盒的其他任选组分包括限制酶、对照质粒、缓冲液、用于将载体导入细胞的材料等等。试剂盒的各种组分可以存在于单独容器中或者某些相容组分可以按需要预混合入单个容器。
除了上述组分,本试剂盒通常进一步包括使用所述试剂盒的各组分以实施本方法的说明书。用于实施本方法的说明书一般记录在适合的记录介质上。例如,说明书可以印在底物例如纸或塑料等等上。这样,说明书可以作为包装内容物存在于试剂盒中,存在于试剂盒容器或其组件的标签中(即与包装或分包装关联)等等。在其他实施方案中,说明书作为存在于适当计算机可读存储介质(例如CD-ROM、磁盘等)上的电子存储数据文档存在。而在其他实施方案中,实际说明书不存在于试剂盒中,但是提供了从远程来源例如通过因特网获得说明书的手段。该实施方案的实例是包括网址的试剂盒,在所述网址中可以观看说明书和/或下载说明书。与说明书一样,该获得说明书的手段记录在适当底物上。
实施例
列出下述实施例以为本领域技术人员提供如何实现和利用本发明的完整公开和描述,并不是要限制发明人认为是其发明的范围,也不是他们要表示下述实验是进行的全部或仅有的实验。已经努力保证所使用数字(例如量、温度等)的准确性,但应考虑实验误差和偏差。除非另有说明,份是重量份,分子量是重量平均分子量,温度是摄氏度,而压力是大气压或接近大气压。
实施例1
靶载体和供体载体的构建
难以在CHO细胞和其他哺乳动物细胞系中持续实现转基因的高水平表达,因为整合和相关染色体环境的随机性质影响整合的转基因。使用来自噬菌体和R4的位点特异性整合酶可以产生位点特异性整合载体以提供编码感兴趣基因的表达盒在哺乳动物细胞基因组中的位点特异性整合。
Figure A200780027691D00392
和R4整合系统通过提供整合入基因组中相对小数目的位置而去除了随机整合的许多缺陷,其还表征为强基因表达。使用
Figure A200780027691D00393
或R4整合酶的转基因整合提供了容易的产生哺乳动物细胞系的方法,所述细胞系表现出导入基因稳定的、高水平的表达。因此,使用产生生产细胞系的噬菌体整合酶减少了分离适于蛋白质生成的克隆所需的时间和努力。因此,由于整合被认为是最利于发生在具有开放染色质或减少的甲基化的染色体位置中,这样的位置也将最利于高水平、持续的基因表达。
靶载体
图1和图8提供了用于将位点特异性整合酶附着位点导入细胞系基因组的示例性靶载体的示意图。通常,靶载体将包括对第一位点特异性整合酶的第一附着位点和对第二位点特异性整合酶(例如具有更高整合效率的改变的位点特异性整合酶)的第二附着位点,其中第一和第二位点特异性整合酶是不同的。靶载体还可以包括其他元件,例如细菌选择性标记(例如编码对氨苄青霉素抗性的β-内酰胺酶),其提供了对含有所述载体的原核细胞的选择。此外,所述载体还可以包括用于选择具有成功整合入基因组的靶载体的哺乳动物细胞的哺乳动物细胞特异性选择性标记(例如编码对药物潮霉素抗性的潮霉素B磷酸转移酶的基因)和细菌细胞例如大肠杆菌的载体复制起点(例如ColE1DNA复制起点)。
如图12和图13所示,靶载体将用于将编码 attP 103位点的核酸序列导入细胞例如哺乳动物细胞基因组。整合后,该
Figure A200780027691D00402
 attP 103位点将用于位点特异性地整合供体质粒,所述质粒包括感兴趣基因的表达盒和编码
Figure A200780027691D00403
 attB 285 AAA位点的核酸序列。起始靶载体包括两个不同位点特异性整合酶的两个不同att位点的核酸序列。特别地,靶载体将包括编码R4attB 295位点的核酸序列。R4 attB 295位点介导靶载体整合入哺乳动物细胞基因组中的R4拟attP(R4 Ψ attP)位点。在典型的哺乳动物基因组中估计有约100个R4 Ψ attP位点。靶载体也将包括编码
Figure A200780027691D00404
 attP 103位点的核酸序列。 attP 103位点用作整合供体载体的靶位点,所述供体载体包括用以指导感兴趣基因表达的表达盒。
选择这里所选择的整合顺序(即R4整合酶介导整合随后
Figure A200780027691D00406
突变整合酶介导的整合)有两个原因。R4整合酶介导的整合而不是
Figure A200780027691D00407
整合酶介导的整合被选为第一步骤,因为哺乳动物基因组中R4 Ψ attP位点比
Figure A200780027691D00408
Ψ attP位点更少。因此,将发生整合的位点数目越少,需要被筛选以鉴定具有最高水平的蛋白质表达的克隆越少。突变整合酶介导的整合被选为第二步骤,因为在供体载体整合后导致高水平蛋白质表达的第一整合位点一经鉴定,则需要尽可能有效地整合供体载体。因此,将使用突变
Figure A200780027691D004010
整合酶。已经发现
Figure A200780027691D004011
整合酶的突变体导致达75%的整合事件发生在整合的载体上含有的(例如靶载体上含有的)野生型att P位点上,而剩余25%发生在多个
Figure A200780027691D004012
 attP位点。估计人类细胞(例如293、D407和HepG2细胞(Chalberg等,2006))中有约370个(范围=202-764,95%置信区间)attP位点。整合最频繁发生的位点在不同细胞间可能不同,但是通常为可用作整合位点的位点总数的<5-10%。如果使用效率较低的整合酶,其对野生型attP位点(相对于拟attP位点)具有更低程度的选择性,则更多的整合将发生在整合的靶载体中
Figure A200780027691D00411
别Ψ attP位点而非所希望的野生型attP位点。
此外,靶载体还包括编码选择性标记潮霉素的核酸序列,用于选择具有基因组整合的靶载体的潮霉素抗性克隆。靶载体具有(例如无启动子的)嘌呤霉素编码区的第一部分和编码
Figure A200780027691D00412
 attP 103位点的核酸序列下游的SV40 polyA信号。供体载体一经整合,SV40启动子被导入嘌呤霉素基因的上游,从而重建完整的基因表达盒,其能够提供选择性标记的表达。因此,重建的嘌呤霉素选择性标记能用以有效选择供体载体上
Figure A200780027691D00413
 attB位点(例如
Figure A200780027691D00414
 attB 285 AAA位点)与靶载体上存在的
Figure A200780027691D00415
 attP位点(例如
Figure A200780027691D00416
attP 103位点)之间成功的重组事件。
相对于较强的启动子(例如CMV)和较弱的选择性药物(例如G418),选择了较弱的启动子(例如SV40)和更毒性的选择性药物(例如嘌呤霉素)以提供对希望的供体载体整合事件更强的选择。将供体载体整合入整合的靶载体的该步骤是本发明的关键步骤,其允许含有感兴趣基因的表达盒的供体载体的位点特异性整合。然而,可能的是,供体载体上多个启动子(无编码区)可能有效作用。此外,靶载体上存在的多个药物抗性基因编码区(无启动子)也可能有效作用。这里给出的使用SV40启动子和嘌呤霉素编码区的实施例不意味是排他性的。
以类似方式,相对弱启动子(单纯疱疹病毒胸苷激酶)用于驱动靶载体上药物抗性标记(潮霉素)的表达。已经有一些报道,共选择的标记表达越弱,可以导致连锁的感兴趣基因的表达越高。
靶载体的构建
为构建靶载体(pR1;图8),进行下述步骤。pR1载体的序列提供于图33A-33B。通过PCR从再水合的微小链霉菌(Streptomyces parvulus)细胞(ATCC 12434)扩增含有R4 attB位点的295bp片段(R4 attB 295),使用了引物5′-CGTGGGGACGCCGTACAG-3′(SEQ ID NO:01)和5′-CCCGGTCAACATCCAGTACACCT-3′(SEQ ID NO:02)(如Olivares等,2001所述),并克隆入pCR2.1-TOPO(Invitrogen)以制备pTA-R4attB。R4 attB 295通过EcoRI消化从pTA-R4attB分离。该片段用Klenow DNA聚合酶填补末端而成为平端,然后在也已用Klenow DNA聚合酶填补末端而成为平端的Hind III位点连接入pTK-Hyg(TaKaRa Clontech)以制备载体pTK-R4B。利用DNA测序来确认pTK-R4B具有正确的序列,以及R4 attB 295位点为图8所示方向,即R4 attB核心重组位点(由三角形窄端所示)的右侧与潮霉素抗性盒最接近。
进行了两个聚合酶链式反应以分别扩增
Figure A200780027691D00421
 attP 103和嘌呤霉素抗性编码区。然后使用第三个PCR将它们精确融合在一起。PCR条件是95℃变性1分钟,60℃退火15秒和72℃聚合45秒。反应使用产生平端PCR产物的校正酶(Pfu Ultra)进行。
含有已知编码功能性attP位点的序列的
Figure A200780027691D00422
 attP位点的103bp区(
Figure A200780027691D00423
 attP 103)从pTA-attP被扩增(如Olivares等,2001所描述),使用引物C31-attP-1(5′-AAAAAAGAATTCGTACTGACGGACACACCGAAGCCCCC-3′(SEQ ID NO:03)和C31-attP-2(5′-CACGGTAGGCTTGTACTCGGTCATGGTGGCGACCCTACGCCCCCAACTG-3′)(SEQ ID NO:04),生成186bp产物。引物C31-attP-2的5′端具有嘌呤霉素抗性ORF的5′端的24个碱基。
嘌呤霉素抗性编码区连同SV40的多腺苷酸化信号通过PCR从pPUR(TaKaRa Clontech)扩增,使用引物Puro1(5′-CAGTTGGGGGCGTAGGGTCGCCACCATGACCGAGTACAAGCCCACGGTG-3′)(SEQ ID NO:05)和SV40polyA(5′-AAAAAACCTTTCGTCTTCAGACATGATAAGATACATTGATGAGTTTGG-3′)(SEQ ID NO:06),生成1001bp产物。引物Purol的5′端具有 attP的3′端的24个碱基,而SV40polyA的3′端具有Bbs I限制酶识别位点。前10个循环的PCR条件是95℃变性1分钟、47℃退火30秒和72℃聚合75秒。下15个循环的PCR条件是95℃变性1分钟、60℃退火30秒和72℃聚合75秒。反应使用产生平端PCR产物的校正酶(Pfu Ultra)进行。
为了使含有
Figure A200780027691D00425
 attP 103的DNA与含有嘌呤霉素抗性编码区与SV40多腺苷酸化信号的DNA融合,那些单独PCR的产物以等摩尔比混合并使用引物C31-attP-1和SV40polyA通过PCR扩增以生成1138bp产物。PCR条件是95℃ 30秒变性、60℃ 20秒退火和72℃ 90秒聚合。反应使用产生平端PCR产物的校正酶(PfuUltra)进行。
含有
Figure A200780027691D00426
 attP 103、嘌呤霉素抗性开放读框和SV40多腺苷酸化信号的1138bp PCR产物用Bbs I消化并克隆入经Swa I和Bbs I消化的pTK-R4B。这生成了靶载体pR1。通过DNA测序确认
Figure A200780027691D00431
 attP 103、嘌呤霉素抗性开放读框和SV40多腺苷酸化信号在pR1中的序列和正确方向。
 attP 103-嘌呤霉素编码区融合物的设计的关键特征图示于图14。pTA-attP中存在的长221碱基对的
Figure A200780027691D0043174128QIETU
 attP 221位点具有位于嘌呤霉素编码区上游的ATG,其将在供体载体整合入靶载体后终止,以产生
Figure A200780027691D00433
 attL位点。通常,位于合理编码区上游的ATG序列(潜在的翻译起始位点)有害于基因表达。因此,在使
Figure A200780027691D00434
 attP 103与嘌呤霉素编码区融合的PCR产物中,ATG作为嘌呤霉素编码区的起始密码子。此外,ATG之前的2个碱基被改变以产生更加优化的共有翻译起始(Kozak)序列(GCCACC)。如图14所示,这些改变为至少18个碱基3′至最低限度但功能完整的
Figure A200780027691D00435
 attP位点,由Groth等,2000鉴定。因此,它们应该不影响供体载体中
Figure A200780027691D00436
 attB 285AAA位点整合入靶载体中
Figure A200780027691D00437
 attP 103位点的能力。在供体载体整合入靶载体之后,长88个碱基的
Figure A200780027691D00438
 attL位点(
Figure A200780027691D00439
 attL 88)位于5′未翻译区,刚好在嘌呤霉素编码区之前。之前的
Figure A200780027691D004310
 attL 88可以有衍生自SV40早期启动子5′未翻译区的57、62或74个碱基(由SV40早期启动子指导的转录开始于3个不同位点)。
供体载体
图2和10中提供了示例性供体表达载体的示意图。该示例性供体表达载体含有编码 attB 285 AAA位点的核酸序列和编码感兴趣基因的核酸表达盒,例如编码人抗体重链和轻链的盒。供体载体还含有位于编码
Figure A200780027691D004312
attB 285 AAA位点的核酸序列上游的SV40启动子。在供体载体整合入之前整合的靶载体时(由供体载体上存在的
Figure A200780027691D004313
 attB 285 AAA与靶载体中存在的
Figure A200780027691D004314
 attP 103之间的位点特异性重组所介导),SV40启动子将驱动嘌呤霉素基因的表达(图13)。因此,重建的嘌呤霉素抗性基因能用于选择在供体载体上整合了表达感兴趣蛋白质的基因的细胞克隆。
该选择步骤是获得高效方法的关键,因为供体载体上的
Figure A200780027691D004315
 attB 285AAA位点也可以整合入在估计370个染色体位置中发现的
Figure A200780027691D004316
 Ψ attP位点(Chalberg等,2006)。然而,整合入 Ψ attP位点的所有示例性供体表达载体将仅含有SV40启动子,并不会重建功能性嘌呤霉素抗性基因。当仅整合酶在attP靶载体克隆中表达时(即缺乏供体表达载体),也产生一些嘌呤霉素抗性细胞。不受理论束缚,其发生的机制可能涉及细胞启动子附近的ΨattB位点与靶载体中attP 103位点的重组。attP细胞系经选择性供体表达载体和第二整合酶表达载体的转染解决了该忧虑,因为没有表达载体的细胞不会对选择性供体表达载体上完整的选择性药物抗性基因具有抗性。此外,如果必要,希望的供体载体整合入染色体靶载体可以容易地与不希望的随机整合或供体载体整合入 Ψ attP位点相区分,如下文章节"细胞系鉴定方法"中描述的。
供体表达载体的构建
供体表达载体(pD1-DTX-1)基于Jones等,2003所描述的pcDNA3002neo。pcDNA3002neo基于pcDNA3(Invitrogen,Inc.)。pcDNA3002neo含有两个CMV启动子,随后是两个牛生长激素多腺苷酸化信号,用于在哺乳动物细胞中表达蛋白质。pcDNA3002neo还包括ColE1起点和氨苄青霉素抗性基因,用于在大肠杆菌中维持和选择。最终,pcDNA3002neo载体具有使用SV40启动子和SV40多腺苷酸化信号表达的G418抗性基因。图34A-34C中提供了pD1-DTX-1载体的序列。
为了构建pD1-DTX-1,六个插入片段被克隆入pcDNA3002neo,其含有:1)具有在长8个碱基对的识别序列内切割的三个限制酶的识别位点的多聚接头,2)
Figure A200780027691D00442
 attB 285 AAA区,3)介导蛋白质例如人抗体重链分泌并含有唯一限制位点的第一信号序列,4)介导蛋白质例如人抗体轻链分泌并含有另一个唯一限制位点的第二信号序列,5)第一蛋白例如特异性针对白喉毒素的人抗体的重链的编码区,和6)第二蛋白例如特异性针对白喉毒素的人抗体的轻链的编码区。
pcDNA3002neo在其CMV启动子之一后缺乏有用的多聚接头。因此,作为产生供体载体pD1的第一步,插入具有三个很少出现的限制位点的多聚接头。退火两个合成寡核苷酸(BamBst-A和BamBst-B)。BamBst-A的序列是:
5′-GATCCAAAAAATTAATTAAAAAAAACACCGGCGAAAAAAGCGATCGCAAAAAACCAGTGTG-3′(SEQ ID NO:07)。BamBst-B的序列是:5′-CTGGTTTTTTGCGATCGCTTTTTTCGCCGGTGTTTTTTTTAATTAATTTTTTG-3′(SEQ ID NO:08)。当BamBst-A和BamBst-B退火时,它们将在其5′和3’端分别含有Bam HI和Bst XI互补序列,以允许连接至Bam HI/Bst XI消化的pcDNA3002neo。该序列还包括(从5′至3′的顺序)Pac I、SgrA I和AsiS I的限制酶识别位点。6个腺苷的间隔序列隔开各个限制位点,以允许在两个相邻位点的有效消化(如果需要)。两个合成寡核苷酸按原样(即未磷酸化的)退火。pcDNA3002neo用Bam HI在37℃消化,然后用Bst XI在55℃消化。被消化的载体连接至退火的多聚接头,将连接产物转化入XL-10Gold(Stratagene)大肠杆菌细胞。所得载体称为pHPC-1。
供体载体pD1中关键的序列元件是
Figure A200780027691D00451
 attB 285 AAA位点。
Figure A200780027691D00452
 attB285 AAA位点通过PCR从Olivares等,2001所述载体pTA-attB扩增。5′引物称为C31attB5′并具有序列5′-GTCGACGAAATAGGTCACGGTCTC-3′(SEQ ID NO:09)。3′引物称为C31attB-3′并具有序列5′-TACGTCGACATGCCCGCCGTGACC-3′(SEQ ID NO:10)。PCR条件是在95℃变性1分钟,在60℃退火15秒以及在72℃延伸30秒,使用Pfu Ultra聚合酶(Stratagene)。其他反应组分的浓度与标准PCR相同(例如200μMdNTP,1μM每种引物,1.5mM MgCl2)。
5′引物将pTA-attB中
Figure A200780027691D00453
 attB位点5′端的ATG序列改变为AAA序列。其原因类似于上文对 attP 103位点所描述的原因,并图示于图14。pTA-attP中存在的
Figure A200780027691D00455
 attB 285位点的5’端具有位于嘌呤霉素编码区上游的ATG,其将在供体载体整合入靶载体时终止,以产生
Figure A200780027691D00456
 attL 88位点。通常,位于合理编码区上游的ATG序列(潜在的翻译起始位点)有害于基因表达。因此,
Figure A200780027691D00457
 attB的5’端的ATG变为AAA。已经发现,AUG的所有一个碱基变体起替代翻译起始密码子的作用。然而,还没有两个碱基变体已经显示起替代翻译起始密码子的作用。因此,为了防止
Figure A200780027691D00458
 attB的5′ATG用作翻译起始密码子,但同时向
Figure A200780027691D00459
 attB序列引入最小数目的变化,将ATG变为AAA。由于该ATG接近pTA-attB中含有的
Figure A200780027691D004510
 attB区的5’端,最方便的是将ATG至AAA的变化掺入用于PCR来自pTA-attB的
Figure A200780027691D004511
attB序列的引物中。
使用引物C31attB-5′和C31attB-3′通过PCR扩增pTA-attB得到称为
Figure A200780027691D004512
 attB 285 AAA的长285碱基对的产物。pHPC-1用Sma I和Bst Z17I消化生成1130bp和5718bp片段。
Figure A200780027691D004513
 286 AAA PCR产物连接至5718bp片段。这生成了称为pHPC-2的质粒。以使attB的左侧在SV40启动子之后的方向的具有
Figure A200780027691D004514
 attB 286 AAA序列的质粒被称为pHPC-2(+),而以相反方向的具有
Figure A200780027691D004515
 attB 286 AAA序列的质粒被称为pHPC-2(-)。
pHPC2(+)和pHPC-2(-)用作整合和表达编码不分泌的蛋白的基因的载体。但是,为了分泌蛋白质例如抗体、血友病因子(hemophilic factor)、生长因子、血清因子或可溶性受体,含有用于分泌的信号序列的供体载体将是希望的。因此,来自人类T细胞受体α链的信号序列(HAVT20;Boel等,JImmunol Methods.2000 May 26;239(1-2):153-66)被修饰为具有唯一的限制位点。具有唯一Pml I位点的一个形式插在pHPC2(+)的两个多聚接头之一,而另一个具有唯一PspX I位点的形式插在pHPC2(+)的另一个多聚接头。任一形式都没有改变HAVT20信号序列的氨基酸序列,并且变化也利用了频繁使用的人类密码子。Pml I和PspX I位点都刚好出现在信号序列切割位点之前。因此,HAVT20信号序列的切割位点和感兴趣蛋白质的编码区之间的精确融合容易通过设计适合的PCR引物来扩增感兴趣基因的编码区而实现。可选择地,可能切除HAVT20信号序列(例如在一个克隆位点使用BamH I/Pac I而在另一个克隆位点使用Asc I/Not I)并插入其他信号序列。这些序列可以是异源的(例如IL-2信号序列)或同源的(例如人类IgG1信号序列)。
为了将一个HAVT20信号序列插入pHPC-2(+),通过退火下述2个寡核苷酸产生了编码5’端Bam HI位点、优化的共有Kozak序列、具有Pml I位点的HAVT20信号序列和3′端Pac I位点的双链DNA:HAVT20-L-top(5′-CGCGCCACCATGGCATGCCCTGGCTTCCTGTGGGCACTTGTGATCTCCACCTGCCTCGAGTTTTCCATGGCTCG-3′)(SEQ ID NO:11)和HAVT20-L-bot(3′-GGTGGTACCGTACGGGACCGAAGGACACCCGTGAACACTAGAGGTGGACGGAGCTCAAAAGGTACCGAGC-5′)(SEQ IDNO:12)。该退火的盒与经Bam HI和Pac I消化的pHPC2(+)连接。得到的质粒称为pHPC-3。
为了将第二HAVT20信号序列插入pHPC-3,通过退火下述2个寡核苷酸产生了编码5’端Asc I位点、优化的共有Kozak序列、具有PspX I位点的HAVT20信号序列和3′平端的双链DNA:HAVT20-H-top(5′-GATCCGCCACCATGGCATGCCCTGGCTTCCTGTGGGCACTTGTGATCTCCACGTGTCTTGAATTTTCCATGGCTTTAAT-3′)(SEQ ID NO:13)和HAVT20-H-bot(3′-GCGGTGGTACCGTACGGGACCGAAGGACACCCGTGAACACTAGAGGTGCACAGAACTTAAAAGGTACCGAAAT-5′)(SEQ IDNO:14)。该退火的盒与经Asc I和Eco RV消化的pHPC3连接。得到的质粒是供体表达载体骨架,除了其他用途外其可以用于容易地交换各种基因表达元件例如启动子。这种供体表达载体骨架称为pHPC-4(图9)。
为了分离人类IgG基因,分泌结合白喉毒素的抗体的EBV-转化的人类B-细胞系如Traggiai等,2004所述衍生。一种具有高亲合力的抗体被分成亚型并发现具有人类IgG1重链和κ轻链。从生成该抗体的细胞制备RNA并用于RT-PCR反应以产生编码重链和轻链抗体基因的cDNA。用于扩增的引物类似于Marks等.(Transplantation,1991Aug;52(2):340-5),Sblattero等.(Immunotechnology,1998Jan;3(4):271-8)和Yamanaka等.(J Biochem(Tokyo),1995Jun;117(6):1218-27)描述的那些,除了末端具有适当的允许亚克隆的限制位点。轻链cDNA被克隆入pBK-CMV(Stratagene)的Not I/Xba I位点,以产生pBK-CMV-DTX-L。重链cDNA被克隆入pBK-CMV-DTX-L的HindIII/Sal I位点以产生pABMC103。cDNA被测序并确认了其作为人类IgG1κ的特征。
为了将抗白喉毒素抗体基因亚克隆入pHPC-4,完整的重链基因通过PCR扩增,使用引物5′-AAAAAACACGTGTCTTGAATTTTCCATGGCTGAAGTGCAGCTGGTGGAGTCTGGG-3′(SEQ ID NO:15)和5′-AAAAAATTAATTAATTATTTACCCGGAGACAGGGAGAG-3′(SEQ ID NO:16),使用pABMC103作为模板。得到的重链PCR产物用BbrP I(Pml I的同切点酶)和Pac I消化并克隆入用BbrP I和Pac I消化的pHPC-4以产生pHPC4-DTX-H。完整的轻链基因用如下引物扩增:5′-AAAACCTCGAGTTTTCCATGGCTGAAACGACACTCACGCAGTCTCCAG3′(SEQ ID NO:17)和5′-AAAAAAGCGGCCGCTTAACACTCTCCCCTGTTGAAGCTCTTTG-3′(SEQ ID NO:18),使用pABMC103作为模板。得到的轻链PCR产物用PspXI和Not I消化并克隆入用PspX I和Not I消化的pHPC4-DTX-H以产生pD1-DTX-1。证实了两条链的抗体链基因序列。
pHPC-2、pHPC-4和pD1-DTX-1可以是亚克隆载体和表达载体。尽管两个CMV启动子、HAVT20信号序列和牛生长激素多腺苷酸化信号中每一个序列是几乎相同的,但是它们被序列不同的多聚接头隔开。因此,已经设计了能够测序插入每个表达盒的基因的特异性测序引物。例如,引物5′-GCTTGGTACCGAGCTCGGATCC-3’(SEQ ID NO:19)可用于测序一个信号序列的Pml I位点之后插入的抗体可变区,而引物5′-GAAGCTTGGTACCGGTGAATTCGG-3′(SEQ ID NO:20)可用于测序在另一个信号序列的PspX I位点之后插入的抗体可变区。因此,不需要在将感兴趣基因克隆入用于表达的pHPC-2、pHPC-4或pD1-DTX-1之前将它们克隆入其他用于测序的载体。
此外,pHPC-4或pD1-DTX-1中的每一个元件侧翼都有唯一的限制位点,以便任何元件(例如启动子、信号序列、可变抗体链、恒定抗体链、编码区、多腺苷酸化位点、
Figure A200780027691D00481
 attB位点)可以容易地被切除并用其他类似元件替换。
例如,重链可变区可以通过用Pml I/Xho I消化pD1-DTX-1并用其他重链可变区替代抗白喉毒素抗体重链可变区来交换。轻链可变区可以通过用PspX I/BsiW I消化pD1-DTX-1并用其他轻链可变区替代抗白喉毒素抗体轻链可变区来交换。
类似地,IgG1重链恒定区可以通过交换Apa I/Pac I限制片段来交换来自其他抗体亚型(例如IgG2、IgG3、IgG4)或其他免疫球蛋白类别(例如IgA1、IgA2、IgD、IgE或IgM)的那些重链恒定区。pD1-DTX1中的κ轻链恒定区可以通过交换BsiW I/Not I限制片段来交换λκ轻链恒定区。
一个CMV启动子可以通过交换Mfe I/BamH I限制片段而被其它启动子替换,另一CMV启动子可以通过交换BstZ17 I/Asc I限制片段而被替换。一个HAVT20信号序列可以通过交换BamH I/Pml I限制片段而被替换,而另一个可以通过交换Asc I/PspX I限制片段而被替换。一个牛生长激素多腺苷酸化信号可以通过交换AsiS I/NgoM IV限制片段而被替换,而另一个可以通过交换Cla I/Pci I限制片段而被替换。
Figure A200780027691D00482
 attB位点可以通过交换StuI/BstZ17 I限制片段被由另一个位点特异性丝氨酸整合酶识别的attB位点替换。
靶-DHFR载体的构建
靶-DHFR载体(pR1-DHFR)通过将小鼠DHFR表达盒克隆入靶载体pR1而构建,所述DHFR表达盒由SV40启动子、小鼠DHFR编码区、小鼠DHFR cDNA的3′UTR和莫洛尼鼠白血病毒(MLV)多腺苷酸化信号组成。pR1-DHFR载体的序列示于图35A-35C。
来自pSV2dhfr(美国典型培养物保藏中心)的含有SV40启动子、小鼠DHFR编码区和小鼠DHFR cDNA的3′UTR的部分的1074个碱基对DNA片段使用如下引物通过PCR扩增:5′-CGAATCAGCACGGGGTGGCGCGCCCTGTGGAATGTGTGTCAGTTAGG-3′(SEQ ID NO:21)和5′-CGAATCAGCACGAAGTGCACCGGTGTTTAAACTTAATTAAAGATCTAAAGCCAGCAAAAGTCCCATGGT-3′(SEQ ID NO:22)。用于PCR的条件是95℃ 30秒、60℃ 30秒、72℃ 90秒10个循环,然后95℃ 30秒和72℃ 90秒15个循环,使用Pfu聚合酶。然后,PCR产物被克隆入pCR-Blunt II-TOPO(Invitrogen),然后用Dra III消化,分离1050个碱基对的片段并凝胶纯化。pR1用Van91I(Pf1M I的同切点酶)消化并使用Qiagen PCR cleanup试剂盒纯化。Dra III片段与Van91 I切割的pR1连接以产生pR1-dHFR(noltr)。
含有多腺苷酸化信号的长594bp的MLV长末端重复序列通过PCR从pLNXH(TaKaRa Clontech)扩增,使用引物5′-AAAAAATTAATTAAAATGAAAGACCCCACCTGTAGGTTTGG-3’(SEQ ID NO:23)和5′-AAAAAACACCGGTGAAAGTTTAAACAAACCTGCAGGAATGAAAGACCCCCGCTGACGGGTAG-3′(SEQ ID NO:24)。使用的PCR条件包括95℃ 30秒、56℃ 30秒和72℃ 45秒持续15个循环,使用Pfu聚合酶。然后将平端PCR产物克隆入pCR-Blunt II-TOPO以产生pCR-pLTR。MLV LTR使用EcoRI从pCR-pLTR切出,用Klenow钝化末端,然后凝胶纯化。pR1-dHFR(noltr)用PmeI消化并用CIP处理。含有MLV polyA信号的MLV LTR片段与PmeI-消化的载体连接以产生pR1-DHFR。插入片段的方向和正确序列通过限制酶消化和DNA测序来确认。
供体-DHFR表达载体的构建
供体-DHFR表达载体(pD1-DHFR)可以通过将小鼠DHFR表达盒克隆入供体表达载体pD1-DTX-1而构建,小鼠DHFR表达盒由SV40启动子、小鼠DHFR编码区、小鼠DHFR cDNA的3′UTR以及莫洛尼鼠白血病毒(MLV)多腺苷酸化信号组成。该1626个碱基对的表达盒使用Pfu聚合酶通过PCR从靶-DHFR载体pR1-DHFR扩增,使用了引物DHFR-1(5′-TTTTTTGAAGACGAAAGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGA-3′)(SEQIDNO:25)和LTR-2(5′-AAAAAACCTGCAGGAATGAAAGACCCCCGCTGACGGGTAG-3’)(SEQ ID NO:26),并作为平端片段以图6所示方向克隆入pD1-DTX-1的BstZ17I位点。
IRES-供体载体的构建
IRES-供体载体(pD1-IRES,图17)可以通过将两个拷贝的相同IRES(还称为翻译增强元件(TEE))克隆入pD1-DTX-1的唯一BamHI或Asc I位点而构建。可以选择几个IRES,如来自小鼠Gtx同源结构域基因(Chappell等,2000)的天然Gtx IRES,小鼠Rbm3 mRNA(Chappell等,2003)中的天然IRES,或者以基于FACS的富集方案(Owens等,2001)选择的合成IRES例如ICS1-23b或ICS2-17.2。一些IRES的多聚形式通常比单体形式增强翻译好几倍。IRES、甚至多聚体的序列是短的,并且容易通过构建编码它们的合成寡核苷酸而插入pD1-样载体。
多聚ICS1-23b IRES通过退火2个合成寡核苷酸而组装。一对由序列5′-GATCCAGCGGAAACGAGCGAAAAAAAAACAGCGGAAACGAGCGAAAAAAAAACAGCGGAAACGAGCGAAAAAAAACAGCGGAAACGAGCGAAAAAAAAACAGCGGAAACGAGCGGACTCACAACCCCAGAAACAGACATG-3′(SEQ ID NO:27)和5′-GATCCATGTCTGTTTCTGGGGTTGTGAGTCCGCTCGTTTCCGCTGTTTTTTTTTCGCTCGTTTCCGCTGTTTTTTTTTCGCTCGTTTCCGCTGTTTTTTTTTCGCTCGTTTCCGCTGTTTTTTTTTCGCTCGTTTCCGCTG-3’(SEQ ID NO:28)组成,其具有与BamH I限制位点互补的末端,而另一对由序列5′-CGCGCCAGCGGAAACGAGCGAAAAAAAAACAGCGGAAACGAGCGAAAAAAAAACAGCGGAAACGAGCGAAAAAAAAACAGCGGAAACGAGCGAAAAAAAAACAGCGGAAACGAGCGGACTCACAACCCCAGAAACAGACATGG-3′(SEQ ID NO:29)和5′-CGCGCCATGTCTGTTTCTGGGGTTGTGAGTCCGCTCGTTTCCGCTGTTTTTTTTTCGCTCGTTTCCGCTGTTTTTTTTTCGCTCGTTTCCGCTGTTTTTTTTTCGCTCGTTTCCGCTGTTTTTTTTTCGCTCGTTTCCGCTGG-3’(SEQ IDNO:30)组成,其具有与Asc I限制位点互补的末端。这些序列含有5个拷贝的长15个碱基的ICS1-23b IRES。每一个被4个拷贝的长9个碱基的polyA间隔序列隔开。最后,3′端含有25个碱基的序列,其刚好在小鼠β-珠蛋白编码区(例如GenBank登录号J00413)之前。这些退火的寡核苷酸被克隆入pD1-DTX-1的BamH I和Asc I位点以产生IRES-供体载体pD1-IRES。测序克隆以鉴定具有正确方向和序列的克隆。
可调控靶载体的构建
当一些蛋白质以使它们可商业利用所必要的水平表达时,他们可以是毒性的并导致缓慢的细胞生长或甚至细胞死亡。因此,抑制它们的表达是有用的,直至有必要生成大量时。一些用于调控基因的方法是可用的。在一些实施方案中,希望在蛋白质表达盒被导入细胞之前首先将调控基因的系统导入细胞。以这种方式,基因调控系统被建立,并将在表达载体被导入之前抑制基因表达。因此,可能希望具有对靶载体pR1而非供体载体的基因调控系统。
RheoSwitch系统(New England Biolabs)提供了对宽表达范围的基因调控。RheoSwitch系统的基因调控由两个蛋白介导。RheoReceptor由与昆虫雌激素核受体的配体结合结构域融合的酵母GAL4蛋白组成。RheoReceptor结合衍生自酵母GAL4基因的上游活化序列(UAS),所述活化序列位于TATA框的上游。RheoActivator由与单纯疱疹病毒VP16转录活化结构域融合的杂合昆虫/哺乳动物RXR配体结合受体组成。蜕皮激素类似物可以二聚体化RheoReceptor和RheoActivator,当此发生时,正确连接至GAL4UASDNA结合元件的基因将被活化。而且,当缺乏二聚体时,RheoReceptor结合UAS序列并介导基因表达的抑制。最终结果是使用该系统的表达基础水平非常低,能够实现的诱导水平高。
编码RheoSwitch系统的两个蛋白质组分(RheoReceptor和RheoActivator)的基因盒可以通过PCR从pNEBR-R1(New England Biolabs)扩增。它们以图18所示方向克隆,以便RheoReceptor和RheoActivator的编码区方向与嘌呤霉素编码区方向相同。这种构型不同于pNEBR-R1中的构型(其中它们方向相反),并且这是为什么RheoReceptor和RheoActivator基因盒被单独克隆入pR1的原因。
更具体说,由序列5′-AAAAAAACCCTGCAGGGGCCTCCGCGCCGGGTTTTGGCGCCT-3′(SEQ ID NO:31)和5′-AAAAAAAACACCGGTGCTTATCGGATTTTACCACATTTG-3’(SEQ ID NO:32)组成的PCR引物被用于扩增RheoActivator基因表达盒(其由泛素C(UbC)启动子、RheoActivator编码区和SV40晚期区多腺苷酸化信号序列组成)。长2481碱基对的产物用Sbf I和SgrA I消化并克隆入pR1-PL1的唯一SbfI/SgrA I位点以产生pR1-RA。
由序列5′-AAAAAAAACACCGGTGCCGATATCGGGTGCCACGCCGTCCCG-3’(SEQ ID NO:33)和5′-AAAAAAAAGCCCGGGCGGCGGCCCGCCAGAAATCC-3’(SEQ ID NO:34)组成的PCR引物被用于扩增RheoReceptor基因表达盒(其由泛素B(UbB)启动子、RheoReceptor编码区和TK多腺苷酸化信号序列组成)。长3680碱基对的产物用SgrA I和Srf I消化并克隆入pR1-RA的唯一SgrA I/SrfI位点以产生pR1reg。
可调控靶-DHFR载体的构建
为了构建可调控供体载体中的基因并进行基因扩增的靶载体,构建了调控型靶-DHFR载体(图19)。来自pR1reg的基因调控盒由RheoActivator和RheoReceptor基因组成,其通过PCR从pR1reg扩增,使用了引物5′-AAAAAAACCCTGCAGGGGCCTCCGCGCCGGGTTTTGGCGCCT-3’(SEQ IDNO:35)和5′-AAAAAAAAGCCCGGGCGGCGGCCCGCCAGAAATCC-3’(SEQ ID NO:36),用SbfI和SfrI消化并克隆入pR1-DHFR的SbfI和SfrI位点以构建调控型靶-DHFR载体pR1reg-DHFR。
可调控供体表达载体骨架的构建
可调控供体表达载体骨架(图20)具有由克隆在感兴趣蛋白质的编码区上游的pR1reg编码的基因调控系统的蛋白质组分(例如RheoReceptor)识别的DNA序列。在RheoSwitch系统的情况下,RheoReceptor结合的DNA元件是GAL4上游活化序列(UAS)。依如下顺序编码限制位点(BstZ17 I的3′部分、EcoR I)、SV40多腺苷酸化信号区(防止隐性(cryptic)转录入调控区)、5个GAL4UAS元件和TATA框的长722碱基对的DNA序列可以通过PCR从pNEBR-XIHygro(New England Biolabs)扩增,使用了引物5′-TACGAATTCATCAGCCATATCACATTTGTAGAG-3’(SEQ ID NO:37)和5′-TTATATACCCTCTAGAGTCTCCGCTCGGA-3′(SEQ ID NO:38)。
编码两种形式的、在3′端具有不同限制酶位点的CMV早期启动子5′未翻译区(5′UTR)的两个长173或178碱基对的DNA序列通过退火两组重叠寡核苷酸并使用Klenow DNA聚合酶填补其3’端而产生。长173碱基的形式是通过退火5′-CCGAGCGGAGACTCTAGAGGGTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGAC-3′(SEQ ID NO:39)和5′-AAAAAAGGATCCGAGCTCGGTACCAAGCTTCCAATGCACCGTTCCCGGCCGCGGAGGCTGGATCGGTCCCGGTGTCTTCTATGGAGGTCAAAA-3’(SEQ ID NO:40)并用Klenow聚合酶填充而产生的。长178碱基的形式是通过退火5′-CCGAGCGGAGACTCTAGAGGGTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGAC-3′(SEQ ID NO:41)和5′-AAAAAAGGCGCGCCGAATTCACCGGTACCAAGCTTCCAATGCACCGTTCCCGGCCGCGGAGGCTGGATCGGTCCCGGTGTCTTCTATGGAGGTCAAAA-3′(SEQ ID NO:42)并用Klenow聚合酶填充而产生的。然后,它们分别与722碱基对的PCR产物(含有SV40 polyA信号、五个GAL4 UAS和TATA框)混合,并用下述两组PCR引物进行PCR扩增:5′-TACGAATTCATCAGCCATATCACATTTGTAGAG-3’(SEQ IDNO:43)和5′-AAAAAAGGATCCGAGCTCGGTACCAAGCTTCCAATGCACCGTTCCCGGCCGCGGAGGCTGGATCGGTCCCGGTGTCTTCTATGGAGGTCAAAA-3’(SEQ ID NO:44),或者5′-TACGAATTCATCAGCCATATCACATTTGTAGAG-3’(SEQ ID NO:45)和5′-AAAAAAGGCGCGCCGAATTCACCGGTACCAAGCTTCCAATGCACCGTTCCCGGCCGCGGAGGCTGGATCGGTCCCGGTGTCTTCTATGGAGGTCAAAA-3′(SEQ ID NO:46)。
以该方式,组装了两个包含SV40多腺苷酸化信号区(以防止隐性转录入调控区)、五个GAL4 UAS元件、TATA框和来自CMV早期启动子的5′UTR的盒。一个盒经EcoR I和BamH I消化并克隆入pHPC-4的Mfe I/BamHI位点以产生pHPC-4reg。另一个经Asc I消化并克隆入pHPC-4reg的BstZ17I/Asc I位点以产生pD1reg。这些克隆步骤去除了pHpC-4中的可以干扰调控表达的两个组成型CMV启动子。如上所述,各种感兴趣基因可以插入pD1reg的多聚接头区,以便它们能够整合入靶载体,并且它们的表达能够被调控。
对于使用不含基因调控系统(例如pD1、pD1-DHFR、pD1-IRES)的某些组分的供体载体形式而保持可能的高水平基因表达而言可能重要的有两个关于pD1reg构建的特征。第一,来自基因调控系统的TATA框与来自pD1的CMV启动子的TATA框精确融合。第二,CMV启动子的5′UTR被重建。最终结果是TATA框与pD1reg的翻译起始密码子(即转录起始位点和5′UTR)之间的序列与在pD1中的相同。但是,pD1reg中TATA框之前的序列由获得由基因调控系统的蛋白质组分介导的基因调控所需的那些DNA序列组成,所述蛋白质组分由pR1reg编码。
选择性供体表达载体的构建
选择性供体表达载体(图21)类似于供体表达载体,除了其还包括完整的药物抗性基因,其不同于无启动子的第一选择性标记基因和靶载体上的第二功能性选择性标记基因。作为例子,描述了具有完整G418抗性基因的选择性供体表达载体(pD1-DTX1-G418,图21)的构建。pD1-DTX1-G418载体的序列提供于图36A-36D。
选择性供体表达载体pD1-DTX1-G418通过扩增来自pcDNA3002neo(Crucell)的完整功能性G418药物抗性盒而构建,使用聚合酶链式反应和引物5′-GAGAGAGGATCCACGCGTCTGTGGAATGTGTGTCAGTTAGGG-3’(SEQ ID NO:47)和5′-GAGAGAGAATTCTCTAGACAGACATGATAAGATACATTGATGAGTTTG-3′(SEQ ID NO:48)。所得到的PCR产物含有SV40启动子、G418抗性基因和SV40多腺苷酸化信号。PCR产物用限制酶BamH I和EcoR I消化并连接入已经Bgl II和Mfe I消化的供体表达载体pD1-DTX-1。连接产物经Bgl II和Mfe I(其通过插入片段的连接而被破坏)消化以减少仅载体骨架的连接并转化入XL-10Gold超感受态大肠杆菌细胞(Stratagene)。在希望的方向上具有插入片段的克隆通过PCR和限制酶消化来鉴定。完整的G418抗性基因的正确DNA序列通过测序证实。
报道供体表达载体的构建
报道供体表达载体(图30)类似于供体表达载体,除了其还包括报道基因,其可以通过例如荧光显微术或荧光活化细胞分选器在单个细胞中检测。大体上,报道供体表达载体上的报道基因的表达水平与相同报道供体表达载体上的感兴趣蛋白质的表达水平相关。因此,当靶载体克隆用报道供体表达载体转染后,导致感兴趣蛋白质高水平表达的靶载体克隆能够任选地通过鉴定高水平表达报道基因的克隆而被鉴定。通过使用高通量仪器例如荧光活化细胞分选器,可以根据表达来筛选比人工克隆挑选方法筛选更多数量的靶载体克隆(即整合位点)。
在这样的任选方案中,将产生大量的靶载体克隆池。例如细胞将被靶载体和第一整合酶表达载体转染。稳定的集落将被选择(例如通过对潮霉素的抗性)。例如可以产生每个平板具有100个集落的多如100个平板(即10000个靶载体克隆)。然后将每个靶载体克隆池单独用报道供体表达载体和第二整合酶表达载体转染。报道供体表达载体稳定整合入的靶载体被选择(例如通过对嘌呤霉素的抗性)。每个单个的报道供体载体克隆池使用荧光活化细胞分选器分选,并从每个池收集具有最高报道基因表达的单细胞。然后证实感兴趣蛋白质的高水平表达。然后使用质粒拯救或PCR技术确定具有最高报道基因表达的细胞中靶载体的整合位点。靶载体特异性PCR引物被设计为特异性针对靶载体整合位点。于是,提供最高水平表达的靶载体克隆池是克隆的单细胞,并且靶载体特异性PCR引物用于鉴定哪些单个靶载体克隆在经报道供体表达载体和第二整合酶表达载体转染后产生最高水平的表达。通过分离小量的导致最高水平蛋白质表达的靶载体克隆,其他供体表达载体可以被转染入所鉴定的克隆以表达多种其他蛋白,而不用每次进行大规模的表达筛选。
除了上述任选用于高通量筛选整合位点,报道供体表达载体提供了通过使用荧光显微镜检验转染细胞而实时监测时程、频率和报道供体载体整合稳定性的简单快速方法。作为例子,描述了具有绿色荧光蛋白基因的报道供体表达载体(pD3-DTX1,图30)的构建。
报道供体表达载体pD3-DTX1通过首先从质粒pLXRN(Clontech)扩增劳斯肉瘤病毒启动子(pRSV)而构建,使用聚合酶链式反应和引物5′-TTTTCACTGCATTCGACAATTGTCATCCCCTCAGGATATAGTAGTTTC-3′(SEQID NO:49)和5′-GACCAGCACGTTGCCCAGGAGTTGGAGGTGCACACCAATGTGGTG-3’(SEQ ID NO:50)。含有人源化海肾(Renilla reniforms)绿色荧光蛋白(hrGFP)编码区和人生长激素(hGH)基因多腺苷酸化信号的DNA通过PCR从pAAV hrGFP(Stratagene)扩增,使用引物5′-CACCACATTGGTGTGCACCTCCAACTCCTGGGCAACGTGCTGGTC-3′(SEQ ID NO:51)和5′-GAGAGAGCTAGCATTTAAATAAGGACAGGGAAGGGAGCAGTGG-3’(SEQ ID NO:52)。混合2种PCR产物并用引物5′-TTTTCACTGCATTCGACAATTGTCATCCCCTCAGGATATAGTAGTTTC-3′(SEQ ID NO:53)和5′-GAGAGAGCTAGCATTTAAATAAGGACAGGGAAGGGAGCAGTGG-3’(SEQ ID NO:54)扩增以将劳斯肉瘤病毒启动子融合至hrGFP编码区和hGH基因多腺苷酸化信号。得到的平端PCR产物被连接入供体表达载体pD1-DTX1的平Psi I位点。具有插入片段的克隆通过PCR鉴定,使用引物5′-TTTTCACTGCATTCGACAATTGTCATCCCCTCAGGATATAGTAGTTTC-3′(SEQ ID NO:53)和5′-GAGAGAGCTAGCATTTAAATAAGGACAGGGAAGGGAGCAGTGG-3’(SEQ ID NO:54),通过限制酶消化确定插入片段的方向。证实了整个pRSV-hrGFP-hGH polyA插入片段的正确DNA序列。pD3-DTX1载体的序列提供于图37A-37D。
载体测试
测试了单个靶载体、供体表达载体和整合酶表达载体的功能。例如,靶载体转染入DG44细胞或PER.C6TM细胞能够赋予潮霉素抗性。当R4整合酶表达载体或
Figure A200780027691D00561
整合酶表达载体经靶载体转染时,与仅靶载体转染相比较得到约5倍多的潮霉素抗性集落,表明任一种整合酶的表达都可以导致增加数目的稳定克隆。仅供体表达载体的瞬时转染导致在DG44细胞中生成300ng/ml抗体和在PER.C6TM中生成1μg/ml抗体(图31)。
要说明的另一个重要功能是靶载体中
Figure A200780027691D00562
 attP位点与供体表达载体中
Figure A200780027691D00563
 attB位点重组的能力。这是非常正确的,因为靶载体和供体载体中的att位点被突变或截断以满足本文描述的表达系统的要求。在存在或缺乏4000ng 整合酶表达载体(pCS-M3J)下,使用Lipofectamine 2000CD在10cm板上的DG44细胞(3e6)经500ng靶载体(pR1)和500ng供体表达载体(pD1-DTX-1)转染。转染后48小时,细胞经胰蛋白酶作用并使用QIAprepSpin Miniprep试剂盒(QIAGEN)分离质粒DNA。DNA使用PCR引物5′-TGCCCCGGGGCTTCACGTTTTCC-3’(SEQ ID NO:55)(来自
Figure A200780027691D00565
 att P)和5′-GCCCGCCGTGACCGTCGAGAAC-3′(SEQ ID NO:56)(来自
Figure A200780027691D00566
 att B),然后使用引物5′-CAGGTCAGAAGCGGTTTTCGGGAG-3’(SEQ ID NO:57)(来自
Figure A200780027691D00567
 att P)和5′-CCGCTGACGCTGCCCCGCGTATC-3′(SEQ IDNO:58)(来自
Figure A200780027691D00568
 att B)来扩增,所有引物都被设计为特异性扩增能够仅从靶载体中
Figure A200780027691D00569
 attP位点与供体表达载体中
Figure A200780027691D00569
 attB位点的
Figure A200780027691D005611
整合酶介导的重组产生的attR产物。作为阳性对照,各500ng含有更长的野生型
Figure A200780027691D005612
 att位点序列的质粒pTA-attB和pTA-attP在存在或缺乏4000ng 整合酶载体(pCS-M3J)下转染。pTA-attB和pTA-attP分别具有来自
Figure A200780027691D005614
 attB位点和
Figure A200780027691D005615
 attP位点的285和221个碱基对长的区域。作为阴性对照,使用未转染的细胞。如图22所示,pR1和pD1-DTX-1可以仅在
Figure A200780027691D005616
整合酶存在下重组产生attR位点。
在产生大量单独稳定细胞系之前,如图11所示,通过转染和选择PER.C6TM或DG44细胞而即刻测试靶载体、供体载体和两个整合酶表达载体的功能。该实验仅在开发方法学过程中或者按需要(例如如果构建靶、供体或整合酶质粒的变体)进行一次。随后,仅编码其他感兴趣蛋白质的供体表达载体被瞬时转染以测试感兴趣蛋白质的表达并确认能够表达的供体载体。
靶载体pR1与表达R4整合酶的质粒(pCMV-sre)通过脂质转染使用Lipofectamine 2000CD(Invitrogen)根据生产商说明共转染入PER.C6TM或DG44细胞。然后细胞培养48小时以允许R4整合酶蛋白表达,其介导了靶载体上存在的R4 attB 295位点与染色体中存在的拟R4 attP位点之间的位点特异性整合(图3和11)。然后在含有潮霉素的培养基(例如DMEM、10%胎牛血清、10mM MgCl2用于PER.C6TM,而F-12、5%胎牛血清、30μM胸苷用于DG44)中选择含有整合的靶载体的集落。分离单个的潮霉素抗性集落并筛选对嘌呤霉素的敏感性。
潮霉素抗性、嘌呤霉素敏感性的靶载体克隆再次用含有
Figure A200780027691D00571
 attB 285AAA位点和编码感兴趣蛋白质(例如特异性针对白喉毒素的人类抗体的重链和轻链)的表达盒的供体载体(例如pD1-DTX-1)以及编码改变的
Figure A200780027691D00572
整合酶的表达质粒(例如pCS-M3J)共转染。改变的
Figure A200780027691D00573
整合酶蛋白介导了供体载体上存在的
Figure A200780027691D00574
 attB 285 AAA位点与使用靶载体工程化入细胞系染色体的
Figure A200780027691D00575
 attP 103位点之间的位点特异性整合(图4和11)。
稳定的嘌呤霉素抗性细胞池分离如下。第二次转染后48小时,常规细胞生长培养基用含有嘌呤霉素(1μg/ml用于PER.C6TM,10μg/ml用于DG44)的细胞生长培养基替换。含有嘌呤霉素的培养基每2-3天更换一次持续7天(DG44细胞)或者14-21天(PER.C6TM细胞),或者直至生长集落的数目变得稳定。
此时所有集落经胰蛋白酶作用并收集。细胞再次铺板并允许附着24小时。嘌呤霉素抗性选择持续共计至少21天以允许未整合的表达载体被稀释。然后分析感兴趣蛋白质(例如编码抗体)的表达水平以确认整合酶表达载体以及靶载体和供体载体的功能。为了测试抗体表达,使用了针对人类IgG的特异性分析(例如Easy Titer IgG分析,Pierce,Inc.)。
靶载体可以不整合在除了R4拟attP位点以外的位置或可以随机整合在除了R4拟attP位点以外的位置。即使在这些情况下,供体载体依然能够整合入靶载体以重建完整的嘌呤霉素抗性基因。预期从这些事件产生的嘌呤霉素集落的数目远低于供体载体整合入靶载体(其又使用R4整合酶被位点特异性整合)而产生的数目。这是因为未整合的载体将在漫长的选择过程中丢失。靶载体的随机整合发生频率比由R4整合酶介导的位点特异性整合低得多。为进一步证明该实验中测量的蛋白质表达水平主要是靶载体的初始位点特异性整合的结果,进行了对照实验,其中省略了R4整合酶表达载体。
希望进行嘌呤霉素抗性选择步骤以保证其起作用,因为该步骤是位点特异性地整合供体表达载体的关键。供体载体上
Figure A200780027691D00581
 attB位点整合入靶载体上
Figure A200780027691D00582
 attP位点导致产生
Figure A200780027691D00583
 attL位点,其在该特定实施例中是88个碱基长。该附加序列将存在于编码嘌呤霉素抗性的mRNA的5′未翻译区。因为该附加序列对转录、mRNA稳定性、翻译和因此最终对可能达到的嘌呤霉素抗性水平的影响无法仅从核酸序列预测,所以载体应该如上所述进行测试以确保重建的嘌呤霉素抗性盒行使功能的程度允许有效选择其中供体载体已整合入受体载体的细胞。
实施例2
蛋白质表达细胞系的构建
按照下述方案构建蛋白质表达细胞系。CHO/dhfr细胞(例如DG44细胞和PER.C6TM细胞)使用Lipofectamine 2000CD在10cm板上转染如下:
1.第一次转染使用每10cm板500ng靶载体pR1-DHFR和5000ng R4整合酶质粒pCMV-sre进行(图11)。
2.细胞在常规培养基(Ham′s F-12,5%胎牛血清,30μM胸苷)中培养48小时。
3.然后细胞经胰蛋白酶作用并涂板于96孔板的选择性培养基中,所述选择性培养基是含有400μg/ml潮霉素B的常规培养基。在这些条件下,五个96孔板的每一个上生长约30个单细胞克隆。
4.转染后大约7-8天,当集落第一次肉眼可见时,个体克隆经胰蛋白酶作用并转移至最小数目的96孔板。总共选择了165个克隆并合并在两个96孔板上。
5.所选择的集落被扩增在三次重复的96孔板组上。一组用于维持。一组用于冷冻和保存在液氮蒸气相中。第三组用于第二次转染。
6.一组CHO集落被扩增至24孔板并用15ng pD1-DTX1-G418(选择性供体表达载体)和150ng pCS-M3J(突变
Figure A200780027691D00591
整合酶质粒)共转染(图11)。
7.细胞在含有400μg/ml潮霉素B的常规培养基中培养48小时。
8.然后细胞在含有10μg/ml嘌呤霉素的选择性培养基中生长。7-21天的选择后,集落可变数目增加,取决于哪种亲本attP细胞系被转染。
9.然后集落经胰蛋白酶作用并收集。半数涂板于含有10μg/ml嘌呤霉素的培养基中,半数涂板于含有10μg/ml嘌呤霉素和400μg/ml G418的培养基中。
10.选择性培养基每2-3天更换,直至细胞铺满。生长在嘌呤霉素和G418中的克隆池扩增至6孔板,并测试IgG生产率(pg生成的IgG/细胞/天)。
11.在165个亲本DHFR-靶载体克隆中,132个是嘌呤霉素敏感的并用于第二次转染。其中96个生成嘌呤霉素抗性克隆并测试IgG生成。96个克隆中14个以可检测水平生成IgG。
12.具有最高表达水平(~8pg/细胞/天)的池(2G7-G)在对DHFR基因和选择性供体表达载体选择性的培养基(MEMα-,7%透析的胎牛血清,400μg/mlG418)中生长6天然后以1个细胞/孔涂板于两个96孔板上以分离克隆。
13.获得了共56个克隆,并检测了这些克隆的IgG生产率。结果示于图28A和28B。三个克隆被鉴定为具有被认为在高端的生产率平均水平(即>30pg/细胞/天)。
14.其中DHFR基因显示通过质粒拯救方法与抗体基因连锁的另一个池(2H9-G)进行DHFR基因扩增。细胞在对DHFR基因和选择性供体表达载体选择性的培养基(MEMα-,7%透析的胎牛血清,400μg/ml G418)中培养。然后DHFR基因通过将增加量的氨甲蝶呤添加至培养基而扩增。起始浓度是2nM,浓度通常约每10-14天增加2至3倍。
15.测量以不同浓度的氨甲蝶呤选择的2H9-G池的IgG生产率,结果示于图29。在200nM氨甲蝶呤下,观察到生产率明显增加至等于最高表达2G7-G克隆的水平。然而,虽然使用位点特异性整合来分离最高表达2G7-G克隆要用约1个月,但使用基因扩增来分离高表达2H9-G池要用约4个月。
第一次整合
为了产生用于整合蛋白质表达载体的特异性唯一位点并识别适合高水平重复性生成蛋白质的细胞系的基因组中的R4 Ψ attP位点,靶载体pR1或DHFR-靶载体pR1-DHFR整合在PER.C6TM和DG44细胞中大量不同的R4ΨattP位点。靶载体或DHFR-靶载体与R4整合酶表达载体pCMV-sre混合并通过脂质转染根据生产商说明而转染入PER.C6TM和DG44细胞。适合脂质转染的脂质体试剂包括Fugene 6(Roche Applied Science)、Lipofectamine2000 CD(Invitrogen)等等。细胞保温48小时以允许整合酶表达和pR1或pR1-DHFR整合入R4 Ψ attP位点。然后细胞常规生长培养基用含有100ug/ml(用于PER.C6TM细胞)或400μg/ml(用于DG44细胞)潮霉素B(Calbiochem)的选择性生长培养基替换。细胞生长培养基每2-3天更换一次,持续7-14天或直至看到最大数目的集落。挑选估计代表约50个不同R4 ΨattP位点的共100个集落并扩增用于第二次整合。该步骤中分离的每个细胞克隆称为PER.C6TM attP细胞系或DG 44 attP细胞系。
与整合的靶载体相邻的序列被确定为显示它们通过R4整合酶介导的机制被整合。为此,使用了包括下述步骤的"质粒拯救"方法。基因组DNA从靶载体克隆制备并用Afl III或Nsi I(New England Biolabs)消化。这些酶在复制起点附近切割靶载体,但不会在复制起点和Ψ R4 attL位点之间任何其他位点切割靶载体(参见图12)。最重要地,它们也不在复制起点和氨苄青霉素抗性基因内切割,这是大肠杆菌中成功质粒拯救所需要的。消化的DNA以低浓度(~10ng/ml)连接然后电穿孔进入TOP10细胞(Invitrogen)。从得到的集落分离小量制备(miniprep)的DNA并用相应于嘌呤霉素编码区反义链的引物测序,以便获得的序列从嘌呤霉素编码区延伸穿过
Figure A200780027691D00601
 attP位点,然后进入Ψ R4 attL位点。如图23所示,从两个靶载体克隆拯救的质粒含有达R4 att位点核心序列然后延伸入染色体DNA的序列。R4 att位点核心序列在每种情况下被缺失,如同当丝氨酸整合酶重组野生型att位点与Ψ att位点时通常发生的。
半随机PCR方法也可以用于测定靶载体与染色体DNA接合处的序列。例如DNA Walking SpeedUp试剂盒(Seegene)能够用于该目的。"靶特异性引物"将位于嘌呤霉素抗性基因中以分离含有R4 Ψ attL位点的序列或者位于HSK TK polyA区中以分离含有R4 Ψ attR位点的序列。
或者,可以使用"反向PCR"方法。在这些方法中,基因组DNA用不在感兴趣区域切割的限制酶消化。DNA连接形成环状DNA。然后连接的DNA通过聚合酶链式反应扩增,使用已知序列中的嵌套引物。引物方向与它们在正常PCR中的方向相反,以便扩增跨连接点的序列。
在第二次整合之前,根据嘌呤霉素敏感性筛选attP细胞系。嘌呤霉素抗性选择用于选择第二次整合步骤,并因此用于确保在第一次整合中获得的靶载体或DHFR-靶载体克隆是嘌呤霉素敏感性的。我们已经发现达约10%的靶载体或DHFR-靶载体克隆可以是嘌呤霉素敏感性的,取决于细胞系。因为整合效率约0.1-1%,如果嘌呤霉素抗性克隆被转染,则预计仅0.1-1%的细胞会表达感兴趣蛋白并且因为细胞已经是嘌呤霉素抗性的,不可能富集表达蛋白质的细胞。除了在第一次转染后筛选对嘌呤霉素敏感性的靶载体克隆外,防止该问题的另一种方法是在第二次转染中使用选择性供体表达载体。
第二次整合
为了测试在第一次整合中整合入靶载体的每个R4 Ψ attP位点高水平蛋白质表达的能力,进行了供体表达载体的第二次整合。编码抗白喉毒素抗体的供体载体(pD1-DTX-1)与
Figure A200780027691D00611
突变整合酶表达载体(pCS-M3J)混合并通过脂质转染根据生产商说明而转染入在第一次转染中产生的每个PER.C6TM attP或DG44 attP细胞系。适合脂质转染的脂质体试剂包括Fugene 6(Roche Applied Science)、Lipofectamine 2000 CD(Invitrogen)等等。细胞保温48小时以允许
Figure A200780027691D00612
突变整合酶表达和pD1-DTX-1整合入靶载体。然后,常规生长培养基用含有1μg/ml(用于PER.C6TM细胞)或10μg/ml(用于DG44细胞)嘌呤霉素(Calbiochem)的选择性生长培养基替换。含有嘌呤霉素的细胞生长培养基每2-3天更换一次,持续7-14天或直至看到最大数目的集落。每次转染产生的集落经胰蛋白酶作用、扩增、冷冻为液氮蒸气相保存。
靶载体和供体表达载体接合处周围的序列被测定以显示它们通过
Figure A200780027691D00613
整合酶介导的机制重组。为此使用了包括下述步骤的"质粒拯救"方法。基因组DNA从用供体和
Figure A200780027691D00614
突变整合酶表达载体转染的池制备。DNA用Tfi I(New England Biolabs)消化。该酶在重链抗体基因内切割表达载体并在复制起点附近切割靶载体,但不会在这些区域之间的任何其他位点对其进行切割(参见图13)。最重要地,Tfi I不在复制起点或氨苄青霉素抗性基因内切割,这是大肠杆菌中成功质粒拯救所需要的。消化的DNA以低浓度(~10ng/ml)连接,然后电穿孔进入TOP10细胞(Invitrogen)。从得到的集落分离小量制备的DNA并用相应于嘌呤霉素编码区反义链的引物测序,以便获得的序列从嘌呤霉素编码区(来自靶载体)延伸穿过
Figure A200780027691D00621
 attL88位点(重组的靶载体和供体载体之间的接合处),然后进入牛生长激素多腺苷酸化信号(来自供体载体)。如图24A和图25A所示,从DG44和PER.C6TM细胞拯救的质粒的序列如所预测的,整合酶正确整合供体表达载体入靶载体。
Figure A200780027691D00623
 attR位点周围的序列以类似方式测定,并发现精确如所预测的(图24B和图25B)。
还开发了基于PCR的方法以实现克隆或克隆池中可能存在的整合类型的快速测定。就供体表达载体整合而言,三个类型的整合是可能的:随机、靶载体或Ψ att位点。为检测随机整合,设计了特异性针对供体表达载体中
Figure A200780027691D00624
 attB位点的PCR引物。在大多数随机整合情况中,小(285碱基对)attB位点将是完整的,而如果供体载体整合入靶载体或者Ψ att位点已经出现,则attB位点将被破坏。从其中供体载体已经被整合的6个克隆池制备基因组DNA。一微克DNA进行聚合酶链式反应,使用引物5′-CATCTCAATTAGTCAGCAACCATAGTC-3’(SEQ ID NO:59)和5′-AAGCTCTAGCTAGAGGTCGACGGTA-3′(SEQ ID NO:60)持续30个循环,然后1%的反应DNA进行聚合酶链式反应,使用引物5′-GTCGACGAAATAGGTCACGGTCTC-3’(SEQ ID NO:61)和5′-TACGTCGACATGCCCGCCGTGACC-3′(SEQ ID NO:62)再持续30个循环。PCR产物在4%琼脂糖凝胶上分离,结果示于图26A。供体表达载体随机整合的证据在两个池(2G7、2H10)中缺乏,但在四个池(2B11、2G11、2H9G、2H9P)中出现。
为了检测进入靶载体的整合的存在,含有杂合
Figure A200780027691D00625
 attR位点的区域通过PCR直接在细胞上扩增。使用了不同数目的胰蛋白酶作用的来自2H9G池的细胞。2H9G细胞池通过用供体表达载体(pD1-DTX1-G418)和突变整合酶载体(pCS-M3J)转染DG44靶载体(pR1-DHFR)克隆(2H9)而衍生。细胞在嘌呤霉素中选择一个月,然后在G418中选择一个月。胰蛋白酶作用的细胞进行PCR扩增,使用引物5′-TGCCCCGGGGCTTCACGTTTTCC-3’(SEQ ID NO:64)和5′-GCCCGCCGTGACCGTCGAGAAC-3′(SEQ ID NO:65)进行30个循环,然后1%的反应DNA进行随后的PCR扩增循环,使用引物5′-CAGGTCAGAAGCGGTTTTCGGGAG-3’(SEQ ID NO:63)和5′-CCGCTGACGCTGCCCCGCGTATC-3’(SEQ ID NO:66)再进行30个循环。PCR产物在4%琼脂糖凝胶上分离,结果示于图26B。当使用102、103或104细胞时,正确尺寸的特定信号被扩增。
半随机PCR方法可以用于测定供体载体是否已整合入Ψ
Figure A200780027691D00631
 att位点。例如,为此目的,可以使用DNA Walking SpeedUp试剂盒(Seegene)。或者可以使用反向PCR方法。
抗体生成水平检测如下。已知数目的细胞涂板于6孔板中,对于CHODHFR-细胞在具有7%透析的胎牛血清(Invitrogen)的MEMα-培养基(Invitrogen)中,对于PER.C6TM细胞在DMEM(Invitrogen)、10%胎牛血清(JRH)、10mM MgCl2中。细胞生长1-4天。收获培养基,同时测定最终的细胞数目。
使用血细胞计数器测定细胞数目。或者,可以使用基于MTT的分析试剂盒(Cell Titer 96试剂盒,Promega)或类似试剂盒测定板上的细胞数目。可测量板上贴壁细胞数目的仪器例如ViaCount Assay(Guava)是可用的。
使用Easy-Titer人类Ig(H+L)分析试剂盒(Pierce)测定培养基中IgG的浓度,所述试剂盒特异性测量所有类别的人类IgG。通过下述方程式计算比生产率(皮克抗体/细胞/天):
pg/ml抗体X ml收获的培养基
(最终细胞数+初始细胞数)/2
抗体生成天数
筛选100个PER.C6TM attP细胞系和100个DG44 attP细胞系的结果分别示于图27A和图27B。十六个DG44 attP细胞系产生具有可检测的表达的嘌呤霉素抗性克隆池和最佳池产生约8pg抗体/细胞/天(图27A)。十七个PER.C6TM attP细胞系产生具有可检测的表达的嘌呤霉素抗性克隆池和最佳池产生约4pg抗体/细胞/天(图27B)。
通常,克隆池将含有蛋白质表达变化极大的细胞。因此,我们亚克隆了高产池以鉴定池内提供高水平蛋白质表达的特定细胞系。用表现出最高表达水平的供体表达载体转染DG44 attP细胞系而得到的池(2G7)随后通过在96孔板上有限稀释而被克隆,并如上所述分析抗体生产率。结果示于图28。在池内,生成7.6pg/细胞/天的是生产率为0.2至38pg/细胞/天的克隆。三个克隆生成超过30pg/细胞/天。
表达非常高水平的蛋白质的细胞通常处于生长劣势,因此可能在如上所述作为池的一部分扩增时消失或不具代表性(underrepresented)。防止该问题的方法如下。用供体表达载体和
Figure A200780027691D00641
整合酶载体转染后,细胞保温48小时以允许发生整合。然后,转染的细胞经胰蛋白酶作用并涂板于96孔板上,以便单集落在约30%的孔中生长。转染的细胞每孔涂板的数目取决于涂板效率和供体载体整合效率。通常为了在96孔板上获得最大数目的单细胞克隆,每孔涂板约0.3个100%生存力的细胞。因此,例如如果细胞涂板效率是50%并且0.1%的细胞经历产生嘌呤霉素抗性细胞的整合事件,则可以在转染后涂板0.3/0.5/0.001=6000细胞/孔以获得克隆。如果整合效率非常高则可能需要转染更少的细胞。
产生最大数目的具有最高蛋白质表达水平的克隆的亲本PER.C6TM attP或DG44 attP细胞系被选择用作attP细胞系,用于整合其他供体表达载体并以高水平产生其他蛋白质。那些细胞系被重复使用,并且仅有少数(<50)克隆被产生并筛选以鉴定具有最高表达水平的那些克隆。该方案将对多种蛋白质表达有效,显示通过在一个位点整合实现高表达水平的能力不是抗体表达特异性的。与目前使用的可能需要每次生成不同的蛋白质时要筛选数百或数千克隆的方法相比,该方法节省了大量时间。此外,通过每次在相同基因座整合表达盒,基因和由那些基因编码的蛋白质表达的稳定性与目前使用的方法相比更加可预测,在目前使用的方法中,基因和蛋白质表达稳定性通常高度可变并因而可能需要筛选额外克隆和耗时分析以鉴定稳定性足够可用的那些细胞系。该方法还排除了如果未获得具有高水平蛋白质表达的细胞系时经常用于增强表达的基因扩增方法。所述基因扩增方法例如利用二氢叶酸还原酶基因或谷氨酰胺合成酶基因的基因扩增方法通常要用3-6月来实现高表达水平,并且在许多情况下表达可能不是稳定的。
当供体载体整合入靶载体时产生的染色体构型的几个特征是值得注意的(图11-13)。首先,所有启动子为相同或相反方向以避免产生可能减少基因表达的反义转录物和siRNA。其次,双CMV启动子构型均衡了抗体重链和轻链的表达。这是重要的,因为通常当重链或轻链的表达失衡时,不发生正确的组装或者它们被降解。第三,
Figure A200780027691D00642
 attB 285 AAA和
Figure A200780027691D00643
 att P103位点被设计为当它们重组时,得到不含上游翻译起始密码子的短88碱基长的
Figure A200780027691D00644
 attL位点。编码嘌呤霉素抗性的mRNA的5′UTR中存在的短长度的
Figure A200780027691D00645
 attL 88最小化对嘌呤霉素抗性表达的干扰。
另一种示例构型包括其中位于内含子中的 attL位点终止的构型。为了产生该构型,供体载体被构建为含有(依次)启动子、药物抗性基因的编码区的N端半部分和
Figure A200780027691D00652
 attB位点之前的内含子的5′半部分。然后靶载体被构建为含有(依次)内含子的3′半部分、药物抗性基因的编码区的C端半部分和
Figure A200780027691D00653
 attP位点之后的polyA信号。在这种供体载体整合入这种靶载体之后,重建了完整功能性的药物抗性表达盒,其由启动子、完整的药物抗性基因编码区和polyA信号组成。
Figure A200780027691D00654
 attL位点将存在于内含子中。
关于内含子中哪个核酸序列是发生适当剪接所需要的大量信息是可获得的。例如,5′和3′外显子/内含子接合处附近的序列和通常位于内含子5′至3’端约30个碱基处的多嘧啶片是发生有效剪接所需要的。因此,在上述构型中,供体载体中的attB和靶载体中的attP置于从内含子任一端的至少100个碱基的内含子中部,以便得到的attL位点将位于内含子中部,远离对发生适当剪接关键的任何核苷酸序列。这将确保得到的attL位点很不可能干扰剪接。此外,内含子可以是长的(>1kbp),以进一步最小化attL位点干扰剪接的潜力。
细胞系鉴定方法
进行几个程序以鉴定使用上述方法衍生的细胞系中存在的基因盒和由使用上述方法衍生的细胞系生成的蛋白质。鉴定基因盒以确定基因盒整合位置并确保所预测的结构是存在的并且随时间稳定。由所述细胞系生成的蛋白质也被鉴定以确保其是存在的、活性的并且高水平生成是随时间稳定的。
为了鉴定整合位点的数目及其位置,许多方法是可用的。在一些实施方案中,使用荧光原位杂交(FISH)来测定完整基因组中的整合位点数目。整合位点的位置通过分离并测序在整合的盒侧翼的染色体DNA并与完整人类基因组的序列相比较而确定(参见例如Chalberg等,2006)。
完整的整合的盒通过"质粒拯救"方法每月分离成两个片段,以便所述盒在需要做回顾分析的情况下归档。简言之,质粒拯救包括从细胞系制备基因组DNA,用限制酶对其消化,所述限制酶在整合的盒内切割一次并在基因组DNA中切割一次以便DNA片段具有复制起点和适用于在大肠杆菌中维持和选择的选择性标记。消化的DNA被连接并用于转化大肠杆菌。含有大肠杆菌复制起点(例如ColE1)和选择性标记(例如氨苄青霉素抗性)的任何DNA复制并因此被“拯救”。通过将靶载体整合入Ψ R4 attP位点随后将供体载体pD1整合入整合的靶载体而得到的DNA盒将具有两个大肠杆菌复制起点和两个选择性标记。几个限制酶在这些序列之间切割一次,因此能够拯救分别含有靶载体和供体载体的DNA。通过使用该方法,可以测定表达盒完整性和随时间的稳定性。例如,完整盒(~14kbp)可以被测序以确认其具有预期的序列和DNA元件排列。
如果染色体DNA中的限制位点离整合的盒太远以致不能产生足以在大肠杆菌中复制的小DNA,则质粒拯救可能是不成功的。在这样的实施方案中,聚合酶链式反应用以分析整合的盒。几种酶和条件是可用的,以便完整的~14kbp整合盒可以被扩增并原样保存,无进一步克隆。如果需要获得染色体DNA侧翼的序列,可用许多方法,例如反向PCR或使用随机引物来扩增侧翼染色体序列的方法。
除了测定存在哪些基因外,还需要确保整合酶载体未整合入基因组。这是因为整合酶的持久表达能够导致由基因组中存在的Ψ att位点之间的重组所介导的整合的靶载体和供体载体盒的不稳定性或者染色体DNA的不稳定性。稳定的整合酶载体已经在瞬时转染后被观察到,但是很少。然而,在一些实施方案中,可能需要排除整合酶载体在细胞系中的存在。任何适合检测特定核酸存在或不存在的方法可以用于确定整合酶载体是否存在,所述方法例如DNA印迹或聚合酶链式反应。或者可以使用检测整合酶蛋白存在的方法例如蛋白质印迹或ELISA。
蛋白质生成的鉴定
除了鉴定整合的基因盒外,还鉴定了蛋白质生成(例如抗体生成)的质量、稳定性和水平。开始,来自第二次整合的大量混合的细胞系(>100)在96孔板中筛选蛋白质生成。可以使用许多适合抗体筛选的方法。例如,ELISA用以测量存在的抗体的总量。如果制成的抗体的水平以适当的水平生成,SDS-聚丙烯酰胺凝胶也可以用于筛选生成水平。如果细胞在无血清培养基中生长,可以将细胞培养上清液直接加载在SDS-PAGE凝胶上。如果细胞在含有血清的培养基中生长,抗体可以被特异性检测并通过例如蛋白质印迹或ELISA定量。
细胞生成的抗体的比结合活性
DG44或PER.C6TM用pD1-DTX1转染(使用别处所述的Lipofectamine2000CD)。转染24小时后,收获培养基。使用Easy-Titer(H+L)IgG分析试剂盒(如本专利其他地方所述)测定总IgG。使用白喉IgG ELISA试剂盒(IBLHamburg)严格按照生产商说明测定抗白喉毒素IgG。
图31显示了DG44细胞或PER.C6TM细胞中表达的抗白喉毒素抗体的比结合活性。从每一种细胞产生的抗体具有相同的比结合活性。此外,结果显示来自两个细胞系的抗体具有正确的抗原特异性,通常10000IU剂量需要~250mg该抗体。
细胞生成的抗体的生物学活性
也可以使用中和分析来测量抗体的功能活性。例如炭疽毒素和其他毒素例如白喉毒素杀伤培养的细胞。因此抗白喉毒素抗体的活性可以通过测量其中和纯化的白喉毒素的细胞杀伤性质的能力而确定。功能活性与总蛋白之比(比活性)是特定细胞系生成活性抗体或其他分泌蛋白的水平的有效量度。
DG44或PER.C6TM生成的抗白喉毒素抗体的中和活性被测定并与来自D2.2细胞系的抗体相比较,从D2.2细胞系克隆了抗白喉毒素抗体基因。来自DG44或PER.C6TM的抗体通过使用其他地方所述的Lipofectamine 2000CD瞬时转染细胞而产生。D2.2细胞或转染的DG44和PER.C6TM细胞上清液中存在的抗体量通过ELISA测定,使用纯白喉毒素作为抗原。然后将不同量的抗体添加至10ng/ml白喉毒素。37℃保温15分钟后,将抗体/毒素混合物添加至对白喉毒素杀伤敏感的Jurkat细胞。通过3H-胸苷掺入来测量细胞分裂。结果示于图32。缺乏明显的3H-胸苷掺入指示仅用毒素而无抗体处理的对照细胞死亡。用增加量的由D2.2、DG44或PER.C6TM细胞产生的抗白喉毒素抗体处理的细胞存活。对于由D2.2、DG44或PER.C6TM细胞产生的抗白喉毒素抗体而言,用于保护Jurkat细胞免受白喉毒素杀伤的EC50分别是5、8和11ng/ml。
约十种以小规模生成最高水平抗体的细胞系适以大规模(例如100ml-1升)的无血清悬浮培养。几个克隆适应(因为一些可能不适应),快速生长或保留高水平抗体表达水平。在细胞系适应悬浮培养后,再次测试抗体生产水平。实验室规模的示例性抗体生成为约10-100mg/L培养基每天或大约10-100pg/细胞/天,假设最大细胞密度为1 x 109细胞每升。
已经描述了用于大规模人类IgG抗体纯化的多种方法。通常使用至少三种层析树脂。A蛋白柱用作第一亲和步骤以通过结合其Fc区而捕获IgG。第二柱用以去除内毒素,保留细胞蛋白和从第一柱沥滤(leached)的任何A蛋白。示例性树脂包括羟磷灰石、疏水性相互作用或阳离子交换树脂,其可用于第二层析步骤。阴离子交换柱用作第三步以去除DNA。
约100mg抗体被纯化并以适当活性分析进行测试。对于抗白喉毒素抗体而言,适当的体内分析是在豚鼠中进行的皮肤测试。抗体与纯化的白喉毒素混合并注射入皮肤。未中和的毒素导致炎症反应。对于抗白喉毒素抗体而言,适当的体外分析是使用Vero细胞的分析。少至如一个分子的白喉毒素(Sigma)被认为能够通过延伸因子-2(EF-2)核糖体辅助蛋白的共价ADP核糖基化而杀伤细胞。结果,细胞中所有的蛋白质合成被抑制,细胞死亡。因此,测量细胞生存力或细胞代谢的任何分析例如基于MTT的分析用于测定针对给定量的纯化白喉毒素的抗体效价。这样的分析每月进行一次持续12个月,以确定贮存期并研究纯化抗体的稳定性。
使用SDS-聚丙烯酰胺凝胶来评价抗体的一些基本特征。例如,可以使用还原(reduced)抗体样品的SDS凝胶电泳来确认重链(~50kDa1)和轻链(~25kDa1)的量、纯度和正确分子量,但更重要的是确认重链与轻链之比为约1:1。变性但非还原样品的SDS凝胶电泳用以确定抗体主要是单体还是多聚体。这是重要的,因为聚集抗体的存在可以指示生成或纯化问题。当用作人类治疗剂时,聚集抗体可以具有不希望的作用,例如肾毒性。最后,就它们希望的生物学活性而言,聚集抗体还通常是无活性的。还可以使用其他生物分析方法来评估抗体的聚集状态,包括光散射或凝胶过滤。
实施例3
使用选择性供体表达载体生成蛋白质的CHO细胞系
我们发现用
Figure A200780027691D00681
突变整合酶表达载体pCS-M3J单独转染DG44pR1-DHFR细胞克隆可以无需转染供体表达载体而生成嘌呤霉素抗性细胞。这似乎是
Figure A200780027691D00682
整合酶介导染色体DNA在嘌呤霉素抗性基因的5′区重排入整合的pR1-DHFR质粒的结果。这种易位染色体DNA可以含有驱动嘌呤霉素抗性表达的启动子。在一些实验中,这些事件的数目达到其中供体表达载体整合入靶载体的希望的整合事件数目的30%。
防止该问题的一种方法是在供体表达载体上具有完整的功能性药物抗性基因例如编码对G418抗性的基因。在用含有G418基因的供体表达载体和
Figure A200780027691D00691
整合酶载体转染靶载体克隆、随后根据嘌呤霉素选择之后,会有两类整合体。一类中,将发生供体表达载体重组入靶载体的野生型att P位点,而在另一类中将发生染色体DNA重排入靶载体。但是,如果G418选择在嘌呤霉素选择之后进行,则仅保留具有完整供体表达载体的重组体。其中已经发生染色体DNA重排入靶载体的细胞将不含有G418-供体表达载体并将被消除。
注意,药物抗性选择的顺序是重要的。如果首先进行G418选择,则可能获得G418-供体表达载体随机整合入靶载体和Ψ att位点的细胞。然后如果随后进行嘌呤霉素选择,则将消除具有随机或Ψ att位点整合的细胞,但染色体重排入靶载体可以依然存在于例如其中未发生供体表达载体整合入靶载体的细胞中。出于类似原因,不期望同时进行嘌呤霉素和G418选择。
为确定在嘌呤霉素选择后进行G418选择是否有益,将pD1-DTX1-G418转染入实施例2中所述的DG44 R1-DHFR克隆1A1、2B11、2E8、2G7、2H1、2H9。转染两天后,细胞在10μg/ml嘌呤霉素中选择7天。然后将集落分入仅含有10μg/ml嘌呤霉素或含有10μg/ml嘌呤霉素和400μg/ml G418两者的生长培养基。这些条件下的选择持续21天。然后分析培养基中的抗体生成。这些分析的结果示于表1。G418选择在4例中增加比生产率30至73倍,在两例中没有效果。G418选择是否具有效果可能取决于供体表达载体在每个靶载体克隆中的整合的效率,还取决于导致嘌呤霉素抗性的表达载体依赖性事件的频率。
表1:使用选择性供体表达载体对蛋白质生成的影响
 
转染的靶载体克隆 IgG生成(在嘌呤霉素和G418选择后) IgG生成(在仅嘌呤霉素选择后) 生成比率(经G418选择/无G418选择)
1A1 15ng/ml 19ng/ml 0.8
2B11 1795ng/ml 56ng/ml 32
2E8 585ng/ml 10ng/ml 59
2G7 1017ng/ml 34ng/ml 30
2H1 815ng/ml 658ng/ml 1.2
2H9 1688ng/ml 26ng/ml 73
除了编码对G418抗性的药物抗性基因以外的完整药物抗性基因可以任选整合入选择性供体表达载体。唯一的限制是其必须不同于用于选择靶载体整合(例如潮霉素抗性)、选择供体载体整合(例如嘌呤霉素抗性)或扩增靶载体(例如二氢叶酸还原酶)拷贝数的药物抗性基因。因此例如可以利用编码对zeocin或杀稻瘟素抗性的基因。
使用选择性供体表达载体的另一个益处是在
Figure A200780027691D00701
介导的选择性供体表达载体整合入靶载体例如pR1-DHFR后,选择性基因将位于抗体重链和轻链编码区之间。因此连续的选择将防止表达载体重复元件(例如启动子、信号序列、多腺苷酸化信号)之间能导致重链或轻链编码区缺失的同源重组。
实施例4
用于高产率蛋白质生成的工程化CHO细胞系
培养和转染CHO细胞的方法将依照Thyagarajan等,Methods Mol.Bio.,308:99-106(2005)中所描述的程序。简言之,CHO/dhfr-细胞(例如DG44细胞)将使用Fugene 6在24孔板中转染。依照下述方案:
1.第一次转染使用靶载体和
Figure A200780027691D00702
整合酶质粒进行(图3)。
2.转染24小时后,细胞转移至100-mm皿中。
3.转染48小时后,根据潮霉素抗性克隆选择细胞。
4.转染约12-14天后,当出现良好形成的集落时,挑选个体克隆并转移至24孔板。根据使用
Figure A200780027691D00703
整合酶的先前经验,仅需要筛选30-50个克隆以获得高表达克隆。
5.选择的集落将保持在两组24孔板中。一组用于维持。另一组用于筛选。
6.筛选组的CHO集落在24孔板中用表达报道基因(例如CIP、GFP或荧光素酶)的供体载体和R4整合酶质粒共转染(图4)。
7.第二次转染后48小时,非选择性培养基从平板去除,应用几次含有zeocin的培养基约2周。
8.然后收获细胞用于适当的报道基因分析。
9.选择3-5个表达最高水平报道基因的克隆,并扩增维持组相应的克隆。
10.得到的含有R4整合酶噬菌体附着位点(attP)的细胞系称为CHO-R4attP细胞。
测试CHO-R4attP细胞系
SARS或炭疽抗体用于测试CHO-R4attP细胞系。大多数SARS和炭疽抗体是IgG1。抗体的VH和VL可变区被克隆,然后在含有IgG1恒定区的载体中组装生成全长抗体。重链和轻链cDNA可以被克隆入两个单独供体质粒或串联克隆入单个供体质粒,其由两个相同或两个不同的启动子驱动。使用噬菌体整合酶的优点在于对感兴趣基因没有大小限制。双质粒系统和单质粒系统都用于表达全长抗体。
单克隆抗体在研究规模的表达已经被广泛描述(Wurm等,NatBiotechnol 22,1393-8(2004);Andersen等,Curr Opin Biotechnol 13,117-23(2002);Wirth等,Gene 73,419-26(1988);Kim等,Biotechnol Bioeng 58,73-84(1998);Gandor等,FEBS Lett 377,290-4(1995);和Kito等,Appl MicrobiolBiotechnol 60,442-8(2002))。这些普通方法针对CHO-R4attP细胞系进行。无血清培养基和细胞培养过程被开发以优化大规模发酵的抗体生成。
亲本细胞系,一种CHO/dhfr-的亚克隆,被选择在无血清培养基中高产率(30-50pg/细胞/天)生成蛋白质。使用工程化CHO-R4 attP细胞系在无血清培养基中的预期生产率为约至少30pg/细胞/天。细胞系和供体载体一经开发,任何感兴趣抗体基因可以被方便地克隆入供体载体的表达盒(图2)。由于选择高水平表达克隆仅需要筛选30-50个集落,表达高水平抗体的稳定细胞系可以以成本有效方式快速产生。
CHO-R4attP细胞系的鉴定
依照FDA的Center for Biologics Evaluation and Research(CBER)出版的备忘录″Points to Consider in the Characterization of Cell Lines Used toProduce Biologicals(1993)"来鉴定CHO-R4attP细胞系。
此外,通过常规方法例如FISH、DNA印迹、PCR和DNA测序完全鉴定了R4 attP整合位点例如关于拷贝数和整合基因座。由于感兴趣基因的未来整合将特异性靶向之前已经工程化入染色体的R4 attP位点,每个个体感兴趣基因的整合位点的鉴定是不重要的。因此,表达感兴趣基因的稳定细胞系的未来鉴定被明显简化,节省了时间和成本。
实施例5
用于高产率蛋白质生成的工程化DHFR-可扩增CHO细胞系
DHFR扩增系统被广泛用于CHO表达系统以增加DHFR相关表达盒的拷贝数。所述表达系统利用了二氢叶酸还原酶(DHFR)缺陷型CHO宿主细胞结合转染的DHFR基因作为选择性标记。该系统扩增与DHFR连锁的基因和序列,其导致增强水平的蛋白质表达(Wurm等,Nat Biotechnol 22,1393-8(2004))。通过扩增DHFR基因和周围区域达100-10000千碱基,转染的细胞产生对氨甲蝶呤(MTX)(一种DHFR抑制剂)的抗性(Coquelle等,Cell 89,215-25(1997);和Stark等,Cell 57,901-8(1989))。2-3周暴露于MTX后,大部分细胞死亡。然而,存活细胞通常含有几百至几千拷贝的整合的质粒(Wurm等,Ann N Y Acad Sci 782,70-8(1996);和Wurm等,Biologicals22,95-102(1994))。大部分"扩增的"细胞生成达10-至20多倍的重组蛋白(Wirth等,Gene 73,419-26(1988))。通常进行几个循环的基因扩增,通常在每个基因扩增循环后氨甲蝶呤浓度增加3-5倍。测试了三个可选择的选项以获得最佳DHFR扩增。
为了测试感兴趣基因的DHFR扩增是否将允许蛋白质表达增加,将DHFR基因置于靶载体上。包括DHFR基因的靶载体的图示提供于图15。得到的载体的序列提供于图35A-35C。图29显示来自其中供体表达载体位点特异性地整合入DHFR-靶载体、然后细胞群暴露于增加浓度的氨甲蝶呤的细胞池的抗体的表达(pg/细胞/天)。
将DHFR基因与靶载体上的R4 attP位点连锁有至少三个优点。首先,DHFR扩增后,染色体也将具有多个拷贝的R4 attP位点。在供体载体转染入CHO-R4attP(DHFR)细胞系后,感兴趣基因可以整合入多个接收性R4attP位点,由R4整合酶介导。其次,如果之前扩增的CHO-R4attP(DHFR)细胞系已具有表达足够高水平的感兴趣基因的能力,在感兴趣基因转染后可能不需要第二次DHFR扩增,从而节省了大量时间和劳动。第三,由于CHO-R4attP(DHFR)细胞系将已被良好鉴定,在来自供体载体的感兴趣基因整合后,表达感兴趣基因的表达细胞系可能不需要另外漫长的DHFR扩增和进一步鉴定,节省了大量时间和成本。
在第二个实施例中,DHFR基因存在于供体载体上。包括DHFR基因的供体载体的图示提供于图6。在第三个实施例中,DHFR基因存在于靶载体(图5)上和供体载体(图6)上。DHFR扩增后,工程化的CHO-R4attP(DHFR)细胞系预期在无血清培养基中生成远高于30pg蛋白/细胞/天的产率。
实施例6
使用IRES高产率生成翻译增强的蛋白的工程化CHO细胞系
还测试了使用优化IRES元件以及
Figure A200780027691D00731
整合酶来进一步提高表达水平的可能性和必要性。优化IRES元件被克隆入供体载体,在感兴趣蛋白质的编码区上游和转录起始位点下游(图7)。该IRES元件将通过增强靶mRNA的翻译效率而显著增加蛋白质生成(Chappell等,J Biol Chem 278,33793-800(2003);Owens等,Proc Natl Acad Sci USA 98,1471-6(2001);和Chappell等,(2000)Proc.Natl.Acad.Sci.U.S.A.,97,1536-1541)。
为了获得大量治疗性蛋白和抗体,开发了使用新型基于翻译技术的过表达的细胞系,其能够实现比使用传统的基于转录方法(其增加靶基因mRNA的量,例如通过使用强启动子、染色体重复和选择高表达细胞系)可能获得的水平高得多的蛋白质生成水平。
近期已经使用短RNA序列开发了翻译增强子,所述短RNA序列作用为募集翻译装置并促进翻译起始的内部核糖体进入位点(IRES)。尽管个体IRES元件的活性是相对弱的,但显示当特定IRES元件连接在一起时,IRES活性可以协同增加(Owens等,Proc Natl Acad Sci USA 98,1471-6(2001);和Chappell等,(2000)Proc.Natl.Acad.Sci.U.S.A.,97,1536-1541)。在这些研究中,合成IRES在双顺反子mRNA的顺反子区域中测试了它们增强第二个顺反子翻译的能力。然而,近期显示这些IRES之一在置于单顺反子mRNA的5′前导序列中时也能起有效翻译增强子的功能。该协同IRES含有来自Gtx同源结构域mRNA的5′前导序列的9-nt IRES组件的多个连接拷贝。
目标是鉴定在CHO细胞中有效起作用的IRES元件并使用这些个体元件产生在CHO细胞中有效起作用的合成的翻译增强子。还开发了在用于大规模生产的人-杂合和人类细胞系中有效起作用的翻译增强子。
在这些细胞系中有效起作用的个体IRES元件使用选择方法学获得,所述方法学中含有18个随机核苷酸的盒被克隆入选择载体并转染入感兴趣细胞系(Owens等,Proc Natl Acad Sci USA 98,1471-6(2001))。选择实验使用GFP/CFP双顺反子逆转录病毒载体进行。含有活性IRES元件的细胞通过FACS选择。选择的序列被回收并在海肾/萤火虫(RPh)双重荧光素酶载体中再测试以显示IRES在另一个环境中起作用并不依赖于用以选择它们的GFP/CFP载体中存在的序列或受其影响。测试了各种IRES元件通过将多个拷贝的相同或不同IRES元件连接在一起而协同增强活性的能力。测试了显示增强的IRES活性的元件组合作为翻译增强子在单顺反子报道RNA的5′前导序列中起作用的能力。
然后在编码治疗性蛋白或抗体的mRNA的5′前导序列中测试产生的合成翻译增强子以确定哪个增强子/基因组合作用最有效。特别有效的组合一经鉴定,则构建体在放大的培养条件下测试并进一步优化(如果必要)以最大化抗体生成。
实施例7
用于高产率可诱导蛋白质生成的工程化CHO细胞系
适合放大和生产的细胞系必须具有快速生长和高比生产率的组合能力。由于表达载体的高表达水平,生产细胞在表达高水平外源蛋白时可能具有增加的困难,或者外源蛋白可能在延长的生长期中聚集。如果遇到该困难,为供体载体增加开关以提供感兴趣基因的可诱导表达。这样,元件将作用以在细胞生长过程中关闭转基因表达并将仅在细胞生长至临界量并准备好蛋白质生成时开放表达。这些开关由与适当受体系统相互作用的配体驱动,所述系统有条件地干扰或激活转录。已经开发了几个用于基因疗法研究的专用开关,并可以用于预想的生成系统,包括但不限于ARGENT系统、GENE SWITCH系统、核糖开关、锌指蛋白、基于蜕皮激素受体的系统等等。此外,也可以利用四环素诱导的和气体诱导的系统(Weber等,NatBiotechnol 22,1440-4(2004);和Weber等,Metab Eng 7,174-81(2005))。
实施例8
用于高产率蛋白质生成的工程化PER.C6 TM 细胞系
培养和转染PER.C6TM细胞的方法将依照Thyagarajan等,Methods Mol.Bio.,308:99-106(2005)中描述的程序。简言之,PER.C6TM细胞将使用Fugene6在24孔板中转染。依照下述方案:
1.第一次转染使用靶载体和
Figure A200780027691D00741
整合酶质粒进行(图3)。
2.转染24小时后,细胞被转移至100-mm皿中。
3.转染48小时后,根据潮霉素抗性克隆选择细胞。
4.转染约21天后,当出现良好形成的集落时,挑选个体克隆并转移至24孔板。根据使用
Figure A200780027691D00751
整合酶的先前经验,仅需要筛选30-50个克隆以获得高表达克隆。
5.然后将选择的集落保持在两组24孔板中。一组用于维持。另一组用于筛选。
6.筛选组的PER.C6TM集落在24孔板中以表达报道基因(例如SEAP、CIP、GFP或荧光素酶)的供体载体和R4整合酶质粒共转染(图4)。
7.第二次转染后48小时,非选择性培养基从平板去除,应用几次含有zeocin的培养基,约3周。
8.然后收获细胞用于适当的报道基因分析。
9.选择3-5个表达最高水平报道基因的克隆并扩增维持组相应的克隆。
10.得到的含有R4整合酶噬菌体附着位点(attP)的细胞系称为PER.C6TM-R4attP细胞。
测试PER.C6 TM -R4attP细胞系
SARS或炭疽抗体用于测试和鉴定PER.C6TM-R4attP细胞系。大多数SARS和炭疽抗体是IgG1。抗体的VH和VL可变区被克隆,然后在含有IgG1恒定区的载体中组装生成全长抗体。重链和轻链的cDNA可以被克隆入两个单独供体质粒或串联克隆入单个供体质粒,其由两个相同或两个不同的启动子驱动。使用噬菌体整合酶的优点在于对感兴趣基因没有大小限制。双质粒系统和单质粒系统都用于表达全长抗体。
单克隆抗体在研究规模的表达已经被广泛描述(Wurm等,NatBiotechnol 22,1393-8(2004);Andersen等,Curr Opin Biotechnol 13,117-23(2002);Wirth等,Gene 73,419-26(1988);Kim等,Biotechnol Bioeng 58,73-84(1998);Gandor等,FEBS Lett 311,290-4(1995);和Kito等,Appl MicrobiolBiotechnol 60,442-8(2002)),并且也在PER.C6TM细胞中(Urlaub等,Proc NatlAcad Sci USA 77,4216-20(1980))描述。这些普通方法针对CHO-R4attP细胞系进行。无血清培养基和细胞培养过程被开发以优化大规模发酵的抗体生成。
使用工程化PER.C6TM-R4attP细胞系在无血清培养基中的预期生产率为约至少30pg/细胞/天。细胞系和供体载体一经开发,任何感兴趣抗体基因可以被方便地克隆入供体载体的表达盒(图2)。由于选择高水平表达克隆仅需要筛选30-50个集落,表达高水平抗体的稳定细胞系可以以成本有效方式快速产生。
PER.C6 TM -R4attP细胞系的鉴定
依照FDA的Center for Biologics Evaluation and Research(CBER)出版的备忘录"Points to Consider in the Characterization of Cell Lines Used toProduce Biologicals(1993)"来鉴定PER.C6TM-R4attP细胞系。
此外,通过常规方法例如FISH、DNA印迹、PCR和DNA测序完全鉴定了R4 attP整合位点,例如关于拷贝数和整合基因座。由于感兴趣基因的未来整合将特异性靶向之前已经工程化入染色体的R4 attP位点,每个个体感兴趣基因的整合位点的鉴定是不重要的。因此,表达感兴趣基因的稳定细胞系的未来鉴定被明显简化,节省了时间和成本。
实施例9
使用IRES高产率生成翻译增强的蛋白的工程化PER.C6 TM 细胞系
还测试了使用优化的IRES元件以及整合酶来进一步提高表达水平的可能性和必要性。优化的IRES元件被克隆入供体载体,在启动子下游和感兴趣基因的编码区上游(图7)。该IRES元件将通过增强靶mRNA的翻译效率而显著增加蛋白质生成(Chappell等,J Biol Chem 278,33793-800(2003);Owens等,Proc Natl Acad Sci USA 98,1471-6(2001);和Chappell等,(2000)Proc.Natl.Acad.Sci.U.S.A.,97,1536-1541)。
为了获得大量治疗性蛋白和抗体,开发了使用新型基于翻译技术的过表达细胞系,其能够实现比使用传统的基于转录的方法(其增加靶基因mRNA的量例如通过使用强启动子、染色体重复和选择高表达细胞系)可能获得的水平高得多的蛋白质生成水平。
近期已经使用短RNA序列开发了翻译增强子,所述短RNA序列作用为募集翻译装置并促进翻译起始的内部核糖体进入位点(IRES)。尽管个体IRES元件的活性是相对弱的,但显示当特定IRES元件连接在一起时,IRES活性可以协同增加(Owens等,Proc Natl Acad Sci USA 98,1471-6(2001);andChappell等,(2000)Proc.Natl.Acad.Sci.U.S.A.,97,1536-1541)。在这些研究中,合成IRES在双顺反子mRNA的顺反子区域中测试了它们增强第二个顺反子翻译的能力。然而,近期显示这些IRES之一在置于单顺反子mRNA的5′前导序列中时也能起有效翻译增强子的功能。该协同IRES含有来自Gtx同源结构域mRNA的5′前导序列的9-nt IRES组件的多个连接拷贝。
目标是鉴定在PER.C6TM细胞中有效起作用的IRES元件并使用这些个体元件产生在PER.C6TM细胞中有效起作用的合成翻译增强子。还开发了在用于大规模生产的人-杂合和人类细胞系中有效起作用的翻译增强子。
在这些细胞系中有效起作用的个体IRES元件使用选择方法学获得,所述方法学中含有18个随机核苷酸的盒被克隆入选择载体并转染入感兴趣细胞系(Owens等,Proc Natl Acad Sci USA 98,1471-6(2001))。选择实验使用GFP/CFP双顺反子逆转录病毒载体进行。含有活性IRES元件的细胞通过FACS选择。选择的序列被回收并在海肾/萤火虫(RPh)双重荧光素酶载体中再测试以显示IRES在另一个环境中起作用并不依赖于用以选择它们的GFP/CFP载体中存在的序列或受其影响。测试了各种IRES元件通过将多个拷贝的相同或不同IRES元件连接在一起而协同增强活性的能力。测试了显示增强的IRES活性的元件组合作为翻译增强子在单顺反子报道RNA的5′前导序列中起作用的能力。
然后在编码治疗性蛋白或抗体的mRNA的5′前导序列中测试产生的合成翻译增强子以确定哪个增强子/基因组合作用最有效。特别有效的组合一经鉴定,则构建体在放大的培养条件下测试并进一步优化(如果必要)以最大化抗体生成。
实施例10
用于高产率可诱导蛋白质生成的工程化PER.C6 TM 细胞系
适合放大和生产的细胞系必须具有快速生长和高比生产率的组合能力。由于表达载体的高表达水平,生产细胞在表达高水平外源蛋白时可能具有增加的困难,或者外源蛋白可能在延长的生长期中聚集。如果遇到该困难,为供体载体增加开关以提供感兴趣基因在PER.C6TM细胞系中的可诱导表达。这样,元件将作用以在细胞生长过程中关闭转基因表达并将仅在细胞生长至临界量并准备好蛋白质生成时开放表达。这些开关由与适当受体系统相互作用的配体驱动,所述系统有条件地干扰或激活转录。已经开发了几个用于基因疗法研究的专用开关并可以用于预想的生成系统,包括但不限于ARGENT系统、GENE SWITCH系统、核糖开关、锌指蛋白、基于蜕皮激素受体的系统等等。此外,也可以利用四环素诱导的和气体诱导的系统(Weber等,Nat Biotechnol 22,1440-4(2004);和Weber等,Metab Eng7,174-81(2005))。
之前仅描述了本发明的原理。应该理解本领域技术人员能够设计各种排列,尽管其没有在本文明确描述或显示但其实现本发明原理并包括在其精神和范围内。而且,本文引用的所有实施例和条件语言主要是要帮助读者理解本发明的原理和发明人用于拓展该技术的概念,并要解释为不限于这种特别引用的实施例和条件。而且,本文叙述本发明原理、方面和实施方案及其具体实施例的所有描述预期包括其结构和功能等价物。另外,预期这种等价物包括目前已知的等价物和未来发展的等价物,即被开发以进行相同功能的任何元件,而不论结构如何。因此本发明的范围预期不限于本文显示和描述的示例性实施方案。而且本发明的范围和精神由所附权利要求来体现。

Claims (49)

1.一种位点特异性整合靶载体,所述载体包括:
(a)第一载体重组位点,其在第一单向位点特异性重组酶存在下与基因组重组位点重组;
(b)第二载体重组位点,其在不同于所述第一单向位点特异性重组酶的第二单向位点特异性重组酶存在下与供体重组位点重组;
(c)与所述第二载体重组位点的3’端相邻的第一选择性标记的第一部分;和
(d)不同于所述第一选择性标记的第二选择性标记。
2.根据权利要求1所述的靶载体,其中所述基因组重组位点是哺乳动物基因组重组位点。
3.根据权利要求1所述的靶载体,其中所述第一载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。
4.根据权利要求1所述的靶载体,其中所述第一载体重组位点是细菌基因组重组位点(attB),并且所述基因组重组位点是拟噬菌体基因组重组位点(拟attP)。
5.根据权利要求1所述的靶载体,其中所述第一载体重组位点是噬菌体基因组重组位点(attP),并且所述基因组重组位点是拟细菌基因组重组位点(拟attB)。
6.根据权利要求1所述的靶载体,其中所述第一载体重组位点是拟细菌基因组重组位点(拟attB)或拟噬菌体基因组重组attP位点(拟attP)。
7.根据权利要求1所述的靶载体,其中所述第二载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。
8.根据权利要求1所述的靶载体,其中所述第二载体重组位点是拟细菌基因组重组位点(拟attB)或拟噬菌体基因组重组attP位点(拟attP)。
9.根据权利要求1所述的靶载体,其中所述第一单向位点特异性重组酶是
Figure A200780027691C00031
噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691C00032
噬菌体重组酶、
Figure A200780027691C00033
噬菌体重组酶或
Figure A200780027691C00034
噬菌体重组酶。
10.根据权利要求1所述的靶载体,其中所述第一单向位点特异性重组酶是
Figure A200780027691C00035
噬菌体重组酶。
11.根据权利要求1所述的靶载体,其中所述第二单向位点特异性重组酶是R4噬菌体重组酶。
12.一种将编码感兴趣蛋白质的多核苷酸位点特异性地整合入真核细胞基因组的方法,所述方法包括:
(a)将权利要求1所述的靶载体导入包含第一单向位点特异性重组酶的哺乳动物细胞并使所述哺乳动物细胞保持在足以发生由所述第一单向位点特异性重组酶介导的、在所述第一载体重组位点和所述基因组重组位点之间重组事件的条件下,以将所述靶载体位点特异性地整合入所述哺乳动物细胞的基因组中;
(b)将供体载体导入包含第二单向位点特异性重组酶的靶细胞,其中所述供体载体包含所述编码感兴趣蛋白质的多核苷酸和供体重组位点,并使所述靶细胞保持在足以发生由所述第二单向位点特异性重组酶介导的、所述供体重组位点和所述靶载体的第二载体重组位点之间重组事件的条件下,以将所述编码感兴趣蛋白质的多核苷酸位点特异性地整合入所述哺乳动物细胞的基因组中;
其中所述第一单向位点特异性重组酶不同于所述第二单向位点特异性重组酶。
13.根据权利要求12所述的方法,其进一步包括选择表达所述感兴趣蛋白质的细胞。
14.根据权利要求12所述的方法,其中所述第一载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。
15.根据权利要求12所述的方法,其中所述第一载体重组位点是细菌基因组重组位点(attB),并且所述基因组重组位点是拟噬菌体基因组重组位点(拟attP)。
16.根据权利要求12所述的方法,其中所述第一载体重组位点是噬菌体基因组重组位点(attP),并且所述基因组重组位点是拟细菌基因组重组位点(拟attB)。
17.根据权利要求12所述的方法,其中所述第一载体重组位点是拟细菌基因组重组位点(拟attB)或拟噬菌体基因组重组attP位点(拟attP)。
18.根据权利要求12所述的方法,其中所述第二载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。
19.根据权利要求12所述的方法,其中所述第二载体重组位点是拟细菌基因组重组位点(拟attB)或拟噬菌体基因组重组attP位点(拟attP)。
20.根据权利要求12所述的方法,其中所述供体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。
21.根据权利要求12所述的方法,其中所述供体重组位点是拟细菌基因组重组位点(拟attB)或拟噬菌体基因组重组attP位点(拟attP)。
22.根据权利要求12所述的方法,其中所述第一单向位点特异性重组酶是
Figure A200780027691C00041
噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691C00042
噬菌体重组酶、
Figure A200780027691C00043
噬菌体重组酶或
Figure A200780027691C0004153945QIETU
噬菌体重组酶。
23.根据权利要求12所述的方法,其中所述第二单向位点特异性重组酶是
Figure A200780027691C00045
噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691C00046
噬菌体重组酶、
Figure A200780027691C00047
噬菌体重组酶或
Figure A200780027691C00048
噬菌体重组酶。
24.根据权利要求12所述的方法,其中所述第一单向位点特异性重组酶是
Figure A200780027691C00049
噬菌体重组酶。
25.根据权利要求12所述的方法,其中所述第二单向位点特异性重组酶是R4噬菌体重组酶。
26.根据权利要求12所述的方法,其中所述蛋白质是分泌的蛋白质。
27.根据权利要求12所述的方法,其中所述分泌的蛋白质是抗体。
28.根据权利要求12所述的方法,其中所述细胞是哺乳动物细胞。
29.根据权利要求28所述的方法,其中所述哺乳动物细胞是啮齿动物细胞。
30.根据权利要求29所述的方法,其中所述啮齿动物细胞是CHO细胞。
31.根据权利要求28所述的方法,其中所述哺乳动物细胞是人类细胞。
32.根据权利要求31所述的方法,其中所述人类细胞是PER.C6TM细胞。
33.一种分离的真核细胞,其包括:
基因组整合的多核苷酸盒,所述多核苷酸盒包括,
第一杂合重组位点和第二杂合重组位点,其位于下述位点的侧翼:
(a)在单向位点特异性重组酶存在下与供体重组位点重组的载体重组位点;
(b)与所述载体重组位点的3’端相邻的第一选择性标记的第一部分;和
(c)不同于所述第一选择性标记的第二选择性标记。
34.根据权利要求33所述的分离的真核细胞,其中所述载体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。
35.根据权利要求33所述的分离的真核细胞,其中所述供体重组位点是细菌基因组重组位点(attB)或噬菌体基因组重组位点(attP)。
36.根据权利要求33所述的分离的真核细胞,其中所述单向位点特异性重组酶是
Figure A200780027691C00051
噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691C00052
噬菌体重组酶、
Figure A200780027691C00053
噬菌体重组酶或噬菌体重组酶。
37.根据权利要求33所述的分离的真核细胞,其中所述细胞是哺乳动物细胞。
38.根据权利要求37所述的分离的真核细胞,其中所述哺乳动物细胞是啮齿动物细胞。
39.根据权利要求38所述的分离的真核细胞,其中所述啮齿动物细胞是CHO细胞。
40.根据权利要求37所述的分离的真核细胞,其中所述哺乳动物细胞是人类细胞。
41.根据权利要求40所述的分离的真核细胞,其中所述人类细胞是PER.C6TM细胞。
42.一种用于在体外将多核苷酸位点特异性地整合入细胞基因组的试剂盒,该试剂盒包括:
(a)权利要求1所述的载体;和
(b)供体载体,其包括:
(i)多克隆位点;
(ii)供体重组位点;和
(iii)与所述供体重组位点的5’端相邻的第一选择性标记的第二部分。
43.根据权利要求42所述的试剂盒,其进一步包括第一单向位点特异性重组酶或编码所述第一单向位点特异性重组酶的核酸。
44.根据权利要求43所述的试剂盒,其进一步包括不同于所述第一单向位点特异性重组酶的第二单向位点特异性重组酶或编码所述第二单向位点特异性重组酶的核酸。
45.根据权利要求43所述的试剂盒,其中所述第一单向位点特异性重组酶是
Figure A200780027691C00061
噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691C00062
噬菌体重组酶、
Figure A200780027691C00071
噬菌体重组酶或
Figure A200780027691C00072
噬菌体重组酶。
46.根据权利要求44所述的试剂盒,其中所述第二单向位点特异性重组酶是
Figure A200780027691C00073
噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691C00074
噬菌体重组酶、噬菌体重组酶或
Figure A200780027691C00076
噬菌体重组酶。
47.一种用于在细胞中生成蛋白质的试剂盒,该试剂盒包括:
(a)权利要求43所述的分离的真核细胞;和
(b)供体载体,其包括:
(i)多克隆位点;
(ii)供体重组位点;和
(iii)与所述供体重组位点的5’端相邻的第一选择性标记的第二部分。
48.根据权利要求47所述的试剂盒,其进一步包括单向位点特异性重组酶或编码所述单向位点特异性重组酶的核酸。
49.根据权利要求48所述的试剂盒,其中所述单向位点特异性重组酶是噬菌体重组酶、TP901-1噬菌体重组酶、R4噬菌体重组酶、
Figure A200780027691C00078
噬菌体重组酶、
Figure A200780027691C00079
噬菌体重组酶或噬菌体重组酶。
CNA2007800276912A 2006-05-22 2007-05-22 使用真核细胞系生成蛋白质 Pending CN101511994A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US80271906P 2006-05-22 2006-05-22
US60/802,719 2006-05-22

Publications (1)

Publication Number Publication Date
CN101511994A true CN101511994A (zh) 2009-08-19

Family

ID=38724093

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800276912A Pending CN101511994A (zh) 2006-05-22 2007-05-22 使用真核细胞系生成蛋白质

Country Status (9)

Country Link
US (1) US20110177600A1 (zh)
EP (1) EP2019860A4 (zh)
JP (1) JP2009538144A (zh)
CN (1) CN101511994A (zh)
AU (1) AU2007254508B2 (zh)
BR (1) BRPI0711207A2 (zh)
CA (1) CA2654415A1 (zh)
NZ (1) NZ572884A (zh)
WO (1) WO2007137267A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103270162A (zh) * 2010-11-25 2013-08-28 应用干细胞有限公司 增强的基因表达
CN103509823A (zh) * 2012-06-25 2014-01-15 上海复宏汉霖生物技术有限公司 一种利用cho细胞生产重组蛋白的真核表达载体及系统
CN111212913A (zh) * 2017-05-16 2020-05-29 凯恩生物科学股份有限公司 多重测定

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012167192A2 (en) * 2011-06-01 2012-12-06 Precision Biosciences, Inc. Methods and products for producing engineered mammalian cell lines with amplified transgenes
AU2011382454B2 (en) 2011-11-30 2017-02-23 Abbvie Biotechnology Ltd Vectors and host cells comprising a modified SV40 promoter for protein expression
SG10201808825XA (en) 2014-04-10 2018-11-29 Seattle Childrens Hospital Dba Seattle Childrens Res Inst Defined composition gene modified t-cell products
US11458167B2 (en) 2015-08-07 2022-10-04 Seattle Children's Hospital Bispecific CAR T-cells for solid tumor targeting
US20220267802A1 (en) * 2019-07-15 2022-08-25 President And Fellows Of Harvard College Methods and compositions for gene delivery

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050208021A1 (en) * 2002-06-04 2005-09-22 Michele Calos Methods of unidirectional, site-specific integration into a genome, compositions and kits for practicing the same
CN1693467A (zh) * 2005-04-14 2005-11-09 北京天广实生物技术有限公司 快速构建目标基因高表达的哺乳动物细胞株的体系和方法
US20060019301A1 (en) * 2004-07-20 2006-01-26 Novozymes A/S Methods of producing mutant polynucleotides

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5928914A (en) * 1996-06-14 1999-07-27 Albert Einstein College Of Medicine Of Yeshiva University, A Division Of Yeshiva University Methods and compositions for transforming cells
US6632672B2 (en) 1998-08-19 2003-10-14 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for genomic modification
WO2001061049A1 (en) 2000-02-18 2001-08-23 The Board Of Trustees Of The Leland Stanford Junior University Altered recombinases for genome modification
BR0112633A (pt) * 2000-07-21 2003-09-16 Us Agriculture Método para substituir, translocar e empilhar dna em genomas eucarióticos
EP1395612B1 (en) * 2000-11-10 2005-08-31 ARTEMIS Pharmaceuticals GmbH Modified recombinase
US7351877B2 (en) * 2002-03-29 2008-04-01 Syngenta Participations Ag Lambda integrase mediated recombination in plants
US8304233B2 (en) * 2002-06-04 2012-11-06 Poetic Genetics, Llc Methods of unidirectional, site-specific integration into a genome, compositions and kits for practicing the same
US9034650B2 (en) * 2005-02-02 2015-05-19 Intrexon Corporation Site-specific serine recombinases and methods of their use

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050208021A1 (en) * 2002-06-04 2005-09-22 Michele Calos Methods of unidirectional, site-specific integration into a genome, compositions and kits for practicing the same
US20060019301A1 (en) * 2004-07-20 2006-01-26 Novozymes A/S Methods of producing mutant polynucleotides
CN1693467A (zh) * 2005-04-14 2005-11-09 北京天广实生物技术有限公司 快速构建目标基因高表达的哺乳动物细胞株的体系和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAVENGA M J E等: "Improved Adenovirus Vectors for Infection of Cardiovascular Tissues", 《JOURNAL OF VIROLOGY》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103270162A (zh) * 2010-11-25 2013-08-28 应用干细胞有限公司 增强的基因表达
US9234195B2 (en) 2010-11-25 2016-01-12 Applied Stemcell, Inc. Enhanced gene expression
CN103270162B (zh) * 2010-11-25 2016-07-06 应用干细胞有限公司 增强的基因表达
CN103509823A (zh) * 2012-06-25 2014-01-15 上海复宏汉霖生物技术有限公司 一种利用cho细胞生产重组蛋白的真核表达载体及系统
CN103509823B (zh) * 2012-06-25 2018-07-31 上海复宏汉霖生物制药有限公司 一种利用cho细胞生产重组蛋白的真核表达载体及系统
CN111212913A (zh) * 2017-05-16 2020-05-29 凯恩生物科学股份有限公司 多重测定

Also Published As

Publication number Publication date
US20110177600A1 (en) 2011-07-21
AU2007254508B2 (en) 2012-03-22
WO2007137267A2 (en) 2007-11-29
EP2019860A4 (en) 2010-12-15
BRPI0711207A2 (pt) 2011-03-22
AU2007254508A1 (en) 2007-11-29
CA2654415A1 (en) 2007-11-29
WO2007137267A3 (en) 2008-01-24
NZ572884A (en) 2011-12-22
EP2019860A2 (en) 2009-02-04
JP2009538144A (ja) 2009-11-05

Similar Documents

Publication Publication Date Title
JP4489424B2 (ja) 染色体に基くプラットホーム
AU2014225272B2 (en) A cell expression system
CN101511994A (zh) 使用真核细胞系生成蛋白质
JP5377806B2 (ja) ベクター構築物の細胞dnaとの非相同組換えによる内因性遺伝子の発現
RU2494147C2 (ru) Вектор экспрессии млекопитающих
US11512144B2 (en) Compositions and methods for making antibodies based on use of an expression-enhancing loci
AU2002310275A1 (en) Chromosome-based platforms
Chin et al. Engineering selection stringency on expression vector for the production of recombinant human alpha1-antitrypsin using Chinese Hamster ovary cells
AU2003298674A2 (en) Intron fusion construct and method of using for selecting high-expressing production cell lines
US20230159958A1 (en) Methods for targeted integration
KR102256749B1 (ko) 고발현 세포주 확립방법
KR20220008274A (ko) 안정한 표적화 통합
CN106255757B (zh) 生产多肽的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20090819