CN106414745B - 使用组蛋白酰化作为标记来选择长期生产性细胞的方法 - Google Patents

使用组蛋白酰化作为标记来选择长期生产性细胞的方法 Download PDF

Info

Publication number
CN106414745B
CN106414745B CN201580026132.4A CN201580026132A CN106414745B CN 106414745 B CN106414745 B CN 106414745B CN 201580026132 A CN201580026132 A CN 201580026132A CN 106414745 B CN106414745 B CN 106414745B
Authority
CN
China
Prior art keywords
cell
histone
nucleic acid
cell line
methylation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580026132.4A
Other languages
English (en)
Other versions
CN106414745A (zh
Inventor
U·格普费特
P·贝克尔
B·莫里茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of CN106414745A publication Critical patent/CN106414745A/zh
Application granted granted Critical
Publication of CN106414745B publication Critical patent/CN106414745B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/46Hybrid immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/164Methylation detection other then bisulfite or methylation sensitive restriction endonucleases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本文中报道了一种用于确定与编码多肽的核酸有效连接的启动子核酸的甲基化并因而确定细胞长期生产率的方法。另外一个方面是一种通过确定与编码多肽的结构基因有效连接的启动子核酸的甲基化,选择细胞以产生多肽的方法。

Description

使用组蛋白酰化作为标记来选择长期生产性细胞的方法
本文中报告的方法涉及细胞选择和多肽表达/产生领域。更详细地,本文中报道了一种基于确定组蛋白酰化,选择长期表达或分泌多肽的细胞的方法。
发明背景
DNA是编码全部已知活生物的指令的大分子(Avery,O.T.等人,J.Exp.Med.79(1944)137-158)。在人类细胞中,DNA具有大约两米长度并且大多贮存在具有10μm直径的胞核中(Turner,B.M.,Cell 111(2002)285-291)。为了组织这种量的信息,DNA需要高度压缩。一组称作组蛋白的保守小碱性蛋白与DNA形成复合物以产生有序和紧凑的结构,称作染色质。那些带正电荷的蛋白质与DNA双螺旋的带负电荷磷酸二酯主链相互作用(Alberts,B.J.A等人,Molecular Biology of the Cell;Meyers,R.A.,Epigenetic Regulation andEpigenomics,WILEY-BLACKWELL,1;Olins,E.D.,Nat.Rev.Mol.Cell Biol.(2003))。4种“核心”组蛋白H2A、H2B、H3和H4与DNA组合以形成染色质的基本重复单元,称作核小体(Thomas,J.O.和Kornberg,R.D.,Proc.Natl.Acad.Sci.USA 72(1975)2626-2630)。225kDa核小体核心结构由缠绕在组蛋白八聚体周围的大约147bp DNA组成,所述组蛋白八聚体包含两个H2A/H2B二聚体和一个H3/H4四聚体,为1.67左手超螺旋转角(Arents,G.等人,Proc.Natl.Acad.Sci.USA 88(1991)10148-10152;Arents,G.和Moudrianakis,E.N.,Proc.Natl.Acad.Sci.USA 90(1993),10489-10493;Richmond,T.J.,Scientist 13(1999)15-15)。取决于DNA可及性,染色质区分成两个类型。较少可用于转录的高度压缩的异染色质,和松散压缩的转录活性的常染色质。兼性的异染色质可以在胞核中任何地方形成,经常局限于启动子,并且按发育调节的方式或响应于环境触发物而建立(Chen,T.和Dent,S.Y.,Nat.Rev.Genet.15(2014),93-106)。
长期培养物中的生产率逐步损失是开发生产型细胞系时常见的问题。重组蛋白表达的减少能归因于转基因拷贝数的丢失和/或转基因启动子的沉默。通过外遗传修饰染色质如直接甲基化CpG位点处的启动子DNA及翻译后修饰作为染色质的主要蛋白质组分的组蛋白,引起沉默。组蛋白的失活性修饰由具有活化性的其他修饰对抗。
Barnes,L.M.等人报告了重组NS0骨髓瘤细胞中稳定蛋白质表达的预示性指标的分子定义(Biotechnol.Bioeng.85(2004)115-121)。Barnes等人报告的相关性是微弱的并且不足以用于稳定性预测。
在WO 2004/056986中,报告了通过能够使染色质为转录因子更可用的染色质开放物产生蛋白质的手段和方法。
在WO 2011/128377中,已经报道可以利用直接甲基化人巨细胞病毒主要立即早期启动子(hCMV MIE)作为早期标志物以预测重组CHO细胞系的生产不稳定性。
Osterlehner,A.等人报道了启动子甲基化和转基因拷贝数预测重组中国仓鼠卵巢细胞系中的不稳定性蛋白质产生(Biotechnol.Bioeng.108(2011)2670-2681)。
发明概述
已经发现,确定用于产生多肽的细胞或细胞系中与编码相应多肽的结构基因有效连接的启动子核酸中特定CpG位点的甲基化程度与确定接近于该启动子(即在启动子染色质中)的组蛋白酰化组合,可以用来预测长期培养期间生产率的下降。另外,可以确定整合至基因组中的轻链表达盒的拷贝数。
如本文中报道的一个方面是一种用于选择细胞克隆/细胞系的方法,所述细胞克隆/细胞系包含核酸,所述核酸包含编码多肽的结构基因,所述结构基因与启动子核酸有效连接,所述方法包括以下步骤:
a)对第一组细胞克隆/细胞系,确定与启动子核酸接近的组蛋白3乙酰化相对于组蛋白3水平的(相对)水平(H3ac/H3),和
b)选择细胞克隆/细胞系,所述细胞克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,所述启动子核酸具有0.1或更大的如步骤a)中所确定的组蛋白3乙酰化相对于组蛋白3水平的(相对)水平。
如本文中报道的一个方面是一种用于选择细胞克隆/细胞系的方法,所述细胞克隆/细胞系包含核酸,所述核酸包含编码多肽的结构基因,所述结构基因与启动子核酸有效连接,所述方法包括以下步骤:
a)对第一组细胞克隆/细胞系的每个细胞克隆/细胞系,其中每个克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,基于从每个细胞克隆/细胞系的培养物获得的至少10个细胞中确定的组蛋白3乙酰化相对于组蛋白3水平的(相对)水平(H3ac/H3),确定与启动子核酸接近的组蛋白3乙酰化相对于组蛋白3水平的平均(相对)水平(H3ac/H3),和
b)选择细胞克隆/细胞系,所述细胞克隆/细胞系相对于组蛋白3水平具有0.1或更大的平均(相对)组蛋白3乙酰化水平(H3ac/H3)。
如本文中报道的一个方面是一种用于选择细胞克隆/细胞系的方法,所述细胞克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,所述启动子核酸具有SEQ ID NO:01的核酸序列,所述方法包括以下步骤:
a)对第一组细胞克隆/细胞系的每个克隆,确定与具有SEQ ID NO:01的核苷酸序列的启动子核酸接近的组蛋白3乙酰化相对于组蛋白3水平的(相对)水平(H3ac/H3),和
b)确定第二组细胞克隆/细胞系的每个克隆在SEQ ID NO:01的位置425处的CpG位点甲基化频率,和
c)选择细胞克隆/细胞系,所述细胞克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,所述启动子核酸具有SEQ ID NO:01的核酸序列,相对于组蛋白3水平具有如步骤a)中所确定的0.1或更大的(相对)组蛋白3乙酰化水平并且在位置425处具有如步骤b)中所确定的小于5%的CpG位点甲基化频率。
如本文中报道的一个方面是一种用于选择细胞克隆/细胞系的方法,所述细胞克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,所述启动子核酸具有SEQ ID NO:01的核酸序列,所述方法包括以下步骤:
a)对第一组细胞克隆/细胞系的每个细胞克隆/细胞系,其中每个克隆/细胞系包含核酸,所述核酸包含与具有SEQ ID NO:01的核酸序列的启动子核酸有效连接的编码多肽的结构基因,基于从每个细胞克隆/细胞系的培养物获得的至少10个细胞中确定的组蛋白3乙酰化相对于组蛋白3水平的平均(相对)水平(H3ac/H3),确定与具有SEQ ID NO:01的核苷酸序列的启动子核酸接近的组蛋白3乙酰化相对于组蛋白3水平的平均(相对)水平(H3ac/H3),和
b)对第二组细胞克隆/细胞系的每个细胞克隆/细胞系,其中每个克隆/细胞系包含核酸,所述核酸包含与具有SEQ ID NO:01的核酸序列的启动子核酸有效连接的编码多肽的结构基因,基于从每个细胞克隆/细胞系的培养物获得的至少10个细胞所确定的甲基化,确定在SEQ ID NO:01的位置425处CpG位点的平均甲基化频率,
c)选择细胞克隆/细胞系,所述细胞克隆/细胞系相对于组蛋白3水平具有0.1或更大的平均(相对)组蛋白3乙酰化水平(H3ac/H3)并且在位置425处具有低于5%的甲基化频率。
在一个实施方案中,相对于组蛋白3水平的(相对)组蛋白3乙酰化水平是0.2或更大。在一个实施方案中,相对于组蛋白3水平的(相对)组蛋白3乙酰化水平是0.5或更大。在一个实施方案中,相对于组蛋白3水平的(相对)组蛋白3乙酰化水平是0.75或更大。在一个实施方案中,相对于组蛋白3水平的(相对)组蛋白3乙酰化水平是1.0或更大。
在一个优选的实施方案中,相对于组蛋白3水平的(相对)组蛋白3乙酰化水平是0.5或更大。
在一个实施方案中,启动子核酸具有SEQ ID NO:01的序列或包含其功能性片段或其功能性变体。在一个实施方案中,CpG位点位于SEQ ID NO:01的位置425处或其片段或变体中的相应位置。
在全部方面的一个实施方案中,方法还包括以下步骤:
ab)确定稳定整合的轻链表达盒的(拷贝)数目,
其中步骤c)是:
选择细胞克隆/细胞系,所述细胞克隆/细胞系相对于组蛋白3水平具有如步骤a)中所确定的大于0.5的组蛋白3乙酰化水平并且在位置425处具有如步骤b)中所确定的小于5%的CpG位点甲基化频率,和具有如步骤ab)中所确定的10或更小的稳定整合的轻链表达盒的(拷贝)数目。
在一个优选的实施方案中,如步骤ab)所测定的稳定整合的轻链表达盒的拷贝数是6或更小。
在一个实施方案中,平均(相对)组蛋白3乙酰化水平是位置4和/或9和/或14和/或18和/或27处的赖氨酸残基处的平均(相对)组蛋白3乙酰化水平。在一个实施方案中,赖氨酸残基在位置9和/或14和/或27处。
在全部方面的一个实施方案中,该方法包括以下作为第一步骤:
-用核酸转染细胞群体,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,所述启动子核酸具有SEQ ID NO:01的核酸序列,并且从中获得第一组和第二组和任选地第三组细胞克隆/细胞系。
在一个实施方案中,(选择的)细胞系在培养30-60个世代后具有超过开始培养时生产率60%的生产率。
如本文中报道的一个方面是一种用于选择细胞克隆/细胞系的方法,所述细胞克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码至少抗体轻链的结构基因,所述启动子核酸具有SEQ ID NO:01的核酸序列,所述方法包括以下步骤:
a)对第一组细胞克隆/细胞系的每个克隆,确定与具有SEQ ID NO:01的核苷酸序列的启动子核酸接近的组蛋白3乙酰化相对于组蛋白3水平的(相对)水平(H3ac/H3),和
b)确定第二组细胞克隆/细胞系的每个克隆的稳定整合的轻链表达盒的(拷贝)数目,和
c)确定第三组细胞克隆/细胞系的每个克隆在SEQ ID NO:1的位置425处的CpG位点甲基化频率,和
d)选择细胞克隆/细胞系,所述细胞克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,所述启动子核酸具有SEQ ID NO:01的核酸序列,i)相对于组蛋白3水平具有如步骤a)中所确定的0.1或更大的(相对)组蛋白3乙酰化水平,ii)在位置425处具有如步骤b)中所确定的小于5%的CpG位点甲基化频率,和iii)具有如步骤ab)中所确定的10或更小的稳定整合的轻链表达盒的(拷贝)数目。
如本文中报道的一个方面是一种用于选择细胞克隆/细胞系的方法,所述细胞克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码至少抗体轻链的结构基因,所述启动子核酸具有SEQ ID NO:01的核酸序列,所述方法包括以下步骤:
a)对一组细胞克隆/细胞系的每个细胞克隆/细胞系,其中每个克隆/细胞系包含核酸,所述核酸包含与具有SEQ ID NO:01的核酸序列的启动子核酸有效连接的编码多肽的结构基因,基于从每个细胞克隆/细胞系的培养物获得的至少10个细胞中确定的组蛋白3乙酰化相对于组蛋白3水平的(相对)水平(H3ac/H3),确定与具有SEQ ID NO:01的核苷酸序列的启动子核酸接近的组蛋白3乙酰化相对于组蛋白3水平的平均(相对)水平(H3ac/H3),
b)对该组细胞克隆/细胞系的每个细胞克隆/细胞系确定从每个细胞克隆/细胞系的培养物获得的至少10个细胞中稳定整合的轻链表达盒的(拷贝)数目,和
c)基于从每个细胞克隆/细胞系的培养物获得的至少10个细胞所确定的甲基化,确定该组细胞克隆/细胞系的每个细胞克隆/细胞系在SEQ ID NO:01的位置425处CpG位点的平均甲基化频率,其中每个克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,所述启动子核酸具有SEQ ID NO:01的核酸序列,
d)选择细胞克隆/细胞系,所述细胞克隆/细胞系i)相对于组蛋白3水平具有0.1或更大的平均(相对)组蛋白3乙酰化水平(H3ac/H3),ii)在位置425处具有低于5%的甲基化频率,和具有如步骤ab)中所确定的10或更小的稳定整合的轻链表达盒的(拷贝)数目。
在一个实施方案中,相对于组蛋白3水平的(相对)组蛋白3乙酰化水平是0.2或更大。在一个实施方案中,相对于组蛋白3水平的(相对)组蛋白3乙酰化水平是0.5或更大。在一个实施方案中,相对于组蛋白3水平的(相对)组蛋白3乙酰化水平是0.75或更大。在一个实施方案中,相对于组蛋白3水平的(相对)组蛋白3乙酰化水平是1.0或更大。
在一个优选的实施方案中,相对于组蛋白3水平的(相对)组蛋白3乙酰化水平是0.5或更大。
在一个实施方案中,平均(相对)组蛋白3乙酰化水平是位置4和/或9和/或14和/或18和/或27处的赖氨酸残基处的平均(相对)组蛋白3乙酰化水平。在一个实施方案中,赖氨酸残基在位置9和/或14和/或27处。
在一个实施方案中,启动子核酸具有SEQ ID NO:01的序列或包含其功能性片段或其功能性变体。在一个实施方案中,CpG位点位于SEQ ID NO:01的位置425处或其片段或变体中的相应位置。
在一个优选的实施方案中,如步骤b)所测定的稳定整合的轻链表达盒的(拷贝)数目是6或更小。
在一个实施方案中,确定相对于组蛋白3水平的(相对)组蛋白3乙酰化水平(H3ac/H3)包括以下步骤:
1)从每个细胞克隆/细胞系分离染色质,
2)通过适合确定(相对)组蛋白3乙酰化水平的抗体(例如组蛋白3乙酰化特异性抗体)处理染色质第一等分试样并形成抗体-染色质沉淀物,以及通过适合确定组蛋白3水平的抗体(例如组蛋白3特异性抗体)处理染色质第二等分试样并形成抗体-染色质沉淀物,
3)从染色质的第三未处理等分试样和从第一和第二处理的等分试样用实时定量PCR扩增基因组DNA,
4)用步骤3)中获得的结果确定相对于组蛋白3的水平而言的(相对)组蛋白3乙酰化水平。
在一个实施方案中,确定甲基化频率包括以下步骤:
1)从每个细胞克隆/细胞系分离DNA,
2)对每种分离的DNA单独进行甲基化特异性聚合酶链反应,
3)用步骤2)中获得的结果确定甲基化频率。
在一个实施方案中,步骤2)是
2)对每种分离的DNA用甲基化特异性引物和通用引物单独进行聚合酶链反应。
还在一个实施方案中,步骤2)是
2)用限制性酶分别消化分离的DNA并且对每种消化的DNA用甲基化特异性引物和通用引物进行聚合酶链反应。
在一个实施方案中,引物彼此独立地选自SEQ ID NO:06至20。
在一个实施方案中,引物选自SEQ ID NO:11、14和15,通用引物具有SEQ ID NO:09的序列,并且甲基化特异性引物选自SEQ ID NO:17、18和19。
在一个实施方案中,通用引物具有SEQ ID NO:09和11的序列并且甲基化特异性引物具有SEQ ID NO:11和18的序列。
在一个实施方案中,相对于组蛋白3水平的(相对)组蛋白3乙酰化水平(H3ac/H3)对参比基因归一化。在一个实施方案中,参比基因是Gusb。
在一个实施方案中,第二组细胞克隆/细胞系包含至少一个还包含于第一组细胞克隆/细胞系中的细胞克隆/细胞系。在一个实施方案中,第二组细胞克隆/细胞系与第一组细胞克隆/细胞系相同。
在一个实施方案中,细胞克隆/细胞系是真核细胞克隆/细胞系。在一个实施方案中,细胞克隆/细胞系是哺乳动物细胞克隆/细胞系。在一个实施方案中,细胞克隆/细胞系选自CHO、BHK、HEK和Sp2/0。在一个实施方案中,细胞克隆/细胞系是CHO细胞克隆/细胞系。在一个实施方案中,细胞克隆/细胞系是CHO K1细胞克隆/细胞系。
在一个优选的实施方案中,细胞克隆/细胞系是CHO细胞克隆/细胞系。
在一个实施方案中,多肽是i)抗体,或ii)抗体片段,或iii)抗体缀合物,或iv)抗体轻链和抗体重链。在一个实施方案中,抗体是双特异性抗体。
如本文中报道的一个方面是一种用于产生多肽的方法,所述方法包括以下步骤:
a)用如本文中报道的方法选择细胞克隆/细胞系,
b)培养选择的细胞克隆/细胞系,和
c)从培养基和/或细胞克隆/细胞系回收多肽并且因而产生多肽。
在一个实施方案中,该方法包括在步骤a)之前的以下步骤:
a-3)提供非人类哺乳动物细胞,
a-2)用核酸转染提供的细胞,所述核酸包含了包含与启动子核酸有效连接的编码多肽的结构基因的核酸,所述启动子核酸具有SEQ ID NO:01的核酸序列,
a-1)i)任选地在选择剂存在下培养转染的细胞克隆/细胞系,ii)单一沉积转染的细胞,和iii)在选择剂存在下培育单一沉积的转染细胞。
如本文中报道的一个方面是一种用于产生多肽的方法,所述方法包括以下步骤:
a)用如本文中报道的方法选择细胞克隆/细胞系,
b)培养选择的细胞/克隆,和
c)从培养基和/或细胞回收多肽并且因而产生多肽。
在一个实施方案中,该方法包括又一个步骤
d)纯化回收的多肽。
在一个实施方案中,该方法包括在步骤a)之前的以下步骤:
a-3)提供细胞,
a-2)用核酸转染提供的细胞,所述核酸含有与启动子核酸有效连接的编码多肽的结构基因,
a-1)i)任选地在选择剂存在下培养和增殖转染的细胞,ii)单一沉积细胞,和iii)在选择剂存在下培养单一沉积的转染细胞。
在一个实施方案中,步骤a)包括:
i)提供至少一个包含核酸的细胞,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,
ii)确定SEQ ID NO:01的启动子核酸内部位置425处CpG位点的甲基化,和
iii)选择产生多肽的细胞,其中步骤b)中确定的甲基化低于阈值。
发明详述
需要经济的细胞系以在小规模至大规模增殖期间提供高生产率和稳定的生产水平。放大期间生产率下降构成了细胞系开发期间的严重风险(Barnes,L.M.等人,Biotechnol.Bioeng.81(2003)631-639)。生产不稳定性的一个主要原因是有效拷贝数随多个细胞周期推移减少,这可能归因于作为CHO细胞内在特征(Kim,M.等人,Biotechnol.Bioeng.108(2011)2434-2446)和/或由基因扩增过程诱导(Kaufman,R.J.等人,Mol.Cell.Biol.(1983)699-711)的染色体破坏/重排。在重组基因拷贝数恒定时mRNA的减少是生产率降低的另一个主要原因(Barnes,L.M.等人,Biotechnol.Bioeng.85(2004)115-121;Chusainow,J.等人,Biotechnol.Bioeng.102(2009)1182-1196;Strutzenberger,K.等人,J.Biotechnol.69(1999)215-226)。发生这种情况的合理解释是因启动子甲基化(Osterlehner,A.等人,Biotechnol.Bioeng.108(2011)2670-2681;Yang,Y.等人,J.Biotechnol.147(2010)180-185)和如脱乙酰化和特异性甲基化所代表的组蛋白修饰(Mutskov,V.和Felsenfeld,G.,EMBO J.23(2004)138-149;Paredes,V.等人,Biotechnol.Lett.35(2013)987-993)所致的外遗传沉默。另外,提出重组序列本身、形成串联重复序列和转基因的基因组位置是基因沉默的起因(Kaufman,W.L.等人,Nuc.AcidsRes.36(2008)e111)。从这里,相邻染色质对整合位点的影响称作‘位置效应’(Lattenmayer,C.等人,Cytotechnol.51(2006)171-182;Yin,Z.等人,Genet.Mol.Res.11(2012)355-369)。
重组基因上游的启动子启动基因转录并且能够影响基因表达水平和稳定性(Kaufman,W.L.等人,Nuc.Acids Res.36(2008)e111)。人巨细胞病毒的主要立即早期基因启动子(hCMV-MIE)常用来在用于研究和生产的哺乳动物细胞中驱动重组表达,以在瞬时和稳定转染中获得高表达水平(Boshart,M.等人,Cell 41(1985)521-530;Chapman,B.S.等人,Nuc.Acids Res.19(1991)3979-3986;Foecking,M.K.和Hofstetter,H.Gene 45(1986)101-105;Wright,A.等人,Hum.Gene Ther.16(2005)881-892)。尽管hCMV-MIE启动子提供了高基因表达水平,但是许多研究已经报道在长期培养期间生产率下降(Bailey,L.A.等人,Biotechnol.Bioeng.109(2012)2093-2103;Barnes,L.M.等人,Biotechnol.Bioeng.73(2001)261-270;He,L.等人,Biotechnol.Bioeng.109(2012)1713-1722)。hCMV-MIE启动子沉默(除拷贝数丢失之外)主要归因于外遗传事件:启动子DNA甲基化和组蛋白修饰(Brooks,A.R.等人,J.Gene Med.6(2004)395-404.;Kim,M.等人,Biotechnol.Bioeng.108(2011)2434-2446;Osterlehner,A.等人,Biotechnol.Bioeng.108(2011)2670-2681;Paredes,V.等人,Biotechnol.Lett.35(2013)987-993;Yang,Y.等人,J.Biotechnol.147(2010)180-185)。
已知染色质参与基因表达调节。修饰DNA或染色质和/或染色质结合的蛋白质如组蛋白影响染色质结构并因此影响基因表达。可以通过使CpG二核苷酸中的胞嘧啶残基甲基化,进行哺乳动物细胞中的DNA修饰。可以通过乙酰化、甲基化、磷酸化或遍在蛋白化修饰组蛋白,特别是其N末端部分。
细胞的核酸内容物(即其DNA)以压缩形式连同组蛋白一起存在于细胞核中。组蛋白将DNA压缩并整理成核小体。人类中存在5种主要的组蛋白。组蛋白是高度碱性的蛋白质。组蛋白H3(组蛋白3)具有一个主要球状结构域和一个N末端尾。它具有137个氨基酸残基的大小。组蛋白通常具有提供核心结构的功能,其中围绕所述核心结构存在DNA并且调节基因表达。
组蛋白可以按许多不同方式修饰,主要沿取决于具体组蛋白而范围从13个至40个氨基酸长度的N端氨基酸序列的残基发生。这种巨大的修饰数目甚至因以下事实而增加:一些修饰(如赖氨酸甲基化)包括多达三种不同状态(Kouzarides,T.,Cell 128(2007)693-705)。已经发现超过100种组蛋白修饰(Zentner,G.E.和Henikoff,S.,Nat.Struct.Mol.Biol.20(2013)259-266)。组蛋白H3和组蛋白H4尾部残基的乙酰化和甲基化是研究最充分的修饰。总体上,已经发现14种不同类型的修饰(Dawson,M.A.和Kouzarides,T.,Cell 150(2012)12-27)并且在下表中列出。
表:K,赖氨酸;R,精氨酸;S,丝氨酸;T,苏氨酸;E,谷氨酸;P,脯氨酸;ac,乙酰化;me,甲基化;cit,瓜氨酸;cr,巴豆酰化;pr,丙酰化;bu,丁酰化;fo,甲酰化;oh,羟化;a,非对称;s,对称;>,转化。改编自(Dawson和Kouzarides,2012)。
这些修饰的组合,称作PTM(翻译后修饰)基序,与功能相关而非单独的标识。对修饰组合的研究提出超过200种不同的PTM基序(Feller,C.等人,Mol.Cell 57(2015)559-571)。修饰是可逆的。
已知组蛋白H3在赖氨酸9(H3K9)和27(H3K27)处的甲基化是导致基因阻遏的修饰。组蛋白修饰似乎提供不稳定的转录阻遏作用,而DNA甲基化是不容易逆转的高度稳定的沉默标记(Cedar,H.和Bergman,Y.,Nat.Rev.Gen.10(2009)295-304)。
组蛋白乙酰化在1961年作为首个组蛋白修饰发现(Phillips,D.M.,Biochem.J.87(1963)258-263)。早期研究将活跃的转录基因与组蛋白过度乙酰化联系,这提示乙酰化在转录过程中的功能(Allfrey,V.G.等人,Proc.Natl.Acad.Sci.USA 51(1964)786-794)。在S期期间,观察到乙酰化位点如H3K56ac全面增加,随后在G2期期间减少。这导致如下结论:组蛋白乙酰化可能促进新合成的组蛋白掺入(Miller,K.M.等人,Cell Cycle 5(2006)2561-2565)。除其在DNA复制期间的全面作用之外,组蛋白乙酰化形成与活跃转录相关的特定基因组样式。因而,异染色质区域低度乙酰化并且常染色质转录活跃的基因高度乙酰化(Kouzarides,T.,Cell 128(2007)693-705)。在启动子中与转录起点位点(TSS)接近的特定位点处存在乙酰化峰(Wang,Z.等人,Nat.Genet.40(2008)897-903)。组蛋白3的N末端尾在位置4、9、14、18处和组蛋白4的N末端尾在赖氨酸5、8、和12处的组蛋白赖氨酸残基优势地易于乙酰化。总之,基因表达、DNA复制、修复和重组的调节受组蛋白的不同乙酰化状态影响(Dawson,M.A.和Kouzarides,T.,Cell 150(2012)12-27)。
组蛋白乙酰转移酶(HATS)通常介导基因表达及转录激活(Cheung,P.等人,Cell103(2000)263-271)。使用染色质免疫沉淀法,已经发现非甲基化的DNA大多在含有与开放染色质结合的乙酰化组蛋白的核小体中装配,而相同DNA序列上甲基的存在与含有非乙酰化组蛋白H3和H4的核小体的装配相关,导致更紧凑的染色质(Cedar,H.和Bergman,Y.,Nat.Rev.Gen.10(2009)295-304;Eden,S.等,Nature 394(1998)842-843;Hashimshony,T.等人,Nat.Gen.34(2003)187-192)。组蛋白H3是5种天然存在的组蛋白当中最过度修饰的组蛋白。
在高转录活性区域中,可以发现高程度的组蛋白乙酰化。组蛋白乙酰化由组蛋白-乙酰基-转移酶(HAT)催化,所述酶将乙酰-CoA的乙酰基部分转移至N端区域中特定组蛋白赖氨酸残基的ε-氨基。组蛋白乙酰化排他性在赖氨酸残基例如H3K9(在组蛋白3的位置9处的赖氨酸)、H3K14和H3K27处发生(Koch,C.M.等人,Gen.Res.17(2007)691-707;Creyghton,M.P.等人,Proc.Natl.Acad.Sci.USA 107(2010)21931-21936)。
在细胞系开发期间和在大规模生产中常观察到在延长的(大规模)宿主细胞培养期间发生重组基因表达沉默。在哺乳动物细胞中,这可以例如归因于染色质衍生物形成,这阻碍重组基因的转录。
在较长培养时间后,如在大规模生产中(包括种子培养发酵和主发酵),这产生不均一的细胞群体。在这种不均一的细胞群体中,某些细胞继续表达高水平的目的重组蛋白,而其他细胞表达少量目的蛋白或甚至不表达目的蛋白(参见,例如Martin,D.I.和Whitelaw,E.,Bioessays 18,(1996)919-923;McBurney,M.W.等人,Exp.Cell.Res.274(2002)1-8)。
生产细胞系通常是来自单一亲本细胞的后代。这些细胞经常在培养期间放大并且以大规模发酵长时间培养(种子培养和生产发酵),产生高达25000升的培养体积及经常超过1百万个细胞/毫升的细胞密度。这类大规模发酵能显示生产率大幅度降低(Migliaccio,A.R.等人,Gene 256(2000)197-214;Strutzenberger,K.等人,J.Biotechnol.69(1999)215-226)。
为了选择生产细胞系/细胞克隆,即意在用于大规模重组产生多肽(例如抗体)的细胞克隆/细胞系,细胞克隆/细胞系的生产/表达稳定性是重要的,即丧失了一代一代之间不同的生产率。因此,用于重组蛋白生产的哺乳动物细胞系需要在延长的培养时间范围内维持生产率。通常,通过经历长时间段(即多个世代)培养细胞克隆/细胞系确定细胞克隆/细胞系的生产稳定性。按定期时间间隔,将培养基用新鲜培养基稀释并且基于产物滴度和活细胞密度测定比生产率/细胞。比生产率的变化(通常是降低)显示细胞克隆/细胞系的长期生产稳定性。
长期稳定性研究耗费大量时间和资源,但是所述长期稳定性研究被广泛地进行以确定并消除细胞系开发期间不稳定的候选者。取决于目的标准,这项研究涵盖30至60次细胞分裂,这通常对应于30天至70天。因此,所需的材料和工时是明显的。这可以因以下事实而甚至更明显看出:多达75%的受试细胞系/细胞克隆不是稳定的并且因此必须评估大量细胞系/细胞克隆。
除了转基因丢失外,生产性细胞系的不稳定性可能与用于表达转基因的异源启动子的甲基化和沉默相关(参见,例如Escher,G.等人J.Lipid Res.46(2005)356-365;Krishnan,M.等人,FASEB J.20(2006)106-108;Yang,Y.等人,J.Biotechnol.147(2010)180-185)。启动子沉默可以因外遗传修饰染色质(构成细胞胞核内容物的DNA和蛋白质的组合或复合物)而产生。这可以是启动子例如人巨细胞病毒主要立即早期启动子/增强子(hCMV MIE)内部CpG二核苷酸的直接甲基化和/或组蛋白的翻译后修饰。除了失活性组蛋白修饰(如组蛋白3的赖氨酸9或27的甲基化),还已知活化性修饰,如组蛋白3的赖氨酸4的甲基化,或组蛋白3和4的总体乙酰化(参见,例如Cedar,H.和Bergman,Y.,Nat.Rev.Genet.10(2009)295-304)。
使用hCMV-MIE启动子的CpG甲基化的外遗传修饰用作长期生产稳定性的指标(参见Osterlehner等人)。
本文,确定局部赖氨酸乙酰化(H3ac)作为长期转基因沉默的潜在预测标记。
已经发现,在不稳定产生抗体的中国仓鼠卵巢(CHO)细胞系中人CMV主要立即早期(hCMV)启动子/增强子(SEQ ID NO:01)在位置425处的CpG二核苷酸频繁地甲基化。已经建立甲基化特异性实时qPCR以允许快速和敏感地测量hCMV-MIE甲基化。
已经进一步发现,可以利用与启动子毗邻的组蛋白的翻译后修饰作为进一步的标记以鉴定稳定的表达性/生产性细胞系。失活性修饰的存在是相应细胞克隆/细胞系非常不稳定并且在未来培养过程期间将显示高于平均的生产率下降(长期不稳定的生产性细胞克隆/细胞系)的标记。在另一方面,活化性修饰的存在是相应细胞克隆/细胞系非常稳定并且在未来培养过程期间将显示低于平均的生产率下降(长期稳定的生产性细胞克隆/细胞系)的标记。
已经发现,通过使用以上两种标记的组合,即SEQ ID NO:01的位置425处的甲基化和相对于与启动子核酸接近的组蛋白3水平而言的相对组蛋白3乙酰化水平(H3ac/H3),可以实现进一步改善长期稳定性生产型重组细胞系/细胞克隆的确定。在抗体的情况下,如果还包括稳定整合的轻链表达盒的(拷贝)数目,则进一步改善是可能的。
因此,本文中报道了用于选择细胞克隆/细胞系的方法以及使用这种细胞克隆/细胞系生产多肽的方法。选择的细胞克隆/细胞系是长期生产性细胞。可以如本文中报道那样,基于i)相对于与启动子核酸接近的组蛋白3水平而言的相对组蛋白3乙酰化水平(H3ac/H3),或ii)基于与编码多肽的结构基因有效连接的人CMV主要立即早期(hCMV MIE)启动子/增强子在位置425处的甲基化,或iii)基于i)和ii)的组合,选择这种细胞克隆/细胞系。
A.定义
术语“几乎”指这种表述后的值是具有某种变异度的中心值。在一个实施方案中,变异度是该值的±40%,在另一个实施方案中,变异度是±30%,并且在又一个实施方案中,变异度是是±20%。因此,术语几乎恒定指在一个实施方案中,值处于60%至140%范围内,在另一个实施方案中处于70%至130%范围内,和在又一个实施方案中处于80%至120%范围内。
术语“抗体”指包含至少两个所谓轻链多肽(轻链)和两个所谓重链多肽(重链)的分子。每个重链多肽和轻链多肽包含可变结构域(可变区)(通常是多肽链的氨基端部分),所述可变结构域包含能够与抗原相互作用的结合区。每个重链多肽和轻链多肽还包含恒定区(通常是羧基端部分)。重链的恒定区介导抗体i)与携带Fcγ受体(FcγR)的细胞(如吞噬细胞)结合;或ii)与携带新生儿Fc受体(FcRn)(也称作Brambell受体)的细胞结合。它还介导与某些因子结合,包括经典补体系统的因子如组分(C1q)结合。
术语“抗体”在本文中以最广意义使用并且涵盖各种抗体结构物,包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如,双特异性抗体)和抗体片段,只要它们显示出所需的抗原结合活性即可。
取决于重链恒定区的氨基酸序列,将抗体划分为不同类别:IgA类、IgD类、IgE类、IgG类和IgM类。这些类别中的某些类别进一步划分成亚类(同种型),即IgG的IgG1、IgG2、IgG3和IgG4,或IgA的IgA1和IgA2。根据抗体所属的类别,重链恒定区分别称作α(IgA)、δ(IgD)、ε(IgE)、γ(IgG)和μ(IgM)。在一个实施方案中,抗体是IgG类抗体。在另一个实施方案中,抗体具有人类恒定区或衍生自人源的恒定区。在又一个实施方案中,抗体属于IgG4亚类或IgG1、IgG2或IgG3亚类,所述抗体以这样的方式受到修饰,从而不能检测到Fcγ受体(例如FcγRIIIa)结合和/或C1q结合。在一个实施方案中,抗体是人IgG4亚类或突变的人IgG1亚类。在一个实施方案中,抗体是具有突变L234A和L235A的人IgG1亚类。在另一个实施方案中,就Fcγ受体结合作用而言,抗体是IgG4亚类或IgG1或IgG2亚类,在L234、L235和/或D265中具有突变,和/或含有PVA236突变。在又一个实施方案中,抗体具有选自S228P、L234A、L235A、L235E、SPLE(S228P和L235E)和/或PVA236的突变(PVA236意指从IgG1的氨基酸位置233至236的氨基酸序列ELLG(按单字母氨基酸代码给出)或IgG4的EFLG由PVA替换)。在一个实施方案中,抗体是IgG4亚类并且具有IgG4的突变S228P,或抗体是IgG1亚类并且具有突变L234A和L235A。
免疫球蛋白的轻链或重链的可变结构域因而包含不同的区段,即4个构架区(FR)和3个高变区(CDR)。
术语“亚硫酸氢盐处理”指核酸中的胞嘧啶碱基在亚硫酸氢盐离子存在下转化成尿嘧啶碱基的反应,而5-甲基-胞嘧啶碱基并未显著地转化。这种检测甲基化胞嘧啶的反应由Frommer等人(Frommer,M.等人,Proc.Natl.Acad.Sci.USA 89(1992)1827-1831)以及Grigg和Clark(Grigg,G.W.和Clark,S.,Bioessays 16(1994)431-436;Grigg,G.W.,DNASeq.6(1996)189-198)详述。亚硫酸氢盐反应含有可以分别或同时实施的脱胺步骤和脱磺化步骤。所述的5-甲基-胞嘧啶碱基并未显著转化仅应当考虑如下事实:尽管意在仅仅和排他地转化(非甲基化的)胞嘧啶碱基,但不能排除小百分数的5-甲基-胞嘧啶碱基转化成尿嘧啶。
术语“细胞”指可以向其中引入/转染核酸(例如编码(任选地异源)多肽的核酸)的细胞。术语“细胞”包括用于增殖质粒的原核细胞和用于表达核酸的真核细胞。在一个实施方案中,细胞是真核细胞并且在又一个实施方案中,真核细胞是哺乳动物细胞。在另一个实施方案中,哺乳动物细胞选自以下哺乳动物细胞,包括CHO细胞(例如CHO K1、CHO DG44)、BHK细胞、NS0细胞、SP2/0细胞、HEK 293细胞、HEK 293 EBNA细胞、细胞和COS细胞。如本文所用,表述“细胞”包括主题细胞及其后代。因此,术语“细胞”指原代主题细胞和从其衍生的培养物,而无论转移次数是多少。还应当理解,全部后代可以在DNA含量方面不是精确地相同,原因在于有意或不经意突变。包括具有与最初转化细胞中所筛选的相同功能或生物活性的变体后代。
术语“CpG位点”指核酸内部可以由细胞甲基化酶识别并且其中胞嘧啶可以转化成5-甲基胞嘧啶的二核苷酸CG。在一个实施方案中,CpG位点在启动子核酸内部。
术语“表达盒”指含有用于在细胞中至少表达所含核酸而必需的调节元件(如启动子和多聚腺苷化位点)的构建体。
术语“表达质粒”指一种核酸,其提供在细胞中表达所包含的结构基因所需的全部元件。一般地,表达质粒包含原核质粒增殖单元,例如针对大肠杆菌的原核质粒增殖单元,包括复制起点,和选择标记、真核选择标记,以及一个或多个用于表达目的结构基因的表达盒,所述表达盒各自包含启动子核酸、结构基因和包括多聚腺苷化信号的转录终止子。基因表达通常置于启动子核酸的控制下,并且将这种结构基因称作“与该启动子核酸有效连接”。类似地,如果调节元件调节核心启动子核酸的活性,则调节元件和核心启动子核酸有效连接。
术语“世代时间”指细胞分裂以产生子代细胞所需的时间。因此,已经分裂过一次的细胞具有一个世代年龄。术语“世代”指细胞的细胞分裂次数。
术语“高频率”指基于分别分析统计显著数目的独立细胞或DNA克隆的甲基化,胞嘧啶在这个甲基化位点比在其他甲基化位点处更经常地甲基化。这种统计显著数目在一个实施方案中分别是至少10个独立细胞或DNA克隆,在又一个实施方案中分别是至少15个独立细胞或DNA克隆,并且在另一个实施方案中分别是至少20个独立细胞或DNA克隆。在一个实施方案中,分别分析最多400个细胞或DNA克隆。
术语“长期生产性细胞”指产生多肽,在一个实施方案中产生异源多肽的细胞,其中细胞的比生产率几乎恒定至少30个世代。在一个实施方案中,长期生产性细胞具有几乎恒定至少30个世代的比生产率,在另一个实施方案中具有几乎恒定至少45个世代的比生产率并且在又一个实施方案中几乎恒定至少60个世代的比生产率。在一个实施方案中,长期生产性细胞具有几乎恒定直至60个世代的比生产率,在又一个实施方案中几乎恒定直至75个世代的比生产率并且在另一个实施方案中几乎恒定直至90个世代的比生产率。
术语“甲基化”指在已经用核酸转染的细胞内部的过程,所述核酸包含与启动子有效连接的编码多肽的结构基因,在所述过程中启动子核酸的胞嘧啶转化成5-甲基胞嘧啶。其中至少一个胞嘧啶转化成5-甲基胞嘧啶的启动子核酸称作“甲基化”核酸。
如本文中所用的术语“单克隆抗体”指从基本上均一的抗体群体获得的抗体,即,该群体包含的各个抗体是相同的和/或结合相同的表位,除了可能的变体抗体之外(例如,含有天然存在突变或在产生单克隆抗体制备物期间出现),这类变体通常以微小的量存在。与一般包括针对不同决定簇(表位)的不同抗体的多克隆抗体制备物相反,单克隆抗体制备物的每种单克隆抗体针对抗原上的单一决定簇。因此,修饰语“单克隆的”指示该抗体的特征为从基本上均一的抗体群体获得,并且不得解释为要求通过任何特定方法产生该抗体。例如,可以通过多种技术产生待根据本发明使用的单克隆抗体,所述技术包括但不限于杂交瘤方法、重组DNA方法、噬菌体展示方法和利用含有全部或部分的人免疫球蛋白基因座的转基因动物的方法,本文中描述了用于产生单克隆抗体的这类方法和其他示例性方法。在一个实施方案中,抗体是单克隆抗体。
术语“有效连接的”指两个或更多个组件的接近,其中如此描述的组件处于允许它们以其预期方式发挥功能的关系中。例如,如果启动子顺式发挥作用以控制或调节所连接序列的转录,则启动子和/或增强子与编码序列有效连接。通常但不必然地,“有效连接”的DNA序列是连续的,并且在需要连接两个蛋白质编码区如分泌性前导序列和多肽的情况下,它们是连续的且符合可读框的。然而,虽然有效连接的启动子通常位于编码序列的上游,但是它不必然地与编码序列连续。增强子不必是连续的。如果增强子增加编码序列的转录,则增强子与编码序列有效连接。有效连接的增强子可以位于编码序列上游、其内部或下游并且远离启动子。如果多聚腺苷化位点位于编码序列的下游端,从而转录穿过编码序列继续行进至多聚腺苷化序列中,则多聚腺苷化位点与编码序列有效连接。如果翻译终止密码子位于编码序列的下游端(3'末端)处,从而翻译穿过编码序列继续行进至终止密码子并在此终止,则翻译终止密码子与外显子核酸序列有效连接。通过本领域已知的重组方法,例如,使用PCR方法学和/或通过在便利的限制性位点处连接,完成连接。如果便利的限制性位点不存在,则根据常规惯例使用合成的寡核苷酸衔接子或接头。
术语“多肽”指由肽键连接的氨基酸组成的聚合物,无论是天然产生或合成产生。小于约20个氨基酸残基的多肽可以称作“肽”,而由两条或更多条多肽组成或包含超过100个氨基酸残基的一条多肽的分子可以称作“蛋白质”。多肽还可以包含非氨基酸组分,如糖基团、金属离子或羧酸酯。非氨基酸组分可以由表达多肽的细胞添加并且可以随细胞类型变动。多肽在本文中根据它们的氨基酸主链结构或编码它们的核酸来定义。添加物如糖基团通常不特别说明,然而它们可以存在。
术语启动子核酸的“变体”指在启动子核酸内部,一个或多个核苷酸在不干扰启动子核酸功能的情况下被改变。这种变化可以是移除或引入限制性位点。
术语“产生”指在细胞中表达插入表达盒中的结构基因。该术语包括转录和翻译核酸的过程。在适宜的原核或真核细胞中进行产生,并且可以在裂解后从细胞回收或从培养上清液回收表达(即产生)的多肽。
术语“启动子核酸”指控制与它有效连接的基因/结构基因或核酸序列的转录的多核苷酸序列。启动子核酸包括RNA聚合酶结合和转录启动的信号。所用的启动子核酸将在其中构思表达所选择的结构基因的宿主细胞中有功能。大量启动子核酸,包括来自多种不同来源的组成型、诱导型和阻遏型启动子,是本领域熟知的(并且在数据库如GenBank中鉴定)并且是原样地或在克隆的多核苷酸内部可获得的(例如,来自保藏机构如ATCC以及其他商业来源或个人来源)。
一般地,启动子核酸位于基因的5'非编码或非翻译区内,临近于结构基因的转录起始位点。启动子核酸内部在转录起始方面发挥作用的序列元件经常以共有核苷酸序列为特征。这些元件包括RNA聚合酶结合位点、TATA序列、CAAT序列、分化特异性元件(DSE)、环状AMP应答元件(CRE)、血清应答元件(SRE)、糖皮质激素应答元件(GRE)和其他转录因子的结合位点,如CRE/ATF、AP2、SP1、cAMP应答元件结合蛋白(CREB)和八聚物因子。如果启动子核酸是诱导型启动子核酸,则转录速率响应于诱导剂而增加,如接续两个Tet操纵基因位点的CMV启动子核酸、金属硫蛋白启动子核酸和热休克启动子核酸。如果启动子核酸是以组成型方式有活性的启动子核酸,则转录速率不受诱导剂调节。在已经被鉴定为表达用强启动子核酸的真核启动子核酸中有SV40早期启动子核酸、腺病毒主要晚期启动子核酸、小鼠金属硫蛋白-I启动子核酸、劳斯肉瘤病毒长末端重复序列、中国仓鼠延伸因子1α(CHEF-1)、人EF-1α、遍在蛋白和人巨细胞病毒主要立即早期启动子核酸(hCMV MIE)。
术语“选择标记”指一种核酸,所述核酸允许在相应选择剂存在下特异性选择或反选择携带它的细胞。一般地,选择标记将在引入它的细胞中赋予药物抗性或代偿代谢缺陷或异化作用缺陷。选择标记可以是正向、负向或双官能的。有用的正向选择标记是抗生素耐药基因,其允许在相应选择剂(例如抗生素)存在下选择用该基因转化的细胞。非转化细胞不能够在选择性条件下即在选择剂存在下生长或存活。负向选择标记允许细胞携带待选择性地消除的标记。用于真核细胞的选择标记例如包括编码氨基糖甙磷酸转移酶(APH)(例如潮霉素(hyg)、新霉素(neo)和G418选择标记)、二氢叶酸还原酶(DHFR)、胸苷激酶(tk)、谷氨酰胺合成酶(GS)、天冬酰胺合成酶、色氨酸合成酶(选择剂吲哚)、组氨醇脱氢酶(选择剂组氨醇D)的结构基因和赋予嘌呤霉素、博来霉素、腐草霉素、氯霉素、博莱霉素(Zeocin)和霉酚酸耐药性的核酸。
术语“短期生产率”指如从给定时间段内产生的多肽的量和活细胞密度所确定的那样,由单个细胞在1天内产生的多肽的量,其中时间段短。在一个实施方案中,短期培养是持续2天至20天,在另一个实施方案中持续4天至15天,并且在又一个实施方案中持续10天至14天。
术语“比生产率”或“生产率”指如从给定时间段内产生的多肽的量和活细胞密度所确定的那样,由单个细胞在1天内产生的多肽的量。可以使用下式计算比生产率(SPR):
SPR=P2-P1/((D2+D1)/2*Δt) (式2)
其中
SPR[pg/细胞/d]:比生产率,
P1[μg/ml]:在时间段开始时的多肽浓度,
P2[μg/ml]:在时间段结束时的多肽浓度,
D1[细胞/ml]:在时间段开始时的活细胞密度,
D2[细胞/ml]:在时间段结束时的活细胞密度,
Δt[d]:时间段的持续期。
术语“结构基因”指无信号序列的基因区域,即编码区。
B.如本文中报道的方法
产生多肽的细胞系/细胞克隆,即用包含表达盒的核酸转染的细胞,所述表达盒含有编码异源多肽的结构基因,可以按不同类别分组:在第一类细胞中,比生产率历经多个世代几乎恒定。与之相反,在第二类细胞中,比生产率历经多个世代而随每个世代降低,尤其单调地降低。在不受这个理论约束的情况下,产生多肽的细胞和细胞系的日益减弱的生产率分别至少部分地由稳定增加的甲基化和与编码目的多肽的结构基因有效连接的启动子核酸的失活/沉默造成。另外,这种下降可以因编码目的蛋白的结构基因的拷贝丢失所致。
本发明至少部分地基于以下发现:在不稳定产生抗体的中国仓鼠卵巢(CHO)细胞系中人CMV主要立即早期(hCMV MIE)启动子/增强子(SEQ ID NO:01)在位置425处的CpG二核苷酸频繁地甲基化。这可以作为标记用于预测表达目的蛋白的重组细胞克隆/细胞系的长期重组生产稳定性,其中所述目的蛋白由有效连接于hCMV-MIE启动子(例如SEQ ID NO:01)的结构基因编码。
本发明至少部分地基于以下发现:可以利用与启动子毗邻的组蛋白的翻译后修饰作为进一步的标记以鉴定稳定的表达性/生产性细胞系。失活性修饰的存在是相应细胞克隆/细胞系非常不稳定并且在未来培养过程期间将显示高于平均的生产率下降(长期不稳定的生产性细胞克隆/细胞系)的标记。在另一方面,活化性修饰的存在是相应细胞克隆/细胞系非常稳定并且在未来培养过程期间将显示低于平均的生产率下降(长期稳定的生产性细胞克隆/细胞系)的标记。
本发明至少部分地基于以下发现:通过使用SEQ ID NO:01的位置425处甲基化和相对于与启动子核酸接近的组蛋白3水平而言的相对组蛋白3乙酰化水平(H3ac/H3)的组合,可以实现进一步改善长期稳定性生产型重组细胞系/细胞克隆的确定。
B.1.启动子甲基化
已经发现,与编码多肽的结构基因有效连接的人CMV MIE启动子的启动子核酸中位置425处可检测甲基化的存在分别提供了关于细胞系或细胞克隆的长期生产率的信息。
如果启动子核酸未用保护性元件屏蔽,则用于表达结构基因的每个启动子核酸包含易于被已经引入该启动子的细胞的酶甲基化的位点。可进行甲基化的位点称作CpG位点并且包含二核苷酸CG/由其组成。但是,并非全部CpG位点均以相同的相对频率甲基化-其中某些CpG位点比其他位点更经常地甲基化。已经发现,例如在人CMV MIE启动子内部的某些位点以不同频率甲基化并且对启动子沉默具有不同的影响。
以下方法可以用于确定核酸序列中的CpG位点:
1)向细胞提供这样的多肽生产率,所述多肽生产率在选择剂不存在下30个细胞世代的培养时间后小于90%在首个培养世代后的细胞生产率,
2)分别从1)的细胞培养物的至少10个细胞分离DNA,
3)通过亚硫酸氢盐处理法修饰分离的DNA的胞嘧啶,
4)基于步骤3)中获得的DNA,以至少0.2的甲基化频率确定与编码多肽的结构基因有效连接的启动子核酸内部的CpG位点并且由此鉴定CpG位点。
即在一个实施方案中,不稳定细胞克隆/细胞系的一个标准是在30至60个世代的培养时间后细胞克隆/细胞系的生产率是首个培养世代后细胞克隆/细胞系的生产率的60%或较之更小。
在一个实施方案中,细胞系在培养30-60个世代后具有超过开始培养时生产率60%的生产率。
通过亚硫酸氢盐处理法修饰分离的DNA的胞嘧啶的步骤可以包括以下步骤:
3-a)在亚硫酸根离子存在下温育分离的DNA,因而DNA脱胺,并且
3-b)在碱性条件下温育脱胺的DNA,因而脱胺的DNA脱磺化。
一种获得产生多肽的细胞克隆/细胞系的方法是包括至少一个转染步骤和至少一个选择步骤的方法,所述选择步骤包括转染后随即或在选择剂存在下生长后对成功转染的细胞进行单个细胞沉积(single cell depositing)。在选择步骤中,将细胞基于其短期比生产率,即基于短期培养后上清液中的多肽浓度来鉴定。在选择的细胞中,一些细胞具有经历多个世代几乎恒定的比生产率并且其他具有经历多个世代单调下降的比生产率。因此,采用通常使用的(短期)选择标准,不能特异性选出具有稳定长期生产率的一个细胞或多个细胞。
在如本文报道的方法中,可以分析通过采用包含表达盒的表达质粒转染所获得的任何细胞克隆/细胞系,其中所述表达盒包含与编码由转染细胞待产生的目的多肽的结构基因有效连接的启动子核酸。表达质粒通常还包含选择标记。因此,将细胞在选择剂存在下在转染步骤后和在选择步骤之前培养。备选地,该方法可以包括将细胞在选择剂存在下,在无先前单个细胞沉积或有限稀释的情况下(即作为汇集物)培养。进一步备选地,该方法可以包括将细胞在单个细胞沉积或有限稀释后培养。
在汇集培养/选择后,必须进行单个细胞沉积。如果在汇集培养步骤后进行单个细胞沉积,则在单个细胞沉积后还进一步培养细胞。
为了鉴定具有经历多个世代几乎恒定的比生产率的细胞系或细胞克隆,上清液中的多肽浓度和活细胞密度必须在长期培养下经历多个世代在定义的培养时间测定。因此适用的方法是本领域技术人员已知的,分别如ELISA和FACS。
可以通过亚硫酸氢盐处理单链DNA(例如在pH 5)连同后续的碱脱硫过程,鉴定具有高甲基化频率的CpG位点。本文中,可以区分甲基化和非甲基化的CpG位点。在特定处理条件下,胞嘧啶而非5-甲基-胞嘧啶在N-杂环位置4处脱胺并转化成尿嘧啶。将互补的DNA链转化成两条链,链A和链B,它们不再互补。这种确定可以基于这些链的任一条链。
对于启动子核酸或者对于启动子核酸和细胞系的组合,这种长期培养必须仅进行一次。如果第二次使用相同的启动子核酸或者相同的细胞和启动子组合,选择可以基于已经采集的数据。
在亚硫酸氢盐处理后,众多技术可以用来揭示甲基化等位基因和非甲基化等位基因之间的序列差异。例如,可以将目的序列(链A或链B)通过PCR在非甲基化特异性条件下(即采用对甲基化位点不敏感的引物)扩增,并且随后通过多种方法如DNA测序法(在克隆或不克隆的情况下)、高分辨率解链温度分析法或微阵列分析法分析。在另一个实施方案中,可以采用甲基化敏感或甲基化特异性引物或探针进行定量PCR(qPCR)。在备选的方案中,将甲基化的DNA用5-甲基胞嘧啶特异性抗体沉淀,随后进行定量聚合酶链反应。
甲基化特异性PCR(MSP)也可以用来在不事先PCR扩增目的区域的情况下直接解析亚硫酸氢盐处理的DNA的序列。MSP中使用的引物应当包含一个或多个CpG位点。它们与未转化的5-甲基-胞嘧啶互补以检测甲基化的DNA,或与从胞嘧啶转化的尿嘧啶互补以检测非甲基化的DNA。
对许多细胞确定CpG位点的甲基化。在一个实施方案中,细胞数目是至少10个,在另一个实施方案中是至少15个,并且在又一个实施方案中是至少20个。此后,计算CpG位点的甲基化频率,即计算在CpG位点处甲基化的细胞的数目除以所分析的细胞总数。具有高甲基化频率的CpG位点是具有甲基化频率至少0.2、在一个实施方案中至少0.25、在一个实施方案中至少0.4以及在一个优选的实施方案中至少0.5的CpG位点。
已经发现在用于生产多肽的细胞或细胞系中,甚至甲基化启动子核酸的低水平(即预定阈值以上)都可以用来预测长期培养期间生产率的下降。
在图1中显示了从不同细胞获得的相同启动子核酸的甲基化CpG位点数目。
人CMV MIE启动子是如下文中所述的核酸序列(CpG位点加下划线):
ATGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGAC GTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTAGCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCCGTTTAGTGAACG(SEQ ID NO:01)。
在SEQ ID NO:01中,存在33个CpG位点,它们是核酸甲基化的潜在位点。采用如上文概述的方法,可以鉴定在人CMV MIE启动子内部优势地甲基化的胞嘧啶残基。
保留全部CpG位点的链A具有核苷酸序列
ATGTTGATATTGATTATTGATTAGTTATTAATAGTAATTAATTACGGGGTTATTAGTTTATAGTTTATATATGGAGTTTCGCGTTATATAATTTACGGTAAATGGTTCGTTTGGTTGATCGTTTAACGATTTTCGTTTATTGACGTTAATAATGACGTATGTTTTTATAGTAACGTTAATAGGGATTTTTTATTGACGTTAATGGGTGGAGTATTTACGGTAAATTGTTTATTTGGTAGTATATTAAGTGTATTATATGTTAAGTACGTTTTTTATTGACGTTAATGACGGTAAATGGTTCGTTTGGTATTATGTTTAGTATATGATTTTATGGGATTTTTTTATTTGGTAGTATATTTACGTATTAGTTATCGTTATTAGTATGGTGATGCGGTTTTGGTAGTATATTAATGGGCGTGGATAGCGGTTTGATTTACGGGGATTTTTAAGTTTTTATTTTATTGACGTTAATGGGAGTTTGTTTTGGTATTAAAATTAACGGGATTTTTTAAAATGTCGTAATAATTTCGTTTTATTGACGTAAATGGGCGGTAGGCGTGTACGGTGGGAGGTTTATATAAGTAGAGTTTCGTTTAGTGAACG
(SEQ ID NO:02)并且完全脱胺的链A具有核苷酸序列
ATGTTGATATTGATTATTGATTAGTTATTAATAGTAATTAATTATGGGGTTATTAGTTTATAGTTTATATATGGAGTTTTGTGTTATATAATTTATGGTAAATGGTTTGTTTGGTTGATTGTTTAATGATTTTTGTTTATTGATGTTAATAATGATGTATGTTTTTATAGTAATGTTAATAGGGATTTTTTATTGATGTTAATGGGTGGAGTATTTATGGTAAATTGTTTATTTGGTAGTATATTAAGTGTATTATATGTTAAGTATGTTTTTTATTGATGTTAATGATGGTAAATGGTTTGTTTGGTATTATGTTTAGTATATGATTTTATGGGATTTTTTTATTTGGTAGTATATTTATGTATTAGTTATTGTTATTAGTATGGTGATGTGGTTTTGGTAGTATATTAATGGGTGTGGATAGTGGTTTGATTTATGGGGATTTTTAAGTTTTTATTTTATTGATGTTAATGGGAGTTTGTTTTGGTATTAAAATTAATGGGATTTTTTAAAATGTTGTAATAATTTTGTTTTATTGATGTAAATGGGTGGTAGGTGTGTATGGTGGGAGGTTTATATAAGTAGAGTTTTGTTTAGTGAATG
(SEQ ID NO:03)。保留全部CpG位点的链B具有核苷酸序列
CGTTTATTAAACGGAGTTTTGTTTATATAGATTTTTTATCGTATACGTTTATCGTTTATTTGCGTTAATGGGGCGGAGTTGTTACGATATTTTGGAAAGTTTCGTTGATTTTGGTGTTAAAATAAATTTTTATTGACGTTAATGGGGTGGAGATTTGGAAATTTTCGTGAGTTAAATCGTTATTTACGTTTATTGATGTATTGTTAAAATCGTATTATTATGTTAATAGCGATGATTAATACGTAGATGTATTGTTAAGTAGGAAAGTTTTATAAGGTTATGTATTGGGTATAATGTTAGGCGGGTTATTTATCGTTATTGACGTTAATAGGGGGCGTATTTGGTATATGATATATTTGATGTATTGTTAAGTGGGTAGTTTATCGTAAATATTTTATTTATTGACGTTAATGGAAAGTTTTTATTGGCGTTATTATGGGAATATACGTTATTATTGACGTTAATGGGCGGGGGTCGTTGGGCGGTTAGTTAGGCGGGTTATTTATCGTAAGTTATGTAACGCGGAATTTTATATATGGGTTATGAATTAATGATTTCGTAATTGATTATTATTAATAATTAGTTAATAATTAATGTTAATAT
(SEQ ID NO:04)并且完全脱胺形式的链B具有核苷酸序列
TGTTTATTAAATGGAGTTTTGTTTATATAGATTTTTTATTGTATATGTTTATTGTTTATTTGTGTTAATGGGGTGGAGTTGTTATGATATTTTGGAAAGTTTTGTTGATTTTGGTGTTAAAATAAATTTTTATTGATGTTAATGGGGTGGAGATTTGGAAATTTTTGTGAGTTAAATTGTTATTTATGTTTATTGATGTATTGTTAAAATTGTATTATTATGTTAATAGTGATGATTAATATGTAGATGTATTGTTAAGTAGGAAAGTTTTATAAGGTTATGTATTGGGTATAATGTTAGGTGGGTTATTTATTGTTATTGATGTTAATAGGGGGTGTATTTGGTATATGATATATTTGATGTATTGTTAAGTGGGTAGTTTATTGTAAATATTTTATTTATTGATGTTAATGGAAAGTTTTTATTGGTGTTATTATGGGAATATATGTTATTATTGATGTTAATGGGTGGGGGTTGTTGGGTGGTTAGTTAGGTGGGTTATTTATTGTAAGTTATGTAATGTGGAATTTTATATATGGGTTATGAATTAATGATTTTGTAATTGATTATTATTAATAATTAGTTAATAATTAATGTTAATAT
(SEQ ID NO:05)。
在图4中显示不同细胞系中各个CpG位点处的甲基化频率。已经通过分析19至22个不同克隆确定这些数字,其中在用包含表达目的多肽的表达盒的质粒转染后,从不同CHO亲本细胞系获得所述克隆。对每个细胞系显示了单个DNA的甲基化模式(底部)和单个CpG位点处的甲基化频率(顶部)。细胞系K18.1例如高度甲基化(图4A)。在不同CpG位点甲基化频率不相等,但是似乎以3个团簇为中心,即在5'-末端、3’-末端和位置(或分别是核苷酸)400周围。22个测序的插入物中14个插入物在位置425处具有胞嘧啶。图4E中显示细胞系43-16A10中启动子核酸的甲基化。甲基化的分布类似于对细胞系K18.1观察到的分布。与K18.1一样,位置425最经常甲基化:20个测序的插入物中5个插入物在这个位置含有胞嘧啶。
在其他三个分析的细胞系中,在不同的CpG位点零星检测到胞嘧啶,即作为单个事件检测到(图4B、4C和4D)。为了对总体甲基化频率低的细胞系获得统计显著性,需要对数百个插入物测序。另外,这些单个事件还可能代表因不完整的胞嘧啶脱胺而非实际启动子甲基化所致的假阳性事件。
为了可靠地确定CpG位置特异性甲基化,已经开发了甲基化特异性PCR方法。对于甲基化特异性PCR,可以使用如下表1中所示的引物。单独或组合的这些引物也是如本文中报道的方面。
表1:可以在甲基化特异性PCR中使用的引物。
在引物评价过程中,已经发现对位置425处具有胞嘧啶的脱胺CMV启动子DNA呈高度选择性的甲基化特异性引物对在其特性方面不同(参见图6)。在一个实施方案中,甲基化特异性PCR的引物具有SEQ ID NO:14和SEQ ID NO:18的核苷酸序列。
因此,在如本文报道的方法的一个实施方案中,启动子核酸是SEQ ID NO:01的人CMV启动子核酸。在一个实施方案中,具有高甲基化频率的CpG位点是在SEQ ID NO:01的位置(bp)425处的CpG位点。
表2:qPCR中甲基化特异性(MSP)引物对和通用引物对的预期结果。
通用引物对应当扩增全部四种模板,而MSP引物对应当选择性地扩增模板#62(SEQID NO:22)和模板#01(SEQ ID NO:23)。在模板#62和模板#01上,ΔCp值应当在MSP引物对和通用引物对之间尽可能地小。相反地,用MSP引物对在模板#11(SEQ ID NO:21)和#04(SEQID NO:24)上获得的Cp值应当尽可能地高,即与采用通用引物对的扩增相比,ΔCp应当是最大的。
即便在位置416和437处存在其他两个甲基化位置,甲基化特异性引物应当能够在位置425处选择性地检出5-甲基胞嘧啶。
采用1%至100%的甲基化频率可能测定甲基化。
采用甲基化特异性PCR并且通过克隆和测序,观察到甲基化程度方面的可比结果,其中甲基化特异性PCR灵敏得多。长期生产中生产率降低的细胞系在位置425处具有甲基化频率高于阈值的甲基化状况。在一个实施方案中,阈值2倍于测定方法的背景噪声。具有长期稳定生产率的细胞系在CpG位点处具有低于阈值的甲基化频率。
对于高分辨率解链温度分析,扩增启动子核酸,从位置334开始直至位置487,即154bp。图10A中显示一个示例性解链温度分析并且在图10B中显示其一阶导数。可以看出,采用高分辨率解链温度分析,甲基化启动子核酸(模板#16,SEQ ID NO:25)可以与非甲基化启动子核酸(模板#11)区分。可以按50%或更大的相对频率检出甲基化的启动子核酸片段。可以按10%或更大的相对频率检出非甲基化的启动子片段。
该数据显示,可以通过测量位置425处胞嘧啶的甲基化状态预测重组CHO细胞系的生产稳定性,所述重组CHO细胞系含有表达受人CMV主要立即早期启动子/增强子驱动的重组引入的基因。
因此,已经发现,可以使用C425甲基化的确定作为预示性标记以确定生成的重组细胞克隆中多肽表达的稳定性。这允许在细胞系开发期间选择具有稳定生产率的稳定克隆。已经进一步发现,5%或更小的C425甲基化是选择稳定细胞克隆的合适标准(这考虑了所用检测方法的阈值)。还已经发现,可以通过测试前在MTX不存在下将细胞克隆培养某个时间,减少错误预测为稳定的细胞克隆(假阴性细胞克隆)的比例。
因此,本文中报道了通过选择在SEQ ID NO:01的位置425处具有5%或更小的相对启动子甲基化的细胞,从转染细胞的群体富集表达重组多肽的长期(稳定)细胞系的方法。可以使用如本文报道的甲基化特异性qPCR方法连同如本文报道的引物,确定这种相对甲基化频率。
已经建立了定量hCMV-MIE核苷酸在CpG位点425处甲基化的敏感和精确PCR方法,已经评估了重组CHO细胞系K18.1、43 16 A10和G45-2中的甲基化。直接或在PCR扩增完整hCMV-MIE区域后使用已经通过测序法分析的亚硫酸氢盐处理的DNA作为甲基化特异性实时qPCR中的模板(图8A和图8B)。两个分析设置均提供可比较的结果。更重要地,结果与亚硫酸氢盐测序结果很好地相关。这表明,CpG位点425甲基化特异性qPCR测定法可以用来度量重组CHO细胞系中CpG位点425处的hCMV-MIE甲基化并且可以在不事先PCR扩增靶DNA的情况下使用。
原则上,可以探索CMV主要立即早期启动子/增强子DNA内部的其他CpG位点来预测生产不稳定性。然而,发现在C425处的甲基化大约5倍高于全部CpG位点处的平均甲基化。另外一些位点甚至在高度甲基化的细胞克隆不甲基化,例如C280和C289(图4F、图4J和图13)。通过选择正确(即频繁修饰)的CpG位点用于启动子甲基化分析,该测定法变得更灵敏。如果随机选择CpG位点用于分析,可能遗漏克隆G25-17、G25-10和43-16 A10的约10%的明显甲基化。
通过解析一种启动子核酸内部有关CpG位点的甲基化状态的稳定性预测也可以用于其他异种启动子核酸。
为了评价早期启动子甲基化和生产不稳定性的潜在相关性,将稳定性研究伊始的CpG位点425甲基化对选择剂(MTX)存在或不存在下qP的相对改变作图。图11A(存在MTX)和11B(不存在MTX)中显示相关性图。为了评价,将绘图区域以5%甲基化(等于2倍至3倍的甲基化测量背景,即检测限)和40%qP下降(代表生产稳定性的接受限值(这也是如本文报道的方法的一个实施方案))时的限值划分成4个隔区。测定不同隔区中克隆的数目。使用Pearson卡方检查依据甲基化状态的稳定性状态列联分析以p值0.05显示采用MTX时培养的显著关联并且以p值0.13显示不采用MTX时培养的趋势。证明在CpG位点425处甲基化小于5%的大部分克隆存在于稳定克隆的部分中(在存在或不存在MTX的情况下qP下降小于40%,左上隔区中所示)。
因此,总结上文,长期培养和放大期间的生产率损失是开发生产性细胞系中的主要风险。因此,需要可以快速和容易测定和检查的生产不稳定性分子标记。已经发现,启动子甲基化可以用来预测重组CHO细胞系中的生产率损失。为了评估这种情况,分析了广泛使用的hCMV-MIE启动子/增强子的一个603bp区域内部33个CpG位点的DNA甲基化。研究的该区域的总体甲基化水平在约1%和18%的全部CpG位点之间变动。1%表观甲基化代表技术上可实现的背景,其因非甲基化胞嘧啶的不完全脱胺作用产生。另外,在甲基化启动子内部,甲基化水平在各个CpG位点之间大幅度变动并且在三个团簇中积累,其中在CpG位点425处最大。在位点CpG425处的甲基化大约5倍高于全部其他CpG位点的平均甲基化程度。在另一方面,一些CpG位点似乎完全不甲基化,甚至在高度甲基化的细胞系中也是如此。hCMV-MIE的总体甲基化以及各个CpG位点之间甲基化的分布能在细胞类型和组织之间明显地变动(参见,例如Kong,Q.等人,PLoS One 4(2009)e6679;Krishnan,M.等人,FASEB J.20(2006)106-108;Mehta,A.K.等人,Gene 428(2009)20-24)。
已经发现,CpG位点425的优势甲基化适合作为hCMV-MIE甲基化的标记。已经确立CpG位点425甲基化特异性qPCR作为一种具有中等通量的快速和灵敏方法。当通过CpG位点425甲基化特异性qPCR分析大量细胞系时,已经发现大部分不稳定性生产细胞在CpG位点425显示超过5%的甲基化,甚至在长期培养前也是如此,而大部分稳定生产细胞在这个位点显示小于5%的甲基化。
仅仅在携带超过10拷贝异源质粒的克隆中发现CpG位点425的早期甲基化。此前报道已经提供了某种证据:多个转基因拷贝的串联重复序列在哺乳动物细胞中更易于甲基化和沉默(Garrick,D.等人,Nat.Genet.18(1998)56-59;McBurney,M.W.等人,Exp.CellRes.274(2002)1-8)。
B.2.组蛋白酰化
确定了与hCMV-MIE启动子接近的组蛋白修饰的相对量。检查了H3ac和H3K4me3标记(活化性标记)和H3K9me3以及H3K27me3标记(阻遏标记)。检查了在SEQ ID NO:01的位置404至507处(人CMV-MIE启动子序列;tacatca atgggcgtgg atagcggttt gactcacggggatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactt)的这些组蛋白修饰,所述位置表示转录起始位点上游-97至-200bp的序列并且在位置C-425(即转录起始位点上游-179bp)处含有CpG位点并且可以用引物对396/397扩增。
将相对于与人CMV主要立即早期启动子/增强子片段接近的组蛋白3水平而言的相对组蛋白3乙酰化水平作为存在和不存在选择剂的情况下生产稳定性的预测标记研究。
将来自培养起点(原代种子库)的两个示例性冷冻细胞系解冻并且测定了与hCMV-MIE启动子接近的指定组蛋白修饰的相对量。独立地执行项目T和项目H并且将每个细胞系在存在(+)和不存在(-)选择剂(250nM甲氨蝶呤)的条件下培养至少60个世代。
测定hCMV-MIE启动子甲基化速率(mC-425)的数据、来自(PSB)的拷贝数/细胞以及60个世代范围内比生产率的改变百分数(ΔqP)。如Osterlehner等人先前所描述那样进行数据记录。
表:项目T的12个细胞系的数据。mC-425是在培养期开始时(PSB)在hCMV-MIE的转录起始位点上游位置425处(TSS;相对于TSS的-179)胞嘧啶的甲基化%的均值;ΔqP是在60个细胞世代的时间范围内比生产率的改变%(qP);在培养开始时(PSB)测量IgG转基因的轻链(LC)平均拷贝数。
表:20个项目H细胞系的数据。mC-425是在培养期开始时(PSB)在hCMV-MIE的TSS上游位置425处胞嘧啶的甲基化%的均值;ΔqP是在60个细胞世代的时间范围内比生产率(qP)的改变%;在培养开始时(PSB)测量IgG转基因的轻链(LC)平均拷贝数。
为了研究组蛋白修饰的相对量,收获携带受hCMV-MIE启动子驱动的重组基因的活CHO细胞。在3.7%甲醛中固定后,经超声处理裂解的染色质并且根据适宜的组蛋白修饰纯化交联的DNA-组蛋白复合物。随后,用蛋白酶K降解积累的DNA-组蛋白复合物并洗脱DNA片段。使用特异性引物对,用qPCR比较各种DNA片段的量。
为了相对于参比区域的相应修饰而言验证抗体-组蛋白结合一致性,对多种基因测试特定组蛋白修饰的积累。首先,将抗体过滤的与参比区域接近的组蛋白修饰的量与项目T和项目H中非特异性无抗体对照(模拟)的纯化样品按每种一份样品比较。使用抗体纯化样品、模拟和未处理的输入样品的DNA片段作为qPCR的模板。将潜在参比区域的引物对添加至每份样品并且一式三份进行qPCR。将获得的Cq值作为输入样品的百分数比较。在两个项目中,抗体纯化的样品在适宜的区域中获得比模拟更高的值。这证实适宜的结合作用。另外,活化标记H3ac和H3K4me3在活跃区域Eif3i和Gusb积累。相反地,沉默的区域Fox2a具有较高浓度的H3K9me3,而H3K27me3醒目地位于Gata5区域。在两个项目中,不同的组蛋白修饰匹配于相应的对照区。
靶区域上组蛋白修饰的相对量的估计值严格依赖于修饰的稳定参比区域。
与hCMV-MIE启动子接近的特定组蛋白修饰对参考序列的归一化能够进行不同细胞系的比较。为此目的,参考序列必须具有稳健和可重复水平的相应组蛋白修饰。
在下表中,对项目T和项目H展示全部细胞系的平均Cq值和变异系数(CV)(包括三个生物学重复)。
表:项目T和H中的参比区域。对两个项目计算全部ChIP样品(包括生物学三次重复)的Cq值的平均数和适宜变异系数(CV);各行显示基因组内部的不同参比区域;各列含有特定组蛋白修饰;所选择的针对适宜外遗传修饰的对照区以粗体标记;因而距模拟的Cq距离和CV是决定性的;在两个项目中,活化标记H3ac、H3K4me3以及总组蛋白3在Gusb和Eif3i区域稳定积累(CV 2%);较低的Cq值决定Gusb作为活化标记的参比;全部潜在参比区域均具有稳定的总组蛋白3值。
Gusb作为活跃组蛋白修饰H3ac和H3K4me3的参比区域和Gata5作为H3K27me3的稳定区域不同于适宜的模拟对照,并且具有一致的Cq值。有效对照区Eif3i和Gusb是高度稳定的。对于全部对照区,观察到总组蛋白3(H3)稳定积累。
对重组表达抗体项目的CHO细胞系的生物学三次重复分析与hCMV-MIE启动子位置接近的组蛋白修饰。为此,使用针对特定组蛋白修饰的抗体,纯化染色质片段,消化以获得无蛋白质的基因组DNA并通过实时PCR定量(参见图26)。对使用的每个参比区域进行归一化。为了确定每种引物对的扩增效率,使用LinReg PCR软件,2014.5版(Ruijter,2009,LinRegPCR)。全部引物-模板对的扩增效率非常相似。因此,Livak方法用于归一化,其中假定扩增效率相似。
表:引物效率。对全部细胞系(包括生物学三次重复)确定扩增效率;使用引物对(396/397);为此目的,qPCR原始数据用于LinReg PCR软件,2014.5版并计算效率;各行依据不同的引物对区分;平均列含有每种引物-模板对的平均扩增效率并且标准差列含有适宜的标准差;全部扩增效率之间的差距小于2%;因此,Livak方法用于归一化。
依据Livak的归一化包括两个归一化步骤:
-在第一步骤中,与hCMV-MIE启动子接近的组蛋白3修饰的量(Cq)对参比区域处组蛋白3修饰的量(Cq)归一化→ΔCq
-在第二步骤中,将归一化的组蛋白3修饰设定成与hCMV-MIE启动子接近的归一化总组蛋白3→ΔΔCq
这最终显示与hCMV-MIE启动子接近的每个组蛋白3的相对修饰量。
总组蛋白3在全部参比区域中稳定,这允许用相同的参比区域归一化组蛋白修饰和总组蛋白3。这最小化了归一化方法中的变异。例如,每个组蛋白3的相对组蛋白乙酰化对对照区Gusb归一化,因为Gusb区域包含稳定量的经修饰组蛋白和总组蛋白3。以下式用于计算:
将组蛋白修饰/组蛋白3的相对量(ΔΔCq)和与hCMV-MIE启动子接近的总组蛋白3的量(ΔCq)对ΔqP值作图。与hCMV-MIE启动子接近的总组蛋白3对Gusb归一化并且针对ΔqP值拟合。此外,检查组蛋白3/相对拷贝数(H3/rCN)和模拟/组蛋白3(模拟/H3)。H3/rCN理想地扣减拷贝数并且是与hCMV-MIE启动子接近的相对组蛋白3密度(H3D)的量值。模拟/H3是背景噪声/组蛋白3的非特异性效应。
用标准最小二乘拟合模型检验相关性。为此目的,使用软件JMP10(10.0.1发布:2,64位版本;SAS Institute Inc.)。
表:外遗传修饰对长期生产稳定性影响的度量。列中展示在选择压力(250nM MTX)存在(+)和不存在(-)时影响ΔqP的P值;测量与hCMV-MIE启动子接近的全部影响并且按行排序;在标准最小二乘模型中用软件JMP10计算归一化组蛋白3的影响(H3)、组蛋白3的密度/相对拷贝数(H3/rCN)、背景噪声/组蛋白3(模拟/H3)和修饰/组蛋白3(H3ac/H3、H3K4me3/H3、H3K27me3/H3和H3K9me3/H3);在项目H中,如果细胞在选择压力(+)下培养,则乙酰化/组蛋白3(H3ac/H3)对ΔqP具有高度显著的影响,在ΔqP+条件下H3/rCN、模拟/H3、H3K4me3、H3K27me3和H3事件也产生中等至高度显著的影响。
n.d.=未测定
hCMV-MIE启动子处每个组蛋白3的乙酰化程度(H3ac/H3)对选择剂MTX存在下经60个世代获得的生产率损失具有高度显著的影响。
对H3/rCN、模拟/H3、H3K4me3/H3、H3K27me3/H3和H3观察到进一步显著的影响(列出了从最弱至最强烈繁荣影响)。在考虑模拟/H3和单独H3的影响水平情况下,单独H3对联合作用X/H3具有明显影响。已经发现具有比单独H3影响更大的外遗传事件是良好的预测标记:→H3ac/H3。
进行Jackknife离群分析。因而,通过比较两种选择剂条件的ΔqP找到了一式三份的一个离群值。就这项分析而言,从影响测量中排除细胞系H-18。此后,在排除细胞系H-18后,用影响筛选模型再次分析项目H的样品。已经发现hCMV-MIE启动子处每个组蛋白3的乙酰化丢失(H3ac/H3)对两种选择条件下经60个世代获得的生产率损失具有最显著的影响。
表:排除离群细胞系H-18后修饰对项目H中的长期稳定性的影响度量。列中展示在选择压力(250nM MTX)存在(+)和不存在(-)时影响ΔqP的P值;测量与hCMV-MIE启动子接近的全部影响并且按行排序;在标准最小二乘模型中用软件JMP10计算归一化组蛋白3的影响(H3)、组蛋白3的密度/相对拷贝数(H3/rCN)、背景噪声/组蛋白3(模拟/H3)和修饰/组蛋白3(H3ac/H3、H3K4me3/H3、H3K27me3/H3和H3K9me3/H3);对于H3ac/H3,可以在两种选择条件下观察到对ΔqP的最显著影响。
在项目T中,H3ac/H3对ΔqP的图显示长期稳定性和乙酰化/组蛋白3同时增加,特别在选择压力下是这样。
为了解释hCMV-MIE启动子处不同水平的组蛋白3,将组蛋白3乙酰化进一步对组蛋白3归一化(H3ac/H3)。
将相对组蛋白3乙酰化水平(H3ac/H3)与选择剂MSX存在(+)和不存在(-)下60个世代范围内的比生产率的改变(ΔqP)比较。在离群分析后,用生物学重复的H3ac/H3值和19个CHO细胞系的ΔqP值输入标准最小二乘回归模型。检测到H3ac/H3和ΔqP的显著相关性。
对于H3ac/H3值,用jmp软件计算决策树。用LogWorth统计学计算最佳分割节点并且因此计算最佳滤子。对于样品H,计算(+)MSX条件下的最佳分割是相对于组蛋白3水平而言的0.58组蛋白3乙酰化(H3ac/H3)。为了减少假阴性样品数目,设定滤子至下限值A>0.5H3ac/H3。
对于每个阳性门,计算在分别存在或不存在选择剂MTX或MSX的条件时ΔSPR(ΔqP)的均值并且与未过滤的均值比较,并如下展示:
与未过滤的条件相比,滤子A>0.5H3ac/H3增加平均ΔSPR。
B.3.启动子甲基化和组蛋白乙酰化的组合
研究相对于与人CMV主要立即早期启动子/增强子片段接近的组蛋白3水平而言的相对组蛋白3乙酰化水平和人CMV主要立即早期启动子/增强子片段的C-425甲基化百分数作为存在和不存在选择剂的情况下生产稳定性的预测标记。
对于每个阳性门,计算在存在或不存在选择剂的条件时ΔSPR的均值并且与未过滤的均值比较,并如下展示:
与未过滤的条件相比,滤子A>0.5H3ac/H3与滤子B<5%mC-425[%]PSB组合增加了平均ΔSPR。
更详细地,使用Jmp10软件计算决策树以确定H3ac/H3比率的阈值,旨在允许排除低劣生产细胞。LogWorth统计学用来鉴定最佳分割节点。将LogWorth计算为:-log10(p值),其中以复合方式计算修正的p值,所述复合方式考虑了分割可能发生的不同方式的庞大数目(Sall,2002,Monte Carlo Calibration of Distributions of PartitionStatistics;SAS白皮书)。ΔqP+条件的最佳分割是0.47乙酰化/组蛋白3。为了最小化假阳性值,将阈值设定至0.5H3ac/H3并且变换成项目H和T中的两种条件。
此外,从记录的甲基化数据(参见上表)确定hCMV-MIE启动子甲基化的5%阈值(%mC-425)以利用两种预测标记的(协同)组合。因此,排除hCMV-MIE启动子处DNA甲基化超过5%或乙酰化/组蛋白3小于0.5的样品。
对阳性经滤子筛选的样品计算ΔqP的平均数并且与未过滤样品的平均ΔqP比较。这在考虑是否添加MTX至培养基的情况下进行。
预测标记H3ac/H3的使用导致所纳入样品的长期稳定性增加。
两个项目中过滤后的平均ΔqP几乎相同。
表:排除低劣生产细胞。值高于0.5H3ac/H3和低于5%mC-425的样品用来计算平均ΔqP;令人感兴趣地,对于两个项目中,经滤子筛选的ΔqP几乎相同。
项目T N 平均ΔqP+ 平均ΔqP-
未过滤 36 -0.29 -0.41
A>0.5H3ac/H3 7(19%) -0.19 -0.32
B<5%mC-425 24(67%) -0.28 -0.43
项目H N 平均ΔqP+ 平均ΔqP-
未过滤 56 -0.39 -0.55
A>0.5H3ac/H3 23(41%) -0.15 -0.38
B<5%mC-425 27(48%) -0.24 -0.45
hCMV-MIE启动子处组蛋白3乙酰化的程度对稳定性具有显著影响。另外,总H3的量和位置C-425处的甲基化程度(%mC-425)对长期稳定性具有影响。另外,发现的H3ac/H3和%mC-425的负相关证实了这些标记的可靠性。
阈值设定导致排除全部低劣生产细胞。高于这个值的细胞优势地稳定。
B.4.启动子甲基化和组蛋白乙酰化及转基因拷贝数的组合
组蛋白3乙酰化与DNA甲基化和拷贝数的相关性是显著的,这为拷贝数、DNA甲基化和组蛋白3乙酰化的相互关系提供了证据。已经发现,DNA甲基化程度与组蛋白3乙酰化相反。已经进一步发现拷贝数对组蛋白3乙酰化和DNA甲基化提供以下事实:具有较高拷贝数的细胞系基本上是非乙酰化的并且易于DNA甲基化。已经发现在选择剂存在和不存在下拷贝数和长期生产率改变的相关性。因此,拷贝数与标记的程度相互作用,这转而影响长期生产稳定性。
此外,标准细胞系开发中因根据其抗体滴度早期选择细胞系而引发不稳定细胞系的无意积累。假定具有低拷贝数目的细胞系需要是占优地有活性,然而具有高拷贝数的生产细胞能具有大量不同的外遗传状态,从每个独立转基因无活化、中等活化至高度活化,只要转录物的总数可比较即可。考虑到这一点,根据抗体滴度的第一选择偏好可能碰巧具有稳定整合位点的具有高拷贝数的细胞系或略微被迫拥有这些稳定整合位点的低拷贝数细胞系。来自培养起始阶段的拷贝数对稳定性作图,并且发现具有大数目转基因的细胞系倾向于不稳定。
因此作为一个方面,本文中报道了一个三步骤细胞系选择方法/过程。在第一步骤中,扩增具有轻链低拷贝数的表达抗体的细胞,在第二步骤中根据它们的组蛋白3乙酰化程度进行选择。此后,快速减少选择剂。因而,获得了具有稳定整合位点、基因沉默和拷贝数损失的风险降低以及用预加胁迫的去稳定化机制鉴定亚群的细胞系。
在一个实施方案中,稳定整合的轻链表达盒的拷贝数低于50。在另一个实施方案中,稳定整合的轻链表达盒的拷贝数低于25。在又一个实施方案中,稳定整合的轻链表达盒的拷贝数低于10。在又一个实施方案中,稳定整合的轻链表达盒的拷贝数低于6。
提供以下实施例、序列表和附图以辅助理解本发明,本发明的真实范围在所附权利要求书中阐述。可以理解,可以对所述方法作修改而不脱离本发明的精神。
附图简述
图1:从不同细胞系获得的hCMV-MIE启动子/增强子的甲基化CpG位点数目。
图2:p5057的质粒图。
图3:A:在选择剂不存在下长期生产中经历多个世代的细胞系K18.1的比生产率。B:在选择剂不存在下长期生产中经历多个世代的细胞系G25-10的比生产率。C:在选择剂不存在下长期生产中经历多个世代的细胞系G25-17的比生产率。D:在选择剂不存在下长期生产中经历多个世代的细胞系G42-5的比生产率。E:在选择剂不存在下长期生产中经历多个世代的细胞系43-16 A10的比生产率。
图4:上图:通过分析19-22个分别的启动子核酸确定的来自重组CHO细胞系的hCMV-MIE DNA启动子/增强子内部不同甲基化位点处的甲基化频率;下图:来自重组CHO细胞系的hCMV-MIE启动子/增强子DNA内部甲基化CpG位点的示意图—甲基化位点以黑色显示—位置425由箭头突出显示。
A:细胞系K18.1—全部CpG位点甲基化:12%,位点C425甲基化:64%,位点C591甲基化:27%,位点C96甲基化:32%;
B:细胞系G25-10–全部CpG位点甲基化:0.5%,位点C425甲基化:0%,位点C591甲基化:5%,位点C96甲基化:0%;
C:细胞系G25-17–全部CpG位点甲基化:0.3%,位点C425甲基化:0%,位点C591甲基化:0%,位点C96甲基化:0%;
D:细胞系G42-5–全部CpG位点甲基化:0.6%,位点C425甲基化:0%,位点C591甲基化:0%,位点C96甲基化:0%;
E:细胞系43-16 A10–全部CpG位点甲基化:4.4%,位点C425甲基化:25%,位点C591甲基化:15%,位点C96甲基化:10%。
图5:通过甲基化特异性实时qPCR区分位点425处甲基化的hCMV-MIE启动子/增强子与位点425处非甲基化的hCMV-MIE;模板#11(A)、#62(B)、#01(C)和#04(D)的PCR扩增曲线。
图6:不同甲基化特异性引物和引物对的PCR扩增曲线。
图7:在非甲基化hCMV-MIE启动子/增强子的背景下通过甲基化特异性实时qPCR回收位点425甲基化的hCMV-MIE启动子/增强子。
图8:用引物#239和#267采用预扩增(A)获得和从亚硫酸氢盐处理的基因组DNA(B)直接获得的在甲基化位点425处甲基化的hCMV-MIE启动子/增强子核酸。
图9:用引物(黑色)239+237和239+267、(白色)263+237和263+267、(水平线)264+237和264+267和(垂直线)239+237和239+266获得的在甲基化位点425处甲基化的hCMV-MIE启动子/增强子核酸。
图10:示例性高分辨归一化的解链曲线分析法(A)和其一阶导数,即解链峰(B)。
图11:长期培养前C425处的甲基化程度和在有250nM MTX(A)或无MTX(B)的情况下60个世代培养后SPR相对改变的相关性。
图12:长期培养前C425处的甲基化程度和在有250nM MTX的情况下60个世代培养后甲基化程度的相关性。
图13:来自克隆44-28的hCMV-MIE启动子/增强子DNA内部的甲基化CpG位点的示意图。甲基化位点以黑色显示。核苷酸位置425由箭头突出显示。全部CpG位点甲基化:18%;在C425处的甲基化:80%;在C591处的甲基化:70%;在C96处的甲基化:60%。
图14:在无MTX的情况下在稳定性试验之前和之后的轻链基因拷贝数。
图15:对参比基因Gusb归一化的相对于与人CMV主要立即早期启动子/增强子片段接近的组蛋白3水平而言的相对组蛋白3乙酰化水平。3次生物学重复之间的变异性由标准差展示。
图16:对参比基因Gusb归一化的相对于与人CMV主要立即早期启动子/增强子片段接近的组蛋白3水平而言的相对组蛋白3赖氨酸4三重甲基化水平。3次生物学重复之间的变异性用标准差变异性。
图17:采用3次生物学重复时样品H-1至H-20的效应H3K4me3/H3的实际值对预测值图(Actual by Predicted Plot)。以短划线显示拟合线的可信度曲线,以提供目的检验是否在5%水平显著的目视显示。曲线需要穿越显著性的水平线。
图18:采用3次生物学重复时样品H-1至H-20的效应H3ac/H3的实际值对预测值图(Actual by Predicted Plot)。以短划线显示拟合线的可信度曲线,以提供目的检验是否在5%水平显著的目视显示。曲线需要穿越显著性的水平线。
图19:样品H-1至H-20的效应mC 425[%]的实际值对预测值图(Actual byPredicted Plot)。以短划线显示拟合线的可信度曲线,以提供目的检验是否在5%水平显著的目视显示。曲线需要穿越显著性的水平线。
图20:以存在和不存在MSX作为条件用ΔSPR的Jackknife距离对项目H的离群分析。样品H-18远超控制上限(UCL),这有力地显示该样品为离群值。
图21:采用3次生物学重复时样品H-1至H-17、H-19和H-20的效应H3K4me3/H3的实际值对预测值图(Actual by Predicted Plot)。以短划线显示拟合线的可信度曲线以提供目的检验是否在5%水平显著的目视显示。曲线需要穿越显著性的水平线。
图22:采用3次生物学重复时样品H-1至H-17、H-19和H-20的效应H3ac/H3的实际值对预测值图(Actual by Predicted Plot)。以短划线显示拟合线的可信度曲线以提供目的检验是否在5%水平显著的目视显示。曲线需要穿越显著性的水平线。
图23:样品H-1至H-17、H-19和H-20的效应mC-425[%]的实际值对预测值图(Actual by Predicted Plot)。以短划线显示拟合线的可信度曲线以提供目的检验是否在5%水平显著的目视显示。曲线需要穿越显著性的水平线。
图24:柱状图中标绘的样品H-1至H-17、H-19和H-20的ΔSPR值。展示了不同的选择和滤子条件。箱内部的水平线表示中位数。可信度菱形含有均值、均值的95%上限和下限。菱形的中央代表均值。菱形的顶点和底点代表第1和第3四分位数。箱具有从每个末端延伸出来的线,称作箱须。箱须从箱的末端延伸至落于计算为第1四分位数-1.5*(四分位数间范围)和第3四分位数+1.5*(四分位数间范围)的距离范围内的最靠外数据点。如果数据点未抵达计算的范围,则箱须由数据点上限和下限值(不包括离群值)决定。箱外部的括号确定最短半数(the shortest half),其是最密集的50%观察值(Rousseuw和Leroy 1987)。
图25:柱状图中标绘的项目T的ΔSPR值。展示了不同的选择和滤子条件。
图26:CHO细胞系DNA的染色质免疫沉淀法(ChIP)方案。
图27:外遗传标记、拷贝数和稳定性的相关性研究。A:在hCMV-MIE启动子处C-425甲基化对乙酰化/组蛋白3的图。B:排除细胞系H-18后在选择剂MSX不存在(-)和存在(+)下经历60个世代的CHO细胞的比生产率改变图。确定在选择剂存在和不存在下细胞系稳定性的高度相关行为。C:图显示拷贝数和组蛋白3乙酰化的相关性,表明仅具有低拷贝数的细胞系在组蛋白3处乙酰化。D:图显示拷贝数和DNA甲基化的相关性,其中仅具有高拷贝数的细胞系优势地在hCMV-MIE启动子处甲基化。E和F:图显示在选择剂存在(+)和不存在(-)下经历60个世代的拷贝数和生产率改变的相关性。因此,高拷贝数细胞系易于沉默。
图28:表达人抗体IgG类的质粒。人免疫球蛋白的轻链表达盒和重链表达盒均处于人CMV主要立即早期启动子和增强子(SEQ ID NO:01)(hCMV-MIE)的控制下。
实施例1
一般技术
溶液
重组DNA技术
如Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989)中所述的标准方法用来操作DNA。根据制造商的说明书使用分子生物学试剂。
DNA序列测定
在SequiServe GmbH(Vaterstetten,德国)进行DNA测序。
DNA和蛋白质序列分析和序列数据管理
EMBOSS(欧洲分子生物学开放软件套件)软件包和Invitrogen’sVector NTI版本9.1用于序列生成、作图、分析、注释和阐述。
蛋白质测定
色谱方法用来对样品中存在的抗体的量定量。使用结合抗体Fc区的Poros A柱。抗体与柱结合并且随后借助低pH条件洗脱。使用基于氨基酸序列计算的摩尔消光系数,采用320nm参比波长,通过在280nm测定光密度(OD),由此测定蛋白质浓度。
琼脂糖凝胶电泳
进行琼脂糖凝胶电泳以分析线性DNA片段的质量、大小和量(Chong,2001)。根据DNA片段的大小,通过煮沸,在1×TAE溶液中溶解1%(w/v)的琼脂糖溶液。凝胶含有终浓度0.5μg/ml的溴化乙锭。通过添加1/6(v/v)6×DNA上样染料制备样品。使用DNA梯作为大小标准。在1×TAE中通过施加10V/cm凝胶长度(不超过250V)进行电泳。在分离后,在凝胶记录系统中(Intas Science Imaging Instruments GmbH,Goettingen,德国)在紫外线(254-366nm)下检查DNA。
凝胶提取
在琼脂糖凝胶电泳后,将含有所需条带的凝胶片用解剖刀切下并且将凝胶切片进一步用凝胶提取试剂盒(Qiagen,希尔登,德国)提取。此后,添加3体积的QG缓冲液至1体积的凝胶(100mg约100μl)并且在50℃温育10分钟。添加一个凝胶体积的异丙醇至溶解的凝胶并混合。通过在13,000转/分钟离心1分钟,使DNA片段黏附于QIAquick离心柱并且用0.75ml缓冲液PE洗涤及随后离心(13,000转/分钟,1分钟)。在另一个收集管中的第二次洗涤移除残余洗涤缓冲液。最后,通过离心(13,000转/分钟,1分钟),将DNA在30μl无RNA酶的H2O中洗脱入样品管内。可以在Flash-凝胶(FlashGelTM系统,Lonza,科隆,德国)上检查DNA。
DNA定量
使用Nanodrop 2000(PEQLAB Biotechnologie GmbH,Erlangen,德国),通过在260nm波长测量光密度(OD)定量DNA浓度。可以通过比率OD260/280和OD260/230判断DNA的纯度。纯的DNA制备物应当拥有≥1.8和2.0的比率。
转化感受态细菌
将45微升化学感受态大肠杆菌NEB5α(NEB,德国)在冰上解冻10分钟并且此后与1pg–100ng质粒DNA(1-5μl)在冰上温育30分钟。将细胞悬液在42℃热休克45秒并且立即在冰上冷却5分钟。添加950微升室温化的SOC或LB并且将悬液在37℃温育60分钟伴随搅拌(250转/分钟)。将转化的细菌铺种在含有氨苄青霉素的预温的琼脂平板上。将平板在37℃温育过夜。
质粒制备
使用Qiagen质粒微量和大量试剂盒(Qiagen,希尔登,德国),遵循制造商的说明书,制备质粒。
DNA纯化
用Allprep DNA/RNA微量试剂盒(50)(目录号80204,Qiagen,希尔登,德国)和DNAase血液与组织试剂盒(Qiagen,希尔登,德国)根据制造商的推荐来分离并纯化基因组DNA。用高纯PCR产物纯化试剂盒(Roche Diagnostics GmbH,曼海姆,德国)遵循制造商的说明书,进行片段的纯化。
酚-氯仿提取
通过酚/氯仿提取法进行质粒浓缩和纯化。全部步骤均在化学通风橱下进行。将500微升线性化质粒与1体积酚/氯仿/异戊醇(25:24:1)(目录号A156,Roth,德国)混合并涡旋混合30秒。此后,将乳剂转移至预离心的Phase Lock GelTM Light管(目录号0032005.101,Eppendorf,Hamburg,德国)中,离心(13,000转/分钟,1分钟)。将上层水相转移入新管并且重复提取过程。此后,将上层水相与500μl氯仿/异戊醇(24:1)混合并且再重复提取步骤一次。将上层相转移入新管并且通过颠倒管4-6次与0.1初始体积的3摩尔/升乙酸钠缓冲剂(pH4.8-5.2)和0.7初始体积的100%异丙醇(20-30℃)混合。在-80℃温育20分钟接着离心(13,000转/分钟,在4℃,30分钟)后,弃去上清液。将沉淀物用冰冷的1ml 70%乙醇洗涤,离心(13,000转/分钟,在4℃,5分钟)并且弃去上清液。在无菌条件下重复洗涤步骤并且完全移除残余上清液。将沉淀物在无菌空气下干燥5-10分钟并随后溶解于0.5个初始体积的双蒸水中。
转基因拷贝数确定
根据Osterlehner等人(上文)的推荐确定hCMV-MIE启动子的转基因拷贝数以及其C-425的甲基化率。
通过以2为底数以靶输入样品hCMV-MIE启动子的Cq值与参比输入样品(例如Gusb)的Cq值的差值为幂,计算相对拷贝数(rCN)。
相对拷贝数=2(靶输入样品的Cq-参比输入样品的Cq)
染色质免疫沉淀法
收获生存力大于90%、优选地大于97%的CHO细胞系。在固定前,制备用于预清除和沉淀的珠。通过在120μl ChIP稀释缓冲液/样品中,15μl蛋白A琼脂糖浆(RocheDiagnostics GmbH,曼海姆,德国)与2μl纯化的兔IgG(目录号PP64B,Millipore,德国)温育(1小时,室温,同时转动),产生预清除用珠。为了纯化,进行两个洗涤步骤,每个步骤1体积ChIP稀释缓冲液,随后在85μl ChIP稀释缓冲液中重悬珠。在1ml ChIP稀释缓冲液中用5mg/ml BSA(Roche Diagnostics GmbH,曼海姆,德国)及100μg/ml预热的鲑精DNA(在95℃10分钟和在冰上5分钟;目录号15632-011,Invitrogen,德国)封闭15微升沉淀用琼脂糖A珠。将重悬的沉淀物在4℃温育4-5小时,同时转动,随后洗涤3次并且置于2体积的ChIP稀释缓冲液中。
如先前所描述通过向培养基添加甲醛直到终浓度3.7%和在室温温育10分钟,固定约1*107个细胞/样品(Beneke,S等人,PLoS One 7(2012)e32914)。通过添加甘氨酸直至1倍溶液,终止固定。在采用冰冷PBS进行两个洗涤步骤并在2000x g离心3分钟后,将沉淀物重悬于1ml含有蛋白酶抑制剂Roche Complete(Roche Diagnostics GmbH,曼海姆,德国)的PBS中。通过离心沉淀悬液(3000x g,5分钟,4℃)。弃去上清液。
通过添加1ml细胞裂解缓冲液加Roche Complete(Roche Diagnostics GmbH,曼海姆,德国)并在冰上温育10分钟,进行沉淀物的裂解。在离心后(2300x g,4分钟,4℃),将胞核沉淀物重悬于300μl胞核裂解液中并超声处理(输出5,占空比(Duty cycle)90%,15秒超声处理,随后在冰上温育2-3分钟,进行6个周期;Branson Sonifier B15,Dietzenbach,德国)。添加700微升胞核裂解液至超声处理的胞核,随后离心(13,000转/分钟,15分钟,4℃)。将上清液转移入新管以便储存在-80℃直至使用。在蛋白质消化后,在琼脂糖凝胶上测试超声处理级别。
通过温育(在4℃,2小时,同时转动)及离心(13,000转/分钟,6分钟,4℃,Eppendorf,Hamburg,德国)用80μl制备的蛋白A琼脂糖浆预清除染色质。将上清液转移入新管并且测定蛋白质浓度(BCA蛋白质分析试剂盒,Thermo Scientific,Rockford,美国)。将25至100微克染色质/免疫沉淀(IP)置于200μl胞核裂解缓冲液中并添加至300μl包含3μg适宜抗体的ChIP稀释缓冲液。在4℃同时转动下过夜进行免疫沉淀法。未稀释的输入样品贮存在-20℃。在温育过夜后,添加40μl封闭的蛋白A琼脂糖珠至IP溶液并且温育(在4℃,1小时,同时转动)。将沉淀物用低盐洗涤缓冲液洗涤2次,用高盐洗涤缓冲液洗涤1次,用LiCl洗涤缓冲液洗涤1次,并且用TE洗涤缓冲液洗涤1次。每次洗涤在1ml缓冲液中在转动的平台进行5分钟,随后离心(500x g,30秒,4℃)。在最后洗涤步骤后,将珠用500x g离心1分钟。珠沉淀物与200μl IP洗脱缓冲液合并,同时将25-100μg染色质输入样品用IP洗脱缓冲液补足直至200μl并且在65℃温育30分钟,同时振摇。随后,向每只管添加0.5μl无DNA酶的RNA酶(Roche Diagnostics GmbH,曼海姆,德国)后,将管在37℃温育30分钟。对于最终蛋白质消化,将10μl 4M NaCl(终浓度0.2M)和2μl蛋白酶K(终浓度100-200μg/ml,RocheDiagnostics GmbH,曼海姆,德国)添加至反应样品并且在65℃温育1.5小时。通过RochePCR纯化试剂盒(Roche Diagnostics GmbH,曼海姆,德国)纯化DNA。
亚硫酸氢盐转化
为了将非甲基化的胞嘧啶转化成尿嘧啶,根据制造商的说明书使用EZ-96DNA甲基化发光TM试剂盒(深孔样式)(ZymoResarch,Freiburg,德国)。简言之,将gDNA用DNase血液及组织试剂盒(Qiagen,希尔登,德国)提取并且用Nanodrop 2000(PEQLAB BiotechnologieGmbH,Erlangen,德国)测量浓度,以在20μl双蒸水中按350ng gDNA设定浓度。在转化平板中将20微升gDNA与130μl发光转化试剂混合。将平板在98℃温育8分钟,随后在54℃温育60分钟并且最终暂时贮存在4℃。将含有600μl M结合缓冲液/孔的Zymo-SpinTM I-96结合平板安装在收集板上。添加来自转化平板的样品至Zymo-SpinTM I-96结合平板,混合并离心(3000xg,5分钟)。将平板用400μl M-洗涤缓冲液洗涤并离心(3000x g,5分钟)。添加200μl L-脱磺化缓冲液至每个孔,温育(20-30℃,20分钟)并且随后离心(3000x g,5分钟)。用10分钟3000x g离心完成额外的洗涤步骤并且在30μl M-洗脱缓冲液中洗脱转化的DNA。转化的DNA贮存在-20℃直至使用。
扩增转化的和整合的hCMV-MIE启动子
为了研究hCMV-MIE启动子的CpG甲基化,如下设计针对启动子远端区(F1与R1)和近端区(F2与R2)的引物对:
添加每种引物10皮摩尔(0.5μl)至12.5μl ZymoTaqTM DNA聚合酶预混物(ZymoResarch,德国),3μl gDNA模板并用双蒸水补足直至25μl。用Mastercyler nexus X1(Eppendorf,Hamburg,德国)进行聚合酶链反应(PCR),PCR条件如下:
用Roche PCR纯化试剂盒(Roche Diagnostics GmbH,曼海姆,德国)在30至40μl洗脱缓冲液中纯化扩增子。用Nanodrop 2000(PEQLAB Biotechnologie GmbH,Erlangen,德国)确定浓度并且通过琼脂糖凝胶电泳展示扩增子的大小。
反向PCR
反向聚合酶链反应(iPCR)是确定随机整合的载体的整合位点的方法。从这里,切割位点附近的已知载体序列将用来产生至少20bp长度的引物。那些引物以相反方向取向。
将基因组用不在引物结合位点之间和不在载体的线性化位点处切割的频繁切割性酶(4bp切割酶)消化。所得到的片段在极稀的条件下连接,从而有利于分子内连接。现在可以用反向引物扩增环化序列。
将基因组DNA用Qiagen血液与细胞培养物DNA微量制备试剂盒(Qiagen,希尔登,德国)从每种条件2x 107个细胞(约90μg DNA)(基因组DNA可以在-20℃贮存几个月)分离并且溶解于90μl双蒸水中。
将分离的基因组DNA用不同的限制性核酸内切酶在适宜的工作温度消化最少16小时。为了消化gDNA,酶CviQI、MseI和MspI用于PvuI整合位点上游的iPCR并且酶MseI、BfaI和MluCl用于PvuI整合位点下游的iPCR。每次消化使用10微克基因组DNA(3.8x 106个拷贝)。
消化:
将消化的DNA用Roche PCR-纯化试剂盒纯化并且在xμl(200μl)洗脱缓冲液中洗脱。DNA的高稀释度有利于分子内连接。
连接
为了产生环状DNA片段,将消化的DNA在16℃用T4 DNA连接酶(NEB,法兰克福/Main,德国)连接过夜。将连接的DNA在高纯PCR纯化试剂盒(Roche Diagnostics GmbH,曼海姆,德国)的50μl洗脱缓冲液中洗脱并添加至10ng模板DNA。作为对照组,研究CHO细胞系的未转染的gDNA。
如下描述5′iPCR条件的iPCR。
将5微升PCR片段与Orange G(5μl)和双蒸水(10μl)混合并加载于琼脂糖凝胶上以验证片段的分布。对于MseI和MluCI所切割片段的5′iPCR,获得了良好结果并且在对照泳道中未检出非特异性条带。
将(用MseI和MluCI切割的)每份样品的5′扩增子组合并且用高纯PCR纯化试剂盒(Roche Diagnostics GmbH,曼海姆,德国)在40μl洗脱缓冲液中纯化。
定量实时聚合酶链反应
对于每个qPCR,在480Instrument II System(RocheDiagnostics GmbH,曼海姆,德国)中使用非特异性荧光染料480SYBRGreen I Master。使用蓝光(λmax=488nm)激发SYBR Green并且它发射绿光(λmax=522nm)。SYBR Green染料与PCR中的全部双链DNA结合。作为结果,荧光强度和fDNA产物的量同时增加,这可以在每个循环后用系统检测到。为了定量,将荧光对循环次数按对数标度作图。通过系统设定检测基于DNA的荧光的阈值,略高于发射的背景。荧光超过阈值的循环次数称作定量循环(Cq)(Bustin,S.A.等人,Clin.Chem.55(2009)611-22)。在指数扩增阶段期间,在每个新循环中预计靶DNA加倍。然而,在引物和模板之间扩增效率经常是可变的。分析所扩增的DNA片段的解链温度给出了所用引物对的特异性和引物二聚体数量的首个线索。
可以通过产生标准曲线的滴定实验或通过效率计算程序如LinRegPCR评定引物模板组合的效率。该程序使用来自系统的非基线修正的数据,对每份样品分别执行基线修正,确定线性窗口并且随后使用线性回归分析拟合贯穿PCR数据集的直线。从这条直线的斜率,计算每份独立样品的PCR效率。
对于相对定量,通过从Cq(参考)减去Cq(靶),将靶序列的量与参考序列比较。这种归一化称作ΔCq法(Schefe,J.H.等人,J.Mol.Med.(柏林)84(2006)901-910)。参考序列必须具有非常稳定的值,显著高于背景值(模拟(Mock))。因此对于每个参考序列,计算一个项目内部全部样品的平均数和变异系数并且与背景水平比较。将不同条件的Cq值显示为输入样品%,使相距模拟对照的距离可视化。
输入样品%=100*2ΔCq(输入样品-ChIP样品)
对于庞大数目的样品,全部qPCR均在384孔平板中完成。在每个孔中转移入以下成分。
体积(μl)384孔平板 溶液
5 SYBR Green Master混合物
0.5 正向引物(10pM)
0.5 反向引物(10pM)
1.5 H<sub>2</sub>O
2.5 DNA(X ng/μl)
10 总计
qPCR程序设计如下:
在相对定量组蛋白修饰的情况下,样品(已处理)对输入样品(未处理)的归一化直接更换为处理的靶序列对处理的参考序列的归一化。组蛋白修饰/组蛋白的进一步计算使得对输入样品的归一化冗余。
用Livak法(也称作ΔΔCq法)(Livak,K.J.和Schmittgen,T.D.,Methods 25(2001)402-408)估计与人CMV主要立即早期启动子/增强子片段接近的特定组蛋白修饰的相对量,只要引物-模板效率接近于2并彼此接近(Cq均值<2%的差异)。
该方法可以用于靶相对于参考的相对定量。将与人CMV主要立即早期启动子/增强子片段接近的组蛋白3乙酰化水平和组蛋白3水平的相对定量在两个步骤中归一化为与参比基因接近的组蛋白3乙酰化水平和组蛋白3水平。首先,如下计算ΔCq:
ΔCq=对照-样品
ΔCq是用不同引物对扩增的相同样品的对照(例如,Gusb的ChIP样品值)和靶(例如hCMV-MIE的ChIP样品值)之间定量循环(Cq)的距离。为了鉴定组蛋白3修饰水平/组蛋白3,使用ΔΔCq法。
测序方法
由SequiServe(SequiServe GmbH,Vaterstetten,德国)公司执行Sanger测序法。
由GATC(GATC-biotech,Konstanz,德国)和Active Motif(La Hulpe,比利时)使用Illumina测序技术执行下一代测序法。
蛋白质定量
BCA蛋白质分析试剂盒(Thermo Scientific,Rockford,美国)与蛋白质标准品比较,估计蛋白质浓度。
区室中的蛋白质分级
将蛋白质按膜/胞质核蛋白和核蛋白分级(Misawa,Y,2006)。此后,通过离心(300xg,在4℃3分钟)沉淀CHO细胞(1x 107个细胞/样品)并且将沉淀物在补充有Roche Complete(Roche Diagnostics GmbH,曼海姆,德国)的冰冷PBS中洗涤2次。将洗涤的沉淀物用1ml0.5%Triton X-100裂解缓冲液裂解并且在冰上温育15分钟。通过离心(13,000转/分钟,在4℃,15分钟)分离不溶性胞核。将含有膜/细胞质的上清液转移入新管并且在冰上冷却。将核沉淀物用裂解缓冲液淋洗一次并重悬于300μl含有0.5%SDS的裂解缓冲液中,随后超声处理(5秒,输出2,占空比90%,Branson Sonifier 450,Dietzenbach,德国)。添加700微升裂解缓冲液并且将样品在4℃以13,000转/分钟离心15分钟。将含有胞核的上清液转移入新管并且将蛋白质级分贮存在-80℃。
SDS聚丙烯酰胺凝胶电泳(SDS-PAGE)
对于变性SDS聚丙烯酰胺凝胶电泳,使用与电泳系统组合的NuPAGE凝胶(4-12%)(10%Bis-Tris凝胶1.0mm x 12孔,目录号NP0302BOX,Invitrogen,德国)。根据Quick参考卡(Bis-Tris Mini Gels),将凝胶固定在槽内,并且用1x MOPS运行缓冲液(20x NuPAGE MOPS SDS运行缓冲液,目录号NP0001,Invitrogen,德国)灌装内盒。还灌装外槽至其三分之二体积。取出齿梳并用小吸头吹扫泳道。将30μl样品添加至10μl 4x NuPAGE LDS-样品缓冲液(目录号NP0007,Invitrogen,德国)、2μl 1M DTT(终浓度50mM),并且在95℃温育5分钟。样品(20μl/泳道)和标记((10μl/泳道)预染的SeeBlue标记,目录号LC 5625,Invitrogen;(5μl/泳道)MagicMark XP抗IgG,目录号LC 5602,Invitrogen,德国)转移入泳道,并且用电泳系统向凝胶施加30伏持续50分钟。
SDS-PAGE和蛋白质印迹
在XCell II Blot-模块(Invitrogen,德国)中用适宜试剂,根据NuPAGE变性电泳方案(技术指导,手册产品编号IM1001,Invitrogen,德国),将SDS-PAGE所致的分离的蛋白质印迹至甲醇活化的硝酸纤维素膜。印迹过程在SDS-PAGE槽中以30伏实施50分钟。将印迹的蛋白质膜转移至新槽中并在1x TBS洗涤缓冲液(10x TBS:0.5M Tris-碱,1.5MNaCl,pH 7.5)中洗涤3次持续10分钟,随后在通常的蛋白质检测用Ponceau溶液(0.1%)中温育5分钟。弃去Ponceau溶液并且用1分钟TBS洗涤步骤洗去残余物2次。
将膜在20-30℃在1%封闭液(封闭液:1/10酪蛋白(Roche Diagnostics GmbH,曼海姆,德国),1x TBS)中封闭1小时。随后,将膜在第一抗体溶液(1%封闭液+抗体)中在4℃温育过夜,同时振摇。将膜在20-30℃于1x TBST中洗涤3次持续10分钟,随后是在1x TBS中的1分钟洗涤步骤。将膜在第二抗体溶液(1%封闭液+抗体)中在20-30℃温育45分钟或在4℃温育过夜,同时搅拌。将膜在20-30℃于1x TBST中洗涤3次持续10分钟,随后在1x TBS中实施2个1分钟洗涤步骤,以除去吐温。
抗体名称 稀释度(WB) 宿主 公司 目录号
H4K16ac-ab 1:5000 Millipore 07-329
抗GFP 1:2000 小鼠 SIGMA G 6539
抗Flag 1:1000-10000 小鼠 SIGMA F 3165
Gal4(DBD+O1679 1:100-1000 Santa Cruz Biotech Sc-577
α-微管蛋白 1:10000 小鼠 SIGMA T 9026
山羊抗兔 1:2000 山羊 Millipore 12-348
山羊抗小鼠 1:2500 山羊 Millipore
用Lumi-LightPLUS蛋白质印迹系统(Roche,彭茨贝格,德国)检测抗体结合作用。
CHO细胞系解冻
准备含有5ml适宜培养基的Falcon管。将冷冻管储存在干冰上,直至用于水浴(37℃)中解冻。此后,将CHO细胞置于准备的Falcon管中并以500x g离心3分钟以移除残余的DMSO。将沉淀物重悬于5ml培养基中并且在标准增湿条件(95%rH,37℃和5%至8%CO2)下以120转/分钟至150转/分钟的恒定振摇速率在一次性125ml摇瓶(含有20ml适宜的培养基)中增殖。可以用Cedex HiRes分析仪(Roche Diagnostics GmbH,曼海姆,德国)检验生存力(>95%)和细胞浓度。
CHO细胞系的培养
将未转染的CHO细胞每3-4天分瓶并以2-3x 105个细胞/ml的浓度接种在培养基中。转染的细胞随多种浓度的甲氨蝶呤(MTX)或氨基亚砜蛋氨酸(methioninesulfoximine;MSX)作为选择剂一起接种。在细胞生存力恢复(3-4周)后,在含有20nM至1200nM甲氨蝶呤(MTX)或140-160μM氨基亚砜蛋氨酸(MSX)作为选择剂的无胸苷和蛋白质的培养基中选择稳定转染的细胞。将细胞在标准增湿条件(95%rH,37℃和5%CO2)下以120转/分钟至150转/分钟的恒定振摇速率在125ml通气摇瓶中增殖。每3-4天,将细胞以2-3x105个细胞/ml的浓度分入新鲜的培养基中。使用CASY TT或Cedex HiRes细胞计数器(RocheInnovates AG,Bielefeld,德国),测定培养物的密度和生存力。
瞬时转染和稳定转染
细胞系试剂盒V(Lonza,科隆,德国)及转染平台NucleofectorTM2b Device和96孔ShuttleTM系统(Lonza,科隆,德国)进行转染。
对于每次转染,离心(200x g,5分钟)5x106个CHO细胞并且弃去上清液。将沉淀物重悬于100μl补充的Nucleofector溶液V中并通过上下抽吸添加1.2pmol无菌质粒。将质粒线性化以便稳定转染,对于瞬时转染,维持环状形式。将悬液置入无气泡的比色皿中并启动程序U-24用于CHO细胞系转染。在脉冲后,将500μl预温的培养基置入比色皿并将整个悬液转移入8ml预温的培养基中。将细胞转移至培养箱中并且两天后细胞备妥用于首次检验。
用Cellavista计数细胞
将60μl CHO细胞悬液与60μl台盼蓝(0.1μm)在96圆底孔中混合并且在20-30℃温育5分钟。此后,将处理的CHO细胞悬液用培养基1:50稀释并且转移200μl至96平底孔(Greiner,德国)中。缓慢离心(500x g,5分钟)导致细胞快速沉降。
为了精确计数细胞,从孔中部拍摄画面,以避免靠近每个孔边缘的画面显示误差。Cellavista细胞成像仪(SynenTec,Munich,德国)用于细胞计数目的。每份样品重复进行并且总计10个画面用来计算细胞计数。
用Cedex HiRes分析仪计数细胞
对于样品编号高达40的细胞计数,使用Cedex HiRes分析仪(Roche,德国)。此后,将CHO细胞按比率1:5在HiRes培养基中稀释并且转移300μl至各管中。根据制造商的推荐进行细胞计算。一式两份分析样品以验证细胞数目。
用于抗体分析的样品溶液
计算细胞浓度并且将2ml/样品离心(500x g,在20-30℃,5分钟)。将上清液转移至新的96深孔平板并贮存在-20℃直至使用。将冷冻的上清液在4℃解冻过夜,颠倒6次并离心(4,000转/分钟,在20-30℃,30分钟)。通过离心(1200转/分钟,在20-30℃,3分钟)用条码化的96圆孔平板上的多筛Millipore平板过滤310μl。
用HPLC定量抗体生产
色谱方法用来对样品中存在的抗体的量定量。使用结合抗体Fc区的Poros A柱。抗体与柱结合并且随后借助低pH条件洗脱。使用基于氨基酸序列计算的摩尔消光系数,采用320nm参比波长,通过在280nm测定光密度(OD),确立蛋白质浓度。
用ELISA定量抗体生产
ELISA(酶联免疫吸附测定)技术基于抗体夹心原理。对目的分析物例如IgG的Fc部分特异的捕获抗体与微量滴定板结合以产生固相。在封闭步骤和洗涤步骤后,样品、标准品(参考抗体的稀释系列)和对照随后与固相抗体温育,这捕获了分析物。在洗去未结合的分析物后,添加缀合的检测抗体(例如POD缀合的)。这种检测抗体与正在测量的分子的不同表位结合,完成夹心。BM化学发光ELISA底物POD(Roche Diagnostics GmbH,曼海姆,德国)提供基于过氧化物酶的(POD,HRP)二级检测系统的底物溶液。免疫测定法中的信号生成率直接与结合至固相的标记酶的量成正比。通过标准稀释度的斜率计算抗体浓度。
产生包含hCMV-MIE启动子的重组CHO细胞系
通过瞬时或稳定转染CHO-K1悬浮培养细胞,产生了表达IgG类人抗体构建体的重组细胞系。人免疫球蛋白的轻链表达盒和重链表达盒均处于人CMV主要立即早期启动子和增强子的控制下。
该载体还包含编码鼠二氢叶酸还原酶(DHFR)的核酸序列。通过Amaxa核转染系统(Lonza Cologne GmbH,科隆,德国)进行细胞的转染。
使用Nucleofector装置联合Nucleofector试剂盒V(Lonza Cologne GmbH,科隆,德国),根据制造商的操作方案,将CHO-K1 M悬液用瞬时表达抗体的环状质粒DNA转染。将瞬时转染的细胞悬液接种在96孔平板中并温育5天。
将稳定的转染细胞悬液接种在含有无胸苷培养基的384孔板或6孔板中,所述培养基以250至1600nM甲氨蝶呤(MTX)作为选择剂。在3至4周后测试表达抗体的细胞汇集物的长期稳定性,历时1至3个月时间。表达抗体的单个细胞克隆接种在384和96孔平板中。在3周后,通过ELISA测量培养基中的抗体滴度,鉴定表达抗体的细胞系。随机挑取培养孔并且为了长期稳定性测定法,将细胞克隆在更大的体积中(6孔平板中3ml/孔)扩增并且在每次传代结束时,通过蛋白A HPLC和ELISA测定抗体浓度。
将细胞在标准增湿条件(95%rH,37℃和5%至8%CO2)下以120转/分钟至150转/分钟的恒定振摇速率在一次性125ml通气摇瓶或6孔平板中增殖。每3-4天,将细胞分入新鲜的培养基中。使用Cedex HiRes细胞计数器(Roche Innovates AG,Bielefeld,德国)或Cellavista CV3.1(SynenTec Bio Services GmbH,Munich,德国),测定培养物的密度和生存力。
包含hCMV-MIE启动子的CHO细胞系的长期培养和生产
在转染后在选择剂MTX存在下测试细胞的表型(即生产)稳定性2至3个月。将细胞在含有20-40ml培养基的通气125ml摇瓶或含有2-4ml培养基的6孔平板中随选择剂一起连续培养并且一周2次用新鲜培养基稀释。接种密度是2至3*105个细胞/ml。在传代之前,确定活细胞密度和生存力。
在每次传代结束时,通过蛋白A HPLC和ELISA测定上清液的抗体浓度(抗体滴度)。从这些数据,使用下式计算每次传代的细胞比生产率(qP):
qP[pg/细胞/天]:细胞比生产率,
P1[μg/ml]:传代开始时的抗体滴度,
P2[μg/ml]:传代结束时的抗体滴度,
D1[细胞/ml]:传代开始时的活细胞密度,
D2[细胞/ml]:传代结束时的活细胞密度,
Δt[d]:传代的持续时间。
在各世代中相应传代结束时,将qP值对培养物的年龄作图。在全部qP数据点范围内计算线性趋势线并且根据以下等式自行计算该时间范围内qP的相对改变(以百分数计):
ΔqP[%]:qP的改变百分数,
m[pg/细胞/天/世代]:线性趋势线的斜率,
a[世代数]:培养物年龄,
qP0:线性趋势线的y轴截距。
就针对每份样品获得的数据点较低数值而言,将最后三个qP值的平均数除以前两个qP值的平均数并且以百分数显示以获得ΔqP。
平均qP EOS:最后三个qP值的平均数
平均qP PSB:前两个qP值的平均数
处理重组CHO细胞系,用于鉴定外遗传标记
两个项目的32个CHO细胞系用来鉴定外遗传标记,提前两个月预测靶基因表达。对于包括抗体浓度的两个项目数据,经60个世代的时间(约2个月)采集hCMV-MIE启动子的C-425甲基化状态和拷贝数。项目H包含20个在hCMV-MIE启动子控制下表达人IgG类抗体的CHO-K1细胞系。载体还包含编码谷氨酰胺合成酶的核酸序列,令细胞对氨基亚砜蛋氨酸(MSX)选择敏感。项目T包含12个在hCMV-MIE启动子控制下表达人IgG类抗体的CHO-K1细胞系。这些细胞系对甲氨蝶呤(MTX)选择敏感,原因在于鼠二氢叶酸还原酶转基因。将冷冻的起始培养物解冻并且在包含250nM MTX或140μM MSX的适宜培养基中培养。在培养2周(时间点PSB)后,收获细胞并且用以下抗体实施染色质免疫沉淀法。
项目T列表
项目H列表
用以下引物进行定量PCR。
转基因拷贝数确定
如先前所描述那样进行转基因拷贝数检验(Osterlehner等人,2011)。从系列稀释物的标准曲线外推转基因拷贝/样品(LCS或HCS)。假定每个细胞含有大约6pg DNA,如下计算转基因数目/细胞(LC细胞)。
采用JMP的计算性分析
在标准最小二乘拟合模型中,将培养阶段开始时C-179的甲基化和与hCMV-MIE接近的乙酰化/组蛋白3的百分数对经历60个世代的比生产率改变(ΔqP)作图。因此,使用软件JMP1010.0.1发布:2,64位版本;SAS Institute Inc.)并且计算效应杠杆图的P值。此外,通过使用Jackknife技术进行离群分析。执行LogWorth统计学以鉴定最佳分割节点,旨在依据外遗传修饰的稳定性和程度对细胞群体再划分(Sall,2002)。
实施例2
产生重组CHO细胞系
通过用编码抗体轻链和重链的载体稳定转染CHO-K1或CHO-DG44悬液培养细胞,产生表达人IgG类抗体的重组细胞系,所述抗体包含人免疫球蛋白κ轻链和人免疫球蛋白γ1或γ4重链。该载体还包含编码鼠二氢叶酸还原酶(DHFR)或谷氨酰胺合成酶(GS)的核酸。轻链表达盒和重链表达盒均处于人CMV主要立即早期启动子和增强子(SEQ ID NO:01)的控制下。通过核转染法(Lonza Cologne GmbH或Amaxa Biosystems)或通过使用Gene PulserXCell(BIO-RAD)电穿孔,进行细胞的转染。
例如,使用Nucleofector装置并联合Nucleofector试剂盒V(Lonza CologneGmbH,科隆,德国)或通过使用Gene Pulser XCell(Bio-Rad,Hercules,CA)电穿孔,根据制造商的操作方案,将CHO-K1或CHO-DG44悬液用线性化质粒DNA转染。将转染的细胞接种在含有无胸苷培养基的96孔板或384孔板中,所述培养基具有多种浓度的甲氨蝶呤(MTX)作为选择剂或氨基亚砜蛋氨酸(MSX)作为选择剂。在3周后,通过ELISA测量培养基中的抗体滴度,鉴定表达抗体的细胞系。将顶级的生产细胞扩充至更大的体积,通过有限稀释法亚克隆并冷冻保存。
在含有20nM至1200nM甲氨蝶呤(MTX)或140-160μM氨基亚砜蛋氨酸(MSX)作为选择剂的无胸苷和蛋白质的培养基中选择稳定转染的细胞。通过测量培养基中的抗体滴度鉴定表达抗体的细胞或细胞系并且通过有限稀释和/或FACS单个细胞沉积法亚克隆。
将细胞在标准增湿条件(95%rH,37℃和5%至8%CO2)下以120转/分钟至150转/分钟的恒定振摇速率在一次性50ml或125ml通气摇瓶中增殖。每3-4天,将细胞分入新鲜的培养基中。使用CASY TT或Cedex HiRes细胞计数器(Roche Innovates AG,Bielefeld,德国),测定培养物的密度和生存力。
另外,使用如Current Protocols in Cell Biology,Bonifacino,J.S.等人(编著),John Wiley&Sons,Inc.,New York(2000)中所述的标准细胞培养技术。
实施例3
长期培养和生产
研究根据实施例2获得的CHO细胞系的长期生产率。
在选择剂不存在下测试细胞的表型(即生产)稳定性35至70个世代。将细胞在含有50ml培养基的通气125ml摇瓶中的无选择剂情况下连续培养并且一周2次用新鲜培养基稀释。接种密度是2至3x 105个细胞/ml。在传代之前,测定活细胞密度和生存力。根据以下等式计算每次传代结束时各世代中培养物的年龄:
a2=a1+ln(D2/D1)/ln2 (式1)
其中
a2[世代数]:传代结束时培养物的年龄,
a1[世代数]:传代开始时培养物的年龄,即先前传代结束时培养物的年龄,
D1[细胞/ml]:传代开始时的活细胞密度,
D2[细胞/ml]:传代结束时的活细胞密度。
在每次传代结束时,通过蛋白A HPLC测定上清液中的抗体浓度(抗体滴度)。从这些数据,使用下式计算每次传代的比生产率(SPR):
SPR=P2-P1/((D2+D1)/2*Δt) (式2)
其中
SPR[pg/细胞/d]:比生产率,
P1[μg/ml]:传代开始时的抗体滴度,
P2[μg/ml]:传代结束时的抗体滴度,
D1[细胞/ml]:传代开始时的活细胞密度,
D2[细胞/ml]:传代结束时的活细胞密度,
Δt[d]:传代的持续期。
在各世代中相应传代结束时,将SPR值对培养物的年龄作图。在全部SPR数据点范围内计算线性趋势线并且根据以下等式计算测试的时间范围内SPR的相对改变(以百分数计):
ΔSPR=m*a/SPR0*100 (式3)
其中
ΔSPR[%]:SPR改变百分数,
m[pg/细胞/天/世代]:线性趋势线的斜率,
a[世代数]:培养物年龄,
SPR0:线性趋势线的y轴截距。
几乎全部细胞系都显示生产率下降,而在无选择剂的条件下生产率损失倾向于更强烈。
表3:在选择剂存在和/或不存在下5个细胞系培养期间SPR的变化。
n.d.=未测定
n.d.=未测定
e.i.m.=测量中的误差
实施例4
通过亚硫酸氢盐处理和DNA测序鉴定人CMV主要立即早期启动子/增强子DNA内部的甲基化CpG位点
用于表达抗体轻链基因和重链基因的人CMV主要立即早期启动子/增强子片段(SEQ ID NO:01)含有33个CpG位点。
使用来自Qiagen的Allprep DNA/RNA微量试剂盒(希尔登,德国),从CHO细胞系K18.1、G25-10、G25-17、G42-5和43-16 A10分离基因组DNA。将5微克DNA用酶DraI切割并且通过在260nm测量消光系数定量。100纳克DNA接受亚硫酸氢盐处理并且使用EpiTect亚硫酸氢盐试剂盒(Qiagen,希尔登,德国)纯化。将亚硫酸氢盐处理的DNA回收于20μl无RNA酶的水(Qiagen,希尔登,德国)中。
为了扩增人CMV主要立即早期启动子/增强子片段的链A(正向)(SEQ ID NO:02),将1μl亚硫酸氢盐处理的DNA与24μl PCR主混合物组合并使用PCR系统9700(Applied Biosystems Inc.,USA)进行PCR。
24μl PCR主混合物包含:
1μl SEQ ID NO:06的正向引物227(10pmol/μl),
1μl SEQ ID NO:08的反向引物229(10pmol/μl),
22μlPCR SuperMix HighFidelty(Invitrogen Corp.,美国)。
正向引物227与人CMV主要立即早期启动子/增强子片段的5'末端互补。反向引物229在免疫球蛋白基因的5’-UTR内部下游结合。
PCR条件如下:
温度 持续时间
步骤1 变性 95℃ 10分钟
步骤2:PCR 变性 94℃ 30秒
循环次数:45 复性 50℃ 2分钟
延伸 68℃ 2分钟
步骤3 终末延伸 72℃ 10分钟
步骤4 保温 4℃ 无限
通过琼脂糖凝胶电泳检查PCR产物的大小和纯度,并且使用TOPO TA克隆试剂盒(IInvitrogen Corp.,美国)克隆于载体pCR4(Invitrogen Corp.,美国)中。将质粒克隆分离并通过限制性消化和琼脂糖凝胶电泳分析。对于每个细胞系,将19至22个含有插入物的质粒测序。为了评估亚硫酸氢盐处理在非CpG位点处的脱胺效率,测定非CpG位点处残余胞嘧啶的数目。如下计算脱胺效率百分数:
Emod=100-(Cres/Ctotal*100) (式4)
其中
Emod[%]:脱胺效率,
Cres:在分析的全部插入物中非CpG位点(排除PCR引物位点)处残余胞嘧啶的数目,
Ctotal:在未经亚硫酸氢盐处理的CMV启动子/增强子片段中(排除PCR引物位点)胞嘧啶的数目,乘以分析的插入物数目,即107*20。
发现全部样品中非CpG胞嘧啶处的脱胺效率均大于99%(表4)。
表4:非CpG胞嘧啶处的脱胺效率。
通过从dcm+大肠杆菌分离的质粒DNA的亚硫酸氢盐处理及后续克隆和测序证实保护5-甲基胞嘧啶免于脱胺作用。dcm+大肠杆菌使序列CCAGG或CCTGG(dcm-位点)内部的内部胞嘧啶残基甲基化。发现脱胺效率在非dcm-位点处是99%并且在dcm位点内部的内部胞嘧啶处小于5%。
为了定量在亚硫酸氢盐处理的CMV启动子/增强子片段内部CpG位点处DNA甲基化的延续情况,确定在每个CpG位点找到的胞嘧啶的数目并对分析的每种细胞作图。
细胞系K18.1是高度甲基化的(图3A)。甲基化频率在3个团簇中积累,一个在5'-末端,一个在3’-末端和并且一个在大约位置400处。发现最高程度的甲基化存在于位置425处。22个测序的插入物中有14个在此具有胞嘧啶。
来自细胞系43-16 A10的CMV启动子的甲基化引人注目(图3E)。甲基化的分布类似于对细胞系K18.1观察到的分布。位置425最经常甲基化。20个测序的插入物中5个插入物在这个位置含有胞嘧啶。
在研究的三个其他细胞系中,在CpG位点仅零星检测到胞嘧啶(图3B、图3C和图3D)。
实施例5
亚硫酸氢盐处理的人CMV主要立即早期启动子/增强子DNA的定量甲基化特异性PCR
在这个实施例中,报告了一种甲基化特异性实时qPCR作为检测hCMV启动子核酸的CpG位置处、更精确地在其位置425处甲基化的方法。
设计了两套引物:
选择性扩增在位置425具有胞嘧啶的脱胺CMV启动子DNA(其代表在位置425处甲基化的DNA)的甲基化特异性引物对(MSP引物对),和
无论甲基化状态是什么均扩增脱胺CMV启动子DNA的通用引物对。
通用引物对用于归一化。为了用于相同的PCR试验中,两种引物对应当具有相似的解链温度。
感知位置425处甲基化情况的引物的设计因存在紧邻的两个额外CpG位点(位置416和位置437)复杂化。甲基化灵敏引物应当与位置416和位置437的甲基化状态无关地检测5mC425。
已经使用实施例4中分离的代表位置425和437内可能的序列变异的4种脱胺的人CMV主要立即早期启动子/增强子片段:#11、#62、#01和#04(表5,SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22)作为甲基化特异性PCR和通用引物对的qPCR模板。
表5:qPCR中MSP引物对和通用引物对的预期结果。
采用通用引物时,可以可比较地扩增全部4种模板,而甲基化特异性引物对可以选择性地扩增模板#62和模板#01。在模板#62和模板#01上,ΔCp应当在甲基化特异性引物对和通用引物对之间尽可能地小。用甲基化特异性引物对在模板#11和模板#04上获得的Cp值应当尽可能地高,即与采用通用引物对的扩增相比,ΔCp应当是最大的。
对于qPCR,使用480II系统(Roche Diagnostics GmbH,曼海姆,德国),并且使用480 SYBR Green I Master(Roche Diagnostics GmbH,曼海姆,德国)制备样品。5微升含有0.05ng DNA的模板溶液与15μl PCR主混合物在96孔多孔平板的孔中组合。
15μl PCR主混合物包含:
4.2μl水,
0.4μl正向引物239、263或264(还可能是引物227、228、240、238)(10pmol/μl),
0.4μl反向引物237、254、262、265、266、267或268(还可能是引物229)(10pmol/μl),
10μl SYBR Green I Master。
将多孔平板用480密封箔(Roche Diagnostics GmbH,曼海姆,德国)密封并且以1,500x g离心2分钟。此后,将平板置入480系统并进行qPCR。一式二份、三份或四份测试每份样品。为了允许确定绝对拷贝数,使用线性化的表达质粒作为标准品,生成LC和HC转基因的标准曲线。标准稀释物含有2.5x 107、2.5x 106、2.5x105、2.5x 104或2.5x 103个质粒拷贝。一式三份测试基因组DNA;一式四份运行标准品。
所用的PCR条件是:
480软件1.5版进行数据的收集和分析。使用下式计算表观甲基化程度,其中假定理想扩增效率(E=2)。
mCapp=2Cp(t)-Cp(m)*100 (式5)
其中
mCapp[%]:表观甲基化程度,
Cp(t):用通用引物获得的Cp值,
Cp(m):用甲基化特异性引物获得的Cp值。
在引物评价期间,发现不得不仔细设计对位置425处具有胞嘧啶(“甲基化”)的脱胺CMV启动子DNA呈高度选择性的甲基化特异性引物。引物266和267显示Cp(#11)和Cp(#62)之间的最大差异,即对“甲基化”DNA的最高选择性。引物265、268和254显示小的选择性。将通用引物对263/237作为对照来测试最小ΔCp(图6和表6)。
表6:引物评价结果。
在图5中,显示了用与通用引物对239/237(SEQ ID NO:11、SEQ ID NO:09)组合的甲基化特异性引物对239/267(SEQ ID NO:11、SEQ ID NO:18)获得的结果。通用引物对239/237大致同等良好地扩增全部4种模板,而甲基化特异性引物对239/267扩增模板#62和#01。引物对239/267仅低劣扩增模板#11和#4。
对于模板#62和模板#01,从Cp值计算的甲基化频率几乎是100%,并且对于模板#11和模板#04,几乎是0%(表7A)。这显示与通用引物对239/237组合的甲基化特异性引物对239/267可以用来通过实时qPCR区分位置425处甲基化的CMV启动子DNA与位置425处非甲基化的CMV启动子DNA。
表7A和7B存在并表征了额外的通用和甲基化特异性引物对。
表7A:与三种不同正向引物组合的甲基化特异性反向引物267和非甲基化特异性反向引物237。
表7B:与二种不同正向引物组合的甲基化特异性反向引物266和非甲基化特异性反向引物237。
为了定量宽范围内的甲基化程度,将模板#62混合按不同比率与模板#11混合。使用引物对239/237和239/267,如上文所述进行qPCR,并且计算在模板#11背景下模板#62的回收。
为了计算模板#62 DNA的比率,测定引物对在所用条件下的扩增效率。对模板#62和#11从n=0.005ng至0.5ng DNA的系列稀释物进行qPCR并将测定的Cp值对log(n)作图。使用XLfit(Microsoft)计算线性回归线。使用下式计算扩增效率。
E=10-1/m (式6)
其中
E:扩增效率,
m:线性趋势线的斜率。
两种引物对的扩增效率经计算是大约1.7。以下式用于计算模板#62 DNA的比例:
mC=1.7Cp(t)-Cp(m)*100 (式7)
其中
mC[%]:在位置425处甲基化的DNA的比例,
Cp(t):用通用引物对获得的Cp值,
Cp(m):用甲基化特异性引物对获得的Cp值。
来自两个独立实验的测定的模板#62 DNA比例对预期值作图(图7)。可以在1%和100%之间进行甲基化定量。
实施例6
通过亚硫酸氢盐处理和实时定量PCR鉴定人CMV主要立即早期启动子/增强子DNA内部C-425的甲基化状态
亚硫酸氢盐处理CHO细胞系的基因组DNA
如Osterlehner等人(上文)中所述那样进行测定法。使用来自Qiagen的AllprepDNA/RNA微量试剂盒(希尔登,德国),从CHO细胞系分离基因组DNA。将5微克DNA用酶DraI切割并且通过在260nm测量消光系数定量。对100纳克DNA进行亚硫酸氢盐处理并且使用EpiTect亚硫酸氢盐试剂盒(Qiagen,希尔登,德国)纯化。将亚硫酸氢盐处理的DNA回收于20μl无RNA酶的水(Qiagen,希尔登,德国)中。
为了扩增人CMV主要立即早期启动子/增强子片段的链A(正向)(SEQ ID NO:2),将1μl亚硫酸氢盐处理的DNA与24μl PCR主混合物组合并使用PCR系统9700(Applied Biosystems Inc.,USA)进行PCR。
24μl PCR主混合物包含
1μl SEQ ID NO:06的正向引物227(10pmol/μl),
1μl SEQ ID NO:08的反向引物229(10pmol/μl),
22μlPCR SuperMix HighFidelty
(Life Technologies,Carlsbad,CA)。
正向引物227与人CMV主要立即早期启动子/增强子片段的5'末端互补。反向引物229在免疫球蛋白基因的5’-UTR内部下游结合。
PCR条件如下:
通过琼脂糖凝胶电泳检查PCR产物的大小和纯度。
甲基化特异性实时定量PCR
LightCycler 480II系统(Roche Diagnostics GmbH,曼海姆,德国)联合LightCycler 480 SYBR Green I Master(Roche Diagnostics GmbH,曼海姆,德国)用来进行qPCR。使用50皮克质粒DNA、3μl亚硫酸氢盐处理的基因组DNA或底物227和229(SEQ IDNO:06/08)的PCR产物连同亚硫酸氢盐处理的基因组DNA的5μl 1:50000稀释物作为模板。对于qPCR,将模板与4或12pmol正向引物和反向引物、10μl LightCycler 480 SYBR Green IMaster和无核酸酶的水混合,以构成总体积20μl。为了定量人CMV主要立即早期启动子/增强子片段总DNA,使用引物对239/237(SEQ ID NO:11/09),用引物对239/267(SEQ ID NO:11/18)检测位置C-425处的甲基化DNA(SEQ ID NO:01)。将PCR混合物加入多孔平板。
将多孔平板用480密封箔(Roche Diagnostics GmbH,曼海姆,德国)密封并且以1500x g离心2分钟。此后,将平板置入480系统并进行qPCR。一式二份、三份或四份测试每份样品。
PCR条件如下:
使用LightCycler 480软件1.5版(Roche Diagnostics GmbH,曼海姆,德国)进行数据收集和分析。mC的甲基化通过以下等式以百分数表述:
mC=ECq(t)-Cq(m)*100 (式8)
Cq(t)是用通用引物对239/237获得的定量循环,Cq(m)表示用甲基化特异性引物对239/267获得的定量循环,并且E是扩增效率(MIQE指南)。对于0.2pmol/μl引物浓度,E是大约1.7,并且对于0.6pmol/μl引物浓度,E是大约2.0。
实施例7
人CMV主要立即早期启动子/增强子甲基化与长期生产率的相关性
采用预扩增的人CMV主要立即早期启动子/增强子链A的甲基化特异性qPCR
如实施例4中报道,将基因组DNA从CHO细胞系K18.1、G25-10、G25-17、G42-5和43-16 A10分离,用酶DraI切割和通过亚硫酸氢盐处理脱胺。使用引物227和229扩增人CMV主要立即早期启动子/增强子的链A。
1:50000稀释PCR产物。5微升的每种稀释物用于实时qPCR。引物239和237用于定量总CMV启动子DNA;引物239和267用于定量位置425处甲基化的CMV启动子/增强子DNA。一式三份测试样品。使用模板#11、#62和#01作为对照。
通过将5μl模板与15μl PCR主混合物合并,如实施例5中报道那样建立qPCR。PCR条件如实施例5中报道那样。引物复性温度是58℃。
采用亚硫酸氢盐处理的基因组DNA的甲基化特异性qPCR
将基因组DNA从CHO细胞系K18.1、G25-10、G25-17、G42-5和43-16 A10提取,用酶DraI切割和通过亚硫酸氢盐处理脱胺。使用扩增总CMV启动子/增强子链A的引物对239/237和扩增位置425处甲基化的CMV启动子/增强子链A的引物对239/267,将稀释于3μl水中的2微升脱胺的DNA用作实时qPCR中的模板。一式三份测试样品。使用模板#11和#62作为对照。
建立PCR并且如实施例5中报道那样进行qPCR。引物复性温度是58℃。
对于a)和b),如下计算在位置425处甲基化的启动子DNA的比例:
mC=1.7Cp(t)-Cp(m)*100 (式7)
其中
mC[%]:在位置425处甲基化的DNA的比例,
Cp(t):用通用引物对239/237获得的Cp值,
Cp(m):用甲基化特异性引物对239/267获得的Cp值。
两个分析设置均提供可比的结果。三次重复内部的标准差在没有预扩增CMV启动子链A的情况下较高(图8A和图8B)。细胞系K18.1、G25-10、G25-17和43-16 A10中CMV启动子核酸的位置425的甲基化高于不完全脱胺的背景,已经发现所述背景是大约1%。细胞系G42-5中的甲基化低于背景水平或在背景水平最大。对于细胞系K18.1,测定到最高甲基化(超过60%)。
用其他通用引物对和甲基化特异性引物对执行测定法设置a)。为了计算在位置425处甲基化的DNA的比例,假定全部引物对的扩增效率是2:
mC=2Cp(t)-Cp(m)*100 (式5')
其中
mC[%]:在位置425处甲基化的DNA的比例,
Cp(t):用通用引物对获得的Cp值,
Cp(m):用甲基化特异性引物对获得的Cp值。
表8显示已经在有预扩增或没有预扩增CMV启动子DNA的情况下在克隆的DNA模板上或在基因组DNA上测试过的引物对组合的总结。
表8:引物对组合。
实施例8
人CMV主要立即早期启动子/增强子的甲基化和重组CHO细胞系生产不稳定性的预测
用编码人IgG4抗体的质粒转染CHO-K1细胞并且使用DHFR/MTX系统选择稳定的克隆。通过有限稀释法亚克隆高产生性亲本克隆。在整个细胞系生成过程期间生长培养基中保有MTX。从10个亲本克隆选出16个亚克隆。
用250nM MTX再培养经选择的细胞。一旦它们显示稳定生长,则在MTX存在和不存在下测试它们经历60至80个世代的长期生产稳定性。计算SPR经历60个世代的相对改变。在研究开始时用存在MTX时培养的细胞和研究结束时从已经在无MTX的情况下培养的细胞测定C435的甲基化。
将研究开始时的C425甲基化对SPR在MTX存在(图11A)和MTX不存在下(图11B)的相对改变作图。在C425处甲基化小于5%的大部分克隆可以在稳定的克隆级分中(在存在或不存在MTX的情况下SPR下降小于40%)中找到,而在C425处甲基化大于5%的大部分克隆簇集在不稳定的克隆级分中。这独立于甲基化是否与MTX存在或不存在时的稳定性相关(还参见表9)。在有MTX情况下损失小于20%生产率和在无MTX情况下损失小于30%生产率的大部分稳定克隆显示小于5%的C425甲基化。
表9:甲基化与MTX存在或不存在时的稳定性(A)和质粒拷贝数(B)的相关性。
这项研究结果显示,可以使用对C425甲基化的确定作为预示性标记以确定生成的细胞克隆中多肽表达的稳定性,并且因而允许在细胞系开发期间选择具有稳定生产率的稳定克隆。已经发现,5%或更小的C425甲基化是选择稳定细胞克隆的合适标准。
已经进一步发现,两个中等稳定的细胞克隆以及在研究开始时非甲基化的两个非常不稳定的克隆在稳定性试验期间在无MTX的情况下甲基化升高超过5%(还参见图12)。这显示,通过测试前在MTX不存在下将细胞克隆培养某个时间,可以减少错误预测为稳定的细胞克隆(假阴性细胞克隆)的比例。
为了通过第二种方法证实C425甲基化,我们用高度甲基化的克隆44-28进行亚硫酸氢盐测序(图13)。发现C425处的甲基化程度是80%。考虑到两种测定法的不同,这与甲基化特异性PCR的结果一致。如同克隆K18.1和43-16A10(图4),C425在人CMV主要立即早期启动子/增强子DNA内部的全部CpG位点当中最经常地甲基化。其他甲基化事件簇集在5'末端和3’末端。在全部位点的平均甲基化程度是18%。
实施例9
早期甲基化与转基因高拷贝数一致
使用基于TaqMan原理的多重qPCR测定法,确定稳定性试验开始和结束时免疫球蛋白轻链基因和重链基因的整合拷贝。使用由正向引物、反向引物和水解探针组成的两个引物集合:一个集合对人κ链基因特异,另一个集合对人γ重链基因特异。为了允许确定绝对拷贝数,使用已经用于转染的线性化表达质粒作为标准品。确保样品和标准品的相等扩增效率。
对于qPCR,使用480II系统(Roche Diagnostics GmbH,曼海姆,德国),并且使用480探针Master(Roche Diagnostics GmbH,曼海姆,德国)制备样品。
5微升含有50ng基因组DNA的模板溶液与15μl PCR主混合物在96孔微量滴定板的孔中组合。在标准品的情况下,模板溶液含有2.5x 107、2.5x 106、2.5x 105、2.5x 104和2.5x 103个相应线性化质粒DNA的拷贝。
15μl PCR主混合物包含:
10μl480探针Master
1μl正向引物#133(10pmol/μl)
1μl反向引物#132(10pmol/μl)
0.5μl探针#166(10pmol/μl)
1μl正向引物#178(10pmol/μl)
1μl反向引物#180(10pmol/μl)
0.5μl探针#185(10pmol/μl)
将平板用480密封箔(Roche Diagnostics GmbH,曼海姆,德国)密封并且以1500g离心2分钟。此后,将平板置入480系统并进行qPCR。一式三份测试每份样品,一式四份测试标准品。
PCR条件如下:
使用480软件1.5版进行数据的收集和分析。基本上,将质粒标准品稀释物的平均Cp值对相应的基因拷贝数作图以产生标准曲线,从所述标准曲线外推出样品中转基因的数目。
假定平均DNA含量/细胞是jpg,计算转基因数目/细胞:
Nc=Ns/50000*6
Nc:转基因拷贝数/细胞
Ns:样品中的转基因拷贝数
表10:引物序列。
引物编号 引物序列(5′->3′) SEQ ID NO:
133 TCACAGAGCAGGACAGCAAG 26
132 GACTTCGCAGGCGTAGACTT 27
166 (FAM)-AGCACCTACAGCCTCAGCAGCACC-(BHQ1) 28
178 CGAACCGGTGACGGTGT 29
180 GAGGGCACGGTCACCAC 30
185 (Cy5)-CACACCTTCCCGGCTGTCCTACAG-(BHQ3) 31
图14描述了在稳定性试验之前和之后甲基化细胞和非甲基化细胞的轻链基因拷贝数。并不令人惊讶地,发现重链基因的拷贝数相同,因为细胞已经用携带两个基因的双基因载体转染(数据未显示)。仅在携带超过10个转基因拷贝的细胞中发现早期甲基化,即稳定性试验之前的甲基化,而一些具有小于10个转基因拷贝的克隆在稳定性试验期间获得甲基化。作为结果,在稳定性试验之前选择具有转基因低拷贝数的克隆同等地富集具有稳定生产率的克隆(表11)。
表11:转基因拷贝数与MTX存在或不存在时的稳定性的相关性。
我们进一步观察到生产不稳定性通常与转基因拷贝的丢失不相关。克隆1A5-05、1A5-21、1A5-24和2B1-02丢失转基因拷贝,2B-13稳定并且14-13以及14-23的基因拷贝数增加(还参见图11B)。
实施例10
通过染色质免疫沉淀法和实时PCR鉴定与人CMV主要立即早期启动子/增强子DNA接近的本发明组蛋白修饰
CHO细胞系的染色质免疫沉淀法
在稳定性生产细胞系中用于表达抗体轻链和重链的人CMV主要立即早期启动子/增强子片段(SEQ ID NO:1)接近于压缩DNA的组蛋白(染色质)。用染色质免疫沉淀测定法(ChIP)测量与人CMV主要立即早期启动子/增强子片段接近的修饰型组蛋白的积累。
将32个CHO细胞系(样品H-1至H-20和T-1至T-12,参见表3)在室温于3.7%甲醛中固定10分钟。在10%甘氨酸中5分钟来终止固定。将细胞在冰上于细胞裂解缓冲液中裂解10分钟,在4℃以5000转/分钟离心4分钟。将沉淀物重悬于胞核裂解缓冲液中并且用BransonSonifier B15超声处理染色质至平均片段大小200-500bp。用BCA蛋白质分析试剂盒(Thermo Scientific,Rockford,美国)测定染色质片段的浓度。将2.5μg-100μg染色质片段添加至1.5个体积的含有3μl–12μl抗体的IP稀释缓冲液并且在4℃温育过夜,同时以25转/分钟转动。
将蛋白A琼脂糖珠(Roche Diagnostics GmbH,曼海姆,德国)在4℃于含有100μg/ml鲑精DNA(Invitrogen,Carlsbad,美国)和5mg/ml BSA(牛血清白蛋白,RocheDiagnostics GmbH,曼海姆,德国)的IP稀释缓冲液中封闭过夜。通过以下方式纯化抗体-染色质沉淀物:在封闭的琼脂糖珠中温育1小时,随后在4℃于2x低盐洗涤缓冲液、1x高盐洗涤缓冲液、1x LiCl和1x TE洗涤缓冲液中各自温育5分钟。在65℃用200μl IP洗脱缓冲液从琼脂糖珠洗脱抗体30分钟。添加0.5μl无DNA酶的RNA酶(Roche Diagnostics GmbH,曼海姆,德国)以在37℃消化RNA 30分钟。对于蛋白质消化,添加NaCl(终浓度0.2M)和蛋白酶K(终浓度100–200μg/ml)(Roche Diagnostics GmbH,曼海姆,德国)并且在65℃温育溶液1.5小时。在150μl PCR级H2O中通过Roche PCR纯化试剂盒(Roche Diagnostics GmbH,曼海姆,德国)回收DNA。
表12:用于染色质免疫沉淀法(ChIP)的缓冲液。
表13:对组蛋白或组蛋白修饰特异的抗体。
ChIP DNA的定量实时PCR
根据染色质免疫沉淀法,通过测量人CMV主要立即早期启动子/增强子片段的相对量,用实时定量PCR来检测CHO细胞系中人CMV主要立即早期启动子/增强子片段(SEQ IDNO:01)上特异性组蛋白修饰的积累。
使用LightCycler 480 SYBR Green I Master(Roche Diagnostics GmbH,曼海姆,德国),使用LightCycler 480 II系统(Roche Diagnostics GmbH,曼海姆,德国),用实时定量PCR从未处理的输入样品(IS)和抗体纯化的染色质片段扩增基因组DNA。为了定量人CMV主要立即早期启动子/增强子片段(SEQ ID NO:01)的量,使用可能的参比基因的特异性引物和人CMV主要立即早期启动子/增强子片段的特异性引物。
表14:实时定量PCR的引物序列。
将2.5μl洗脱的DNA片段、人CMV主要立即早期启动子/增强子片段(SEQ ID NO:01)的1μl(10pmol/μl)正向引物396(SEQ ID NO:32)和1μl(10pmol/μl)反向引物397(SEQ IDNO:33)、5μl LightCycler 480 SYBR Green I Master和无核酸酶的水混合直至总体积10μl。在相同平板上定量参比基因。将混合物施加至384孔平板(Roche Diagnostics GmbH,曼海姆,德国)。
将平板用480密封箔(Roche Diagnostics GmbH,曼海姆,德国)密封并且以1200g离心3分钟。此后,将平板置入480系统并进行实时qPCR。一式三份测试每份样品。
PCR条件如下:
480软件1.5版进行数据的收集和分析。
实施例11
实时PCR中组蛋白修饰时人CMV主要立即早期启动子/增强子片段的相对定量
参比基因的稳定性
在这个例子中,用程序“Normfinder”计算特定组蛋白修饰的潜在参比基因的稳定性。Andersen,C.L.等人,Cancer Res.64(2004)5245-5250中描述了奠定“NormFinder”的模型和统计构架。
用于Excel的“NormFinder add on”提供了每种基因的稳定性值,这是估计的表达变异的直接量度。稳定性值最小的基因是最稳定的基因。输入数据假定按线性标度,因此使用下式,输入方法百分数用来线性化标度表达量:
输入样品%=100*2ΔCq(输入样品-ChIP样品) (式9)
用“Normfinder”测试5种基因(参见表15)。对三次生物学重复中的20份样品(H-1至H20)研究与人CMV主要立即早期启动子/增强子片段及参比基因接近的组蛋白3乙酰化、组蛋白3赖氨酸4三重甲基化和组蛋白3的稳定性。
表15:可能的参比基因和人CMV主要立即早期启动子/增强子片段的稳定性值。
参比基因Gusb在选择的ChIP条件下比其他对照更稳定。使用Gusb作为参比基因以归一化组蛋白3乙酰化水平、组蛋白3赖氨酸4三重甲基化水平和组蛋白3水平。
用LinRegPCR软件估计引物对的扩增效率
在这个实施例中,对于样品H-1至H20,用LinRegPCR软件(http://www.hartfaalcentrum.nl)估计引物对396/397对人CMV主要立即早期启动子/增强子片段的扩增效率和引物对386/387对参比基因Gusb的扩增效率。该程序测定基线荧光并且进行基线扣减。随后设定线性窗口并计算每份样品的PCR效率(参见Ramakers等人,NeuroSciLett.2003;Ruijter等人,Nucleic Acids Research 2009)。
Eff=10斜率 (式11)
从线性回归线的斜率导出单个的PCR效率(Eff)并且定义为每循环的倍数增加。它的范围可以在1和2之间。效率2表示每个循环中扩增子完美加倍。
表16:参比Gusb引物对和靶hCMV-MIE引物对的扩增效率。
采用20份样品和3个生物学重复时,引物对396/397和386/387产生稳定和可比较的扩增效率,无论是否测量ChIP输入样品或是否用针对组蛋白3、乙酰化组蛋白3或组蛋白3赖氨酸4三重甲基化的抗体沉淀DNA。引物对396/397和386/387用于相对于与参比基因Gusb接近的组蛋白3水平和组蛋白3修饰水平而言,与人CMV主要立即早期启动子/增强子片段接近的组蛋白3乙酰化水平、组蛋白3赖氨酸4三重甲基化水平和组蛋白3水平的相对定量。
相对于组蛋白水平而言相对定量组蛋白修饰的ΔΔCq法
用Livak方法(也称作ΔΔCq(ΔΔCq)法)估计与人CMV主要立即早期启动子/增强子片段接近的组蛋白3乙酰化水平、组蛋白3赖氨酸4三重甲基化水平和组蛋白3水平的相对定量。
该方法可以用于靶相对于参考的相对定量。在这个实施例中,将与人CMV主要立即早期启动子/增强子片段接近的组蛋白3乙酰化水平、组蛋白3赖氨酸4三重甲基化水平和组蛋白3水平的相对定量在两个步骤中对与参比基因Gusb接近的组蛋白3修饰水平和组蛋白3水平归一化。
首先,如下计算ΔCq:
ΔCq=输入样品-样品 (式12)
ΔCq是用相同引物对扩增的相同样品的未处理状况(输入样品)和处理状况(ChIP样品)的定量循环(Cq)之间的差异。ΔCq用来描述相同样品内部相对于未处理状况的值。为了比较不同样品,使用ΔΔCq法。
在这个实施例中,对于全部样品H-1至H-20,ΔΔCq是靶hCMV MIE的ΔCq和参比Gusb的ΔCq之间的差异。可以在样品之间比较使用ΔΔCq值确定的DNA相对量。
最后,组蛋白3乙酰化水平和组蛋白3赖氨酸4三重甲基化水平对三个生物学重复下的20个CHO细胞系H-1至H-20的组蛋白3水平归一化。图15和图16中显示结果连同标准差。
实施例12
与人CMV主要立即早期启动子/增强子片段接近的组蛋白3乙酰化和组蛋白3赖氨酸4三重甲基化以及人CMV主要立即早期启动子/增强子片段的C425甲基化与长期稳定性相关
在具有个性“标准最小二乘”和重点“效应杠杆模型”的拟合模型中研究了相对于与人CMV主要立即早期启动子/增强子片段接近的组蛋白3水平而言的相对乙酰化和赖氨酸4三重甲基化水平(H3ac/H3和H3K4me3/H3)以及人CMV主要立即早期启动子/增强子片段的C425的甲基化百分数(mC-425[%]),以检测影响生产细胞系H-1至H-20长期稳定性的效应。对于计算,使用JMP软件10版(SAS,Boeblingen,德国)。
将样品H-1至H-20的组蛋白修饰值和C-425甲基化百分数作为效应分别输入模型。将60个世代后的比生产率改变(ΔSPR)百分数作为响应输入。在图17至图19中显示所得的杠杆图。与效应相关的参数数目(Nparm)和自由度是1。
RSquare(RSq)评估可以归因于模型而非归因于随机误差的响应中的变异比例。更接近于1的R2表示更好的拟合。更接近于0的R2表示,拟合预测到响应不优于总体响应均值。均方根误差(RMSE)评估随机误差的标准差。它是方差分析报告中误差的均方的平方根。Prob>F列出了效应检验的p值,其告知效应的显著性。
表17:效应检验中计算的已输入效应H3K4me3/H3和H3ac/H3的P值。以三个生物学重复对样品H计算。
表17显示在(-)MTX条件下mC-425[%]的显著性。H3ac/H3和H3K4-me3/H3的效应在(+)MSX条件下是显著的。
至于经历60个世代的效应和选择条件,将实际ΔSPR值对杠杆图中的预测值作图(图17-图19)。这实际值对预测值图显示模型多大程度拟合数据。在选择剂存在下检测到H3ac/H3效应的最低p值(图18),随后在选择剂不存在下检测到mC425[%]效应的最低p值(图19)。
对样品H-1至H-20的ΔSPR值比较存在和不存在选择剂MSX的条件的离群分析
在样品H-18中,不存选择剂MSX的条件((-)MSX)的杠杆图对ΔSPR具有明显异常的值。因此,进行了显示Jackknife距离的离群分析(图20)。
这证实,在条件(-)MSX下样品H-18中ΔSPR的增加相对于全部其他样品而言异常。因此,在无样品H-18情况下重复杠杆分析。表18中展示19份样品H-1至H-17和H-19至H-20的效应检验的计算p值。
表18:效应检验中计算的已输入效应H3K4me3/H3和H3ac/H3的P值。三个生物学重复下19份样品(H-1至H-17、H-19、H-20)的计算P值。
表18显示两种选择条件下H3ac/H3的高度显著性。H3K4-me3/H3的效应在条件(+)MSX下是显著的。
关于经历60个世代的效应和选择条件,将实际ΔSPR值对杠杆图中的预测值作图(图20-图22)。这实际值对预测值图显示模型多大程度拟合数据。对H3ac/H3效应观察到最佳拟合(图21)。
实施例13
通过使用与人CMV主要立即早期启动子/增强子接近的组蛋白修饰和人CMV主要立即早期启动子/增强子片段的C425的甲基化作为标记,预测重组CHO细胞系中的生产不稳定性。
通过用滤子设置排除低劣生产细胞系而增加项目H样品的平均ΔSPR
如实施例12中报道,从建立预测标记的进一步研究排除离群样品H-18的值。
将相对于与人CMV主要立即早期启动子/增强子片段接近的组蛋白3水平而言的组蛋白3乙酰化水平和人CMV主要立即早期启动子/增强子片段的C-425甲基化百分数作为存在和不存在选择剂的情况下生产稳定性的预测标记研究。
如Osterlehner等人中所述,mC-425[%]值的滤子设定至5%。排除高于5%的值以增加剩余样品的平均ΔSPR。
对于样品H-1至H-17、H-19和H-20的H3ac/H3值,用jmp软件计算决策树。用LogWorth统计学计算最佳分割节点并且因此计算最佳滤子。将LogWorth计算为:
-log10(p值) (式14)
其中以复合方式计算修正的p值,所述复合方式考虑了能发生分割的不同方式的数目。与赋予X多个水平的非修正p值和赋予X少数水平的Bonferroni p值相比,这种计算非常公平(白皮书:“Monte Carlo Calibration of Distributions of PartitionStatistics”)。
对于样品H-1至H-17,H-19和H-20,计算(+)MSX条件下的最佳分割是相对于组蛋白3水平而言的0.58组蛋白3乙酰化(H3ac/H3)。为了减少假阴性样品数目,设定滤子至下限值A>0.5H3ac/H3。
单独和组合使用两种滤子。对于每个阳性门,计算在存在或不存在选择剂MSX的条件时ΔSPR的均值并且与未过滤的均值比较(表19)。
表19:在存在或不存在选择剂时和在滤子条件A>0.5H3ac/H3和B<5%mC-425[%]PSP下的ΔSPR计算均值。参考滤子设置,计算样品H-1至H-17、H-19和H-20的值。
与未过滤的条件相比,每种滤子可以增加平均ΔSPR。滤子A和B的交集增加滤子A>0.5H3ac/H3的平均ΔSPR。为了可视化改变的ΔSPR值,图23中展示了每种条件和滤子的柱状图。
项目H的已建立滤子设置适用于项目T以证实阳性效应。
还用如上文确定的滤子设置(参见表20)分析12个细胞系(T-1至T-12)。为了可视化改变的ΔSPR值,图25中展示了每种条件和滤子的柱状图。
表20:在存在或不存在选择剂时的ΔSPR计算均值。参考滤子设置,计算12份样品T-1至T-12的值。
在(-)MTX条件下比较经滤子筛选的样品与未过滤的样品,观察了平均ΔSPR的增加。
与未过滤的数据相比,使用滤子设置A>0.5H3ac/H3导致平均ΔSPR增加。
这显示相对于与人CMV主要立即早期启动子/增强子片段接近的组蛋白3水平而言的组蛋白3乙酰化是有价值的预测标记。

Claims (19)

1.用于选择细胞克隆/细胞系的方法,所述细胞克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,所述启动子核酸具有SEQ ID NO:01的核酸序列,所述方法包括以下步骤:
a)相对于与具有SEQ ID NO:01的核苷酸序列的启动子核酸接近的组蛋白3水平,确定第一组细胞克隆/细胞系的组蛋白3乙酰化水平(H3ac/H3),和
b)确定第二组细胞克隆/细胞系在SEQ ID NO:01的位置425处的CpG位点甲基化频率,和
d)选择细胞克隆/细胞系,所述细胞克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,所述启动子核酸具有SEQ ID NO:01的核酸序列,所述细胞克隆/细胞系相对于组蛋白3水平,具有如步骤a)中所确定的大于0.5的组蛋白3乙酰化水平;并且在位置425处具有如步骤b)中所确定的小于5%的CpG位点甲基化频率。
2.根据权利要求1所述的方法,其中多肽是抗体轻链并且在步骤b)和步骤d)之间还包括以下步骤:
c)确定稳定整合的轻链表达盒的拷贝数,
其中步骤d)是:
选择细胞克隆/细胞系,所述细胞克隆/细胞系相对于组蛋白3水平具有如步骤a)中所确定的大于0.5的组蛋白3乙酰化水平并且在位置425处具有如步骤b)中所确定的小于5%的CpG位点甲基化频率,和具有如步骤c)中所确定的10或更小的稳定整合的轻链表达盒的拷贝数。
3.用于选择细胞克隆/细胞系的方法,所述细胞克隆/细胞系包含核酸,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,所述启动子核酸具有SEQ ID NO:01的核酸序列,所述方法包括以下步骤:
a)对第一组细胞克隆/细胞系的每个细胞克隆/细胞系,其中每个克隆/细胞系包含核酸,所述核酸包含与具有SEQ ID NO:01的核酸序列的启动子核酸有效连接的编码多肽的结构基因,基于从每个细胞克隆/细胞系的培养物获得的至少10个细胞中确定的组蛋白3乙酰化水平相对于组蛋白3的水平(H3ac/H3),确定与具有SEQ ID NO:01的核苷酸序列的启动子核酸接近的组蛋白3乙酰化相对于组蛋白3水平的平均水平(H3ac/H3),
b)对第二组细胞克隆/细胞系的每个细胞克隆/细胞系,其中每个克隆/细胞系包含核酸,所述核酸包含与具有SEQ ID NO:01的核酸序列的启动子核酸有效连接的编码多肽的结构基因,基于从每个细胞克隆/细胞系的培养物获得的至少10个细胞所确定的甲基化,确定在SEQ ID NO:01的位置425处CpG位点的平均甲基化频率,
d)选择细胞克隆/细胞系,所述细胞克隆/细胞系相对于组蛋白3水平具有0.5或更大的平均组蛋白3乙酰化水平(H3ac/H3)并且在位置425处具有低于5%的甲基化频率。
4.根据权利要求3所述的方法,其中多肽是抗体轻链并且在步骤b)和步骤d)之间还包括以下步骤:
c)确定稳定整合的轻链表达盒的拷贝数,
其中步骤d)是:
选择细胞克隆/细胞系,所述细胞克隆/细胞系相对于组蛋白3水平具有如步骤a)中所确定的大于0.5的组蛋白3乙酰化水平并且在位置425处具有如步骤b)中所确定的小于5%的CpG位点甲基化频率,和具有如步骤c)中所确定的10或更小的稳定整合的轻链表达盒的拷贝数。
5.根据权利要求1至4中任一项所述的方法,其中第一组细胞和第二组细胞是相同的细胞群体。
6.根据权利要求1至4中任一项所述的方法,其中确定相对于组蛋白3水平的组蛋白3乙酰化水平(H3ac/H3)包括以下步骤:
1)从每个细胞克隆/细胞系分离染色质,
2)通过组蛋白3乙酰化特异性抗体或组蛋白3特异性抗体处理染色质第一等分试样并且形成抗体-染色质沉淀物,以及通过组蛋白3特异性抗体处理染色质第二等分试样并且形成抗体-染色质沉淀物,
3)从染色质的第三未处理等分试样和从第一和第二处理的等分试样用实时定量PCR扩增基因组DNA,
4)用步骤3)中获得的结果确定相对于组蛋白3的水平而言的组蛋白3乙酰化水平。
7.根据权利要求1至4中任一项所述的方法,其中确定甲基化频率包括以下步骤:
i)从每个细胞克隆/细胞系分离DNA,
ii)对每种分离的DNA单独进行甲基化特异性聚合酶链反应,
iii)用步骤ii)中获得的结果确定甲基化频率。
8.根据权利要求7所述的方法,其中步骤ii)是
ii)对每种分离的DNA用甲基化特异性引物和通用引物单独进行聚合酶链反应。
9.根据权利要求8所述的方法,其中通用引物具有SEQ ID NO:09和11的序列并且甲基化特异性引物具有SEQ ID NO:11和18的序列。
10.根据权利要求1至4中任一项所述的方法,其中相对于组蛋白3水平的组蛋白3乙酰化水平(H3ac/H3)对参比基因归一化。
11.根据权利要求10所述的方法,特征在于参比基因是Gusb。
12.根据权利要求1至4中任一项所述的方法,其中第二组细胞克隆/细胞系包含至少一个还包含于第一组细胞克隆/细胞系中的细胞克隆/细胞系。
13.根据权利要求12所述的方法,其中第二组细胞克隆/细胞系与第一组细胞克隆/细胞系相同。
14.根据权利要求1至4中任一项所述的方法,其中细胞克隆/细胞系是CHO细胞克隆/细胞系。
15.根据权利要求1至4中任一项所述的方法,其中多肽是抗体或抗体片段或抗体缀合物。
16.根据权利要求15所述的方法,其中抗体是双特异性抗体。
17.用于产生多肽的方法,包括以下步骤:
a)用根据权利要求1至16中任一项所述的方法选择细胞克隆/细胞系,
b)培养选择的细胞克隆/细胞系,和
c)从培养基和/或细胞克隆/细胞系回收多肽并且因而产生多肽。
18.根据权利要求17所述的方法,其中所述方法包括在步骤(a)之前的以下步骤:
1)提供非人类哺乳动物细胞,
2)用核酸转染提供的细胞,所述核酸包含了包含与启动子核酸有效连接的编码多肽的结构基因的核酸,所述启动子核酸具有SEQ ID NO:01的核酸序列。
19.根据权利要求17所述的方法,其中所述方法包括在步骤(a)之前的以下步骤:
1)提供非人类哺乳动物细胞,
2)用核酸转染提供的细胞,所述核酸包含了包含与启动子核酸有效连接的编码多肽的结构基因的核酸,所述启动子核酸具有SEQ ID NO:01的核酸序列,
3)i)在选择剂存在下培养转染的细胞克隆/细胞系,ii)单一沉积转染的细胞,和iii)在选择剂存在下培育单一沉积的转染细胞。
CN201580026132.4A 2014-05-19 2015-05-13 使用组蛋白酰化作为标记来选择长期生产性细胞的方法 Active CN106414745B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14168896.0 2014-05-19
EP14168896 2014-05-19
PCT/EP2015/060593 WO2015177022A1 (en) 2014-05-19 2015-05-13 Method for the selection of a long-term producing cell using histone acylation as markers

Publications (2)

Publication Number Publication Date
CN106414745A CN106414745A (zh) 2017-02-15
CN106414745B true CN106414745B (zh) 2019-08-16

Family

ID=50735934

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580026132.4A Active CN106414745B (zh) 2014-05-19 2015-05-13 使用组蛋白酰化作为标记来选择长期生产性细胞的方法

Country Status (13)

Country Link
US (2) US11332797B2 (zh)
EP (1) EP3146052B1 (zh)
JP (1) JP6649276B2 (zh)
KR (1) KR102320614B1 (zh)
CN (1) CN106414745B (zh)
BR (1) BR112016025972B1 (zh)
CA (1) CA2944813A1 (zh)
ES (1) ES2708830T3 (zh)
MX (1) MX2016014542A (zh)
PL (1) PL3146052T3 (zh)
RU (1) RU2707543C2 (zh)
TR (1) TR201819532T4 (zh)
WO (1) WO2015177022A1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004056986A2 (en) * 2002-12-20 2004-07-08 Chromagenics B.V. Means and methods for producing a protein through chromatin openers that are capable of rendering chromatin more accessible to transcription factors
WO2011128377A1 (en) * 2010-04-14 2011-10-20 F. Hoffmann-La Roche Ag Method for the selection of a long-term producing cell

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004016018A (ja) 2002-06-12 2004-01-22 Japan Science & Technology Corp 染色体末端構造を制御するヒストンアセチル化酵素とヒストン脱アセチル化酵素
JP5283104B2 (ja) 2007-01-10 2013-09-04 独立行政法人理化学研究所 アセチル化及び脱アセチル化の蛍光可視化検出方法
RU2425882C1 (ru) 2009-11-10 2011-08-10 Учреждение Российской Академии Наук Институт Биологии Гена Ран Способ создания трансгенных линий клеток млекопитающего со стабильным и высоким уровнем экспрессии трансгенного белка

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004056986A2 (en) * 2002-12-20 2004-07-08 Chromagenics B.V. Means and methods for producing a protein through chromatin openers that are capable of rendering chromatin more accessible to transcription factors
WO2011128377A1 (en) * 2010-04-14 2011-10-20 F. Hoffmann-La Roche Ag Method for the selection of a long-term producing cell
CN102859001A (zh) * 2010-04-14 2013-01-02 弗·哈夫曼-拉罗切有限公司 用于选择长期生产性细胞的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Linking DNA methylation and histone modification: patterns and paradigms;Howard Cedar and Yehudit Bergman;《NATURE REVIEWS》;20090324;第10卷;全文

Also Published As

Publication number Publication date
BR112016025972A2 (pt) 2018-02-20
RU2016149090A (ru) 2018-06-20
US20170081732A1 (en) 2017-03-23
TR201819532T4 (tr) 2019-01-21
RU2016149090A3 (zh) 2018-12-24
ES2708830T3 (es) 2019-04-11
MX2016014542A (es) 2017-02-20
EP3146052B1 (en) 2018-11-28
JP2017515489A (ja) 2017-06-15
WO2015177022A1 (en) 2015-11-26
KR20170003696A (ko) 2017-01-09
EP3146052A1 (en) 2017-03-29
US11332797B2 (en) 2022-05-17
US20230016623A1 (en) 2023-01-19
PL3146052T3 (pl) 2019-04-30
WO2015177022A9 (en) 2016-11-17
KR102320614B1 (ko) 2021-11-02
CN106414745A (zh) 2017-02-15
RU2707543C2 (ru) 2019-11-27
CA2944813A1 (en) 2015-11-26
JP6649276B2 (ja) 2020-02-19
BR112016025972B1 (pt) 2022-04-19

Similar Documents

Publication Publication Date Title
Guo et al. cBAF complex components and MYC cooperate early in CD8+ T cell fate
Zagore et al. DAZL regulates germ cell survival through a network of PolyA-proximal mRNA interactions
Evsikov et al. Systems biology of the 2-cell mouse embryo
WO2021226077A2 (en) Compositions, systems, and methods for the generation, identification, and characterization of effector domains for activating and silencing gene expression
Wissink et al. High-throughput discovery of post-transcriptional cis-regulatory elements
Golubov et al. Microsatellite instability in Arabidopsis increases with plant development
US20240117383A1 (en) Selection by essential-gene knock-in
Robertson et al. A disease-linked lncRNA mutation in RNase MRP inhibits ribosome synthesis
US20160369258A1 (en) Restricting nuclear protein to specific phases of the cell cycle
Raab et al. A blueprint from nature: miRNome comparison of plasma cells and CHO cells to optimize therapeutic antibody production
CN112899238B (zh) 基于RNA-m6A修饰水平的化合物筛选细胞模型及其构建与应用
Cheng et al. Regulatory architecture of the RCA gene cluster captures an intragenic TAD boundary, CTCF-mediated chromatin looping and a long-range intergenic enhancer
CN106414745B (zh) 使用组蛋白酰化作为标记来选择长期生产性细胞的方法
WO2023023553A2 (en) Compositions, systems, and methods for activating and silencing gene expression
Morrow et al. Fluorescent tagging of endogenous proteins with CRISPR/Cas9 in primary mouse neural stem cells
Grenov et al. B Cell division capacity in germinal centers depends on Myc Transcript stabilization through m6A mRNA methylation and IGF2BP3 functions
Hu et al. Generation of IL17RB Knockout Cell Lines Using CRISPR/Cas9-Based Genome Editing
Choi et al. Massively parallel reporter assays combined with cell-type specific eQTL informed multiple melanoma loci and identified a pleiotropic function of HIV-1 restriction gene, MX2, in melanoma promotion
Sankpal et al. Dual expression lentiviral vectors for concurrent RNA interference and rescue
US20240254444A1 (en) Engineered cells for therapy
Kothapalli et al. Characterizing somatic hypermutation and gene conversion in the chicken DT40 cell system
Zhang et al. The repetitive portion of the Xenopus IgH Mu switch region mediates orientation-dependent class switch recombination
Zielke et al. Myc-dependent cell competition and proliferative response requires induction of the ribosome biogenesis regulator Peter Pan
Caldwell et al. Gain‐of‐function analysis of cis‐acting diversification elements in DT 40 cells
Rubio Exploring RBM6 Overexpression: Impact on Cell Division and Gene Splicing in HeLa Cells

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1232913

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant