CN113227388A - 具有可预测和稳定的转基因表达的ssi细胞及形成方法 - Google Patents

具有可预测和稳定的转基因表达的ssi细胞及形成方法 Download PDF

Info

Publication number
CN113227388A
CN113227388A CN201980064770.3A CN201980064770A CN113227388A CN 113227388 A CN113227388 A CN 113227388A CN 201980064770 A CN201980064770 A CN 201980064770A CN 113227388 A CN113227388 A CN 113227388A
Authority
CN
China
Prior art keywords
cell
gene
locus
peaks
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980064770.3A
Other languages
English (en)
Inventor
P·M·奥卡拉汉
S·贝万
R·扬
P·法拉色
L·张
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lonza AG
Babraham Institute
Pfizer Inc
Original Assignee
Lonza AG
Babraham Institute
Pfizer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lonza AG, Babraham Institute, Pfizer Inc filed Critical Lonza AG
Publication of CN113227388A publication Critical patent/CN113227388A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • C07K2317/14Specific host cells or culture conditions, e.g. components, pH or temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

描述了包含整合在高整合基因座内的重组靶位点的哺乳动物细胞。还描述了掺入哺乳动物细胞的重组蛋白生产细胞系和用于形成哺乳动物细胞的方法。通过对哺乳动物细胞中的染色质的三维层次结构的理解和映射,已经开发出高整合基因座。高整合基因座存在于转录活性环境中,其可以提供染色质可及性和表观遗传稳定性。因此,重组哺乳动物细胞可以提供可预测的和稳定的转基因生产。

Description

具有可预测和稳定的转基因表达的SSI细胞及形成方法
相关申请的交叉引用
本申请要求申请日为2018年10月1日的美国临时专利申请序列第62/739,546号的申请权益,该申请通过引用并入本文用于所有目的。
背景技术
在宿主细胞中整合重组蛋白(rP)表达盒以表达异源多肽已经进行了许多年。传统上,使用随机整合(RI)过程,其利用基因组中现有的双链断裂来掺入表达盒。不幸的是,由于位置花斑效应,在RI过程中,整合的基因拷贝数和整合位点处的表达特征都可能高度可变,从而产生不期望的表型异质性。因此,在开发有用的细胞系时,RI过程需要对整合事件进行昂贵的筛选。此外,用于增加表达的基因扩增方法可以引起基因组中的不稳定性(例如,缺失、重复、易位)以及表达修饰表观遗传作用(例如,甲基化、组蛋白修饰、异染色质侵入)。因此,RI产生的细胞系通常不稳定,并且随着时间的推移显示出降低的产量。
最近,已经开发了位点特异性整合(SSI),其中通过整合来自位点特异性重组酶系统诸如酿酒酵母衍生的FLP-Frt系统或噬菌体P1衍生的Cre-loxP系统的重组靶位点(RTS),在细胞基因组中形成“着陆垫”。在SSI细胞系中整合盒的过程被称为重组酶介导的盒交换(RMCE)。RMCE通常涉及共转染编码重组酶的表达载体以及含有目的基因(GOI)的靶向表达载体,所述目的基因的侧翼是重组酶靶向序列。通过在待交换的盒的5′端和3′端使用不同RTS(在供体和靶DNA中),SSI整合方法可以确保重组以定向方式发生,并且仅交换优选的盒区域。
不幸的是,SSI生成的细胞系也可能具有局限性。例如,SSI系统需要将RTS插入到基因组中,作为载体靶向和生成表达GOI的细胞系的先决条件。RTS插入通常通过RI或进入有限数量的特定基因组区域来进行,并且因此所得的细胞系仍然存在不稳定性和随着时间的推移降低的产量。此外,SSI通常导致整合的基因拷贝数低,这可能间接地限制rP生产滴度。
增加重组基因的整合的拷贝的一种方法被称为累积性或积累性SSI(参见例如Kameyama et al.Biotechnol.Bioeng.105:1106-14(2010)、Kawabe etal.Cytotechnology 64:267-79(2012)和Turan et al.J.Mol.Biol.402:52-69(2010))。这种方法可以包含重复的RMCE循环,以在单个位点上依次装载rP表达盒的多个拷贝。
本领域所需要的是在宿主细胞的基因组中转录活性和高度稳定的基因座处掺入RTS的SSI细胞系。这种细胞系将能够稳定和长期表达GOI。
在本文中引用了出版物、专利和专利申请,其公开通过引用以其整体并入本文。
发明内容
本公开基于这样的认识,即来自转基因插入位点的转录输出及其表达系统的稳定性将受到该区域中染色质的3维(3D)结构的强烈影响。本公开描述了基于这种认识的方法,用于在3维中确定基因组的结构和确认(基因组的3D映射)。所公开的3D映射方法可以通过利用诸如例如Hi-C和其他染色体构象捕获方法(Elzo de Wit and Wouter de Laat.GenesDev.201226:11-24)和启动子捕获Hi-C(Schoenfelder et al.Genome Res 25:582-97(2015))等的技术来进行。还描述了利用通过3D映射协议获得的信息的方法以及可以通过所述方法形成的哺乳动物细胞。本申请教导了如何生成多级3D基因组图谱,并且然后使用该信息来鉴定用于表达异源基因的最佳基因组整合位点。例如,通过询问映射的3D基因组结构,可以鉴定可能表现出高性能的整合位点。
在一个实施例中,本公开涉及一种在高整合(HI)基因座处包含RTS的哺乳动物细胞。HI基因座是发明人通过分析基因组染色质的3D层次结构而鉴定的高性能基因组位点。有益的是,HI基因座处于基因组的稳定、转录活性环境中,并且可以重复靶向以递送可预测和稳定水平的GOI表达。
HI基因座可以位于可及染色质的活性基因组区室中,并且也可以位于拓扑相关结构域(TAD)边界的约30,000个碱基对中。此外,HI基因座可以与基因组中与至少一个增强子元件相互作用的区域重叠。根据GOI的表达是由原位内源启动子驱动还是由异源启动子驱动,HI基因座可以不同。例如,在那些其中GOI的表达由原位内源启动子驱动的细胞系中,HI基因座可以重叠并且位于转录起始位点(TSS)的下游。此外,在该实施例中,HI基因座可以与活性基因座重叠,并且在一些实施例中,也可以与完全标注的基因座重叠,例如,其表达产物或其缺乏对细胞不重要的活性基因。在那些其中GOI的表达由异源启动子驱动的细胞系中,HI基因座通常可以在活性或非转录基因座的外部。例如,这种细胞中的HI基因座可以包含不与活性基因的任何相关启动子区域重叠的基因座,或者在一个实施例中不在任何活性基因的约1,000个碱基对内(例如,在任何活性和完全标注的基因的约1,000个碱基对内)的基因座。
在一些实施例中,细胞可以包含多个RTS,例如,在一些实施例中,至少两个RTS,至少四个RTS,或者甚至更多。例如,细胞可以在单个HI基因座中、在不同的HI基因座中和/或在单独的基因座(例如FerIL4基因座)中包含多个RTS。
在一些实施例中,RTS可以包含Frt位点、lox位点、rox位点或att位点。在一些实施例中,RTS可以包含选自SEQ ID NO.:126-155的序列。
本文包含的细胞类型可以包含但不限于小鼠细胞、人细胞、中国仓鼠卵巢(CHO)细胞、CHO-K1细胞、CHO-DXB11细胞、CHO-DG44细胞、包含所有变体的CHOK1SVTM细胞、包含所有变体的CHO谷氨酰胺合成酶敲除细胞、HEK细胞、包含贴壁和悬浮适应变体的HEK293细胞、HeLa细胞或HT1080细胞。
在一个实施例中,细胞可以包含GOI,例如染色体整合的GOI,诸如报告基因、选择基因、治疗目的基因、辅助基因或基因的组合。GOI可以编码难以表达的(DtE)蛋白,诸如Fc-融合蛋白、酶、膜受体或单克隆抗体(例如,双特异性或三特异性单克隆抗体)。在一个实施例中,GOI可以位于单个HI基因座内的两个RTS之间。在一些实施例中,细胞可以掺入多个GOI。例如,细胞可以在单个HI基因座内掺入两个或更多个GOI,可以掺入多个GOI,其中一个或多个位于不同的HI基因座中,和/或可以在HI基因座和单独的基因座的任何组合中掺入多个GOI。在一些实施例中,细胞可以掺入重组酶基因,例如位点特异性重组酶基因,其在一个实施例中可以染色体整合。
还公开了用于生产重组细胞的方法。例如,一种方法可以包含映射细胞基因组的可及染色质中的峰,并且在可及染色质中的映射的峰内鉴定第一组峰,所述第一组峰位于可及染色质的活性基因组区室内,并且也位于拓扑相关结构域(TAD)边界的约30,000个碱基对内。在一个实施例中,第一组峰可以在活性基因组区室中(例如,如由主成分分析方法(PCA)定义的),并且也可以在开放染色质中(例如,如由ATAC-seq定义的),但这不是方法的要求,并且在其他实施例中,第一组峰可以包含在整个映射的可及染色质中的活性基因组区室中的那些峰。该方法还可以包含在第一组峰中鉴定与基因组的与至少一个增强子元件相互作用的区域重叠的那些峰。然后可以在符合这些标准的峰中定义HI基因座。在鉴定出HI基因座后,可以将RTS插入到该HI基因座。任选地,编码位点特异性重组酶的基因也可以插入到细胞中。
在其中来自HI基因座的基因的表达将由原位内源启动子驱动的那些实施例中,一种方法可以进一步包含在与基因组的与至少一个增强子元件相互作用的区域重叠的第一组峰中鉴定与TSS重叠的第二组峰,并且特别是对于其表达产物或其缺乏不重要的活性基因的TSS。HI基因座可以在该第二组峰中定义,HI基因座与活性基因重叠并且位于活性基因的TSS的下游。
在其中来自HI基因座的基因的表达将由异源启动子驱动的那些实施例中,一种方法可以进一步包含在与基因组的与至少一个增强子元件相互作用的区域重叠的第一组峰内鉴定不与活性基因或其相关启动子区域重叠的可及染色质中的那些峰,并且可以在该第二组峰内定义HI基因座。
一种方法还可以包含用包含编码GOI的可交换盒的载体转染细胞,并且将可交换盒整合到HI基因座中。然后,可以选择在HI基因座处包含整合到染色体中的可交换盒的细胞作为重组蛋白生产细胞。
任选地,方法可以包含将附加RTS掺入到细胞中。例如,可以将附加RTS掺入到与第一RTS相同的HI基因座中,掺入到一个或多个附加HI基因座中,和/或掺入到一个或多个单独的基因座中。
根据另一个实施例,公开了一种用于生产重组细胞的方法,该方法包含映射细胞基因组的可及染色质中的峰,并且在可及染色质中的映射的峰内鉴定第一组峰,该组峰位于可及染色质的活性基因组区室内并且也位于拓扑相关结构域(TAD)边界的约30,000个碱基对内。在一个实施例中,第一组峰可以在活性基因组区室中(例如,如由主成分分析方法(PCA)定义的),并且也可以在开放染色质中(例如,如由ATAC-seq定义的),但这不是方法的要求,并且在其他实施例中,第一组峰可以包含在整个映射的可及染色质中的活性基因组区室中的那些峰。该方法还可以包含在第一组峰中鉴定与基因组的与至少一个增强子元件相互作用的区域重叠的那些峰。然后可以在所得到的一组映射的峰内定义多个HI基因座。一种方法可以进一步包含将RTS整合到多个细胞中(例如,根据RI协议),并且然后从所述多个细胞中选择包括整合到HI基因座中的RTS的细胞。任选地,也可以将编码位点特异性重组酶的基因插入到该所选的细胞中。
在一个实施例中,通过该方法鉴定的HI基因座可以根据有效性进行排序。例如,可以根据与每个基因座相关的一个或多个基因的表达水平、从每个基因座到最近的TAD边界的距离以及每个基因座的预测的增强子相互作用的数量中的一种或多种来对HI基因座进行排序。在一个这样的实施例中,其中选择包含整合到HI基因座中的RTS的细胞,可以根据HI基因座插入位点的排序选择细胞。
在一个实施例中,定义HI基因座的方法还可以取决于HI基因座旨在用于表达由原位内源启动子还是由异源启动子驱动的异源基因。例如,在其中来自HI基因座的基因的表达将由原位内源启动子驱动的那些实施例中,一种方法可以进一步包含在如上定义的所得到的一组映射的峰内鉴定与活性基因(诸如其表达产物或其缺乏不重要的活性基因)的TSS重叠的那些峰。然后可以定义与所鉴定的基因重叠并且位于这些所鉴定的基因的TSS下游的第二组峰,并且可以在该第二组峰内定义HI基因座。
在其中来自HI基因座的基因的表达将由异源启动子驱动的那些实施例中,一种方法可以进一步包含在如上所定义的所得的一组映射的峰内鉴定不与任何基因(例如,任何活性基因或其相关启动子区域)重叠的第二组峰,并且HI基因座可以在该第二组峰内定义。
一种方法还可以包含用包含编码GOI的可交换盒的载体转染包含整合到HI基因座中的RTS的选定细胞,并将可交换盒整合到HI基因座中。然后可以选择包含整合到染色体中的可交换盒的细胞作为重组蛋白生产细胞。
任选地,方法可以包含将附加RTS掺入到细胞中。例如,可以将附加RTS掺入到第一HI基因座中,掺入到一个或多个附加HI基因座中,和/或掺入到一个或多个单独的基因座中。
附图说明
在说明书的其余部分,包含参考附图,更具体地阐述了本主题的完整且能够实现的公开,包含对本领域普通技术人员的最佳模式,其中:
图1呈现了流程图,其示出了用于产生基因组的3D图谱并利用其来定义和排列候选HI基因座的方法的一个实施例。该图示出了顺序过滤或筛选过程的总结,然后通过该过程,用于生成多层次3D基因组图谱的数据可以用于鉴定候选HI基因座。
图2A示出了在单个CHO-K1SV原支架的分辨率下映射到LACHESIS组件的数据的全基因组Hi-C热图的一部分。仅映射了顺式相互作用,并且由于视觉清晰度,不包含最小的LACHESIS组7、8和9。
图2B示出了100%堆叠条形图,显示了映射到单个输入CHO-K1SV支架和最终LACHESIS组件的CHO-K1SV 10E9 Hi-C复制品中的近顺式(<10kb)、远顺式(>10kb)和反式唯一有效双标签的平均百分比。为了比较,包含在来自人胚胎干细胞和小鼠胎肝细胞的等效Hi-C数据集的各复制品上取平均的近顺式、远顺式和反式双标签的分布(Nagano,T.etal.Comparison of Hi-C results using in-solution versus in-nucleusligation.Genome Biol.16,175(2015))。
图3A示出了候选HI基因座SEQ ID NO.:3的结构特征(由菱形表示的位置)。Hi-CPCA的结果表明候选基因座位于活性常染色质样区域(左)。与在附近(中间)鉴定的TAD相关的候选基因座的位置。用ATAC-Seq、H3K4me3、H3K27ac和H3K4me1信号标注的候选基因座HindIII限制性片段的相互作用概况以及受引诱的启动子HindIII限制性片段的位置(右)。
图3B示出了候选HI基因座SEQ ID NO.:2的结构特征(由菱形表示的位置)。Hi-CPCA的结果表明候选基因座位于活性常染色质样区域(左)。与在附近(中间)鉴定的TAD相关的候选基因座的位置。用ATAC-Seq、H3K4me3、H3K27ac和H3K4me1信号标注的候选基因座HindIII限制性片段的相互作用概况以及受引诱的启动子HindIII限制性片段的位置(右)。
图3C示出了当前工业相关的Fer1L4着陆垫的结构特征(由菱形表示的位置)。Hi-CPCA的结果表明候选基因座位于活性常染色质样区域(左)。与在附近(中间)鉴定的TAD相关的候选基因座的位置。用ATAC-Seq、H3K4me3、H3K27ac和H3K4mel信号标注的候选基因座HindIII限制性片段的相互作用概况以及受引诱的启动子HindIII限制性片段的位置(右)。
图4A-图4D示出了筛选取自表1的基因组基因座子集的结果,以在CMV启动子的控制下表达整合的eGFP报告基因盒。通过图1中所述的筛选过程来鉴定候选基因座,并通过使用Cas9核酸酶结合位点特异性导向RNA将相同的CMV-eGFP表达盒靶向至所述基因座对候选基因座进行经验测试。将CMV-eGFP盒转染到图4A所示的供体质粒内包含的细胞中,其还表达转染后体内Cas9介导的CMV-eGFP盒从质粒上裂解所需的“伪gRNA”序列。一旦从质粒中释放,CMV-eGFP盒就通过基因座特异性gRNA的表达被靶向以用于整合到所需的基因组基因座,在BbsI位点处克隆到gRNA支架序列上游的供体质粒中。在单独的质粒(未示出)上共转染时提供Cas9核酸酶。图4B示出了用Cas9和CMV-eGFP供体质粒转染十三天后,在中国仓鼠卵巢SSI 10E9细胞系的池中获得的GFP阳性细胞的百分比(Zhang et a1.,BiotechnolProg.2015:31(6)1645-56),其中每个池的GFP+细胞的中位GFP信号在图4C中示出。在图4C中,每个基因座的两个条代表流式细胞仪分析的技术复制品。为了确认每个池中CMV-eGFP盒的靶整合,对提取的基因组DNA使用了基于PCR的测定(图4D)。PCR产物仅在靶基因组整合时产生,其中当仅使用供体质粒(‘D’)作为模板时,不产生PCR产物。‘供体’是指供体质粒,‘Het对照’是指异染色质对照整合位点,其中‘Fer1l4’是指下面提到的带有10E9细胞系的着陆垫。
具体实施方式
本领域普通技术人员应当理解,本讨论仅是示例性实施例的描述,并且不旨在限制本公开的更广泛的方面。
本公开总体涉及细胞基因组的3D图谱的构建,并且在一个特定的实施例中涉及中国仓鼠卵巢细胞基因组的3D图谱的构建。还公开了使用这样的图谱来鉴定高性能整合位点(HI基因座),重组转基因可以从所述位点表达。在本文进一步描述的一个特定实施例中,可以通过使用正交方法的组合来生成3D图谱,所述正交方法诸如ATAC-seq(使用测序对转座酶可及染色质的测定)(Buenrostro et al.10:1213-8(2013))、Hi-C和启动子捕获Hi-C,所述正交方法与关于全基因组转录活性的RNA-Seq数据以及核组蛋白的甲基化和乙酰化的数据集相结合。通过这些方法,可以生成3D基因组及其表达概况的全局图像,其可以为H1基因座的识别和设计提供信息。
根据一个实施例,公开了包含整合在HI基因座内的RTS的哺乳动物细胞。还公开了掺入所述哺乳动物细胞的rP生产细胞系和用于形成这种哺乳动物细胞的方法。本文所述的HI基因座和用于鉴定细胞基因组中的HI基因座的方法已通过理解和映射哺乳动物细胞中染色质的3D分级结构而开发。HI基因座存在于可以提供染色质可及性和表观遗传稳定性的转录活性环境中。因此,在一个或多个HI基因座(即完全在、重叠或+/-约5Kb内)掺入RTS的SSI哺乳动物细胞可以提供可预测和稳定的转基因生产。例如,所公开的GOI在哺乳动物细胞中的表达可以在约70、约100、约150、约200或约300代上稳定。如本文所使用的,与紧跟在生产开始后的初始表达水平相比,如果表达水平降低约30%或更低,或随时间维持在相同的水平或增加的水平(例如,约30%或更多),则可以认为表达是“稳定的”。在一些实施例中,如果体积生产率变化小于±30%,或者保持在相同水平,则认为表达是稳定的。在一些实施例中,SSI宿主细胞可以产生约1.5g/L、约2g/L、约3g/L、约4g/L或约5g/L或更多的GOI表达产物。在一些实施例中,可以将SSI细胞(例如,SSI细胞系)维持在培养物中而无需进一步选择。因此,所公开的细胞系可能更容易被监管机构接受。
如本文所使用的,术语“约”用于指示值包含用于确定所述值的方法/装置的误差的固有变化,或存在于研究受试者之间的变化。通常,该术语意味着根据情况包含大约或小于1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或20%的可变性。
在一个实施例中,哺乳动物细胞可以衍生自中国仓鼠卵巢(CHO)细胞。虽然本讨论的大部分涉及CHO细胞和细胞系,但是应当理解,本公开决不限于任何特定的细胞类型,并且如本文所述,术语“哺乳动物细胞”包含来自哺乳动物目的任何成员的细胞。本文包含的哺乳动物细胞可以包含但不限于人细胞、小鼠细胞、大鼠细胞、猴细胞、仓鼠细胞、牛细胞等。在一些实施例中,哺乳动物细胞是小鼠细胞(例如小鼠骨髓瘤诸如NS0或SP2/0细胞系)、人细胞、中国仓鼠卵巢(CHO)细胞、CHO-K1细胞、CHO-DXB11细胞、CHO-DG44细胞、包含所有变体的CHOK1SVTM细胞(例如CHOK1SVTM
Figure BDA0003001247780000081
Lonza,Slough,UK)、包含所有变体的CHO谷氨酰胺合成酶敲除细胞(例如GS-KOTM、XceedTM)、DG44 CHO细胞、DUXB11 CHO细胞、CHOS、CHO FUT8 GS敲除细胞、CHOZN或任何CHO来源的细胞。
根据一个实施例,可以鉴定基因组中天然存在的HI基因座,并且使用这种鉴定,可以开发掺入在一个或多个HI基因座处染色体整合的异源核酸分子的哺乳动物细胞。例如,异源核酸分子可以包含外源盒,其被设计为在用于生产重组蛋白的细胞系的形成中表达GOI。
如本文所使用的,术语“核酸”、“核酸分子”和“寡核苷酸”是可互换的,并且是指包括共价连接的核苷酸的聚合化合物。该术语包含聚(核糖核酸)(RNA)和聚(脱氧核糖核酸)(DNA),两者都可以是单链或双链的。DNA包含但不限于互补DNA(cDNA)、基因组DNA、质粒或载体DNA以及合成DNA。RNA包含但不限于mRNA、tRNA、rRNA、snRNA、microRNA、miRNA或MIRNA。
如本文所使用的,术语“肽”、“多肽”和“蛋白”是可互换的,并且是指任何长度的氨基酸的聚合形式,其可以包含编码的和非编码的氨基酸、化学或生物化学修饰的或衍生的氨基酸以及具有修饰的肽主链的多肽。术语“链”和多肽“链”在本文中可互换使用,并且是指单个肽主链的氨基酸的聚合形式。术语“氨基酸”是指天然的和非天然的(即合成的)氨基酸。
如本文所使用的,术语“重组的”当用于指核酸分子、肽、多肽或蛋白时,是指自然界中未知存在的遗传材料的新组合或由其产生的。重组分子可以通过重组技术领域中可用的任何众所周知的技术产生,包含但不限于聚合酶链反应(PCR)、基因切割(例如,使用限制性内切酶)、DNA连接(例如,使用DNA连接酶)、RI、RMCE、CRISPR介导的技术、核酸分子、肽或蛋白的固态合成以及技术的组合。在一些实施例中,“重组的”是指自然界中未知存在的病毒载体或病毒,例如在病毒载体或病毒中具有一个或多个突变、核酸插入或异源基因的病毒载体或病毒。在一些实施例中,“重组的”是指自然界中未知存在的细胞或宿主细胞,例如在细胞或宿主细胞中具有一个或多个突变、核酸插入或异源基因的细胞或宿主细胞。
如本文所使用的,术语“基因”是指编码多肽的核苷酸的集合,并且包含cDNA和基因组DNA核酸分子。“基因”还指可以充当编码序列之前(5′非编码序列)和之后(3′非编码序列)的调节元件的核酸片段。异源基因可以以单拷贝、多拷贝和/或预定的拷贝数整合到宿主细胞基因组中。
如本文所使用的,术语“调节元件”是指控制核酸序列的表达的某一方面的遗传元件。
如本文所使用的,术语“启动子”、“启动子序列”或“启动子区域”是可互换的,并且是指能够结合RNA聚合酶并参与启动下游编码或非编码序列的转录的DNA调节区域/序列。在本公开的一些实例中,启动子序列包含转录开始位点(在本文中也被称为转录起始位点(TSS)),并且向上游延伸以包含在高于背景的可检测水平下开始转录所必需的最小数目的元件。在一些实施例中,启动子序列包含TSS以及负责结合RNA聚合酶的蛋白结合结构域。真核启动子将通常(但不总是)含有“TATA”框和“CAT”框。各种启动子(包含诱导型启动子、漏型启动子、合成型启动子等)可以用于驱动本公开的宿主细胞和/或载体中的基因表达。
如本文所使用的,术语“异源的”是指核酸序列,例如任选地可操作地连接到GOI的启动子,其衍生自与其所位于其中的宿主细胞不同的物种或衍生自相同物种,但天然存在于该物种(或宿主细胞)中的不同位置。异源核酸序列可以来自原核系统或真核系统。与异源调节序列相关的编码或非编码序列(例如,在异源启动子的下游并通过异源启动子的启动而转录的序列)对异源调节序列可以是内源的(例如,异源启动子在天然环境中可操作地连接到该序列),或者对异源调节序列可以是异源的(例如,异源启动子在天然环境中没有可操作地连接到该序列)。
如本文所使用的,术语“内源的”是指天然存在于宿主细胞中的核酸序列。例如,内源启动子可以可操作地连接以启动对宿主细胞异源的下游编码或非编码序列的转录。
如本文所使用的,术语“以可操作的组合”、“以可操作的顺序”和“可操作地连接”是可互换的,并且是指以产生能够指导给定基因的转录和/或所需蛋白分子的合成的核酸分子的方式连接核酸序列。该术语还指以产生功能性蛋白的方式连接氨基酸序列。例如,GOI、辅助基因、编码重组酶的基因或非编码序列可以可操作地连接至启动子,并且核酸序列可以被染色体整合到宿主细胞中。
如本文所述,术语“染色体整合(chromosomally-integrated)”或“染色体整合(chromosomal integration)”是指将核酸序列稳定地掺入到宿主细胞诸如哺乳动物细胞的染色体中,即染色体整合到宿主细胞(例如哺乳动物细胞)的基因组DNA(gDNA)中的核酸序列。
如本文所使用的,术语“染色体基因座”和“基因座”(复数“多个基因座”)可互换地使用,并且是指细胞的染色体上核酸的定义位置。在一些实施例中,基因座可以包括至少一个基因。例如,染色体基因座可以包含约500个碱基对至约100,000个碱基对;约5,000个碱基对至约75,000个碱基对;约5,000个碱基对至约60,000个碱基对;约20,000个碱基对至约50,000个碱基对;约30,000个碱基对至约50,000个碱基对;或约45,000个碱基对至约49,000个碱基对。在一些实施例中,染色体基因座可以延伸至所定义的核酸序列的5′和/或3′末端的约100个碱基对,约250个碱基对;约500个碱基对;约750个碱基对;约1,000个碱基对;或约5,000个碱基对。
在一个实施例中,一种方法可以包含鉴定基因组中的HI基因座。HI基因座可以位于可及染色质的活性基因组区室中,并且可以位于拓扑相关结构域边界的5′或3′方向的约30,000个碱基对内。在一个实施例中,第一组峰可以在活性基因组区室中(例如如由主成分分析方法(PCA)定义),并且也可以在开放染色质中(例如如由ATAC-seq定义),但这不是方法的要求,并且在其他实施例中,第一组峰可以包含在整个映射的可及染色质中的活性基因组区室中的那些峰。HI基因座也可以和与至少一个增强子元件相互作用的区域重叠。因此,HI基因座的鉴定可以包含基因组的3D映射,以鉴定符合这些标准的一组峰。
如本文所使用的,术语“拓扑相关的结构域”和“TAD”以及“接触结构域”可互换使用,并且是指高度保守的基因组区域,其含有优先彼此物理相互作用的核酸序列。因此,与存在于TAD界限之外的序列相比,TAD内的核酸序列将更频繁地彼此物理作用。TAD可以从数千延伸到数百万个碱基对。TAD可以被边界区域(“TAD边界”)分隔,边界区域可以富含与活性转录相关的因子。例如,TAD边界区域可以表现出相对高水平的CTCF结合。还可以通过存在相对大量的tRNA基因和管家基因(例如,肌动蛋白、GAPDH、泛素等)来识别TAD边界区域。
如本文所使用的,术语“增强子”、“增强子元件”、“推定的活性增强子元件”和“预测的活性增强子元件”可互换使用,并且是指能够增加靶基因的转录速率的DNA调节区域/序列,其不与标注的转录起始位点上游的2Kb区域或下游的2Kb区域重叠,但如ChromHMM分析所示(参见例如Ernst and Kellis M.Nat Protoc.12:2478-2492(2017)),富含ATAC-Seq信号(表明开放的可及染色质)以及H3K4me1和H3K27ac组蛋白标记(Shlyueva etal.2014.Nat Rev Genet.15:272-86)。
术语“增强子元件”还可以包含“相互作用的推定活性增强子限制性片段”,其指HindIII限制性片段,其本身不含标注的转录起始位点(TSS)和/或与富含H3K27me3或H3K9me3组蛋白标记的基因组区域重叠(如由ChromHMM分析所示),但与推定的活性增强子确实重叠(如上文所定义),并且在顺式和多个PCHi-C(启动子捕获Hi-C)复制品中确实相互作用,其中HindIII限制性片段含有标注的TSS。
增强子元件可以与编码或非编码序列的启动子连接,并且可以位于启动子和相关基因的上游或下游。当以任一方向放置时,增强子元件通常可以表现出活性,并且当位于距启动子相当大的距离时,增强子可以是活性的。例如,增强子元件可以位于TSS上游或下游约1,000,000处,并且可以与TSS相邻或不相邻。用于检测增强子活性的方法在本领域中是已知的,例如,参见Molecular Cloning,A Laboratory Manual,Second Edition,(Sambrook Fritsch,Maniatis,Eds.,Cold Spring Harbor Laboratory Press,ColdSpring Harbor N.Y.,1989)。与此类增强子元件相关的活性-首先描述了病毒序列(Banerji et al.,1981,Moreau et al.,1981),并且随后描述了源自后生动物基因座的序列(Banerji et al.,1983,Gillies et al.,1983)-包含转录的激活,而不管元件在质粒构建体中相对于启动子的位置或方向。
如图1所示,一种方法可以包含鉴定可及染色质中的峰。如本文所使用的,术语“峰”是指包含DNA测序读取次数的增加(即测序读取深度)的基因组区域。例如,如由ATAC-Seq所揭示的,测序读取深度高于基因组区域的标准化背景模型的增加可以指示开放染色质,而来自PCHi-C实验的两个HindIII限制性片段之间的测序读取次数的高于设定的阈值的增加(例如标准化的CHiCAGO评分为5或以上;Cairns J,et al.,GenomeBiology.2016.17:127)将表明两个基因组区域之间具有统计学意义的顺式相互作用。术语“峰”还可以指如通过诸如Hi-C和PCHi-C的技术揭示的基因组中两点之间的接触频率的高于预定阈值的增加。
在一些实施例中,可以作为执行序列协议的结果进行峰鉴定,例如,ChiP-测序或MeDIP-seq(甲基化DNA免疫沉淀测序)协议。如本领域中已知的任何峰调用工具可以用于鉴定如本文所定义的峰。许多已知的峰调用工具仅针对某一类型的测定进行优化,诸如仅针对转录因子ChIP-seq或仅针对DNase-seq进行优化。然而,本文涵盖的峰鉴定方法不限于此类工具和任何峰调用方法和软件,包含但不限于DFilter、GEM、MACS2(Zhang et al.Model-based Analysis of ChIP-Seq(MACS).Genome Biol(2008)vol.9(9)pp.R137)、MUSIC、BCP、Threshold-based MethodTM和ZINBA。峰调用方法可以包含基于广义最优检测理论的方法以及能够利用不同类型测序数据的方法。
可以根据所鉴定的峰的类型优化为映射和鉴定目的序列中的峰而选择的数据集。此外,可以通过使用多个数据集作为参考序列来鉴定峰。例如,可以通过利用模拟的ChIP-seq数据集、真实数据集及其组合并结合数学分析(例如,利用泊松检验对候选峰进行排序)来鉴定峰。数据集可以包含但不限于ChIP-seq、ATAC-seq(参见例如Giresi等人的美国专利申请公开第2016/0060691号;Buenrostro,et al.2015″ATAC-Seq:A method for assayingchromatin accessibility genome-wide.″Curr Protoc Mol Bio 109:21.29.1-21.29.9)、Hi-C、启动子捕获Hi-C(PCHi-C)(参见例如Fraser等人的美国专利申请公开第2016/0194713号)、RNA-seq及其任意组合。可以使用如本领域中已知的其他数据集,例如,Feichtinger ChiP-Seq数据集(登录号-PRJEB9291)(参见例如,Feichtinger etal.Biotechnol Bioeng.113(10):2241-53(2016))。在某一实施例中,多个数据集(例如,多个Hi-C数据集)可以用于组装染色体规模的从头参考基因组数据,所述从头参考基因组数据可以用于使用例如SALSA或LACHESIS软件鉴定目的序列中的Hi基因座(参见例如,Burton,et al.,2013″Chromosome-scale scaffolding of de novo genome assembliesbased on chromatin interactions.”Nat Biotechnol 31:1119-1125)。
如图1所示,HI基因座可以位于可及染色质的活性基因组区室中(也见图3)。因此,对基因组上的HI基因座的鉴定可以包含对可及染色质中的峰的初始鉴定(例如通过利用利用了ATAC-seq的峰调用算法),随后进行分析以确定那些峰中的哪些存在于活性基因组区室中,如图I所示。应当理解,图I中所示的鉴定步骤的特定顺序仅是代表性的,并且所公开的方法不限于基因组的各个方面被映射的任何特定顺序。例如,在图1所示的实施例中,在鉴定位于TAD的30Kb内的峰之前,进行鉴定活性基因组区室中的可及染色质中的所有峰的步骤,但是可以改变该实施例中这些和其他步骤的特定顺序。
根据一个实施例,可以通过将目的基因组序列与参考序列进行比较来鉴定在目的序列的活性基因组区室中的可及染色质的峰。参考序列可以是单一的已知序列,或者可以通过汇编已知序列(例如,通过利用LACHESIS软件和多个Hi-C和/或PCHi-C数据集)进行组合。在一个实施例中,可以检查参考序列以鉴定所有目的峰,例如参考序列的所有ATAC-Seq峰。在可及染色质中的峰与在活性基因组区室中的峰之间的比较可以提供存在于参考序列的可及染色质的活性基因组区室中的一组峰。将目的序列与参考序列进行映射后,可以进行过滤协议以鉴定目的序列中位于可及染色质中和活性基因组区室中的峰。
HI基因座也可以位于TAD边界区域的约30,000个碱基对之内。因此,在如图1所示的一个实施例中,在鉴定了存在于可及染色质的活性基因组区室中的目的序列中的一组峰之后,可以进一步分析该组峰以确定这些峰中的哪一些也在TAD边界区域的约30,000个碱基对内(上游或下游)。这可以通过将目的序列与相同或不同的参考序列进行映射来进行。如有必要,可以在映射前在参考序列中鉴定TAD边界区域。在一个实施例中,可以根据使用“方向性指数”描述的方法鉴定TAD边界区域(参见例如,在Dixon et al.,2012,″Topological domains in mammalian genomes identified by analysis of chromatininteractions.″Nature.485(7398):376-80中)。当然,可以同样使用用于鉴定TAD边界区域的其他方法和工具。
在一个实施例中(在下面的示例部分中进一步描述),活性基因组区室和TAD边界位置的鉴定可以通过比较参考序列(例如基因组组装体、一个或多个Hi-C数据集的汇编等)与目的序列来进行,例如通过将算法应用于通过使用映射至目的序列的LACHESIS软件获得的基因组组装体。在鉴定TAD边界后,并且通过使用至少在基因组的可及染色质部分的活性基因组区室上完整的一个或多个参考基因组序列,可以鉴定出每个TAD边界的约30,000个碱基对内的峰。
如图1所示的实施例中所示,可以进一步检查鉴定为在TAD边界的约30,000个碱基对内并且也在可及染色质的活性基因组区室内的该组峰,以确定这些峰中的哪些峰也与基因组中的与至少一个增强子元件相互作用的区域重叠(通常顺式相互作用,尽管反式相互作用也包含在本文中)。例如,一种方法可以包含使用数据集鉴定基因组的与至少一个增强子元件相互作用的区域,所述数据集诸如但不限于PCHi-C、ATAC-Seq、ChIP-seq、ChromHMM或其组合。在一个实施例中,可以通过针对目的序列映射的参考序列的PCHi-C和ChromHMM分析来鉴定具有统计学意义的增强子相互作用预测。然后,可以进一步过滤之前在目的序列中鉴定的峰,以仅包含与增强子元件相互作用的峰。这种进一步的过滤可以将该组峰缩小到落在这些区域内的那些峰。所得到的一组经过滤的峰可以用于鉴定基因组的HI基因座,即这些峰中的每一个可以定义基因组的潜在HI基因座。
可以根据旨在用于驱动将被插入到基因组中的异源基因的转录的启动子类型,进行HI基因座的进一步修正。
在其中将异源启动子用于GOI转录的那些实施例中,HI基因座优选地不能与基因组的任何基因重叠。在一个实施例中,HI基因座可以包含不与基因组的任何活性基因重叠的那些基因座,但是掺入异源启动子的实施例不限于缺乏与活性基因的重叠。在一个实施例中,HI基因座将不与任何基因的任何启动子或基因组的任何活性基因的任何启动子重叠。在一个实施例中,在任何这样的启动子的任一侧,HI基因座将不落入约1,000个碱基对内。因此,在一个实施例中,一种方法可以进一步包含过滤先前通过将参考序列重新映射到目的序列而获得的潜在HI基因座,以鉴定目的序列的这些区域(例如,活性基因及其相关启动子区域(启动子的±约1,000个碱基对))外部的峰。然后可将这些峰鉴定为所需的HI基因座。
在其中原位内源启动子被用于GOI转录的那些实施例中使用的HI基因座可以与活性基因的原位内源TSS重叠,所述活性基因的表达或缺乏表达对细胞来说是不重要的,即重组细胞可以在没有活性基因的情况下存活。因此,如图1右侧的流程中所示,一种方法可以进一步包含过滤先前通过将参考序列重新映射到目的序列而获得的潜在HI基因座,以鉴定可及染色质的活性区室中的非重要活性基因及其相关TSS。例如,还可以检查目的基因是否具有可能影响基因启动子在插入的RTS表达中的使用的其他特征,例如致死性。然后可以将与合适基因的这些区域重叠的那些峰鉴定为所需的HI基因座。
所得到的一组符合特定应用的所有期望类别的峰可以提供基因组的HI基因座。例如,用于包含利用异源启动子的应用中的HI基因座可以包含位于可及染色质的活性基因组区室中且在TAD边界的约30,000个碱基对(上游或下游)内的峰。此外,这些HI基因座可以与基因组中的与增强子元件相互作用的区域重叠,并且通常不会与基因或其相关启动子区域重叠。
用于包含利用原位内源启动子的应用中的HI基因座还可以包含位于可及染色质的活性基因组区室中且在TAD边界的约30,000个碱基对(上游或下游)内的峰,并且这些HI基因座还可以与基因组中的与增强子元件相互作用的区域重叠。此外,这些HI基因座将与活性基因的内源TSS重叠,该活性基因被限制在可及染色质的活性基因组区室中,并且具有已经被归类为对细胞不重要的功能。
在一个实施例中,一种方法可以包含在其鉴定之后对HI基因座进行排序。例如,可以基于与基因座相关的一个或多个基因的一个或多个表达水平、从该基因座到最近的TAD边界的距离、预测的增强子相互作用的数量以及与该基因座相关的一个或多个基因的稳态mRNA水平对HI基因座进行排序。例如,在一个实施例中,可以仅根据单个参数对每个鉴定的HI基因座进行排序,并且然后可以分析所有HI基因座的这些多个排序,以确定总体排序。可以根据需要对组合分析进行加权或不加权。例如,根据非加权的组合方法,每个基因座的每个排序的简单相加得分可以用于确定总体排序。接近最近的TAD边界并预测具有大量增强子相互作用的高排序基因座(例如与高表达基因相关的基因座)可能是用于插入RTS的高度期望的基因座。
通过使用所述方法,可以在任何哺乳动物细胞中鉴定HI基因座。举例来说,下面的表1提供了根据所公开的方法鉴定的CHO基因组HI基因座的示例。然而,应该理解,CHO基因组HI基因座决不限于表1的基因座,并且与SEQ ID NO.:1-125中任一个同源的序列包含在本文中。在其他实施例中,CHO基因组HI基因座可以在如下表1中鉴定的基因座的5′和/或3′端的约5,000个碱基对、约1,000个碱基对、约750个碱基对、约500个碱基对、约250个碱基对或约100个碱基对内。
与表1的序列相比,HI基因座可以具有少量的错配或间隙。例如,本文涵盖的CHO基因组HI基因座与下述序列可以具有约10个或更少的错配。例如,本文涵盖的CHO HI基因座与如表1所述序列可以具有10、9、8、7、6、5、4、3、2或1个错配,和/或与如表1所述的序列相比可以具有5个或更少的间隙。
如本文所定义的HI基因座还可以包含SEQ ID NO.:1-125中任一个的部分,并且不限于SEQ ID NO.:1-125的全长序列。例如,HI基因座可以包含基因组序列,其是仅与SEQ IDNO.:1-125中任一个的一部分等同的序列或同源序列,例如,与SEQ ID NO.:1-125中任一个的约5bp至约98%或更少的区域等同或同源。举例来说,本文涵盖的HI基因座可以包含与SEQ ID NO.:1-125中任一个的总长度的约5bp至约95%、90%、85%、80%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或5%等同或同源的序列。
如本文所使用的,术语“同源物”或“同源序列”是指与具体给定的比较序列具有序列同源性的核苷酸序列,例如与表1的SEQ ID NO.:1-125中的任一个或与SEQ ID NO.:1-125中的任一个的一部分具有序列同源性。如本文所使用的,术语“序列同源性”是指基于序列比对的两个序列的同一性或相似性程度的量度,所述比对使所比对的核苷酸之间的相似性最大化,并且是相同核苷酸的数目、总核苷酸的数目以及序列比对中间隙的存在和长度的函数。多种算法和计算机程序可用于使用标准参数确定序列相似性。在一个实施例中,序列同源性可以使用核酸序列的BLASTn程序测定,该程序可通过国家生物技术信息中心(www.ncbi.nlm.nih.gov/)获得,并在例如Altschul et al.(1990),J Mol.Biol.215:403-410;Gish and States(1993),Nature Genet.3:266-272;Madden et al.(1996),Meth.Enzymol.266:131-141;Altschul et al.(1997),Nu-cleic Acids Res.25:3389-3402);Zhang et al.(2000),J.Comput.Biol.7(1-2):203-14中描述。在一个实施例中,两个核苷酸序列的序列同源性可以通过基于BLASTn算法的以下参数的评分来确定:字长=11;间隙开放罚分=-5;间隙扩展罚分=-2;匹配奖励=1;并且失配罚分=-3。
以下表1的序列参考了公开可获得的BGI CHO数据库以及NCBI遗传序列数据库的公开可获得的
Figure BDA0003001247780000162
表1序列的GenBank组件登录号为GCA_000223135.1,并且表1序列的BGI CHO RefSeq组件登录号为GCF_000223135.1,由北京基因组研究所于2011年8月23日提交。表1中所提及的“开始”和“结束”数字是指公开可获得的完整序列中每个HI基因座的开始和结束核苷酸。
表1
Figure BDA0003001247780000161
Figure BDA0003001247780000171
Figure BDA0003001247780000181
Figure BDA0003001247780000191
根据一个实施例,在鉴定基因组的HI基因座后,哺乳动物细胞可以被修饰以在基因组的HI基因座处包含着陆垫。例如,在一个实施例中,可以选择特定的HI基因座(例如,通过对鉴定的HI基因座进行排序),并且可以在该基因座处插入RTS以形成位点特异性整合位点(例如,在SEQ ID NO.:1-125中的任何一个之内或与其重叠,或者在SEQ ID NO.:1-125中的任何一个的5′端或3′端的约5,000个碱基对、约1,000个碱基对、约750个碱基对、约500个碱基对、约250个碱基对或约100个碱基对之内或与其重叠)。
在一个实施例中,可以进行整合协议以将表达盒随机地整合到多个细胞的基因组中。例如,在一个实施例中,可以进行随机整合协议,并且可以将携带可检测标记的表达盒整合到细胞中。随后,可以检查细胞以确定盒的整合位点,并且可以选择在HI基因座(例如,在一个实施例中,高排序的HI基因座)处包含整合位点的细胞。然后可以利用该所选的细胞在HI基因座处建立着陆垫(例如,在SEQ ID NO.:1-125中任一个内或与之重叠,或在SEQ IDNO.:1-125中任一个的5′端或3′端的约5,000个碱基对、约1,000个碱基对、约750个碱基对、约500个碱基对、约250个碱基对或约100个碱基对内)。
如本文所述,术语“着陆垫”是指包括染色体整合到宿主细胞中的RTS的核酸序列。在一些实施例中,着陆垫包括两个或更多个染色体整合到宿主细胞中的RTS。着陆垫可以被整合到一个或多个不同的染色体基因座中。例如,不同的着陆垫可以被整合到1、2、3、4、5、6、7或8个不同的染色体基因座中,并且一个或多个不同的染色体基因座可以是HI基因座。
如本文所述,术语“位点特异性整合位点”、“重组靶位点”、“RTS”和“位点特异性重组酶靶位点”可互换使用,并且是指被位点特异性重组酶识别并在位点特异性重组事件中可以是交叉区域的短的,例如小于约60个碱基对的核酸位点或序列。在一些实施例中,重组靶位点可以少于约60个碱基对、少于约55个碱基对、少于约50个碱基对、少于约45个碱基对、少于约40个碱基对、少于约35个碱基对或少于约30个碱基对。在一些实施例中,重组靶位点可以是约30至约60个碱基对、约30至约55个碱基对、约32至约52个碱基对、约34至约44个碱基对、约32个碱基对、约34个碱基对或约52个碱基对。位点特异性重组酶靶位点的示例包含但不限于lox位点、rox位点、frt位点、att位点和dif位点。在一些实施例中,重组靶位点是具有与SEQ ID NO.:126-155中所述基本相同序列的核酸。
在一些实施例中,RTS是选自表2的lox位点。如本文所述,术语“lox位点”是指Cre重组酶可以催化位点特异性重组的核苷酸序列。本领域已知多种不相同的lox位点。各种lox位点的序列相似,因为它们都含有相同的13-碱基对反向重复序列,该重复序列位于其中发生重组的8-碱基对不对称核心区域的侧翼。正是不对称核心区域决定了位点的方向性以及不同lox位点之间的差异。这些中的说明性(非限制性)的示例包含天然存在的loxP(在P1基因组中的序列)、loxB、loxL和loxR(它们在大肠杆菌染色体中发现)以及一些突变或变体lox位点,诸如loxP 511、loxA86、loxΔ 117、loxC 2、loxP 2、loxP 3和loxP 23。在一些实施例中,lox重组靶位点是与表2中的序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸。
表2
Figure BDA0003001247780000201
Figure BDA0003001247780000211
如本文所使用的,术语“序列同一性”或“%同一性”在核酸序列或氨基酸序列的上下文中是指当序列在指定的比较窗口上比对时,所比较的序列中相同的残基的百分比。比较窗口可以是至少10到1,000个以上残基的片段,其中可以对序列进行比对和比较。用于确定序列同一性的比对方法是本领域众所周知的,并且可以使用公开可获得的数据库诸如BLAST(blast.ncbi.nlm.nih.gov/Blast.cgi)进行。
在一些实施例中,RTS是选自loxΔ86、loxΔ117、loxC2、loxP 2、loxP 3和loxP 23的lox位点。
在一些实施例中,RTS是从表3中选择的Frt位点。如本文所述,术语“Frt位点”是指酵母2μm质粒的FLP基因产物FLP重组酶可以催化位点特异性重组的核苷酸序列。本领域已知多种不相同的Frt位点。各种Frt位点的序列相似,因为它们都含有相同的13-碱基对反向重复序列,该重复序列位于其中发生重组的8-碱基对不对称核心区域的侧翼。正是不对称的核心区域决定了位点的方向性以及不同Frt位点之间的差异。这些的说明性(非限制性)示例包含天然存在的Frt(F)和几个突变或变体Frt位点,诸如Frt F1和Frt F2。在一些实施例中,Frt重组靶位点是与表3中的序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸。
表3
Figure BDA0003001247780000212
Figure BDA0003001247780000221
在一些实施例中,RTS是选自表4的rox位点。如本文所述,术语“rox位点”是指Dre重组酶可以催化位点特异性重组的核苷酸序列。本领域已知多种不相同的rox位点。这些位点的说明性(非限制性)示例包含roxR和roxF。在一些实施例中,rox重组靶位点是与表4中的序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸。
表4
名称 标识符 序列
roxF SEQ ID NO.:147 TAACTTTAAATAATGCCAATTATTTAAAGTTA
roxR SEQ ID NO.:148 TAACTTTAAATAATTGGCATTATTTAAAGTTA
在一些实施例中,RTS是选自表5的att位点。如本文所述,术语“att位点”是指λ整合酶或
Figure BDA0003001247780000222
整合酶可以催化位点特异性重组的核苷酸序列。本领域已知多种不相同的aat位点。这些位点的说明性(非限制性)示例包含attP、attB、proB、trpC、galT、thrA和rrnB。在一些实施例中,att重组靶位点是与表5中的序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸。
表5
Figure BDA0003001247780000223
在一些实施例中,细胞可以包含多个(例如,至少四个)RTS,例如,多个不同RTS,并且可以使用RTS的任何有用的组合。如本文所使用的,术语“不同的重组靶位点”或“不同RTS”是指不相同或异质特异性的重组靶位点。例如,存在几个变体Frt位点,但重组通常只能发生在两个相同的Frt位点之间。在一些实施例中,不同的重组靶位点是指来自相同重组系统(例如LoxP和LoxR)的不相同的重组靶位点。在一些实施例中,不同的重组靶位点是指来自不同重组系统(例如LoxP和Frt)的不相同的重组靶位点。在一些实施例中,不同的重组靶位点是指来自相同重组系统的重组靶位点和来自不同重组系统(例如LoxP、LoxR、Frt和Frtl)的重组靶位点的组合。例如,在一些实施例中,哺乳动物细胞可以包含至少两个不同RTS,其中至少一个RTS被染色体整合到HI基因座中,并且至少一个RTS被染色体整合到选自Fer1L4(参见例如美国专利申请第14/409,283号)、ROSA26、HGPRT、DHFR、COSMC、LDHA或MGAT1的染色体基因座中。
可以进一步加工在HI基因座处掺入RTS的细胞以产生重组蛋白生产细胞。除了RTS外,重组蛋白生产细胞还可以包含编码位点特异性重组酶的基因。重组酶(recombinaseenzyme)(也被称为重组酶(recombinase))是在位点特异性重组中催化重组的酶。在一个实施例中,可以用于位点特异性重组的重组酶可以来自非哺乳动物系统。例如,重组酶可以来自细菌、噬菌体或酵母。
在一些实施例中,编码重组酶的核酸序列可以被整合到宿主细胞中。例如,可以通过分子生物学已知的方法将编码重组酶的核酸序列递送至宿主细胞。在一些实施例中,重组酶多肽序列可以被直接递送至细胞。
可以使用的重组酶的示例包含但不限于Cre重组酶、FLP重组酶、Dre重组酶、KD重组酶、B2B3重组酶、Hin重组酶、Tre重组酶、λ整合酶、HK022整合酶、HP1整合酶、γδ分解酶/转化酶、ParA分解酶/转化酶、Tn3分解酶/转化酶、Gin分解酶/转化酶、
Figure BDA0003001247780000231
整合酶、BxB1整合酶、R4整合酶或另一种功能重组酶。
在一个实施例中,可以使用FLP重组酶。FLP重组酶催化位点特异性重组反应,该反应涉及在DNA复制期间扩增酿酒酵母2μ质粒的拷贝数。FLP重组酶可以来源于酵母属的物种,并且在一个实施例中可以来源于酿酒酵母的菌株。在一些实施例中,FPL重组酶来源于酿酒酵母的菌株。FLP重组酶可以是热稳定的突变FLP重组酶,诸如FLP1或FLPe。在一些实施例中,编码FLP重组酶的核酸序列包括人优化密码子。
Cre重组酶是重组酶的Int家族的成员(Argos et al.(1986)EMBO J.5:433),并且已经证明不仅在细菌中而且在真核细胞中进行lox位点(X-ing over位点)的高效重组(Sauer(1987)Mol.Cell.Biol.7:2087;Sauer and Henderson(1988)Proc.NatlAcad.Sci.85:5166)。在一个实施例中,Cre重组酶可以来自噬菌体,例如来自P1噬菌体。
在一个实施例中,哺乳动物细胞可以包含染色体整合在HI基因座内的RTS,并且该细胞可以用包括根据SSI整合协议编码目的基因的可交换盒的载体转染。当可交换盒整合到HI基因座中时,可以选择包含被整合到染色体中的可交换盒的重组蛋白生产细胞。选择可以是例如通过检测标记的存在,或者可以是通过使用本领域技术人员已知的方法检测标记的不存在。
SSI协议可以用于将一个或多个基因引入到宿主细胞染色体中。如本文所使用的,“位点特异性整合”可以指核酸序列在特定位点整合到染色体中,并且也可以指“位点特异性重组”,其指通过特定酶在其同源序列对或靶位点进行重组来重排两个DNA伴侣分子。与同源重组不同,位点特异性重组不需要伴侣DNA分子之间的DNA同源性,与RecA无关,并且在任何阶段都不涉及DNA复制。在一些实施例中,位点特异性重组使用位点特异性重组酶系统来实现核酸在宿主细胞例如哺乳动物细胞中的位点特异性整合。重组酶系统通常由三个元件组成:两个匹配的DNA序列(重组靶位点)和特异性酶(重组酶)。重组酶催化匹配重组位点之间的重组反应。
涉及两个RTS序列的术语“匹配”是指两个序列能够被重组酶结合并影响两个序列之间的位点特异性重组。在一些实施例中,与细胞的RTS匹配的可交换盒的RTS是指具有与细胞的RTS基本相同的序列的盒的RTS。在一些实施例中,可交换盒含有与染色体整合到宿主细胞基因组中的一个或两个RTS基本相同的序列。
如本文所使用的,“转染”是指将外源核酸分子(包含载体)导入到细胞中。“转染的”细胞包括细胞内的外源核酸分子,并且“转化的”细胞是其中细胞内的外源核酸分子诱导细胞的表型变化的细胞。转染的核酸分子可以被整合到宿主细胞的基因组DNA中,和/或可以由细胞在染色体外临时或长时间维持。表达外源核酸分子或片段的宿主细胞或生物体被称为“重组”生物体、“转化的”生物体或“转基因”生物体。
载体(也被称为表达载体)可以是任何合适的复制子,诸如质粒、噬菌体、病毒或粘粒,另一个DNA片段可以连接到所述复制子上,以实现所连接的DNA片段在细胞中的复制和/或表达。载体可以包含附加体(例如质粒)和非附加体载体。例如,在一个实施例中,可以使用在许多细胞代后从细胞的群体中除去/丢失的附加体载体,例如通过不对称分配。载体可以是病毒或非病毒载体,并且可以在体外、体内或离体将核酸分子引入到细胞中。合成载体也包含在本文中。可以通过众所周知的方法将载体引入到所需的宿主细胞中,所述方法包含但不限于转染、转导、细胞融合和脂转染。载体可以包括各种调节元件,包含启动子。
如本文所使用的,术语“可交换盒”、“表达盒”和“盒”可互换使用,并且是指含有基因并可以包含RTS的可移动遗传元件。在一些实施例中,可交换盒可以包含多个RTS和/或多个基因。例如,可交换盒可以包含与报告基因或选择基因结合的GOI。
GOI可以包含但不限于报告基因、选择基因、治疗目的基因、辅助基因或其组合。
如本文所使用的,术语“报告基因”是指其表达赋予细胞可以容易地鉴定和测量的表型的基因。例如,报告基因可以包含荧光蛋白基因或选择基因。在一个实施例中,选择基因可以编码赋予细胞在缺乏必需营养物的培养基中存活的能力的产物。在一些实施例中,选择基因可以赋予细胞对抗生素或药物的抗性。选择基因可以用于赋予宿主细胞特定的表型。当宿主细胞表达选择基因以便在选择性培养基中存活时,该基因被认为是阳性选择基因。选择基因也可以用于针对含有特定基因的宿主细胞进行选择;以这种方式使用的选择基因被称为阴性选择基因。
如本文所使用的,术语“治疗目的基因”是指任何功能相关的核苷酸序列。因此,治疗目的基因可以包含编码其表达是制备治疗性重组蛋白所需的蛋白的任何基因。合适的治疗目的基因的代表性(非限制性)示例包含单克隆抗体、双特异性单克隆抗体和抗体药物缀合物(包含凝血因子、其中蛋白表达受限于转录的良好表达的mAb、激素诸如EPO、免疫融合蛋白(Fc融合)、三特异性mAb等)。
如本文所使用的,术语“辅助基因(ancillary gene)”或“辅助基因(helpergene)”可互换使用,并且是指有助于第二基因的表达或有助于第二基因的产物的稳定、折叠或翻译后修饰或产生促进第二基因的产物产生的细胞环境的第一基因。在一些实施例中,第二基因编码DtE蛋白(或其一部分)。辅助基因可以编码例如RNA(例如mRNA、tRNA或miRNA)、转录因子、分子伴侣、伴侣蛋白、合成酶、氧化酶、还原酶、糖转移酶、蛋白酶、激酶、磷酸酶、乙酰基转移酶、脂肪酶或烷基酶。
GOI可以包含以所需的拷贝数编码良好表达的治疗性蛋白的基因。例如,编码良好表达的治疗性蛋白的基因的拷贝数可以是2拷贝、3拷贝、4拷贝、5拷贝、6拷贝、7拷贝、8拷贝、9拷贝或10拷贝。
如本文所使用的,术语“难以表达的蛋白”是指难以产生的蛋白。例如,产生DtE蛋白可能是困难的,这是因为蛋白的表达必须高度调节,蛋白难以从宿主细胞中回收,蛋白易于错折叠,蛋白易于剪切,蛋白易于降解,蛋白易于聚集,蛋白溶解性差,蛋白为膜结合蛋白,蛋白难以纯化,蛋白具有细胞毒性,蛋白包括多个多肽链,例如2、3或4个多肽链,或其任意组合。例如,DtE蛋白可以包含多个多肽链,这些多肽链形成同质寡聚体或异质寡聚体,以产生DtE蛋白。在这样的实施例中,DtE蛋白的链可以编码在一个或多个目的基因上,所述目的基因可以与重组细胞的相同或不同RTS相关。同质寡聚体或异质寡聚体可以通过共价相互作用、非共价相互作用或其组合形成。DtE蛋白也可以是需要表达辅助基因以产生DtE蛋白的蛋白,或需要翻译后修饰以产生DtE蛋白的蛋白。
DtE蛋白可以是单克隆抗体,诸如双特异性单克隆抗体或三特异性单克隆抗体。DtE蛋白的其他示例包含Fc-融合蛋白,它是一种融合蛋白,其中免疫球蛋白的Fc结构域与第二肽可操作地连接。DtE蛋白可以是酶、膜受体和双特异性T细胞衔接器(
Figure BDA0003001247780000261
MicrometAG,Munich,Germany)。
在一个实施例中,GOI可以位于两个RTS之间,即其中一个RTS位于基因的5′,而不同RTS位于基因的3′。在一些实施例中,RTS与位于它们之间的基因直接相邻。在一些实施例中,RTS位于距位于它们之间的基因规定的距离处。在一些实施例中,RTS是定向序列。在一些实施例中,位于它们之间的基因的RTS 5′和3′是直接定向的(即它们定向在相同的方向)。在一些实施例中,位于它们之间的基因的RTS 5′和3′被反向定向(即,它们被定向在相反的方向)。
在一些实施例中,细胞可以包含一个或多个另外的GOI,并且一个或多个另外的GOI可以是染色体整合的。第二目的基因可以是例如报告基因、选择基因、治疗目的基因(例如编码DtE蛋白的基因)、辅助基因或其组合。另外的GOI可以位于与第一GOI相同的HI内、位于第二HI位点内或位于单独的基因座内。
通过使用与用第一GOI转染细胞相同或不同的载体,可以将第二GIO整合到细胞中。例如,可以用包括编码第一目的基因的第一可交换盒的第一载体和包括编码第二目的基因的第二可交换盒的第二载体转染细胞。第一盒可以被整合到HI基因座中,并且第二盒可以被整合到同一个HI基因座中,被整合到第二HI基因座中,或被整合到单独的基因座中。例如,第二盒可以被整合到Fer1L4基因座中。然后可以选择重组蛋白生产细胞,其包含在所需的位置被整合到染色体中的第一可交换盒和第二可交换盒。
有益的是,在制备rP表达细胞时使用位于HI基因座中的着陆垫的SSI可以确保rP表达细胞池的遗传组成是同质的。此外,使用位于HI基因座中的着陆垫制备rP表达细胞的SSI可以确保rP表达细胞池的效率是同质的。例如,生产细胞池可以在第一辅助基因与第二辅助基因的比率方面是同质的,和/或生产细胞池在辅助基因与治疗目的基因的比率方面是同质的。因此,使用位于HI中的着陆垫制备rP表达细胞的SSI可以确保更一致的rP产品质量。
本文所述的细胞系(包含原核和/或真核细胞系)可以使用任何合适的装置、设施和方法培养。此外,在实施例中,所述装置、设施和方法适合于培养悬浮细胞或锚定依赖性(贴壁)细胞,并且适合于被配置用于生产药物和生物制药产品(诸如多肽产品、核酸产品(例如DNA或RNA)或哺乳动物或微生物细胞和/或病毒(诸如用于细胞和/或病毒和微生物群疗法的那些))的生产操作。
细胞可以表达或产生产物,诸如重组治疗性或诊断性产物。由细胞产生的产物的示例可以包含但不限于抗体分子(例如单克隆抗体、双特异性抗体)、抗体模拟物(特异性地结合至抗原但在结构上不与抗体相关的多肽分子,诸如例如DARPins、亲合体、模拟抗体蛋白或IgNAR)、融合蛋白(例如Fc融合蛋白、嵌合细胞因子)、其他重组蛋白(例如糖基化蛋白、酶、激素)、病毒治疗剂(例如抗癌溶瘤病毒、用于基因疗法和病毒免疫疗法的病毒载体)、细胞治疗剂(例如多能干细胞、间充质干细胞和成体干细胞)、疫苗或脂质包封颗粒(例如,外来体、病毒样颗粒)、RNA(诸如例如,siRNA)或DNA(诸如例如,质粒DNA)、抗生素或氨基酸。在实施例中,所述装置、设施和方法可以用于生产生物仿制药。
所公开的方法可以允许生产真核细胞,例如哺乳动物细胞或低等真核细胞,诸如例如酵母细胞或丝状真菌细胞,以及原核细胞,诸如革兰氏阳性或革兰氏阴性细胞和/或真核细胞或原核细胞的产物,例如蛋白、肽、抗生素、氨基酸、核酸(诸如DNA或RNA),其通过真核细胞以大规模方式合成。在一些实施例中,还公开了用于微生物群治疗剂的微生物生物体及其孢子的用途。除非本文另有说明,否则装置、设施和方法可以包含任何所需的体积或生产能力,包含但不限于小规模、中试规模和全生产规模的能力。
此外,除非本文另有说明,否则装置、设施和方法可以包含任何合适的反应器或生物反应器,包含但不限于搅拌罐、气升式反应器、纤维、微纤维、中空纤维、陶瓷基质、流化床、固定床和/或喷动床生物反应器。如本文所使用的,“反应器”或“生物反应器”可以包含发酵罐或发酵单元,或任何其他反应容器,并且术语“反应器”可与“发酵罐”互换使用。术语发酵罐或发酵是指微生物和哺乳动物培养物。例如,在一些方面中,示例性的生物反应器单元可以执行以下中的一个或多个或全部:营养物和/或碳源的进料、合适的气体(例如氧气)的注射、发酵或细胞培养基的入口和出口流、气相和液相的分离、温度的维持、氧气和CO2水平的维持、pH水平的维持、搅动(例如搅拌)和/或清洁/灭菌。诸如发酵单元的示例性反应器单元可以在单元内含有多个反应器,例如该单元可以在每个单元中具有1至约100个或更多个生物反应器,例如在每个单元中具有约10至约90个或约20至约80个生物反应器,和/或设施可以含有在设施内具有单个或多个反应器的多个单元。生物反应器可以适用于分批、半补料分批、补料分批、灌注和/或连续发酵过程。可以使用任何合适的反应器直径。例如,生物反应器可以具有约100mL至约50,000L的体积。非限制性的示例包含约250mL至约10L、约10L至约500L、约20L至约200L、约500L至约5,000L或在一些实施例中约5,000L至约50,000L的体积。此外,合适的反应器可以是多用途的、单用途的、一次性的或非一次性的,并且可以由任何合适的材料形成,包含金属合金,诸如不锈钢(例如,316L或任何其他合适的不锈钢)和铬镍铁合金、塑料和/或玻璃。
在实施例中,并且除非本文另有说明,否则本文所述的装置、设施和方法还可以包含未另外提及的任何合适的单元操作和/或设备,诸如用于分离、纯化和分离此类产物的操作和/或设备。可以使用任何合适的设施和环境,诸如传统的固定设施、模块化、移动和临时设施,或任何其他合适的结构、设施和/或布局。例如,在一些实施例中,可以使用模块化洁净室。此外,除非另有说明,否则本文所述的装置、系统和方法可以在单个位置或设施中容纳和/或执行,或者可替换地,可以在单独或多个位置和/或设施中容纳和/或执行。
作为非限制性的示例且非限制性地,美国公开第2013/0280797号;第2012/0077429号;第2011/0280797号;第2009/0305626号;和美国专利第8,298,054号;第7,629,167号;和第5,656,491号(其据此通过引用以其整体并入)描述了可能适合的示例性设施、设备和/或系统。
重组细胞可以是如前所述的哺乳动物细胞,并且在一个特定的实施例中可以是CHO细胞(例如,CHO-K1细胞、CHO-DXB11细胞、CHO-DG44细胞、包含所有变体的CHOK1SVTM细胞、包含所有变体的CHO谷氨酰胺合成酶敲除细胞等),但是本公开不限于这些细胞。可以在HI基因座中整合RTS的细胞的其他示例可以包含HEK293细胞,包含贴壁和悬浮适应变体、HeLa、HT1080、H9、HepG2、MCF7、MDBK Jurkat、NIH3T3、PC12、BHK(幼仓鼠肾细胞)、VERO、YB2/0、Y0、C127、L、COS(例如COS1和COS7)、QC1-3、HEK-293、VERO、PER.C6、EB1、EB2、EB3、溶瘤或杂交瘤细胞系。真核细胞也可以是禽类细胞、细胞系或细胞株,诸如例如
Figure BDA0003001247780000281
细胞、EB14、EB24、EB26、EB66或EBvl3。
在一些实施例中,可以利用真核干细胞。干细胞可以是例如多能干细胞,包含胚胎干细胞(ESC)、成体干细胞、诱导多能干细胞(iPSC)、组织特异性干细胞(例如造血干细胞)和间充质干细胞(MSC)。本文涵盖本文所述的任何细胞的分化形式。
真核细胞可以是低等真核细胞,诸如例如酵母细胞(例如,毕赤酵母属(例如,毕赤酵母、甲醇毕赤酵母、克鲁维毕赤酵母和安格斯毕赤酵母)、巴斯德毕赤酵母属(例如,毕赤酵母、Komagataella pseudopastoris或法夫驹形氏酵母)、酿酒酵母属(例如,酿酒酵母、克鲁维酵母、葡萄汁酵母)、克鲁维酵母属(例如,乳酸克鲁维酵母、马克斯克鲁维酵母)、念珠菌属(例如,产朊假丝酵母、可可假丝酵母、博伊丁假丝酵母)、地丝菌属(例如,发酵地霉)、多形汉逊酵母、解脂耶氏酵母或粟酒裂殖酵母。
真核细胞可以是真菌细胞(例如曲霉属(诸如黑曲霉、烟曲霉、米曲霉、构巢曲霉)、枝顶孢属(诸如嗜热厌氧菌)、毛壳菌属(诸如嗜热毛壳菌)、金孢子菌属(诸如嗜热金孢子菌)、虫草属(诸如蛹虫草)、棒囊壳属、栉霉属、镰孢属(诸如尖镰孢菌)、小丛壳菌属(诸如禾生小丛壳)、肉座菌属(诸如红褐肉座菌)、巨座壳属(诸如稻热病菌)、毁丝霉属(诸如嗜热毁丝霉)、丛赤壳属(诸如红球丛赤壳菌)、脉孢霉属(诸如粗糙链孢霉)、青霉菌属、孢子丝菌属(诸如嗜热孢子丝菌)、梭孢壳属(诸如太瑞斯梭孢壳霉、异梭孢壳霉)、木霉菌属(诸如里氏木霉)或轮枝菌属(诸如大丽花轮枝孢菌)。
真核细胞可以是昆虫细胞(例如,Sf9、MimicTMSf9、Sf21、High FiveTM(BT1-TN-5B1-4)或BT1-Ea88细胞)、藻类细胞(例如,双眉藻属、硅藻纲、杜氏藻属、小球藻属、衣藻属、蓝藻门(蓝细菌)、微绿球藻、螺旋藻属或棕鞭藻属)或植物细胞(例如,来自单子叶植物(例如,玉米、水稻、小麦或狗尾草)的细胞,或来自双子叶植物(例如,木薯、马铃薯、大豆、番茄、烟草、苜蓿、小立碗藓或拟南芥的细胞)。
细胞可以是细菌或原核细胞。例如,可以使用革兰氏阳性细胞,诸如芽孢杆菌、链霉菌属链球菌、葡萄球菌或乳杆菌。可以使用的芽孢杆菌可以包含例如枯草芽孢杆菌、解淀粉芽孢杆菌、地衣芽孢杆菌、纳豆芽孢杆菌或巨大芽孢杆菌。在实施例中,所述细胞是枯草芽孢杆菌,诸如枯草芽孢杆菌3NA和枯草芽孢杆菌168。芽孢杆菌可以从例如BacillusGenetic Stock Center,Biological Sciences 556,484West 12thAvenue.Columbus OH43210-1214获得。
可以使用革兰氏阴性细胞,诸如沙门氏菌属或大肠杆菌,诸如例如TG1、TG2、W3110、DH1、DHB4、DH5a、HMS 174、HMS174(DE3)、NM533、C600、HB101、JM109、MC4100、XL1-Blue和Origami,以及来源于大肠杆菌B-菌株的那些,诸如例如BL-21或BL21(DE3),所有这些都是可商购的。合适的宿主细胞可商购,例如,从诸如DSMZ(Deutsche Sammlung vonMikroorganismen and Zellkulturen GmbH,Braunschweig,Germany)或美国模式培养物保藏中心(ATCC)的培养物保藏中心获得。在一些实施例中,细胞包含用作治疗剂的其他微生物群。这些微生物群包含存在于人类微生物群系中的微生物群,其属于厚壁菌门、拟杆菌门、变形菌门、疣微菌门、放线菌门、梭杆菌门和蓝细菌门。微生物群可以包含需氧、严格厌氧或兼性厌氧,并且包含细胞或孢子。治疗性微生物群还可以包含经遗传操纵的生物体及在其修饰中使用的载体。其他与微生物群系相关的治疗性生物体可包含:古细菌、真菌和病毒。参见例如,The Human Microbiome Project Consortium.Nature 486,207-214(14June2012);Weinstock,Nature,489(7415):250-256(2012);Lloyd-Price,Genome Medicine 8:51(2016)。
可以培养rP产生细胞以产生肽、氨基酸、脂肪酸或其他有用的生化中间体或代谢物。例如,可以生产分子量为约4000道尔顿至大于约140,000道尔顿的分子。由细胞产生的分子可以具有一定范围的复杂性,并且可以包含翻译后修饰(包含糖基化)。
可以产生的蛋白可包含,例如,BOTOX、Myobloc、Neurobloc、Dysport(或肉毒杆菌神经毒素的其他血清型)、阿糖苷酶α、达托霉素、YH-16、绒毛膜促性腺激素α、非格司亭、西曲瑞克、白介素-2、阿地白介素、替西白介素、地尼白介素-毒素连接物、干扰素α-n3(注射)、干扰素α-nl、DL-8234、干扰素、Suntory(γ-1a)、干扰素γ、胸腺肽α1、他索纳明、DigiFab、ViperaTAb、EchiTAb、CroFab、奈西立肽、阿巴西普、阿法赛特、利比、依托特明α、特立帕肽(骨质疏松症)、可注射降血钙素(骨病)、降血钙素(鼻,骨质疏松症)、依那西普、谷他血红蛋白250(牛)、替加色罗α、胶原酶、卡培立肽、重组人类表皮生长因子(局部凝胶,伤口愈合)、DWP401、达贝泊汀α、依泊汀ω、依泊汀β、依泊汀α、地西卢定、来匹卢定、比伐卢定、诺那凝血素α、Mononine、依他凝血素α(活化的)、重组因子VIII+VWF、重组物、重组因子VIII、因子VIII(重组)、Alphnmate、辛凝血素α、因子VIII、帕利夫明、Indikinase、替奈普酶、阿替普酶、帕米普酶、瑞替普酶、那替普酶、孟替普酶、促滤泡素α、rFSH、hpFSH、米卡芬净、培非格司亭、来格司亭、那托司亭、舍莫瑞林、胰高血糖素、艾塞那肽、普兰林肽、伊米苷酶、加硫酶、Leucotropin、莫拉司亭、醋酸曲普瑞林、组氨瑞林(皮下植入,Hydron)、地洛瑞林、组氨瑞林、那法瑞林、亮丙瑞林缓释库(ATRIGEL)、亮丙瑞林植入物(DUROS)、戈舍瑞林、尤得盼、KP-102程序、生长激素、美卡舍明(生长不足)、恩夫韦肽、Org-33408、甘精胰岛素、赖谷胰岛素、胰岛素(吸入式)、赖脯胰岛素、地特胰岛素、胰岛素(颊的,RapidMist)、美卡舍明-林菲培、阿那白滞素、西莫白介素、99mTc-阿西肽注射剂、表面抗原肽、贝他费隆、醋酸格拉替雷、Gepon、沙莫司亭、奥普瑞白介素、人类白细胞衍生的α干扰素、倍尔来福、胰岛素(重组)、重组人类胰岛素、门冬胰岛素、mecasenin、罗扰素-A、干扰素-α2、Alfaferone、干扰素alfacon-1、干扰素α、Avonex重组人类黄体化激素、脱氧核糖核酸酶α、曲弗明、齐考诺肽、他替瑞林、地博特明α、阿托西班、贝卡普勒明、依替巴肽、Zemaira、CTC-111、Shanvac-B、HPV疫苗(四价)、奥曲肽、兰乐肽、ancestirn、半乳糖苷酶β、半乳糖苷酶α、拉罗尼酶、醋肽铜(局部凝胶)、拉布立酶、兰尼单抗、Actimmune、PEG-内含子、Tricomin、重组屋尘螨变应原脱敏注射剂、重组人类副甲状腺激素(PTH)1-84(皮下,骨质疏松症)、依泊汀δ、转基因抗凝血酶III、Granditropin、Vitrase、重组胰岛素、干扰素-α(口服含片)、GEM-21S、伐普肽、艾度硫酸酯酶、奥马曲拉、重组血清白蛋白、妥珠单抗、羧肽酶、人类重组C1酯酶抑制剂(血管性水肿)、拉诺替普酶、重组人类生长激素、恩夫韦肽(无针注射,Biojector 2000)、VGV-1、干扰素(α)、芦西纳坦、阿肽地尔(吸入的,肺病)、艾替班特、艾卡拉肽、奥米加南、Aurograb、醋酸培西加南、ADI-PEG-20、LDI-200、地加瑞克、贝辛白介素、Favld、MDX-1379、ISAtx-247、利拉鲁肽、特立帕肽(骨质疏松症)、替法可近、AA4500、T4N5脂质体乳液、卡妥索单抗、DWP413、ART-123、Chrysalin、去氨普酶、安地普酶、默沙东促排卯药、TH-9507、替度鲁肽、Diamyd、DWP-412、生长激素(缓释注射)、重组G-CSF、胰岛素(吸入式,AIR)、胰岛素(吸入式,Technosphere)、胰岛素(吸入式,AERx)、RGN-303、DiaPep277、干扰素β(丙肝病毒感染(HCV))、干扰素α-n3(口服)、贝拉西普、经皮胰岛素贴剂、AMG-531、MBP-8298、Xerecept、奥培巴坎、AIDSVAX、GV-1001、LymphoScan、豹蛙酶、Lipoxysan、芦舒普肽、MP52(β-磷酸钙载体、骨再生)、黑素瘤疫苗、sipuleucel-T、CTP-37、Insegia、维特斯朋、人类凝血酶(冷冻,手术出血)、凝血酶、TransMID、蛇毒纤溶酶、普瑞凯希、特利加压素(静脉内,肝肾综合征)、EUR-1008M、重组FGF-I(可注射,血管疾病)、BDM-E、罗替加肽、ETC-216、P-113、MBI-594AN、耐久霉素(吸入式,囊性纤维化)、SCV-07、OPI-45、内皮他丁、血管增生抑制素、ABT-510、Bowman Birk抑制剂浓缩物、XMP-629、99mTc-Hynic-膜联蛋白V、卡哈拉利得F、CTCE-9908、替维瑞克(延释)、ozarelix、罗咪酯肽、BAY-504798、白细胞介素4、PRX-321、肽扫描、iboctadekin、rhlactoferrin、TRU-015、IL-21、ATN-161、西仑吉肽、Albuferon、Biphasix、IRX-2、ω干扰素、PCK-3145、CAP-232、帕瑞肽、huN901-DMI、卵巢癌的免疫治疗疫苗、SB-249553、Oncovax-CL、OncoVax-P、BLP-25、CerVax-16、多抗原表位肽黑素瘤疫苗(MART-1、gp100、酪氨酸酶)、奈米非肽、rAAT(吸入式)、rAAT(皮肤)、CGRP(吸入式,哮喘)、培那西普、胸腺肽β4、plitidepsin、GTP-200、雷莫拉宁、GRASPA、OBI-1、AC-100、鲑降血钙素(口服,eligen)、降血钙素(口服,骨质疏松症)、艾沙瑞林、卡普瑞林、Cardeva、velafermin、131I-TM-601、KK-220、T-10、乌拉立肽、地来司他、hematide、Chrysalin(局部)、rNAPc2、重组因子V111(聚乙二醇化脂质体)、bFGF、聚乙二醇化重组葡萄球菌激酶变体、V-10153、SonoLysisProlyse、NeuroVax、CZEN-002、胰岛细胞再生疗法、rGLP-1、BIM-51077、LY-548806、艾塞那肽(控释,Medisorb)、AVE-0010、GA-GCB、阿伏瑞林、ACM-9604、醋酸利那洛肽、CETi-1、Hemospan、VAL(可注射)、快速起效胰岛素(可注射,Viadel)、鼻内胰岛素、胰岛素(吸入式)、胰岛素(口服,eligen)、重组甲硫氨酰人类瘦蛋白、匹曲白滞素(皮下注射,湿疹)、匹曲白滞素(吸入式干粉,哮喘)、Multikine、RG-1068、MM-093、NBI-6024、AT-001、PI-0824、Org-39141、Cpn10(自体免疫疾病/炎症)、塔乳铁蛋白(局部)、rEV-131(眼睛)、rEV-131(呼吸道疾病)、口服重组人类胰岛素(糖尿病)、RPI-78M、奥普瑞白介素(口服)、CYT-99007CTLA4-Ig、DTY-001、伐拉斯特、干扰素α-n3(局部)、IRX-3、RDP-58、Tauferon、胆盐刺激脂酶、Merispase、碱性磷酸酶、EP-2104R、美那诺坦-II、布雷默浪丹、ATL-104、重组人类微纤溶酶、AX-200、SEMAX、ACV-1、Xen-2174、CJC-1008、强啡肽A、SI-6603、LAB GHRH、AER-002、BGC-728、疟疾疫苗(病毒颗粒,PeviPRO)、ALTU-135、细小病毒B19疫苗、流感疫苗(重组神经氨糖酸苷酶)、疟疾/HBV疫苗、炭疽疫苗、Vacc-5q、Vacc-4x、HIV疫苗(口服)、HPV疫苗、Tat Toxoid、YSPSL、CHS-13340、PTH(1-34)脂质体乳膏(Novasome)、Ostabolin-C、PTH类似物(局部,银屑病)、MBRI-93.02、MTB72F疫苗(肺结核)、MVA-Ag85A疫苗(肺结核)、FARA04、BA-210、重组瘟疫FIV疫苗、AG-702、OxSODrol、rBetV1、Der-p1/Der-p2/Der-p7变应原靶向疫苗(尘螨过敏症)、PR1肽抗原(白血病)、突变ras疫苗、HPV-16E7脂肽疫苗、labyrinthin疫苗(腺癌)、CML疫苗、WT1-肽疫苗(癌症)、IDD-5、CDX-110、Pentrys、Norelin、CytoFab、P-9808、VT-111、艾罗卡肽、替柏明(皮肤,糖尿病足溃疡)、芦平曲韦、reticulose、rGRF、HA、α-半乳糖苷酶A、ACE-011、ALTU-140、CGX-1160、血管紧缩素治疗疫苗、D-4F、ETC-642、APP-018、rhMBL、SCV-07(口服,肺结核)、DRF-7295、ABT-828、ErbB2-特异性免疫毒素(抗癌症)、DT3SSIL-3、TST-10088、PRO-1762、Combotox、胆囊收缩素-B/促胃液素-受体结合肽、111In-hEGF、AE-37、曲妥单抗-DM1、拮抗剂G、IL-12(重组)、PM-02734、IMP-321、rhIGF-BP3、BLX-883、CUV-1647(局部)、L-19基放射性免疫治疗剂(癌症)、Re-188-P-2045、AMG-386、DC/1540/KLH疫苗(癌症)、VX-001、AVE-9633、AC-9301、NY-ESO-1疫苗(肽)、NA17.A2肽、黑素瘤疫苗(脉冲抗原治疗)、前列腺癌症疫苗、CBP-501、重组人类乳铁蛋白(干眼症)、FX-06、AP-214、WAP-8294A(可注射)、ACP-HIP、SUN-11031、肽YY[3-36](肥胖症,鼻内)、FGLL、阿塞西普、BR3-Fc、BN-003、BA-058、人类副甲状腺激素1-34(鼻,骨质疏松症)、F-18-CCR1、AT-1100(乳糜泻/糖尿病)、JPD-003、PTH(7-34)脂质体乳膏(Novasome)、耐久霉素(眼睛,干眼症)、CAB-2、CTCE-0214、糖基化聚二乙醇化红细胞生成素、EPO-Fc、CNTO-528、AMG-114、JR-013、因子XIII、氨基康定、PN-951、716155、SUN-E7001、TH-0318、BAY-73-7977、替维瑞克(立即释放)、EP-51216、hGH(控释,Biosphere)、OGP-I、西夫韦肽、TV4710、ALG-889、Org-41259、rhCC10、F-991、胸腺五肽(肺病)、r(m)CRP、肝选择性胰岛素、subalin、L19-IL-2融合蛋白、elafin、NMK-150、ALTU-139、EN-122004、rhTPO、促血小板生成素受体激动剂(血小板减少症)、AL-108、AL-208、神经生长因子拮抗剂(疼痛)、SLV-317、CGX-1007、INNO-105、口服特立帕肽(eligen)、GEM-OS1、AC-162352、PRX-302、LFn-p24融合物疫苗(Therapore)、EP-1043、S小儿肺炎疫苗、疟疾疫苗、脑膜炎奈瑟氏球菌B组疫苗、新生儿B组链球菌疫苗、炭疽疫苗、HCV疫苗(gpE1+gpE2+MF-59)、中耳炎疗法、HCV疫苗(核心抗原+ISCOMATRIX)、hPTH(1-34)(经皮,ViaDerm)、768974、SYN-101、PGN-0052、aviscumnine、BIM-23190、结核疫苗、多抗原表位酪氨酸酶肽、癌症疫苗、恩卡斯替母、APC-8024、GI-5005、ACC-001、TTS-CD3、靶向血管的TNF(实体瘤)、去氨加压素(颊控释)、奥那西普和TP-9201。
可能产生的肽的其他示例包含但不限于阿达木单抗(HUMIRA)、英夫利昔单抗(REMICADETM)、利妥昔单抗(RITUXANTM/MABTHERATM)、依那西普(ENBRELTM)、贝伐珠单抗(AVASTINTM)、曲妥单抗(HERCEPTINTM)、派革利革斯丁(NEULASTATM)或任何其他合适的多肽,包含生物仿制药和改良型生物仿制药。
其他合适的多肽是在下表6和US2016/0097074中列出的那些多肽。本领域技术人员可以理解,本发明的公开还将包含如本文所述的产物和/或缀合物的组合[(即,多蛋白,修饰的蛋白(与PEG、毒素、其他活性成分缀合))]。
表6
Figure BDA0003001247780000331
Figure BDA0003001247780000341
Figure BDA0003001247780000351
Figure BDA0003001247780000361
在实施例中,多肽可以是如表7中所示的激素、血液凝结/凝固因子、细胞因子/生长因子、抗体分子、融合蛋白、蛋白疫苗或肽。
表7
Figure BDA0003001247780000362
Figure BDA0003001247780000371
在实施例中,所述蛋白是多特异性蛋白,例如如表8所示的双特异性抗体。
表8
Figure BDA0003001247780000372
Figure BDA0003001247780000381
Figure BDA0003001247780000391
Figure BDA0003001247780000401
示例1
描述的是一个通过正交方法产生基因组的多维图谱,并且然后使用该图谱或多个图谱生成候选HI基因座的列表以用于靶向整合具有预测的高表达和稳定性的转基因的过程的示例。用于使用多维图谱获得候选基因座列表的过滤过程或算法总结在图1中并在下面描述。
首先,构建参考基因组组装体,随后在其上附加多层次遗传和表观遗传数据。
来源于中国仓鼠卵巢(CHO)细胞系CHO-K1SV 10E9的Hi-C数据(Zhang et al.,Biotechnol Prog.2015:31(6)1645-56)被用于告知从头组装最初由Illumina短阅读序列构建的CHO-K1SV(10E9的祖细胞系)测序支架。作为基于邻近的连接的结果,Hi-C数据的特征在于线性序列上彼此靠近的区域和/或同一染色体内的区域之间的接触密度增加。因此,Hi-C可以用于确定片段化的参考组装体内先前分离的序列支架之间的连接。来自三个生物学复制品的超过3.1亿个独特的、有效的Hi-C读数对的比对被用于通过已发表的LACHESIS算法(Burton,J.et al.Chromosome-scale scaffolding of de novo genome assembliesbased on chromatin interactions.Nat.Biotechnol.31,1119-1125(2013))对CHO-K1SV序列支架进行聚类、排序和定向。LACHESIS组装体包括1146个输入序列支架并且包含90.52%的原始CHO-K1SV序列。最终组装体将输入序列支架聚类为13个高置信度组,其中长度分布范围为12Mb至455Mb。
来自10E9细胞系的Hi-C数据与LACHESIS组装体比对,产生了类似于与更成熟的人和小鼠参考组装体相关的基因组范围的接触图(图2A),并且具有与源自人胚胎干细胞和小鼠胎肝细胞的等效Hi-C数据集一致的有效读数对的顺式/反式比率(图2B)。
来源于中国仓鼠卵巢SSI 10E9细胞系的配对端Hi-C序列数据和启动子捕获Hi-C(PCHi-C)序列数据的三个复制品(Zhang et al.,Biotechnol Prog.2015:31(6)1645-56),在默认参数下通过HiCUP版本0.5.9.dev单独处理(Wingett S,et al.,F1000Research2015,4:1310))。使用Bowtie版本1.1.0(Langmead B,et al.,Genome Biol.2009;10(3):R25)作为HiCUP管道的一部分,将唯一比对的有效读数对映射到目的序列上。
对根据Buenrostro et al.2013(Nat Methods 10,1213-1218)中描述的协议生成的并且来自中国仓鼠卵巢SSI 10E9细胞系的配对端ATAC-Seq序列数据的三个复制品进行了跨两条泳道的测序。在配对端模式下使用Bowtie2和2000个碱基对的最大片段长度映射到目的序列之前,修剪所有产生的FASTQ文件,以去除配对端模式下的测序衔接子序列(Langmead B,Salzberg S.Fast gapped-read alignment with Bowtie 2.NatureMethods.2012,9:357-359)。然后使用自定义Perl脚本合并对应于同一样品的后续BAM文件,并使用Samtools view函数从样品合并的BAM文件中删除映射质量得分小于20的比对(Li H.,Handsaker B.,Wysoker A.,Fennell T.,Ruan J.,Homer N.,Marth G.,AbecasisG.,Durbin R.and 1000Genome Project Data Processing Subgroup(2009)The Sequencealignment/map(SAM)format and SAMtools.Bioinformatics,25,2078-9)。
下载已发表的来源于悬浮适应的CHO-K1细胞系的组蛋白修饰ChIP-Seq序列数据集(Feichtinger J,et al.Biotechnol Bioeng.113(10):2241-53(2016)-Accession CodePRJEB9291),并修剪每个FASTQ文件,以去除单端模式下的测序衔接子序列。然后使用Bowtie2在单端模式和最大片段长度为1,000个碱基对的情况下,将修剪后的FASTQ文件映射到目的序列。使用自定义Perl脚本合并对应于同一组蛋白修饰的不同时间点的BAM文件,并再次使用Samtools view函数从样本合并的BAM文件中删除映射质量得分小于20的比对。
来自中国仓鼠卵巢SSI 10E9细胞系(Zhang L,et al.2015)的配对端总RNA-Seq数据的三个复制品的FASTQ文件被修剪,以去除配对端模式下的测序衔接子序列。然后使用HiSat2(Kim D,Langmead B and Salzberg SL.HISAT:a fast spliced aligner with lowmemory requirements.Nature Methods.2012,12:357-360)在默认参数下在配对模式下将修剪后的FASTQ文件映射到目的序列。移除映射质量得分低于40的比对,并且在Seqmonk内合并复制数据集。RNA-Seq定量(RPKM值)使用SeqMonk(Babraham Bioinformatics-SeqMonkMapped Sequence Analysis Tool by Simon Andrews)中的RNA-Seq定量管道进行,规定了文库是非链特异性的、配对端的,并且应只定量与标注的外显子重叠的读取。对于不同的转录物长度,将所得到的定量标准化,并进行对数转换。对数-RPKM值为负的基因座的下游分析值均为零。
Hi-C分析
使用自定义Perl脚本合并了来自三个复制品的过滤和映射的Hi-C BAM文件。在HOMER(Heinz S.,et al.,Mol Cell 2010May 28;38(4):576-589.PMID:20513432)标签Hi-C目录已创建之前,使用自定义Python脚本从合并的BAM文件创建了Hi-C摘要文件。
拓扑相关的结构域(TAD)是通过将上述Hi-C标签目录置于分辨率为5Kb、超分辨率为25Kb且最大相互作用距离界限为1Mb的‘findHiCDomains.pl’HOMER脚本中来鉴定的。算法中使用的TAD边界是输出文件中定义的结构域的碱基对末端。
通过将上述Hi-C标签目录置于分辨率为50Kb和超分辨率为100Kb的HOMER‘runHiCpca.pl’脚本下,进行主成分分析,以调节活性基因组区室的鉴定。前两个主成分是通过选择152个‘活性表达’的基因座(通过定量来自中国仓鼠卵巢10E9细胞系的稳态RNA-Seq数据确定)作为种子区鉴定的。当第一主成分代表不同染色体臂的分离时,使用来自第二主成分的数据。对于所有其他‘染色体’,使用来自第一主成分的数据。算法中使用的‘活性’结构域通过将上面讨论的主成分分析数据合并到HOMER‘findHiCCompartments.pl’脚本中来鉴定。
在该分析之后算法的数据输入包含在目的序列内鉴定的TAD边界位置和在目的序列内鉴定的活性区室的坐标。
ATAC-Seq分析
使用带有以下参数的MACS2‘callpeak’函数,在映射至目的序列的所有三个复制的ATAC-Seq过滤的、合并的BAM文件中鉴定可及染色质中的峰;-q 0.01--nolambda--nomodel--call-summits。使用GenomicRanges Bioconductor软件包(Lawrence M,HuberW,Pagès H,Aboyoun P,Carlson M,Gentleman R,Morgan M,Carey V(2013).″Softwarefor Computing and Annotating Genomic Ranges.″PLoS Computational Biology,9)定义的所有三个复制品中重叠峰的总和随后在算法中被使用。
PCHi-C分析
使用CHiCAGO版本1.1.3(Cairns J,et al.,Genome Biology.2016.17:127)在默认参数下从启动子捕获Hi-C数据集鉴定了显著的启动子相互作用。针对目的序列设计了启动子捕获RNA诱饵文库,并创建了含有HindIII限制性片段的引诱启动子列表。在运行CHiCAGO之前,使用自定义Perl脚本过滤比对的PCHi-C BAM文件,以去除与这些引诱启动子(含有HindIII限制性片段)之一不重叠的读数对。然后,使用默认参数在单独的复制、过滤的BAM文件上运行CHiCAGO。在三次重复中的至少两次中被归类为具有统计学意义的顺式相互作用被提取以供进一步使用。
ChromHMM分析
过滤的、合并的ATAC-Seq和公布的与目的序列一致的ChIP-Seq BAM文件被用于告知17状态ChromHMM模型的产生(Ernst and Kellis M.Nat Protoc.12:2478-2492(2017))。状态2和3被认为是潜在的活性增强子区域,而状态11、12、14、15和16被指定为具有潜在抑制特性的区域。
潜在活性增强子HindIII限制性片段的列表被定义为那些首先与标注的TSS的2Kb之外的至少一个ChromHMM状态2或3区域重叠的限制性片段。随后过滤这些候选限制性片段,以去除也与任何‘抑制性’ChromHMM状态区域(11、12、14、15和16)和/或含有在PCHi-C分析部分中列出的HindIII限制性片段的引诱启动子重叠的那些片段。
为了算法的目的,针对潜在活性增强子HindIII限制性片段的列表,过滤了在至少两个PCHi-C复制品中被归类为具有统计学意义的顺式PCHi-C相互作用的列表,以得到一组可再现的启动子:算法中使用的预测的具有统计学意义的增强子顺式相互作用。
在表1中描述了通过该版本的算法发现的所得的潜在HI基因座,其中包含的HI基因座包含位于特定鉴定的位点两侧+/-约5,000个碱基对的这些位点。表1中的位点已根据预测的性能进行了排序,该预测的性能是基于每个位点与最近的TAD边界的接近度、可再现的预测增强子顺式相互作用的数量以及‘相关’基因的稳态mRNA水平的排序的非加权相加总和。
与图3C中当前工业相关的FerIL4着陆垫相比,图3A中针对候选HI基因座SEQ IDNO.:3和图3B中针对候选HI基因座SEQ ID NO.:2提供了其中候选HI基因座位于3D基因组图谱内的示例。特别值得注意的是相对于1)TAD边界的空间位置,2)由ATAC-Seq确定的开放染色质中的映射峰,3)映射到该区域的启动子捕获Hi-C相互作用,以及4)映射的表观遗传标记。
示例2
为了证明使用图1中概述并在示例1中描述的程序鉴定HI基因座的方法的能力,选择排序靠前的候选基因座中的五个和排序靠后的基因座中的五个进行经验评估。这是通过测量在所鉴定的基因座处针对基因组整合的报告基因盒的表达来实现的。与两个对照一起评估靶基因座;中国仓鼠卵巢SSI 10E9细胞系(Zhang et al.,Biotechnol Prog.2015:31(6)1645-56)的异染色质区和5′侧翼序列,Fer1l4着陆垫。异染色质对照区代表可及染色质中的峰,其与参与任何可再现的显著PCHi-C相互作用的HindIII限制性片段不重叠。该峰还位于‘非转录’Fbxl2基因(Ref Seq ID NW_003613997.1,Genbank ID JH000418.1)上游约14kb处,位于非活性基因组区室中,并与组成型异染色质组蛋白标记H3K9me3填充的区域重叠。纳入这些对照为评估候选基因座提供了直接参考点。
为了测试候选基因座,构建了自定义设计的GFP供体模板质粒,其由组成型CMV启动子控制下的eGFP表达盒组成,两侧是自定义设计的‘伪gRNA’识别位点(图4A)。使用自定义设计的伪gRNA序列介导体内切除后转染的前提由已发表的通用基因标记技术(Lackneret al.,2015;Nat Commun.6:10237)获得。除了报告基因之外,供体质粒还含有伪gRNA序列和基因座特异性gRNA序列(以将CMV-eGFP盒靶向至目的基因座),均在U6启动子的控制下,且均包含在Ran et al.,2013(Ran et al.,2013;Nat Protoc.8(11):2281-2308)中规定的gRNA支架序列。此外,基因座特异性gRNA盒主链由gRNA支架序列上游的两个BbsI限制性位点组成,允许使用Ran et al.,2013(Ran et al.,2013)中再次概述的克隆策略掺入基因座特异性crRNA序列。在所有实验中,伪gRNA保持不变,而位点特异性gRNA变化,以允许CMV-eGFP盒的位点特异性靶向。
在共转染供体和Cas9质粒后,Cas9核酸酶通过将伪gRNA结合到CMV-eGFP盒侧翼的识别位点上,将CMV-eGFP盒从供体质粒中切割出来。然后,在Cas9切割靶基因组DNA后,应通过细胞内源NHEJ(非同源末端连接)机制结合位点特异性gRNA将盒整合到靶基因组位点。
对于每一个候选基因座,使用考虑介导靶外基因组切割倾向的内部CRISPR gRNA设计工具鉴定crRNA靶序列。选择了排序前三位的crRNA靶序列,每个序列对相关候选基因座的不同区域具有特异性。然后将这些序列分别克隆到U6启动子下游和BbsI位点处的gRNA支架序列上游的供体质粒中,为靶基因座产生最终表达的gRNA,如在Ranet al.2013中所概述的。对于每个靶基因座,构建了三个独立的供体质粒,其含有单独的crRNA序列。通过混合等摩尔比的三个构建的供体质粒,为每个候选基因座创建无菌5μg供体质粒文库。然后将这些文库与5μg的无菌Cas9-Puro质粒(Dharmacon U-005100-120)一起转染到中国仓鼠卵巢SSI 10E9细胞中,转染时得到总计10μg的质粒DNA。
传代培养第2天或第3天的中国仓鼠卵巢SSI 10E9细胞使用Bio-Rad Gene PulserXcell电穿孔系统通过电穿孔用供体和Cas9质粒转染,其中细胞与DNA转染比率为0.7mLCD-CHO培养基中的1x107个活细胞与100μL TE缓冲液中的10μg质粒DNA。然后将三份转染试管混合到30mL的预热的CD-CHO培养基中并静置以回收。将培养物放置总共13天,以在分析前恢复。在此期间,在第4天更换培养基,并在第7天和第10天以1×106个活细胞/mL的细胞密度传代培养培养物。
分析当天,使用Guava easyCyte 12HT台式流式细胞仪通过流式细胞术分析了来自每个细胞池的20,000个细胞的重复注射的每个细胞的GFP产量。在(图4B)中,可以观察到每个转染池中靶向特定基因组基因座的GFP+细胞的平均百分比。对于通过供体质粒的随机、与同源性无关的基因组整合实现的GFP表达和/或来自池生长后残留的瞬时质粒的表达,将缺乏任何位点特异性gRNA的供体质粒作为阴性对照(‘质粒对照’)被包含。在(图4C)中,示出了每个池的GFP+细胞的中位GFP信号。从该基因座样本中可以观察到,有可能鉴定出与FerlL4位点表达性能大致相当的HI基因座,该位点以前已通过大规模的、随机的、经验性筛选被鉴定为高性能基因组位点((Zhang et al.,Biotechnol Prog.2015:31(6)1645-56))。
为了证明CMV-eGFP盒的靶上整合发生在上述分析的池中,在制造商的指导下使用GeneJET基因组DNA纯化试剂盒提取了来自每个细胞池的基因组DNA。使用GFP特异性引物和对每个候选整合基因座的上游和下游序列特异的引物,通过PCR测定GFP表达盒的靶向整合。除了基因座Seq ID:4之外,确认了所有候选基因座的靶向整合(图4D)。使用本研究中的引物组合,未观察到来自Ferl14基因座的有义扩增子。
在不脱离本发明的精神和范围的情况下,本领域普通技术人员可以实施本发明的这些和其他修改和变化,本发明的精神和范围在所附权利要求中更具体地阐述。此外,应当理解,各种实施例的方面可以全部或部分互换。此外,本领域普通技术人员将理解,前面的描述仅仅是示例性的,并且不旨在限制在所附权利要求中进一步描述的本发明。

Claims (62)

1.一种哺乳动物细胞,包括在第一高整合(HI)基因座处染色体整合的第一重组靶位点(RTS),所述第一HI基因座位于可及染色质的活性基因组区室内和拓扑相关结构域(TAD)边界的约30,000个碱基对内,所述第一HI基因座与所述细胞基因组中的与至少一个增强子元件相互作用的区域重叠。
2.根据权利要求1所述的细胞,其中所述第一HI基因座包括SEQ ID NO:1-125中的一个,或者在SEQ ID NO.:1-125中的任何一个的5′端或3′端的约5,000个碱基对内或与之重叠。
3.根据权利要求1所述的细胞,其中所述第一HI基因座与所述活性基因组区室中的转录起始位点(TSS)重叠。
4.根据权利要求3所述的细胞,其中所述TSS与活性基因可操作地连接,所述活性基因的表达或缺乏表达对于所述哺乳动物细胞是不重要的。
5.根据权利要求1所述的细胞,其中所述第一HI基因座不与基因座重叠。
6.根据权利要求1所述的细胞,其中所述第一HI基因座不与基因座的原位内源启动子重叠。
7.根据权利要求6所述的细胞,其中所述第一HI基因座不在所述启动子的约1,000个碱基对之内。
8.根据权利要求1所述的细胞,包括第二不同RTS。
9.根据权利要求8所述的细胞,其中所述第一不同RTS和所述第二不同RTS被染色体整合在所述第一HI基因座内。
10.根据权利要求8所述的细胞,其中所述第二不同RTS被染色体整合在第二HI基因座内。
11.根据权利要求8所述的细胞,其中所述第二不同RTS被染色体整合在单独的基因座。
12.根据权利要求11所述的细胞,其中所述单独的基因座是Fer1L4基因座。
13.根据权利要求1所述的细胞,包括多个附加的不同RTS。
14.根据权利要求1至13中任一项所述的细胞,其中所述RTS中的至少一个是frt位点、lox位点、rox位点或att位点。
15.根据权利要求1至14中任一项所述的细胞,其中所述RTS中的至少一个包括选自SEQID NO.:126-155的序列。
16.根据权利要求1至15中任一项所述的细胞,其中所述哺乳动物细胞是小鼠细胞、人细胞、中国仓鼠卵巢(CHO)细胞、CHO-K1细胞、CHO-DXB11细胞、CHO-DG44细胞、CHOK1SVTM或其变体、CHO谷氨酰胺合成酶敲除细胞或其变体、HEK细胞、HEK293细胞或其贴壁或悬浮适应变体、HeLa细胞或HT1080细胞。
17.根据权利要求1至16中任一项所述的细胞,进一步包括第一目的基因,其中所述第一目的基因是染色体整合的。
18.根据权利要求17所述的细胞,其中所述第一目的基因包括报告基因、选择基因、治疗目的基因、辅助基因或其组合。
19.根据权利要求18所述的细胞,其中所述治疗目的基因包括编码难以表达的蛋白的基因。
20.根据权利要求19所述的细胞,其中所述难以表达的蛋白选自由Fc-融合蛋白、酶、膜受体或单克隆抗体组成的组。
21.根据权利要求17至20中任一项所述的细胞,其中所述第一目的基因位于两个所述RTS之间。
22.根据权利要求17至21中任一项所述的细胞,其中所述第一目的基因位于所述第一HI基因座内。
23.根据权利要求1至22中任一项所述的细胞,进一步包括第二目的基因,其中所述第二目的基因是染色体整合的。
24.根据权利要求23所述的细胞,其中所述第二目的基因位于所述第一HI基因座内。
25.根据权利要求23所述的细胞,其中所述第一目的基因位于所述第一HI基因座内,并且所述第二目的基因位于第二HI基因座内或单独的基因座内。
26.根据权利要求23至25中任一项所述的细胞,进一步包括第三目的基因,其中所述第三目的基因是染色体整合的。
27.根据权利要求26所述的细胞,其中所述第三目的基因位于所述第一HI基因座内或位于所述第二HI基因座内或者位于或位于所述单独的基因座内。
28.根据权利要求27所述的细胞,其中
a.所述第一目的基因、所述第二目的基因和所述第三目的基因中的至少一个位于所述第一HI基因座内,并且
b.所述第一目的基因、所述第二目的基因和所述第三目的基因中的至少一个位于所述第二HI基因座内。
29.根据权利要求1至28中任一项所述的细胞,进一步包括位点特异性重组酶基因。
30.根据权利要求29所述的细胞,其中所述位点特异性重组酶基因是染色体整合的。
31.一种用于生产重组细胞的方法,包括:
a.映射细胞基因组的可及染色质中的峰;
b.在映射的峰中鉴定所述可及染色质的活性基因组区室中以及拓扑相关结构域(TAD)边界的约30,000个碱基对中的第一组峰;
c.在所述第一组峰内定义第一高整合(HI)基因座,所述第一HI基因座与所述基因组中的与至少一个增强子元件相互作用的区域重叠;和
d.在所述第一HI基因座内插入第一重组靶位点(RTS)。
32.根据权利要求31所述的方法,其中所述第一HI基因座包括SEQ ID NO.:1-125中的一个,或者在SEQ ID NO.:1-125中的任一个的5′端或3′端的约5,000个碱基对之内或与之重叠。
33.根据权利要求31所述的方法,进一步包括在所述细胞中插入编码位点特异性重组酶的基因。
34.根据权利要求31所述的方法,进一步包括在所述第一组峰中鉴定与基因的任何转录起始位点(TSS)重叠的那些峰(所述基因的表达产物或其缺乏不重要),并且定义与所述基因重叠并且位于所述TSS下游的第二组峰,其中所述第一HI基因座在所述第二组峰中定义。
35.根据权利要求31所述的方法,进一步包括在所述第一组峰中鉴定不与任何基因重叠的第三组峰,其中所述第一HI基因座在所述第三组峰中定义。
36.根据权利要求31所述的方法,进一步包括用包括编码第一目的基因的可交换盒的第一载体转染所述细胞,并将所述第一可交换盒整合在所述第一HI基因座内。
37.根据权利要求36所述的方法,进一步包括选择包括整合到所述染色体中的所述第一可交换盒的重组蛋白生产细胞。
38.根据权利要求36所述的方法,其中所述第一目的基因包括报告基因、选择基因、治疗目的基因、辅助基因或其组合。
39.根据权利要求38所述的方法,其中所述治疗目的基因包括编码难以表达的蛋白的基因。
40.根据权利要求39所述的方法,其中所述难以表达的蛋白由Fc-融合蛋白、酶、膜受体或单克隆抗体组成。
41.根据权利要求31所述的方法,进一步包括在所述第一组峰内鉴定第二HI基因座。
42.根据权利要求31至41中任一项所述的方法,进一步包括在所述细胞内插入一个或多个附加RTS。
43.根据权利要求42所述的方法,其中所述第一目的基因位于两个所述RTS之间。
44.根据权利要求31至43中任一项所述的方法,进一步包括用包括编码第二目的基因的可交换盒的第二载体转染所述细胞,并将所述第二可交换盒整合在所述细胞内。
45.根据权利要求44所述的方法,其中所述第二可交换盒被整合在所述第一HI基因座内。
46.根据权利要求44所述的方法,其中所述第二可交换盒被整合在所述第二HI基因座内。
47.一种用于生产重组细胞的方法,包括:
a.映射细胞基因组的可及染色质中的峰;
b.在映射的峰中鉴定所述可及染色质的活性基因组区室中以及拓扑相关结构域(TAD)边界的约30,000个碱基对中的第一组峰;
c.在所述可及染色质内鉴定所述基因组的与至少一个增强子元件相互作用的区域;
d.在所述第一组峰内定义多个高整合(HI)基因座,所述多个中的每个HI基因座与所鉴定的区域重叠;
e.将重组靶位点(RTS)整合到多个细胞中;和
f.从所述多个细胞中选择包括整合在HI基因座的所述RTS的细胞。
48.根据权利要求47所述的方法,其中所述HI基因座包括SEQ ID NO.:1-125中的一个,或者在SEQ ID NO.:1-125中的任一个的5′端或3′端的约5,000个碱基对之内或与之重叠。
49.根据权利要求47所述的方法,进一步包括在所选的细胞中插入编码位点特异性重组酶的基因。
50.根据权利要求47所述的方法,进一步包括在所述第一组峰中鉴定与活性基因的转录起始位点(TSS)重叠的那些峰(所述活性基因的表达或其缺乏具有不重要功能),并且定义与所述活性基因重叠并且在所述活性基因的所述TSS下游的第二组峰,其中所述HI基因座在所述第二组峰中定义。
51.根据权利要求47所述的方法,进一步包括在所述第一组峰中鉴定不与任何基因重叠的第三组峰,其中所述HI基因座在所述第三组峰中定义。
52.根据权利要求47所述的方法,进一步包括用包括编码目的基因的可交换盒的载体转染多个所选的细胞,并将所述可交换盒整合在所述HI基因座内。
53.根据权利要求52所述的方法,进一步包括选择包括整合到所述染色体中的所述可交换盒的重组蛋白生产细胞。
54.根据权利要求52所述的方法,其中所述目的基因包括报告基因、选择基因、治疗目的基因、辅助基因或其组合。
55.根据权利要求54所述的方法,其中所述治疗目的基因包括编码难以表达的蛋白的基因。
56.根据权利要求55所述的方法,其中所述难以表达的蛋白由Fc-融合蛋白、酶、膜受体或单克隆抗体组成。
57.根据权利要求56所述的方法,其中所述单克隆抗体是双特异性单克隆抗体或三特异性单克隆抗体。
58.根据权利要求47至57中任一项所述的方法,进一步包括在所述细胞内插入一个或多个附加RTS。
59.根据权利要求58所述的方法,其中所述目的基因位于两个所述RTS之间。
60.根据权利要求47所述的方法,其中,根据随机集成协议将所述RTS整合到所述多个细胞中。
61.根据权利要求47至60中任一项所述的方法,进一步包括对所述HI基因座进行排序。
62.根据权利要求61所述的方法,其中根据与每个基因座相关的一个或多个基因的表达水平、从每个基因座到最近的TAD边界的距离、每个基因座处预测的增强子相互作用的数量、以及与每个基因座相关的一个或多个基因的mRNA表达水平中的一种或多种对所述HI基因座进行排序。
CN201980064770.3A 2018-10-01 2019-10-01 具有可预测和稳定的转基因表达的ssi细胞及形成方法 Pending CN113227388A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862739546P 2018-10-01 2018-10-01
US62/739,546 2018-10-01
PCT/US2019/054045 WO2020072480A1 (en) 2018-10-01 2019-10-01 Ssi cells with predictable and stable transgene expression and methods of formation

Publications (1)

Publication Number Publication Date
CN113227388A true CN113227388A (zh) 2021-08-06

Family

ID=68290359

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980064770.3A Pending CN113227388A (zh) 2018-10-01 2019-10-01 具有可预测和稳定的转基因表达的ssi细胞及形成方法

Country Status (6)

Country Link
US (1) US20220049275A1 (zh)
EP (1) EP3844288A1 (zh)
JP (1) JP7549582B2 (zh)
CN (1) CN113227388A (zh)
SG (1) SG11202103111TA (zh)
WO (1) WO2020072480A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365920B (zh) * 2020-09-30 2024-04-02 中国农业科学院蜜蜂研究所 一种鉴定蜜蜂分化关键基因的方法及鉴定得到的基因和应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998041645A1 (en) * 1997-03-14 1998-09-24 Idec Pharmaceuticals Corporation Method for integrating genes at specific sites in mammalian cells via homologous recombination and vectors for accomplishing the same
EP2189529A1 (en) * 2007-08-10 2010-05-26 Toto Ltd. Recombinant mammalian cells, method of producing recombinant mammalian cells and method of producing target protein
CN103154256A (zh) * 2010-05-27 2013-06-12 海因里希·佩特研究所莱比锡试验病毒学研究所-民法基金会 用于使多种逆转录病毒毒株中的不对称靶位点重组的修整重组酶
WO2013190032A1 (en) * 2012-06-22 2013-12-27 Lonza Biologics Plc Site-specific integration
CN104884467A (zh) * 2012-12-18 2015-09-02 诺华股份有限公司 在遗传修饰的哺乳动物细胞中生产治疗性蛋白质
WO2018150269A1 (en) * 2017-02-17 2018-08-23 Lonza Ltd. Multi-site specific integration cells for difficult to express proteins

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1258959B (it) 1992-06-09 1996-03-11 Impianto a moduli mobili per lo sviluppo e la produzione di prodotti biotecnologici su scala pilota
JP2003531616A (ja) * 2000-04-28 2003-10-28 サンガモ バイオサイエンシーズ, インコーポレイテッド 細胞性クロマチンに外因性分子を結合させるための方法
CA2554941A1 (en) 2004-02-03 2005-08-18 Xcellerex, Llc System and method for manufacturing
WO2005118771A2 (en) 2004-06-04 2005-12-15 Xcellerex, Inc. Disposable bioreactor systems and methods
CA2632520A1 (en) 2005-12-05 2007-06-14 Ernest G. Hope Prevalidated, modular good manufacturing practice-compliant facility
PT2137655E (pt) 2007-04-16 2012-09-14 Momenta Pharmaceuticals Inc Produtos de glicoproteína definidos e métodos relacionados
US8771635B2 (en) 2010-04-26 2014-07-08 Toyota Motor Engineering & Manufacturing North America, Inc. Hydrogen release from complex metal hydrides by solvation in ionic liquids
US10371394B2 (en) 2010-09-20 2019-08-06 Biologics Modular Llc Mobile, modular cleanroom facility
US9388373B2 (en) 2011-03-08 2016-07-12 University Of Maryland Baltimore County Microscale bioprocessing system and method for protein manufacturing
EP4321628A3 (en) 2013-05-23 2024-04-24 The Board of Trustees of the Leland Stanford Junior University Transposition into native chromatin for personal epigenomics
GB2517936B (en) 2013-09-05 2016-10-19 Babraham Inst Chromosome conformation capture method including selection and enrichment steps
US20170130247A1 (en) * 2015-09-30 2017-05-11 Whitehead Institute For Biomedical Research Compositions and methods for altering gene expression
CN110691792A (zh) * 2017-01-10 2020-01-14 朱诺治疗学股份有限公司 细胞疗法的表观遗传学分析及相关方法
US11781116B2 (en) * 2017-02-17 2023-10-10 Lonza Ltd. Mammalian cells for producing adeno-associated viruses

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998041645A1 (en) * 1997-03-14 1998-09-24 Idec Pharmaceuticals Corporation Method for integrating genes at specific sites in mammalian cells via homologous recombination and vectors for accomplishing the same
EP2189529A1 (en) * 2007-08-10 2010-05-26 Toto Ltd. Recombinant mammalian cells, method of producing recombinant mammalian cells and method of producing target protein
CN103154256A (zh) * 2010-05-27 2013-06-12 海因里希·佩特研究所莱比锡试验病毒学研究所-民法基金会 用于使多种逆转录病毒毒株中的不对称靶位点重组的修整重组酶
WO2013190032A1 (en) * 2012-06-22 2013-12-27 Lonza Biologics Plc Site-specific integration
CN104884467A (zh) * 2012-12-18 2015-09-02 诺华股份有限公司 在遗传修饰的哺乳动物细胞中生产治疗性蛋白质
WO2018150269A1 (en) * 2017-02-17 2018-08-23 Lonza Ltd. Multi-site specific integration cells for difficult to express proteins

Also Published As

Publication number Publication date
JP2022513319A (ja) 2022-02-07
WO2020072480A1 (en) 2020-04-09
SG11202103111TA (en) 2021-04-29
EP3844288A1 (en) 2021-07-07
US20220049275A1 (en) 2022-02-17
JP7549582B2 (ja) 2024-09-11

Similar Documents

Publication Publication Date Title
JP7467119B2 (ja) 発現困難タンパク質のための多部位ssi細胞
US11760998B2 (en) High-throughput precision genome editing
EP4008336A1 (en) A recombinant nucleic acid molecule of transcriptional circular rna and its application in protein expression
CN1468304B (zh) 蛋白质功能域的制备方法
JP2023081927A (ja) アデノ随伴ウイルスを生産するための哺乳動物細胞
CN111971388B (zh) 细胞选择和修饰细胞代谢的方法
WO2017136520A1 (en) Mitochondrial genome editing and regulation
ES2921137T3 (es) Producción de proteínas regulada por fuente de carbono en una célula huésped recombinante
US11884928B2 (en) Methods for genetic engineering Kluyveromyces host cells
WO2023115732A1 (en) Single-pot methods for producing circular rnas
US20240307558A1 (en) Gene therapy DNA vector based on gene therapy DNA vector VTvaf17 carrying the therapeutic gene selected from the group of KRT5, KRT14, LAMB3, and COL7A1 genes for increasing the expression level of these therapeutic genes, method of its production and use, Escherichia coli strain SCS110-AF/VTvaf17-KRT5, or Escherichia coli strain SCS110-AF/VTvaf17-KRT14, or Escherichia coli strain SCS110-AF/VTvaf17-LAMB3, or Escherichia coli strain SCS110-AF/VTvaf17-COL7A1 carrying the gene therapy DNA vector, m
JP2009538144A (ja) 真核細胞株を用いたタンパク質産生
WO2021197342A1 (en) Active dna transposon systems and methods for use thereof
JP7549582B2 (ja) 予測可能かつ安定な導入遺伝子発現を有するssi細胞および形成の方法
EP1098987B1 (en) Method for transformation of animal cells
TWI853878B (zh) 重組宿主細胞中的碳源調控蛋白質製造
US20240084084A1 (en) Promoter for yeast
WO2024092217A1 (en) Systems and methods for gene insertions
CN118638859A (zh) 活性dna转座子系统及其使用方法
CN114026239A (zh) Mut-甲醇营养型酵母
CN118581155A (zh) 一种基于CRISPR/Cas12a的多靶点编辑糖基化酶基因的方法
WO2020139156A1 (en) Gene therapy dna vector and its application
Dröge Mammalian Expression Systems
TW201035312A (en) Gene amplification method for enhancing gene expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40053255

Country of ref document: HK