CN117660352A

CN117660352A - Nfat5基因定点整合宿主细胞

Info

Publication number: CN117660352A
Application number: CN202311141326.1A
Authority: CN
Inventors: 周松涛; 岳丽云
Original assignee: Jiangsu Hengrui Medicine Co Ltd; Shanghai Hengrui Pharmaceutical Co Ltd
Current assignee: Jiangsu Hengrui Medicine Co Ltd; Shanghai Hengrui Pharmaceutical Co Ltd
Priority date: 2022-09-06
Filing date: 2023-09-06
Publication date: 2024-03-08

Abstract

本披露涉及Nfat5基因定点整合宿主细胞。具体而言，本披露涉及外源核苷酸基因定点整合的细胞系，制备方法及其用途。该细胞系通过在Nfat5基因插入识别标签或外源基因而获得。

Description

Nfat5基因定点整合宿主细胞

技术领域

本披露涉及外源核苷酸基因定点整合的细胞系，制备方法及其用途；更具体地，涉及一种通过在Nfat5基因插入识别标签或外源基因而获得的宿主细胞。

背景技术

传统构建外源蛋白表达细胞系的方法是将外源基因随机插入到细胞基因组中。由于插入位点的随机性、插入基因拷贝数的随机性，使得稳转细胞表现出不同的生长特性、表达特性，且在长期传代的过程中存在拷贝数丢失等的风险。在构建外源蛋白高表达细胞系时需要对候选细胞系表达产物的表达量检测，对不同质量参数检测，并对细胞进行长期稳定性传代最终筛选出可长期稳定高表达且产物质量参数合格的生产用细胞株。基于随机整合方法获得的重组细胞展现出了巨大的单克隆差异性，因此需要花费很长的时间及人力物力成本，用于挑选出最终可以应用于生产的单克隆细胞。

中国仓鼠卵巢细胞(Chinese Hamster Ovary cell,CHO)，作为生物制药细胞系开发领域中最重要的生产细胞系，已经被广泛应用于治疗性蛋白质的表达中，包括重组抗体、重组单体蛋白及重组融合蛋白等。

定点整合技术，可以将外源基因精确整合到CHO基因组内的稳定高表达位点，极大降低了所获得重组细胞的单克隆多样性，简化了单克隆筛选流程，从而降低了生物制药开发的时间与人力物力成本。为了能实现外源基因的定点整合，最重要的是找到CHO细胞系基因组内可以稳定高表达外源基因的位点。

目前已有一些制药企业公开了CHO细胞基因组内可用于表达外源基因的位点，如辉瑞公司(WO2013190032)报道的一处位于Fer1L4基因31到32号外显子中间内含子上的整合位点。本披露公开了一处新的位于CHO基因组内可用于稳定高表达外源基因的位点。

发明内容

本披露提供了一种包含整合在特定位点处的外源核苷酸序列的宿主细胞，其中所述的特定位点为Nfat5基因。

在一些实施方案中，如前所述的宿主细胞，其中所述的特定位点为Nfat5基因的内含子；优选地，所述的特定位点为Nfat5基因的第1内含子(NW_003614572.1(269232--293783))。

在一些实施方案中，如前任一项所述的宿主细胞，其中所述的特定位点包含如序列SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列，或与SEQ ID NO:2、SEQ IDNO:3或SEQ ID NO:4具有至少90％序列同一性的核苷酸序列。

在一些实施方案中，如前所述的宿主细胞，其中所述的特定位点为如序列SEQ IDNO:2所示的核苷酸序列。

在一些实施方案中，如前所述的宿主细胞，其中所述的特定位点为如序列SEQ IDNO:3所示的核苷酸序列。

在一些实施方案中，如前所述的宿主细胞，其中所述外源核苷酸序列包括至少2个重组识别序列，位于编码目标序列的基因的侧翼。

在一些实施方案中，如前所述的宿主细胞，其中所述重组识别序列包含了可被酪氨酸重组酶识别的位点如FRT位点或lox位点；或可被丝氨酸重组酶识别的序列如att位点。

在一些实施方案中，如前所述的宿主细胞，其中所述重组识别序列是FRT位点或lox位点。

在一些实施方案中，如前所述的宿主细胞，所述重组识别序列选自以下各项组成的群组：loxP位点、lox511位点、lox2272位点、lox2372位点、lox5171位点、loxm2位点、lox71位点、lox66位点、loxFas位点、attp位点、attB位点、野生型FRT位点、FRT3位点和FRT5位点。

在一些实施方案中，如前所述的宿主细胞，所述重组识别序列为loxP和lox2272位点。

在一些实施方案中，如前所述的宿主细胞，其中所述的外源核苷酸序列包含一个或多个编码筛选标记物、可检测的蛋白、抗体或其抗原可结合片段、肽抗原、酶、激素、生长因子、受体、融合蛋白或其它生物活性蛋白的基因。

在一些实施方案中，如前所述的宿主细胞，其中所述的外源核苷酸序列包含一个或多个选自编码筛选标记物，可检测的蛋白，和抗体或其抗原可结合片段的基因。

在一些实施方案中，如前所述的宿主细胞，其中所述筛选标记物基因是抗性基因，所述的可检测的蛋白是荧光标记蛋白。

在一些实施方案中，如前所述的宿主细胞，其中所述筛选标记物选自GS选择标记物、DHFR选择标记物、遗传霉素选择标记物、新霉素选择标记物、嘌呤霉素选择标记物或胸苷激酶选择标记物；

最优选的，其中所述筛选标记物是新霉素选择标记物，所述的可检测的蛋白是绿荧光标记蛋白。

在一些实施方案中，如前所述宿主细胞，其中所述的外源核苷酸序列包含一个或多个抗体或其抗原可结合片段。

在一些实施方案中，如前所述的宿主细胞是小鼠细胞、人类细胞、CHO细胞株、CHOK1细胞株、CHO-S细胞株、CHO-DXB11或CHO-DG44细胞株，优选CHO细胞株。

在一些实施方案中，如前所述宿主细胞，其中所述外源核苷酸序列的包含3′端同源臂和5′端同源臂；所述的3′端同源臂与Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3的核苷酸序列中所存在的序列同源，所述的5′端同源臂与Nfat5基因第1内含子、SEQ IDNO:2或SEQ ID NO:3的核苷酸序列中所存在的序列同源。

在一些实施方案中，如前所述宿主细胞，其中所述的3′端同源臂与SEQ ID NO:32的核苷酸序列中所存在的序列同源，所述的5′端同源臂与SEQ ID NO:31的核苷酸序列中所存在的序列同源。

在一些实施方案中，如前所述宿主细胞，其中所述的3′端同源臂与SEQ ID NO:34的核苷酸序列中所存在的序列同源，所述的5′端同源臂与SEQ ID NO:33的核苷酸序列中所存在的序列同源。

在一些实施方案中，如前所述宿主细胞，其中所述外源核苷酸序列选自：

a).所述外源核苷酸序列包括2个同源臂，所述的同源臂为与SEQ ID NO:32的核苷酸序列中所存在的序列同源的3′端同源臂，和与SEQ ID NO:31的核苷酸序列中所存在的序列同源的5′端同源臂，

两个重组识别序列loxP和lox 2272位点，

启动子，筛选标记物基因和/或抗性基因；或

b).所述外源核苷酸序列包括2个同源臂，所述的同源臂为与SEQ ID No:34的核苷酸序列中所存在的序列同源的3′端同源臂，和与SEQ ID NO:33的核苷酸序列中所存在的序列同源所述的5′端同源臂，

两个重组识别序列loxP和lox 2272位点，

启动子，抗体或其抗原可结合片段的基因。

在一些实施方案中，如前所述宿主细胞，其中所述的外源核苷酸序列选自：

c).

-loxP-EF1αPromoter-ZsGreen1-bGHpolyA-SV40-NeoR-lox2272-；和

d).

-loxp-CMV-LC-bGHpolyA-CMV-HC-lox2272-。

在一些实施方案中，如前所述宿主细胞，其中所述外源核苷酸序列选自如下所示的c)、d)和e)：

c).

-loxP-EF1αPromoter-ZsGreen1-bGHpolyA-SV40-NeoR-lox2272-；和

d).

-loxp-CMV-LC-bGHpolyA-CMV-HC-lox2272-；

优选地，其中的LC为如SEQ ID NO:40的编码抗体轻链的核苷酸序列，HC为如SEQID NO:41的编码抗体重链的核苷酸序列；或者其中的LC为如SEQ ID NO:62的编码抗体轻链的核苷酸序列，HC为如

SEQ ID NO:63的编码抗体重链的核苷酸序列；

e)-loxp-CMV-LC1-bGHpolyA-CMV-HC1-bGHpolyA-CMV-LC2-bGHpolyA-CMV-HC2-lox2272-

优选地，其中的LC1为如SEQ ID NO:64的编码抗体轻链的核苷酸序列，HC1为如SEQID NO:65的编码抗体重链的核苷酸序列，LC2为如SEQ ID NO:66的编码抗体轻链的核苷酸序列，HC2为如SEQ ID NO:67的编码抗体重链的核苷酸序列。

本披露进一步提供一种表达目标产物的宿主细胞的构建方法，所述方法包含将外源核苷酸引入到细胞内的内源Nfat5基因；优选地，包含将外源核苷酸引入到细胞内的内源Nfat5基因的内含子中；更优选地，包含将外源核苷酸引入到细胞内的内源Nfat5基因的第1内含子中。

在一些实施方案中，如前所述的构建方法，其中所述的外源核苷酸序列包含一个或多个选自编码筛选标记物、可检测的蛋白、抗体或其抗原可结合片段、肽抗原、酶、激素、生长因子、受体、融合蛋白或其它生物活性蛋白的基因。

在一些实施方案中，如前所述的构建方法，其中所述的外源核苷酸序列包含一个或多个编码筛选标记物，可检测的蛋白，和抗体或其抗原可结合片段的基因。

在一些实施方案中，如前所述的构建方法，包括：

步骤1、将外源核苷酸序列筛选标记物基因和可检测的蛋白基因引入到细胞内的内源Nfat5基因中；

步骤2、将外源核苷酸序列抗体或其抗原可结合片段的基因用基因重组替换的方法，替换筛选标记物基因和可检测的蛋白基因，引入到细胞内的内源Nfat5基因中。

在一些实施方案中，如前所述的构建方法，包括：

步骤1、将外源核苷酸序列抗性基因和可检测的蛋白基因引入到细胞内的内源Nfat5基因的内含子中；

步骤2、将外源核苷酸序列抗体或其抗原可结合片段的基因用基因重组替换的方法，替换筛选标记物基因和可检测的蛋白基因，引入到细胞内的内源Nfat5基因的内含子中。

在一些实施方案中，如前所述的构建方法，包括：

步骤1、将外源核苷酸序列抗性基因和可检测的蛋白基因引入到细胞内的内源Nfat5基因的内第1含子中；

步骤2、将外源核苷酸序列抗体或其抗原可结合片段的基因用基因重组替换的方法，替换筛选标记物基因和可检测的蛋白基因，引入到细胞内的内源Nfat5基因的第1内含子中。

在一些实施方案中，如前所述的构建方法，包括：

步骤1、将外源核苷酸序列抗性基因和可检测的蛋白基因引入到细胞内的内源Nfat5基因的第1内含子中；

步骤2、将外源核苷酸序列抗体或其抗原可结合片段的基因用基因重组替换的方法，替换抗性基因和可检测的蛋白基因，引入到细胞内的内源Nfat5基因的第1内含子中。

在一些实施方案中，如前所述的构建方法，包括：

步骤1、将外源核苷酸序列抗性基因和可检测的荧光标记蛋白基因引入到细胞内的内源Nfat5基因中；

步骤2、将外源核苷酸序列抗体或其抗原可结合片段的基因用基因重组替换的方法，替换抗性基因和荧光标记蛋白基因，引入到细胞内的内源Nfat5基因中。

在一些实施方案中，如前所述的构建方法，包括：

步骤1、将外源核苷酸序列抗性基因和可检测的荧光标记蛋白基因引入到细胞内的内源Nfat5基因的内含子中；

步骤2、将外源核苷酸序列抗体或其抗原可结合片段的基因用基因重组替换的方法，替换抗性基因和荧光标记蛋白基因，引入到细胞内的内源Nfat5基因的内含子中。

在一些实施方案中，如前所述的构建方法，包括：

步骤1、将外源核苷酸序列抗性基因和可检测的荧光标记蛋白基因引入到细胞内的内源Nfat5基因的第1内含子中；

步骤2、将外源核苷酸序列抗体或其抗原可结合片段的基因用基因重组替换的方法，替换抗性基因和荧光标记蛋白基因，引入到细胞内的内源Nfat5基因的第1内含子中。

在一些实施方案中，如前所述的构建方法，包括：

步骤1、构建SgRNA质粒、Cas 9质粒和供体质粒导入所述CHO细胞；

步骤2、构建包含目标蛋白基因的表达盒质粒；

步骤3、通过盒式交换将表达盒质粒中的目标蛋白基因替换供体质粒基因，得到表达目标蛋白的细胞株；

其中所述的SgRNA质粒包含选自Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3上的识别位点序列SEQ ID NO:5，优选SEQ ID NO:9；

其中所述的供体质粒包括位于Nfat5基因第1内含子的3′同源臂和5′同源臂；两个重组识别位点，启动子，终止子，抗性基因和绿色荧光基因；

其中所述的表达盒质粒包括两个重组识别位点，启动子，终止子，和目标蛋白，优选抗体。

在一些实施方案中，如前所述的构建方法，其中所述的目标蛋白为抗体；优选单克隆抗体或双特异性抗体。

在一些实施方案中，如前所述的构建方法，其中所述的目标蛋白选自以下核苷酸编码的抗体：由核苷酸序列SEQ ID NO:40编码的抗体轻链，和核苷酸序列SEQ ID NO:41编码的抗体重链得到的单克隆抗体；

或由核苷酸序列SEQ ID NO:62编码的抗体轻链，和核苷酸序列SEQ ID NO:63编码的抗体重链得到的单克隆抗体；

或由核苷酸序列SEQ ID NO:64编码一个抗体轻链，核苷酸序列SEQ ID NO:65编码一个抗体重链，核苷酸序列SEQ ID NO:66编码另一抗体轻链，核苷酸序列SEQ ID NO:67编码另一抗体重链，获得的双特异性抗体。

在一些实施方案中，如前所述的构建方法，其中所述的3′端同源臂与Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3的核苷酸序列中所存在的序列同源，所述的5′端同源臂与Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3的核苷酸序列中所存在的序列同源；

优选地，所述的3′端同源臂与SEQ ID NO:32的核苷酸序列中所存在的序列同源，所述的5′端同源臂与SEQ ID NO:31的核苷酸序列中所存在的序列同源；

更优选地，所述的3′端同源臂与SEQ ID NO:34的核苷酸序列中所存在的序列同源，所述的5′端同源臂与SEQ ID NO:33的核苷酸序列中所存在的序列同源；

最优选地，所述3′同源臂为Cas 9断裂位点SEQ ID NO:9右侧的序列，所述5′同源臂为Cas 9断裂识别位点SEQ ID NO:9左侧的序列。

在一些实施方案中，如前所述的构建方法，5′端同源臂为SEQ ID NO:35，3′端同源臂为SEQ ID NO:36。

本披露提供的基因插入位点，具有表达量高，传代稳定的优点。并且因为位于内含子，也不影响细胞的正常表达。

附图说明

图1：荧光定点细胞株构建示意图。

图2：盒式交换构建蛋白定点整合细胞株的原理示意图。

图3：荧光标记细胞株接头PCR与全长PCR扩增片段示意图。

图4A：荧光标记细胞株5-92及F-9接头PCR扩增结果电泳图。

图4B：荧光标记细胞株5-92及F-9全长PCR扩增结果电泳图。

图5：两株荧光标记细胞株5-92及F-9靶点插入序列二代测序结果。

图6：抗体定点整合细胞株接头PCR与全长PCR扩增片段示意图。

图7A：细胞株5-mAbA-8和F-mAbA-6的5′接头PCR结果电泳图。

图7B：细胞株5-mAbA-8和F-mAbA-6的3′接头PCR结果电泳图。

图7C：细胞株5-mAbA-8和F-mAbA-6的全长PCR结果电泳图。

图7D：细胞株5-mAbB-9和5-BsAb-1的5′接头PCR结果电泳图。

图7E：细胞株5-mAbB-9和5-BsAb-1的3′接头PCR结果电泳图。

图7F：细胞株5-mAbB-9和5-BsAb-1的全长PCR结果电泳图。

图8：细胞株5-mAbA-8、F-mAbA-6、5-mAbB-9和5-BsAb-1的抗体轻重链基因二代测序结果。

具体实施方式

术语

本文所用的术语只是为了描述实施方案的目的，并非旨在进行限制。除非另外定义，本文所用的全部技术术语和科学术语具有与本披露所属领域的普通技术人员通常所理解的相同意义。

除非上下文另外清楚要求，否则在整个说明书和权利要求书中，应将词语“包含”、“具有”、“包括”等理解为具有包含意义，而不是排他性或穷举性意义；也即，“包括但不仅限于”的意义。除非另有说明，“包含”包括了“由……组成”。

本披露所用氨基酸三字母代码和单字母代码如J.biol.chem，243，p3558(1968)中所述。

本披露提供的重组蛋白在真核细胞中的稳定整合和/或表达。具体来说，本披露包括通过采用表达增强核苷酸序列改善蛋白在真核细胞中的表达的方法和组合物。本披露包括有助于重组介导的盒交换(RMCE)的聚核苷酸和经修饰的细胞。本披露的方法将外源性核酸整合在中国仓鼠细胞基因组的Nfat5基因座以有助于经修饰的细胞增强并且稳定表达重组蛋白。

DNA区当在功能上彼此相关时是可操作地连接的。举例来说，如果启动子能够参与编码序列的转录，那么所述启动子被可操作地连接到所述序列；如果核糖体结合位点经定位以便允许翻译，那么所述核糖体结合位点被可操作地连接到编码序列。一般来说，可操作地连接可以包括但并不要求邻接。就如分泌性前导序列的序列来说，邻接并且适当放置在阅读框中是典型的特征。

所述的“外源核苷酸序列”是指作为自然界中所发现的基因座内，不存在的任何DNA序列或基因在所关注的基因座上。举例来说，CHO基因座内“外源核苷酸序列”可以是自然界中特定CHO基因座内未发现的仓鼠基因(即，仓鼠基因来自仓鼠基因组的另一基因座)、来自任何其它物种的基因(例如人类基因)、嵌合基因(例如人类/小鼠)或自然界中未发现的任何其它基因存在于所关注CHO基因座内。

本披露至少部分地基于基因组中独特序列(即基因座)的发现，所述序列与基因组中的其它区或序列相比展现更高效的重组、插入稳定性和较高水平表达。本披露还至少部分地基于以下发现：当这类表达增强序列被鉴别时，可以在所述序列中或附近外源添加合适的基因或构建体并且外源添加的基因可以被有利地表达或用于另外的基因组修饰。这类被称为表达增强序列的序列被视为稳定的并且不位于基因组的编码区内。这些表达增强和稳定区可以经工程改造以用于未来的克隆或基因组编辑事件。因此，可靠的表达系统被构建到细胞的基因组主链中。

本披露还基于外源性基因特异性靶向整合位点。本披露的方法允许细胞基因组高效“转换”到适用的克隆盒中，例如通过采用重组酶介导的盒交换(RMCE)。为此目的，本披露的方法采用细胞基因组重组酶识别位点安置所关注基因，以便产生用于重组蛋白生产的高产细胞系。

本披露的组合物也可以被包括在表达构建体中，例如在用于克隆和工程改造新细胞系的表达载体中。包含本披露的聚核苷酸的表达载体可以用于瞬时表达蛋白，或可以通过随机或靶向重组，如同源重组或由识别特定重组位点的重组酶所介导的重组(例如Cre-lox介导的重组)整合到基因组中。包含本披露的聚核苷酸的表达载体还可以用于评定其它DNA序列，例如顺式作用调控序列的功效。

当描述所关注基因座或其片段时，一致性百分比意味着包括沿着邻接的同源区展示出所列举一致性的同源序列，但在相比较的序列中不具有同源性的间隙、缺失或插入的存在不纳入一致性百分比的计算中。

在本发明的上下文中，Nfat5基因是野生型Nfat5基因，其所有的异型体和其所有的同系物，具体而言，只要同系物与野生型Fer1L4基因具有至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.5％序列同源性即可，优选地，与野生型Nfat5基因的全长相比，优选具有NCBI登录号NW_003614572.1

(269178..352822)中的非编码区中，优选为野生型CHO Nfat5基因或其截短的形式，特别是fat5基因的第1内含子NW_003614572.1(269232..293783)内。

如本文所用，在例如Nfat5基因的第1内含子或其片段与物种同源物之间的“一致性百分比”测定将不包括在比对中物种同源物无同源序列比较(即，Nfat5基因的第1内含子或其片段在那一点处具有插入，或物种同系物具有间隙或缺失，视具体情况而定)的序列比较。因此，“一致性百分比”不包括间隙、缺失和插入的罚分。

在核酸序列的情形下，“同源序列”是指基本上与参考核酸序列同源的序列。在一些实施例中，如果两个序列的至少50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的相应核苷酸在相关的残基序列段上是一致的，那么这两个序列被认为是基本上同源的。在一些实施例中，相关序列段是完全序列。

“整合在特定位点处”是指用于引导基因或核酸序列插入或整合到基因组的特定位置，即，引导DNA到相连聚核苷酸链中两个核苷酸之间的特定位点的基因靶向方法。也可以对特定基因盒进行靶向插入，所述基因盒包括多个基因、调控元件和/或核酸序列。“插入”和“整合”可互换使用。应理解，基因或核酸序列(例如包含表达盒的核酸序列)的插入可能导致(或可能经工程改造以使得)一个或多个核酸的替代或缺失，这取决于所采用的基因编辑技术。

整合位点通常是通过随机整合或分析逆转录病毒整合事件来加以鉴别。本文中详细描述的CHO整合位点是通过随机整合编码多链抗体的DNA并且发现所表达蛋白展现增强的表达来加以鉴别。

稳定性分析

本披露中对细胞每3-4天进行传代，每次进行传代操作时，检测细胞密度，并稀释到5E5/mL。直到60代后，完成传代过程。整个传代过程为9周。对传代好的细胞再次进行Fed-batch培养，若细胞产率在W9较W0变化范围超过30％，则认为是不稳定的。

“识别位点”、“整合位点”或“识别序列”是由核酸酶或其它酶识别以结合并且引导DNA主链的位点特异性裂解的特定DNA序列。核酸内切酶在DNA分子内裂解DNA。识别位点在所属领域中也被称为识别目标位点。

“重组酶识别位点”是由重组酶，如Cre重组酶(Cre)或翻转酶(flp)识别的特定DNA序列。位点特异性重组酶在其一个或多个目标识别序列被战略性置于生物体基因组中时，可以进行DNA重排，包括缺失、倒位和易位。在一个实例中，Cre在其DNA目标识别位点loxP处特异性介导重组事件，所述识别位点是由通过8-bp间隔子分隔开的两个13-bp反向重复序列构成。可以采用不止一个重组酶识别位点，例如以有助于重组介导的DNA交换。也可以采用重组酶识别位点(例如lox位点)的变异体或突变体(Araki,N.等人,2002,Nucleic AcidsResearch,30:19,e103)。

Cre-lox系统

Cre重组酶基因编码区序列全长1029bp(EMBL数据库登录号X03453)，编码38kDa蛋白质。Cre重组酶是一种由343个氨基酸组成的单体蛋白。属于λInt酶超基因家族，它不仅具有催化活性，而且与限制酶相似，能识别特异的DNA序列，即lox位点，使lox位点间的基因序列被删除或重组。

loxP(locus of X-over P1)序列来源于P1噬菌体，是有两个13bp反向重复序列和中间间隔的8bp序列共同组成，8bp的间隔序列同时也确定了loxP的方向。Cre酶在催化DNA链交换过程中与DNA共价结合，13bp的反向重复序列是Cre酶的结合域。

如本文所用，术语“loxP元件”指可以被Cre重组蛋白识别的两个同向重复位点。

如本文所用，术语“Cre酶”指介导2个loxP位点之间特异性重组的蛋白酶，它可以导致loxP位点之间的核苷酸序列被删除或重组。

“重组酶介导的盒交换”(Recombinase Mediated Cassette Exchange，RMCE)涉及一种用供体盒精确替换基因组目标盒的方法。通常为了进行此方法所提供的分子组合物包括1)5'和3'侧接对特定重组酶具有特异性的识别目标位点的基因组目标盒，2)侧接匹配的识别目标位点的供体盒和3)位点特异性重组酶。重组酶蛋白在所属领域中是众所周知的(Turan,S.和Bode J.,2011,FASEB J.,25,第4088-4107页)并且能够精确裂解特定识别目标位点内的DNA(DNA的序列)而不增加或丢失核苷酸。常见重组酶/位点组合包括(但不限于)Cre/lox和Flp/frt。

如本文所用，“外源基因”指作用是阶段性作用的外源DNA分子。可用于本申请的外源基因没有特别限制，包括转基因动物领域常用的各种外源基因。代表性例子包括(但并不限于)：溶菌酶基因、鲑鱼降钙素基因、或血清白蛋白基因。

如本文所用，“筛选标记物基因”指转基因过程中用来筛选转基因细胞或转基因动物的基因，可用于本申请的筛选标记基因没有特别限制，包括转基因领域常用的各种筛选标记基因，代表性例子包括(但并不限于)：新霉素抗性基因(NeoR)或嘌呤霉素抗性基因。

如本文所用，术语“表达盒”是指含有待表达基因以及表达所需元件的序列组件的一段多聚核苷酸序列。例如，在本披露中，术语“筛选标记表达盒”指含有编码筛选标记的序列以及表达所需元件的序列组件的多聚核苷酸序列。表达所需的组件包括启动子和聚腺苷酸化信号序列。此外，筛选标记表达盒还可以含有或不含有其他序列，包括(但并不限于)：增强子、分泌信号肽序列等。

在本披露中，适用于外源基因表达盒和筛选标记基因表达盒的启动子可以是任何一种常见的启动子，它可以是组成型启动子或诱导型启动子。优选地，该启动子是组成型的强启动子，例如牛β-乳球蛋白启动子等其它适用于真核表达的启动子。

“质粒”是由携载外源性核酸的任何聚核苷酸或聚核苷酸集合组成的用于引入到细胞中的组合物。可通过众所周知的转染方法递送到细胞。在一个实例中，引入到细胞中的质粒可以是瞬时的并且未整合到基因组中。同时，所述质粒可以携载进行整合过程所必需的外源性核酸。

本申请的供体质粒包含外源核苷酸序列，以及任何其它所需元件，例如启动子、增强子、标记、操纵子、核糖体结合位点等。

提供用于将核酸序列稳定整合到真核细胞中的组合物和方法，其中所述核酸序列能够借助于整合在Nfat5基因的第1内含子或其表达增强片段中来增强表达。

CHO整合位点的物理和功能表征，包括用接头PCR和全长PCR验证外源核苷酸序列是否插入，用微滴式数字PCR验证定点整合外源核苷酸序列的基因拷贝数，用OCTET QK分子相互作用仪确定培养基中抗体的表达量。

在某些实施例中，SEQ ID NO:2的片段选自由以下各项组成的群组：跨越SEQ IDNO:2的编号10-4,000、100-3,900、200-3,800、300-3,700、400-3,600、500-3,500、600-3,400、700-3,300、800-3,200、900-3,100、1,000-3,000、1,100-2,900、1,200-2,800、1,300-2,700、1,200-2,600、1,300-2,500、1,400-2,400、1,500-2,300、1,600-2,200、1,700-2100、1,800-2050、1850-2050、1,900-2040、1950-2,025、1990-2021、2002-2021和2,010-2,015的位置的核苷酸。

在另一个实施例中，SEQ ID NO:2的片段选自由以下各项组成的群组：跨越SEQ IDNO:2的编号10-500、500-1,000、500-2,100、1,000-1,500、1,000-2,100、1,500-2,000、1,500-2,500、2,000-2,500、2,500-3,000、2,500-3,500、3,000-3,500、3,000-4,000和3,500-4,000的位置的核苷酸。在某些实施例中，外源性核酸序列整合在上文所述片段内的特定位点处或所述特定位点附近。

在另一个实施例中，外源性核酸序列定位于如上所述的SEQ ID NO:2或其片段内，或在与SEQ ID NO:2的表达增强序列或其表达增强片段至少约90％一致、至少约91％一致、至少约92％一致、至少约93％一致、至少约94％一致、至少约95％一致、至少约96％一致、至少约97％一致、至少约98％一致或至少约99％一致的序列内。

可以使用本文所提供的方法产生表达增强水平的所关注蛋白的细胞群。表达的绝对水平将随特定蛋白而变化，取决于细胞如何有效地加工蛋白。通过外源性序列整合在本披露的表达增强序列内所产生的细胞池随时间推移而稳定，并且可以作为稳定细胞系加以处理以用于大部分目的。还可以延迟重组步骤直到稍后在本披露细胞系的发展过程中。

CHO表达增强基因座和其片段

本披露涵盖一种表达增强片段，其核苷酸序列与Nfat5基因第1内含子或SEQ IDNO:2的核苷酸序列至少约90％一致、至少约91％一致、至少约92％一致、至少约93％一致、至少约94％一致、至少约95％一致、至少约96％一致、至少约97％一致、至少约98％一致或至少约99％一致。本披露包括包含以下片段的载体，所述片段是为了瞬时或稳定转染而包括，跨越SEQ ID NO:2的编号10-4,000、100-3,900、200-3,800、300-3,700、400-3,600、500-3,500、600-3,400、700-3,300、800-3,200、900-3,100、1,000-3,000、1,100-2,900、1,200-2,800、1,300-2,700、1,200-2,600、1,300-2,500、1,400-2,400、1,500-2,300、1,600-2,200、1,700-2100、1,800-2050、1850-2050、1,900-2040、1950-2,025、1990-2021、2002-2021和2,010-2,015的位置。本披露还包括一种包含这类片段的真核细胞，其中所述片段对于所述细胞来说是外源性的并且被整合到所述细胞基因组中，并且包含这类片段的细胞具有至少一个重组酶识别位点，所述重组酶识别位点是在所述片段内、5'紧靠或3'紧靠所述片段。

在一个实施例中，SEQ ID NO:2的表达增强片段的位置位于SEQ ID NO:2内跨越SEQ ID NO:2的编号10-500、500-1,000、500-2,100、1,000-1,500、1,000-2,100、1,500-2,000、1,500-2,500、2,000-2,500、2,500-3,000、2,500-3,500、3,000-3,500、3,000-4,000或3,500-4,000的位置。

在支持稳定整合和/或所整合聚核苷酸的增强转录的情况下，基因座插入(即整合)位点相对于示例位点的精确位置不是必需的。实际上，整合位点可以如本文所述在Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3的片段内或相邻的任何位置。在所关注基因座内或相邻的特定染色体位置是否支持稳定整合和所整合外源性基因的高效转录可以根据所属领域中众所周知的标准程序或本文中例示的方法来确定。

本文中所考虑的整合位点位于包含Nfat5基因第1内含子、SEQ ID NO:2或SEQ IDNO:3的核苷酸序列的基因座内，或极为接近所关注基因座，例如相对于染色体DNA上SEQ IDNO:2的位置上游(5')或下游(3')小于约1kb、500个碱基对(bp)、250bp、100bp、50bp、25bp、10bp或小于约5bp。在又一些其它实施例中，所采用的整合位点相对于染色体DNA上Nfat5基因的第1内含子、SEQ ID NO:2或SEQ ID NO:3的位置位于上游(5')或下游(3')约1000、2500、5000或更多个碱基对处。

在所属领域中应理解，为了高效复制和转录染色体DNA，采用大基因组区，如支架/基质附着区。支架/基质附着区(S/MAR)，也称为支架附着区(SAR)或基质相关或基质附着区(MAR)，是核基质附着的真核基因组DNA区。在不受任何一个理论束缚的情况下，S/MAR通常定位到非编码区，使给定转录区(例如染色质结构域)与其相邻者分开，并且还提供用于机器加工和/或结合实现转录的因子(如DNA酶或聚合酶的识别位点)的平台。一些S/MAR已表征为约14-20kb长(Klar等人,2005,Gene 364:79-89)。因而，预期基因整合在LOCUS1处(Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3内或附近)赋予增强的表达。

所属领域的技术人员应认识到，数种元件可以被优化以便在目标基因座处具有高转录活性，从而使得所插入的编码所关注蛋白的基因高度表达。有待考虑的元件包括驱动转录的强启动子、足够的转录机器和具有开放并且可接近的构型的DNA。在所属领域人员的技能内可以通过靶向在Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3内所选的整合位点而优化在目标基因座处的插入。

基因工程改造特定位置(即目标基因座)中的细胞基因组的方法可以用数种方式达成。使用遗传编辑技术将核酸序列稳定整合到真核细胞中，其中所述核酸序列是通常并未在这类细胞中所发现的外源性序列。克隆扩增是为了确保细胞子代将享有经工程改造的细胞系的一致基因型和表现型特征所必需的。在一些实例中，天然细胞是通过同源重组技术来修饰以便将外源性核酸序列整合在Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3内。在其它实例中，提供在Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3内含有至少一个重组酶识别序列的细胞，以便于整合外源性核酸序列或所关注基因。

在一些实例中，提供含有第一重组酶识别序列和第二重组酶识别序列的细胞，其中所述第一和第二重组酶识别序列各选自包含以下各项的群组：loxP、lox511、lox5171、lox2272、lox2372、loxm2、lox-FAS、lox71、lox66和其突变体。在这种情况下，如果需要重组酶介导的盒交换(RMCE)，那么位点特异性重组酶是Cre重组酶或其衍生物。在其它实例中，第一和第二重组酶识别序列各选自包含FRT、F3、F5、FRT突变体-10、FRT突变体+10和其突变体的群组，并且在这种情境下，如果需要RMCE，那么位点特异性重组酶是Flp重组酶或其衍生物。在又一个实例中，所述第一和第二重组酶识别序列各选自包含attB、attP和其突变体的群组，并且在这种情况下，如果需要RMCE，那么位点特异性重组酶是phiC31整合酶或其衍生物。

在一个方面，用于将核酸序列稳定整合在Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3或其表达增强片段内的方法和组合物是经由同源重组获得的。所关注核酸分子，即基因或聚核苷酸，可以通过同源重组或通过使用特异性靶向整合位点处的序列的位点特异性核酸酶方法插入到所靶向的基因座(即Nfat5基因的第1内含子)中。关于同源重组，同源聚核苷酸分子(即同源臂)对其重组并且交换它们的一段序列。如果转基因侧接同源基因组序列，那么可以在此交换期间引入转基因。在一个实例中，可以在整合位点处将重组酶识别位点引入到宿主细胞基因组中。

可以通过在染色体DNA中的整合位点处引入断裂来促进真核细胞中的同源重组。模型系统已证明，如果在染色体目标序列中引入双链断裂，那么在基因靶向期间同源重组的频率会增加。这可以通过将某些核酸酶靶向特定整合位点而实现。在目标基因座识别DNA序列的DNA结合蛋白是所属领域中已知的。基因靶向载体也用于促进同源重组。在用于同源指导修复(homology directed repair)的基因靶向载体不存在的情况下，细胞常常会通过非同源末端接合(NHEJ)(其可能在裂解位点处导致多个核苷酸的缺失或插入)来闭合双链断裂。应存在插入或缺失(InDel)，因而在断裂位点处随机插入或缺失少量核苷酸并且这些InDel可以移位或破坏目标基因座内基因的任何开放阅读框(ORF)。应理解，鉴别为Nfat5基因第1内含子(或SEQ ID NO:4)的基因座不是基因编码区。因此，设想在此基因座的插入和/或缺失不破坏内源性基因转录。

同源指导修复(或同源指导重组)(HDR)特别适用于在目标基因座插入或整合基因。供体构建体包含如本文所述的来源于Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3的同源臂。

基因靶向载体构建和核酸酶选择在本披露所属领域的技术人员的技能内。常见的基因靶向载体构建方法(基因编辑方法)包括但不限于锌指核酸酶(Zinc FingerNuclease,ZFN)，转录激活子样效应因子核酸酶((Transcription Activation LikeEffector Nuclease，TALEN)，以及规律性间隔的短回文序列重复簇(CRISPR)。RNA指导的核酸内切酶(RGEN)是从细菌适应性免疫机制开发的可编程的基因组工程改造工具。在此系统(成簇规律间隔短回文重复序列(CRISPR)/CRISPR相关性(Cas)免疫反应)中，蛋白Cas9当与两个RNA(其中一个指导靶选择)复合时形成序列特异性核酸内切酶。RGEN由组分(Cas9和tracrRNA)以及靶特异性CRISPR RNA(crRNA)组成。DNA靶裂解的效率以及裂解位点的位置均基于前间区序列邻近基序(PAM)的位置而变化，所述基序是针对靶识别的额外要求(Chen,H.等人,J.Biol.Chem.2014年3月14作为手稿M113.539726在线发表)。

用于鉴别Nfat5基因的第1内含子的特异性靶向基因座特有的序列的策略是所属领域中已知的。

在一些实施例中，用于引入到基因组中的质粒，即包含编码所关注基因的序列或识别序列或基因盒的外源性核酸，视具体情况而定包含携载所述外源性核酸的载体和一个或多个额外载体或mRNA。在某些实施例中，所述一个或多个载体或mRNA包含具有指导RNA、tracrRNA和编码Cas酶的核苷酸序列的载体，以及包含供体(外源性)核苷酸序列的载体。这类载体序列包含编码所关注基因的核苷酸序列，或识别序列，或包含打算用于靶向插入的这些外源性元件中的任一个的基因盒。在使用mRNA的情况下，mRNA可以借助于所属领域的技术人员已知的常见转染方法转染到细胞中并且可以编码酶，例如转座酶或核酸内切酶。虽然引入到细胞中的mRNA可以是瞬时的并且未整合到基因组中，但是所述mRNA可以携载对于进行整合来说所必需或有益的外源性核酸。

另外其它同源重组方法可供技术人员使用，如具有精确DNA结合特异性的BuD衍生的核酸酶(BuDN)(Stella,S.等人Acta Cryst.2014,D70,2042-2052)。精确的基因组修饰方法是基于与Nfat5基因第1内含子内的独特目标序列相容的可用工具来选择，以避免细胞表型被破坏。

本披露提供用于修饰CHO细胞基因组的方法，其包含将一个或多个质粒引入到所述细胞中，例如将供体质粒，识别质粒，酶切质粒转入CHO细胞。

其中供体质粒包含编码如本文所述的任何治疗上或工业上适用的蛋白基因。供体质粒的定点整合需鉴别目标基因座内的目标序列，因此可同时转入包含识别序列的质粒，如本披露中的SgRNA质粒。酶切质粒用于切割特异性识别的位点，如本披露中的Cas9质粒。

供体质粒根据所采用的同源重组方法，可根据现有技术选择与Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3同源的同源臂序列。在一些实施例中，供体质粒包含具有与SEQ ID NO:2的核苷酸同源的序列(与SEQ ID NO:31的核苷酸对应)的5'同源臂(5′arm)和具有与SEQ ID NO:2的核苷酸同源的序列(与SEQ ID NO:32的核苷酸对应)的3'同源臂(3′arm)。5'到3'的同源臂可以扩增基因座内包含至少约1kb、或至少约2kb、或至少约3kb、或至少约4kb、或至少约5kb、或至少约10kb的区或靶向序列。在其它实施例中，选择用于第一和第二同源臂的靶向序列的核苷酸总数包含至少约1kb、或至少约2kb、或至少约3kb、或至少约4kb、或至少约5kb、或至少约10kb。在一些情况下，5'同源臂与3'同源臂(与靶向序列同源)之间的距离包含至少5bp、10bp、20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、或至少约1kb、或至少约2kb、或至少约3kb、或至少约4kb、或至少5kb、或至少约10kb。在选择SEQ ID NO:31和SEQ ID NO:32作为5'和3'同源臂的情况下，两个同源臂之间的距离可以是20个核苷酸(与SEQ ID NO:5的核苷酸对应)；并且这类同源臂可以介导外源性核酸序列整合在包含Nfat5基因的第1内含子的基因座内，例如NW_003614572.1(272410..272418)(SEQ ID NO:4)位点序列4内，或者(SEQ ID NO:4)的缺失。

在其它实施例中，供体质粒的同源臂包含替换基因座内的内源性序列的靶向序列。或者在其它实施例中，供体质粒的同源臂包含整合或插入在基因座内的内源性序列内的靶向序列。

用修饰CHO细胞基因组的方法可以得到定点插入荧光标记的细胞株，该细胞株可以作为方便并且稳定的表达系统而用于重组酶介导的盒交换(RMCE)。编码所关注蛋白的核酸序列可以方便地整合到包含Nfat5基因第1内含子或其表达增强片段、具有至少一个重组酶识别位点的经修饰的细胞中，例如经由RMCE方法。

重组表达载体可包含编码蛋白的合成的或cDNA衍生的DNA片段，其可操作地连接到来源于哺乳动物、病毒或昆虫基因的合适的转录和/或翻译调控元件。这类调控元件包括转录启动子、增强子、编码合适的mRNA核糖体结合位点的序列以及控制转录和翻译终止的序列，如下文详细描述。哺乳动物表达载体还可包含非转录元件，如复制起点、其它5'或3'侧翼非转录序列，以及5'或3'非翻译序列，如剪接供体和受体位点。还可并入帮助识别转染子的可选标记基因。

荧光标记是适用于识别已经或尚未成功地插入和/或替换的基因盒的可选标记基因，视具体情况而定。荧光标记的实例是所属领域中众所周知的，包括(但不限于)Discosoma珊瑚(DsRed)、绿色荧光蛋白(Zsgreen1)、增强型绿色荧光蛋白(eGFP)、蓝绿色荧光蛋白(CFP)、增强型蓝绿色荧光蛋白(eCFP)、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)和远红外荧光蛋白(例如mKate、mKate2、mPlum、mRaspberry或E2-crimson。还参见例如Nagai,T.等人,2002Nature Biotechnology 20:87-90；Heim,R.等人1995年2月23日Nature373:663-664；和Strack,R.L.等人2009Biochemistry 48:8279-81。

启动子为：CMV(人类巨细胞病毒来源的强哺乳动物表达启动子)、EF-1a(人延长因子1α来源的强哺乳动物表达启动子)、SV40(猿猴空泡病毒40来源的哺乳动物表达启动子)、PGK1(磷酸甘油酸酯激酶基因来源的哺乳动物启动子)、UBC(人类泛素C基因来源的哺乳动物启动子)、human beta actin(β-肌动蛋白基因来源的哺乳动物启动子)、CAG(强杂交哺乳动物启动子)等中的一种。

适用于转染脊椎动物细胞的表达载体中的转录和翻译控制序列可由病毒提供。举例来说，常用的启动子和增强子来源于病毒，如多瘤病毒、腺病毒2、猿猴病毒40(SV40)和人类巨细胞病毒(CMV)。病毒基因组启动子、控制和/或信号序列可用于驱动表达，所提供的这类控制序列与所选择的宿主细胞相容。还可以使用非病毒细胞启动子(例如β-球蛋白和EF-1α启动子)，取决于表达重组蛋白的细胞类型。

来源于SV40病毒基因组的DNA序列，例如SV40起点、早期和晚期启动子、增强子、剪接和聚腺苷酸化位点可用于提供对异源DNA序列的表达有用的其它基因元件。早期和晚期启动子是特别有用的，因为二者可容易地从SV40病毒作为还包含SV40病毒复制起点的片段得到(Fiers等人,Nature 273:113,1978)。也可使用较小或较大的SV40片段。通常，包括从位于SV40复制起点中的Hind III位点向BglI位点延伸的大约250bp序列。

在本披露的上下文中，术语“选择标记物基因”是指一种核苷酸序列，尤其是编码序列的基因，即编码蛋白的核苷酸序列，在下文中也称为区域，其在至少一个调控元件的调节和功能性控制之下，尤其是启动子，其中所述编码蛋白的区域编码使得能选择表达所述蛋白的宿主细胞的蛋白。

在本披露的上下文中，GS选择标记物(由GS标记物基因编码)运行于GS标记物系统中。因此，在生长培养基中缺少谷氨酰胺时，谷氨酰胺合成酶(GS)活性对于培养物中的哺乳动物细胞的存活而言是必需的。一些哺乳动物细胞系如小鼠骨髓瘤细胞系，其在不添加谷氨酰胺时，不能够表达足够的GS用以生存。在这些细胞系中，转染的GS标记物基因可作为选择标记物起作用，允许在不含谷氨酰胺的培养基的中生长。其它的细胞系如中国仓鼠卵巢细胞系，其表达足够的GS用以生存而无需外源谷氨酰胺。在此类情况下，可以使用GS抑制剂甲硫氨酸亚砜亚胺(MSX)以抑制内源GS活性，使得仅具有额外的GS活性的转染体才可以生存。

用于表达多个转录物的双顺反子表达载体先前已有描述(Kim S.K.和Wold B.J.,Cell 42:129,1985)并且可以与本披露的表达增强序列(例如Nfat5基因的第1内含子)或其片段组合使用。其它类型的表达载体也将是有用的，例如描述于美国专利第4,634,665号(Axel等人)和美国专利第4,656,134号(Ringold等人)中的那些。

目标蛋白

可使用适于在真核细胞中表达的任何所关注的目标蛋白。举例来说，所关注目标蛋白包括(但不限于)抗体或其抗原结合片段、嵌合抗体或其抗原结合片段、ScFv或其片段、Fc融合蛋白或其片段、生长因子或其片段、细胞因子或其片段、或细胞表面受体的胞外域或其片段。所关注蛋白可以是由单个亚单位组成的简单多肽或包含两个或更多个亚单位的复杂多亚单位蛋白。

宿主细胞和转染

本披露的方法中所用的宿主细胞是哺乳动物宿主细胞，包括例如中国仓鼠卵巢(CHO)细胞和小鼠细胞。在一优选实施例中，本披露提供一种Nfat5基因第1内含子、SEQ IDNO:2或SEQ ID NO:3的核酸序列片段，其编码CHO细胞中的表达增强序列。可以在Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3的任何片段内发现整合位点。举例来说，整合位点可以是置于Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3的任何片段内的重组酶识别位点。合适整合位点的一个实例是loxP位点。合适整合位点的另一个实例是两个重组酶识别位点，例如选自由以下各项组成的群组：loxP位点、lox511位点、lox2272位点、lox2372位点、loxm2位点、lox71位点、lox66位点和lox5171位点。在其它实施例中，整合位点位于序列SEQ ID NO:2内的位置或邻近于序列内的位置，其选自由以下各项组成的群组：跨越SEQ IDNO:2的编号10-4,000、100-3,900、200-3,800、300-3,700、400-3,600、500-3,500、600-3,400、700-3,300、800-3,200、900-3,100、1,000-3,000、1,100-2,900、1,200-2,800、1,300-2,700、1,200-2,600、1,300-2,500、1,400-2,400、1,500-2,300、1,600-2,200、1,700-2100、1,800-2050、1850-2050、1,900-2040、1950-2,025、1990-2021、2002-2021和2,010-2,015的位置的核苷酸。在某些实施例中，处于SEQ ID NO:2内的位置或邻近于SEQ ID NO:2内的位置的整合位点选自由以下各项组成的群组：跨越SEQ ID NO:2的编号1990-1991、1991-1992、1992-1993、1993-1994、1995-1996、1996-1997、1997-1998、1999-2000、2001-2002、2002-2003、2003-2004、2004-2005、2005-2006、2006-2007、2007-2008、2008-2009、2009-2010、2010-2011、2011-2012、2012-2013、2013-2014、2014-2015、2015-2016、2016-2017、2017-2018、2018-2019、2019-2020和2020-2021的位置的核苷酸。以上为自然编号。

本披露包括用本披露的表达载体或mRNA转染的哺乳动物宿主细胞。虽然可使用任何哺乳动物细胞，但在一个特定实施例中，宿主细胞是CHO细胞。

本领域已知数种转染方法，它们在Kaufman(1988)Meth.Enzymology 185:537中进行了综述。所选的转染方案将取决于宿主细胞类型和GOI(目标基因，gene of interest)性质，且可基于常规实验来选择。任何这类方案的基本要求是首先将编码所关注蛋白的DNA引入到合适的宿主细胞中，然后以相对稳定、可表达的方式鉴别和分离已并入异源DNA的宿主细胞。适用于整合到宿主细胞基因组中或其它功能的编码蛋白的mRNA分子可以是瞬时的并且因此有时限。

转染方案以及用于将多肽或聚核苷酸序列引入到细胞中的方案可以改变。非限制性转染方法包括基于化学的转染方法，包括使用脂质体；纳米颗粒；磷酸钙(Graham等人(1973).Virology 52(2):456-67,Bacchetti等人(1977)Proc Natl Acad Sci USA 74(4):1590-4和Kriegler,M(1991).Transfer and Expression:A Laboratory Manual.NewYork:W.H.Freeman and Company.第96-97页)；树枝状聚合物；或阳离子聚合物，如DEAE-葡聚糖或聚乙烯亚胺。非化学法包括电穿孔；声穿孔；和光学转染。基于粒子的转染包括使用基因枪、磁体辅助转染(Bertram,J.(2006)Current Pharmaceutical Biotechnology 7,277-28)。还可以使用病毒方法进行转染。mRNA递送包括使用TransMessengerTM的方法(Bire等人BMC Biotechnology 2013,13:75)。

将异源DNA引入到细胞中的一种常用方法是磷酸钙沉淀，如Wigler等人(Proc.Natl.Acad.Sci.USA 77:3567,1980)所述。通过此方法引入到宿主细胞中的DNA经常进行重排，使得此程序适用于单独基因的共转染。

聚乙烯诱导的细菌原生质体与哺乳动物细胞的融合(Schaffner等人,(1980)Proc.Natl.Acad.Sci.USA 77:2163)是另一种适用于引入异源DNA的方法。原生质体融合方案经常产生整合到哺乳动物宿主细胞基因组中的质粒DNA的多个拷贝，并且此技术需要选择和扩增标记与外源核苷酸序列在同一质粒上。还可以使用电穿孔将DNA直接引入到宿主细胞的细胞质中，如Potter等人(Proc.Natl.Acad.Sci.USA 81:7161,1988)或Shigekawa等人(BioTechniques6:742,1988)所述。与原生质体融合不同，电穿孔不需要选择标记和外源核苷酸序列在同一质粒上。

已描述适用于将异源DNA引入到哺乳动物细胞中的其它试剂，如LipofectinTM试剂和LipofectamineTM试剂(Gibco BRL,Gaithersburg,Md.)。这两种可商购的试剂均用于形成脂质-核酸复合物(或脂质体)，当应用于培养的细胞时，有利于核酸摄入细胞中。

在一个实施例中，将一个或多个聚核苷酸引入到细胞中是通过电穿孔、通过胞质内注射、通过病毒感染、通过腺病毒、通过慢病毒、通过逆转录病毒、通过转染、通过脂质介导的转染来介导或经由NucleofectionTM介导。

用于扩增外源核苷酸序列的方法同样是重组蛋白表达所需的，并且通常涉及使用选择标记(在Kaufman(1988)Meth.Enzymology 185:537中进行了综述)。对细胞毒性药物的抗性是最常用作选择标记的特征，并且可以是显性性状(例如可独立于宿主细胞类型使用)或隐性性状(例如适用于缺乏所选任何活性的特定宿主细胞类型)的结果。数种可扩增标记适用于本披露的表达载体中(例如，如Sambrook,Molecular Biology:A LaboratoryManual,Cold Spring Harbor Laboratory,NY,1989；第16.9-16.14页中所述)。

适用于在抗药性哺乳动物细胞中基因扩增的可选标记展示于Kaufman(1988)Meth.Enzymology 185:537,并且包括DHFR-MTX抗性、P-糖蛋白和多药物抗性(MDR)-各种亲脂性细胞毒性剂(例如阿德力霉素、秋水仙碱、长春新碱)和腺苷脱氨酶(ADA)-Xyl-A或腺苷和2'-脱氧柯福霉素。

其它显性可选标记包括来源于微生物的抗生素抗性基因，例如新霉素(Nero)、卡那霉素或潮霉素抗性。然而，尚未显示这些选择标记可扩增(Kaufman,R.J.,同上)。哺乳动物宿主存在数种合适的选择系统(Sambrook同上,第16.9-16.15页)。也已描述采用两个显性可选标记的共转染方案(Okayama和Berg,Mol.Cell Biol5:1136,1985)。

先前已描述或所属领域已知的有用调控元件也可包括在用于转染哺乳动物细胞的核酸构建体中。所选择的转染方案和选择用于其中的元件将取决于所用宿主细胞的类型。所属领域的技术人员知道许多不同的方案和宿主细胞，并且可基于所用的细胞培养系统的要求来选择用于表达所需蛋白的适当系统。

本披露的其它特征在示例性实施例的以下描述过程中将变得显而易见，所述示例性实施例为了说明本披露而给出并且并不打算对本披露进行限制。

本披露的构建物中所用的各种元件都是本领域中已知的，因此本领域技术人员可以用常规方法，如PCR方法、全人工化学合成法、酶切方法获得相应的元件，然后通过熟知的DNA连接技术连接在一起，就形成了本披露的质粒。

将本披露的质粒与Cre酶质粒共转化宿主细胞；或用具有细胞穿透活性的TAT-Cre重组蛋白介导本披露的载体对宿主细胞染色体进行整合。

术语“抗体”以最广义使用，并且涵盖各种抗体结构，包括但不限于单克隆抗体，多克隆抗体；单特异性抗体，多特异性抗体(例如双特异性抗体)，全长抗体和抗体片段(或抗原结合片段，或抗原结合部分)，只要它们展现出期望的抗原结合活性。“天然抗体”指天然存在的免疫球蛋白分子。例如，天然IgG抗体是约150000道尔顿的异四聚糖蛋白，由二硫键结合的两条轻链和两条重链构成。从N至C端，每条重链具有一个可变区(VH，又称作可变重域、重链可变区)，接着是三个恒定域(CH1、CH2和CH3)。类似地，从N至C端，每条轻链具有一个可变区(VL，又称作可变轻域，或轻链可变域)，接着是一个恒定轻域(轻链恒定区、CL)。术语“全长抗体”、“完整抗体”和“全抗体”在本文可互换使用，指具有与天然抗体结构基本类似的结构或具有含有如本文所限定的Fc区的重链的抗体。

术语“抗体片段”指不同于完整抗体的分子，其包含完整抗体的部分，所述部分保留了完整抗体的抗原结合能力。抗体片段的实例包括但不限于Fv、Fab、Fab’、Fab’-SH、F(ab′)₂、单域抗体、单链Fab(scFab)、双抗体、线性抗体、单链抗体分子(例如scFv)；以及由抗体片段形成的多特异性抗体。

术语“单克隆抗体”指基本上均质的抗体的群，即在该群中包含的抗体分子的氨基酸序列是相同的，除了可能少量存在的天然突变以外。相比之下，多克隆抗体制剂通常包含在其可变结构域具有不同氨基酸序列的多种不同抗体，其通常特异性针对不同表位。“单克隆”表示从基本上均质的抗体群体获得的抗体的特征，并且不应解释为要求通过任何特定方法来生产抗体。在一些实施方式中，本披露提供的抗体是单克隆抗体。

术语“核酸”在本文中可与术语“多核苷酸”互换使用，并且是指呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。所述术语涵盖含有已知核苷酸类似物或修饰的骨架残基或连接的核酸，所述核酸是合成的、天然存在的和非天然存在的，具有与参考核酸相似的结合特性，并且以类似于参考核苷酸的方式代谢。此类类似物的实例包括但不限于硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性-甲基膦酸酯、2-O-甲基核糖核苷酸、肽-核酸(PNA)。“分离的核酸”指已经与其天然环境的组分分开的核酸分子。分离的核酸包括在下述细胞中含有的核酸分子，所述细胞通常含有该核酸分子，但该核酸分子存在于染色体外或存在于不同于其天然染色体位置的染色体位置处。编码所述抗原结合分子的分离的核酸指编码抗体重链和轻链(或其片段)的一个或更多个核酸分子，包括在单一载体或分开的载体中的这样的一个或更多个核酸分子，和存在于宿主细胞中一个或更多个位置的这样的一个或更多个核酸分子。除非另有说明，否则特定的核酸序列还隐含地涵盖其保守修饰的变体(例如，简并密码子取代)和互补序列以及明确指明的序列。具体地，如下详述，简并密码子取代可以通过产生如下序列而获得，在这些序列中，一个或多个所选的(或全部)密码子的第三位被简并碱基和/或脱氧肌苷残基取代。

术语“多肽”和“蛋白质”在本文中可互换使用，指氨基酸残基的聚合物。该术语适用于氨基酸聚合物，其中一个或多个氨基酸残基是天然存在的氨基酸相应的人工化学模拟物，以及适用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。除非另外说明，否则特定的多肽序列还隐含地涵盖其保守修饰的变体。

术语序列“同一性”指，当对两条序列进行最佳比对时，两条序列的氨基酸/核酸在等价位置相同的程度(百分比)。在比对过程中，必要时可允许引入间隙以获取最大序列同一性百分比，但任何保守性取代不视为构成序列同一性的一部分。为测定序列同一性百分比，比对可以通过本领域技术已知的技术来实现，例如使用公开可得到的计算机软件，诸如BLAST、BLAST-2、ALIGN、ALIGN-2或Megalign(DNASTAR)软件。本领域技术人员可确定适用于测量比对的参数，包括在所比较的序列全长上达成最大比对所需的任何算法。

术语“载体”意指能够转运与其连接的另一多核苷酸的多核苷酸分子。一种类型的载体是“质粒”，其是指环状双链DNA环，其中可以连接附加的DNA区段。另一种类型的载体是病毒载体，例如腺相关病毒载体(AAV或AAV2)，其中另外的DNA区段可以连接到病毒基因组中。某些载体能够在引入它们的宿主细胞中自主复制(例如，具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如，非附加型哺乳动物载体)可以在引入宿主细胞中后整合到宿主细胞的基因组中，从而与宿主基因组一起复制。术语“表达载体”或“表达构建体”是指适用于对宿主细胞进行转化且含有指导及/或控制(连同宿主细胞一起)与其可操作地连接的一个或多个异源编码区的表达的核酸序列的载体。表达构建体可以包括但不限于影响或控制转录、翻译且在存在内含子时影响与其可操作地连接的编码区的RNA剪接的序列。

术语“宿主细胞”、“宿主细胞系”和“宿主细胞培养物”可互换使用，并且指已经导入外源核酸的细胞，包括此类细胞的后代。宿主细胞包括“转化体”和“经转化的细胞”，其包括原代的经转化的细胞及自其衍生的后代，而不考虑传代的次数。后代在核酸内容物上可以与亲本细胞不完全相同，而是可以含有突变。本文中，该术语包括突变体后代，其与在原代转化细胞中筛选或选择的细胞具有相同的功能或生物学活性。宿主细胞包括原核和真核宿主细胞，其中真核宿主细胞包括但不限于哺乳动物细胞、昆虫细胞系植物细胞和真菌细胞。哺乳动物宿主细胞包括人、小鼠、大鼠、犬、猴、猪、山羊、牛、马和仓鼠细胞，包括但不限于中国仓鼠卵巢(CHO)细胞、NSO、SP2细胞、HeLa细胞、幼仓鼠肾(BHK)细胞、猴肾细胞(COS)、人肝细胞癌细胞(例如，Hep G2)、A549细胞、3T3细胞和HEK-293细胞。

“任选”或“任选地”意味着随后所描述地事件或环境可以但不必发生，该说明包括该事件或环境发生或不发生的场合。

实施例与测试例

以下结合实施例和测试例进一步描述本披露，但这些实施例和测试例并非限制着本披露的范围。本披露实施例和测试例中未注明具体条件的实验方法，通常按照常规条件，如冷泉港的抗体技术实验手册，分子克隆手册；或按照原料或商品制造厂商所建议的条件。未注明具体来源的试剂，为市场购买的常规试剂。

实施例

本披露确定了一个用于高表达，稳定性高的定点插入位点，该位点位于CHO细胞基因组NW_003614572.1(269178..352822)Nfat5基因内，特别是第1内含子NW_003614572.1(269232--293783)内。高效整合位点优选在序列2如SEQ ID NO:2(约4kb)内。更优选，在序列3如SEQ ID NO:3(约2kb)内，特别优选在NW_003614572.1(272410..272418)序列4处，见SEQ ID NO:4。

位点序列2：

CCAGTTTAGCAACTTCTTCAGTTCTGTGACCTGGGGCAAGTGATTTTACTATTCTAAACTTTATTATTCCTTCTAGAAAAGTAGGTATCTCCTTAGGTATTAAAGTGTCTAGTTATAGTGTTTGGCTTTATTATTATTTTATTATTGGATAGTACTGGGGATTTATTTATTTGCTTACTATTGTTTTTTGAGACAAGTCTCACTATGTAGCTCTTTGATGTTCTGGGACAATTCTATATGGGTCATACTGGCCTGGAACTTAGATCTGCCTGCCTCTGCTTTGAGTGCTTTAAAGAGTGTGCCACAATGCCCAGAAGTACTGGGAATTTAACCTGGGACTTCAAGAATGGGAGGCAAATGTTCTCATTGAGCTATATGACCCTAGCAGGGAATATCCTAATCAGAGAGATTATCTATCAGGGAAAATGTGTTAATTATTTAAGGATGTATTTTATAAATTTTAAGGTTTTTCTTTTTTTTTGTTTGTTTTTTAAGATTATTTTTATGTGTATGGGTGTTTTGCTTTTGCCTGCCTGTATGTCCGTGTATCGTGTGTGCGTGTGTGTTGTGCTGACAGAGACCATAAAAGAGTGTTGGATCCCCAGAGACTGGAATTATAGAGCTGTCATGTATGTGCTGGGAATCAAACTTGGGTCCTCTCTAAGAGCAGCCAGTGCTCTTCTGAGTCTTCTCTCCAGTCCCCTAAAAGTTAGTTTTTAAACTTTAGCATCAGCTATATTGTTTTAACAGTATAATTTAGAGTATATAAAAGGTTCTCAAATATATTTTTTTCTTTTTTGAGATTAGGTATTACTATGTAGTCTTGGCTGGCCTGGAATTCACTATGTAAAGCAGGCTGCCTTTGAACTCAAGACATTGGCCTGCTGCTTGTTTTCAAATGAGAGATAGAAAGAAAAGATGTGGCTTGGCTAGGTGGATGGAGGGGAAACTGTGATCAGAACATATTTTATGAAAACAATTTTCAATAAAAAAGTTAAATCAAAAAAAAAAAAGATTGGCCTGCTTCTGCCTCCCGAGTTCTGGCTTATTAAAGACATATTCTATCATGCCTGGCTTTTTGTATTAATTTTTTGTTGGTCTTTTTGAGACAGGGTTTGTCTATGTATGCTTGGACTGCCCTGGAACTCTCTCCATAGACCAGGCTGGACTCAAACACAGGAGATCTACATGCCTCTACCTCTCAAGTACTGGAAGTAAAGTAAAGGTGTTCACCATGATTGTCTGGCTTTGTATTAATTTTTTAGAATACTCTGTTTTATTCTAAGAAGTATATATTCTAGTTCATTTCTTTTTTCTTTTTTCTTTTCTTTTATTTTTTATTTAATTTTTACAAATTGTAATTTCACATGTCAATCCTTTCTCCCTTTTCCCCCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTTTGCCATCTTTGAAAGAAAGAGGATGACAGGAGGCTAATACTTCTGGTGTATCAGTGTCTTGTAATCTCTTAAAACTGCAGTCCAAGTAGGTGAGGCAGGAGGGTTGCAGAGATGGAAACAAAGCTAGTAAGTAACAAGCTATAGAATGTGTAAACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACAAAAAAATTGTTGAACATAAATCTCTTCAGAGTGGTGTATGTCAAGAGCTTGCCACTGAATTATTCCTTTTTTTTTTTTTTTTAAGTTTTTTAAGACAGGGTTTCACTGTATAGCCCTGGCTGTCTTGGAACTCACTTTGTAGACCAGACTAGCTTTGAACTCACAGAGATCCACCTCCCTCTGCCTCCTAAGTTCTGGGATTAAAGGCGTGTGTACCACCACCTGGCACCACTGAATTCTTTAAAAAACATTTACTTACTGGATGTGCCATACTACACATGTGGATGTCAGACTCAACAGTTTTTAGGAATCAGTTCTTGCTTTCTACTATGTGGTTCTGGGGGTCATTCTCAGGTTGTCAGGCTTGGTGGCAAGTGCCTTTACTTTACCTATTGAGCTTCCTTACTGTCCCGATGATTCACTGAATTATTTGTGTGTGTGTGCATACATGTGTGTAAAGCCCAGAGGTTCCTCAATCTATCCCTACCTTCCTGTTGAAAATTTCTCACTGAATCTGGAATTAACTAATTTGGCTAGACTGACTGACCGGCAAGCCTGCAAGGATCCTCCTGTTCCTGCCTGTCTTGTGCTGGGATTACAGGCATAGTTTACTTTTTATATGGGTGCAGGGACTCTGAATTTTGGTCTGCATTCTTACATAGAAAACTTCCCATGGAGCCATTTCCCTAGTTATTGAATTCATTCATGTTCATTCATTTCTAATTCTAAAGTTCATTCATTTCTCTTTCTAAGATTTTTTTTTGAGAATTGGTTTGTTTGTGTGTTGGTTTTTCAAGACAGGATTTCTCTGTGTAATAGTCCTGGATGTCCTGGAACTCGATTTGTTGACCAGTCTGGCCTTGAACTCACAGAGATTCACCTGACTCTGCCTCCTGAGTGCTGGGGTTAAAAGTGTGTGCCAGCAGTGCCCAGCATTTTTTTTGAGATTTAATTTGTCATTATATTTTATGTGGATGAGTGTTTTGCCTGCATGAATGTCTGTTCATCGCATGCATGTAGTGCATGAGGCAGCCAGAAGAGGGTGTTGGATTCCCTGGAATTAGAGTTACAGATGGTTGTTAGCCACCATATGGTTGCTGGGAATTGAACCCATATTCTCTGGAAGAACAGCCAGTGCTCTTAATTAATCACTGAGCCATCTTCTCTCACCTTTCTTTTTTTGAGGCAGGGTCTCATTCACAGCCCAGGTTATCCTTGAACTTTTGGTCCTCCTGTCCCATTTGTTTGAGTGCTGGGAGTAGAGGTGTTGCTAGCTCCTGCATCCTACTTGATCAGTGAACTCAAAAGAATTTGTATAACCCTTTGAGATGTTAAATAGCAATTATCTTACTTTAGAGATGAGGAAATGGAGGCATATGGATCTTTAGTGACTAGCCTAGAATCACATAATTAATAAGTTGTAGAGTTACGCTGTTGGAGCTGCTGCTCTTCCTCTTCCTTCCCCCTCTTTGAAACTTTCACTCCTTCTGCCTCAGTCTGTCAGTGCTTGGATTACAGGTGTTCCCCACCATGCCTGTCAATTTAAGTTTTTAAGAAAATAAGTTATAAAACCTGTAGTTGGGAGTTTTTGACTTGATAAATAGATTAAAAATATTCTTGCTATTCAGCAGAGTTTGCTTTTAGCCTGTCTATTAAAACAATGCTGACTGAGCCTTCTTGCTACCATGATTTTAATTAACGTGATGATTCCCTGACAATAGTTACAGGATTTTAACTAATTAATGCAATAATACACAAGTATTAAAATGACCTCAACTTCAGGAGACACCCAGTACTCTATTATGGCCTCAAAGGGCTCCCTCATATGCATGGGGCTCGCTCTCTCTCTCTCTCTCTTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCGCACATAATCACACAAATTTAAAATGTATATAATTCTTTAAAAAATTGTATGTTTGTTTTTAAAGGTTTTACGAGTTTAAATATCTTGCTTGCATGCGTGTGCCTGACTTATTTATTTTTTAAAAAAGATTTATTTATTATATATACAGTATTCTACCTGCATGTCAGCCTGCATGCCAGAAGAGGGCATCAGATTTCATTTTAAATGATTGTGAGCCACCATGTGGTTGCTGGGAATTGAACTCAGGACCTCTGAAGAACAGCCAGTGCTCTTAACCTCTGAGCCATCTCTCCAGCCCTGTGCCTGATTTATTTTATTGAAAATAAATTTTTTTCATACCAGTGAGATTTTTCCTTTTCAAGTGGTTGTTAGTGGAAGATAGCTTCTTGGTTAGGGATGTGAGCTCTGCTTTGGGGAATATTTTAATGTTCACAGTTAGCAAATTG

SEQ ID NO:2

位点序列3：

CAAAAAAAAAAAAGATTGGCCTGCTTCTGCCTCCCGAGTTCTGGCTTATTAAAGACATATTCTATCATGCCTGGCTTTTTGTATTAATTTTTTGTTGGTCTTTTTGAGACAGGGTTTGTCTATGTATGCTTGGACTGCCCTGGAACTCTCTCCATAGACCAGGCTGGACTCAAACACAGGAGATCTACATGCCTCTACCTCTCAAGTACTGGAAGTAAAGTAAAGGTGTTCACCATGATTGTCTGGCTTTGTATTAATTTTTTAGAATACTCTGTTTTATTCTAAGAAGTATATATTCTAGTTCATTTCTTTTTTCTTTTTTCTTTTCTTTTATTTTTTATTTAATTTTTACAAATTGTAATTTCACATGTCAATCCTTTCTCCCTTTTCCCCCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTTTGCCATCTTTGAAAGAAAGAGGATGACAGGAGGCTAATACTTCTGGTGTATCAGTGTCTTGTAATCTCTTAAAACTGCAGTCCAAGTAGGTGAGGCAGGAGGGTTGCAGAGATGGAAACAAAGCTAGTAAGTAACAAGCTATAGAATGTGTAAACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACAAAAAAATTGTTGAACATAAATCTCTTCAGAGTGGTGTATGTCAAGAGCTTGCCACTGAATTATTCCTTTTTTTTTTTTTTTTAAGTTTTTTAAGACAGGGTTTCACTGTATAGCCCTGGCTGTCTTGGAACTCACTTTGTAGACCAGACTAGCTTTGAACTCACAGAGATCCACCTCCCTCTGCCTCCTAAGTTCTGGGATTAAAGGCGTGTGTACCACCACCTGGCACCACTGAATTCTTTAAAAAACATTTACTTACTGGATGTGCCATACTACACATGTGGATGTCAGACTCAACAGTTTTTAGGAATCAGTTCTTGCTTTCTACTATGTGGTTCTGGGGGTCATTCTCAGGTTGTCAGGCTTGGTGGCAAGTGCCTTTACTTTACCTATTGAGCTTCCTTACTGTCCCGATGATTCACTGAATTATTTGTGTGTGTGTGCATACATGTGTGTAAAGCCCAGAGGTTCCTCAATCTATCCCTACCTTCCTGTTGAAAATTTCTCACTGAATCTGGAATTAACTAATTTGGCTAGACTGACTGACCGGCAAGCCTGCAAGGATCCTCCTGTTCCTGCCTGTCTTGTGCTGGGATTACAGGCATAGTTTACTTTTTATATGGGTGCAGGGACTCTGAATTTTGGTCTGCATTCTTACATAGAAAACTTCCCATGGAGCCATTTCCCTAGTTATTGAATTCATTCATGTTCATTCATTTCTAATTCTAAAGTTCATTCATTTCTCTTTCTAAGATTTTTTTTTGAGAATTGGTTTGTTTGTGTGTTGGTTTTTCAAGACAGGATTTCTCTGTGTAATAGTCCTGGATGTCCTGGAACTCGATTTGTTGACCAGTCTGGCCTTGAACTCACAGAGATTCACCTGACTCTGCCTCCTGAGTGCTGGGGTTAAAAGTGTGTGCCAGCAGTGCCCAGCATTTTTTTTGAGATTTAATTTGTCATTATATTTTATGTGGATGAGTGTTTTGCCTGCATGAATGTCTGTTCATCGCATGCATGTAGTGCATGAGGCAGCCAGAAGAGGGTGTTGGATTCCCTGGAATTAGAGTTACAGATGGTTGTTAGCCACCATATGGTTGCTGGGAATTGAACCCATATTCTCTGGAAGAACAGCCAGTGCTCTTAATTAATCACTGAGCCATCTTCTCTCACCTTTCTTTTTTTGAGGCAGGGTCTCATTCACAGCCCAGGTTATCCTTGAACTTTTGGTCCTCCTGTCCCATTTGTTTGAGTGCTGGGAGTAGAGGTGTTGCTAGCTCCTGCATCCTACTTGATCAGTGAACTCAAAAGAATTTGTATAACCCTTTGAGATGTTAAA

SEQ ID NO:3

位点序列4：

CTATGTGGT SEQ ID NO:4

本例中构建荧光定点标记细胞株的原理是将供体质粒、sgRNA质粒、Cas9质粒共同转染CHO细胞后，Cas9蛋白在sgRNA的引导下，在基因组的gRNA靶点处进行剪切，产生双链断裂(DSBs，double strand breaks)，从而触发DNA的同源定向修复(homology-directedrepair，HDR)。该机制借助基因组断裂位点上游的5′和下游的3′同源臂(homology arm，HA)，与供体质粒上带有的5′和3′同源臂进行同源重组修复，从而将带有绿色荧光(ZsGreen1)及抗性基因(NeoR)的外源核苷酸序列定点插入到同源臂之间，得到荧光蛋白定点标记的宿主细胞株。通过重组酶介导的盒式交换(Recombinase Mediated CassetteExchange，RMCE)，可以将抗体轻重链基因置换标记细胞株中的绿色荧光蛋白，构建得到抗体表达细胞株。

实施例1:定点标记细胞株的建立

本实施例利用CRISPR/Cas9的定点整合技术，在目标位点处将包括lox重组识别基因序列，绿色荧光蛋白基因序列(ZsGreen1)等外源核苷酸序列整合到CHO细胞。整合位点位于Nfat5基因NW_003614572.1(269178..352822)的非编码区中，这样不破坏细胞正常基因组机制(例如蛋白的翻译)或改变细胞表型。通过流式分选、PCR鉴定可以方便快速地得到定点整合荧光蛋白标记的宿主细胞。定点标记宿主细胞的构建如图1所示。构建步骤如下：

1、质粒的构建

构建定点整合的细胞株需要使用三种不同的质粒共转CHO细胞，分别为Cas9质粒，SgRNA质粒及供体质粒。

1.1Cas9质粒

参考WO2015052231实施例6，将Cas9蛋白的基因序列(S.pyogenes菌株M1，GAS基因组，WO2015052231中的SEQ ID NO:2)克隆至pJ607-03，得到Cas9质粒。

1.2SgRNA质粒

申请人经鉴定发现SEQ ID NO:4，CTATGTGGT(NW_003614572.1，272410..272418)为可高效稳定表达外源核苷酸蛋白的靶点序列。该靶点序列位于Nfat5基因的第1内含子NW_003614572.1(269232..293783)内，在其上下游各约2000bp范围内(SEQ ID NO:2)，优选在其上下游各约1000bp范围内(SEQ ID NO:3)，优先选择定点整合位点。采用CRISPR/Cas9技术定点整合目的蛋白质的编码基因时，定点整合SgRNA靶点序列的非限制性实施例如下表所示：

表1定点整合SgRNA靶点序列

1	NNNNNNNNNNNNNNNNNNNNNGG	SEQ ID NO:5
			2	AACTGCAGTCCAAGTAGGTGAGG	SEQ ID NO:6
3	TGTTTACACATTCTATAGCCAGG	SEQ ID NO:7
			4	ACCCTCCTGCCTCACCTACTTGG	SEQ ID NO:8
5	GATGTGCCATACTACACATGTGG	SEQ ID NO:9
			6	AAACAAAGCTAGTAAGTTCCTGG	SEQ ID NO:10
7	GGGATAGATTGAGGAACCTCTGG	SEQ ID NO:11
			8	GTGAGAAATTTTCAACAGGAAGG	SEQ ID NO:12
9	CATGAATGAATTCAATAACTAGG	SEQ ID NO:13
			10	GAGGATCCTTGCAGGCTTGCCGG	SEQ ID NO:14
11	CTTACATAGAAAACTTCCCATGG	SEQ ID NO:15
			12	GCATAGTTTACTTTTTATATGGG	SEQ ID NO:16
13	GGCATAGTTTACTTTTTATATGG	SEQ ID NO:17
			14	CTGTCTTGTGCTGGAATTACAGG	SEQ ID NO:18
15	TCTCAGGTTGTCAGGCTTGGTGG	SEQ ID NO:19

其中SEQ ID NO:4序列表示在Nfat5基因的内含子上，尤其第1内含子上，特别是在SEQ ID NO:2的范围内，优选在SEQ ID NO:3的范围内，使用CRISPR/Cas9的定点整合技术，所确定的可供gRNA识别的定点整合位点。其中一个优选的sgRNA靶向序列为SEQ ID NO:9(NW_003614572.1，272344..272366)。

以下实施例以靶向序列SEQ ID NO:9为例，用于示例性说明本申请构建SgRNA质粒方法：

用如下序列合成识别Nfat5基因的SgRNA序列：

SgRNA-5-fwd:5′-TTTGGATGTGCCATACTACACATGGT-3′

SEQ ID NO:20

SgRNA-5-rev:5′-TAAAACCATGTGTAGTATGGCACATC-3′

SEQ ID NO:21

用如下序列合成识别Fer1L4靶点基因(WO2013190032)的SgRNA序列，作为对照：

SgRNA-F-fwd:5′-TTTGGCAGACTGACCTCACTTCAAGT-3′

SEQ ID NO:22

SgRNA-F-rev:5′-TAAAACTTGAAGTGAGGTCAGTCTGC-3′

SEQ ID NO:23

将U6启动子克隆到pSK载体(pBluescript-SK，GenBank编号：X52324.1)中，得到pSK-U6载体。将上述的SgRNA序列克隆到pSK-U6载体中，分别得到相对应的靶向Nfat5基因的SgRNA质粒和靶向Fer1L4基因的SgRNA质粒。

1.3构建供体质粒方法如下：

合成外源核苷酸序列，包含如下基因元件：

-5′arm-loxP-EF1α-ZsGreen1-bGHpolyA-SV40-NeoR-lox2272-bGHpolyA-3′arm-SV40-tagBFP-bGHpolyA-

以上外源核苷酸序列的克隆至pUC57(addgene,54338)载体，示例性克隆步骤如下：

1)将loxP-EF1α-ZsGreen1-bGHpolyA-SV40-NeoR-lox2272-bGHpolyA通过两个酶切位点(EcoRI，KpnI)克隆至pUC57载体上；

2)将SV40-tagBFP-bGHpolyA-通过两个酶切位点(KpnI，BamHI)克隆至pUC57载体上；

3)将5′arm同源臂序列克隆至上述载体上(酶切位点EcoRI)；

4)将3′arm同源臂序列克隆至上述载体上(酶切位点KpnI)。

其中，EF1α为人延长因子1α来源的强哺乳动物表达启动子，SV40为猿猴空泡病毒40来源的哺乳动物表达启动子，ZsGreen1为绿色荧光标记基因，NeoR为新霉素抗性基因，tagBFP为蓝色荧光蛋白，具体参考文献Minimizing Clonal Variation during MammalianCell Line Engineering for Improved Systems Biology Data Generation。具体序列如下：

loxp识别位点：

ATAACTTCGTATAGCATACATTATACGAAGTTAT

SEQ ID NO:24

lox2272识别位点：

ATAACTTCGTATAGGATACTTTATACGAAGTTAT

SEQ ID NO:25

ZsGreen1绿色荧光标记基因：

ATGGCCCAGTCCAAGCACGGCCTGACCAAGGAGATGACCATGAAGTACCGCATGGAGGGCTGCGTGGACGGCCACAAGTTCGTGATCACCGGCGAGGGCATCGGCTACCCCTTCAAGGGCAAGCAGGCCATCAACCTGTGCGTGGTGGAGGGCGGCCCCTTGCCCTTCGCCGAGGACATCTTGTCCGCCGCCTTCATGTACGGCAACCGCGTGTTCACCGAGTACCCCCAGGACATCGTCGACTACTTCAAGAACTCCTGCCCCGCCGGCTACACCTGGGACCGCTCCTTCCTGTTCGAGGACGGCGCCGTGTGCATCTGCAACGCCGACATCACCGTGAGCGTGGAGGAGAACTGCATGTACCACGAGTCCAAGTTCTACGGCGTGAACTTCCCCGCCGACGGCCCCGTGATGAAGAAGATGACCGACAACTGGGAGCCCTCCTGCGAGAAGATCATCCCCGTGCCCAAGCAGGGCATCTTGAAGGGCGACGTGAGCATGTACCTGCTGCTGAAGGACGGTGGCCGCTTGCGCTGCCAGTTCGACACCGTGTACAAGGCCAAGTCCGTGCCCCGCAAGATGCCCGACTGGCACTTCATCCAGCACAAGCTGACCCGCGAGGACCGCAGCGACGCCAAGAACCAGAAGTGGCACCTGACCGAGCACGCCATCGCCTCCGGCTCCGCCTTGCCCAAGCTTCCGCGGAGCCATGGCTTCCCGCCGGCGGTGGCGGCGCAGGATGATGGCACGCTGCCCATGTCTTGTGCCCAGGAGAGCGGGATGGACCGTCACCCTGCAGCCTGTGCTTCTGCTAGGATCAATGTGTAG

SEQ ID NO:26

EF1α启动子：

GGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTCCAGTACGTGATTCTTGATCCCGAGCTGGAGCCAGGGGCGGGCCTTGCGCTTTAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAGGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGGCCTCGCGCCGCCGTGTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTCCAGGGGGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAGGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTGGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGA

SEQ ID NO:27

SV40启动子：

GTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAA

SEQ ID NO:28

NeoR抗性基因：

ATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAGGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGCGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGA

SEQ ID NO:29

tagBFP荧光蛋白基因：ATGAGCGAGCTGATTAAGGAGAACATGCACATGAAGCTGTACATGGAGGGCACCGTGGACAACCATCACTTCAAGTGCACATCCGAGGGCGAAGGCAAGCCCTACGAGGGCACCCAGACCATGAGAATCAAGGTGGTCGAGGGCGGCCCTCTCCCCTTCGCCTTCGACATCCTGGCTACTAGCTTCCTCTACGGCAGCAAGACCTTCATCAACCACACCCAGGGCATCCCCGACTTCTTCAAGCAGTCCTTCCCTGAGGGCTTCACATGGGAGAGAGTCACCACATACGAAGACGGGGGCGTGCTGACCGCTACCCAGGACACCAGCCTCCAGGACGGCTGCCTCATCTACAACGTCAAGATCAGAGGGGTGAACTTCACATCCAACGGCCCTGTGATGCAGAAGAAAACACTCGGCTGGGAGGCCTTCACCGAGACGCTGTACCCCGCTGACGGCGGCCTGGAAGGCAGAAACGACATGGCCCTGAAGCTCGTGGGCGGGAGCCATCTGATCGCAAACATCAAGACCACATATAGATCCAAGAAACCCGCTAAGAACCTCAAGATGCCTGGCGTCTACTATGTGGACTACAGACTGGAAAGAATCAAGGAGGCCAACAACGAGACCTACGTCGAGCAGCACGAGGTGGCAGTGGCCAGATACTGCGACCTCCCTAGCAAACTGGGGCACAAGCTTAATTAA

SEQ ID NO:30

本领域的技术人员在目标序列确定后，可将任何工业上或治疗上适用的蛋白的基因序列整合到目标基因座。本披露采用同源重组方法，选择与Nfat5基因的第1内含子、SEQID NO:2或SEQ ID NO:3同源的序列作为同源臂进行重组。当选择采用CRISPR/Cas9的定点整合技术，其中5′arm同源臂选择在SgRNA靶点序列上游250bp-1000bp长度，优选300bp-750bp，更优选500bp-700bp；其中3′arm同源臂选择在SgRNA靶点序列下游250bp-1000bp长度，优选300bp-750bp，更优选500bp-700bp。

本申请的5′arm同源臂优选与识别位点上游序列SEQ ID NO:31或SEQ ID NO:33同源，3′arm同源臂优选与识别位点下游序列SEQ ID NO:32或SEQ ID NO:34同源。

上下游序列如下：

上游2000bp序列：

AGAGGAAGGTTGTCCTATAGATACAGTGGGGGAAGTGGGTGTTGTAATTGAGCTTAGGTTTAAATACCAGTTTAGCAACTTCTTCAGTTCTGTGACCTGGGGCAAGTGATTTTACTATTCTAAACTTTATTATTCCTTCTAGAAAAGTAGGTATCTCCTTAGGTATTAAAGTGTCTAGTTATAGTGTTTGGCTTTATTATTATTTTATTATTGGATAGTACTGGGGATTTATTTATTTGCTTACTATTGTTTTTTGAGACAAGTCTCACTATGTAGCTCTTTGATGTTCTGGGACAATTCTATATGGGTCATACTGGCCTGGAACTTAGATCTGCCTGCCTCTGCTTTGAGTGCTTTAAAGAGTGTGCCACAATGCCCAGAAGTACTGGGAATTTAACCTGGGACTTCAAGAATGGGAGGCAAATGTTCTCATTGAGCTATATGACCCTAGCAGGGAATATCCTAATCAGAGAGATTATCTATCAGGGAAAATGTGTTAATTATTTAAGGATGTATTTTATAAATTTTAAGGTTTTTCTTTTTTTTTGTTTGTTTTTTAAGATTATTTTTATGTGTATGGGTGTTTTGCTTTTGCCTGCCTGTATGTCCGTGTATCGTGTGTGCGTGTGTGTTGTGCTGACAGAGACCATAAAAGAGTGTTGGATCCCCAGAGACTGGAATTATAGAGCTGTCATGTATGTGCTGGGAATCAAACTTGGGTCCTCTCTAAGAGCAGCCAGTGCTCTTCTGAGTCTTCTCTCCAGTCCCCTAAAAGTTAGTTTTTAAACTTTAGCATCAGCTATATTGTTTTAACAGTATAATTTAGAGTATATAAAAGGTTCTCAAATATATTTTTTTCTTTTTTGAGATTAGGTATTACTATGTAGTCTTGGCTGGCCTGGAATTCACTATGTAAAGCAGGCTGCCTTTGAACTCAAGACATTGGCCTGCTGCTTGTTTTCAAATGAGAGATAGAAAGAAAAGATGTGGCTTGGCTAGGTGGATGGAGGGGAAACTGTGATCAGAACATATTTTATGAAAACAATTTTCAATAAAAAAGTTAAATCAAAAAAAAAAAAGATTGGCCTGCTTCTGCCTCCCGAGTTCTGGCTTATTAAAGACATATTCTATCATGCCTGGCTTTTTGTATTAATTTTTTGTTGGTCTTTTTGAGACAGGGTTTGTCTATGTATGCTTGGACTGCCCTGGAACTCTCTCCATAGACCAGGCTGGACTCAAACACAGGAGATCTACATGCCTCTACCTCTCAAGTACTGGAAGTAAAGTAAAGGTGTTCACCATGATTGTCTGGCTTTGTATTAATTTTTTAGAATACTCTGTTTTATTCTAAGAAGTATATATTCTAGTTCATTTCTTTTTTCTTTTTTCTTTTCTTTTATTTTTTATTTAATTTTTACAAATTGTAATTTCACATGTCAATCCTTTCTCCCTTTTCCCCCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTTTGCCATCTTTGAAAGAAAGAGGATGACAGGAGGCTAATACTTCTGGTGTATCAGTGTCTTGTAATCTCTTAAAACTGCAGTCCAAGTAGGTGAGGCAGGAGGGTTGCAGAGATGGAAACAAAGCTAGTAAGTAACAAGCTATAGAATGTGTAAACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACAAAAAAATTGTTGAACATAAATCTCTTCAGAGTGGTGTATGTCAAGAGCTTGCCACTGAATTATTCCTTTTTTTTTTTTTTTTAAGTTTTTTAAGACAGGGTTTCACTGTATAGCCCTGGCTGTCTTGGAACTCACTTTGTAGACCAGACTAGCTTTGAACTCACAGAGATCCACCTCCCTCTGCCTCCTAAGTTCTGGGATTAAAGGCGTGTGTACCACCACCTGGCACCACTGAATTCTTTAAAAAACATTTACTTACTG

SEQ ID NO:31

下游2000bp序列：

ATGTCAGACTCAACAGTTTTTAGGAATCAGTTCTTGCTTTCTACTATGTGGTTCTGGGGGTCATTCTCAGGTTGTCAGGCTTGGTGGCAAGTGCCTTTACTTTACCTATTGAGCTTCCTTACTGTCCCGATGATTCACTGAATTATTTGTGTGTGTGTGCATACATGTGTGTAAAGCCCAGAGGTTCCTCAATCTATCCCTACCTTCCTGTTGAAAATTTCTCACTGAATCTGGAATTAACTAATTTGGCTAGACTGACTGACCGGCAAGCCTGCAAGGATCCTCCTGTTCCTGCCTGTCTTGTGCTGGGATTACAGGCATAGTTTACTTTTTATATGGGTGCAGGGACTCTGAATTTTGGTCTGCATTCTTACATAGAAAACTTCCCATGGAGCCATTTCCCTAGTTATTGAATTCATTCATGTTCATTCATTTCTAATTCTAAAGTTCATTCATTTCTCTTTCTAAGATTTTTTTTTGAGAATTGGTTTGTTTGTGTGTTGGTTTTTCAAGACAGGATTTCTCTGTGTAATAGTCCTGGATGTCCTGGAACTCGATTTGTTGACCAGTCTGGCCTTGAACTCACAGAGATTCACCTGACTCTGCCTCCTGAGTGCTGGGGTTAAAAGTGTGTGCCAGCAGTGCCCAGCATTTTTTTTGAGATTTAATTTGTCATTATATTTTATGTGGATGAGTGTTTTGCCTGCATGAATGTCTGTTCATCGCATGCATGTAGTGCATGAGGCAGCCAGAAGAGGGTGTTGGATTCCCTGGAATTAGAGTTACAGATGGTTGTTAGCCACCATATGGTTGCTGGGAATTGAACCCATATTCTCTGGAAGAACAGCCAGTGCTCTTAATTAATCACTGAGCCATCTTCTCTCACCTTTCTTTTTTTGAGGCAGGGTCTCATTCACAGCCCAGGTTATCCTTGAACTTTTGGTCCTCCTGTCCCATTTGTTTGAGTGCTGGGAGTAGAGGTGTTGCTAGCTCCTGCATCCTACTTGATCAGTGAACTCAAAAGAATTTGTATAACCCTTTGAGATGTTAAATAGCAATTATCTTACTTTAGAGATGAGGAAATGGAGGCATATGGATCTTTAGTGACTAGCCTAGAATCACATAATTAATAAGTTGTAGAGTTACGCTGTTGGAGCTGCTGCTCTTCCTCTTCCTTCCCCCTCTTTGAAACTTTCACTCCTTCTGCCTCAGTCTGTCAGTGCTTGGATTACAGGTGTTCCCCACCATGCCTGTCAATTTAAGTTTTTAAGAAAATAAGTTATAAAACCTGTAGTTGGGAGTTTTTGACTTGATAAATAGATTAAAAATATTCTTGCTATTCAGCAGAGTTTGCTTTTAGCCTGTCTATTAAAACAATGCTGACTGAGCCTTCTTGCTACCATGATTTTAATTAACGTGATGATTCCCTGACAATAGTTACAGGATTTTAACTAATTAATGCAATAATACACAAGTATTAAAATGACCTCAACTTCAGGAGACACCCAGTACTCTATTATGGCCTCAAAGGGCTCCCTCATATGCATGGGGCTCGCTCTCTCTCTCTCTCTCTTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCGCACATAATCACACAAATTTAAAATGTATATAATTCTTTAAAAAATTGTATGTTTGTTTTTAAAGGTTTTACGAGTTTAAATATCTTGCTTGCATGCGTGTGCCTGACTTATTTATTTTTTAAAAAAGATTTATTTATTATATATACAGTATTCTACCTGCATGTCAGCCTGCATGCCAGAAGAGGGCATCAGATTTCATTTTAAATGATTGTGAGCCACCATGTGGTTGCTGGGAATTGAACTCAGGACCTCTGAAGAACAGCCAGTGCTCTTAACCTCTGAGCCATCTCTCCAGCCCTGTGCCTGATTTATTTTATTGAAAATAAATTTTTTTCATACCAGTGAGATTTTTCCTTTTCAAGTGGTTGTTAGTGGAAGATAGCTTCTTGGTTAG

SEQ ID NO:32

上游1000bp序列：

TGGATGGAGGGGAAACTGTGATCAGAACATATTTTATGAAAACAATTTTCAATAAAAAAGTTAAATCAAAAAAAAAAAAGATTGGCCTGCTTCTGCCTCCCGAGTTCTGGCTTATTAAAGACATATTCTATCATGCCTGGCTTTTTGTATTAATTTTTTGTTGGTCTTTTTGAGACAGGGTTTGTCTATGTATGCTTGGACTGCCCTGGAACTCTCTCCATAGACCAGGCTGGACTCAAACACAGGAGATCTACATGCCTCTACCTCTCAAGTACTGGAAGTAAAGTAAAGGTGTTCACCATGATTGTCTGGCTTTGTATTAATTTTTTAGAATACTCTGTTTTATTCTAAGAAGTATATATTCTAGTTCATTTCTTTTTTCTTTTTTCTTTTCTTTTATTTTTTATTTAATTTTTACAAATTGTAATTTCACATGTCAATCCTTTCTCCCTTTTCCCCCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTTTGCCATCTTTGAAAGAAAGAGGATGACAGGAGGCTAATACTTCTGGTGTATCAGTGTCTTGTAATCTCTTAAAACTGCAGTCCAAGTAGGTGAGGCAGGAGGGTTGCAGAGATGGAAACAAAGCTAGTAAGTAACAAGCTATAGAATGTGTAAACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACAAAAAAATTGTTGAACATAAATCTCTTCAGAGTGGTGTATGTCAAGAGCTTGCCACTGAATTATTCCTTTTTTTTTTTTTTTTAAGTTTTTTAAGACAGGGTTTCACTGTATAGCCCTGGCTGTCTTGGAACTCACTTTGTAGACCAGACTAGCTTTGAACTCACAGAGATCCACCTCCCTCTGCCTCCTAAGTTCTGGGATTAAAGGCGTGTGTACCACCACCTGGCACCACTGAATTCTTTAAAAAACATTTACTTACTG

SEQ ID NO:33

下游1000bp序列：

ATGTCAGACTCAACAGTTTTTAGGAATCAGTTCTTGCTTTCTACTATGTGGTTCTGGGGGTCATTCTCAGGTTGTCAGGCTTGGTGGCAAGTGCCTTTACTTTACCTATTGAGCTTCCTTACTGTCCCGATGATTCACTGAATTATTTGTGTGTGTGTGCATACATGTGTGTAAAGCCCAGAGGTTCCTCAATCTATCCCTACCTTCCTGTTGAAAATTTCTCACTGAATCTGGAATTAACTAATTTGGCTAGACTGACTGACCGGCAAGCCTGCAAGGATCCTCCTGTTCCTGCCTGTCTTGTGCTGGGATTACAGGCATAGTTTACTTTTTATATGGGTGCAGGGACTCTGAATTTTGGTCTGCATTCTTACATAGAAAACTTCCCATGGAGCCATTTCCCTAGTTATTGAATTCATTCATGTTCATTCATTTCTAATTCTAAAGTTCATTCATTTCTCTTTCTAAGATTTTTTTTTGAGAATTGGTTTGTTTGTGTGTTGGTTTTTCAAGACAGGATTTCTCTGTGTAATAGTCCTGGATGTCCTGGAACTCGATTTGTTGACCAGTCTGGCCTTGAACTCACAGAGATTCACCTGACTCTGCCTCCTGAGTGCTGGGGTTAAAAGTGTGTGCCAGCAGTGCCCAGCATTTTTTTTGAGATTTAATTTGTCATTATATTTTATGTGGATGAGTGTTTTGCCTGCATGAATGTCTGTTCATCGCATGCATGTAGTGCATGAGGCAGCCAGAAGAGGGTGTTGGATTCCCTGGAATTAGAGTTACAGATGGTTGTTAGCCACCATATGGTTGCTGGGAATTGAACCCATATTCTCTGGAAGAACAGCCAGTGCTCTTAATTAATCACTGAGCCATCTTCTCTCACCTTTCTTTTTTTGAGGCAGGGTCTCATTCACAGCCCAGGTTATCCTTGAACTTTTGGTCCTCCTGTCCCATTTGTTTGAGTGCTGGGAGTAGAGGTGTTGCTAGCTCCTGCATC

SEQ ID NO:34

本披露外源核苷酸序列在Nfat5基因上的插入，与该外源核苷酸序列在前述Fer1L4靶点基因(WO2013190032)上的插入进行比较。

同源臂的非限制性实施列如下：

在Nfat5基因上的插入同源臂：

Site-5-5′arm

CCTCTAGTTCATTTCTTGATTCTCCTTTGCCATCTTTGCAAGATAGAGTATACCAGGAGGCTAATACTTCTGGTGTATCAGTGTCTTGTAATCTCTTAAAACTGCAGTCCAAGTAGGTGAGGCAGGAGGGTTGCAGAGATGGAAACAAAGCTAGTAAGTTCCTGGCTATAGAATGTGTAAACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACGGAAAAATTGTTGAACATAAATCTCTTCAGAGTGGTGTATGTCAAGAGCTTGCCACTGAATTATTCCTTTTTTTTTTTTTTTTTTAAGTTTTTTAAGACAGGGTTTCACTGTATAGCCCTGGCTGTCTTGGAACTCACTTTGTAGACCAGACTAGCTTTGAACTCACAGAGATCCACCTCCCTCTGCCTCCTAAGTTCTGGGATTAAAGGCGTGTGTACCACCACCTGGCACCACTGAATTCTTTAAAAAACATTTACTTACTG

SEQ ID NO:35

Site-5 3′armATGTCAGACTCAACAGTTTTTAGGAATCAGTTCTTGCTTTCTACTATGTGGTTCTGGGGGTCATTCTCAGGTTGTCAGGCTTGGTGGCAAGTGCCTTTACTTTACCTATTGAGCTTCCTTACTGTCCCGATGATTCACTGAATTATTTGTGTGTGTGTGCATACATGTGTGTAAAGCCCAGAGGTTCCTCAATCTATCCCTACCTTCCTGTTGAAAATTTCTCACTGAATCTGGAATTAACTAATTTGGCTAGACTGACTGACCGGCAAGCCTGCAAGGATCCTCCTGTTCCTGCCTGTCTTGTGCTGGAATTACAGGCATAGTTTACTTTTTATATGGGTGCAGGGACTCTGAATTTTGGTCTGCATTCTTACATAGAAAACTTCCCATGGAGCCATTTCCCTAGTTATTGAATTCATTCATGTTCATTCATTTCTAATTCTAAAGTTCATTCATTTCTCTTTCTAAGATTTTTTTTGAGAATTGGTTTGTTTGTGTGTTGGTTTTTCAAGACAGGA

SEQ ID NO:36

在pUC57载体上整合包含Nfat5基因同源臂的外源核苷酸序列，得到供体质粒1。质粒构成参考图1。

在Fer1L4基因上的插入同源臂：

Site-F-5′arm

AGAACATGAGGGGCTGGAGAGATGGCTCAGAGGTTAAGAGCACTGGCTGTTCTTCCAGAGTTTCTGAGTTCAATTCCCAGCAACCACATAGTGGTTCACAGCCATCTATAATGAGATCTGGTGCTCTCTTCTGGTGTGCAGGCATACATGCAGGCAGAACATTGTATACATAATAAACAATAAATCCTTAAAAAAAAAAAAAAAGAACATGAGGCCAGCATGGTGGTGCACAGCCTTAATCCCTGCACTGGATCAATCCCTGTGAGTTCGAGGCCAGCCTGGTCTATATAACAGGCAGTGAGACCTGTCTCTGAAACAAAAAACATGAGTGTAGAATTTTAGCTCTTAAACTTGGGTATGGTGACACACACCTCTCCAGTGAGCACCTGGGAGGTGGTAACAGAAAGGTCAGGAGTTCAAAGCCAGCTTATACCAACATGAGACTCTGTCTCAAATTTTTTTTATTTTAATTTTTGTTAATAGCCACATTTAAAAAGTGAAAGGGAACAAATGAGAATAATTTTTGGTACTGTTTTATTAATGTATACAAAATATTGTTCCAACCAGTGATTATCATAAAAATTAGTAATATGCTATTTTACATTCTCACAGTAAGTCTGCTGTGTGTCCCACTCACACCACCTCACAGT

SEQ ID NO:37

Site-F-3′arm

CTCAGTGACCGTGGGTGGGTGGTGGTGACTGAAGTCAACAGCATAGGTTTAGACAATAGAGGGGACTTTAAAAAGAAGTGACTGTGGCTGAAGAAGAGGGGTGGGCCAAGGGGGGCAGTGGGAGGGGCTACCTCCGACCTGTCTTTTGATTTCAGTCCGGCTTTGATGAGGATGAGATGGAGGACGCTGGGGACCCAGGTGAGAGTCCTGACTTTTGTTCTTGCTCCATCTCTCCACCCATCCCTGTCCCCACATTCTTACCTGGACCATTTCTGCTGTTTCCAGACGGGACCCACCTCATTTCTGGGGACAGGGAGGCTCAGGAGCAGGGAAGAACTGATATCAAAGTGTCTGGACCTCAGAAGAAAGCAATCGCCACCTTGAAGGTGACAAGGTGTTGGGGAGAAGGGTGCCCCTTGGATTTGGGGAACAGAGTTGTCACTGAGACCCCTCACCTTTCAGATCTACAACAGCTCCCTAGAGGAGGAGTTTAACCACTTTGAGGACTGGCTGAATGTGTTCCCCCTGTACAGAGGGCAAGGCGGCCAGGCTGGAGATGGCGAGGAAGGTTCTGGACACTTGGTGGGCAAATTCAAGGTATACTTGGGGGAAGAATGGGAGACTGACAAGGGACAAGCTTTCATACAGGCTGAGAGGTGGCTCAGCAGTTAACACTGGCTGCT

SEQ ID NO:38

在pUC57载体上整合包含Fer1L4基因同源臂的外源核苷酸序列，得到供体质粒2。质粒构成参考图1。

2、定点整合

将上述三种质粒(Cas9质粒，SgRNA质粒，供体质粒1或2)按1:1:1混合后，直接电转CHO细胞。电转3天后，添加400μg/mL G418到细胞培养液内，并维持直到细胞活率恢复到90％以上后，从培养基内撤去G418。通过流式分选(BD，FACSAria Fusion)，在488nm激光及405nm激光下，以CHO野生细胞作为阴性对照，圈出绿色及蓝色荧光信号的十字门槛(crossgate)。分选出仅含有绿色荧光且不带蓝色荧光的细胞，并将其单克隆化，得到定点整合了绿色荧光蛋白的定点标记细胞株5-92(荧光蛋白定点整合在Nfat5基因的细胞株)和F-9(荧光蛋白定点整合在Fer1L4基因细胞株)。

实施例2:抗体轻重链基因定点整合细胞的构建

通过重组酶介导的盒式交换(Recombinase Mediated Cassette Exchange，RMCE)，可以将抗体轻重链基因置换实施例1得到的标记细胞中的绿色荧光蛋白，构建得到抗体表达细胞株。RMCE定点整合技术构建抗体表达细胞株的过程中，需要将带有抗体轻重链基因的质粒和Cre酶质粒共同转染CHO细胞。抗体轻重链基因的上下游含有loxp和lox2272元件，在标记细胞株的绿色荧光(ZsGreen1)及抗性基因(NeoR)前后同样含有loxp和lox 2272元件。Cre酶的存在，会介导标记细胞株的基因组及带有抗体轻重链基因的质粒在loxp和lox2272元件处发生同源重组，从而将定点标记细胞株基因组中的绿色荧光(ZsGreen1)及抗性基因(NeoR)置换为抗体轻重链基因，得到无绿色荧光的抗体表达细胞。盒式交换构建蛋白定点整合细胞株的原理见图2。

通过流式分选、PCR鉴定，可以方便快速地获得抗体轻重链基因定点整合细胞株，无需大量筛选工作。

1、抗体轻重链基因表达盒载体构建

合成可用于定点整合到Nfat5位点或Fer1L4位点上的单克隆抗体(mAbA和mAbB)轻重链基因表达盒(gene cassette)，其结构为：

-loxp-CMV-LC-bGHpolyA-CMV-HC-lox2272-，

相关元件序列如下：

CMV序列启动子：

TGAGGCGCGCCTACTGAGTCATTAGGGACTTTCCAATGGGTTTTGCCCAGTACATAAGGTCAATAGGGGTGAATCAACAGGAAAGTCCCATTGGAGCCAAGTACACTGAGTCAATAGGGACTTTCCATTGGGTTTTGCCCAGTACAAAAGGTCAATAGGGGGTGAGTCAATGGGTTTTTCCCATTATTGGCACGTACATAAGGTCAATAGGGGTGAGTCATTGGGTTTTTCCAGCCAATTTAATTAAAACGCCATGTACTTTCCCACCATTGACGTCAATGGGCTATTGAAACTAATGCAACGTGACCTTTAAACGGTACTTTCCCATAGCTGATTAATGGGAAAGTACCGTTCTCGAGCCAATACACGTCAATGGGAAGTGAAAGGGCAGCCAAAACGTAACACCGCCCCGGTTTTCCCCTGGAAATTCCATATTGGCACGCATTCTATTGGCTGAGCTGCGTTCTACGTGGGTATAAGAGGCGCGACCAGCGTCGGTACCGTCGCAGTCTTCGGTCTGACCACCGTAGAACGCAGCCTCAGGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACCCCCTTGGCTTCTTATGCATGCTATACTGTTTTTGGCTTGGGGTCTATACACCCCCGCTTCCTCATGTTATAGGTGATGGTATAGCTTAGCCTATAGGTGTGGGTTATTGACCATTATTGACCACTCCCCTATTGGTGACGATACTTTCCATTACTAATCCATAACATGGCTCTTTGCCACAACTCTCTTTATTGGCTATATGCCAATACACTGTCCTTCAGAGACTGACACGGACTCTGTATTTTTACAGGATGGGGTCTCATTTATTATTTACAAATTCACATATACAACACCACCGTCCCCAGTGCCCGCAGTTTTTATTAAACATAACGTGGGATCTCCACGCGAATCTCGGGTACGTGTTCCGGACATGGGCTCTTCTCCGGTAGCGGCGGAGCTTCTACATCCGAGCCCTGCTCCCATGCCTCCAGCGACTCATGGTCGCTCGGCAGCTCCTTGCTCCTAACAGTGGAGGCCAGACTTAGGCACAGCACGATGCCCACCACCACCAGTGTGCCGCACAAGGCCGTGGCGGTAGGGTATGTGTCTGAAAATGAGCTCGGGGAGCGGGCTTGCACCGCTGACGCATTTGGAAGACTTAAGGCAGCGGCAGAAGAAGATGCAGGCAGCTGAGTTGTTGTGTTCTGATAAGAGTCAGAGGTAACTCCCGTTGCGGTGCTGTTAACGGTGGAGGGCAGTGTAGTCTGAGCAGTACTCGTTGCTGCCGCGCGCGCCACCAGACATAATAGCTGACAGACTAACAGACTGTTCCTTTCCATGGGTCTTTTCTGCAGTCACCGTCCTTGACACG

SEQ ID NO:39

mAbA-LC DNA序列:

ATGTCCGTGCCTACCCAGGTGCTGGGACTGCTGCTGCTGTGGCTGACCGATGCCAGATGCGAGATCGTGCTGACCCAGTCCCCCGACTTCCAGTCCGTGACCCCCAAAGAAAAAGTGACAATTACCTGCTCCGCCTCCTCCTCCGTGAACTACATGCACTGGTTCCAGCAGAAGCCCGACCAGTCCCCTAAGCTGTGGATCTACCGGACCTCCAACCTGGCCTCTGGCGTGCCCTCTAGATTCTCCGGCTCTGGCTCTGGCACCGACTACACCCTGACCATCAACTCCCTGGAAGCCGAGGACGCCGCCACCTACTACTGCCAGCAGCGGTCCTCTTACCCCTGGACCTTTGGCCAGGGCACCAAGCTGGAAATCAAGCGGACCGTGGCCGCTCCCTCCGTGTTCATCTTCCCACCTTCCGACGAGCAGCTGAAGTCCGGCACCGCTTCTGTCGTGTGCCTGCTGAACAACTTCTACCCCCGCGAGGCCAAGGTGCAGTGGAAGGTGGACAACGCCCTGCAGTCCGGCAACTCCCAGGAATCCGTGACCGAGCAGGACTCCAAGGACAGCACCTACTCCCTGTCCTCTACCCTGACCCTGTCCAAGGCCGACTACGAGAAGCACAAGGTGTACGCCTGCGAAGTGACCCACCAGGGCCTGTCTAGCCCCGTGACCAAGTCTTTCAACCGGGGCGAGTGCTGA

SEQ ID NO:40

mAbA-HC DNA序列:

ATGGAATGGTCCTGGGTGTTCCTGTTCTTCCTGTCCGTGACCACCGGCGTGCACTCCGAAGTGCAGCTGGTGCAGTCTGGCGCCGAAGTGAAGAAACCTGGCGCCTCCGTGAAGGTGTCCTGCAAGGCTTCCGGCTACACCTTTACCGACTACGAGGTGCACTGGGTGCGACAGGCTCCAGGCCAGGGACTGGAATGGATGGGCGTGATCGATCCTGGCACCGGCGGAGTGGCCTACAACCAGAAATTCGAGGGCAGAGTGACCATGACCGCCGACACCTCTACCTCCACCGCCTACATGGAACTGCGGTCCCTGAGATCCGACGACACCGCCGTGTACTACTGCACCCGGTACTCCCTGTTCTACGGCTCCTCCCCCTACGCCATGGACTATTGGGGCCAGGGCACCCTCGTGACCGTGTCCTCTGCTTCTACCAAGGGCCCCTCCGTGTTCCCTCTGGCCCCTTCCAGCAAGTCTACCTCTGGCGGCACAGCCGCTCTGGGCTGCCTCGTGAAGGACTACTTCCCCGAGCCCGTGACAGTGTCTTGGAACTCTGGCGCCCTGACATCTGGCGTGCACACCTTCCCTGCTGTGCTGCAGTCTAGCGGCCTGTACAGCCTGTCCTCCGTCGTGACTGTGCCCTCCAGCTCTCTGGGCACCCAGACCTACATCTGCAACGTGAACCACAAGCCCTCCAACACCAAGGTGGACAAGAAGGTGGAACCCAAGTCCTGCGACAAGACCCACACCTGTCCCCCTTGTCCTGCCCCTGAACTGCTGGGCGGACCCTCTGTGTTTCTGTTCCCCCCAAAGCCCAAGGACACCCTGATGATCTCCCGGACCCCCGAAGTGACCTGCGTGGTGGTGGATGTGTCCCACGAGGACCCTGAAGTGAAGTTCAATTGGTACGTGGACGGCGTGGAAGTGCACAACGCCAAGACCAAGCCTAGAGAGGAACAGTACAACTCCACCTACCGGGTGGTGTCCGTGCTGACCGTGCTGCACCAGGATTGGCTGAACGGCAAAGAGTACAAGTGCAAGGTGTCCAACAAGGCCCTGCCTGCCCCCATCGAAAAGACCATCTCCAAGGCCAAGGGCCAGCCCCGGGAACCCCAGGTGTACACACTGCCCCCTAGCCGGGAAGAGATGACCAAGAACCAGGTGTCCCTGACCTGTCTCGTGAAAGGCTTCTACCCCTCCGATATCGCCGTGGAATGGGAGTCCAACGGCCAGCCTGAGAACAACTACAAGACCACCCCCCCTGTGCTGGACTCCGACGGCTCATTCTTTCTGTACTCCAAGCTGACAGTGGACAAGTCCCGGTGGCAGCAGGGCAACGTGTTCTCCTGCAGCGTGATGCACGAGGCCCTGCACAACCACTACACCCAGAAGTCCCTGTCCCTGAGCCCCGGCAAATGA

SEQ ID NO:41

mAbB-LC DNA序列：

ATGTCTGTGCCTACACAGGTTCTGGGACTGCTGCTGCTGTGGCTGACAGACGCCAGATGCGACATCGTGATGACACAGAGCCCTAGCAGCCTGGCTGTGTCTGTGGGAGAGAGAGTGACCATCAGCTGCAAGAGCAGCCAGAGCCTGCTGTACTCCACCAACCAGAAGAACTACCTGGCCTGGTATCAGCAGAAGCCCGGCCAGTCTCCTAAGCTGCTGATCTACTGGGCCAGCACCAGAGAAAGCGGCGTGCCAGATAGATTCAGCGGCAGCGGCTCTGGAACCGACTTCACCCTGACAATCAGCTCCCTGCAGGCCGAGGATGTGGCCGTGTACTACTGCCAGCAGTACTACAGCTACCTGAGAACCTTCGGCGGAGGCACCAAGCTGGAAATCAAGAGAACAGTGGCCGCTCCTAGCGTGTTCATCTTCCCACCATCTGACGAGCAGCTGAAGTCTGGCACAGCCAGCGTTGTGTGCCTGCTGAACAACTTCTACCCCAGAGAAGCCAAGGTGCAGTGGAAGGTGGACAACGCTCTGCAGTCCGGCAACAGCCAAGAGAGCGTGACAGAGCAGGACAGCAAGGACTCCACCTACAGCCTGAGCAGCACACTGACACTGAGCAAGGCCGACTACGAAAAGCACAAGGTGTACGCCTGCGAAGTGACCCACCAGGGACTGTCTAGCCCTGTGACCAAGAGCTTCAACAGAGGCGAGTGCTGA

SEQ ID NO:62

mAbB-HC DNA序列：

ATGGAATGGTCCTGGGTGTTCCTGTTCTTCCTGAGCGTGACCACAGGCGTGCACTCTGAGGTGCAGCTGGTTGAATCTGGCGGAGGACTGGTTCAGCCTGGCGGATCTCTGAGACTGTCTTGTGCCGCCAGCGGCTTCACCTTCAGCAGCTACGCTATGAGCTGGGTCCGACAGGCTCCTGGCAAAGGACTTGAGTGGGTCGCCTACATCAGCAGCGGCGGCAGCACATATTACCCCGACTCTGTGAAGGGCAGATTCACCATCTCCAGAGACAACGCCAAGAACAGCCTGTACCTGCAGATGAACTCCCTGAGAGCCGAGGACACCGCCGTGTACTACTGTGCCAGAGAAGGCTACGGCACCTACGGCGATTATTGGGGCCAGGGCACAACCCTGACAGTGTCTAGCGCTTCCACAAAGGGCCCCAGCGTTTTCCCACTGGCTCCTAGCAGCAAGAGCACAAGCGGAGGAACAGCTGCTCTGGGCTGTCTGGTCAAGGACTACTTCCCTGAGCCTGTGACCGTGTCCTGGAACTCTGGCGCTCTGACTTCTGGCGTGCACACATTCCCTGCCGTGCTGCAATCTAGCGGCCTGTACTCTCTGAGCAGCGTGGTCACAGTGCCAAGCTCTAGCCTGGGCACCCAGACCTACATCTGCAATGTGAACCACAAGCCTAGCAACACCAAGGTGGACAAGAAGGTGGAACCCAAGAGCTGCGACAAGACCCACACCTGTCCTCCATGTCCTGCTCCAGAACTGCTCGGCGGACCTTCCGTGTTTCTGTTCCCTCCAAAGCCTAAGGACACCCTGATGATCAGCAGAACCCCTGAAGTGACCTGCGTGGTGGTGGATGTGTCTCACGAGGACCCCGAAGTGAAGTTCAATTGGTACGTGGACGGCGTGGAAGTGCACAACGCTAAGACCAAGCCTAGAGAGGAACAGTACAACAGCACCTATAGAGTGGTGTCCGTGCTGACAGTGCTGCACCAGGATTGGCTGAACGGCAAAGAGTACAAGTGCAAGGTGTCCAACAAGGCCCTGCCTGCTCCTATCGAAAAGACCATCAGCAAGGCCAAGGGCCAGCCTAGGGAACCCCAGGTTTACACACTGCCACCAAGCAGGGACGAGCTGACCAAGAATCAGGTGTCCCTGACCTGCCTCGTGAAGGGCTTCTACCCTTCCGATATCGCCGTGGAATGGGAGAGCAACGGCCAGCCTGAGAACAACTACAAGACAACCCCTCCTGTGCTGGACAGCGACGGCTCATTCTTCCTGTACAGCAAGCTGACCGTGGACAAGTCCAGATGGCAGCAGGGCAACGTGTTCAGCTGCAGCGTGATGCACGAGGCCCTGCACAACCACTACACCCAGAAGTCCCTGTCTCTGAGCCCCGGCAAATGA

SEQ ID NO:63

合成可用于定点整合到Nfat5位点或Fer1L4位点上的双抗(BsAb)轻重链基因表达盒(gene cassette)，其结构为：-loxp-CMV-LC1-bGHpolyA-CMV-HC1-bGHpolyA-CMV-LC2-bGHpolyA-CMV-HC2-lox2272-，相关元件序列如下：

BsAb-LC1 DNA序列：

ATGGTCCTGGGTGTTCCTGTTCTTCCTGTCTCTGACCGGGGTGCACGCCGACATCCAGATGACACAGTCCCCATCTTCTCTGTCCGCCTCTGTGGGCGACAGAGTGACCATCACCTGTAGAGCCAGCCAGGACATCTCCAACTACCTGAACTGGTATCAGCAGAAGCCCGACGGCACCATCAAGCTGCTGATCTACTACACCTCCAGACTGCACTCTGGCGTGCCCTCCAGATTTTCTGGCTCTGGATCTGGCACCGACTACACCTTCACCATCTCTAGCCTGCAGCCTGAGGATATCGCCACCTACTACTGCCAGCAGGGCAATACCCTGCCTTGGACCTTTGGCGGCGGAACAAAGGTGGAAATCAAAGGCGGCGGAGGAAGCTCTGGCGCCCCTAGATTTCTGACCAGACCTAAGGCTTCCGTGGTGTCCGTGGGCAAAGACGCTACCCTGTCTTGTCAGATCGTGGGCAACCCATTTCCTCAGGTGTCCTGGGAGAAAGACAAGCAGCCTGTGACAGCCGGCGTGCGGTTTAGATTGGCTCAGGATGGCGACCTGTACCGGCTGAAGATCCTCGACCTGCAGCTGTCTGATTCCGGCCAGTACGTGTGCAGAGCTAGAAATGCCCACGGCGAGGCTTTTGCTTGTCTGGGACTGCAAGTGGATGCCGAGGCTTGA

SEQ ID NO:64

BsAb-HC1 DNA序列：

ATGGAATGGTCCTGGGTGTTCCTGTTCTTCCTGTCTCTGACTGGGGTGCACGCTGAAGTGCAGTTGGTTCAGAGCGGAGCCGAAGTGAAGAAACCTGGCGCTTCTGTGAAGGTGTCCTGCAAGGCTTCTGGCTACACCCTGACCAGCTACTGGATCACCTGGGTCCGACAAGCTCCTGGACAGGGACTTGAGTGGATGGGCGATATCTATCCTGGCAGCGGCCGGACCAACTACAACGAGATGTTCAAGAACAGAGTGACCATGACCGTGGACACCTCCACCAGCACCGCTTACATGGAACTGTCCAGCCTGAGATCTGAGGACACCGCCGTGTACTACTGCGCTAGAAGGCACTATGGCACCGGCTACGAGTCTTTCGATGTGTGGGGACAGGGCACCACCGTGACAGTTTCTAGCGGAGGCGGAGGATCTGGCATCCCTCCTAAGATCGAGTGCCTGCCTATCGACATCTCCATCGACGAAGGCAAGGTGCTGACCGTGGCTTCTGCTTTTACTGGCGAGCCCACACCTGAAGTGACCTGGTCTACCGGCGGCAGAAAGATCCACTCTCAAGAGCAGGGCAGATTCCACATCGAGAACACCGACGACTCCACCACACTGACCATCAAGGACGTGCAGAAACAGGACGGCGGCCTGTACACTCTGACCCTGAGAAACGAGTTCGGCTCTGACTCCGCCACCGTGAACATCCACATCCGGTCCATCGACAAGACCCACACATGCCCTCCATGTCCTGCTCCAGAAGCTGCTGGCGGACCCTCTGTGTTTCTGTTCCCTCCAAAGCCTAAGGACACCCTGATGATCTCTCGGACTCCCGAAGTGACATGCGTGGTGGTGGATGTGTCTCATGAGGACCCAGAAGTGAAGTTCAATTGGTACGTGGACGGCGTGGAAGTGCACAACGCCAAGACCAAGCCTAGAGAGGAACAGTACAACTCCACCTACAGAGTGGTGTCCGTGCTGACAGTGCTGCACCAGGATTGGCTGAACGGCAAAGAGTACAAGTGCAAGGTGTCCAACAAGGCCCTGCCTGCTCCTATCGAAAAGACCATCTCCAAGGCTAAGGGCCAGCCTCGGGAACCTCAGGTTTACACACTGCCTCCATGCCGGGACGAGCTGACCAAAAATCAGGTGTCCCTGTGGTGCCTGGTCAAGGGCTTCTACCCTTCCGATATCGCCGTGGAATGGGAGTCTAACGGCCAGCCAGAGAACAACTACAAGACCACACCTCCTGTGCTGGACTCCGACGGCTCATTCTTTCTGTACTCCAAGCTGACTGTGGACAAGTCCAGATGGCAGCAGGGCAACGTGTTCTCCTGCTCTGTGATGCACGAGGCCCTGCACAACCACTACACACAGAAATCCCTGAGCCTGTCTCCTGGCAAATGA

SEQ ID NO:65

BsAb-LC2 DNA序列：

ATGGTCCTGGGTGTTCCTGTTCTTCCTGTCTCTGACCGGGGTGCACGCCGATATCCAGCTGACACAGTCCCCATCTTCTCTGTCTGCCTCTGTGGGCGACAGAGTGACCATCACCTGTAGAGCCAGCCAGGACATCTCTAGCGCCCTCGTGTGGTATCAGCAGAAGCCTGGAAAGGCCCCTAAGCTGCTGATCTACGACGCCTCCTCTCTGGAATCTGGCGTGCCATCCAGATTCTCCGGCTCTGAGTCTGGCACCGACTTCACCCTGACAATCTCTAGCCTGCAGCCTGAGGACTTCGCCACCTACTACTGCCAGCAGTTCAACAGCTACCCTCTGACCTTTGGCGGAGGCACCAAGGTGGAAATCAAGAGAACCGTGGCCGCTCCTTCCGTGTTCATCTTCCCACCATCTGACGAGCAGCTGAAGTCCGGCACAGCTTCTGTCGTGTGCCTGCTGAACAACTTCTACCCTCGGGAAGCCAAGGTGCAGTGGAAGGTGGACAATGCCCTGCAGTCCGGCAACTCCCAAGAGTCTGTGACCGAGCAGGACTCCAAGGACTCTACCTACAGCCTGTCCTCCACACTGACCCTGTCTAAGGCCGACTACGAGAAGCACAAGGTGTACGCCTGTGAAGTGACCCACCAGGGACTGTCTAGCCCCGTGACCAAGTCTTTCAACAGAGGCGAGTGCTGA

SEQ ID NO:66

BsAb-HC2 DNA序列：

ATGGTCCTGGGTGTTCCTGTTCTTCCTGTCTCTGACTGGGGTGCACGCTCAGGTGCAGTTGGTTGAATCTGGTGGCGGAGTGGTGCAGCCTGGCAGATCTCTGAGACTGTCTTGTGCCGCCTCCGGCTTCACCTTCTCTACCTATGGCATGCACTGGGTCCGACAGGCCCCTGGAAAAGGACTGGAATGGGTTGCCGTGATCTGGGACGACGGCTCCTACAAGTACTACGGCGACTCCGTGAAGGGCAGATTCACCATCTCTCGGGACAACTCCAAGAACACCCTGTACCTGCAGATGAACTCCCTGAGAGCCGAGGACACCGCCGTGTACTATTGTGCCAGAGATGGCATCACCATGGTCCGAGGCGTGATGAAGGACTACTTCGATTATTGGGGCCAGGGCACCCTGGTCACCGTGTCCTCTGCTTCTACAAAGGGCCCCTCTGTGTTCCCTCTGGCTCCTTCCTCTAAATCCACCTCTGGCGGAACCGCTGCTCTGGGCTGTCTGGTCAAGGATTACTTCCCTGAGCCTGTGACCGTGTCTTGGAACTCTGGTGCTCTGACATCCGGCGTGCACACCTTTCCAGCTGTGCTGCAGTCCTCTGGCCTGTACTCTCTGTCCTCTGTCGTGACCGTGCCTTCTAGCTCTCTGGGCACCCAGACCTACATCTGCAACGTGAACCACAAGCCTTCCAACACCAAGGTGGACAAGAAGGTGGAACCCAAGTCCTGCGACAAGACCCACACCTGTCCTCCATGTCCTGCTCCAGAAGCTGCTGGCGGACCCTCCGTTTTCCTGTTTCCACCTAAGCCTAAGGACACCCTGATGATCTCTCGGACCCCTGAAGTGACCTGCGTGGTGGTGGATGTGTCTCACGAGGATCCCGAAGTGAAGTTCAATTGGTACGTGGACGGCGTGGAAGTGCACAACGCCAAGACCAAGCCTAGAGAGGAACAGTACAACTCCACCTACAGAGTGGTGTCCGTGCTGACCGTGCTGCACCAGGATTGGCTGAACGGCAAAGAGTACAAGTGCAAGGTGTCCAACAAGGCCCTGCCTGCTCCTATCGAAAAGACCATCTCCAAGGCTAAGGGCCAGCCTCGGGAACCTCAAGTCTGTACACTGCCTCCTAGCCGGGACGAGCTGACCAAAAATCAGGTGTCCCTGTCCTGCGCTGTGAAGGGCTTCTACCCTTCCGATATCGCCGTGGAATGGGAGTCCAATGGCCAGCCTGAGAACAACTACAAGACAACCCCTCCTGTGCTGGACTCCGACGGCTCATTCTTCCTGGTGTCCAAGCTGACAGTGGACAAGTCCAGATGGCAGCAGGGCAACGTGTTCTCCTGCTCTGTGATGCACGAGGCCCTGCACAACCACTACACCCAGAAGAGTCTGTCTCTGTCCCCTGGCAAATGA

SEQ ID NO:67

再将该基因表达盒分别整合到pUC57载体上，构成包含目标蛋白基因的表达盒质粒，质粒结构见图2。

2、抗体定点整合细胞株的构建

将包含目标蛋白mAbA轻重链基因的表达盒质粒同PSF-CMV-CRE质粒(Sigma-Aldrich,OGS591)按3:1电转定点标记细胞株5-92和F-9。一周后，对细胞进行流式分选(BD,FACSMelody^TM)，在488nm激光下，利用BD FACS Chorus软件，选择绿色荧光强度最弱的0.5％细胞群落范围，将该范围内的细胞分选后，得到单克隆的抗体定点整合细胞株5-mAbA-8和F-mAbA-6。其中细胞株5-mAbA-8中抗体轻重链基因定点整合在Nfat5基因上，细胞株F-mAbA-6中抗体轻重链基因定点整合在Fer1L4基因上。利用相同方法分别构建了将单克隆抗体mAbB基因定点整合于Nfat5基因上的单克隆抗体表达细胞株5-mAbB-9，和将双特异性抗体BsAb基因定点整合于Nfat5基因上的双特异性抗体表达细胞株5-BsAb-1。

测试例

测试例1、标记细胞株定点整合的PCR鉴定

参考现有技术(JaeSeongLee，SciRep.2015；5:8572.)验证目的序列是否已被插入到靶点处。

将实施例1得到的定点标记细胞株5-92和F-9单克隆细胞进行扩大培养后，用DNA提取试剂盒(天根，DP304)抽提出细胞基因组DNA，作为模板用于接头PCR鉴定和全长PCR检测。

1)接头PCR

根据PCR预混液(ThermoFisher，14001013)说明书要求，将其与DNA模板、引物及ddH₂O混合后，在PCR仪(ThermoFisher,4484075)上进行5′接头PCR(5′junctionPCR)及3′接头PCR(3′junction PCR)，以验证目的序列是否已被插入到靶点处。扩增范围示意见图3。

A、用5′接头PCR鉴定定点标记细胞株5-92和F-9是否在5′端插入

细胞株5-92的5′接头PCR的引物：

Ssi-5fwd-1:5′-ACACAGGAGATCTACGCCTCT-3′

SEQ ID NO:42

EF1αrev:5′-AGTAATTCAAGGCACGCAAGGG-3′

SEQ ID NO:43

细胞株F-9的5′接头PCR的引物：

Ssi-F fwd:5′-AGTACTTCTGCCTCCCAACA-3′

SEQ ID NO:44

EF1αrev:5′-AGTAATTCAAGGCACGCAAGGG-3′

SEQ ID NO:43

B、用3′接头PCR鉴定定点标记细胞株5-92和F-9是否在3′端插入

细胞株5-92的3′接头PCR的引物：

NeoR fwd:5′-ATGGTGGAAAATGGCCGCTT-3′

SEQ ID NO:45

Ssi-5rev-1:5′-AGGAGGCAGAGTCAGGTGAAT-3′

SEQ ID NO:46

细胞株F-9的3′接头PCR的引物：

NeoR fwd:5′-ATGGTGGAAAATGGCCGCTT-3′

SEQ ID NO:45

Ssi-F rev:5′-CCTGAAACTGGAGTTAGGGAT-3′

SEQ ID NO:47

2)全长PCR

根据PCR预混液(ThermoFisher，12369010)说明书要求，将其与DNA模板、引物及ddH₂O混合后，在PCR仪(ThermoFisher,4484075)上进行插入片段的全长PCR(扩增范围示意见图3)，以验证插入序列是否以单倍体形式整合到靶点。

细胞株5-92的全长扩增PCR的引物：

SSI-5fwd-2:5′-ACTGCAGTCCAAGTAGGTGAG-3′

SEQ ID NO:48

SSI-5rev-2:5′-ACTAGGGAAATGGCTCCATGG-3′

SEQ ID NO:49

细胞株F-9的全长扩增PCR的引物：

Ssi-F fwd:5′-AGTACTTCTGCCTCCCAACA-3′

SEQ ID NO:44

Ssi-F rev:5′-CCTGAAACTGGAGTTAGGGAT-3′

SEQ ID NO:47

3)PCR检测定点整合结果

根据接头PCR结果，在Site-5及对照Site-F处，因5′接头PCR及3′接头PCR结果均出现了预想条带(～1kb或～0.75kb)，故证明目的基因片段被插入到对应靶点，并获得了5-92及F-9两株定点整合单克隆细胞。结果见图4A。

另外全长PCR结果显示，在～5kb及～2kb处均有条带，证明了均仅有一条等位基因上插入了目的基因序列。结果见图4B。

测试例2、标记细胞株的插入序列测序鉴定

将测试例1中得到的全长PCR产物片段(5kb)切胶纯化后(天根，DP209)，利用Ultra^TMDNA Library Prep Kit for/>文库构建试剂盒说明书要求，构建文库(NEB，E7370L)并进行二代测序(Illumina,novaseq 6000)，测序数据总量为1G，以验证插入到靶点上的外源核苷酸序列是否准确。

以ZsGreen1及NeoR基因表达盒为参考序列，比对二代测序结果，显示出参考序列均有很高的测序深度(～250000X)，表明目的序列被完整准确地整合到了靶点处。两株荧光标记细胞株5-92及F-9靶点插入序列二代测序结果见图5。

测试例3、定点标记细胞株荧光蛋白Zsgreen1基因拷贝数鉴定

将实施例1得到的细胞株5-92提取DNA后，与引物、探针、ddPCR Supermix forProbes(Bio-Rad,1863024)及ddH₂O混匀，在PCR仪(Bio-Rad,T100)上进行微滴式数字PCR(Digital droplet PCR，ddPCR)，以检测外源核苷酸序列的绝对拷贝数。其中以ZsGreen1作为目的基因，COSMC作为内参基因(其制备参考ACS Synth.Biol.2019,8,758-774)。

ddPCR所需要的探针及引物如下：

ZsGreen1-probe:5′-CCGTGAGCGTGGAGGAGAACTGCATGT-3′5'-FAM

3'-MGB(探针在5′及3′上分别做了FAM荧光基团和MGB淬灭基团的修饰)

SEQ ID NO:50

ZsGreen1-fwd:5′-CATCTGCAACGCCGACATCA-3′

SEQ ID NO:51

ZsGreen1-rev:5′-GCTCCCAGTTGTCGGTCATC-3′

SEQ ID NO:52

COSMC-probe:5′-AGTGACAGCCATATTGGAACAGCATCC-3′5'-VIC 3'-MGB

(探针在5′及3′上分别做了VIC荧光基团和MGB淬灭基团的修饰)

SEQ ID NO:53

COSMC-fwd:5′-ACCCGAACCAGGTAGTAGAA-3′

SEQ ID NO:54

COSMC-rev:5′-ACATGTCCAAAGGCCCTAAG-3′

SEQ ID NO:55

用ddPCR鉴定出单拷贝定点整合的单克隆细胞，进行9周连续传代(约60代)后，评估定点整合细胞株传代稳定性。

细胞株经9周传代，ZsGreen1基因拷贝数在传代前(W0)及9周连续传代(W 9)均稳定维持在单拷贝水平。

表2：荧光标记细胞株5-92在不同传代下目的基因Zsgreen1基因拷贝数

细胞株	Copy#(W0)	Copy#(W9)
			5-92	1.09	1.01

测试例4、定点标记细胞株绿色荧光表达检测

将荧光定点标记细胞株每隔2-3天，按5E5细胞/mL接种到总体积为20mL的含8mM谷氨酰胺的CD CHO培养基(Lot:10743029，Gibco^TM)中，于新的125mL摇瓶中进行振摇培养，培养条件为36.5℃，6.0％CO₂，120rpm，80％相对湿度。传代过程中通过流式细胞仪(Beckman,Cytoflex)以CHO野生细胞作为对照，在CytExpert软件分析传代前(W0)与传代9周(W9)的荧光定点细胞株的绿色荧光信号强度。

表3：5-92在不同传代下目的基因Zsgreen1平均荧光强度情况对比

样品名	平均荧光强度(W0)	平均荧光强度(W9)
			5-92	54342.3	63008

结论：5-92经9周传代后，其第9周(W9)荧光强度与传代前(W0)相比，能维持一致水平，证实本细胞株能稳定传代。

测试例5、抗体定点整合细胞株的PCR鉴定

将实施例2得到的单克隆抗体定点整合细胞5-mAbA-8、F-mAbA-6、5-mAbB-9和5-BsAb-1进行扩大培养，用DNA提取试剂盒(天根，DP304)抽提出细胞基因组DNA作为模板，用于接头PCR和全长PCR的检测。

1)接头PCR

根据PCR预混液(ThermoFisher，14001013)说明书要求，将其与DNA模板、引物及ddH₂O混合后，在PCR仪(ThermoFisher,4484075)上进行接头PCR(5′接头PCR及3′接头PCR)，以验证目的序列是否已被插入到靶点处。抗体定点整合细胞接头PCR扩增范围示意见图6。

A、用接头PCR鉴定抗体定点整合细胞株5-mAbA-8、F-mAbA-6、5-mAbB-9和5-BsAb-1的抗体轻重链基因表达盒是否在5′端插入：

5-mAbA-8细胞株5′接头PCR的引物

Ssi-5fwd-1:5′-ACACAGGAGATCTACGCCTCT-3′

SEQ ID NO:42

mAbA-Left-Rev:5′-GAGTTGATGGTCAGGGTGTAG-3′

SEQ ID NO:56

F-mAbA-6细胞株5′接头PCR的引物

Ssi-F fwd:5′-AGTACTTCTGCCTCCCAACA-3′

SEQ ID NO:44

mAbA-Left-Rev:5′-GAGTTGATGGTCAGGGTGTAG-3′

SEQ ID NO:56

5-mAbB-9细胞株5′接头PCR的引物

Ssi-5fwd-1:5′-ACACAGGAGATCTACGCCTCT-3′

SEQ ID NO:42

mAbB-Left-Rev:5′-CTGTGTCATCACGATGTCGCAT-3′

SEQ ID NO:68

5-BsAb-1细胞株5′接头PCR的引物

Ssi-5fwd-1:5′-ACACAGGAGATCTACGCCTCT-3′

SEQ ID NO:42

BsAb-Left-Rev：5′-AGATCAGCAGCTTGATGGTGC-3′

SEQ ID NO:69结果见图7A、D。

B、用接头PCR鉴定抗体定点整合细胞株5-mAbA-8、F-mAbA-6、5-mAbB-9和5-BsAb-1的抗体轻重链基因表达盒是否在3′端插入：

5-mAbA-8细胞株3′接头PCR的引物

mAbA-Right-Fwd:5′-CCCATCGAAAAGACCATCTCC-3′

SEQ ID NO:57

Ssi-5rev-1:5′-AGGAGGCAGAGTCAGGTGAAT-3′

SEQ ID NO:58

F-mAbA-6细胞株3′接头PCR的引物

mAbA-Right-Fwd:5′-CCCATCGAAAAGACCATCTCC-3′

SEQ ID NO:57

Ssi-F rev:5′-CCTGAAACTGGAGTTAGGGAT-3′

SEQ ID NO:47

5-mAbB-9细胞株3′接头PCR的引物

mAbB-Right-Fwd:5′-GACCGTGGACAAGTCCAGAT-3′

SEQ ID NO:70

Ssi-5rev-1:5′-AGGAGGCAGAGTCAGGTGAAT-3′

SEQ ID NO:58

5-BsAb-1细胞株3′接头PCR的引物

BsAb-Right-Fwd:5′-CAATGGCCAGCCTGAGAACAA-3′

SEQ ID NO:71

Ssi-5rev-1:5′-AGGAGGCAGAGTCAGGTGAAT-3′

SEQ ID NO:58

结果见图7B、E。

2)全长PCR

根据PCR预混液(ThermoFisher，12369010)说明书要求，将其与DNA模板、引物及ddH₂O混合后，在PCR仪(ThermoFisher,4484075)上进行全长PCR，以验证插入序列是否为单倍体形式整合到靶点。全长PCR扩增范围示意见图6。细胞株5-mAbA-8的全长扩增PCR的引物：

SSI-5fwd-2:5′-ACTGCAGTCCAAGTAGGTGAG-3′

SEQ ID NO:48

SSI-5rev-2:5′-ACTAGGGAAATGGCTCCATGG-3′

SEQ ID NO:49

细胞株5-mAbB-9和5-BsAb-1的全长扩增PCR的引物：

SSI-5fwd-3:5′-TGGACTGCCCTGGAACTCTCTCCATA-3′

SEQ ID NO:72

SSI-5rev-3:5′-CTGCCTCATGCACTACATGCATGCGA-3′

SEQ ID NO:73

细胞株F-mAbA-6的全长扩增PCR的引物：

Ssi-F fwd:5′-AGTACTTCTGCCTCCCAACA-3′

SEQ ID NO:44

Ssi-F rev:5′-CCTGAAACTGGAGTTAGGGAT-3′

SEQ ID NO:47

结果见图7C、7F。

3)PCR检测定点整合接头PCR结果显示，在5-mAbA-8、F-mAbA-6、5-mAbB-9和5-BsAb-1处，5′接头PCR及3′接头PCR结果均出现了预想条带(～2kb及～1kb)，故证明目的基因片段被插入到对应靶点，并获得了5-mAbA-8、F-mAbA-6、5-mAbB-9和5-BsAb-1四株抗体定点整合单克隆细胞。结果见图7A、7B、7D和7E。

另外全长PCR结果显示，细胞株F-mAbA-6在～7kb及～2kb均有条带，或细胞株5-mAbA-8在～7kb及～1kb处均有条带，5-mAbB-9在～7kb及～2kb处均有条带，5-BsAb-1在～12kb及～2kb处均有条带，证明了上述四个细胞株均仅有一条等位基因上插入了目的基因序列。结果见图7C、7F。

测试例6、抗体定点整合细胞插入序列测序鉴定

将测试例5中得到的全长PCR扩增产物片段(7kb)切胶纯化后(天根，DP209)，构建文库(NEB，E7370L)并进行二代测序(Illumina,novaseq 6000)，测序数据量为1G，以验证插入到靶点上的抗体轻重链基因序列是否准确。

以完整的轻重链基因表达盒为参考序列，比对二代测序结果，显示出轻重链基因序列均有很高的测序深度(～200000X)，表明目的序列被完整准确地整合到了靶点处。定点整合于Nfat5位点或Fer1L4位点上的抗体轻重链基因二代测序结果见图8。

测试例7、抗体定点整合细胞轻重链基因拷贝数鉴定

将实施例2得到的细胞株5-mAbA-8、5-mAbB-9和5-BsAb-1提取DNA后，与引物、探针、ddPCR Supermix for Probes(Bio-Rad,1863024)及ddH₂O混匀，在PCR仪(Bio-Rad,T100)上进行微滴式数字PCR(Digital droplet PCR，ddPCR)，以检测外源核苷酸序列的绝对拷贝数。其中分别以mAbA抗体-LC(SEQ ID NO:40)、mAbA-HC(SEQ ID NO:41)、mAbB-LC(SEQ ID NO:62)、mAbB-HC(SEQ ID NO:63)、BsAb-LC1(SEQ ID NO:64)、BsAb-HC1(SEQ IDNO:65)、BsAb-LC2(SEQ ID NO:66)和BsAb-HC2(SEQ ID NO:67)作为目的基因，COSMC作为内参基因。

ddPCR所需要的探针及引物如下：

mAbA-LC基因探针及引物：

LC-P1-6 8:5′-TTCCACTGCACCTTG-3′5′-FAM，3′-MGB

SEQ ID NO:59

LC-F1-6 8:5′-GTGTGCCTGCTGAACAACTTC-3′

SEQ ID NO:60

mAbA-LC-R1-4 6 8:5′-GGAGTTGCCGGACTGCA-3′

SEQ ID NO:61

mAbB-LC基因探针及引物包括SEQ ID NO:59,SEQ ID NO:60及下方序列SEQ IDNO:74

mAbB-LC-R5：5′-ACGCTCTCTTGGCTGTTGC-3′

SEQ ID NO:74

mAbA-HC及mAbB-HC基因引物及探针：

HC-F1-3 568：5′-ACCTGCGTGGTGGTGGAT-3′

SEQ ID NO:75

HC-R1-6 8：5′-ACTCTTTGCCGTTCAGCCA-3′

SEQ ID NO:76

HC-P1-6 8：5′-CGTACCAATTGAAC-3′5′-FAM，3′-MGBSEQ ID NO:77

BsAb四条基因(LC1,HC1,LC2,HC2)引物及探针：

LC-1-F：5′-ACAAAGGTGGAAATCAAAGGC-3′

SEQ ID NO:78

LC-1-R：5′-ATCTGACAAGACAGGGTAGCGT-3′

SEQ ID NO:79

LC-1-P：5′-CCCCTAGATTTCTGACC-3′5’FAM 3’MGB

SEQ ID NO:80

LC-2-F：5′-CTTCCGTGTTCATCTTCCCA-3′

SEQ ID NO:81

LC-2-R：5′-ATTGTCCACCTTCCACTGCA-3′

SEQ ID NO:82

LC-2-P：5′-CTTCTGTCGTGTGCCT-3′5’FAM 3’MGB

SEQ ID NO:83

HC-1-F：5′-AAGAGCAGGGCAGATTCCA-3′

SEQ ID NO:84

HC-1-R：5′-CGTTTCTCAGGGTCAGAGTGTA-3′

SEQ ID NO:85

HC-1-P：5′-ACGACTCCACCACACT-3′5’FAM 3’MGB

SEQ ID NO:86

HC-2-F：5′-CGAGGCGTGATGAAGGACTA-3′

SEQ ID NO:87

HC-2-R：5′-AGAGGTGGATTTAGAGGAAGGAG-3′

SEQ ID NO:88

HC-2-P：5′-TCACCGTGTCCTCT-3′5’FAM 3’MGB

SEQ ID NO:1

内参基因引物及探针

COSMC-probe:5′-AGTGACAGCCATATTGGAACAGCATCC-3′5'-VIC 3'-MGB

SEQ ID NO:53

COSMC-fwd:5′-ACCCGAACCAGGTAGTAGAA-3′

SEQ ID NO:54

COSMC-rev:5′-ACATGTCCAAAGGCCCTAAG-3′

SEQ ID NO:55

经过拷贝数检测，抗体轻链LC及重链HC拷贝数均为1左右。经9周传代后，LC及HC的基因拷贝数仍旧维持在1左右。

表4：定点整合单克隆细胞在W0及W9轻重链基因拷贝数

测试例8、抗体定点整合细胞表达水平检测

本测试用于检测本披露抗体定点整合细胞株的抗体表达水平。

细胞培养方法：将处于指数生长期的定点标记细胞株按5×10⁵细胞/mL接种到总体积为20mL的含8mM谷氨酰胺的CD CHO培养基(Lot:10743029，Gibco^TM)中，于125mL摇瓶中进行振摇培养，培养条件为36.5℃，6.0％CO₂，120rpm，80％相对湿度。接种培养第4、6、8、11、14天，取适量细胞样品用0.4％台盼蓝溶液染色后，通过Countstar细胞计数仪记录活细胞浓度(Viable Cell Density，VCD)和细胞活率(Viability％)。在第4、6、8、11天分别加入培养体系5％、5％、7.5％、7.5％的Efficient-Pro^TMFeed 1培养基(Lot：A5208801，Gibco^TM)；取10μL细胞悬液用990μL PBS稀释，通过生化分析仪(Biosen C-Line Glucoseand Lactate analyzer，EKF Diagnostic)，检测培养基中葡萄糖浓度。根据葡萄糖检测结果，补入适量葡萄糖，使最终葡萄糖浓度为10g/L。培养14天后取100μL细胞上清用PBS稀释5倍，通过OCTET QK分子相互作用仪确定培养基中抗体的表达量(Titer值)。

对细胞进行了9周连续传代后，再次对所有单克隆细胞按本实验方法进行培养，并检测抗体表达量及细胞生长情况。细胞生长及抗体表达情况计算方式及结果如下：

细胞单位生产率(specific productviy，Qp)计算公式：

总细胞量(Integrated viable cell density，IVCD)计算公式：

表5定点整合细胞株抗体mAbA表达量、细胞单位生产率及IVCD

结果显示，传代前(W0)抗体轻重链基因定点整合于Nfat5的单克隆细胞(5-mAbA-8)第14天产物表达水平及细胞单位生产率均显著高于定点整合于Fer1L4的单克隆细胞(F-mAbA-6)。

对定点整合于Nfat5位点的细胞5-mAbA-8、5-mAbB-9和5-BsAb-1进行了9周连续传代(W9)后，培养第14天抗体表达量与传代前(W0)相比有下降，且下降比例不超过20％(优于行业传代稳定性标准不超过30％)。可认为Nfat5位点定点整合单克隆细胞具有传代稳定性。9周连续传代(W9)后，抗体轻重链基因定点整合于Nfat5的单克隆细胞(5-mAbA-8)第14天产物表达水平及细胞单位生产率仍均显著高于定点整合于Fer1L4的单克隆细胞(F-mAbA-6)。

表6定点整合细胞株抗体mAbB和BsAb表达量、细胞单位生产率及IVCD

虽然为了清楚的理解，已经借助于附图和实例详细描述了上述发明，但是描述和实例不应当解释为限制本披露的范围。实际上，除了本文中所述的那些内容之外，所属领域的技术人员根据前述说明和附图将显而易知本披露的各种修改。希望这些修改属于所附权利要求书的范围内。本文中引用的所有专利和科学文献的公开内容通过引用完整地清楚结合。

Claims

1.一种包含整合在特定位点处的外源核苷酸序列的宿主细胞，其中所述的特定位点为Nfat5基因。

2.根据权利要求1所述的宿主细胞，其中所述的特定位点为Nfat5基因的内含子；优选地，所述的特定位点为Nfat5基因的第1内含子。

3.根据权利要求1或2所述的宿主细胞，其中所述的特定位点包含如序列SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列，或与SEQ ID NO:2、SEQ ID NO:3或SEQ IDNO:4具有至少90％序列同一性的核苷酸序列；

优选地，所述的特定位点为如序列SEQ ID NO:2所示的核苷酸序列；

更优选地，所述的特定位点为如序列SEQ ID NO:3所示的核苷酸序列。

4.根据权利要求1-3中任一项所述的宿主细胞，其中所述外源核苷酸序列包括至少2个重组识别序列，位于编码目标序列的基因的侧翼；

优选地，其中所述重组识别序列包含了可被酪氨酸重组酶识别的位点如FRT位点或lox位点；或可被丝氨酸重组酶识别的序列如att位点；

更优选地，所述重组识别序列选自以下各项组成的群组：loxP位点、lox511位点、lox2272位点、lox2372位点、lox5171位点、loxm2位点、lox71位点、lox66位点、loxFas位点、attP、attB位点和野生型FRT、FRT3和FRT5位点；

最优选地，所述重组识别序列为loxP和lox 2272位点。

5.根据权利要求1-4中任一项所述的宿主细胞，其中所述的外源核苷酸序列包含一个或多个选自编码筛选标记物、可检测的蛋白、抗体或其抗原可结合片段、肽抗原、酶、激素、生长因子、受体、融合蛋白或其它生物活性蛋白的基因；

优选地，其中所述的外源核苷酸序列包含一个或多个编码筛选标记物，可检测的蛋白，和抗体或其抗原可结合片段的基因；

更优选地，其中所述筛选标记物选自GS选择标记物、DHFR选择标记物、遗传霉素选择标记物、新霉素选择标记物、嘌呤霉素选择标记物或胸苷激酶选择标记物，所述的可检测的蛋白是荧光标记蛋白；

6.根据权利要求1-5中任一项所述宿主细胞，其中所述的外源核苷酸序列包含一个或多个抗体或其抗原可结合片段。

7.根据权利要求1至6中任一项所述的宿主细胞，其中所述宿主细胞是小鼠细胞、人类细胞、CHO细胞株、CHO-K1细胞株、CHO-S细胞株、CHO-DXB11或CHO-DG44细胞株，优选CHO细胞株。

8.根据权利要求1至7中任一项所述的宿主细胞，其中所述外源核苷酸序列的包含3′端同源臂和5′端同源臂；所述的3′端同源臂与Nfat5基因的第1内含子、SEQ ID NO:2或SEQ IDNO:3的核苷酸序列中所存在的序列同源，所述的5′端同源臂与Nfat5基因的第1内含子、SEQID NO:2或SEQ ID NO:3的核苷酸序列中所存在的序列同源；

更优选地，所述的3′端同源臂与SEQ ID NO:34的核苷酸序列中所存在的序列同源，所述的5′端同源臂与SEQ ID NO:33的核苷酸序列中所存在的序列同源。

9.根据权利要求1至8中任一项所述的宿主细胞，其中所述外源核苷酸序列选自：

a).所述外源核苷酸序列在2个同源臂之间，所述的同源臂为与SEQ ID NO:32的核苷酸序列中所存在的序列同源的3′端同源臂，和与SEQ ID NO:31的核苷酸序列中所存在的序列同源的5′端同源臂，

两个重组识别序列loxP和lox 2272位点；

启动子，筛选标记物基因和/或抗性基因；或

b).所述外源核苷酸序列包括2个同源臂，所述的同源臂为与SEQ ID NO:34的核苷酸序列中所存在的序列同源的3′端同源臂，和与SEQ ID NO:33的核苷酸序列中所存在的序列同源的5′端同源臂，

两个重组识别序列loxP和lox 2272位点；

启动子，抗体或其抗原可结合片段的基因。

10.根据权利要求1至9中任一项所述的宿主细胞，其中所述外源核苷酸序列包括选自如下所示的c)、d)和e)：

c).

-loxP-EF1αPromoter-ZsGreen1-bGHpolyA-SV40-NeoR-lox2272-；和

d).

-loxp-CMV-LC-bGHpolyA-CMV-HC-lox2272-；

优选地，其中的LC为如SEQ ID NO:40的编码抗体轻链的核苷酸序列，HC为如SEQ IDNO:41的编码抗体重链的核苷酸序列；或者其中的LC为如SEQ ID NO:62的编码抗体轻链的核苷酸序列，HC为如SEQ ID NO:63的编码抗体重链的核苷酸序列；

e)-loxp-CMV-LC1-bGHpolyA-CMV-HC1-bGHpolyA-CMV-LC2-bGHpolyA-CMV-HC2-lox2272-

优选地，其中的LC1为如SEQ ID NO:64的编码抗体轻链的核苷酸序列，HC1为如SEQ IDNO:65的编码抗体重链的核苷酸序列，LC2为如SEQ ID NO:66的编码抗体轻链的核苷酸序列，HC2为如SEQ ID NO:67的编码抗体重链的核苷酸序列。

11.一种表达目标产物的宿主细胞的构建方法，所述方法包含将外源核苷酸引入到细胞内的内源Nfat5基因；优选地，包含将外源核苷酸引入到细胞内的内源Nfat5基因的内含子中；更优选地，包含将外源核苷酸引入到细胞内的内源Nfat5基因的第1内含子中。

12.根据权利要求11所述的宿主细胞的构建方法，其中所述的外源核苷酸序列包含一个或多个选自编码筛选标记物、可检测的蛋白、抗体或其抗原可结合片段、肽抗原、酶、激素、生长因子、受体、融合蛋白或其它生物活性蛋白的基因；

优选地，其中所述的外源核苷酸序列包含一个或多个选自编码筛选标记物，可检测的蛋白，和抗体或其抗原可结合片段的基因。

13.根据权利要求11所述的宿主细胞的构建方法，包括：

步骤2、将外源核苷酸序列抗体或其抗原可结合片段的基因用基因重组替换的方法，替换筛选标记物基因和可检测的蛋白基因，引入到细胞内的内源Nfat5基因中；

优选地，方法包括：

步骤1、将外源核苷酸序列筛选标记物基因和可检测的蛋白基因引入到细胞内的内源Nfat5基因的内含子中；

步骤2、将外源核苷酸序列抗体或其抗原可结合片段的基因用基因重组替换的方法，替换筛选标记物基因和可检测的蛋白基因，引入到细胞内的内源Nfat5基因的内含子中；

更优选地，方法包括：

步骤1、将外源核苷酸序列筛选标记物基因和可检测的蛋白基因引入到细胞内的内源Nfat5基因的第1内含子中；

14.根据权利要求11所述的宿主细胞的构建方法，包括：

步骤2、构建包含目标蛋白基因的表达盒质粒；

其中所述的表达盒质粒包括两个重组识别位点，启动子，终止子，和目标蛋白；

优选地，所述的目标蛋白为抗体；

更优选地，所述的目标蛋白选自以下核苷酸编码的抗体：

由核苷酸序列SEQ ID NO:40编码的抗体轻链，和核苷酸序列SEQ ID NO:41编码的抗体重链得到的单克隆抗体；

15.根据权利要求14所述的宿主细胞的构建方法，其中所述的3′端同源臂与Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3的核苷酸序列中所存在的序列同源，所述的5′端同源臂与Nfat5基因第1内含子、SEQ ID NO:2或SEQ ID NO:3的核苷酸序列中所存在的序列同源；