CN117561273A

CN117561273A - 用于经改善的磷酸转移酶的材料和方法

Info

Publication number: CN117561273A
Application number: CN202280044379.9A
Authority: CN
Inventors: W·L·佩里三世
Original assignee: Janssen Biotech Inc
Current assignee: Janssen Biotech Inc
Priority date: 2021-04-21
Filing date: 2022-04-20
Publication date: 2024-02-13

Abstract

本文描述了非天然存在的新霉素磷酸转移酶(NPT)蛋白质和编码此类NPT蛋白质的核酸序列。在具体的实施方案中，该非天然存在的NPT蛋白质相对于野生型NPT具有减少的活性。本文所提供的该非天然存在的NPT蛋白质可以用作用于筛选经转化的或经转染的细胞的选择性标记。本文还提供了包含编码非天然存在的NPT蛋白质的核酸序列的载体和试剂盒，以及产生表达该非天然存在的NPT蛋白质和感兴趣的蛋白质或感兴趣的非编码RNA序列的细胞的方法。

Description

用于经改善的磷酸转移酶的材料和方法

1.相关申请的交叉引用

本申请要求2021年4月21日提交的美国序列号63/177,739、2021年4月21日提交的美国序列号63/177,744、2021年4月21日提交的美国序列号63/177,746、2021年4月21日提交的美国序列号63/177,749、2021年4月21日提交的美国序列号63/177,753、2021年4月21日提交的美国序列号63/177,759、2021年4月21日提交的美国序列号63/177,764、2021年4月21日提交的美国序列号63/177,767的权益，这些申请中的每一篇的公开内容以引用的方式全文并入本文。

2.序列表

本申请包含序列表，该序列表作为ASCII格式的序列表经由EFS-Web以电子方式递交，文件名为“14620-686-228_SL.txt”，创建日期为2022年4月9日，并且大小为118113字节。经由EFS-Web提交的该序列表是本说明书的一部分并且全文以引用方式并入本文。

3.技术领域

本文提供了非天然存在的新霉素磷酸转移酶(NPT)蛋白质和编码此类NPT蛋白质的核酸序列。在具体的实施方案中，非天然存在的NPT蛋白质相对于野生型NPT具有减少的活性。本文所提供的非天然存在的NPT蛋白质可以用作用于筛选经转化的或经转染的细胞的选择性标记。本文还提供了包含编码非天然存在的NPT蛋白质的核酸序列的载体和试剂盒，以及产生表达非天然存在的NPT蛋白质和感兴趣的蛋白质或感兴趣的非编码RNA序列的细胞的方法。

4.背景技术

虽然在一些情况下生成携带稳定整合至基因组中的外源转基因的哺乳动物细胞系已经变得不太困难，但识别以高水平和/或以高转基因拷贝数表达蛋白质产物的无性系是具有挑战性的，例如是低效且耗时的等。转基因整合位点处的序列可以对转基因表达具有主要影响(Lee等人，Trends Biotechnol.,37(9):931-942(2019))，从而导致不同克隆中显著不同的表达水平。当放置于转基因与宿主DNA之间时，DNA调控元件可以用于保护转基因免受染色体位置效应的影响(综述于Gupta等人，Biotechnol.Adv.37(8):107415(2019))。虽然该方法可以增加表达和表达稳定性，但是仍然可能需要重要筛选以识别高表达克隆。为了开发病毒生产细胞系，可能更重要的是生成具有待封装的病毒有效载荷的许多拷贝的细胞系，而不是具有高转基因表达。用以选择多拷贝转基因的方法将使细胞系开发更有效。

问题中的一个问题为许多用于生成稳定细胞系的构建体含有非常有效的选择标记，即使当以非常低的水平表达时，该选择标记也向经转化的细胞赋予选择性优点。从而，没有直接选择高标记基因表达或多拷贝转基因。已经描述了若干减少选择标记表达或翻译效率的方法。这些方法包括使用弱启动子以驱动表达(Niwa等人，Gene 108(2):193-199(1991)；Fan等人，J Biotechnol 168(4):652-658(2013)；Zhou等人，BMC Biotechnol.13:29(2013))，从替代密码子(例如GTG或TTG，而不是ATG)发起翻译(van Blokland等人，J Biotechnol 128(2):237-245(2007)；Cairn等人，Biotechnol Bioeng 108(11):2611-2622(2011))，以及使用内部核糖体进入位点(IRES)以发起翻译(Gurtu等人，Biochem Biophys Res Commun 229(1):295-298(1996)；Kwaks等人，Nat Biotechnol 21(5):553-558(2003)；Ho等人，J Biotechnol 157(1):130-139(2012))。

降低选择标记效率的另一种方法为使用具有减少的活性的突变型蛋白质。已经使用了谷氨酰胺合成酶(GS)中的突变以增加CHO细胞中的选择严格性(Lin等人，MAbs 11(5):965-976(2019))。来自Tn5(氨基糖苷磷酸转移酶3'-IIa)的新霉素磷酸转移酶(NPT)为最常用的选择标记中的一种选择标记。它通过在细菌中将新霉素和卡那霉素磷酸化并且在哺乳动物和植物细胞中将G418磷酸化来赋予对这些抗生素的抗性(Shaw等人，Microbiol Rev57(1):138-163(1993))。诱变研究(Blazquez等人，Mol.Microbiol.5(6):1511-1518(1991)；Kocabiyik等人，SAAS Bull Biochem Biotechnol 5:58-63(1992)；Kocabiyik和Perlin，Biochem Biophys Res Commun 185(3):925-931(1992)；Kocabivik和Perlin，Int J Biochem 26(1):61-66(1994))和自发突变的发现(Yenofsky等人，Proc Natl Acad SciU S A 87(9):3435-3439(1990))已经识别出降低了但未消除用以在细菌中赋予抗生素抗性的能力的关键残基。相对于野生型NPT的用途，当将突变型NPT基因结合至用于在CHO细胞中选择稳定抗体生产细胞系的载体中时，增加的选择严格性导致了更高的抗体表达和生产能力(Sautter和Enenkel，Biotechnol Bioeng 89(5):530-538(2005)；Ho等人，JBiotechnol 157(1):130-139(2012))。使用2载体系统，相对于用野生型NPT基因选择的库，具有2％至16％酶活性的NPT突变体将特异性抗体生产能力增加了5倍至10倍(Sautter和Enenkel 2005)。相对于野生型NPT基因的用途，当在单个三顺反子载体中使用了具有3％活性的突变型NPT基因时，特异性生产能力增加了17倍(Ho等人，2012)。然而，这些方法是受限的。

5.发明内容

本发明认识到并且解决了具有显著减少的活性的NPT突变体的标识，这将使经转化的细胞的选择更加严格，并且从而减少了用以识别和形成表达高水平的感兴趣的转基因的细胞系所必需的筛选。在一个方面，本文提供了具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含野生型NPT中的一个、两个或更多个氨基酸取代(例如，表1或表2中公开的氨基酸取代中的一个、两个或更多个氨基酸取代或它们的组合)。在某些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下氨基酸取代的野生型新霉素磷酸转移酶的氨基酸序列：(a)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(b)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(c)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(d)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(e)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(f)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

在一些实施方案中，非天然存在的NPT包含具有以下氨基酸取代的SEQ ID NO:1的氨基酸序列：(a)在SEQ ID NO:1的位置36和210处的氨基酸序列，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置210处的氨基酸取代为对丙氨酸的取代；(b)在SEQ ID NO:1的位置36和182处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置182处的氨基酸取代为对天冬氨酸的取代；(c)在SEQ ID NO:1的位置36和218处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的氨基酸取代为对苯丙氨酸的取代；(d)在SEQ ID NO:1的位置216和261处的氨基酸取代，其中在SEQ ID NO:1的位置216处的氨基酸取代为对甘氨酸的取代，并且在SEQ IDNO:1的位置261处的氨基酸取代为对天冬酰胺的取代；(e)在SEQ ID NO:1的位置36和218处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的氨基酸取代为对丝氨酸的取代；或(f)在SEQ ID NO:1的位置36和216处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置216处的氨基酸取代为对甘氨酸的取代。

在一些实施方案中，相比于野生型NPT，非天然存在的NPT作为选择标记具有衰减的新霉素磷酸转移酶活性。

在一些实施方案中，野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。在一些实施方案中，野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

在一些实施方案中，相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择标记具有衰减的新霉素磷酸转移酶活性。

在一些实施方案中，相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。在一些实施方案中，细菌细胞为大肠杆菌(E.coli)。在一些实施方案中，野生型NPT包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的。在一些实施方案中，哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。在一些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为0.001％至75％的频率产生。在某些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为5.5％至0.004％的频率产生。在一些实施方案中，野生型NPT包含SEQ ID NO:1的氨基酸序列。在一些实施方案中，哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。

在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。

在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。

在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。

在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。

在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

在一些实施方案中，非天然存在的NPT包含SEQ ID NO:38的氨基酸序列。在一些实施方案中，非天然存在的NPT包含SEQ ID NO:39的氨基酸序列。在一些实施方案中，非天然存在的NPT包含SEQ ID NO:40的氨基酸序列。在一些实施方案中，非天然存在的NPT包含SEQID NO:41的氨基酸序列。在一些实施方案中，非天然存在的NPT包含SEQ ID NO:42的氨基酸序列。在一些实施方案中，非天然存在的NPT包含SEQ ID NO:43的氨基酸序列。

在另一方面，本文提供了包含编码如本文所述的非天然存在的NPT的第一核苷酸序列的核酸。在一些实施方案中，第一核苷酸序列包含SEQ ID NO:20、SEQ ID NO:32、SEQID NO:33、SEQ ID NO:34、SEQ ID NO:36或SEQ ID NO:37的核苷酸序列。

在一些实施方案中，核酸序列还包含编码第二蛋白质或非编码RNA的第二核苷酸序列。在一些实施方案中，第二核苷酸序列编码第二蛋白质，并且其中第二蛋白质为治疗性蛋白。

在另一方面，本文提供了包含如本文所述的核酸序列的载体。

在另一方面，本文提供了包含非天然存在的NPT的体外或离体宿主细胞。在一些实施方案中，宿主细胞包含核酸，该核酸包含编码非天然存在的NPT的第一核苷酸序列。在一些实施方案中，宿主细胞包含核酸，该核酸包含SEQ ID NO:20、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:36或SEQ ID NO:37的核苷酸序列。在一些实施方案中，核酸序列被稳定整合至宿主细胞的基因组中。在一些实施方案中，宿主细胞包含载体。在某些实施方案中，宿主细胞为细菌、酵母细胞、哺乳动物细胞或植物细胞。在某些实施方案中，宿主细胞来自人细胞系。

在另一方面，本文提供了表达非天然存在的NPT的体外或离体宿主细胞，其中非天然存在的NPT相对于野生型新霉素磷酸转移酶为衰减的，并且其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(a)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(b)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(c)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(d)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(e)在对应于SEQ IDNO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(f)在对应于SEQID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ IDNO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

在一些实施方案中，体外或离体宿主细胞表达相对于野生型新霉素磷酸转移酶具有衰减的活性的非天然存在的NPT，并且其中非天然存在的NPT包含具有以下项的SEQ IDNO:1的氨基酸序列：(a)在SEQ ID NO:1的氨基酸残基36和210处的氨基酸取代，其中在SEQID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基210处的氨基酸取代为对丙氨酸的取代；(b)在SEQ ID NO:1的氨基酸残基36和182处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基182处的氨基酸取代为对天冬氨酸的取代；(c)在SEQ IDNO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对苯丙氨酸的取代；(d)在SEQ ID NO:1的氨基酸残基216和261处的氨基酸取代，其中在SEQ IDNO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的氨基酸残基261处的氨基酸取代为对天冬酰胺的取代；(e)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对丝氨酸的取代；或(f)在SEQ IDNO:1的氨基酸残基36和216处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代。

在本文所述的体外或离体宿主细胞的一些实施方案中，野生型NPT包含与SEQ IDNO:1至少80％、至少90％或至少98％相同的氨基酸序列。在一些实施方案中，野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。在一些实施方案中，相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择标记具有衰减的新霉素磷酸转移酶活性。

在本文所述的体外或离体宿主细胞的一些实施方案中，相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。在一些实施方案中，野生型NPT包含SEQ IDNO:1的氨基酸序列。在一些实施方案中，细菌细胞为大肠杆菌。

在本文所述的体外或离体宿主细胞的一些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的。在一些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为0.001％至75％的频率产生。在某些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为5.5％至0.004％的频率产生。在一些实施方案中，野生型NPT包含SEQ ID NO:1的氨基酸序列。在一些实施方案中，哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

在本文所述的体外或离体宿主细胞一些实施方案中，经表达的非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。在一些实施方案中，非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。在本文所述的体外或离体宿主细胞一些实施方案中，经表达的非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。在本文所述的体外或离体宿主细胞一些实施方案中，经表达的非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。在本文所述的体外或离体宿主细胞一些实施方案中，经表达的非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。在本文所述的体外或离体宿主细胞一些实施方案中，经表达的非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

在一些实施方案中，体外或离体宿主细胞还包含编码第二蛋白质或非编码RNA的第二核酸序列。在一些实施方案中，第二核酸序列编码第二蛋白质，并且其中第二蛋白质为治疗性蛋白。在一些实施方案中，第二核酸序列编码非编码RNA，并且其中非编码RNA为shRNA、miRNA、反义RNA、用于Crispr核酸酶的引导RNA、催化RNA、核糖体RNA或tRNA。在某些实施方案中，宿主细胞为细菌、酵母细胞、哺乳动物细胞或植物细胞。

在另一方面，本文提供了用于从其中引入了转基因的宿主细胞群中选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法，该方法包括：a)将包含核酸序列引入宿主细胞群中，该核酸序列包含：(i)第一核苷酸序列，其编码具有新霉素磷酸转移酶活性的本文所述的非天然存在的新霉素磷酸转移酶(NPT)；以及(ii)第二核苷酸序列，其包含转基因；以及b)从其中引入了核酸序列的宿主细胞群中选择在新霉素磷酸转移酶底物的存在下生长的细胞。

在一个实施方案中，本文提供了一种用于从其中引入了转基因的宿主细胞群中选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法，该方法包括：a)将核酸序列引入宿主细胞群中，该核酸序列包含：(i)第一核苷酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)；以及(ii)第二核苷酸序列，其包含转基因，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及b)从其中引入了核酸序列的宿主细胞群中选择在新霉素磷酸转移酶底物的存在下生长的细胞。

在某些实施方案中，一种用于从其中引入了转基因的宿主细胞群中选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法，该方法包括：a)将第一核酸序列引入宿主细胞群中，该第一核酸序列包含：(i)第一核苷酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)；以及(ii)第二核苷酸序列，其包含转基因，其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：(1)在SEQ ID NO:1的氨基酸残基36和210处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基210处的氨基酸取代为对丙氨酸的取代；(2)在SEQ ID NO:1的氨基酸残基36和182处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基182处的氨基酸取代为对天冬氨酸的取代；(3)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对苯丙氨酸的取代；(4)在SEQ ID NO:1的氨基酸残基216和261处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的氨基酸残基261处的氨基酸取代为对天冬酰胺的取代；(5)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对丝氨酸的取代；或(6)在SEQ ID NO:1的氨基酸残基36和216处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代；以及b)从其中引入了核酸序列的宿主细胞群中选择在新霉素磷酸转移酶底物的存在下生长的细胞。

在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，相比于野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，转基因的高拷贝数是当使用编码野生型NPT的核苷酸序列取代非天然存在的NPT或突变型NPT时所实现的拷贝数的5倍至10倍、5倍至15倍、2倍至5倍、2倍至10倍、2倍至15倍、或10倍至20倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或2倍至1000倍。在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，转基因的高表达水平是当使用编码野生型NPT的核苷酸序列取代非天然存在的NPT或突变型NPT时所实现的拷贝数的5倍至25倍、10倍至25倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或5倍至1000倍。

在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。在一些实施方案中，细菌细胞为大肠杆菌。在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的。在某些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为0.001％至75％的频率产生。在一些实施方案中，哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。在某些实施方案中，相对于用编码包含SEQID NO:1的氨基酸序列的野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。在一些实施方案中，细菌细胞为大肠杆菌。在某些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。在某些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为5.5％至0.004％的频率产生，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。在一些实施方案中，哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。在某些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。在某些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。在某些实施方案中，非天然存在的NPT包含在对应于SEQID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ IDNO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

在某些实施方案中，非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。在一些实施方案中，非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。在某些实施方案中，非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。在一些实施方案中，非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。在某些实施方案中，非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。在一些实施方案中，非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，宿主细胞为细菌、酵母细胞、哺乳动物细胞或植物细胞。在一些实施方案中，宿主细胞为人细胞。在某些实施方案中，宿主细胞来自哺乳动物细胞系(例如，人细胞系)。

在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，核酸序列被稳定整合至所选择的细胞的基因组中。在一些实施方案中，所选择的细胞已经将转基因的5个至100个拷贝整合至它们的基因组DNA中。在某些实施方案中，所选择的细胞已经将转基因的1个至5个拷贝整合至它们的基因组DNA中。

在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，所选择的细胞具有高拷贝数的转基因。在一些实施方案中，转基因的高拷贝数是当使用编码野生型NPT的核苷酸序列取代NPT突变体或非天然存在的NPT时所实现的拷贝数的5倍至10倍、5倍至15倍、2倍至5倍、2倍至10倍、2倍至15倍、或10倍至20倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或2倍至1000倍。在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，所选择的细胞具有高表达水平的转基因。在一些实施方案中，转基因的高表达水平是当使用编码野生型NPT的核苷酸序列取代非天然存在的NPT或突变型NPT时所实现的拷贝数的5倍至25倍、10倍至25倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或5倍至1000倍。在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，所选择的细胞具有高拷贝数的转基因和高表达水平的转基因。在一些实施方案中，转基因的高拷贝数是当使用编码野生型NPT的核苷酸序列取代NPT突变体或非天然存在的NPT时所实现的拷贝数的5倍至10倍、5倍至15倍、2倍至5倍、2倍至10倍、2倍至15倍、或10倍至20倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或2倍至1000倍。在一些实施方案中，转基因的高表达水平是当使用编码野生型NPT的核苷酸序列取代非天然存在的NPT或突变型NPT时所实现的拷贝数的5倍至25倍、10倍至25倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或5倍至1000倍。

在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，转基因包含病毒基因。在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，转基因包含人生长因子基因。

在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，新霉素磷酸转移酶底物为新霉素、卡那霉素或G418。

在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后的第二组细胞中的转基因的拷贝数，所选择的细胞包含10倍至1000倍的转基因的拷贝数，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后的第二组细胞中的转基因的拷贝数，所选择的细胞包含100倍至1000倍的转基因的拷贝数，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后的第二组细胞中的转基因的拷贝数，所选择的细胞包含500倍至1000倍的转基因的拷贝数，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后的第二组细胞中的转基因的拷贝数，所选择的细胞包含750倍至1000倍的转基因的拷贝数，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后的第二组细胞中的转基因的拷贝数，所选择的细胞包含100倍至500倍的转基因的拷贝数，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后的第二组细胞中的转基因的拷贝数，所选择的细胞包含10倍至100倍的转基因的拷贝数，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后的第二组细胞中的转基因的拷贝数，所选择的细胞包含10倍至50倍的转基因的拷贝数，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后的第二组细胞中的转基因的拷贝数，所选择的细胞包含10倍至25倍的转基因的拷贝数，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后的第二组细胞中的转基因的拷贝数，所选择的细胞包含2倍至10倍的转基因的拷贝数，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。

在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后由第二组细胞的转基因的表达水平，所选择的细胞实现了10倍至1000倍的转基因的表达水平，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后由第二组细胞的转基因的表达水平，所选择的细胞实现了100倍至1000倍的转基因的表达水平，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后由第二组细胞的转基因的表达水平，所选择的细胞实现了500倍至1000倍的转基因的表达水平，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后由第二组细胞的转基因的表达水平，所选择的细胞实现了750倍至1000倍的转基因的表达水平，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后由第二组细胞的转基因的表达水平，所选择的细胞实现了10倍至100倍的转基因的表达水平，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后由第二组细胞的转基因的表达水平，所选择的细胞实现了10倍至50倍的转基因的表达水平，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后由第二组细胞的转基因的表达水平，所选择的细胞实现了5倍至25倍的转基因的表达水平，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，所选择的细胞实现了5倍至10倍的选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后由第二组细胞的转基因的表达水平，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的一些实施方案中，所选择的细胞实现了2倍至10倍的选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后由第二组细胞的转基因的表达水平，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。在具体的实施方案中，宿主细胞群为相同的并且所使用的条件为相同的。

在用于选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法的某些实施方案中，转基因编码蛋白质或非编码RNA。在一些实施方案中，非编码RNA选自由以下项组成的组：反义RNA、miRNA、shRNA、长链非编码RNA、催化RNA、核糖体RNA、tRNA或用于CRISPR核酸酶的引导RNA。在某些实施方案中，蛋白质为治疗性蛋白或抗原。治疗性蛋白或抗原可以为本文所述的或本领域技术人员已知的治疗性蛋白或抗原。在某些实施方案中，蛋白质为病毒蛋白。病毒蛋白可以为本文所述的或本领域技术人员已知的病毒蛋白。

在一些实施方案中，本文所述的非天然存在的NPT的使用将对于筛选用转基因转染或转化的细胞的需要减少7500倍至10000倍。在一些实施方案中，本文所述的非天然存在的NPT的使用将对于筛选用转基因转染或转化的细胞的需要减少5000倍至10000倍。在一些实施方案中，本文所述的非天然存在的NPT的使用将对于筛选用转基因转染或转化的细胞的需要减少2500倍至10000倍。在一些实施方案中，本文所述的非天然存在的NPT的使用将对于筛选用转基因转染或转化的细胞的需要减少1000倍至10000倍。在一些实施方案中，本文所述的非天然存在的NPT的使用将对于筛选用转基因转染或转化的细胞的需要减少5000倍至7500倍。在一些实施方案中，本文所述的非天然存在的NPT的使用将对于筛选用转基因转染或转化的细胞的需要减少1000倍至5000倍。在一些实施方案中，本文所述的非天然存在的NPT的使用将对于筛选用转基因转染或转化的细胞的需要减少500倍至1000倍。

在另一方面，本文提供了使用质粒或转座子的方法，该质粒或转座子包含编码本文所述的非天然存在的NPT的核酸序列，相比于野生型NPT，该非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性，该方法包括：a)将包含核酸序列的质粒或转座子引入宿主细胞中；以及b)使细胞在新霉素磷酸转移酶底物的存在下生长。在一些实施方案中，该方法还包括选择在新霉素磷酸转移酶底物的存在下生长的宿主细胞。

在一个实施方案中，本文提供了一种使用质粒或转座子的方法，该质粒或转座子包含编码非天然存在的NPT的核酸序列，相比于野生型NPT，该非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性，该方法包括：a)将包含编码非天然存在的NPT的核酸序列的质粒或转座子引入宿主细胞中，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及b)使细胞在新霉素磷酸转移酶底物的存在下生长。在一些实施方案中，该方法还包括选择在新霉素磷酸转移酶底物的存在下生长的宿主细胞。

在一些实施方案中，本文提供了一种使用质粒或转座子的方法，该质粒或转座子包含编码非天然存在的NPT的核酸序列，相比于野生型NPT，该非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性，该方法包括：a)将包含编码非天然存在的NPT的核酸序列的质粒或转座子引入宿主细胞中，其中非天然存在的NPT包含具有以下项的SEQ IDNO:1的氨基酸序列：(1)在SEQ ID NO:1的氨基酸残基36和210处的氨基酸取代，其中在SEQID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基210处的氨基酸取代为对丙氨酸的取代；(2)在SEQ ID NO:1的氨基酸残基36和182处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基182处的氨基酸取代为对天冬氨酸的取代；(3)在SEQ IDNO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对苯丙氨酸的取代；(4)在SEQ ID NO:1的氨基酸残基216和261处的氨基酸取代，其中在SEQ IDNO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的氨基酸残基261处的氨基酸取代为对天冬酰胺的取代；(5)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对丝氨酸的取代；或(6)在SEQ IDNO:1的氨基酸残基36和216处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代；以及b)使细胞在新霉素磷酸转移酶底物的存在下生长。在一些实施方案中，该方法还包括选择在新霉素磷酸转移酶底物的存在下生长的宿主细胞。

在使用质粒或转座子的方法的一些实施方案中，野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。在使用质粒或转座子的方法的某些实施方案中，野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

在使用质粒或转座子的方法的某些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。在使用质粒或转座子的方法的一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。在使用质粒或转座子的方法的某些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。在使用质粒或转座子的方法的一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。在使用质粒或转座子的方法的某些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。在使用质粒或转座子的方法的一些实施方案中，非天然存在的NPT包含在对应于SEQ IDNO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

在使用质粒或转座子的方法的某些实施方案中，非天然存在的NPT包含SEQ IDNO:38的氨基酸序列(V36M，G210A)。在使用质粒或转座子的方法的一些实施方案中，非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。在使用质粒或转座子的方法的某些实施方案中，非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。在使用质粒或转座子的方法的一些实施方案中，非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。在使用质粒或转座子的方法的某些实施方案中，非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。在使用质粒或转座子的方法的一些实施方案中，非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

在使用质粒或转座子的方法的某些实施方案中，宿主细胞为细菌、酵母细胞、哺乳动物细胞或植物细胞。在一些实施方案中，宿主细胞为人细胞。

在使用质粒或转座子的方法的某些实施方案中，其中质粒或转座子还包含编码蛋白质或非编码RNA的第二核苷酸序列。在一些实施方案中，蛋白质为病毒蛋白。在某些实施方案中，蛋白质为治疗性蛋白。

在使用质粒或转座子的方法的某些实施方案中，新霉素磷酸转移酶底物为新霉素、卡那霉素或G418。

在另一方面，本文提供了制备宿主细胞的方法，该方法包括：a)将第一核酸序列引入宿主细胞群中，该第一核酸序列包含：(i)第一核苷酸序列，其编码本文所述的非天然存在的NPT，以及(ii)第二核苷酸序列，其包含编码第二蛋白质或非编码RNA的转基因；b)使宿主细胞群在新霉素磷酸转移酶底物的存在下生长，以产生集落；以及c)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。在一些实施方案中，该方法还包括培养所选择的细胞集落。

在一个实施方案中，本文提供了一种制备包含第二核苷酸序列的宿主细胞的方法，该方法包括：a)用第一核酸序列引入第一宿主细胞群，该第一核酸序列包含：(i)第一核苷酸序列，其编码非天然存在的NPT，以及(ii)第二核苷酸序列，其包含编码第二蛋白质或非编码RNA的转基因，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；b)使宿主细胞群在新霉素磷酸转移酶底物的存在下生长，以产生集落；以及c)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。

在另一方面，本文提供了一种制备包含第二核苷酸序列的宿主细胞的方法，该方法包括：a)将以下项共引入宿主细胞群中：(i)第一核酸序列，其包含编码本文所述的非天然存在的NPT的第一核苷酸序列，以及(ii)第二核酸序列，其包含编码第二蛋白质或非编码RNA的转基因；b)使宿主细胞群在新霉素磷酸转移酶底物的存在下生长，以产生集落；以及c)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。在一些实施方案中，该方法还包括培养所选择的细胞集落。

在一些实施方案中，本文提供了一种制备包含第二核苷酸序列的宿主细胞的方法，该方法包括：a)将以下项共引入宿主细胞群中：(i)第一核酸序列，其包含编码非天然存在的NPT的第一核苷酸序列，以及(ii)第二核酸序列，其包含编码第二蛋白质或非编码RNA的转基因，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；b)使宿主细胞群在新霉素磷酸转移酶底物的存在下生长，以产生集落；以及c)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。

在一些实施方案中，本文提供了一种制备包含第二核苷酸序列的宿主细胞的方法，该方法包括：a)将以下项共引入宿主细胞群中：(i)第一核酸序列，其包含编码非天然存在的NPT的第一核苷酸序列，以及(ii)第二核酸序列，其包含编码第二蛋白质或非编码RNA的转基因，其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：(1)在SEQID NO:1的位置36和210处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置210处的氨基酸取代为对丙氨酸的取代；(2)在SEQ ID NO:1的位置36和182处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置182处的氨基酸取代为对天冬氨酸的取代；(3)在SEQ ID NO:1的位置36和218处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的氨基酸取代为对苯丙氨酸的取代；(4)在SEQ ID NO:1的位置216和261处的氨基酸取代，其中在SEQ ID NO:1的位置216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的位置261处的氨基酸取代为对天冬酰胺的取代；(5)在SEQ ID NO:1的位置36和218处的氨基酸取代，其中在SEQ IDNO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的氨基酸取代为对丝氨酸的取代；或(6)在SEQ ID NO:1的位置36和216处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置216处的氨基酸取代为对甘氨酸的取代；b)使宿主细胞群在新霉素磷酸转移酶底物的存在下生长，以产生集落；以及c)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。

在另一方面，本文提供了制备包含第二核苷酸序列的宿主细胞的方法，该方法包括：a)使宿主细胞群在新霉素磷酸转移酶底物的存在下生长，以产生集落，其中宿主细胞群包含第一核酸序列，该第一核酸序列包含：(i)第一核苷酸序列，其编码本文所述的非天然存在的NPT，以及(ii)第二核苷酸序列，其包含编码第二蛋白质或非编码RNA的转基因；以及b)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。在一些实施方案中，该方法还包括培养所选择的细胞的集落。

在一个实施方案中，本文提供了一种制备包含第二核苷酸序列的宿主细胞的方法，该方法包括：a)使宿主细胞群在新霉素磷酸转移酶的底物的存在下生长，以产生集落，其中宿主细胞群包含第一核酸序列，该第一核酸序列包含：(i)第一核苷酸序列，其编码非天然存在的NPT，以及(ii)第二核苷酸序列，其包含编码第二蛋白质或非编码RNA的转基因，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及b)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。在一些实施方案中，该方法还包括培养所选择的细胞集落。

在一些实施方案中，一种制备包含第二核苷酸序列的宿主细胞的方法包括：a)使宿主细胞群在新霉素磷酸转移酶的底物的存在下生长，以产生集落，其中宿主细胞群包含：(i)第一核酸序列，其包含编码非天然存在的NPT的第一核苷酸序列，以及(ii)第二核酸序列，其包含编码第二蛋白质或非编码RNA的转基因；其中非天然存在的NPT包含具有以下氨基酸取代的SEQ ID NO:1的氨基酸序列：(1)在SEQ ID NO:1的位置36和210处的氨基酸序列，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置210处的氨基酸取代为对丙氨酸的取代；(2)在SEQ ID NO:1的位置36和182处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQID NO:1的位置182处的氨基酸取代为对天冬氨酸的取代；(3)在SEQ ID NO:1的位置36和218处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的氨基酸取代为对苯丙氨酸的取代；(4)在SEQ ID NO:1的位置216和261处的氨基酸取代，其中在SEQ ID NO:1的位置216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的位置261处的氨基酸取代为对天冬酰胺的取代；(5)在SEQ IDNO:1的位置36和218处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的氨基酸取代为对丝氨酸的取代；或(6)在SEQ ID NO:1的位置36和216处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置216处的氨基酸取代为对甘氨酸的取代；以及b)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。在一些实施方案中，该方法还包括培养所选择的细胞集落。

在另一方面，本文提供了宿主细胞，该宿主细胞包含通过本文所述的方法来产生的第二核苷酸序列。

在另一方面，本文提供了一种用于制造表达治疗性蛋白或酶的稳定细胞系的方法，该方法包括：a)将一个或多个核酸序列引入宿主细胞群中，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的本文所述的非天然存在的新霉素磷酸转移酶(NPT)；b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及c)培养所选择的细胞，以产生表达治疗性蛋白或酶的稳定细胞系。

在一个实施方案中，本文提供了一种用于制造表达治疗性蛋白或酶的稳定细胞系的方法，该方法包括：a)将一个或多个核酸序列引入宿主细胞群中，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码治疗性蛋白或酶；b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及c)培养所选择的细胞，以产生表达治疗性蛋白或酶的稳定细胞系。

在一些实施方案中，本文提供了一种用于制造表达治疗性蛋白或酶的稳定细胞系的方法，该方法包括：a)将一个或多个核酸序列引入宿主细胞群中，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：(1)在SEQ ID NO:1的氨基酸残基36和210处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基210处的氨基酸取代为对丙氨酸的取代；(2)在SEQ ID NO:1的氨基酸残基36和182处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基182处的氨基酸取代为对天冬氨酸的取代；(3)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对苯丙氨酸的取代；(4)在SEQ ID NO:1的氨基酸残基216和261处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的氨基酸残基261处的氨基酸取代为对天冬酰胺的取代；(5)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对丝氨酸的取代；或(6)在SEQ ID NO:1的氨基酸残基36和216处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码治疗性蛋白或酶；b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及c)培养所选择的细胞，以产生表达治疗性蛋白或酶的稳定细胞系。

在本文所提供的方法的一些实施方案中，稳定细胞系为哺乳动物细胞系。在本文所提供的方法的一些实施方案中，稳定细胞系为人细胞系。在一些实施方案中，稳定细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。在本文所提供的方法的一些实施方案中，稳定细胞系表达治疗性蛋白。在本文所提供的方法的一些实施方案中，治疗性蛋白为抗体或抗体片段。在一些实施方案中，稳定细胞系表达酶。

在另一方面，本文提供了由本文所述的方法所产生的稳定细胞系。在一些实施方案中，细胞系的稳定性可以通过由定量方法(诸如例如qPCR或杂交)测量转基因的拷贝数来进行确定。

在本文所提供的方法的一些实施方案中，相比于野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

在本文所提供的方法的一些实施方案中，野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。在所提供的方法的一些实施方案中，野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

在本文所提供的方法的一些实施方案中，相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

在本文所提供的方法的一些实施方案中，相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。在一些实施方案中，细菌细胞为大肠杆菌。

在本文所提供的方法的一些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的。在一些实施方案中，哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

在本文所提供的方法的一些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为0.001％至75％的频率产生。在一些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为5.5％至0.004％的频率产生。在一些实施方案中，哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

在本文所提供的方法的一些实施方案中，相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。

在本文所提供的方法的一些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。在一些实施方案中，相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为5.5％至0.004％的频率产生，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。在一些实施方案中，哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

在本文所提供的方法的一些实施方案中，非天然存在的NPT包含在对应于SEQ IDNO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。在一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

在本文所提供的方法的一些实施方案中，非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。

在本文所提供的方法的一些实施方案中，非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。

在本文所提供的方法的一些实施方案中，非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。

在本文所提供的方法的一些实施方案中，非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。

在本文所提供的方法的一些实施方案中，非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。

在本文所提供的方法的一些实施方案中，非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

在本文所提供的方法的一些实施方案中，其中宿主细胞群被转染或转化，与用第二核酸序列转染或转化并且在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群相比，该宿主细胞群产生更少的集落，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。

宿主细胞可以为例如哺乳动物细胞。在一些实施方案中，哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。在一些实施方案中，细胞为人细胞。

在本文所提供的方法的一些实施方案中，新霉素磷酸转移酶底物为新霉素、卡那霉素或G418。

在本文所提供的方法的一些实施方案中，蛋白质为治疗性蛋白或抗原。

在本文所提供的方法的一些实施方案中，非编码RNA为shRNA、miRNA、反义RNA、用于Crispr核酸酶的引导RNA、催化RNA、核糖体RNA或tRNA。

在另一方面，本文提供了一种制备病毒生产细胞系的方法，该方法包括：a)将一个或多个核酸序列引入宿主细胞群中，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的本文所述的非天然存在的新霉素磷酸转移酶(NPT)；b)从细胞群中选择在新霉素磷酸转移酶底物的存在下生长的细胞；以及c)繁殖所选择的细胞，以产生病毒生产细胞系。病毒生产细胞系可以用于产生用于例如基因疗法或癌症疗法的病毒。

在一个实施方案中，本文提供了一种制备病毒生产细胞系的方法，该方法包括：a)将一个或多个核酸序列引入宿主细胞群中，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码一种或多种病毒蛋白；b)从细胞群中选择在新霉素磷酸转移酶底物的存在下生长的细胞；以及c)繁殖所选择的细胞，以产生病毒生产细胞系。在一些实施方案中，该一种或多种病毒蛋白包括衣壳蛋白、包膜蛋白、复制所必需的病毒蛋白或它们的组合。

在一些实施方案中，一种制备病毒生产细胞系的方法包括：a)将一个或多个核酸序列引入宿主细胞群中，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：(1)在SEQ ID NO:1的氨基酸残基36和210处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基210处的氨基酸取代为对丙氨酸的取代；(2)在SEQ ID NO:1的氨基酸残基36和182处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基182处的氨基酸取代为对天冬氨酸的取代；(3)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对苯丙氨酸的取代；(4)在SEQ ID NO:1的氨基酸残基216和261处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的氨基酸残基261处的氨基酸取代为对天冬酰胺的取代；(5)在SEQ IDNO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对丝氨酸的取代；或(6)在SEQ ID NO:1的氨基酸残基36和216处的氨基酸取代，其中在SEQ IDNO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码一种或多种病毒蛋白；b)从细胞群中选择在新霉素磷酸转移酶底物的存在下生长的细胞；以及c)繁殖所选择的细胞，以产生病毒生产细胞系。在一些实施方案中，该一种或多种病毒蛋白包括衣壳蛋白、包膜蛋白、复制所必需的病毒蛋白或它们的组合。

在本文所提供的方法的一些实施方案中，细胞系为哺乳动物细胞系。在本文所提供的方法的一些实施方案中，细胞系为人细胞系。在本文所提供的方法的一些实施方案中，细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。

在本文所提供的方法的一些实施方案中，该一种或多种病毒蛋白包括AAV衣壳蛋白。

在本文所提供的方法的一些实施方案中，该一种或多种病毒蛋白包括AAV衣壳蛋白和AAV rep蛋白。

在本文所提供的方法的一些实施方案中，该一种或多种病毒蛋白包括包膜蛋白。

在本文所提供的方法的一些实施方案中，该一种或多种病毒蛋白包括腺病毒复制所需的腺病毒E1区蛋白。

在本文所提供的方法的一些实施方案中，该一种或多种病毒蛋白包括逆转录病毒包膜蛋白。

在本文所提供的方法的一些实施方案中，该一种或多种病毒蛋白包括逆转录病毒gag蛋白。

在本文所提供的方法的一些实施方案中，该一种或多种病毒蛋白包括逆转录病毒逆转录酶。

在本文所提供的方法的一些实施方案中，该一种或多种病毒蛋白包括逆转录病毒包膜蛋白、gag蛋白和逆转录酶。

在另一方面，本文提供了包含一个或多个核酸序列的病毒生产细胞系，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的本文所述的非天然存在的新霉素磷酸转移酶(NPT)，以及(ii)第二核酸序列，其编码一种或多种病毒蛋白。在一些实施方案中，该一种或多种病毒蛋白包括衣壳蛋白、包膜蛋白、复制所必需的病毒蛋白或它们的组合。

在一个实施方案中，本文提供了包含一个或多个核酸序列的病毒生产细胞系，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码一种或多种病毒蛋白。在一些实施方案中，该一种或多种病毒蛋白包括衣壳蛋白、包膜蛋白、复制所必需的病毒蛋白或它们的组合。

在一些实施方案中，本文提供了包含一个或多个核酸序列的病毒生产细胞系，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：(1)在SEQ ID NO:1的氨基酸残基36和210处的氨基酸取代，其中在SEQ IDNO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基210处的氨基酸取代为对丙氨酸的取代；(2)在SEQ ID NO:1的氨基酸残基36和182处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基182处的氨基酸取代为对天冬氨酸的取代；(3)在SEQ IDNO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对苯丙氨酸的取代；(4)在SEQ ID NO:1的氨基酸残基216和261处的氨基酸取代，其中在SEQ IDNO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的氨基酸残基261处的氨基酸取代为对天冬酰胺的取代；(5)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对丝氨酸的取代；或(6)在SEQ IDNO:1的氨基酸残基36和216处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码一种或多种病毒蛋白。在一些实施方案中，该一种或多种病毒蛋白包括衣壳蛋白、包膜蛋白、复制所必需的病毒蛋白或它们的组合。

在病毒生产细胞系的一些实施方案中，相比于野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

在病毒生产细胞系的一些实施方案中，野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。在病毒生产细胞系的一些实施方案中，野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。在病毒生产细胞系的一些实施方案中，相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含在对应于SEQ IDNO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含在对应于SEQ IDNO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ IDNO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含SEQID NO:39的氨基酸序列(V36M，E182D)。在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。在病毒生产细胞系的一些实施方案中，非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

在病毒生产细胞系的一些实施方案中，细胞系为哺乳动物细胞系。在病毒生产细胞系的一些实施方案中，细胞系为人细胞系。在病毒生产细胞系的一些实施方案中，细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。

在病毒生产细胞系的一些实施方案中，该一种或多种病毒蛋白包括AAV衣壳蛋白。在病毒生产细胞系的一些实施方案中，该一种或多种病毒蛋白包括AAV衣壳蛋白和AAV rep蛋白。在病毒生产细胞系的一些实施方案中，该一种或多种病毒蛋白包括包膜蛋白。在病毒生产细胞系的一些实施方案中，该一种或多种病毒蛋白包括腺病毒复制所需的腺病毒E1区蛋白。在病毒生产细胞系的一些实施方案中，该一种或多种病毒蛋白包括逆转录病毒包膜蛋白。在病毒生产细胞系的一些实施方案中，该一种或多种病毒蛋白包括逆转录病毒gag蛋白。在病毒生产细胞系的一些实施方案中，该一种或多种病毒蛋白包括逆转录病毒逆转录酶。在病毒生产细胞系的一些实施方案中，该一种或多种病毒蛋白包括逆转录病毒包膜蛋白、gag蛋白和逆转录酶。

在一个方面，本文提供了一种用于制造表达抗原的哺乳动物细胞系的方法，该方法包括：a)将一个或多个核酸序列引入宿主细胞群中，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的本文所述的非天然存在的新霉素磷酸转移酶(NPT)，以及(ii)第二核酸序列，其编码抗原；b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及c)培养所选择的细胞，以产生表达抗原的细胞系。在一些实施方案中，抗原用于免疫哺乳动物受试者(例如，人)或在哺乳动物受试者(例如，人)中诱导免疫应答。抗原也可以在体外或离体使用。

在一个实施方案中，本文提供了一种用于制造表达抗原的哺乳动物细胞系的方法，该方法包括：a)将一个或多个核酸序列引入宿主细胞群中，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的新霉素NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码抗原；b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及c)培养所选择的细胞，以产生表达抗原的细胞系。

在一些实施方案中，本文提供了一种用于制造表达抗原的哺乳动物细胞系的方法，该方法包括：a)将一个或多个核酸序列引入宿主细胞群中，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的新霉素NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：(1)在SEQ ID NO:1的氨基酸残基36和210处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基210处的氨基酸取代为对丙氨酸的取代；(2)在SEQ ID NO:1的氨基酸残基36和182处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基182处的氨基酸取代为对天冬氨酸的取代；(3)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对苯丙氨酸的取代；(4)在SEQ ID NO:1的氨基酸残基216和261处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的氨基酸残基261处的氨基酸取代为对天冬酰胺的取代；(5)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对丝氨酸的取代；或(6)在SEQ ID NO:1的氨基酸残基36和216处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码抗原；b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及c)培养所选择的细胞，以产生表达抗原的细胞系。

在本文所提供的方法的一些实施方案中，相比于野生型NPT，非天然存在的NPT作为选择标记具有衰减的新霉素磷酸转移酶活性。

在本文所提供的方法的一些实施方案中，野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。在本文所提供的方法的一些实施方案中，野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

在用于制造哺乳动物细胞系的方法的一些实施方案中，细胞系为哺乳动物细胞系。在用于制造哺乳动物细胞系的方法的一些实施方案中，细胞系为人细胞系。在用于制造哺乳动物细胞系的方法的一些实施方案中，细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。

在用于制造哺乳动物细胞系的方法的一些实施方案中，抗原为病毒抗原、细菌抗原或真菌抗原。在用于制造哺乳动物细胞系的方法的一些实施方案中，抗原为癌抗原。

在另一方面，本文提供了包含一个或多个核酸序列的抗原生产细胞系，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的本文所述的非天然存在的新霉素磷酸转移酶(NPT)；以及(ii)第二核酸序列，其编码一种或多种抗原。

在另一方面，本文提供了包含一个或多个核酸序列的抗原生产细胞系，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码一种或多种抗原。

在一些实施方案中，本文提供了包含一个或多个核酸序列的抗原生产细胞系，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：(1)在SEQ ID NO:1的氨基酸残基36和210处的氨基酸取代，其中在SEQ IDNO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基210处的氨基酸取代为对丙氨酸的取代；(2)在SEQ ID NO:1的氨基酸残基36和182处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基182处的氨基酸取代为对天冬氨酸的取代；(3)在SEQ IDNO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对苯丙氨酸的取代；(4)在SEQ ID NO:1的氨基酸残基216和261处的氨基酸取代，其中在SEQ IDNO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的氨基酸残基261处的氨基酸取代为对天冬酰胺的取代；(5)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对丝氨酸的取代；或(6)在SEQ IDNO:1的氨基酸残基36和216处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码一种或多种抗原。

在本文所提供的抗原生产细胞系的一些实施方案中，相比于野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

在本文所提供的抗原生产细胞系的一些实施方案中，野生型NPT包含与SEQ IDNO:1至少80％、至少90％或至少98％相同的氨基酸序列。

在本文所提供的抗原生产细胞系的一些实施方案中，野生型NPT包含与SEQ IDNO:1至少60％、至少65％、至少70％或至少65％相同的氨基酸序列。

在本文所提供的抗原生产细胞系的一些实施方案中，相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

在一些实施方案中，NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。在一些实施方案中，NPT包含对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。在一些实施方案中，NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。在一些实施方案中，NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。在一些实施方案中，NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。在一些实施方案中，NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

在本文所提供的抗原生产细胞系的一些实施方案中，非天然存在的NPT包含SEQID NO:38的氨基酸序列(V36M，G210A)。在一些实施方案中，非天然存在的NPT包含SEQ IDNO:39的氨基酸序列(V36M，E182D)。在本文所提供的抗原生产细胞系的一些实施方案中，非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。在本文所提供的抗原生产细胞系的一些实施方案中，非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。在本文所提供的抗原生产细胞系的一些实施方案中，非天然存在的NPT包含SEQ IDNO:42的氨基酸序列(V36M，Y218S)。在本文所提供的抗原生产细胞系的一些实施方案中，非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

在本文所提供的抗原生产细胞系的一些实施方案中，细胞系为哺乳动物细胞系。在本文所提供的抗原生产细胞系的一些实施方案中，细胞系为人细胞系。在本文所提供的抗原生产细胞系的一些实施方案中，细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。

在本文所提供的抗原生产细胞系的一些实施方案中，该一种或多种抗原为病毒抗原、细菌抗原或真菌抗原。在本文所提供的抗原生产细胞系的一些实施方案中，该一种或多种抗原为癌抗原。

在另一方面，本文提供了一种选择性标记工具，其用于当被引入细菌细胞时赋予对卡那霉素的抗性，并且当被引入哺乳动物细胞时赋予对G418的抗性。在一些实施方案中，选择性标记工具包含SEQ ID NO:20的核酸序列。在一些实施方案中，选择性标记工具包含SEQ ID NO:32的核酸序列。在一些实施方案中，选择性标记工具包含SEQ ID NO:33的核酸序列。在一些实施方案中，选择性标记工具包含SEQ ID NO:34的核酸序列。在一些实施方案中，选择性标记工具包含SEQ ID NO:36的核酸序列。在一些实施方案中，选择性标记工具包含SEQ ID NO:37的核酸序列。

在另一方面，本文提供了一种用于制造生产细胞系的方法，该方法包括：a)用包含核酸序列和工具的表达载体转化细菌或哺乳动物细胞，该核酸序列编码一种或多种病毒蛋白，如果经转化的细胞为细菌细胞，则工具用于在卡那霉素的存在下生长，并且如果经转化的细胞为哺乳动物细胞，则工具用于在G418的存在下生长，以制备经转化的细胞；以及b)在卡那霉素或G418的存在下培养经转化的细胞，以获得生产细胞系，其中生产细胞系表达来自AAV、腺病毒、逆转录病毒、慢病毒、单纯疱疹病毒、牛痘病毒或杆状病毒的一种或多种病毒蛋白。

在另一方面，本文提供了一种用于选择具有外源核酸序列的稳定染色体整合的细胞的方法，该方法包括：a)用包含用于在G418的存在下生长的工具的外源核酸序列转化真核细胞群；b)在G418的存在下培养经转化的细胞群，以产生能够在G418的存在下生长的经转化的细胞集落；以及c)从步骤(b)中产生的集落中选择细胞，以获得具有外源核酸的稳定染色体整合的细胞。

在一些实施方案中，外源核酸序列还包含转基因，并且所选择的细胞表达转基因。

在一些实施方案中，外源核酸序列破坏所选择的细胞的内源性基因的表达。

在另一方面，本文提供了一种用于选择具有稳定游离体的哺乳动物细胞的方法，该方法包括：a)用包含用于在G418的存在下生长的工具的质粒转化哺乳动物细胞群；b)在G418的存在下培养经转化的细胞群，以产生能够在G418的存在下生长的经转化的细胞集落；以及c)从步骤(b)中产生的集落中选择细胞，以获得具有包含质粒的稳定游离体的细胞。

在一些实施方案中，质粒还包含EBNA1 OriP核酸序列，并且所选择的细胞表达EBNA1。

在一个方面，本文提供了一种用于选择瞬时表达转基因的哺乳动物细胞的方法，该方法包括：a)将编码转基因的核酸和用于在G418的存在下生长的工具引入哺乳动物细胞群中；b)在G418的存在下培养哺乳动物细胞群48小时至72小时；以及c)从经培养的哺乳动物细胞群中选择在G418的存在下生长的哺乳动物细胞，其中所选择的哺乳动物细胞瞬时表达所述转基因。

在一些实施方案中，转基因包含编码Crispr内切核酸酶或Crispr引导RNA的核酸序列。

在一些实施方案中，工具为编码非天然存在的新霉素磷酸转移酶的核苷酸序列，该核苷酸序列包含选自由以下项组成的组的氨基酸序列：SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42或SEQ ID NO:43。

6.附图说明

结合附图进行阅读时，能够更好地理解前述发明内容和以下对本专利申请的具体实施方案的详细说明。但是，应当理解，本专利申请不限于附图中示出的精确实施方案。

图1示出了如本文所述的代表性表达载体(质粒P313)。

图2描绘了包括以下项的构建体：转座子元件(“Leapin左”和“Leapin右”)、人延伸因子α启动子(“EF1α”)、具有多腺苷酸化信号的mCherry编码区(“pA”)、NPT编码区(“Kan/NEO”)和复制起点(“pMB1 Ori”)。

图3描绘了来自本文所述的集落形成测定的结果。

图4展示了相比于没有颜色的未转化细胞(最左侧管)，用表达mCherry和NPT蛋白质(标记为“NEO”)的构建体转化的HEK293细胞的稳定库中的mCherry表达。

图5示出了用以下构建体转化的HEK293细胞中转基因(mCherry)拷贝数的图：编码野生型NPT的构建体P724、编码NPT突变体#1的P725(V36M；G210A)或编码NPT突变体#2的P726(V36M；E182D)，并且其中构建体包含(+)或不包含(-)转座酶元件。

图6A至图6B示出了改编自Shaw等人，Microbiological Reviews 57:138-163(1993)的氨基糖苷磷酸转移酶的比对。SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:45至SEQID NO:62已经被指定为图6A至图6B中描绘的序列。

7.具体实施方式

本公开部分地基于以下令人惊讶的发现，具有特定氨基酸取代的NPT相比于野生型NPT，具有显著减少的磷酸转移酶活性。编码如本文所述的NPT的核酸序列的用途提供了作为用于选择和形成经转化的细胞系的选择性标记的显著优点，该经转化的细胞系除了感兴趣的基因之外，还表达经突变的NPT，这赋予经转化的细胞优于非经转化的细胞的选择性优点。

说明书和所附权利要求书中所用的单数形式“一个/种”和“该/所述”包括复数指代，除非上下文清楚表明并非如此。

在两个或更多个核酸或多肽序列的上下文中，术语“相同”或“同一性”百分比是指当进行比较和比对以获得最大对应性时，相同的或具有相同的氨基酸残基或核苷酸的指定百分比的两条或更多条序列或子序列，如使用以下序列比较算法中的一种序列比较算法或通过目视检查所测量的。

对于序列比对，通常将一个序列作为参考序列，将测试序列与其进行对比。当使用序列比对算法时，将测试序列和参考序列输入计算机中，指定子序列坐标(如果必要的话)，并指定序列算法的程序参数。然后，序列比较算法基于指定的程序参数来计算对于测试序列相对于参考序列的序列同一性百分比。

用于比较的序列的最佳比对可例如通过Smith&Waterman的局部同源性算法进行(Adv.Appl.Math.2:482(1981))，通过使用Needleman&Wunsch的同源比对算法进行(J Mol.Biol.48：443(1970))，通过Pearson&Lipman的相似性方法的搜索进行(Proc.Nat’ l.Acad.Sci.USA 85:2444(1988))，通过这些算法(GAP，BESTFIT，FASTA和TFASTA，在威斯康星州遗传学软件包，Genetics Computer Group,575Science Dr.,Madison,WI)计算机化实施，或通过目测(大体参见，Current Protocols in Molecular Biology,F.M.Ausubel等人编辑，Current Protocols,Greene Publishing Associates,Inc.和John Wiley&Sons,Inc.的合资项目(1995年增补版)(Ausubel))。

适用于确定序列同一性百分比和序列相似性的算法的示例为BLAST和BLAST 2.0算法，其分别在Altschul等人，(1990)J.Mol.Biol.215:403-410和Altschul等人，(1997)Nucleic Acids Res.25:3389-3402中有所描述。用于执行BLAST分析的软件可通过国家生物技术信息中心公开获得。该算法涉及首先通过识别查询序列中长度为W的短字词来识别高评分序列对(HSP)，当与数据库序列中相同长度的字词比对时，该短字词匹配或满足一些正值阈值分数T。T被称为邻近字词分数阈值(Altschul等人，出处同上)。这些初始邻近字词命中充当用于发起搜索以找到包含它们的较长HSP的种子。然后将字词命中沿每个序列在两个方向上延伸，只要可增加累积的比对分数。

对于核苷酸序列，使用参数M(一对匹配残基的奖励分数；始终>0)和N(错配残基的处罚分数；始终<0)计算累积分数。对于氨基酸序列，评分矩阵用于计算累积分数。字词命中在每个方向上的延伸在以下情况下停止：累积比对分数从其最大实现值下降数量X；累积分数由于一个或多个负分数残基比对的累积而变为零或更低；或到达任一序列的末端。BLAST算法参数W、T和X确定比对的灵敏度和速度。BLASTN程序(用于核苷酸序列)默认使用字长(W)11、期望值(E)10、M＝5、N＝-4以及两条链的比较。对于氨基酸序列，BLASTP程序默认使用字长(W)3、期望值(E)10以及BLOSUM62评分矩阵(参见Henikoff和Henikoff，Proc.Natl.Acad.Sci.USA 89:10915(1989))。

除了计算序列同一性百分比之外，BLAST算法还对两条序列之间的相似性进行统计分析(参见例如Karlin和Altschul，Proc.Nat’l.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法提供的一种相似性量度是最小总和概率(P(N))，其提供了两条核苷酸或氨基酸序列之间偶然发生匹配的概率的指示。例如，如果在测试核酸与参考核酸的比较中最小总和概率小于约0.1，更优选地小于约0.01，并且最优选地小于约0.001，则认为核酸类似于参考序列。

两个核酸序列或多肽基本上相同的另一个指示是由第一核酸编码的多肽与由第二核酸编码的多肽免疫地交叉反应，如下所述。因此，多肽通常与第二多肽基本上相同，例如，其中两个肽仅通过保守置换而不同。两个核酸序列基本上相同的另一个指示是，两个分子在严格条件下彼此杂交。

术语“野生型NPT”和“野生型新霉素磷酸转移酶”在本文中可互换使用，并且为技术人员所理解的。一般来讲，野生型NPT是指新霉素磷酸转移酶，其在自然界中的生物体中很普遍。在一些实施方案中，野生型NPT为氨基糖苷磷酸转移酶3'-II。在某些实施方案中，野生型NPT为氨基糖苷磷酸转移酶3'-IIa。在一些实施方案中，野生型NPT为来自Tn5的新霉素磷酸转移酶(氨基糖苷磷酸转移酶3'-IIa)。在具体的实施方案中，野生型NPT包含SEQ IDNO:1的氨基酸序列。在另一个具体的实施方案中，野生型NPT包含SEQ ID NO:44的氨基酸序列。在其他实施方案中，野生型NPT包含除SEQ ID NO:1或SEQ ID NO:44之外的氨基酸序列。

本文所述的NPT中的取代的氨基酸位置的描述与SEQ ID NO:1的氨基酸位置有关。例如，在对应于SEQ ID NO:1的氨基酸残基36和210的野生型NPT的氨基酸残基处的氨基酸取代是指在诸如图6A至图6B中提供的比对中具有以下氨基酸取代的野生型NPT：在对应于SEQ ID NO:1的氨基酸残基36和210的野生型NPT的氨基酸残基处的氨基酸取代。在图6A至图6B中，APH(3')-IIa的序列为参考序列(即，对应于SEQ ID NO:1的氨基酸序列)，并且与其他野生型NPT进行比较。编码SEQ ID NO:1的氨基酸序列的示例性核酸序列以SEQ ID NO:6的形式被提供。

如本文所用，短语“选择性标记工具”是指本文所述的NPT突变体或非天然存在的NPT，或者编码本文所述的NPT突变体或非天然存在的NPT的核苷酸序列，其允许宿主细胞在新霉素磷酸转移酶底物(例如，新霉素、卡那霉素或G418或它们的衍生物)的存在下生长。

如本文所用，短语“用于在新霉素磷酸转移酶底物(例如，新霉素、卡那霉素或G418或它们的衍生物)的存在下生长的工具”是指本文所述的NPT突变体或非天然存在的NPT，或者编码本文所述的NPT突变体或非天然存在的NPT的核苷酸序列，其允许宿主细胞在新霉素磷酸转移酶底物的存在下生长。

7.1新霉素磷酸转移酶(NPT)蛋白质

在一个方面，本文提供了在氨基酸序列方面与野生型NPT不同并且相比于野生型NPT具有经改变的磷酸转移酶活性(例如，减少的磷酸转移酶活性)的NPT突变体。在一个实施方案中，NPT突变体包含野生型NPT中的本文所述的一个、两个或更多个氨基酸取代(例如，在表1或表2中)或它们的组合。在具体的实施方案中，本文所提供的NPT突变体为非天然存在的NPT蛋白质。在某些实施方案中，本文所提供的NPT突变体为经分离的NPT蛋白质。在具体的实施方案中，相比于野生型NPT，本文所提供的NPT突变体作为选择性标记具有衰减的活性。在具体实施方案中，在本文所述的或本领域技术人员已知的测定中，相比于对应的野生型NPT，NPT突变体具有减少的酶活性。例如，NPT的酶活性可以在体外激酶测定中进行测量，诸如在Kocabiyik和Perlin，Biochem Biophys Res Commun 185(3):925-931(1992)中所描述的。在相同条件下，将NPT突变体的酶活性与对应的野生型NPT进行比较。另选地或另外地，酶活性NPT可以通过评估由用编码NPT突变体的质粒转化的细菌(例如，大肠杆菌)在含有一定量的卡那霉素(例如，25μg/ml、75μg/ml或100μg/ml)和用于细菌生长的适当营养物质以及用于细菌生长的适当条件(例如，温度等)的板上在一定时间段后(例如，36小时、48小时、72小时或更长)进行的集落形成来间接测量。将用编码NPT突变体的核苷酸序列转化的细菌的集落形成与用编码对应的野生型NPT的核苷酸序列转化的相同菌种的细菌的集落形成进行比较，该相同菌种的细菌生长在与用编码NPT突变体的核苷酸序列转化的细菌相同的生长条件下，其中由用编码NPT突变体的核苷酸序列转化的细菌形成的集落相对于由用编码野生型NPT的质粒转化的细菌形成的集落更少和/或更小指出NPT突变体的酶活性和/或蛋白质稳定性被衰减。用以评估NPT突变体的酶活性的间接测定的另一个示例涉及将由用编码NPT突变型蛋白质的DNA转染或转化的哺乳动物细胞进行的集落形成与由用编码对应的野生型NPT的DNA转染的哺乳动物细胞进行的集落形成进行比较，其中两种哺乳动物细胞群在相同条件下(例如，相同温度、CO₂等)在含有生长所必需的培养基和一定浓度的G418(例如，500μg/ml)的板或另一种适当类型的容器上生长一定时间段(例如，2周、2.5周、3周或更长)，其中相比于由用野生型NPT转染的哺乳动物细胞进行的集落形成，由用NPT突变体转染的哺乳动物细胞进行的集落形成的减少指出NPT突变体具有衰减的酶活性。

用以评估NPT基因的酶活性的间接测定的另一个示例涉及测量用哺乳动物表达构建体转染的细胞的比例，该细胞将构建体稳定整合至宿主染色体中并且当在含有筛选剂的培养基中在组织培养皿中进行稀释和铺板时形成集落。例如，将用设计成表达野生型或突变型NPT亚型的质粒转染的HEK293细胞以2E6个细胞或更少的细胞在含有10％胎牛血清和600μg/ml G418的DMEM培养基中被铺板至150mm组织培养皿中，并且在37℃下在8％CO₂下培养2周。去除培养基，并且细胞用10ml 0.4％亚甲蓝在50％甲醇中的溶液通过在室温下温育10分钟来进行染色。去除染色剂，细胞用100％甲醇洗涤，风干并拍照。相对于野生型NPT表达构建体，使用突变型NPT表达构建体铺板的集落：细胞数的比例的降低指出突变体具有衰减的酶活性。

在某些实施方案中，相比于野生型NPT，具有减少的活性的NPT突变体表现出野生型NPT(例如，SEQ ID NO:1或SEQ ID NO:44)的磷酸转移酶活性的0.001％至10％，如在合适的测定中所确定的。在一些实施方案中，相比于野生型NPT，具有减少的活性的NPT突变体表现出野生型NPT(例如，SEQ ID NO:1或SEQ ID NO:44)的磷酸转移酶活性的0.001％至8％，如在合适的测定中所确定的。在某些实施方案中，相比于野生型NPT，具有减少的活性的NPT突变体表现出野生型NPT(例如，SEQ ID NO:1或SEQ ID NO:44)的磷酸转移酶活性的0.01％至6％，如在合适的测定中所确定的。NPT磷酸转移酶活性可以使用本领域已知的(参见例如Kocabiyik和Perlin，Biochem Biophys Res Commun 185(3):925-931(1992)以及其中引用的参考文献，以查找测定磷酸转移酶活性的示例性方法)或本文所述的(例如，集落形成)测定中的任何测定来进行测量。在某些实施方案中，NPT突变体具有在野生型NPT的氨基酸序列中的一个或两个氨基酸取代，其中在野生型NPT的氨基酸残基处的氨基酸取代对应于表1或表2中列举的SEQ ID NO:1的氨基酸残基中的一个或两个氨基酸残基。在一些实施方案中，NPT突变体具有在野生型NPT的氨基酸序列中的一个氨基酸取代，其中氨基酸取代在野生型NPT的氨基酸残基处，该氨基酸残基对应于表1或表2中列举的SEQ ID NO:1的氨基酸残基中的一个氨基酸残基。在具体的实施方案中，NPT突变体具有减少的活性，如通过本领域技术人员已知的或本文所述的技术所评估的。在某些实施方案中，NPT突变体具有在野生型NPT的氨基酸序列中的两个氨基酸取代，其中氨基酸取代在野生型NPT的氨基酸残基中的两个氨基酸残基处，该氨基酸残基对应于表1或表2中列举的SEQ ID NO:1的氨基酸残基中的两个氨基酸残基。在具体的实施方案中，NPT突变体具有减少的活性，如通过本领域技术人员已知的或本文所述的技术所评估的。

在某些实施方案中，NPT突变体具有在具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的氨基酸序列中的一个或两个氨基酸取代，其中在变体的氨基酸残基处的氨基酸取代对应于表1或表2中列举的SEQ ID NO:1的氨基酸残基中的一个或两个氨基酸残基。在一些实施方案中，NPT突变体具有在具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的氨基酸序列中的一个氨基酸取代，其中氨基酸取代在变体的氨基酸残基处，该氨基酸残基对应于表1或表2中列举的SEQ ID NO:1的氨基酸残基中的一个氨基酸残基。在具体的实施方案中，NPT突变体具有减少的活性，如通过本领域技术人员已知的或本文所述的技术所评估的。在某些实施方案中，NPT突变体具有在具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的氨基酸序列中的两个氨基酸取代，其中氨基酸取代在对应于表1或表2中列举的SEQ ID NO:1的氨基酸残基中的两个氨基酸残基的变体的氨基酸残基中的两个氨基酸残基处。在具体的实施方案中，NPT突变体具有减少的活性，如通过本领域技术人员已知的或本文所述的技术所评估的。

在某些实施方案中，本文所提供的NPT突变体通过具有在对应于SEQ ID NO:1的位置36处的氨基酸的位置处的甲硫氨酸以及在对应于SEQ ID NO:1的位置210处的氨基酸的位置处的丙氨酸而不同于野生型NPT。在某些实施方案中，NPT突变体通过具有在对应于SEQID NO:1的位置36处的氨基酸的位置处的甲硫氨酸以及在对应于SEQ ID NO:1的位置182处的氨基酸的位置处的天冬氨酸而不同于野生型NPT。在某些实施方案中，NPT突变体通过具有在对应于SEQ ID NO:1的位置36处的氨基酸的位置处的甲硫氨酸以及在对应于SEQ IDNO:1的位置218处的氨基酸的位置处的苯丙氨酸而不同于野生型NPT。在某些实施方案中，NPT突变体通过具有在对应于SEQ ID NO:1的位置216处的氨基酸的位置处的甘氨酸以及在对应于SEQ ID NO:1的位置261处的氨基酸的位置处的天冬酰胺而不同于野生型NPT。在某些实施方案中，NPT突变体通过具有在对应于SEQ ID NO:1的位置36处的氨基酸的位置处的甲硫氨酸以及在对应于SEQ ID NO:1的位置218处的氨基酸的位置处的丝氨酸而不同于野生型NPT。在某些实施方案中，NPT突变体通过具有在对应于SEQ ID NO:1的位置36处的氨基酸的位置处的甲硫氨酸以及在对应于SEQ ID NO:1的位置216处的氨基酸的位置处的甘氨酸而不同于野生型NPT。在具体的实施方案中，NPT突变体具有减少的活性，如通过本领域技术人员已知的或本文所述的技术所评估的。

在某些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的野生型新霉素磷酸转移酶的氨基酸序列：在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。在一些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的野生型新霉素磷酸转移酶的氨基酸序列：在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。在某些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的野生型新霉素磷酸转移酶的氨基酸序列：在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。在一些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的野生型新霉素磷酸转移酶的氨基酸序列：在对应于SEQID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ IDNO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。在某些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的野生型新霉素磷酸转移酶的氨基酸序列：在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。在一些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的野生型新霉素磷酸转移酶的氨基酸序列：在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。在具体的实施方案中，非天然存在的NPT具有减少的活性，如通过本领域技术人员已知的或本文所述的技术所评估的。

在一些实施方案中，野生型NPT包含与SEQ ID NO:1或SEQ ID NO:44至少50％、至少55％或至少60％相同的氨基酸序列。在某些实施方案中，野生型NPT包含与SEQ ID NO:1或SEQ ID NO:44至少65％、至少70％或至少75％相同的氨基酸序列。在一些实施方案中，野生型NPT包含与SEQ ID NO:1或SEQ ID NO:44至少80％、至少90％或至少98％相同的氨基酸序列。在某些实施方案中，野生型NPT包含与SEQ ID NO:1或SEQ ID NO:44有50％至75％、50％至80％、50％至60％、75％至95％或85％至95％相同的氨基酸序列。在一些实施方案中，野生型序列的基序1、基序2或基序3分别与SEQ ID NO:1或SEQ ID NO:44的基序1、基序2或基序3相同。在某些实施方案中，野生型序列的基序1、基序2和基序3分别与SEQ ID NO:1或SEQ ID NO:44的基序1、基序2和基序3相同。在一些实施方案中，野生型序列的基序1、基序2和基序3的组合分别与SEQ ID NO:1或SEQ ID NO:44的基序1、基序2和基序3的组合相同。在一些实施方案中，野生型序列的基序1、基序2或基序3分别与SEQ ID NO:1或SEQ IDNO:44的基序1、基序2或基序3至少85％、至少90％或至少95％相同。在某些实施方案中，野生型序列的基序1、基序2和基序3分别与SEQ ID NO:1或SEQ ID NO:44的基序1、基序2和基序3至少85％、至少90％或至少95％相同。在一些实施方案中，野生型序列的基序1、基序2和基序3的组合分别与SEQ ID NO:1或SEQ ID NO:44的基序1、基序2和基序3的组合至少85％、至少90％或至少95％相同。在一些实施方案中，野生型序列的基序1、基序2和基序3的组合分别与SEQ ID NO:1或SEQ ID NO:44的基序1、基序2和基序3的组合至少98％或至少99％相同。

在某些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的氨基酸序列：在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。在一些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的氨基酸序列：在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。在某些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的氨基酸序列：在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。在一些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的氨基酸序列：在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。在某些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的氨基酸序列：在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。在一些实施方案中，本文提供了具有新霉素磷酸转移酶活性的非天然存在的NPT，其中非天然存在的NPT包含具有以下氨基酸取代的具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的氨基酸序列：在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。在具体的实施方案中，非天然存在的NPT突变体具有减少的活性，如通过本领域技术人员已知的或本文所述的技术所评估的。

在某些实施方案中，具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体包含与SEQ ID NO:1或SEQ ID NO:44至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。在某些实施方案中，具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体包含与SEQ ID NO:1或SEQ ID NO:44至少80％、至少90％或至少98％相同的氨基酸序列。在一些实施方案中，具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的基序1、基序2或基序3分别与SEQ ID NO:1或SEQ ID NO:44的基序1、基序2或基序3相同。在某些实施方案中，具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的基序1、基序2和基序3分别与SEQ ID NO:1或SEQ ID NO:44的基序1、基序2和基序3相同。参见例如，图6A至图6B，以查找氨基糖苷转移酶的基序1、基序2和基序3的位置。在一些实施方案中，具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的基序1、基序2和基序3的组合分别与SEQID NO:1或SEQ ID NO:44的基序1、基序2和基序3的组合相同。在一些实施方案中，具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的基序1、基序2或基序3分别与SEQ IDNO:1或SEQ ID NO:44的基序1、基序2或基序3至少85％、至少90％或至少95％相同。在某些实施方案中，具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的基序1、基序2和基序3分别与SEQ ID NO:1或SEQ ID NO:44的基序1、基序2和基序3至少85％、至少90％或至少95％相同。在一些实施方案中，具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的基序1、基序2和基序3的组合分别与SEQ ID NO:1或SEQ ID NO:44的基序1、基序2和基序3的组合至少85％、至少90％或至少95％相同。在一些实施方案中，具有野生型新霉素磷酸转移酶活性的新霉素磷酸转移酶变体的基序1、基序2和基序3的组合分别与SEQ IDNO:1或SEQ ID NO:44的基序1、基序2和基序3的组合至少98％或至少99％相同。

在某些实施方案中，NPT突变体包含具有一个或两个氨基酸取代的SEQ ID NO:1的氨基酸序列。在具体的实施方案中，NPT突变体为本文所提供的表1所列出的NPT突变体中的任何一种突变体。在另一个具体的实施方案中，NPT突变体为本文所提供的表2中所列出的NPT突变体中的任何一种突变体。

在某些实施方案中，本文所提供的NPT突变体通过具有在SEQ ID NO:1或SEQ IDNO:44的氨基酸位置36处的甲硫氨酸以及在SEQ ID NO:1或SEQ ID NO:44的氨基酸位置210处的丙氨酸而不同于SEQ ID NO:1或SEQ ID NO:44。在某些实施方案中，NPT突变体通过具有在SEQ ID NO:1或SEQ ID NO:44的氨基酸位置36处的甲硫氨酸以及在SEQ ID NO:1或SEQID NO:44的氨基酸位置182处的天冬氨酸而不同于SEQ ID NO:1或SEQ ID NO:44。在某些实施方案中，NPT突变体通过具有在SEQ ID NO:1或SEQ ID NO:44的氨基酸位置36处的甲硫氨酸以及在SEQ ID NO:1或SEQ ID NO:44的氨基酸位置218处的苯丙氨酸而不同于SEQ IDNO:1或SEQ ID NO:44。在某些实施方案中，NPT突变体通过具有在SEQ ID NO:1或SEQ IDNO:44的氨基酸位置216处的甘氨酸以及在SEQ ID NO:1或SEQ ID NO:44的氨基酸位置261处的天冬酰胺而不同于SEQ ID NO:1或SEQ ID NO:44。在某些实施方案中，NPT突变体通过具有在SEQ ID NO:1或SEQ ID NO:44的氨基酸位置36处的甲硫氨酸以及在SEQ ID NO:1或SEQ ID NO:44的氨基酸位置218处的丝氨酸而不同于SEQ ID NO:1或SEQ ID NO:44。在某些实施方案中，NPT突变体通过具有在SEQ ID NO:1或SEQ ID NO:44的氨基酸位置36处的甲硫氨酸以及在SEQ ID NO:1或SEQ ID NO:44的氨基酸位置216处的甘氨酸而不同于SEQ IDNO:1或SEQ ID NO:44。在某些实施方案中，本文所提供的NPT突变体为SEQ ID NO:1的双点NPT突变体。例如，在一些实施方案中，NPT突变体包含SEQ ID NO:38的氨基酸序列。在某些实施方案中，NPT突变体包含SEQ ID NO:39的氨基酸序列。在一些实施方案中，NPT突变体包含SEQ ID NO:40的氨基酸序列。在某些实施方案中，NPT突变体包含SEQ ID NO:41的氨基酸序列。在一些实施方案中，NPT突变体包含SEQ ID NO:42的氨基酸序列。在其他实施方案中，NPT突变体包含SEQ ID NO:43的氨基酸序列。

在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:12的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:13的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ IDNO:14的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:15的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:16的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:17的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:18的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:19的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:21的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:22的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:23的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ IDNO:24的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:25的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:26的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:27的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:28的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:29的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:30的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:31的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:35的核苷酸序列编码的氨基酸序列。

在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:20的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:32的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ IDNO:33的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:34的核苷酸序列编码的氨基酸序列。在某些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:36的核苷酸序列编码的氨基酸序列。在一些实施方案中，本文所提供的NPT突变体包含由SEQ ID NO:37的核苷酸序列编码的氨基酸序列。

在某些实施方案中，相对于用编码对应的野生型NPT(例如，SEQ ID NO:1)的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码如本文所提供的NPT突变体的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。“减少的集落形成”可以为，例如，相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞的卡那霉素抗性集落，集落减少0.001％至75％。在一些实施方案中，减少的集落形成为相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞的卡那霉素抗性集落，减少0.001％至10％。在某些实施方案中，减少的集落形成为相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞的卡那霉素抗性集落，减少0.01％至6％。

在一些实施方案中，相对于用编码野生型NPT(例如，SEQ ID NO:1)的核苷酸序列转染或转化的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的组织培养板上生长2周后，用编码如本文所提供的NPT突变体的核苷酸序列转染或转化的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的。“减少的集落形成”可以为，例如，相对于用编码野生型NPT的核苷酸序列转染的哺乳动物细胞的G418抗性集落，集落减少0.001％至75％。在一些实施方案中，减少的集落形成为相对于用野生型NPT转染的哺乳动物细胞的G418抗性集落，减少0.001％至10％。在某些实施方案中，减少的集落形成为相对于用编码野生型NPT的核苷酸序列转染的哺乳动物细胞的G418抗性集落，减少0.01％至6％。

本文所述的NPT突变体或非天然存在的NPT赋予对某些抗生素(例如，新霉素、卡那霉素、G418或任何前述物质的衍生物)的抗性。在具体的实施方案中，由细胞进行的本文所述的NPT突变体或非天然存在的NPT的表达使得细胞能够在新霉素磷酸转移酶底物(例如，新霉素、卡那霉素、G418或任何前述物质的衍生物)的存在下生长。在一些实施方案中，突变型NPT或非天然存在的NPT包含下文章节8中描述的氨基酸序列。

7.2核酸序列

在一个方面，本文提供了编码本文所述的NPT突变体的核酸。在具体的实施方案中，本文提供了包含编码本文所述的NPT突变体的核苷酸序列的核酸序列。在另一个具体的实施方案中，本文提供了包含编码本文所述的非天然存在的NPT的核苷酸序列的核酸序列。由于密码的简并度，编码NPT突变体或非天然存在的NPT的任何核苷酸序列均由本公开所涵盖。在某些实施方案中，编码NPT突变体或非天然存在的NPT的核苷酸序列为经密码子优化的(例如，针对在特定受试者或来自特定受试者的细胞中的表达而进行优化的密码子)。本领域已知的技术可以用于对编码NPT突变体或非天然存在的NPT的核苷酸序列进行密码子优化。核酸序列或核苷酸序列还可以包含一个或多个调控元件(例如，启动子、增强子等)。在一些实施方案中，核酸序列或核苷酸序列还可以包含以下项中的一者、两者或更多者或全部：启动子、增强子、内含子和poly-A序列。在一些实施方案中，核酸序列或核苷酸序列还可以包含启动子和复制起点序列。

在具体的实施方案中，核酸序列或核苷酸序列与其天然存在的核酸序列进行分离。在某些实施方案中，核酸序列或核苷酸序列与其天然存在的生物体进行分离。此外，“分离的”核酸序列，诸如cDNA分子，当通过重组技术产生时可基本上不含其他细胞材料或培养基，或当化学合成时基本上不含化学前体或其他化学品。例如，用语“基本上不含”包括具有少于约15％、10％、5％、2％、1％、0.5％或0.1％(特别是少于约10％)的其他材料(例如，细胞材料、培养基、其他核酸分子、化学前体和/或其他化学物质)的多核苷酸或核酸分子的制剂。

如本文所用，术语“核酸”和“核苷酸”包括脱氧核糖核苷酸、脱氧核糖核酸、核糖核苷酸和核糖核酸以及它们的聚合物形式，并且包括单链形式或双链形式。在某些实施方案中，术语“核酸”和“核苷酸”包括天然核苷酸的已知类似物，例如，具有与参考核酸类似结合特性的肽核酸(“PNA”)。在一些实施方案中，术语“核酸”和“核苷酸”是指脱氧核糖核酸(例如，cDNA或DNA)。在其他实施方案中，术语“核酸”和“核苷酸”是指核糖核酸(例如，mRNA或RNA)。

在某些实施方案中，本文提供了包含SEQ ID NO:12的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:13的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQ ID NO:14的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:15的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQID NO:16的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:17的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQ ID NO:18的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:19的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQ ID NO:21的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:22的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQ ID NO:23的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:24的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQ ID NO:25的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:26的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQ ID NO:27的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:28的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQ ID NO:29的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:30的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQ ID NO:31的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQ IDNO:35的核苷酸序列的核酸序列。

在某些实施方案中，本文提供了包含SEQ ID NO:20的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:32的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQ ID NO:33的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:34的核苷酸序列的核酸序列。在某些实施方案中，本文提供了包含SEQID NO:36的核苷酸序列的核酸序列。在一些实施方案中，本文提供了包含SEQ ID NO:37的核苷酸序列的核酸序列。

在某些实施方案中，本文提供了核酸序列，该核酸序列包含：第一核苷酸序列，其编码本文所述的NPT突变体或非天然存在的NPT；以及第二核苷酸序列。第二核苷酸序列可以编码感兴趣的蛋白质或非编码RNA，或者可以包含破坏宿主细胞中内源性基因的核苷酸序列。在一些实施方案中，本文提供了核酸序列，该核酸序列包含：第一核苷酸序列，其编码本文所述的NPT突变体或非天然存在的NPT；以及第二核苷酸序列，其编码感兴趣的蛋白质或非编码RNA。在某些实施方案中，核酸序列还可以包含附加的核苷酸序列(例如，转座子元件)。核酸序列还可以包含一个或多个调控元件(例如，启动子、增强子等)、复制起点和/或poly-A序列。在某些实施方案中，第一核苷酸序列和第二核苷酸序列可操作地连接至相同的启动子。在其他实施方案中，第一核苷酸序列和第二核苷酸序列可操作地连接至不同的启动子。

在某些实施方案中，本文提供了核酸序列，该核酸序列包含：第一核苷酸序列，其编码本文所述的NPT突变体或非天然存在的NPT；感兴趣的基因的第一片段的第二核苷酸序列；以及感兴趣的基因的第二片段的第三核苷酸序列，其中第二核苷酸序列在5'端部处侧接第一核苷酸序列，并且第三核苷酸序列在3'端部处侧接第一核苷酸序列，其中第一片段和第二片段有利于感兴趣的基因的重组和破坏。在一些实施方案中，核酸序列还包含第二核苷酸序列上游的loxP核苷酸序列和第三核苷酸序列下游的loxP核苷酸序列。参见例如Güldener等人，Nucleic Acids Research 24(13):2519–2524(1996)，以查找此类核酸序列是如何产生和使用的。核酸序列还可以包含一个或多个调控元件(例如，启动子、增强子等)、poly-A序列等。

在某些实施方案中，本文提供了核酸序列，该核酸序列包含：第一核苷酸序列，其编码本文所述的NPT突变体或非天然存在的NPT；第二核苷酸序列，其编码感兴趣的蛋白质；第三核苷酸序列，其包含第一转座酶序列；以及第四核苷酸序列，其包含第二转座酶序列，其中第三核苷酸序列在第一核苷酸序列和第二核苷酸序列的上游，并且其中第四核苷酸序列在第一核苷酸序列和第二核苷酸序列的下游。在一些实施方案中，第一转座酶序列为Leap-In左转座酶，并且第二转座酶为Leap-In转座酶。核酸序列还可以包含一个或多个调控元件(例如，启动子、增强子等)、复制起点和/或poly-A序列。

在具体的实施方案中，核酸序列为下文章节8中描述的核酸序列。

在某些实施方案中，本文提供了核酸序列，该核酸序列包含：第一核苷酸序列，其编码本文所述的NPT突变体或非天然存在的NPT；以及转基因。转基因可以为天然基因序列，或者它可以被修饰，例如用以包含用于适应在特定宿主细胞中进行表达的密码子优化。转基因可以包含编码感兴趣的蛋白质或非编码RNA的核苷酸序列。在具体的实施方案中，转基因可操作地连接至一个或多个调控元件(例如，启动子、增强子等)。

感兴趣的蛋白质可以为例如治疗性蛋白或可检测标记。在某些实施方案中，感兴趣的蛋白质为激素、生长因子、抗体、病毒蛋白、酶、细胞因子或它们的片段。在某些实施方案中，片段的长度为至少8个、至少9个、至少10个、至少11个或至少12个氨基酸。在一些实施方案中，感兴趣的蛋白质为抗原(例如，病毒、细菌、真菌或癌抗原)。在某些实施方案中，感兴趣的蛋白质为病毒蛋白，诸如衣壳蛋白、包膜蛋白或病毒复制所需的蛋白质。病毒蛋白可以为腺伴随病毒(AAV)、腺病毒、逆转录病毒、慢病毒、单纯疱疹病毒、牛痘病毒或杆状病毒蛋白。在一些实施方案中，感兴趣的蛋白质为肽或多肽，其可以用作治疗剂或用于诊断测定。

非编码RNA可以为例如反义RNA、微RNA(miRNA)、短发夹RNA(shRNA)、长链非编码RNA、催化RNA(包括例如核糖酶)、核糖体RNA、tRNA或用于CRISPR核酸酶的引导RNA。

在本文所提供的核酸序列的一些实施方案中，核酸序列还包含编码除NPT蛋白质之外的选择性标记的核苷酸序列。当被引入细胞中时，选择性标记赋予适用于人工选择的性状。选择性标记可以例如赋予对抗生素的抗性，或者该选择性标记可以编码在某些培养条件下真核细胞生长所必需的酶。选择性标记为本领域所熟知的。在某些实施方案中，选择性标记为赋予氨苄青霉素抗性的β-内酰胺酶。在一些实施方案中，选择性标记为荧光蛋白。在一些实施方案中，术语“选择标记”与“选择性标记”可互换使用。

可以使用选择标记，包括但不限于单纯疱疹病毒胸苷激酶(Wigler等人，Cell 11:223(1977))、次黄嘌呤鸟嘌呤磷酸核糖转移酶(Szybalska&Szybalski，Proc.Natl.Acad.Sci.USA 48:202(1992)和腺嘌呤磷酸核糖转移酶(Lowy等人，Cell 22:8-17(1980))基因，可分别用于tk-、hgprt-或aprt-细胞。此外，抗代谢物抗性可用作以下基因的选择基础：dhfr，其赋予对甲氨蝶呤的抗性(Wigler等人，Proc.Natl.Acad.Sci.USA 77:357(1980)；O'Hare等人，Proc.Natl.Acad.Sci.USA 78:1527(1981))；gpt，其赋予对霉酚酸的抗性(Mulligan&Berg，Proc.Natl.Acad.Sci.USA 78:2072(1981))；和hygro，其赋予对潮霉素的抗性(Santerre等人，Gene 30:147(1984))。

7.3载体

在另一方面，本文提供了包含核酸序列的载体，该核酸序列包含编码本文所述的NPT突变体或非天然存在的NPT的核苷酸序列。在具体的实施方案中，本文提供了包含本文所述(例如，在章节7.2或章节8中)的核酸序列或核苷酸序列的载体。在一些实施方案中，本文提供了载体，该载体包含：第一核苷酸序列，其编码本文所述的NPT突变体或非天然存在的NPT；以及第二核苷酸序列，其编码感兴趣的蛋白质或非编码RNA。在某些实施方案中，本文提供了载体，该载体包含：第一核苷酸序列，其编码本文所述的NPT突变体或非天然存在的NPT；感兴趣的基因的第一片段的第二核苷酸序列；以及感兴趣的基因的第二片段的第三核苷酸序列，其中第二核苷酸序列在5'端部处侧接第一核苷酸序列，并且第三核苷酸序列在3'端部处侧接第一核苷酸序列，并且其中第一片段和第二片段有利于感兴趣的基因的重组和破坏。在一些实施方案中，载体还包含第二核苷酸序列上游的loxP核苷酸序列和第三核苷酸序列下游的loxP核苷酸序列。

在具体的实施方案中，载体为下文章节8中描述的载体。

根据本公开，可使用本领域的技术人员已知的任何载体，诸如质粒、粘端质粒、噬菌体载体或病毒载体。在一些实施方案中，载体是重组表达载体，诸如质粒。载体可包括建立表达载体的常规功能的任何元件，例如启动子、核糖体结合元件、终止子、增强子、选择标记和复制起点。启动子可为组成型、诱导型或阻抑型启动子。能够向细胞递送核酸的多种表达载体在本领域中是已知的，并且在本文可用于在细胞中产生蛋白质或非编码RNA。常规克隆技术或人工基因合成可以用于根据本文所提供的实施方案生成重组表达载体。根据本公开，此类技术是本领域技术人员所熟知的。

在某些实施方案中，载体为包含编码NPT突变体的核酸的克隆载体。克隆载体可以为例如质粒、噬菌体、病毒、粘粒、游离体或细菌人工染色体。还可参见章节7.4以查找载体，该载体包括本文所涵盖的表达载体。

7.4用于NPT突变体的表达的方法

在一个方面，本文提供了用于产生本文所述的NPT突变体或非天然存在的NPT以及任选地一种或多种附加的蛋白质或非编码RNA的方法。

在某些方面，本文提供了表达(例如，重组表达)本文所述的NPT突变体或非天然存在的NPT以及任选地一种或多种附加的蛋白质或一种或多种非编码RNA或两者的细胞(例如，宿主细胞)。在另一方面，本文提供了包含核酸序列的载体(例如，表达载体)，其中核酸序列包含编码本文所述的NPT突变体或非天然存在的NPT的核苷酸序列以及任选地编码一种或多种附加的蛋白质或非编码RNA或两者的一种或多种核苷酸序列，以用于在宿主细胞(例如，哺乳动物细胞)中的重组表达。本文还提供包含核酸序列的宿主细胞，该核酸序列包含编码本文所述的NPT突变体或非天然存在的NPT的核苷酸以及任选地编码一种或多种附加的蛋白质或非编码RNA或两者的一种或多种核苷酸序列。在具体的实施方案中，本文提供了包含两种载体的宿主细胞，其中第一载体包含核酸序列，该核酸序列包含编码NPT突变体或非天然存在的NPT的核苷酸序列，并且第二载体包含核酸序列，该核酸序列包含编码一种或多种附加的蛋白质或一种或多种非编码RNA或两者的一种或多种核苷酸序列。

可以使用的细胞的示例包括该节以及下文章节7.5和章节8中描述的那些。细胞可以为原代细胞或细胞系。在具体实施方案中，宿主细胞与其他细胞进行分离。在另一个实施方案中，宿主细胞不存在于受试者的身体内。在细胞或身体的上下文中，术语“受试者”是指任何生物体(例如，细菌或哺乳动物)。受试者可以为人或非人哺乳动物。

NPT突变体或非天然存在的NPT以及任选地一种或多种附加的蛋白质或一种或多种非编码RNA或两者可以通过本领域已知的任何方法产生，诸如例如通过化学合成或通过重组表达技术。除非另有说明，否则本文所述的方法采用分子生物学、微生物学、遗传分析、重组DNA、有机化学、生物化学、PCR、寡核苷酸合成和修饰、核酸杂交和本领域技术内的相关领域中的常规技术。这些技术描述于本文所引用的参考文献中并且在文献中充分解释。参见例如，Maniatis等人，(1982)Molecular Cloning:A Laboratory Manual Cold SpringHarbor Laboratory Press；Sambrook等人，(1989),Molecular Cloning:A LaboratoryManual Second Edition,Cold Spring Harbor Laboratory Press；Sambrook等人，(2001)Molecular Cloning:A Laboratory Manual Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY；Ausubel等人，Current Protocols in Molecular Biology,JohnWiley&Sons(1987年且年度更新)；Current Protocols in Immunology,John Wiley&Sons(1987年且年度更新)Gait(编辑)(1984)Oligonucleotide Synthesis:A PracticalApproach,IRL Press；Eckstein(编辑)(1991)Oligonucleotides and Analogues:APractical Approach,IRL Press；Birren等人，(编辑)(1999)Genome Analysis:ALaboratory Manual Cold Spring Harbor Laboratory Press。

蛋白质(例如，NPT突变体或非天然存在的NPT，以及任选地感兴趣的蛋白质)可以使用本领域已知的多种技术来进行制备，该多种技术包括重组和噬菌体展示技术或它们的组合。噬菌体展示方法的示例包括在以下文献中公开的那些方法：Brinkman等人，1995,J.Immunol.Methods 182:41-50；Ames等人，1995,J.Immunol.Methods 184:177-186；Kettleborough等人，1994,Eur.J.Immunol.24:952-958；Persic等人，1997,Gene 187:9-18；Burton等人，1994,Advances in Immunology 57:191-280；PCT申请号PCT/GB91/01134；国际公布号WO 90/02809、WO 91/10737、WO 92/01047、WO 92/18619、WO 93/1 1236、WO95/15982、WO 95/20401和W097/13844；和美国专利号5,698,426、5,223,409、5,403,484、5,580,717、5,427,908、5,750,753、5,821,047、5,571,698、5,427,908、5,516,637、5,780,225、5,658,727、5,733,743和5,969,108。

表达载体可以通过常规技术来转移至细胞(例如，宿主细胞)，并且所得细胞然后可以通过常规技术来进行培养以产生NPT突变体或非天然存在的NPT，并且任选地感兴趣的蛋白质或非编码RNA可以进行纯化或分离。可以通过例如电穿孔、转染、感染、热休克、显微注射、染色体转移或本领域技术人员已知的任何技术来将载体(例如，表达载体)或核酸序列或核苷酸序列引入细胞(例如宿主细胞)中。

多种宿主表达载体系统可以用于表达NPT突变体或非天然存在的NPT以及任选地感兴趣的蛋白质或非编码RNA。此类宿主表达系统代表了可产生并随后纯化感兴趣的编码序列的媒介物，而且也代表了在经适当的核苷酸编码序列转化或转染时可原位表达本文所述的蛋白质的细胞。这些包括但不限于用重组噬菌体DNA、质粒DNA或粘粒DNA表达载体转化的微生物诸如细菌(例如，大肠杆菌和枯草芽孢杆菌(B.subtilis))；用重组酵母表达载体转化的酵母(例如，毕赤酵母(Saccharomyces,Pichia))；用重组病毒表达载体(例如，杆状病毒)感染的昆虫细胞系统；植物细胞系统(例如，绿藻诸如莱茵衣藻(Chlamydomonasreinhardtii)，或烟草植物)，该植物细胞系统用重组病毒表达载体(例如，花椰菜花叶病毒，CaMV；烟草花叶病毒，TMV)感染或用重组质粒表达载体(例如，Ti质粒)转化；或携带重组表达构建体的哺乳动物细胞系统(例如，COS、CHO、BHK、MDCK、HEK 293、NSO、PER.C6、VERO、CRL7030、HsS78Bst、HeLa和NIH 3T3细胞)，该重组表达构建体含有衍生于哺乳动物细胞的基因组的启动子(例如，金属硫蛋白启动子)或衍生于哺乳动物病毒的启动子(例如，腺病毒晚期启动子；牛痘病毒7.5K启动子)。

在细菌系统中，根据旨在用于所表达的非编码RNA的感兴趣的蛋白质的用途，可以有利地选择许多表达载体。在昆虫系统中，加州苜蓿夜蛾(Autographa californica)核型多角体病毒(AcNPV)可以用作表达外来基因的载体。病毒在秋粘虫(Spodopterafrugiperda)细胞中生长。在哺乳动物宿主细胞中，可利用许多基于病毒的表达系统。在将腺病毒用作表达载体的情况下，可将感兴趣的蛋白质连接到腺病毒转录/翻译控制复合物，例如晚期启动子和三联前导序列。然后该嵌合基因可通过体外或体内重组插入在腺病毒基因组中。插入病毒基因组的非必需区(例如，El或E3区)将得到活的并能够在感染的宿主中表达感兴趣的蛋白质的重组病毒(例如，参见Logan和Shenk，1984,Proc.Natl.Acad.Sci.USA 8 1:355-359)。对于所插入的编码序列的有效翻译也可能需要特定的起始信号。这些信号包括ATG起始密码子和相邻序列。此外，起始密码子必须与期望的编码序列的阅读框相同，以确保整个插入物的翻译。这些外源翻译控制信号和起始密码子可以是天然和合成两者的多种来源。可通过包含适当的转录增强子元件、转录终止子等来增强表达效率(参见例如，Bittner等人，1987,Methods in Enzymol.153:51-544)。

如本文所用，术语“宿主细胞”是指任何类型的细胞，例如原代细胞或来自细胞系的细胞。宿主细胞可以为原代细胞，诸如成纤维细胞、淋巴细胞(例如，B细胞或T细胞)、上皮细胞、内皮细胞、神经元、星形胶质细胞、肝细胞、肌细胞、软骨细胞、脂肪细胞或干细胞(例如，胚胎干细胞)。另选地，宿主细胞可以为无限增殖化细胞。在具体的实施方案中，术语“宿主细胞”是指用核酸序列或核苷酸序列进行转染、感染、显微注射或转化或者以其他方式工程化以含有核酸序列或核苷酸序列的细胞，以及此类细胞的子代或潜在子代。由于可在子代中发生的突变或环境影响或者核酸序列或核苷酸序列整合至宿主细胞基因组中，因此此类细胞的子代可与用核酸序列或核苷酸序列转染的亲本细胞不同。

此外，可选择调节所插入的序列的表达或以期望的特定方式修饰和加工基因产物的宿主细胞株。蛋白质产物的此类修饰(例如，糖基化)和加工(例如，裂解)对于蛋白质的功能可能是重要的。不同的宿主细胞具有用于蛋白质和基因产物的翻译后加工和修饰的特征性和特异性机制。可选择适当的细胞系或宿主系统以确保对所表达的外来蛋白的正确修饰和加工。为此，可以使用具有用于基因产物的初级转录物的适当加工、糖基化和磷酸化的细胞机制的真核宿主细胞。此类哺乳动物宿主细胞包括但不限于CHO、VERO、BHK、Hela、COS、MDCK、HEK 293、NIH 3T3、W138、BT483、Hs578T、HTB2、BT20和T47D、NS0(鼠骨髓瘤细胞系)、CRL7030和HsS78Bst细胞。

对于重组蛋白的长期、高产率生产，稳定表达为优选的。不使用含有病毒复制起点的表达载体，而是用由适当表达控制元件(例如，启动子、增强子、序列、转录终止子、多腺苷酸化位点等)控制的核酸序列(例如，DNA)和选择性标记(例如，NPT突变体或非天然存在的NPT)转化宿主细胞。在引入外来DNA后，可以允许经工程化的细胞在富集培养基中生长一定时间段(例如，1天至2天)，并且然后切换至选择培养基(例如，含有抗生素的培养基，诸如在NPT突变体或非天然存在的NPT的情况下的新霉素、卡那霉素或G418)中。重组质粒中的选择性标记赋予选择抗性(例如，在NPT突变体或非天然存在的NPT的情况下的新霉素、卡那霉素或G418)，并且允许细胞将质粒稳定整合至其染色体中并长成集落，继而可将其克隆并扩增成细胞系。该方法可有利地用于使表达蛋白质的细胞系工程化。

在某些实施方案中，本文提供了用于产生包含第二核苷酸序列的宿主细胞的方法，该方法包括：(a)用第一核酸序列引入第一宿主细胞群，该第一核酸序列包含：(i)第一核苷酸序列，其编码NPT突变体或非天然存在的NPT，以及(ii)第二核苷酸序列(例如，编码第二蛋白质或非编码RNA的第二核苷酸序列)；(b)使第一宿主细胞群在卡那霉素、新霉素或G418或它们的衍生物的存在下生长，以产生集落；以及(c)选择在卡那霉素、新霉素或G418的存在下生长的细胞集落。在一些实施方案中，本文提供了一种用于产生包含第二核苷酸序列的宿主细胞的方法，该方法包括：(a)使第一宿主细胞群在卡那霉素、新霉素或G418或它们的衍生物的存在下生长，以产生集落，其中将第一核酸序列引入第一宿主细胞群中，并且其中第一核酸序列包含：(i)第一核苷酸序列，其编码NPT突变体或非天然存在的NPT，以及(ii)第二核苷酸序列(例如，编码第二蛋白质或非编码RNA的第二核苷酸序列)；以及(b)选择在卡那霉素、新霉素或G418的存在下生长的细胞集落。在具体的实施方案中，与用第二核酸序列转染或转化并且在卡那霉素、新霉素或G418的存在下生长的第二宿主细胞群相比，第一宿主细胞群产生更少的集落和/或更小的集落，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在某些实施方案中，与用第二核酸序列转染或转化并且在卡那霉素、新霉素或G418的存在下生长的第二宿主细胞群相比，第一宿主细胞群产生50倍至100倍、100倍至1000倍、1000倍至5000倍、5000倍至10000倍、1000倍至10000倍、10000倍至15000倍、5000倍至15000倍、15000倍至25000倍、10000倍至25000倍少的集落，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在具体的实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，第一宿主细胞群包含更高的第一核酸序列的拷贝数，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在某些实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，第一宿主细胞群包含5倍至10倍、5倍至15倍、2倍至5倍、2倍至10倍、2倍至15倍、或10倍至20倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或2倍至1000倍的第一核酸序列的拷贝数，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在一些实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，第一宿主细胞群包含至少2倍、至少5倍、至少10倍、至少15倍或至少20倍的第一核酸序列的拷贝数，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在具体的实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的第二核苷酸序列的表达水平，第一宿主细胞群实现了更高的第二核苷酸序列的表达水平，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在某些实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的第二核苷酸序列的表达水平，第一宿主细胞群实现了5倍至25倍、10倍至25倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或5倍至1000倍的第二核苷酸序列的表达水平，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在一些实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的第二核苷酸序列的表达水平，第一宿主细胞群实现了至少5倍、至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍或至少1000倍的第二核苷酸序列的表达水平，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。拷贝数可以使用本领域已知的任何技术来进行确定(例如，拷贝数可以使用数字小滴PCR来进行测量，以测量第二核苷酸序列相对于宿主细胞的基因组中的单拷贝内源性基因的丰度)。第二核苷酸序列的表达可以通过定量逆转录PCR(qPCR)在RNA水平下进行评估，或通过免疫测定法(例如，蛋白质印记或免疫细胞化学)在蛋白质水平下进行评估。此外，关于由第二核苷酸序列编码的一些蛋白质，可以评估该蛋白质的活性(例如，酶活性)。

在某些实施方案中，本文提供了用于产生包含转基因的宿主细胞的方法，该方法包括：(a)用第一核酸序列引入第一宿主细胞群，该第一核酸序列包含：(i)第一核苷酸序列，其编码NPT突变体或非天然存在的NPT，以及(ii)转基因；(b)使第一宿主细胞群在卡那霉素、新霉素或G418或它们的衍生物的存在下生长，以产生集落；以及(c)选择在卡那霉素、新霉素或G418的存在下生长的细胞集落。在一些实施方案中，本文提供了一种用于产生包含转基因的宿主细胞的方法，该方法包括：(a)使第一宿主细胞群在卡那霉素、新霉素或G418或它们的衍生物的存在下生长，以产生集落，其中将第一核酸序列引入第一宿主细胞群中，并且其中第一核酸序列包含：(i)第一核苷酸序列，其编码NPT突变体或非天然存在的NPT，以及(ii)转基因；以及(b)选择在卡那霉素、新霉素或G418的存在下生长的细胞集落。在具体的实施方案中，与用第二核酸序列转染或转化并且在卡那霉素、新霉素或G418的存在下生长的第二宿主细胞群相比，第一宿主细胞群产生更少的集落和/或更小的集落，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在某些实施方案中，与用第二核酸序列转染或转化并且在卡那霉素、新霉素或G418的存在下生长的第二宿主细胞群相比，第一宿主细胞群产生10倍至100倍、100倍至1000倍、1000倍至5000倍、5000倍至10000倍、1000倍至10000倍、10000倍至15000倍、5000倍至15000倍、15000倍至25000倍、10000倍至25000倍少的集落，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在具体的实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，第一宿主细胞群包含更高的第一核酸序列的拷贝数，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在某些实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，第一宿主细胞群包含5倍至10倍、5倍至15倍、2倍至5倍、2倍至10倍、2倍至15倍、或10倍至20倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或2倍至1000倍的第一核酸序列的拷贝数，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在一些实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，第一宿主细胞群包含至少2倍、至少5倍、至少10倍、至少15倍或至少20倍的第一核酸序列的拷贝数，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在具体的实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的第二核苷酸序列的表达水平，第一宿主细胞群实现了更高的第二核苷酸序列的表达水平，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在某些实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的第二核苷酸序列的表达水平，第一宿主细胞群实现了5倍至25倍、10倍至25倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或5倍至1000倍的第二核苷酸序列的表达水平，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在一些实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的转基因的表达水平，第一宿主细胞群实现了至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍或至少1000倍的转基因的表达水平，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。拷贝数可以使用本领域已知的任何技术来进行确定(例如，拷贝数可以使用数字小滴PCR来进行测量，以测量转基因相对于宿主细胞的基因组中的单拷贝内源性基因的丰度)。转基因的表达可以通过定量逆转录PCR(qPCR)在RNA水平下进行评估，或通过免疫测定法(例如，蛋白质印记或免疫细胞化学)在蛋白质水平下进行评估。此外，关于由转基因编码的一些蛋白质，可以评估蛋白质的活性(例如，酶活性)。

在某些实施方案中，本文提供了用于产生包含第二核苷酸序列的宿主细胞的方法，该方法包括：(a)用以下项引入第一宿主细胞群：(1)第一核酸序列，其包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列，以及(2)第二核酸序列，其包含第二核苷酸序列(例如，编码第二蛋白质或非编码RNA的第二核苷酸序列)；(b)使第一宿主细胞群在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长，以产生集落；以及(c)选择在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长的细胞集落。在一些实施方案中，本文提供了一种用于产生包含第二核苷酸序列的宿主细胞的方法，该方法包括：(a)使第一宿主细胞群在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长，以产生集落，其中将第一核酸序列和第二核酸序列引入第一宿主细胞群中，并且其中第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列，并且第二核酸序列包含第二核苷酸序列(例如，编码第二蛋白质或非编码RNA的第二核苷酸序列)；以及(b)选择在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长的细胞集落。在具体的实施方案中，与用第三核酸序列和第四核酸序列转染或转化并且在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长的第二宿主细胞群相比，第一宿主细胞群产生更少的集落和/或更小的集落，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含第二核苷酸序列。在某些实施方案中，与用第三核酸序列和第四核酸序列转染或转化并且在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长的第二宿主细胞群相比，第一宿主细胞群产生50倍至100倍、100倍至1000倍、1000倍至5000倍、5000倍至10000倍、1000倍至10000倍、10000倍至15000倍、5000倍至15000倍、15000倍至25000倍、10000倍至25000倍少的集落，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含第二核苷酸序列。在具体的实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二宿主细胞群所实现的第三核酸序列和/或第四核酸序列的拷贝数，第一宿主细胞群包含更高的第一核酸序列和/或第二核酸序列的拷贝数，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含第二核苷酸序列。在某些实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二宿主细胞群所实现的第三核酸序列和/或第四核酸序列的拷贝数，第一宿主细胞群包含5倍至10倍、5倍至15倍、2倍至5倍、2倍至10倍、2倍至15倍、或10倍至20倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或2倍至1000倍的第一核酸序列和/或第二核酸序列的拷贝数，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含第二核苷酸序列。在一些实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二宿主细胞群所实现的第三核酸序列和/或第四核酸序列的拷贝数，第一宿主细胞群包含至少2倍、至少5倍、至少10倍、至少15倍或至少20倍、至少50倍、至少100倍、至少200倍、至少500倍或至少1000倍的第一核酸序列和/或第二核酸序列的拷贝数，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含第二核苷酸序列。在具体的实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二细胞群所实现的第二核苷酸序列的表达水平，第一宿主细胞群实现了更高的第二核苷酸序列的表达水平，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含第二核苷酸序列。在某些实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二细胞群所实现的第二核苷酸序列的表达水平，第一宿主细胞群实现了5倍至25倍、10倍至25倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或5倍至1000倍的第二核苷酸序列的表达水平，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含第二核苷酸序列。在一些实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二细胞群所实现的第二核苷酸序列的表达水平，第一宿主细胞群实现了至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍或至少1000倍的第二核苷酸序列的表达水平，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含第二核苷酸序列。拷贝数可以使用本领域已知的任何技术来进行确定(例如，拷贝数可以使用数字小滴PCR来进行测量，以测量第二核苷酸序列相对于宿主细胞的基因组中的单拷贝内源性基因的丰度)。第二核苷酸序列的表达可以通过定量逆转录PCR(qPCR)在RNA水平下进行评估，或通过免疫测定法(例如，蛋白质印记或免疫细胞化学)在蛋白质水平下进行评估。此外，关于由第二核苷酸序列编码的一些蛋白质，可以评估该蛋白质的活性(例如，酶活性)。

在某些实施方案中，本文提供了用于产生包含转基因的宿主细胞的方法，该方法包括：(a)用以下项引入第一宿主细胞群：(1)第一核酸序列，其包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列，以及(2)第二核酸序列，其包含转基因(例如，编码第二蛋白质或非编码RNA的转基因)；(b)使第一宿主细胞群在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长，以产生集落；以及(c)选择在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长的细胞集落。在一些实施方案中，本文提供了一种用于产生包含转基因的宿主细胞的方法，该方法包括：(a)使第一宿主细胞群在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长，以产生集落，其中将第一核酸序列和第二核酸序列引入第一宿主细胞群中，并且其中第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列，并且第二核酸序列包含转基因(例如，编码第二蛋白质或非编码RNA的转基因)；以及(b)选择在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长的细胞集落。在具体的实施方案中，与用第三核酸序列和第四核酸序列转染或转化并且在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长的第二宿主细胞群相比，第一宿主细胞群产生更少的集落，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含转基因。在某些实施方案中，与用第三核酸序列和第四核酸序列转染或转化并且在新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)的存在下生长的第二宿主细胞群相比，第一宿主细胞群产生100倍至1000倍、1000倍至5000倍、5000倍至10000倍、1000倍至10000倍、10000倍至15000倍、5000倍至15000倍、15000倍至25000倍、10000倍至25000倍少的集落，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含转基因。在具体的实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二宿主细胞群所实现的第三核酸序列和/或第四核酸序列的拷贝数，第一宿主细胞群包含更高的第一核酸序列和/或第二核酸序列的拷贝数，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含转基因。在某些实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二宿主细胞群所实现的第三核酸序列和/或第四核酸序列的拷贝数，第一宿主细胞群包含5倍至10倍、5倍至15倍、2倍至5倍、2倍至10倍、2倍至15倍、或10倍至20倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或2倍至1000倍的第一核酸序列和/或第二核酸序列的拷贝数，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含转基因。在一些实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二宿主细胞群所实现的第三核酸序列和/或第四核酸序列的拷贝数，第一宿主细胞群包含至少2倍、至少5倍、至少10倍、至少15倍或至少20倍、至少50倍、至少100倍、至少200倍、至少500倍或至少1000倍的第一核酸序列和/或第二核酸序列的拷贝数，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含转基因。在具体的实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二细胞群所实现的转基因的表达水平，第一宿主细胞群实现了更高的转基因的表达水平，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含转基因。在某些实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二细胞群所实现的转基因的表达水平，第一宿主细胞群实现了5倍至25倍、10倍至25倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或5倍至1000倍的转基因的表达水平，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含转基因。在一些实施方案中，相比于由用第三核酸序列和第四核酸序列转染或转化的第二细胞群所实现的转基因的表达水平，第一宿主细胞群实现了至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍或至少1000倍的转基因的表达水平，其中第三核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列，并且其中第四核酸序列包含转基因。拷贝数可以使用本领域已知的任何技术来进行确定(例如，拷贝数可以使用数字小滴PCR来进行测量，以测量转基因相对于宿主细胞的基因组中的单拷贝内源性基因的丰度)。转基因的表达可以通过定量逆转录PCR(qPCR)在RNA水平下进行评估，或通过免疫测定法(例如，蛋白质印记或免疫细胞化学)在蛋白质水平下进行评估。此外，关于由转基因编码的一些蛋白质，可以评估蛋白质的活性(例如，酶活性)。

在具体的实施方案中，NPT突变体或非天然存在的NPT为在章节7.1或章节8中描述的NPT突变体或非天然存在的NPT。在一些实施方案中，转基因为章节7.2中描述的转基因。

重组DNA技术领域中通常已知的方法可常规地应用于选择期望的重组克隆，并且此类方法描述于例如Ausubel等人，(编辑)，Current Protocols in Molecular Biology，John Wiley和Sons，NY(1993)；Kriegler,Gene Transfer and Expression,A LaboratoryManual,Stockton Press,NY(1990)；以及第12章和第13章，Dracopoli等人，(编辑)，Current Protocols in Human Genetics,John Wiley和Sons,NY(1994)；Colberre-Garapin等人，1981,J.Mol.Biol.150:1，这些文献全文以引用方式并入本文。

宿主细胞可以用本文所述的两种或更多种表达载体共转染。这两种载体可以含有相同的选择性标记(例如，NPT突变体或非天然存在的NPT)，其使得感兴趣的蛋白质或非编码RNA的相等表达成为可能。宿主细胞可以用不同量的两种或更多种表达载体共转染。例如，宿主细胞可以用以下比率中的任一比率的第一表达载体和第二表达载体转染：1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:12、1:15、1:20、1:25、1:30、1:35、1:40、1:45或1:50。

另选地，可以使用单个载体，该单个载体编码并且能够表达本文所述的NPT突变体或非天然存在的NPT以及感兴趣的蛋白质或非编码RNA。表达载体可以为单顺反子的或多顺反子的。多顺反子核酸构建体可以编码2个、3个、4个、5个、6个、7个、8个、9个、10个或更多或者在2个至5个、5个至10个或10个至20个的范围内的基因/核苷酸序列。例如，双顺反子核酸构建体可以按以下顺序包含启动子、第一基因(例如，NPT突变体或非天然存在的NPT)和第二基因(例如，感兴趣的蛋白质或非编码RNA)。在此类表达载体中，两种基因的转录均可以由启动子来驱动，而来自第一基因的mRNA的翻译可以通过帽依赖性扫描机制来进行，并且来自第二基因的mRNA的翻译可以通过非帽依赖性机制来进行，例如通过IRES。

一旦通过重组表达产生了本文所述的感兴趣的蛋白质，其就可通过本领域已知的用于纯化蛋白质的任何方法，例如通过色谱法(例如，离子交换、亲和(特别是通过蛋白A后对特定抗原的亲和)和尺寸柱色谱法)、离心、差异溶解度或通过用于纯化蛋白质的任何其他标准技术来纯化。此外，感兴趣的蛋白质可以稠合至本领域已知的异源多肽序列(例如，Flag标签或His标签)，以有利于纯化。

在具体的实施方案中，分离或纯化本文所述的蛋白质(例如，NPT突变体或非天然存在的NPT，或感兴趣的蛋白质)。一般来讲，经分离的蛋白质为基本上不含除经分离的蛋白质以外的其他蛋白质的蛋白质。例如，在具体实施方案中，本文所述的蛋白质的制剂基本上不含细胞材料和/或化学前体。用语“基本上不含细胞材料”包括本文所述的蛋白质的制剂，其中蛋白质与其所分离或重组产生的细胞的细胞组分分离。因此，本文所述的基本上不含细胞材料的蛋白质包括具有小于约30％、20％、10％、5％、2％、1％、0.5％或0.1％(按干重计)的异源蛋白(本文也称为“污染蛋白”)和/或蛋白质的变体(例如，不同翻译后经修饰形式的蛋白质或其他不同型式的蛋白质)的蛋白质的制剂。当重组产生蛋白质时，该蛋白质通常也基本上不含培养基，即，培养基占蛋白质制剂体积的小于约20％、10％、2％、1％、0.5％或0.1％。当通过化学合成来生产蛋白质时，该蛋白质通常基本上不含化学前体或其他化学品，即，该蛋白质与参与蛋白质合成的化学前体或其他化学品分离。因此，此类蛋白质制剂具有小于约30％、20％、10％或5％(按干重计)的除感兴趣的蛋白质之外的化学前体或化合物。在具体的实施方案中，分离或纯化本文所述的蛋白质。

7.5细胞

在另一方面，本文提供了宿主细胞。在某些实施方案中，宿主细胞包含载体，该载体包含编码NPT突变体或非天然存在的NPT的核苷酸序列。在一些实施方案中，宿主细胞包含本文所述(例如，在章节7.2或章节8中)的核酸序列或核苷酸序列。在具体的实施方案中，宿主细胞包含含有SEQ ID NO:20的核酸序列。在另一个具体的实施方案中，宿主细胞包含含有SEQ ID NO:32的核酸序列。在另一个具体的实施方案中，宿主细胞包含含有SEQ IDNO:33的核酸序列。在另一个具体的实施方案中，宿主细胞包含含有SEQ ID NO:34的核酸序列。在另一个具体的实施方案中，宿主细胞包含含有SEQ ID NO:36的核酸序列。在另一个具体的实施方案中，宿主细胞包含含有SEQ ID NO:37的核酸序列。

在一些实施方案中，宿主细胞包含本文所述(例如，章节7.1或章节8)的NPT突变体或非天然存在的NPT。在某些实施方案中，宿主细胞表达本文所述(例如，章节7.1或章节8)的NPT突变体或非天然存在的NPT。

根据本公开，本文所述(例如，章节7.4或章节8)的或本领域技术人员已知的任何宿主细胞可以用于本文所述(例如，章节7.1或章节8)的NPT突变体或非天然存在的NPT的重组表达。例如，当将编码NPT突变体或非天然存在的NPT的核酸序列以及转基因引入细胞中时，可以培养此类宿主细胞并且使其共表达NPT突变体或非天然存在的NPT以及转基因。参见例如，章节7.4和章节8，以查找宿主细胞的示例。

在某些实施方案中，细胞(例如，宿主细胞)为体外或离体细胞。在某些实施方案中，宿主细胞与未由编码NPT突变体或非天然存在的NPT的核苷酸序列所转染或转化的细胞进行分离。宿主细胞可以为本文所述或本领域已知的任何类型的细胞。

在一些实施方案中，宿主细胞为细菌或真核细胞。在某些实施方案中，宿主细胞为酵母、昆虫、哺乳动物或植物细胞。在其中宿主细胞为细菌细胞的实施方案中，细胞为大肠杆菌细胞。示例性大肠杆菌细胞可以为，例如，大肠杆菌TG1或BL21细胞，但不限于此。

在一些实施方案中，宿主细胞为哺乳动物细胞。在某些实施方案中，宿主细胞来自人细胞系。合适的哺乳动物细胞包括，例如，CHO和HEK239细胞，以及它们的变体(例如，CHO-DG44或CHO-K1细胞)。

在某些实施方案中，宿主细胞为无限增殖化细胞系。在一些实施方案中，宿主细胞为HEK293、CHO、PER.C6、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

在具体的实施方案中，宿主细胞为原代细胞，诸如例如但不限于成纤维细胞或血细胞(例如，B细胞或T细胞)。在一些实施方案中，宿主细胞为胚胎干细胞。

在一些实施方案中，宿主细胞为昆虫细胞。在某些实施方案中，宿主细胞为植物细胞。

所培养的无限增殖化细胞可以用编码NPT突变体或非天然存在的NPT的核酸转染，以用于短期(瞬时)或长期(稳定)表达，这取决于引入细胞中的核酸是否被整合至宿主细胞基因组中。瞬时DNA表达通常持续24小时至72小时，而稳定DNA表达潜在地允许蛋白质的持久过表达。

根据具体实施方案，通过常规方法诸如化学转染、热休克或电穿孔将重组表达载体引入至宿主细胞中，使得重组核酸序列有效表达。

在某些实施方案中，编码本文所述的NPT突变体或非天然存在的NPT的核酸序列或核苷酸序列被稳定整合至细胞(例如，宿主细胞)的基因组中。核酸序列或核苷酸序列可以被随机整合至细胞(例如，宿主细胞)的基因组中。另选地，核酸序列或核苷酸序列可以在特定位置处被整合至细胞(例如，宿主细胞)的基因组中。核酸序列或核苷酸序列的多个拷贝可以被整合至细胞的基因组中。(例如，宿主细胞)。例如，宿主细胞可以含有被整合至其基因组中的核酸序列或核苷酸序列的5个、10个、15个、20个、25个或更多个拷贝。在一些实施方案中，转基因为本文所述(例如，在章节7.2中)的转基因。

在一些实施方案中，宿主细胞为哺乳动物细胞，并且编码NPT突变体或非天然存在的NPT的核酸序列或核苷酸序列以及任选地转基因通过转染、转导、感染、显微注射或染色体转移来引入细胞中。

在一些实施方案中，第二核苷酸序列编码本文所述的感兴趣的蛋白质或非编码RNA(例如，章节7.2)。

在具体的实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，用第一核酸序列转化或转染的第一宿主细胞群包含更高的第一核酸序列的拷贝数，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及第二核苷酸序列(例如，编码感兴趣的蛋白质或非编码RNA的第二核苷酸序列)，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在一些实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，用第一核酸序列转化或转染的第一宿主细胞群包含至少2倍、至少5倍、至少10倍、至少15倍或至少20倍、至少50倍、至少100倍、至少200倍、至少500倍或至少1000倍的第一核酸序列的拷贝数，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及第二核苷酸序列(例如，编码感兴趣的蛋白质或非编码RNA的第二核苷酸序列)，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在一些实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，用第一核酸序列转化或转染的第一宿主细胞群包含2倍至20倍、2倍至100倍、2倍至500倍、2倍至1000倍、50倍至100倍、50倍至500倍、50倍至1000倍或500倍至1000倍的第一核酸序列的拷贝数，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及第二核苷酸序列(例如，编码感兴趣的蛋白质或非编码RNA的第二核苷酸序列)，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在具体的实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的第二核苷酸序列的表达水平，用第一核酸序列转化或转染的第一宿主细胞群实现了更高的第二核苷酸序列的表达水平，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及第二核苷酸序列(例如，编码感兴趣的蛋白质或非编码RNA的第二核苷酸序列)，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在一些实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的第二核苷酸序列的表达水平，用第一核酸序列转化或转染的第一宿主细胞群实现了5倍至25倍、10倍至25倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或5倍至1000倍的第二核苷酸序列的表达水平，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及第二核苷酸序列(例如，编码感兴趣的蛋白质或非编码RNA的第二核苷酸序列)，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。在一些实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的第二核苷酸序列的表达水平，用第一核酸序列转化或转染的第一宿主细胞群实现了至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍或至少1000倍的第二核苷酸序列的表达水平，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及第二核苷酸序列(例如，编码感兴趣的蛋白质或非编码RNA的第二核苷酸序列)，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。拷贝数可以使用本领域已知的任何技术来进行确定(例如，拷贝数可以使用数字小滴PCR来进行测量，以测量第二核苷酸序列相对于宿主细胞的基因组中的单拷贝内源性基因的丰度)。第二核苷酸序列的表达可以通过定量逆转录PCR(qPCR)在RNA水平下进行评估，或通过免疫测定法(例如，蛋白质印记或免疫细胞化学)在蛋白质水平下进行评估。此外，关于由第二核苷酸序列编码的一些蛋白质，可以评估该蛋白质的活性(例如，酶活性)。

在具体的实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，用第一核酸序列转化或转染的第一宿主细胞群包含更高的第一核酸序列的拷贝数，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及转基因，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在一些实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，用第一核酸序列转化或转染的第一宿主细胞群包含至少2倍、至少5倍、至少10倍、至少15倍或至少20倍、至少50倍、至少100倍、至少200倍、至少500倍或至少1000倍的第一核酸序列的拷贝数，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及转基因，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在一些实施方案中，相比于由用第二核酸序列转染或转化的第二宿主细胞群所实现的第二核酸序列的拷贝数，用第一核酸序列转化或转染的第一宿主细胞群包含2倍至20倍、2倍至100倍、2倍至500倍、2倍至1000倍、50倍至100倍、50倍至500倍、50倍至1000倍或500倍至1000倍的第一核酸序列的拷贝数，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及转基因，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在具体的实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的转基因的表达水平，用第一核酸序列转化或转染的第一宿主细胞群实现了更高的转基因的表达水平，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及转基因，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在某些实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的转基因的表达水平，用第一核酸序列转化或转染的第一宿主细胞群实现了5倍至25倍、10倍至25倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或5倍至1000倍的转基因的表达水平，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及转基因，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。在一些实施方案中，相比于由用第二核酸序列转染或转化的第二细胞群所实现的转基因的表达水平，用第一核酸序列转化或转染的第一宿主细胞群实现了至少10倍、至少25倍、至少50倍、至少100倍、至少200倍、至少250倍、至少500倍或至少1,000倍的转基因的表达水平，其中第一细胞群包含第一核酸序列，该第一核酸序列包含编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及转基因，并且其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及转基因。拷贝数可以使用本领域已知的任何技术来进行确定(例如，拷贝数可以使用数字小滴PCR来进行测量，以测量转基因相对于宿主细胞的基因组中的单拷贝内源性基因的丰度)。转基因的表达可以通过定量逆转录PCR(qPCR)在RNA水平下进行评估，或通过免疫测定法(例如，蛋白质印记或免疫细胞化学)在蛋白质水平下进行评估。此外，关于由转基因编码的一些蛋白质，可以评估蛋白质的活性(例如，酶活性)。

在一些实施方案中，转基因为本文所述(例如，在章节7.2中)的转基因。在一些实施方案中，NPT突变体或非天然存在的NPT为本文所述(例如，在章节7.1或章节8中)的NPT突变体或非天然存在的NPT。

在某些实施方案中，宿主细胞为病毒细胞生产细胞系，该病毒细胞生产细胞系含有编码本文所述的NPT突变体或非天然存在的NPT的核酸序列或核苷酸序列。病毒生产细胞系可以表达衣壳蛋白或其他表面蛋白(例如，包膜蛋白)、复制所需的蛋白质或两者。合适的病毒生产细胞系可以用于AAV、腺病毒、逆转录病毒、慢病毒、单纯疱疹病毒、牛痘病毒或杆状病毒。病毒生产细胞系可以用于产生用于例如基因疗法或疫苗接种目的的病毒。

在具体的实施方案中，本文提供了包含一个或多个核酸序列的病毒生产细胞系，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码一种或多种病毒蛋白，其中该一种或多种病毒蛋白为衣壳蛋白或包膜蛋白、复制所必需的病毒蛋白或两者。

在一些实施方案中，病毒生产细胞系包含SEQ ID NO:20、SEQ ID NO:32、SEQ IDNO:33、SEQ ID NO:34、SEQ ID NO:36或SEQ ID NO:37中的任一者的NPT突变体核酸序列。

在本文所提供的病毒生产细胞系的某些实施方案中，所编码的一种或多种病毒蛋白可以为例如AAV衣壳蛋白、AAV rep蛋白、腺病毒复制所需的腺病毒E1区蛋白、逆转录病毒包膜蛋白、逆转录病毒gag蛋白或逆转录病毒逆转录酶或它们的组合。例如，该一种或多种病毒蛋白可以为逆转录病毒包膜蛋白、gag蛋白和逆转录酶。

在另一个实施方案中，本文提供了包含一个或多个核酸序列的抗原生产细胞系，其中该一个或多个核酸序列包含：(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码一种或多种抗原。

在一些实施方案中，抗原生产细胞系包含SEQ ID NO:20、SEQ ID NO:32、SEQ IDNO:33、SEQ ID NO:34、SEQ ID NO:36和SEQ ID NO:37中的任一者的NPT突变体核酸序列。

在某些实施方案中，抗原生产细胞系包含编码病毒抗原、细菌抗原或真菌抗原的核酸序列。在其他实施方案中，抗原生产细胞系包含编码癌抗原的核酸序列。

在某些实施方案中，本文提供了表达非天然存在的NPT的体外或离体细胞，其中非天然存在的NPT相对于野生型新霉素磷酸转移酶为衰减的，并且其中非天然存在的NPT包含SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42和SEQ ID NO:43中的任一者的氨基酸序列。

在某些实施方案中，其中宿主细胞为用编码如本文所提供的NPT突变体或非天然存在的NPT的核苷酸序列转染或转化的细菌细胞，相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，该细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。

在某些实施方案中，其中宿主细胞为用编码如本文所提供的NPT突变体或非天然存在的NPT的核苷酸序列转染的哺乳动物细胞，相对于用编码野生型NPT的核苷酸序列转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的。

在某些实施方案中，宿主细胞包含：第一核酸序列，其编码NPT突变体或非天然存在的NPT；以及第二核酸序列，其编码第二蛋白质或非编码RNA。

在一些实施方案中，第二蛋白质或非编码RNA为本文所述(例如，在章节7.2中)的第二蛋白质或非编码RNA。在一些实施方案中，宿主细胞或宿主细胞群通过本文所述(例如，在章节7.4或章节8中)的方法来产生。

7.6使用方法

在具体的实施方案中，本文所述的NPT突变体或非天然存在的NPT，或编码本文所述的NPT突变体或非天然存在的NPT的核苷酸序列以本领域技术人员将使用野生型NPT的任何方式使用。在具体的实施方案中，本文所述的NPT突变体或非天然存在的NPT，或编码本文所述的NPT突变体或非天然存在的NPT的核苷酸序列以本领域技术人员将使用选择性标记的任何方式使用。在某些实施方案中，如本文所述使用本文所述的NPT突变体或非天然存在的NPT，或编码本文所述的NPT突变体或非天然存在的NPT的核苷酸序列。

在具体的实施方案中，使用新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)以选择用包含编码本文所述的NPT突变体或非天然存在的NPT的核苷酸序列的核酸序列以及外源序列转化或转染的宿主细胞(例如，哺乳动物宿主细胞)，其中宿主细胞具有稳定整合至染色体中的外源序列。转染、转导、感染、显微注射或染色体转移可以用于将核酸序列引入宿主细胞中。该方法可以通过插入诱变(例如，通过同源重组插入DNA或通过转座子插入)来用于表达感兴趣的蛋白质或用于破坏基因。

在具体的实施方案中，可以使用例如新霉素、卡那霉素或G418来选择携带高数目的稳定游离体(进行复制的非整合质粒，诸如含有EBNA1OriP序列并且表达EBNA1以及本文所述的NPT突变体或非天然存在的NPT的那些质粒)的宿主细胞。在某些实施方案中，高拷贝数是当使用编码野生型NPT的核苷酸序列取代NPT突变体或非天然存在的NPT时所实现的拷贝数的5倍至10倍、5倍至15倍、2倍至5倍、2倍至10倍、2倍至15倍、或10倍至20倍、10倍至50倍、10倍至100倍、50倍至100倍、50倍至200倍、50倍至500倍、100倍至500倍、100倍至1000倍、500倍至1000倍或2倍至1000倍。

在具体的实施方案中，用新霉素磷酸转移酶底物(例如，卡那霉素、新霉素或G418或它们的衍生物)短期培养宿主细胞(例如，哺乳动物细胞)可以用于富集接受了表达本文所述的NPT突变体或非天然存在的NPT的构建体以及编码蛋白质或非编码RNA的其他经共转染的核酸序列(例如，DNA或RNA)的细胞，其中表达NPT突变体或非天然存在的NPT的构建体未被整合。例如，一些细胞难以转染，并且富集接受了并表达了NPT基因的细胞也可以富集接受了经共转染的Crispr构建体的细胞，从而降低了用以识别具有期望的修饰(例如，基因敲除)的细胞的筛选需要。

在具体的实施方案中，经工程化以表达本文所述的NPT突变体或非天然存在的NPT的宿主细胞可以用于选择那些已经经历使用例如新霉素、卡那霉素、G418或它们的衍生物而进行的基因扩增的宿主细胞。例如，DHFR的抑制剂可以以这种方式用于在宿主细胞(例如，哺乳动物细胞，诸如CHO细胞)中“扩增”含有经整合的转基因的染色体区域。

在具体的实施方案中，当通过染色体转移来形成细胞系时，诸如在形成人仓鼠杂交体时或在通过细胞融合而在细胞之间转移染色体时，编码本文所述的NPT突变体或非天然存在的NPT的核苷酸序列可以用作选择基因。

在具体的实施方案中，将胚胎干细胞工程化以含有编码本文所述的NPT突变体或非天然存在的NPT的核苷酸序列，并且在胚胎干细胞中的同源重组期间将npt基因引入染色体中(产生杂合插入)，可以使用更高浓度的G418，以便选择已经通过不分离现象继承了2个敲除染色体的稀有细胞。这将允许通过在体外或体内对细胞进行表征来对敲除表型进行一些分析，而不必首先将细胞引入小鼠中并且培育小鼠以生成纯合体。

在具体的实施方案中，宿主细胞中的高活性基因启动子可以通过全基因组筛选来进行识别，该全基因组筛选使用用放置于拼接受体下游的无启动子的NPT突变体核苷酸基因或者非天然存在的NPT基因进行工程化的转座子。可以使用适当水平的新霉素磷酸转移酶底物(例如，新霉素、卡那霉素或G418或它们的衍生物)来选择插入具有激活NPT表达的非常具有活性的启动子的基因中的转座子。随后可以通过表征存活细胞中的转座子插入位点来识别相关基因和启动子的同一性。

在具体的实施方案中，用编码NPT突变体或非天然存在的NPT的第一核苷酸序列以及一个或多个共价连接的附加核苷酸序列转化的宿主细胞(例如，细菌)可以通过用适当的新霉素磷酸转移酶底物(例如，新霉素、卡那霉素或G418或它们的衍生物)培养细胞来进行选择。编码NPT基因的核苷酸序列可以存在于克隆载体、病毒中或存在于宿主细胞中的基因组插入物中。

在具体的实施方案中，包含编码仅在细菌中表达的NPT突变体或非天然存在的NPT的核苷酸序列的质粒可以用于形成基因疗法产物，包括例如慢病毒或AAV。NPT突变体或非天然存在的NPT的高度衰减性质使得编码NPT突变体或非天然存在的NPT的核苷酸序列的任何异常封装以及向患者的递送安全得多，因为基因具有低得多的活性。

在具体的实施方案中，可以形成DNA的多联体，诸如通过将含有感兴趣的基因和编码NPT突变体或非天然存在的NPT的核苷酸序列的线性片段连接至具有细菌复制起点的片段，转化宿主细胞，以及使用例如新霉素、卡那霉素或G418或它们的衍生物来选择具有连接在一起的基因的多个拷贝的存活细胞。这可以用于生成基因的头尾相接阵列，该头尾相接阵列可以被递送至哺乳动物宿主细胞并且可以导致更高频率的多拷贝插入至宿主染色体中。

在具体的实施方案中，编码NPT突变体或非天然存在的NPT的核苷酸序列可以用于其中G418和其他NPT底物对细胞(例如，酵母、细菌、昆虫细胞、动物细胞、植物和那些生物体的任何病原体)有毒性的任何地方。

在一些实施方案中，如章节8所述使用编码NPT突变体或非天然存在的NPT的核苷酸序列。

7.7试剂盒

在另一方面，本文提供了试剂盒。在一个实施方案中，本文所提供的试剂盒在容器中包含核酸序列，该核酸序列包含编码NPT突变体或非天然存在的NPT的核苷酸序列。在另一个实施方案中，本文所提供的试剂盒在容器中包含载体(例如，表达载体)，该载体包含编码NPT突变体或非天然存在的NPT的核酸序列或核苷酸序列。在另一个实施方案中，试剂盒在容器中包含cDNA或基因组文库或单个克隆，该单个克隆含有编码NPT突变体或非天然存在的NPT的核酸序列或核苷酸序列。在一些实施方案中，NPT突变体核酸序列为在章节7.2或章节8中描述的NPT突变体核酸序列。在某些具体的实施方案中，NPT突变体核酸序列选自由以下项组成的组：SEQ ID NO:20、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:36和SEQ ID NO:37。在一些实施方案中，试剂盒在容器中还包含新霉素、卡那霉素或G418，或前述物质中的任何前述物质的衍生物。在某些实施方案中，试剂盒在容器中包含细胞(例如，宿主细胞)，可以将包含编码NPT突变体或非天然存在的NPT的核苷酸序列的核酸序列，或包含编码NPT突变体或非天然存在的NPT的核酸序列或核苷酸序列的载体(例如，表达载体)引入该细胞中。在一些实施方案中，试剂盒在容器中还包含细胞(例如，宿主细胞)，已经将包含编码NPT突变体或非天然存在的NPT的核苷酸序列的核酸序列，或包含编码NPT突变体或非天然存在的NPT的核酸序列或核苷酸序列的载体(例如，表达载体)引入该细胞中。

在某些实施方案中，本文提供了在容器中包含载体的试剂盒，该载体包含核酸序列，其中核酸序列包含编码NPT突变体或非天然存在的NPT的核苷酸序列。载体可以为质粒、相(phase)、病毒、粘粒或细菌人工染色体。在一些实施方案中，本文提供了试剂盒，该试剂盒在容器中包含基因组序列、cDNA序列、基因组文库或包含核酸序列的单个克隆，其中核酸序列包含编码NPT突变体或非天然存在的NPT的核苷酸序列。在一些实施方案中，试剂盒在容器中还包含新霉素、卡那霉素或G418，或前述物质中的任何前述物质的衍生物。

在一些实施方案中，试剂盒在容器中包含合成DNA片段或未在活细胞中繁殖的片段，该活细胞编码本文所述的NPT突变体或非天然存在的NPT的片段。NPT突变体或非天然NPT的两个或更多个互补片段可以在载体中的单独碎片中，并且当被引入宿主细胞中时，NPT突变体基因或非天然存在的NPT从单独碎片重构。

在一些实施方案中，本文提供了在容器中包含本文所述的宿主细胞的试剂盒。

8.实施例

8.1实施例1：识别具有减少的活性的NPT突变体

该实施例描述了如何制备NPT突变体并且筛选减少的磷酸转移酶活性。

质粒表达载体的构建

构建质粒载体P313(图1，SEQ ID NO:2)。它编码包含人延伸因子α启动子和第一内含子(SEQ ID NO:3)、mCherry编码区(SEQ ID NO:4)和SV40多腺苷酸化信号(SEQ ID NO:5)的mCherry荧光蛋白表达盒。P313编码衍生于转座子Tn5的新霉素磷酸转移酶(NPT)蛋白质(氨基糖苷磷酸转移酶3'-IIa)(SEQ ID NO:1；包含SEQ ID NO:6的核苷酸序列)，其由小鼠磷酸甘油酸激酶启动子(SEQ ID NO:7)驱动以用于在哺乳动物细胞中表达，并且由大肠杆菌laczya启动子(SEQ ID NO:8)驱动以用于在细菌中表达。NPT转录在哺乳动物细胞中由单纯疱疹病毒胸苷激酶多腺苷酸化信号(SEQ ID NO:9)所终止。质粒还编码氨苄青霉素抗性基因(SEQ ID NO:10)和pUC57质粒复制起始点(SEQ ID NO:11)。

通过用由基因合成(Integrated DNA Technologies,Coralville IA)所生成的DNA片段更换部分NPT开放阅读框来形成在NPT基因中含有突变的质粒。质粒P313用具有独特位点(包括Bsp E1、Tth111 I、Rsr II和Avr II)的适当的限制性核酸内切酶对来进行消化，以形成受体载体。克隆混合物含有5μl 2x HiFi克隆混合物、50ng合成DNA和509ng经消化的载体。将混合物在50℃下温育15分钟，并且冷却至4℃。将2μl转化至Top10感受态细胞(Invitrogen)或Stellar感受态细胞(Clontech)中，铺板至LB-羧苄青霉素板上，并且在37℃下温育。将单个集落接种至5ml LB-羧苄青霉素培养物中，并且在37℃下在振荡培养箱中生长过夜。DNA使用Qiagen质粒小提试剂盒(Qiagen)来进行纯化。质粒序列通过DNA定序(GENEWIZ,Plainfield,NJ)来进行验证。NPT活性在含有浓度为25μg/mL(KAN25)、50μg/mL(KAN50)、75μg/mL(KAN75)和100μg/mL(KAN100)的卡那霉素的板上进行筛选，如下所述。

在细菌中筛选NPT突变体

将在LB-羧苄青霉素中生长的过夜培养物用PBS连续稀释，并且铺板至LB-羧苄青霉素、LB-KAN25和LB-KAN100板上，并且温育24小时。对集落进行计数，允许其在37℃下再温育24小时并且对其重新计数。相对于KAN25和羧苄青霉素板，在KAN100板上集落数目显著减少但并非不存在的质粒被重新铺板至羧苄青霉素、KAN25、KAN50、KAN75和KAN100上，并且如上进行温育和计数。从四十八小时温育得到的集落数目在表1中示出。

表1：在表达突变型NPT的细胞中观察到的集落数目

48小时后的结果；“n.d.”意指未确定；用于突变型NPT核酸序列的开放阅读框(“Neo ORF”)通过序列标识号来进行识别。

结果

在该测定中，单位点点突变体中的两个单位点点突变体导致活性完全丧失(G205E和D208G)。在该测定中，剩余的8个突变体中仅有两个突变体示出降低的活性。突变型R211G在KAN100板上的生长也慢得多，即使总集落数目类似于在较低KAN浓度上的生长。D261N不能够在KAN100板上生长，并且在其他KAN板上仅产生约一半的集落。先前已经报道，在我们的测定中示出完全活性的四种突变体(G210A、Y218S、Y218F和V36M)会赋予降低的对卡那霉素的抗性(Blazquez(1991)Mol.Microbiol.5:1511-1518；Kocabiyik(1992)Biochem.Biophys.Res.Commun.185:925-931；Kocabiyik(1992)FEMS Microbiol Lett 93:199-202)。通过使用高拷贝质粒和/或更强的细菌启动子，这些NPT突变体以比先前研究中更高的水平进行表达是可能的。

构建具有D261N的双突变体，以识别具有甚至更低活性的那些突变体。四个D261N双突变体为完全缺陷的，并且一个双突变体(E182D；D261N)为极度缺陷的(相对于羧苄青霉素板，在KAN25上存在2％的集落，并且在其他卡那霉素浓度下没有生长)。两个克隆仅在KAN25板上产生了集落，但集落数目类似于羧苄青霉素板上的那些集落数目(即克隆N，(D216G；D261N)和克隆O(D227G；D261N)。一个突变似乎与D261N突变部分互补，从而允许在KAN100板上生长，尽管相对于在羧苄青霉素板上的生长，其效率减少(克隆K(H188L，D261N)。

四个克隆(S、T、U和V)组合了两个突变，这两个突变独立地具有上述完全活性，但先前已经报道其具有减少的活性(Blazquez(1991)Mol.Microbiol.5:1511-1518；Kocabiyik(1992)Biochem.Biophys.Res.Commun.185:925-931；Kocabiyik(1992)FEMSMicrobiol Lett 93:199-202)。两个附加的克隆将V36M与上述未经测试的突变进行了组合。据报道，突变H188S减少了对卡那霉素的抗性(Blazquez(1991)Mol.Microbiol.5:1511-1518)，而据报道突变E182D减少对G418的抗性，但不减少对卡那霉素的抗性(Yenofsky(1990)Proc.Natl.Acad.Sci.USA 87:3435-3439)。含有V36M；H188S突变的克隆为完全缺陷的。三个克隆仅保留了用以在KAN25板上生长的能力，而剩余的两个克隆仅在KAN100板上显示生长缺陷(对于以下克隆分别为1个和0个集落：克隆U(V36M；Y218F)和W(V36M和E182D))。这些结果证明，将单独对NPT活性具有弱效应或无效应的某些突变进行组合令人惊讶地产生了具有适用于多个应用的活性的双突变型NPT。

8.2实施例2：在HEK293细胞中作为选择标记的突变型NPT蛋白质

为了证明含有衰减的NPT基因盒的质粒仍然可以在人细胞中赋予对G418的抗性，将上述构建的质粒中的若干质粒转染至HEK293细胞中并且经受集落形成测定。使用Qiagen的HiSpeed maxiprep试剂盒按照制造商的说明书，从含有羧苄青霉素的200ml LB培养物中纯化DNA。

为了转染，在40ml生长培养基(DMEM+10％ FBS+1xPenStrep)中将2E7个HEK293细胞铺板至八个T-75培养瓶中，并且在37℃下温育。转染在15ml Corning管中进行装配，并且含有22μg DNA+在37℃下的3ml的OptiMEM+66μl Fugene-6转染试剂。将转染混合物短暂涡旋并且在37℃的CO₂培养箱中温育15分钟。添加生长培养基(2ml)并且将整个混合物添加至较早铺板的HEK293细胞的培养瓶。将培养瓶在37℃下温育。48小时后，所有培养瓶均具有了带亮红色荧光的细胞。培养瓶用10ml PBS和1ml TryPLE洗涤，并且在37℃下温育5分钟。细胞用10ml生长培养基从培养瓶中洗出，并且随后在25ml培养基中被重新铺板至T150培养瓶中，并且在37℃下温育48小时。然后，细胞如前所述从生长表面进行回收，并且细胞密度使用Countess细胞计数器使用重复读取来进行确定。在50ml的选择性生长培养基(DMEM+10％FBS+1xPenStrep+500μg/ml遗传霉素)中，将连续稀释液与Nuclon Delta Surface一起铺板至重复的150mm板中。将板温育18天，并且将转染了质粒P313、C和S的板进行染色并拍照。将来自其他转染的板再温育13天，然后染色并照相。为了染色，通过移液来轻轻地去除培养基。细胞用10ml染色溶液(0.4％亚甲蓝在50％甲醇中的溶液)进行覆盖，并且在室温下温育10分钟。染色溶液通过移液来进行去除，并且细胞用5ml 100％甲醇洗涤并风干。板使用Bio-Rad成像站来进行拍照。

结果

来自集落形成测定的结果呈现在表2中。突变型构建体中的四个突变型构建体产生了G418抗性集落，该抗性集落的频率范围为具有野生型NPT基因的构建体P313的所测量频率的5.5％至0.004％。

在该测定中，集落形成频率为NPT蛋白质活性的间接量度。当在G418的存在下生长时，相比于经转染的细胞群中的其他细胞，表达更多突变型NPT的细胞(无论由于表达盒的更多多拷贝整合和/或由于盒的整合的更有利基因组位置)能够存活以形成集落。该实施例的结果证明，使用具有减少的活性的NPT突变体作为选择标记可以用于减少必须对多个集落进行筛选以寻找稳定整合的高转基因表达细胞的时间和努力。

在细菌中具有最衰减表型的突变型构建体中的三个突变型构建体未能从1E7个经接种的细胞产生G418抗性集落。尽管这些突变型蛋白质可能在哺乳动物细胞中为完全非活性的，但表达足够高水平的细胞也可能在选择后存活。此类标记可与在生成高拷贝数整合方面更有效的方法(例如逆转录病毒感染或转座)组合使用。

表2：用突变型NPT表达盒转染的HEK细胞的集落形成频率

8.3实施例3：通过转座酶来引入转基因

该实施例证明使用转座酶活性来将mCherry和NPT表达盒整合至人细胞中。在该实施例中使用如本文所述的NPT突变体。

产生了具有图2中所描绘的构型的三种不同构建体。构建体彼此不同，因为它们含有了编码以下项的核酸序列：野生型新霉素磷酸转移酶、突变体1(P725)新霉素磷酸转移酶(V36M；G210A)或突变体2(P726)新霉素磷酸转移酶(E182D；D261N)。构建体用或不用Leap-In转座酶RNA(ATUM Design,Newark,CA)电穿孔至人VPC细胞(HEK293变体)中。细胞被铺板至150mm板上，并且在新霉素选择下培养2周。然后将细胞染色并且测量其集落形成。从未染色的不同板中选择8个至12个集落，并且相对于内源性谷氨酰胺合成酶基因小滴数字PCR(ddPCR)而测量mCherry拷贝数。

结果

来自集落形成测定的结果在图3中示出，其示出NPT突变体通过表达构建体的随机整合而不是通过转座来显著降低集落形成的效率。图4为用转座酶形成的稳定细胞库的图片，其中在与缺乏颜色的未转化细胞进行比较时，由mCherry表达所产生的颜色在正常白光照明下为清楚明显的。

所选择的克隆中的mCherry拷贝数的测量结果在图5中示出。结果证明，相对于具有野生型NPT的那些细胞，含有NPT突变体的细胞具有持续更高的经连接的mCherry转基因的平均拷贝数。通过构建体与野生型NPT基因的随机整合所生成的大多数克隆具有很少的荧光(如果有的话)，而通过两个突变型NPT基因的随机整合所衍生的大多数克隆为荧光的。这可以解释为意指突变型NPT基因必须以比野生型NPT基因更高的水平进行表达，以在G418选择期间存活，无论是通过增加的拷贝数还是通过在有利的基因组位置中进行整合，并且这导致mCherry转基因的增加的表达。

通过转座来将转基因酶整合至宿主染色体中比随机整合有效得多，并且即使使用野生型NPT基因也产生了更高的平均拷贝数。相对于使用野生型NPT基因，突变型NPT基因还增加了拷贝数，这在基因递送或转座效率低的情况下(诸如在大构建体的情况下)将提供优点。

9.实施方案

本发明提供了以下非限制性实施方案。

在一组实施方案中，提供了：

A1.一种具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：

(a)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；

(b)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；

(c)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；

(d)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；

(e)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或

(f)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

A2.一种具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：

(a)在SEQ ID NO:1的位置36和210处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置210处的氨基酸取代为对丙氨酸的取代；

(b)在SEQ ID NO:1的位置36和182处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置182处的氨基酸取代为对天冬氨酸的取代；

(c)在SEQ ID NO:1的位置36和218处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的氨基酸取代为对苯丙氨酸的取代；

(d)在SEQ ID NO:1的位置216和261处的氨基酸取代，其中在SEQ ID NO:1的位置216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的位置261处的氨基酸取代为对天冬酰胺的取代；

(e)在SEQ ID NO:1的位置36和218处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的氨基酸取代为对丝氨酸的取代；或

(f)在SEQ ID NO:1的位置36和216处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置216处的氨基酸取代为对甘氨酸的取代。

A3.根据实施方案A1所述的NPT，其中相比于野生型NPT，非天然存在的NPT作为选择标记具有衰减的新霉素磷酸转移酶活性。

A4.根据实施方案A1或A3所述的NPT，其中野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。

A5.根据实施方案A1或A3所述的NPT，其中野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

A6.根据实施方案A2所述的NPT，其中相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择标记具有衰减的新霉素磷酸转移酶活性。

A7.根据实施方案A1、A3、A4或A5所述的NPT，其中相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。

A8.根据实施方案A7所述的NPT，其中细菌细胞为大肠杆菌。

A9.根据实施方案A1、A3、A4或A5所述的NPT，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的。

A10.根据实施方案A9所述的NPT，其中哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

A11.根据实施方案A1、A3、A4或A5所述的NPT，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为0.001％至75％的频率产生。

A12.根据实施方案A2所述的NPT，其中相对于用编码包含SEQ ID NO:1的氨基酸序列的野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。

A13.根据实施方案A12所述的NPT，其中细菌细胞为大肠杆菌。

A14.根据实施方案A2所述的NPT，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的，其中野生型NPT包含SEQID NO:1的氨基酸序列。

A15.根据实施方案A14所述的NPT，其中哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

A16.根据实施方案A2所述的NPT，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为5.5％至0.004％的频率产生，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。

A17.根据实施方案A1、A3、A4、A5或A7至A11中任一项所述的NPT，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处，其中在对应于SEQID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。

A18.根据实施方案A1、A3、A4、A5或A7至A11中任一项所述的NPT，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。

A19.根据实施方案A1、A3、A4、A5或A7至A11中任一项所述的NPT，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。

A20.根据实施方案A1、A3、A4、A5或A7至A11中任一项所述的NPT，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。

A21.根据实施方案A1、A3、A4、A5或A7至A11中任一项所述的NPT，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。

A22.根据实施方案A1、A3、A4、A5或A7至A11中任一项所述的NPT，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

A23.根据实施方案A2或A12至A16中任一项所述的NPT，其中非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。

A24.根据实施方案A2或A12至A16中任一项所述的NPT，其中非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。

A25.根据实施方案A2或A12至A16中任一项所述的NPT，其中非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。

A26.根据实施方案A2或A12至A16中任一项所述的NPT，其中非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。

A27.根据实施方案A2或A12至A16中任一项所述的NPT，其中非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。

A28.根据实施方案A2或A12至A16中任一项所述的NPT，其中非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

A29.一种核酸序列，其包含编码根据实施方案A1至A28中任一项所述的非天然存在的NPT的第一核苷酸序列。

A30.根据A29的实施方案所述的核酸序列，其中核酸序列还包含编码第二蛋白质或非编码RNA的第二核苷酸序列。

A31.根据实施方案A30所述的核酸序列，其中第二核苷酸序列编码第二蛋白质，并且其中第二蛋白质为治疗性蛋白。

A32.根据实施方案A29至A31中任一项所述的核酸序列，其中第一核苷酸序列包含SEQ ID NO:20、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:36或SEQ ID NO:37的核苷酸序列。

A33.一种载体，其包含根据实施方案A29至A32中任一项所述的核酸序列。

A34.一种体外或离体宿主细胞，其包含根据实施方案A1至A28中任一项所述的非天然存在的NPT。

A35.一种体外或离体宿主细胞，其包含根据实施方案A29至A32中任一项所述的核酸序列。

A36.根据实施方案A35所述的细胞，其中核酸序列被稳定整合至宿主细胞的基因组中。

A37.一种体外或离体宿主细胞，其包含根据实施方案A33所述的载体。

A38.根据实施方案A34至A37中任一项所述的宿主细胞，其中宿主细胞为细菌、酵母细胞、哺乳动物细胞或植物细胞。

A39.根据实施方案A34至A37中任一项所述的宿主细胞，其中宿主细胞来自人细胞系。

在第二组实施方案中，提供了：

B1.一种表达非天然存在的NPT的体外或离体宿主细胞，其中非天然存在的NPT相对于野生型新霉素磷酸转移酶为衰减的，并且其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：

B2.一种表达具有新霉素磷酸转移酶活性的非天然存在的NPT的体外或离体宿主细胞，其中非天然存在的NPT相对于野生型新霉素磷酸转移酶为衰减的，并且其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：

(a)在SEQ ID NO:1的氨基酸残基36和210处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基210处的氨基酸取代为对丙氨酸的取代；

(b)在SEQ ID NO:1的氨基酸残基36和182处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基182处的氨基酸取代为对天冬氨酸的取代；

(c)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对苯丙氨酸的取代；

(d)在SEQ ID NO:1的氨基酸残基216和261处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的氨基酸残基261处的氨基酸取代为对天冬酰胺的取代；

(e)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对丝氨酸的取代；或

(f)在SEQ ID NO:1的氨基酸残基36和216处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代。

B3.根据实施方案B1所述的细胞，其中野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。

B4.根据实施方案B1所述的细胞，其中野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

B5.根据实施方案B2所述的细胞，其中相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择标记具有衰减的新霉素磷酸转移酶活性。

B6.根据实施方案B1、B3或B4所述的细胞，其中相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。

B7.根据实施方案B6所述的细胞，其中细菌细胞为大肠杆菌。

B8.根据实施方案B1、B3或B4所述的细胞，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的。

B9.根据实施方案B8所述的细胞，其中哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

B10.根据实施方案B1、B3或B4所述的细胞，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为0.001％至75％的频率产生。

B11.根据实施方案B2或B5所述的细胞，相对于用编码包含SEQ ID NO:1的氨基酸序列的野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。

B12.根据实施方案B11所述的细胞，其中细菌细胞为大肠杆菌。

B13.根据实施方案B2或B5所述的细胞，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。

B14.根据实施方案B13所述的细胞，其中哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

B15.根据实施方案B2或B5所述的细胞，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为5.5％至0.004％的频率产生，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。

B16.根据实施方案B1、B3、B4或B6至B10中任一项所述的细胞，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。

B17.根据实施方案B1、B3、B4或B6至B10中任一项所述的细胞，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。

B18.根据实施方案B1、B3、B4或B6至B10中任一项所述的细胞，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。

B19.根据实施方案B1、B3、B4或B6至B10中任一项所述的细胞，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。

B20.根据实施方案B1、B3、B4或B6至B10中任一项所述的细胞，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。

B21.根据实施方案B1、B3、B4或B6至B10中任一项所述的细胞，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

B22.根据实施方案B2、B5或B11至B15中任一项所述的细胞，其中非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。

B23.根据实施方案B2、B5或B11至B15中任一项所述的细胞，其中非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。

B24.根据实施方案B2、B5或B11至B15中任一项所述的细胞，其中非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。

B25.根据实施方案B2、B5或B11至B15中任一项所述的细胞，其中非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。

B26.根据实施方案B2、B5或B11至B15中任一项所述的细胞，其中非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。

B27.根据实施方案B2、B5或B11至B15中任一项所述的细胞，其中非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

B28.根据实施方案B1至B27中任一项所述的细胞，其中细胞还包含编码第二蛋白质或非编码RNA的第二核酸序列。

B29.根据实施方案B28所述的细胞，其中第二核酸序列编码第二蛋白质，并且其中第二蛋白质为治疗性蛋白。

B30.根据实施方案B28所述的细胞，其中第二核酸序列编码非编码RNA，并且其中非编码RNA为shRNA、miRNA、反义RNA、用于Crispr核酸酶的引导RNA、催化RNA、核糖体RNA或tRNA。

B31.根据实施方案B1至B30中任一项所述的细胞，其中宿主细胞为细菌、酵母细胞、哺乳动物细胞或植物细胞。

在第三组实施方案中，提供了：

C1.一种用于从其中引入了转基因的宿主细胞群中选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法，该方法包括：

a)将核酸序列引入宿主细胞群中，该核酸序列包含：

(i)第一核苷酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)；以及

(ii)第二核苷酸序列，其包含转基因，

其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：

(1)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代；

(2)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代；

(3)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代；

(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代；

(5)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代；或者

(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及

b)从其中引入了核酸序列的宿主细胞群中选择在新霉素磷酸转移酶底物的存在下生长的细胞。

C2.一种用于从其中引入了转基因的宿主细胞群中选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法，该方法包括：

a)将核酸序列引入宿主细胞群中，该核酸序列包含：

(ii)第二核苷酸序列，其包含转基因，

其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：

(1)在SEQ ID NO:1的氨基酸残基36和210处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基210处的氨基酸取代为对丙氨酸的取代；

(2)在SEQ ID NO:1的氨基酸残基36和182处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基182处的氨基酸取代为对天冬氨酸的取代；

(3)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对苯丙氨酸的取代；

(4)在SEQ ID NO:1的氨基酸残基216和261处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的氨基酸残基261处的氨基酸取代为对天冬酰胺的取代；

(5)在SEQ ID NO:1的氨基酸残基36和218处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基218处的氨基酸取代为对丝氨酸的取代；或者

(6)在SEQ ID NO:1的氨基酸残基36和216处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代；以及

C3.根据实施方案C1所述的方法，其中相比于野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

C4.根据实施方案C1或C3所述的方法，其中野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。

C5.根据实施方案C1所述的方法，其中野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

C6.根据实施方案C2所述的方法，其中相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

C7.根据实施方案C1、C3、C4或C5所述的方法，其中相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。

C8.根据实施方案C7所述的方法，其中细菌细胞为大肠杆菌。

C9.根据实施方案C1、C3、C4或C5所述的方法，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的。

C10.根据实施方案C9所述的方法，其中哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

C11.根据实施方案C1、C3、C4或C5所述的方法，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为0.001％至75％的频率产生。

C12.根据实施方案C2或C6所述的方法，其中相对于用编码包含SEQ ID NO:1的氨基酸序列的野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。

C13.根据实施方案C12所述的方法，其中细菌细胞为大肠杆菌。

C14.根据实施方案C2或C6所述的方法，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。

C15.根据实施方案C14所述的方法，其中哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

C16.根据实施方案C2或C6所述的方法，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为5.5％至0.004％的频率产生，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。

C17.根据实施方案C1、C3、C4、C5或C7至C11中任一项所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。

C18.根据实施方案C1、C3、C4、C5或C7至C11中任一项所述的方法，其中NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。

C19.根据实施方案C1、C3、C4、C5或C7至C11中任一项所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。

C20.根据实施方案C1、C3、C4、C5或C7至C11中任一项所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。

C21.根据实施方案C1、C3、C4、C5或C7至C11中任一项所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。

C22.根据实施方案C1、C3、C4、C5或C7至C11中任一项所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

C23.根据实施方案C2或C6所述的方法，其中非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。

C24.根据实施方案C2或C6所述的方法，其中非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。

C25.根据实施方案C2或C6所述的方法，其中非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。

C26.根据实施方案C2或C6所述的方法，其中非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。

C27.根据实施方案C2或C6所述的方法，其中非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。

C28.根据实施方案C2或C6所述的方法，其中非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

C29.根据实施方案C1至C28中任一项所述的方法，其中：

(a)相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后的第二组细胞中的转基因的拷贝数，所选择的细胞包含2倍至1000倍的转基因的拷贝数，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群；以及/或者

(b)相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后由第二组细胞的转基因的表达水平，所选择的细胞实现了10倍至1000倍的转基因的表达水平，其中用包含编码野生型NPT蛋白质的核苷酸序列和转基因的核酸序列转染或转化第二宿主细胞群。

C30.根据实施方案C1至C29中任一项所述的方法，其中宿主细胞为细菌、酵母、哺乳动物细胞或植物细胞。

C31.根据实施方案C1至C29中任一项所述的方法，其中宿主细胞为人细胞。

C32.根据实施方案C1至C31中任一项所述的方法，其中核酸序列被稳定整合至所选择的细胞的基因组中。

C33.根据实施方案C1至C32中任一项所述的方法，其中所选择的细胞具有高拷贝数的转基因。

C34.根据实施方案C1至C33中任一项所述的方法，其中所选择的细胞具有高表达水平的转基因。

C35.根据实施方案C1至C34中任一项所述的方法，其中所选择的细胞已经将转基因的5个至100个拷贝整合至它们的基因组DNA中。

C36.根据实施方案C1至C35中任一项所述的方法，其中所选择的细胞已经将转基因的1个至5个拷贝整合至它们的基因组DNA中。

C37.根据实施方案C1至C36中任一项所述的方法，其中转基因包含病毒基因。

C38.根据实施方案C1至C36中任一项所述的方法，其中转基因包含人生长因子基因。

C39.根据实施方案C1至C38中任一项所述的方法，其中新霉素磷酸转移酶底物为新霉素、卡那霉素或G418。

C40.一种使用质粒或转座子的方法，该质粒或转座子包含编码非天然存在的NPT的核酸序列，相比于野生型NPT，该非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性，该方法包括：

a)将包含编码非天然存在的NPT的核酸序列的质粒或转座子引入宿主细胞中，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：

b)使细胞在新霉素磷酸转移酶底物的存在下生长。

C41.一种使用质粒或转座子的方法，该质粒或转座子包含编码非天然存在的NPT的核酸序列，相比于野生型NPT，该非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性，该方法包括：

a)将包含编码非天然存在的NPT的核酸序列的质粒或转座子引入宿主细胞中，其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：

(4)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代，并且在SEQ IDNO:1的氨基酸残基261处的氨基酸取代为对天冬酰胺的取代；

b)使细胞在新霉素磷酸转移酶底物的存在下生长。

C42.根据实施方案C40所述的方法，其中野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。

C43.根据实施方案C40所述的方法，其中野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

C44.根据实施方案C40、C42或C43所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。

C45.根据实施方案C40、C42或C43所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。

C46.根据实施方案C40、C42或C43所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。

C47.根据实施方案C40、C42或C43所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。

C48.根据实施方案C40、C42或C43所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。

C49.根据实施方案C40、C42或C43所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

C50.根据实施方案C41所述的方法，其中非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。

C51.根据实施方案C41所述的方法，其中非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。

C52.根据实施方案C41所述的方法，其中非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。

C53.根据实施方案C41所述的方法，其中非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。

C54.根据实施方案C41所述的方法，其中非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。

C55.根据实施方案C41所述的方法，其中非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

C56.根据实施方案C40至C55中任一项所述的方法，其中宿主细胞为细菌、酵母、哺乳动物细胞或植物细胞。

C57.根据实施方案C40至C55中任一项所述的方法，其中宿主细胞为人细胞。

C58.根据实施方案C40至C55中任一项所述的方法，其中质粒或转座子还包含编码蛋白质或非编码RNA的第二核苷酸序列。

C59.根据实施方案C58所述的方法，其中蛋白质为病毒蛋白。

C60.根据实施方案C58所述的方法，其中蛋白质为治疗性蛋白。

C61.根据实施方案C40至C60中任一项所述的方法，其中新霉素磷酸转移酶底物为新霉素、卡那霉素或G418。

C62.根据实施方案C1至C39中任一项所述的方法，其中转基因编码蛋白质或非编码RNA。

C63.根据实施方案C62所述的方法，其中转基因编码选自由以下项组成的组的非编码RNA：反义RNA、miRNA、shRNA、长链非编码RNA、催化RNA、核糖体RNA、tRNA或用于CRISPR核酸酶的引导RNA。

C64.根据实施方案C62所述的方法，其中转基因编码蛋白质，并且蛋白质为治疗性蛋白或抗原。

在第四组实施方案中，提供了：

D1.一种制备包含第二核苷酸序列的宿主细胞的方法，该方法包括：

a)将第一核酸序列引入宿主细胞群中，该第一核酸序列包含：(i)第一核苷酸序列，其编码非天然存在的NPT，以及(ii)第二核苷酸序列，其包含编码第二蛋白质或非编码RNA的转基因，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：

(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；

b)使宿主细胞群在新霉素磷酸转移酶底物的存在下生长，以产生集落；以及

c)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。

D2.一种制备包含第二核苷酸序列的宿主细胞的方法，该方法包括：

a)将以下项共引入宿主细胞群中：(i)第一核酸序列，其包含编码非天然存在的NPT的第一核苷酸序列，以及(ii)第二核酸序列，其包含编码第二蛋白质或非编码RNA的转基因，其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：

(1)在SEQ ID NO:1的位置36和210处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置210处的氨基酸取代为对丙氨酸的取代；

(2)在SEQ ID NO:1的位置36和182处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置182处的氨基酸取代为对天冬氨酸的取代；

(3)在SEQ ID NO:1的位置36和218处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的氨基酸取代为对苯丙氨酸的取代；

(4)在SEQ ID NO:1的位置216和261处的氨基酸取代，其中在SEQ ID NO:1的位置216处的氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的位置261处的氨基酸取代为对天冬酰胺的取代；

(5)在SEQ ID NO:1的位置36和218处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的氨基酸取代为对丝氨酸的取代；或者

(6)在SEQ ID NO:1的位置36和216处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置216处的氨基酸取代为对甘氨酸的取代；

c)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。D3.一种制备包含第二核苷酸序列的宿主细胞的方法，该方法包括：

a)使宿主细胞群在新霉素磷酸转移酶底物的存在下生长，以产生集落，其中宿主细胞群包含第一核酸序列，该第一核酸序列包含：(i)第一核苷酸序列，其编码非天然存在的NPT，以及(ii)第二核苷酸序列，其包含编码第二蛋白质或非编码RNA的转基因，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：

b)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。

D4.一种制备包含第二核苷酸序列的宿主细胞的方法，该方法包括：

a)使宿主细胞群在新霉素磷酸转移酶底物的存在下生长，以产生集落，其中宿主细胞群包含：(i)第一核酸序列，其包含编码非天然存在的NPT的第一核苷酸序列，以及(ii)第二核酸序列，其包含编码第二蛋白质或非编码RNA的转基因；其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：

(6)在SEQ ID NO:1的位置36和216处的氨基酸取代，其中在SEQ ID NO:1的位置36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置216处的氨基酸取代为对甘氨酸的取代；以及

b)选择在新霉素磷酸转移酶底物的存在下生长的细胞集落。

D5.根据实施方案D1或D3所述的方法，其中野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。

D6.根据实施方案D1或D3所述的方法，其中野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

D7.根据实施方案D2所述的方法，其中相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

D8.根据实施方案D1、D3、D4、D5或D6所述的方法，其中相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的。

D9.根据实施方案D8所述的方法，其中细菌细胞为大肠杆菌。

D10.根据实施方案D1、D3、D4、D5或D6所述的方法，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的。

D11.根据实施方案D10所述的方法，其中哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

D12.根据实施方案D1、D3、D4、D5或D6所述的方法，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为0.001％至75％的频率产生。

D13.根据实施方案D2或D7所述的方法，其中相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。

D14.根据实施方案D13所述的方法，其中细菌细胞为大肠杆菌。

D15.根据实施方案D2或D7所述的方法，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。

D16.根据实施方案D15所述的方法，其中哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

D17.根据实施方案D2或D7所述的方法，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为5.5％至0.004％的频率产生，其中野生型NPT包含SEQ ID NO:1的氨基酸序列。

D18.根据实施方案D1、D3、D4、D5、D6或D8至D12中任一项所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。

D19.根据实施方案D1、D3、D4、D5、D6或D8至D12中任一项所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。

D20.根据实施方案D1、D3、D4、D5、D6或D8至D12中任一项所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。

D21.根据实施方案D1、D3、D4、D5、D6或D8至D12中任一项所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。

D22.根据实施方案D1、D3、D4、D5、D6或D8至D12中任一项所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。

D23.根据实施方案D1、D3、D4、D5、D6或D8至D12中任一项所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

D24.根据实施方案D2、D7或D13至D17中任一项所述的方法，其中非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。

D25.根据实施方案D2、D7或D13至D17中任一项所述的方法，其中非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。

D26.根据实施方案D2、D7或D13至D17中任一项所述的方法，其中非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。

D27.根据实施方案D2、D7或D13至D17中任一项所述的方法，其中非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。

D28.根据实施方案D2、D7或D13至D17中任一项所述的方法，其中非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。

D29.根据实施方案D2、D7或D13至D17中任一项所述的方法，其中非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

D30.根据实施方案D1至D29中任一项所述的方法，其中与用第二核酸序列转染或转化并且在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群相比，该宿主细胞群产生更少的集落，其中第二核酸序列包含编码野生型NPT蛋白质的第三核苷酸序列以及第二核苷酸序列。

D31.根据实施方案D1至D30中任一项所述的方法，其中宿主细胞为哺乳动物细胞。

D32.根据实施方案D31所述的方法，其中哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

D33.根据实施方案D1至D29中任一项所述的方法，其中细胞为人细胞。

D34.根据实施方案D1至D33中任一项所述的方法，其还包括培养所选择的细胞集落。

D35.根据实施方案D1至D34中任一项所述的方法，其中新霉素磷酸转移酶底物为新霉素、卡那霉素或G418。

D36.根据实施方案D1至D35中任一项所述的方法，其中蛋白质为治疗性蛋白或抗原。

D37.根据实施方案D1至D35中任一项所述的方法，其中非编码RNA为shRNA、miRNA、反义RNA、用于Crispr核酸酶的引导RNA、催化RNA、核糖体RNA或tRNA。

D38.宿主细胞，其通过根据实施方案D1至D37中任一项所述的方法来产生。

在第五组实施方案中，提供了：

E1.一种用于制造表达治疗性蛋白或酶的稳定细胞系的方法，该方法包括：

a)将一个或多个核酸序列引入宿主细胞群中，其中该一个或多个核酸序列包含：

(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：

(ii)第二核酸序列，其编码治疗性蛋白或酶；

b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及

c)培养所选择的细胞，以产生表达治疗性蛋白或酶的稳定细胞系。

E2.一种用于制造表达治疗性蛋白或酶的稳定细胞系的方法，该方法包括：

(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：

(ii)第二核酸序列，其编码治疗性蛋白或酶；

b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及

E3.根据实施方案E1所述的方法，其中相比于野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

E4.根据实施方案E1或E3所述的方法，其中野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。

E5.根据实施方案E1或E3所述的方法，其中野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

E6.根据实施方案E2所述的方法，其中相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

E7.根据实施方案E1、E3、E4或E5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且

在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。

E8.根据实施方案E1、E3、E4或E5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且

在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。

E9.根据实施方案E1、E3、E4或E5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且

在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。

E10.根据实施方案E1、E3、E4或E5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。

E11.根据实施方案E1、E3、E4或E5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且

在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。

E12.根据实施方案E1、E3、E4或E5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

E13.根据实施方案E2或E6所述的方法，其中非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。

E14.根据实施方案E2或E6所述的方法，其中非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。

E15.根据实施方案E2或E6所述的方法，其中非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。

E16.根据实施方案E2或E6所述的方法，其中非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。

E17.根据实施方案E2或E6所述的方法，其中非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。

E18.根据实施方案E2或E6所述的方法，其中非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

E19.根据实施方案E1至E18中任一项所述的方法，其中稳定细胞系为哺乳动物细胞系。

E20.根据实施方案E1至E18中任一项所述的方法，其中稳定细胞系为人细胞系。

E21.根据实施方案E1至E18中任一项所述的方法，其中稳定细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。

E22.根据实施方案E1至E21中任一项所述的方法，其中稳定细胞系表达治疗性蛋白。

E23.根据实施方案E22所述的方法，其中治疗性蛋白为抗体或抗体片段。

E24.根据实施方案E1至E21中任一项所述的方法，其中稳定细胞系表达酶。

E25.一种稳定细胞系，其通过根据实施方案E1至E24中任一项所述的方法来产生。

在第六组实施方案中，提供了：

F1.一种制备病毒生产细胞系的方法，该方法包括：

(ii)第二核酸序列，其编码一种或多种病毒蛋白，其中该一种或多种病毒蛋白包括衣壳蛋白、包膜蛋白、复制所必需的病毒蛋白或它们的组合；

b)从细胞群中选择在新霉素磷酸转移酶底物的存在下生长的细胞；以及

c)繁殖所选择的细胞，以产生病毒生产细胞系。

F2.一种制备病毒生产细胞系的方法，该方法包括：

c)繁殖所选择的细胞，以产生病毒生产细胞系。

F3.根据实施方案F1所述的方法，其中相比于野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

F4.根据实施方案F1或F3所述的方法，其中野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。

F5.根据实施方案F1或F3所述的方法，其中野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

F6.根据实施方案F2所述的方法，其中相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

F7.根据实施方案F1、F3、F4或F5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且

F8.根据实施方案F1、F3、F4或F5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且

F9.根据实施方案F1、F3、F4或F5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且

F10.根据实施方案F1、F3、F4或F5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。

F11.根据实施方案F1、F3、F4或F5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且

F12.根据实施方案F1、F3、F4或F5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

F13.根据实施方案F2或F6所述的方法，其中非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。

F14.根据实施方案F2或F6所述的方法，其中非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。

F15.根据实施方案F2或F6所述的方法，其中非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。

F16.根据实施方案F2或F6所述的方法，其中非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。

F17.根据实施方案F2或F6所述的方法，其中非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。

F18.根据实施方案F2或F6所述的方法，其中非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

F19.根据实施方案F1至F18中任一项所述的方法，其中细胞系为哺乳动物细胞系。

F20.根据实施方案F1至F18中任一项所述的方法，其中细胞系为人细胞系。

F21.根据实施方案F1至F18中任一项所述的方法，其中细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。

F22.根据实施方案F1至F21中任一项所述的方法，其中该一种或多种病毒蛋白包括AAV衣壳蛋白。

F23.根据实施方案F1至F21中任一项所述的方法，其中该一种或多种病毒蛋白包括AAV衣壳蛋白和AAV rep蛋白。

F24.根据实施方案F1至F21中任一项所述的方法，其中该一种或多种病毒蛋白包括包膜蛋白。

F25.根据实施方案F1至F21中任一项所述的方法，其中该一种或多种病毒蛋白包括腺病毒复制所需的腺病毒E1区蛋白。

F26.根据实施方案F1至F21中任一项所述的方法，其中该一种或多种病毒蛋白包括逆转录病毒包膜蛋白。

F27.根据实施方案F1至F21中任一项所述的方法，其中该一种或多种病毒蛋白包括逆转录病毒gag蛋白。

F28.根据实施方案F1至F21中任一项所述的方法，其中该一种或多种病毒蛋白包括逆转录病毒逆转录酶。

F29.根据实施方案F1至F21中任一项所述的方法，其中该一种或多种病毒蛋白包括逆转录病毒包膜蛋白、gag蛋白和逆转录酶。

F30.一种病毒生产细胞系，其通过根据实施方案F1至F29中任一项所述的方法来制备。

F31.一种病毒生产细胞系，其包含一个或多个核酸序列，其中该一个或多个核酸序列包含：

(ii)第二核酸序列，其编码一种或多种病毒蛋白，其中该一种或多种病毒蛋白包括衣壳蛋白、包膜蛋白、复制所必需的病毒蛋白或它们的组合。

F32.一种病毒生产细胞系，其包含一个或多个核酸序列，其中该一个或多个核酸序列包含：

F33.根据实施方案F31所述的病毒生产细胞系，其中相比于野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

F34.根据实施方案F31或F33所述的病毒生产细胞系，其中野生型NPT包含与SEQID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。

F35.根据实施方案F31或F33所述的病毒生产细胞系，其中野生型NPT包含与SEQID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

F36.根据实施方案F32所述的病毒生产细胞系，其中相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

F37.根据实施方案F31、F33、F34或F35所述的病毒生产细胞系，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。

F38.根据实施方案F31、F33、F34或F35所述的病毒生产细胞系，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。

F39.根据实施方案F31、F33、F34或F35所述的病毒生产细胞系，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。

F40.根据实施方案F31、F33、F34或F35所述的病毒生产细胞系，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。

F41.根据实施方案F31、F33、F34或F35所述的病毒生产细胞系，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。

F42.根据实施方案F31、F33、F34或F35所述的病毒生产细胞系，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

F43.根据实施方案F32或F36所述的病毒生产细胞系，其中非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。

F44.根据实施方案F32或F36所述的病毒生产细胞系，其中非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。

F45.根据实施方案F32或F36所述的病毒生产细胞系，其中非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。

F46.根据实施方案F32或F36所述的病毒生产细胞系，其中非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。

F47.根据实施方案F32或F36所述的病毒生产细胞系，其中非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。

F48.根据实施方案F32或F36所述的病毒生产细胞系，其中非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

F49.根据实施方案F31至F48中任一项所述的病毒生产细胞系，其中细胞系为哺乳动物细胞系。

F50.根据实施方案F31至F48中任一项所述的病毒生产细胞系，其中细胞系为人细胞系。

F51.根据实施方案F31至F48中任一项所述的病毒生产细胞系，其中细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。

F52.根据实施方案F31至F51中任一项所述的病毒生产细胞系，其中该一种或多种病毒蛋白包括AAV衣壳蛋白。

F53.根据实施方案F31至F51中任一项所述的病毒生产细胞系，其中该一种或多种病毒蛋白包括AAV衣壳蛋白和AAV rep蛋白。

F54.根据实施方案F31至F51中任一项所述的病毒生产细胞系，其中该一种或多种病毒蛋白包括包膜蛋白。

F55.根据实施方案F31至F51中任一项所述的病毒生产细胞系，其中该一种或多种病毒蛋白包括腺病毒复制所需的腺病毒E1区蛋白。

F56.根据实施方案F31至F51中任一项所述的病毒生产细胞系，其中该一种或多种病毒蛋白包括逆转录病毒包膜蛋白。

F57.根据实施方案F31至F51中任一项所述的病毒生产细胞系，其中该一种或多种病毒蛋白包括逆转录病毒gag蛋白。

F58.根据实施方案F31至F51中任一项所述的病毒生产细胞系，其中该一种或多种病毒蛋白包括逆转录病毒逆转录酶。

F59.根据实施方案F31至F51中任一项所述的病毒生产细胞系，其中该一种或多种病毒蛋白包括逆转录病毒包膜蛋白、gag蛋白和逆转录酶。

在第七组实施方案中，提供了：

G1.一种用于制造表达抗原的细胞系的方法，该方法包括：

(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的新霉素NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：

(ii)第二核酸序列，其编码抗原；

b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及

c)培养所选择的细胞，以产生表达抗原的细胞系。

G2.一种用于制造表达抗原的细胞系的方法，该方法包括：

(i)第一核酸序列，其编码具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中非天然存在的新霉素NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：

(ii)第二核酸序列，其编码抗原；

b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及

c)培养所选择的细胞，以产生表达抗原的细胞系。

G3.根据实施方案G1所述的方法，其中相比于野生型NPT，非天然存在的NPT作为选择标记具有衰减的新霉素磷酸转移酶活性。

G4.根据实施方案G1或G3所述的方法，其中野生型NPT包含与SEQ ID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。

G5.根据实施方案G1所述的方法，其中野生型NPT包含与SEQ ID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

G6.根据实施方案G2所述的方法，其中相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择标记具有衰减的新霉素磷酸转移酶活性。

G7.根据实施方案G1、G3、G4或G5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。

G8.根据实施方案G1、G3、G4或G5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。

G9.根据实施方案G1、G3、G4或G5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。

G10.根据实施方案G1、G3、G4或G5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。

G11.根据实施方案G1、G3、G4或G5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。

G12.根据实施方案G1、G3、G4或G5所述的方法，其中非天然存在的NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ IDNO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

G13.根据实施方案G2或G6所述的方法，其中非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。

G14.根据实施方案G2或G6所述的方法，其中非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。

G15.根据实施方案G2或G6所述的方法，其中非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。

G16.根据实施方案G2或G6所述的方法，其中非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。

G17.根据实施方案G2或G6所述的方法，其中非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。

G18.根据实施方案G2或G6所述的方法，其中非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

G19.根据实施方案G1至G18中任一项所述的方法，其中细胞系为哺乳动物细胞系。

G20.根据实施方案G1至G18中任一项所述的方法，其中细胞系为人细胞系。

G21.根据实施方案G1至G18中任一项所述的方法，其中细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。

G22.根据实施方案G1至G21中任一项所述的方法，其中抗原为病毒抗原、细菌抗原或真菌抗原。

G23.根据实施方案G1至G21中任一项所述的方法，其中抗原为癌抗原。

G24.一种抗原生产细胞系，其通过根据实施方案G1至G23中任一项所述的方法来制备。

G25.一种包含一个或多个核酸序列的抗原生产细胞系，其中该一个或多个核酸序列包含：

(6)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码一种或多种抗原。

G26.一种包含一个或多个核酸序列的抗原生产细胞系，其中该一个或多个核酸序列包含：

(6)在SEQ ID NO:1的氨基酸残基36和216处的氨基酸取代，其中在SEQ ID NO:1的氨基酸残基36处的氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的氨基酸残基216处的氨基酸取代为对甘氨酸的取代；以及(ii)第二核酸序列，其编码一种或多种抗原。

G27.根据实施方案G25所述的抗原生产细胞系，其中相比于野生型NPT，非天然存在的NPT作为选择标记具有衰减的新霉素磷酸转移酶活性。

G28.根据实施方案G25或G27所述的抗原生产细胞系，其中野生型NPT包含与SEQID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。

G29.根据实施方案G25或G27所述的抗原生产细胞系，其中野生型NPT包含与SEQID NO:1至少60％、至少65％、至少70％或至少65％相同的氨基酸序列。

G30.根据实施方案G26所述的抗原生产细胞系，其中相比于包含SEQ ID NO:1的氨基酸序列的野生型NPT，非天然存在的NPT作为选择标记具有衰减的新霉素磷酸转移酶活性。

G31.根据实施方案G25、G27、G28或G29所述的抗原生产细胞系，

其中NPT包含在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的氨基酸残基处的氨基酸取代为对丙氨酸的取代。

G32.根据实施方案G25、G27、G28或G29所述的抗原生产细胞系，

其中NPT包含在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的氨基酸残基处的氨基酸取代为对天冬氨酸的取代。

G33.根据实施方案G25、G27、G28或G29所述的抗原生产细胞系，

其中NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对苯丙氨酸的取代。

G34.根据实施方案G25、G27、G28或G29所述的抗原生产细胞系，其中NPT包含在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的氨基酸残基处的氨基酸取代为对天冬酰胺的取代。

G35.根据实施方案G25、G27、G28或G29所述的抗原生产细胞系，其中NPT包含在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的氨基酸残基处的氨基酸取代为对丝氨酸的取代。

G36.根据实施方案G25、G27、G28或G29所述的抗原生产细胞系，其中NPT包含在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQID NO:1的氨基酸残基36的氨基酸残基处的氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的氨基酸残基处的氨基酸取代为对甘氨酸的取代。

G37.根据实施方案G26或G30所述的抗原生产细胞系，其中非天然存在的NPT包含SEQ ID NO:38的氨基酸序列(V36M，G210A)。

G38.根据实施方案G26或G30所述的抗原生产细胞系，其中非天然存在的NPT包含SEQ ID NO:39的氨基酸序列(V36M，E182D)。

G39.根据实施方案G26或G30所述的抗原生产细胞系，其中非天然存在的NPT包含SEQ ID NO:40的氨基酸序列(V36M，Y218F)。

G40.根据实施方案G26或G30所述的抗原生产细胞系，其中非天然存在的NPT包含SEQ ID NO:41的氨基酸序列(D216G，D261N)。

G41.根据实施方案G26或G30所述的抗原生产细胞系，其中非天然存在的NPT包含SEQ ID NO:42的氨基酸序列(V36M，Y218S)。

G42.根据实施方案G26或G30所述的抗原生产细胞系，其中非天然存在的NPT包含SEQ ID NO:43的氨基酸序列(V36M，D216G)。

G43.根据实施方案G25至G42中任一项所述的抗原生产细胞系，其中细胞系为哺乳动物细胞系。

G44.根据实施方案G25至G42中任一项所述的抗原生产细胞系，其中细胞系为人细胞系。

G45.根据实施方案G25至G42中任一项所述的抗原生产细胞系，其中细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。

G46.根据实施方案G25至G45中任一项所述的抗原生产细胞系，其中该一种或多种抗原为病毒抗原、细菌抗原或真菌抗原。

G47.根据实施方案G25至G45中任一项所述的抗原生产细胞系，其中该一种或多种抗原为癌抗原。

在第八组实施方案中，提供了：

H1.一种选择性标记工具，其用于当被引入细菌细胞时赋予对卡那霉素的抗性，并且当被引入哺乳动物细胞时赋予对G418的抗性。

H2.根据实施方案H1所述的选择性标记工具，其包含SEQ ID NO:20的核酸序列。

H3.根据实施方案H1所述的选择性标记工具，其包含SEQ ID NO:32的核酸序列。

H4.根据实施方案H1所述的选择性标记工具，其包含SEQ ID NO:33的核酸序列。

H5.根据实施方案H1所述的选择性标记工具，其包含SEQ ID NO:34的核酸序列。

H6.根据实施方案H1所述的选择性标记工具，其包含SEQ ID NO:36的核酸序列。

H7.根据实施方案H1所述的选择性标记工具，其包含SEQ ID NO:37的核酸序列。

H8.一种用于制造生产细胞系的方法，该方法包括：

a)用包含核酸序列和工具的表达载体转化细菌或哺乳动物细胞，该核酸序列编码一种或多种病毒蛋白，如果经转化的细胞为细菌细胞，则工具用于在卡那霉素的存在下生长，并且如果经转化的细胞为哺乳动物细胞，则工具用于在G418的存在下生长，以制备经转化的细胞；以及

b)在卡那霉素或G418的存在下培养经转化的细胞，以获得生产细胞系，其中生产细胞系表达来自AAV、腺病毒、逆转录病毒、慢病毒、单纯疱疹病毒、牛痘病毒或杆状病毒的一种或多种病毒蛋白。

H9.一种用于选择具有外源核酸序列的稳定染色体整合的细胞的方法，该方法包括：

a)用包含用于在G418的存在下生长的工具的外源核酸序列转化真核细胞群；

b)在G418的存在下培养经转化的细胞群，以产生能够在G418的存在下生长的经转化的细胞集落；以及

c)从步骤(b)中产生的集落中选择细胞，以获得具有外源核酸的稳定染色体整合的细胞。

H10.根据实施方案H9所述的方法，其中外源核酸序列还包含转基因，并且所选择的细胞表达转基因。

H11.根据实施方案H9所述的方法，其中外源核酸序列破坏所选择的细胞的内源性基因的表达。

H12.一种用于选择具有稳定游离体的哺乳动物细胞的方法，该方法包括：

a)用包含用于在G418的存在下生长的工具的质粒转化哺乳动物细胞群；

c)从步骤(b)中产生的集落中选择细胞，以获得具有包含质粒的稳定游离体的细胞。

H13.根据实施方案H12所述的方法，其中质粒还包含EBNA1 OriP核酸序列，并且所选择的细胞表达EBNA1。

H14.一种用于选择瞬时表达转基因的哺乳动物细胞的方法，该方法包括：

a)将编码转基因的核酸和用于在G418的存在下生长的工具引入哺乳动物细胞群中；

b)在G418的存在下培养哺乳动物细胞群48小时至72小时；

以及

c)从经培养的哺乳动物细胞群中选择在G418的存在下生长的哺乳动物细胞，其中所选择的哺乳动物细胞瞬时表达转基因。

H15.根据实施方案H14所述的方法，其中转基因包含编码Crispr内切核酸酶或Crispr引导RNA的核酸序列。

H16.根据实施方案H8至H15中任一项所述的方法，其中工具为编码非天然存在的新霉素磷酸转移酶的核苷酸序列，该核苷酸序列包含选自由以下项组成的组的氨基酸序列：SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42或SEQ IDNO:43。

10.本文所公开的序列

下表提供了被分配给本文所述序列的序列标识号的概要：

>SEQ ID NO:1，用于野生型新霉素磷酸转移酶蛋白质的蛋白质序列MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAVFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVADRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF

>SEQ ID NO:2，P313WT载体

taactataacggtcctaaggtagcgaacctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctgcggccaattcagtcgataactataacggtcctaaggtagcgatttaaatacgcgctctcttaaggtagccgtgaggctccggtgcccgtcagtgggcagagcgcacatcgcccacagtccccgagaagttggggggaggggtcggcaattgaaccggtgcctagagaaggtggcgcggggtaaactgggaaagtgatgtcgtgtactggctccgcctttttcccgagggtgggggagaaccgtatataagtgcagtagtcgccgtgaacgttctttttcgcaacgggtttgccgccagaacacaggtaagtgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtgccttgaattacttccacgcccctggctgcagtacgtgattcttgatcccgagcttcgggttggaagtgggtgggagagttcgaggccttgcgcttaaggagccccttcgcctcgtgcttgagttgaggcctggcctgggcgctggggccgccgcgtgcgaatctggtggcaccttcgcgcctgtctcgctgctttcgataagtctctagccatttaaaatttttgatgacctgctgcgacgctttttttctggcaagatagtcttgtaaatgcgggccaagatctgcacactggtatttcggtttttggggccgcgggcggcgacggggcccgtgcgtcccagcgctcatgttcggcgaggcggggcctgcgagcgcggccaccgagaatcggacgggggtagtctcaagctggccggcctgctctggtgcctggcctcgcgccgccgtgtatcgccccgccctgggcggcaaggctggcccggtcggcaccagttgcgtgagcggaaagatggccgcttcccggccctgctgcagggagctcaaaatggaggacgcggcgctcgggagagcgggcgggtgagtcacccacacaaaggaaaagggcctttccgtcctcagccgtcgcttcatgtgactccacggagtaccgggcgccgtccaggcacctcgattagttctcgagcttttggagtacgtcgtctttaggttggggggaggggttttatgcgatggagtttccccacactgagtgggtggagactgaagttaggccagcttggcacttgatgtaattctccttggaatttgccctttttgagtttggatcttggttcattctcaagcctcagacagtggttcaaagtttttttcttccatttcaggtgtcgtgaggcgcgccgccaccatggtgagcaagggcgaggaggataacatggccatcatcaaggagttcatgcgcttcaaggtgcacatggagggctccgtgaacggccacgagttcgagatcgagggcgagggcgagggccgcccctacgagggcacccagaccgccaagctgaaggtgaccaagggtggccccctgcccttcgcctgggacatcctgtcccctcagttcatgtacggctccaaggcctacgtgaagcaccccgccgacatccccgactacttgaagctgtccttccccgagggcttcaagtgggagcgcgtgatgaacttcgaggacggcggcgtggtgaccgtgacccaggactcctccctgcaggacggcgagttcatctacaaggtgaagctgcgcggcaccaacttcccctccgacggccccgtaatgcagaagaagaccatgggctgggaggcctcctccgagcggatgtaccccgaggacggcgccctgaagggcgagatcaagcagaggctgaagctgaaggacggcggccactacgacgctgaggtcaagaccacctacaaggccaagaagcccgtgcagctgcccggcgcctacaacgtcaacatcaagttggacatcacctcccacaacgaggactacaccatcgtggaacagtacgaacgcgccgagggccgccactccaccggcggcatggacgagctgtacaagtagtctagagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggtgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtatggctgattatgatcgcggccgcattctaccgggtaggggaggcgcttttcccaaggcagtctggagcatgcgctttagcagccccgctgggcacttggcgctacacaagtggcctctggcctcgcacacattccacatccaccggtaggcgccaaccggctccgttctttggtggccccttcgcgccaccttctactcctcccctagtcaggaagttcccccccgccccgcagctcgcgtcgtgcaggacgtgacaaatggaagtagcacgtctcactagtctcgtgcagatggacagcaccgctgagcaatggaagcgggtaggcctttggggcagcggccaatagcagctttgctccttcgctttctgggctcagaggctgggaaggggtgggtccgggggcgggctcaggggcgggctcaggggcggggcgggcgcccgaaggtcctccggaggcccggcattctgcacgcttcaaaagcgcacgtctgccgcgctgttctcctcttcctcatctccgggcctttcgacctagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctgccaccatgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctgagggggaggctaactgaaacacggaaggagacaataccggaaggaacccgcgctatgacggcaataaaaagacagaataaaacgcacggtgttgggtcgtttgttcataaacgcggggttcggtcccagggctggcactctgtcgataccccaccgagaccccattggggccaatacgcccgcgtttcttccttttccccaccccaccccccaagttcgggtgaaggcccagggctcgcagccaacgtcggggcggcaggccctgccatagcctagggataacagggtaatggcgcgggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcaggtggcaaacagctattatgggtattatgggtgacgtcaagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccctttcgtctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacgacggccagtgaattcacatgt

>SEQ ID NO:3，人延伸因子α启动子

cgtgaggctccggtgcccgtcagtgggcagagcgcacatcgcccacagtccccgagaagttggggggaggggtcggcaattgaaccggtgcctagagaaggtggcgcggggtaaactgggaaagtgatgtcgtgtactggctccgcctttttcccgagggtgggggagaaccgtatataagtgcagtagtcgccgtgaacgttctttttcgcaacgggtttgccgccagaacacaggtaagtgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtgccttgaattacttccacgcccctggctgcagtacgtgattcttgatcccgagcttcgggttggaagtgggtgggagagttcgaggccttgcgcttaaggagccccttcgcctcgtgcttgagttgaggcctggcctgggcgctggggccgccgcgtgcgaatctggtggcaccttcgcgcctgtctcgctgctttcgataagtctctagccatttaaaatttttgatgacctgctgcgacgctttttttctggcaagatagtcttgtaaatgcgggccaagatctgcacactggtatttcggtttttggggccgcgggcggcgacggggcccgtgcgtcccagcgctcatgttcggcgaggcggggcctgcgagcgcggccaccgagaatcggacgggggtagtctcaagctggccggcctgctctggtgcctggcctcgcgccgccgtgtatcgccccgccctgggcggcaaggctggcccggtcggcaccagttgcgtgagcggaaagatggccgcttcccggccctgctgcagggagctcaaaatggaggacgcggcgctcgggagagcgggcgggtgagtcacccacacaaaggaaaagggcctttccgtcctcagccgtcgcttcatgtgactccacggagtaccgggcgccgtccaggcacctcgattagttctcgagcttttggagtacgtcgtctttaggttggggggaggggttttatgcgatggagtttccccacactgagtgggtggagactgaagttaggccagcttggcacttgatgtaattctccttggaatttgccctttttgagtttggatcttggttcattctcaagcctcagacagtggttcaaagtttttttcttccatttcaggtgtcgtga

>SEQ ID NO:4，mCherry编码区

Atggtgagcaagggcgaggaggataacatggccatcatcaaggagttcatgcgcttcaaggtgcacatggagggctccgtgaacggccacgagttcgagatcgagggcgagggcgagggccgcccctacgagggcacccagaccgccaagctgaaggtgaccaagggtggccccctgcccttcgcctgggacatcctgtcccctcagttcatgtacggctccaaggcctacgtgaagcaccccgccgacatccccgactacttgaagctgtccttccccgagggcttcaagtgggagcgcgtgatgaacttcgaggacggcggcgtggtgaccgtgacccaggactcctccctgcaggacggcgagttcatctacaaggtgaagctgcgcggcaccaacttcccctccgacggccccgtaatgcagaagaagaccatgggctgggaggcctcctccgagcggatgtaccccgaggacggcgccctgaagggcgagatcaagcagaggctgaagctgaaggacggcggccactacgacgctgaggtcaagaccacctacaaggccaagaagcccgtgcagctgcccggcgcctacaacgtcaacatcaagttggacatcacctcccacaacgaggactacaccatcgtggaacagtacgaacgcgccgagggccgccactccaccggcggcatggacgagctgtacaagtag

>SEQ ID NO:5，SV40多腺苷酸化信号

Gatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggtgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtatggctgattatgatc

>SEQ ID NO:6，编码野生型新霉素磷酸转移酶蛋白质的DNA

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:7，小鼠磷酸甘油酸激酶启动子

Attctaccgggtaggggaggcgcttttcccaaggcagtctggagcatgcgctttagcagccccgctgggcacttggcgctacacaagtggcctctggcctcgcacacattccacatccaccggtaggcgccaaccggctccgttctttggtggccccttcgcgccaccttctactcctcccctagtcaggaagttcccccccgccccgcagctcgcgtcgtgcaggacgtgacaaatggaagtagcacgtctcactagtctcgtgcagatggacagcaccgctgagcaatggaagcgggtaggcctttggggcagcggccaatagcagctttgctccttcgctttctgggctcagaggctgggaaggggtgggtccgggggcgggctcaggggcgggctc

>SEQ ID NO:8，大肠杆菌laczya启动子

Agcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtgg

>SEQ ID NO:9，单纯疱疹病毒多聚腺苷酸化信号

Gggggaggctaactgaaacacggaaggagacaataccggaaggaacccgcgctatgacggcaataaaaagacagaataaaacgcacggtgttgggtcgtttgttcataaacgcggggttcggtcccagggctggcactctgtcgataccccaccgagaccccattggggccaatacgcccgcgtttcttccttttccccaccccaccccccaagttcgggtgaaggcccagggctcgcagccaacgtcggggcggcaggccctgccatagcc

>SEQ ID NO:10，氨苄青霉素抗性基因

ACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATC

>SEQ ID NO:11，pUC57质粒复制起点

Cgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatccttt

>SEQ ID NO:12，P614 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgaccctgggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:13，P615 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggcggcctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:14，P616 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga

>SEQ ID NO:15，P623 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgaccctgggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga

>SEQ ID NO:16，P624 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggcggcctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga

>SEQ ID NO:17，P626 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcggcgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga

>SEQ ID NO:18，APH(6)-Ia氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

>SEQ ID NO:19，APH(6)-Ib氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

>SEQ ID NO:20，P629 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcgggccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga

>SEQ ID NO:21，P641 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctgagttcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:22，P642 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcggctgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:23，P643 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcgggccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:24，P675 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtggcattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga

>SEQ ID NO:25，P676 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgcgatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga

>SEQ ID NO:26，P677 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgaccagcggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga

>SEQ ID NO:27，P678 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgatgatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttaacgagttcttctga

>SEQ ID NO:28，P679 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtgcccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:29，P680 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgcagccaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:30，P681 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctttcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:31，P682 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:32，P683 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtgcccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:33，P684 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgcagccaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:34，P685 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctttcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:35，P686 Neo ORFAtgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgaccagcggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:36，P687 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgatgatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:37，P688 Neo ORF

Atgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccatgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgagcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcgggccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctga

>SEQ ID NO:38，P683（V36M G210A）

MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAMFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCARLGVADRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF

>SEQ ID NO:39，P687（V36M E182D）

MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAMFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGDDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVADRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF

>SEQ ID NO:40，P685（V36M Y218F）

MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAMFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVADRFQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF

>SEQ ID NO:41，P629（D216G D261N）

MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAVFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVAGRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLNEFF

>SEQ ID NO:42，P684（V36M Y218S）

MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAMFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVADRSQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF

>SEQ ID NO:43，P688（V36M D216G）

MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAMFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKASMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVAGRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF

>SEQ ID NO:44

MIEQDGLHAGSPAAWVERLFGYDWAQQTIGCSDAAVFRLSAQGRPVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDVVTEAGRDWLLLGEVPGQDLLSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDEEHQGLAPAELFARLKARMPDGEDLVVTHGDACLPNIMVENGRFSGFIDCGRLGVADRYQDIALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF

>SEQ ID NO:45，APH(6)-Ic氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

>SEQ ID NO:46，APH(6)-Id氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

>SEQ ID NO:47，APH(3')-IIIa氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:48，APH(3')-VIIa氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:49，APH(3')-VIa氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:50，APH(3')-IVa氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:51，APH(3')-Ia氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:52，APH(3')-Ic氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:53，APH(3')-Ib氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:54，APH(3')-IIa氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:55，APH(3')-Vb氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:56，APH(3')-Va氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:57，APH(3')-Vc氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:58，APH(3")-Ia氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:59，APH(3")-Ib氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:60，APH(2")-Ia氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:61，APH(4)-Ib氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

SEQ ID NO:62，APH(4)-Ib氨基酸序列

(参见图6A至图6B，以查找氨基酸序列)

本文描述了本发明的特定实施方案。在阅读前述描述后，所公开的实施方案的变型对于本领域的技术人员来说可能变得显而易见，并且预期那些技术人员可适当地采用此类变型。因此，本发明旨在以不同于本文具体描述的方式实践，并且本发明包括在适用法律允许的情况下在所附权利要求中记载的主题的所有修改和等同物。此外，除非本文另有说明或以其它方式与上下文明显矛盾，否则在其所有可能变型中的上述元素的任何组合均涵盖于本发明中。已描述了本发明的多个实施方案。然而，应当理解，在不脱离本发明的精神和范围的情况下，可进行各种修改。因此，实施例部分中的描述旨在说明而非限制权利要求书中描述的本发明的范围。

本文引用的所有参考文献全文并出于所有目的以引用方式并入本文，其程度就如同每个单独的出版物或专利或专利申请被具体地和单独地表示为全文并出于所有目的以引用方式并入。

<110> 詹森生物技术公司（JANSSEN BIOTECH, INC.）

<120> 用于经改善的磷酸转移酶的材料和方法

<130> 14620-686-228/JBI6523WOPCT1

<140>

<141>

<150> 63/177,739

<151> 2021-04-21

<150> 63/177,744

<151> 2021-04-21

<150> 63/177,746

<151> 2021-04-21

<150> 63/177,749

<151> 2021-04-21

<150> 63/177,753

<151> 2021-04-21

<150> 63/177,759

<151> 2021-04-21

<150> 63/177,764

<151> 2021-04-21

<150> 63/177,767

<151> 2021-04-21

<160> 62

<170> PatentIn 3.5版本

<210> 1

<211> 264

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

新霉素磷酸转移酶蛋白质序列

<400> 1

Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val

1 5 10 15

Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser

20 25 30

Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe

35 40 45

Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala

50 55 60

Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val

65 70 75 80

Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu

85 90 95

Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys

100 105 110

Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro

115 120 125

Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala

130 135 140

Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu

145 150 155 160

Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala

165 170 175

Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys

180 185 190

Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp

195 200 205

Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala

210 215 220

Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe

225 230 235 240

Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe

245 250 255

Tyr Arg Leu Leu Asp Glu Phe Phe

260

<210> 2

<211> 6963

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 2

taactataac ggtcctaagg tagcgaacct gcaggcagct gcgcgctcgc tcgctcactg 60

aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg tcgcccggcc tcagtgagcg 120

agcgagcgcg cagagaggga gtggccaact ccatcactag gggttcctgc ggccaattca 180

gtcgataact ataacggtcc taaggtagcg atttaaatac gcgctctctt aaggtagccg 240

tgaggctccg gtgcccgtca gtgggcagag cgcacatcgc ccacagtccc cgagaagttg 300

gggggagggg tcggcaattg aaccggtgcc tagagaaggt ggcgcggggt aaactgggaa 360

agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggggagaacc gtatataagt 420

gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac acaggtaagt 480

gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt atggcccttg cgtgccttga 540

attacttcca cgcccctggc tgcagtacgt gattcttgat cccgagcttc gggttggaag 600

tgggtgggag agttcgaggc cttgcgctta aggagcccct tcgcctcgtg cttgagttga 660

ggcctggcct gggcgctggg gccgccgcgt gcgaatctgg tggcaccttc gcgcctgtct 720

cgctgctttc gataagtctc tagccattta aaatttttga tgacctgctg cgacgctttt 780

tttctggcaa gatagtcttg taaatgcggg ccaagatctg cacactggta tttcggtttt 840

tggggccgcg ggcggcgacg gggcccgtgc gtcccagcgc tcatgttcgg cgaggcgggg 900

cctgcgagcg cggccaccga gaatcggacg ggggtagtct caagctggcc ggcctgctct 960

ggtgcctggc ctcgcgccgc cgtgtatcgc cccgccctgg gcggcaaggc tggcccggtc 1020

ggcaccagtt gcgtgagcgg aaagatggcc gcttcccggc cctgctgcag ggagctcaaa 1080

atggaggacg cggcgctcgg gagagcgggc gggtgagtca cccacacaaa ggaaaagggc 1140

ctttccgtcc tcagccgtcg cttcatgtga ctccacggag taccgggcgc cgtccaggca 1200

cctcgattag ttctcgagct tttggagtac gtcgtcttta ggttgggggg aggggtttta 1260

tgcgatggag tttccccaca ctgagtgggt ggagactgaa gttaggccag cttggcactt 1320

gatgtaattc tccttggaat ttgccctttt tgagtttgga tcttggttca ttctcaagcc 1380

tcagacagtg gttcaaagtt tttttcttcc atttcaggtg tcgtgaggcg cgccgccacc 1440

atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 1500

gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 1560

cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 1620

ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 1680

cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 1740

gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 1800

ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 1860

atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 1920

gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 1980

gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 2040

aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 2100

cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta gtctagagat 2160

acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg 2220

aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca 2280

acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa 2340

gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tcgcggccgc attctaccgg 2400

gtaggggagg cgcttttccc aaggcagtct ggagcatgcg ctttagcagc cccgctgggc 2460

acttggcgct acacaagtgg cctctggcct cgcacacatt ccacatccac cggtaggcgc 2520

caaccggctc cgttctttgg tggccccttc gcgccacctt ctactcctcc cctagtcagg 2580

aagttccccc ccgccccgca gctcgcgtcg tgcaggacgt gacaaatgga agtagcacgt 2640

ctcactagtc tcgtgcagat ggacagcacc gctgagcaat ggaagcgggt aggcctttgg 2700

ggcagcggcc aatagcagct ttgctccttc gctttctggg ctcagaggct gggaaggggt 2760

gggtccgggg gcgggctcag gggcgggctc aggggcgggg cgggcgcccg aaggtcctcc 2820

ggaggcccgg cattctgcac gcttcaaaag cgcacgtctg ccgcgctgtt ctcctcttcc 2880

tcatctccgg gcctttcgac ctagcgggca gtgagcgcaa cgcaattaat gtgagttagc 2940

tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 3000

ttgtgagcgg ataacaattt cacacaggaa acagctgcca ccatgattga acaagatgga 3060

ttgcacgcag gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa 3120

cagacaatcg gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt 3180

ctttttgtca agaccgacct gtccggtgcc ctgaatgaac tgcaagacga ggcagcgcgg 3240

ctatcgtggc tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa 3300

gcgggaaggg actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac 3360

cttgctcctg ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt 3420

gatccggcta cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact 3480

cggatggaag ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg 3540

ccagccgaac tgttcgccag gctcaaggcg agcatgcccg acggcgagga tctcgtcgtg 3600

acccatggcg atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc 3660

atcgactgtg gccggctggg tgtggcggac cgctatcagg acatagcgtt ggctacccgt 3720

gatattgctg aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc 3780

gccgctcccg attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctgaggg 3840

ggaggctaac tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa 3900

taaaaagaca gaataaaacg cacggtgttg ggtcgtttgt tcataaacgc ggggttcggt 3960

cccagggctg gcactctgtc gataccccac cgagacccca ttggggccaa tacgcccgcg 4020

tttcttcctt ttccccaccc caccccccaa gttcgggtga aggcccaggg ctcgcagcca 4080

acgtcggggc ggcaggccct gccatagcct agggataaca gggtaatggc gcgggccgca 4140

ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4200

cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 4260

agcgcgcagc tgcctgcagg tggcaaacag ctattatggg tattatgggt gacgtcaagc 4320

ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 4380

cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 4440

ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 4500

ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 4560

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 4620

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 4680

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 4740

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 4800

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 4860

cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 4920

gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 4980

ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 5040

cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 5100

aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 5160

tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc 5220

ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 5280

tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 5340

ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 5400

agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 5460

atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 5520

cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 5580

ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 5640

ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 5700

agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 5760

agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 5820

gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 5880

cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 5940

gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 6000

tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 6060

tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 6120

aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 6180

cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 6240

cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 6300

aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 6360

ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 6420

tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 6480

ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc 6540

acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag 6600

ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag 6660

ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc atcagagcag 6720

attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa 6780

taccgcatca ggcgccattc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6840

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6900

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcaca 6960

tgt 6963

<210> 3

<211> 1188

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 3

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacgcccctg gctgcagtac gtgattcttg atcccgagct tcgggttgga 360

agtgggtggg agagttcgag gccttgcgct taaggagccc cttcgcctcg tgcttgagtt 420

gaggcctggc ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt 480

ctcgctgctt tcgataagtc tctagccatt taaaattttt gatgacctgc tgcgacgctt 540

tttttctggc aagatagtct tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt 600

tttggggccg cgggcggcga cggggcccgt gcgtcccagc gctcatgttc ggcgaggcgg 660

ggcctgcgag cgcggccacc gagaatcgga cgggggtagt ctcaagctgg ccggcctgct 720

ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag gctggcccgg 780

tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc agggagctca 840

aaatggagga cgcggcgctc gggagagcgg gcgggtgagt cacccacaca aaggaaaagg 900

gcctttccgt cctcagccgt cgcttcatgt gactccacgg agtaccgggc gccgtccagg 960

cacctcgatt agttctcgag cttttggagt acgtcgtctt taggttgggg ggaggggttt 1020

tatgcgatgg agtttcccca cactgagtgg gtggagactg aagttaggcc agcttggcac 1080

ttgatgtaat tctccttgga atttgccctt tttgagtttg gatcttggtt cattctcaag 1140

cctcagacag tggttcaaag tttttttctt ccatttcagg tgtcgtga 1188

<210> 4

<211> 711

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 4

atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60

gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120

cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180

ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240

cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300

gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 360

ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420

atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480

gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540

gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600

aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660

cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta g 711

<210> 5

<211> 225

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 5

gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt 60

gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta 120

acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt 180

aaagcaagta aaacctctac aaatgtggta tggctgatta tgatc 225

<210> 6

<211> 795

<212> DNA

<213> 未知

<220>

<223> 未知的描述：

新霉素磷酸转移酶DNA序列

<400> 6

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 7

<211> 400

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 7

attctaccgg gtaggggagg cgcttttccc aaggcagtct ggagcatgcg ctttagcagc 60

cccgctgggc acttggcgct acacaagtgg cctctggcct cgcacacatt ccacatccac 120

cggtaggcgc caaccggctc cgttctttgg tggccccttc gcgccacctt ctactcctcc 180

cctagtcagg aagttccccc ccgccccgca gctcgcgtcg tgcaggacgt gacaaatgga 240

agtagcacgt ctcactagtc tcgtgcagat ggacagcacc gctgagcaat ggaagcgggt 300

aggcctttgg ggcagcggcc aatagcagct ttgctccttc gctttctggg ctcagaggct 360

gggaaggggt gggtccgggg gcgggctcag gggcgggctc 400

<210> 8

<211> 96

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成寡核苷酸

<400> 8

agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg caccccaggc 60

tttacacttt atgcttccgg ctcgtatgtt gtgtgg 96

<210> 9

<211> 272

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 9

gggggaggct aactgaaaca cggaaggaga caataccgga aggaacccgc gctatgacgg 60

caataaaaag acagaataaa acgcacggtg ttgggtcgtt tgttcataaa cgcggggttc 120

ggtcccaggg ctggcactct gtcgataccc caccgagacc ccattggggc caatacgccc 180

gcgtttcttc cttttcccca ccccaccccc caagttcggg tgaaggccca gggctcgcag 240

ccaacgtcgg ggcggcaggc cctgccatag cc 272

<210> 10

<211> 1119

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 10

acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 60

ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 120

gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 180

ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 240

gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 300

agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag 360

caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 420

gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 480

agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 540

gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 600

aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 660

ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 720

tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 780

tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg 840

gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 900

atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 960

ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 1020

aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 1080

ttttcgttcc actgagcgtc agaccccgta gaaaagatc 1119

<210> 11

<211> 615

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 11

cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 60

ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 120

aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 180

tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 240

gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 300

cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 360

ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 420

cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 480

gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 540

cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 600

tcaagaagat ccttt 615

<210> 12

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 12

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac cctgggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 13

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 13

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc ggcctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 14

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 14

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

aacgagttct tctga 795

<210> 15

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 15

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac cctgggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

aacgagttct tctga 795

<210> 16

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 16

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc ggcctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

aacgagttct tctga 795

<210> 17

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 17

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcggc gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

aacgagttct tctga 795

<210> 18

<211> 307

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(6)-Ia氨基酸序列

<400> 18

Met Ser Ser Ser Asp His Ile His Val Pro Asp Gly Leu Ala Glu Ser

1 5 10 15

Tyr Ser Arg Ser Gly Gly Glu Glu Gly Arg Ala Trp Ile Ala Gly Leu

20 25 30

Pro Ala Leu Val Ala Arg Cys Val Asp Arg Trp Glu Leu Lys Arg Asp

35 40 45

Gly Gly Val Arg Ser Gly Glu Ala Ser Leu Val Val Pro Val Leu Arg

50 55 60

Ala Asp Gly Thr Arg Ala Ala Leu Lys Leu Gln Met Pro Arg Glu Glu

65 70 75 80

Thr Thr Ala Ala Leu Ile Gly Leu Arg Ala Trp Gly Gly Asp Gly Met

85 90 95

Val Arg Leu Leu Asp His Asp Glu Glu Ser Ser Thr Met Leu Leu Glu

100 105 110

Arg Leu Asp Gly Ser Arg Thr Leu Ala Ser Val Glu Asp Asp Asp Glu

115 120 125

Ala Met Gly Val Leu Ala Gly Leu Leu Asn Arg Leu His Ser Val Pro

130 135 140

Ala Pro Pro Gly Leu Arg Gly Leu Gly Glu Ile Ala Gly Ala Met Val

145 150 155 160

Glu Glu Val Pro Ser Ala Val Asp Ser Leu Ala Asp Pro Glu Asp Arg

165 170 175

Ser Arg Leu Arg Gly Trp Ala Ser Ala Val Ala Glu Leu Val Gly Glu

180 185 190

Pro Gly Asp Arg Val Leu His Trp Asp Leu His Tyr Glu Asn Val Leu

195 200 205

Ala Ala Glu Arg Glu Pro Trp Leu Ala Ile Asp Pro Glu Pro Leu Val

210 215 220

Gly Asp Pro Gly Phe Asp Leu Trp Pro Ala Leu Asp Thr Gly Trp Glu

225 230 235 240

Arg Ile Glu Ala Thr Gly Asp Ala Arg Arg Val Val Arg Arg Arg Phe

245 250 255

Asp Leu Leu Thr Glu Ser Leu Glu Leu Asp Arg Gly Arg Ala Ala Gly

260 265 270

Trp Thr Leu Ala Arg Leu Leu Gln Asn Thr Leu Trp Asp Ile Glu Asp

275 280 285

Gly Leu Thr Ala Ile Ala Pro Ser Gln Ile Ala Val Ala Glu Ala Leu

290 295 300

Ala Lys Pro

305

<210> 19

<211> 307

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(6)-Ib氨基酸序列

<400> 19

Met Ser Thr Ser Lys Leu Val Glu Ile Pro Glu Pro Leu Ala Ala Ser

1 5 10 15

Tyr Ala Arg Ala Phe Gly Glu Glu Gly Gln Ala Trp Ile Ala Ala Leu

20 25 30

Pro Ala Leu Val Glu Glu Leu Leu Asp Arg Trp Glu Leu Thr Ala Asp

35 40 45

Gly Ala Ser Ala Ser Gly Glu Ala Ser Leu Val Leu Pro Val Leu Arg

50 55 60

Thr Asp Gly Thr Arg Ala Val Leu Lys Leu Gln Leu Pro Arg Glu Glu

65 70 75 80

Thr Ser Ala Ala Ile Thr Gly Leu Arg Thr Trp Asn Gly His Gly Val

85 90 95

Val Arg Leu Leu Asp His Asp Pro Arg Ser Ser Thr Met Leu Leu Glu

100 105 110

Arg Leu Asp Ala Ser Arg Thr Leu Ala Ser Val Glu Asp Asp Asp Ala

115 120 125

Ala Met Gly Val Leu Ala Gly Leu Leu Ala Arg Leu Val Ser Val Pro

130 135 140

Ala Pro Arg Gly Leu Arg Gly Leu Gly Asp Ile Ala Gly Ala Met Leu

145 150 155 160

Glu Glu Val Pro Arg Ala Val Ala Ala Leu Ala Asp Pro Ala Asp Arg

165 170 175

Arg Leu Leu Asn Asp Trp Ala Ser Ala Val Ala Glu Leu Val Gly Glu

180 185 190

Pro Gly Asp Arg Met Leu His Trp Asp Leu His Tyr Gly Asn Val Leu

195 200 205

Ala Ala Glu Arg Glu Pro Trp Leu Ala Ile Asp Pro Glu Pro Leu Ala

210 215 220

Gly Asp Pro Gly Phe Asp Leu Trp Pro Ala Leu Asp Ser Arg Trp Asp

225 230 235 240

Asp Ile Val Ala Gln Arg Asp Val Val Arg Val Val Arg Arg Arg Phe

245 250 255

Asp Leu Leu Thr Glu Val Leu Gly Leu Asp Arg Ala Arg Ala Ala Gly

260 265 270

Trp Thr Tyr Gly Arg Leu Leu Gln Asn Ala Leu Trp Asp Ile Glu Asp

275 280 285

Gly Ser Ala Ala Leu Asp Pro Ala Ala Val Thr Leu Ala Gln Ala Leu

290 295 300

Arg Gly His

305

<210> 20

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 20

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcgggccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

aacgagttct tctga 795

<210> 21

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 21

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctgagttcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 22

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 22

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cggctgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 23

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 23

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcgggccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 24

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 24

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtgg cattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

aacgagttct tctga 795

<210> 25

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 25

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg cgatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

aacgagttct tctga 795

<210> 26

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 26

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac cagcggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

aacgagttct tctga 795

<210> 27

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 27

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgatgatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

aacgagttct tctga 795

<210> 28

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 28

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtgcc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 29

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 29

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg cagccaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 30

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 30

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctttcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 31

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 31

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 32

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 32

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtgcc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 33

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 33

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg cagccaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 34

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 34

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctttcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 35

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 35

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac cagcggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 36

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 36

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgatgatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 37

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 37

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccatgtt ccggctgtca 120

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180

caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300

gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360

cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420

atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480

gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcgggccg ctatcaggac 660

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780

gacgagttct tctga 795

<210> 38

<211> 264

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 38

Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val

1 5 10 15

Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser

20 25 30

Asp Ala Ala Met Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe

35 40 45

Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala

50 55 60

Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val

65 70 75 80

Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu

85 90 95

Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys

100 105 110

Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro

115 120 125

Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala

130 135 140

Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu

145 150 155 160

Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala

165 170 175

Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys

180 185 190

Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp

195 200 205

Cys Ala Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala

210 215 220

Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe

225 230 235 240

Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe

245 250 255

Tyr Arg Leu Leu Asp Glu Phe Phe

260

<210> 39

<211> 264

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 39

Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val

1 5 10 15

Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser

20 25 30

Asp Ala Ala Met Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe

35 40 45

Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala

50 55 60

Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val

65 70 75 80

Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu

85 90 95

Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys

100 105 110

Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro

115 120 125

Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala

130 135 140

Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu

145 150 155 160

Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala

165 170 175

Ser Met Pro Asp Gly Asp Asp Leu Val Val Thr His Gly Asp Ala Cys

180 185 190

Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp

195 200 205

Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala

210 215 220

Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe

225 230 235 240

Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe

245 250 255

Tyr Arg Leu Leu Asp Glu Phe Phe

260

<210> 40

<211> 264

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 40

Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val

1 5 10 15

Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser

20 25 30

Asp Ala Ala Met Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe

35 40 45

Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala

50 55 60

Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val

65 70 75 80

Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu

85 90 95

Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys

100 105 110

Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro

115 120 125

Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala

130 135 140

Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu

145 150 155 160

Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala

165 170 175

Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys

180 185 190

Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp

195 200 205

Cys Gly Arg Leu Gly Val Ala Asp Arg Phe Gln Asp Ile Ala Leu Ala

210 215 220

Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe

225 230 235 240

Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe

245 250 255

Tyr Arg Leu Leu Asp Glu Phe Phe

260

<210> 41

<211> 264

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 41

Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val

1 5 10 15

Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser

20 25 30

Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe

35 40 45

Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala

50 55 60

Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val

65 70 75 80

Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu

85 90 95

Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys

100 105 110

Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro

115 120 125

Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala

130 135 140

Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu

145 150 155 160

Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala

165 170 175

Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys

180 185 190

Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp

195 200 205

Cys Gly Arg Leu Gly Val Ala Gly Arg Tyr Gln Asp Ile Ala Leu Ala

210 215 220

Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe

225 230 235 240

Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe

245 250 255

Tyr Arg Leu Leu Asn Glu Phe Phe

260

<210> 42

<211> 264

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 42

Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val

1 5 10 15

Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser

20 25 30

Asp Ala Ala Met Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe

35 40 45

Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala

50 55 60

Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val

65 70 75 80

Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu

85 90 95

Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys

100 105 110

Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro

115 120 125

Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala

130 135 140

Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu

145 150 155 160

Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala

165 170 175

Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys

180 185 190

Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp

195 200 205

Cys Gly Arg Leu Gly Val Ala Asp Arg Ser Gln Asp Ile Ala Leu Ala

210 215 220

Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe

225 230 235 240

Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe

245 250 255

Tyr Arg Leu Leu Asp Glu Phe Phe

260

<210> 43

<211> 264

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 43

Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val

1 5 10 15

Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser

20 25 30

Asp Ala Ala Met Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe

35 40 45

Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala

50 55 60

Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val

65 70 75 80

Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu

85 90 95

Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys

100 105 110

Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro

115 120 125

Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala

130 135 140

Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu

145 150 155 160

Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala

165 170 175

Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys

180 185 190

Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp

195 200 205

Cys Gly Arg Leu Gly Val Ala Gly Arg Tyr Gln Asp Ile Ala Leu Ala

210 215 220

Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe

225 230 235 240

Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe

245 250 255

Tyr Arg Leu Leu Asp Glu Phe Phe

260

<210> 44

<211> 264

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

新霉素磷酸转移酶氨基酸序列

<400> 44

Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val

1 5 10 15

Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser

20 25 30

Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe

35 40 45

Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala

50 55 60

Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val

65 70 75 80

Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu

85 90 95

Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys

100 105 110

Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro

115 120 125

Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala

130 135 140

Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu

145 150 155 160

Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala

165 170 175

Arg Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys

180 185 190

Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp

195 200 205

Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala

210 215 220

Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe

225 230 235 240

Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe

245 250 255

Tyr Arg Leu Leu Asp Glu Phe Phe

260

<210> 45

<211> 266

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(6)-Ic氨基酸序列

<400> 45

Met Glu Arg Trp Arg Leu Leu Arg Asp Gly Glu Leu Leu Thr Thr His

1 5 10 15

Ser Ser Trp Ile Leu Pro Val Arg Gln Gly Asp Met Pro Ala Met Leu

20 25 30

Lys Val Ala Arg Ile Pro Asp Glu Glu Ala Gly Tyr Arg Leu Leu Thr

35 40 45

Trp Trp Asp Gly Gln Gly Ala Ala Arg Val Phe Ala Ser Ala Ala Gly

50 55 60

Ala Leu Leu Met Glu Arg Ala Ser Gly Ala Gly Asp Leu Ala Gln Ile

65 70 75 80

Ala Trp Ser Gly Gln Asp Asp Glu Ala Cys Arg Ile Leu Cys Asp Thr

85 90 95

Ala Ala Arg Leu His Ala Pro Arg Ser Gly Pro Pro Pro Asp Leu His

100 105 110

Pro Leu Gln Glu Trp Phe Gln Pro Leu Phe Arg Leu Ala Ala Glu His

115 120 125

Ala Ala Leu Ala Pro Ala Ala Ser Val Ala Arg Gln Leu Leu Ala Ala

130 135 140

Pro Arg Glu Val Cys Pro Leu His Gly Asp Leu His His Glu Asn Val

145 150 155 160

Leu Asp Phe Gly Asp Arg Gly Trp Leu Ala Ile Asp Pro His Gly Leu

165 170 175

Leu Gly Glu Arg Thr Phe Asp Tyr Ala Asn Ile Phe Thr Asn Pro Asp

180 185 190

Leu Ser Asp Pro Gly Arg Pro Leu Ala Ile Leu Pro Gly Arg Leu Glu

195 200 205

Ala Arg Leu Ser Ile Val Val Ala Thr Thr Gly Phe Glu Pro Glu Arg

210 215 220

Leu Leu Arg Trp Ile Ile Ala Trp Thr Gly Leu Ser Ala Ala Trp Phe

225 230 235 240

Ile Gly Asp Gly Asp Gly Glu Gly Glu Gly Ala Ala Ile Asp Leu Ala

245 250 255

Val Asn Ala Met Ala Arg Arg Leu Leu Asp

260 265

<210> 46

<211> 277

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(6)-Id氨基酸序列

<400> 46

Met Phe Met Pro Pro Val Phe Pro Ala His Trp His Val Ser Gln Pro

1 5 10 15

Val Leu Ile Ala Asp Thr Phe Ser Ser Leu Val Trp Lys Val Ser Leu

20 25 30

Pro Asp Gly Thr Pro Ala Ile Val Lys Gly Leu Lys Pro Ile Glu Asp

35 40 45

Ile Ala Asp Glu Leu Arg Gly Ala Asp Tyr Leu Val Trp Arg Asn Gly

50 55 60

Arg Gly Ala Val Arg Leu Leu Gly Arg Glu Asn Asn Leu Met Leu Leu

65 70 75 80

Glu Tyr Ala Gly Glu Arg Met Leu Ser His Ile Val Ala Glu His Gly

85 90 95

Asp Tyr Gln Ala Thr Glu Ile Ala Ala Glu Leu Met Ala Lys Leu Tyr

100 105 110

Ala Ala Ser Glu Glu Pro Leu Pro Ser Ala Leu Leu Pro Ile Arg Asp

115 120 125

Arg Phe Ala Ala Leu Phe Gln Arg Ala Arg Asp Asp Gln Asn Ala Gly

130 135 140

Cys Gln Thr Asp Tyr Val His Ala Ala Ile Ile Ala Asp Gln Met Met

145 150 155 160

Ser Asn Ala Ser Glu Leu Arg Gly Leu His Gly Asp Leu His His Glu

165 170 175

Asn Ile Met Phe Ser Ser Arg Gly Trp Leu Val Ile Asp Pro Val Gly

180 185 190

Leu Val Gly Glu Val Gly Phe Gly Ala Ala Asn Met Phe Tyr Asp Pro

195 200 205

Ala Asp Arg Asp Asp Leu Cys Leu Asp Pro Arg Arg Ile Ala Gln Met

210 215 220

Ala Asp Ala Phe Ser Arg Ala Leu Asp Val Asp Pro Arg Arg Leu Leu

225 230 235 240

Asp Gln Ala Tyr Ala Tyr Gly Cys Leu Ser Ala Ala Trp Asn Ala Asp

245 250 255

Gly Glu Glu Glu Gln Arg Asp Leu Ala Ile Ala Ala Ala Ile Lys Gln

260 265 270

Val Arg Gln Thr Ser

275

<210> 47

<211> 264

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3')-IIIa氨基酸序列

<400> 47

Met Ala Lys Met Arg Ile Ser Pro Glu Leu Lys Lys Leu Ile Glu Lys

1 5 10 15

Tyr Arg Cys Val Lys Asp Thr Glu Gly Met Ser Pro Ala Lys Val Tyr

20 25 30

Lys Leu Val Gly Glu Asn Glu Asn Leu Tyr Leu Lys Met Thr Asp Ser

35 40 45

Arg Tyr Lys Gly Thr Thr Tyr Asp Val Glu Arg Glu Lys Asp Met Met

50 55 60

Leu Trp Leu Glu Gly Lys Leu Pro Val Pro Lys Val Leu His Phe Glu

65 70 75 80

Arg His Asp Gly Trp Ser Asn Leu Leu Met Ser Glu Ala Asp Gly Val

85 90 95

Leu Cys Ser Glu Glu Tyr Glu Asp Glu Gln Ser Pro Glu Lys Ile Ile

100 105 110

Glu Leu Tyr Ala Glu Cys Ile Arg Leu Phe His Ser Ile Asp Ile Ser

115 120 125

Asp Cys Pro Tyr Thr Asn Ser Leu Asp Ser Arg Leu Ala Glu Leu Asp

130 135 140

Tyr Leu Leu Asn Asn Asp Leu Ala Asp Val Asp Cys Glu Asn Trp Glu

145 150 155 160

Glu Asp Thr Pro Phe Lys Asp Pro Arg Glu Leu Tyr Asp Phe Leu Lys

165 170 175

Thr Glu Lys Pro Glu Glu Glu Leu Val Phe Ser His Gly Asp Leu Gly

180 185 190

Asp Ser Asn Ile Phe Val Lys Asp Gly Lys Val Ser Gly Phe Ile Asp

195 200 205

Leu Gly Arg Ser Gly Arg Ala Asp Lys Trp Tyr Asp Ile Ala Phe Cys

210 215 220

Val Arg Ser Ile Arg Glu Asp Ile Gly Glu Glu Gln Tyr Val Glu Leu

225 230 235 240

Phe Phe Asp Leu Leu Gly Ile Lys Pro Asp Trp Glu Lys Ile Lys Tyr

245 250 255

Tyr Ile Leu Leu Asp Glu Leu Phe

260

<210> 48

<211> 250

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3')-VIIa氨基酸序列

<400> 48

Met Lys Tyr Ile Asp Glu Ile Gln Ile Leu Gly Lys Cys Ser Glu Gly

1 5 10 15

Met Ser Pro Ala Glu Val Tyr Lys Cys Gln Leu Lys Asn Thr Val Cys

20 25 30

Tyr Leu Lys Lys Ile Asp Asp Ile Phe Ser Lys Thr Thr Tyr Ser Val

35 40 45

Lys Arg Glu Ala Glu Met Met Met Trp Leu Ser Asp Lys Leu Lys Val

50 55 60

Pro Asp Val Ile Glu Tyr Gly Val Arg Glu His Ser Glu Tyr Leu Ile

65 70 75 80

Met Ser Glu Leu Arg Gly Lys His Ile Asp Cys Phe Ile Asp His Pro

85 90 95

Ile Lys Tyr Ile Glu Cys Leu Val Asn Ala Leu His Gln Leu Gln Ala

100 105 110

Ile Asp Ile Arg Asn Cys Pro Phe Ser Ser Lys Ile Asp Val Arg Leu

115 120 125

Lys Glu Leu Lys Tyr Leu Leu Asp Asn Arg Ile Ala Asp Ile Asp Val

130 135 140

Ser Asn Trp Glu Asp Thr Thr Glu Phe Asp Asp Pro Met Thr Leu Tyr

145 150 155 160

Gln Trp Leu Cys Glu Asn Gln Pro Gln Glu Glu Leu Cys Leu Ser His

165 170 175

Gly Asp Met Ser Ala Asn Phe Phe Val Ser His Asp Gly Ile Tyr Phe

180 185 190

Tyr Asp Leu Ala Arg Cys Gly Val Ala Asp Lys Trp Leu Asp Ile Ala

195 200 205

Phe Cys Val Arg Glu Ile Arg Glu Tyr Tyr Pro Asp Ser Asp Tyr Glu

210 215 220

Lys Phe Phe Phe Asn Met Leu Gly Leu Glu Pro Asp Tyr Lys Lys Ile

225 230 235 240

Asn Tyr Tyr Ile Leu Leu Asp Glu Met Phe

245 250

<210> 49

<211> 259

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3')-VIa氨基酸序列

<400> 49

Met Glu Leu Pro Asn Ile Ile Gln Gln Phe Ile Gly Asn Ser Val Leu

1 5 10 15

Glu Pro Asn Lys Ile Gly Gln Ser Pro Ser Asp Val Tyr Ser Phe Asn

20 25 30

Arg Asn Asn Glu Thr Phe Phe Leu Lys Arg Ser Ser Thr Leu Tyr Thr

35 40 45

Glu Thr Thr Tyr Ser Val Ser Arg Glu Ala Lys Met Leu Ser Trp Leu

50 55 60

Ser Glu Lys Leu Lys Val Pro Glu Leu Ile Met Thr Phe Gln Asp Glu

65 70 75 80

Gln Phe Glu Phe Met Ile Thr Lys Ala Ile Asn Ala Lys Pro Ile Ser

85 90 95

Ala Leu Phe Leu Thr Asp Gln Glu Leu Leu Ala Ile Tyr Lys Glu Ala

100 105 110

Leu Asn Leu Leu Asn Ser Ile Ala Ile Ile Asp Cys Pro Phe Ile Ser

115 120 125

Asn Ile Asp His Arg Leu Lys Glu Ser Lys Phe Phe Ile Asp Asn Gln

130 135 140

Leu Leu Asp Asp Ile Asp Gln Asp Asp Phe Asp Thr Glu Leu Trp Gly

145 150 155 160

Asp His Lys Thr Tyr Leu Ser Leu Trp Asn Glu Leu Thr Glu Thr Arg

165 170 175

Val Glu Glu Arg Leu Val Phe Ser His Gly Asp Ile Thr Asp Ser Asn

180 185 190

Ile Phe Ile Asp Lys Phe Asn Glu Ile Tyr Phe Leu Asp Leu Gly Arg

195 200 205

Ala Gly Leu Ala Asp Glu Phe Val Asp Ile Ser Phe Val Glu Arg Cys

210 215 220

Leu Arg Glu Asp Ala Ser Glu Glu Thr Ala Lys Ile Phe Leu Lys His

225 230 235 240

Leu Lys Asn Asp Arg Pro Asp Lys Arg Asn Tyr Phe Leu Lys Leu Asp

245 250 255

Glu Leu Asn

<210> 50

<211> 262

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3')-IVa氨基酸序列

<400> 50

Met Asn Glu Ser Thr Arg Asn Trp Pro Glu Glu Leu Leu Glu Leu Leu

1 5 10 15

Gly Gln Thr Glu Leu Thr Val Asn Lys Ile Gly Tyr Ser Gly Asp His

20 25 30

Val Tyr His Val Lys Glu Tyr Arg Gly Thr Pro Ala Phe Leu Lys Ile

35 40 45

Ala Pro Ser Val Trp Trp Arg Thr Leu Arg Pro Glu Ile Glu Ala Leu

50 55 60

Ala Trp Leu Asp Gly Lys Leu Pro Val Pro Lys Ile Leu Tyr Thr Ala

65 70 75 80

Glu His Gly Gly Met Asp Tyr Leu Leu Met Glu Ala Leu Gly Gly Lys

85 90 95

Asp Gly Ser His Glu Thr Ile Gln Ala Lys Arg Lys Leu Phe Val Lys

100 105 110

Leu Tyr Ala Glu Gly Leu Arg Ser Val His Gly Leu Asp Ile Arg Glu

115 120 125

Cys Pro Leu Ser Asn Gly Leu Glu Lys Lys Leu Arg Asp Ala Lys Arg

130 135 140

Ile Val Asp Glu Ser Leu Val Asp Pro Ala Asp Ile Lys Glu Glu Tyr

145 150 155 160

Asp Cys Thr Pro Glu Glu Leu Tyr Gly Leu Leu Leu Glu Ser Lys Pro

165 170 175

Val Thr Glu Asp Leu Val Phe Ala His Gly Asp Tyr Cys Ala Pro Asn

180 185 190

Leu Ile Ile Asp Gly Glu Lys Leu Ser Gly Phe Ile Asp Leu Gly Arg

195 200 205

Ala Gly Val Ala Asp Arg Tyr Gln Asp Ile Ser Leu Ala Ile Arg Ser

210 215 220

Leu Arg His Asp Tyr Gly Asp Asp Arg Tyr Lys Ala Leu Phe Leu Glu

225 230 235 240

Leu Tyr Gly Leu Asp Gly Leu Asp Glu Asp Lys Val Arg Tyr Tyr Ile

245 250 255

Arg Leu Asp Glu Phe Phe

260

<210> 51

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3')-Ia氨基酸序列

<400> 51

Met Ser His Ile Gln Arg Glu Thr Ser Cys Ser Arg Pro Arg Leu Asn

1 5 10 15

Ser Asn Met Asp Ala Asp Leu Tyr Gly Tyr Lys Trp Ala Arg Asp Asn

20 25 30

Val Gly Gln Ser Gly Ala Thr Ile Tyr Arg Leu Tyr Gly Lys Pro Asp

35 40 45

Ala Pro Glu Leu Phe Leu Lys His Gly Lys Gly Ser Val Ala Asn Asp

50 55 60

Val Thr Asp Glu Met Val Arg Leu Asn Trp Leu Thr Glu Phe Met Pro

65 70 75 80

Leu Pro Thr Ile Lys His Phe Ile Arg Thr Pro Asp Asp Ala Trp Leu

85 90 95

Leu Thr Thr Ala Ile Pro Gly Lys Thr Ala Phe Gln Val Leu Glu Glu

100 105 110

Tyr Pro Asp Ser Gly Glu Asn Ile Val Asp Ala Leu Ala Val Phe Leu

115 120 125

Arg Arg Leu His Ser Ile Pro Val Cys Asn Cys Pro Phe Asn Ser Asp

130 135 140

Arg Val Phe Arg Leu Ala Gln Ala Gln Ser Arg Met Asn Asn Gly Leu

145 150 155 160

Val Asp Ala Ser Asp Phe Asp Asp Glu Arg Asn Gly Trp Pro Val Glu

165 170 175

Gln Val Trp Lys Glu Met His Lys Leu Leu Pro Phe Ser Pro Asp Ser

180 185 190

Val Val Thr His Gly Asp Phe Ser Leu Asp Asn Leu Ile Phe Asp Glu

195 200 205

Gly Lys Leu Ile Gly Cys Ile Asp Val Gly Arg Val Gly Ile Ala Asp

210 215 220

Arg Tyr Gln Asp Leu Ala Ile Leu Trp Asn Cys Leu Gly Glu Phe Ser

225 230 235 240

Pro Ser Leu Gln Lys Arg Leu Phe Gln Lys Tyr Gly Ile Asp Asn Pro

245 250 255

Asp Met Asn Lys Leu Gln Phe His Leu Met Leu Asp Glu Phe Phe

260 265 270

<210> 52

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3')-Ic氨基酸序列

<400> 52

Met Ser His Ile Gln Arg Glu Thr Ser Cys Ser Arg Pro Arg Leu Asn

1 5 10 15

Ser Asn Leu Asp Ala Asp Leu Tyr Gly Tyr Arg Trp Ala Arg Asp Asn

20 25 30

Val Gly Gln Ser Gly Ala Thr Ile Tyr Arg Leu Tyr Gly Lys Pro Asn

35 40 45

Ala Pro Glu Leu Phe Leu Lys His Gly Lys Gly Ser Val Ala Asn Asp

50 55 60

Val Thr Asp Glu Met Val Arg Leu Asn Trp Leu Thr Ala Phe Met Pro

65 70 75 80

Leu Pro Thr Ile Lys His Phe Ile Arg Thr Pro Asp Asp Ala Trp Leu

85 90 95

Leu Thr Thr Ala Ile Pro Gly Lys Thr Ala Phe Gln Val Leu Glu Glu

100 105 110

Tyr Pro Asp Ser Gly Glu Asn Ile Val Asp Ala Leu Ala Val Phe Leu

115 120 125

Arg Arg Leu His Ser Ile Pro Val Cys Asn Cys Pro Phe Asn Ser Asp

130 135 140

Arg Val Phe Arg Leu Ala Gln Ala Gln Ser Arg Met Asn Asn Gly Leu

145 150 155 160

Val Asp Ala Ser Asp Phe Asp Asp Glu Arg Asn Gly Trp Pro Val Glu

165 170 175

Gln Val Trp Lys Glu Met His Lys Leu Leu Pro Phe Ser Pro Asp Ser

180 185 190

Val Val Thr His Gly Asp Phe Ser Leu Asp Asn Leu Ile Phe Asp Glu

195 200 205

Gly Lys Leu Ile Gly Cys Ile Asp Val Gly Arg Val Gly Ile Ala Asp

210 215 220

Arg Tyr Gln Asp Leu Ala Ile Leu Trp Asn Cys Leu Gly Glu Phe Ser

225 230 235 240

Pro Ser Leu Gln Lys Arg Leu Phe Gln Lys Tyr Gly Ile Asp Asn Pro

245 250 255

Asp Met Asn Lys Leu Gln Phe His Leu Met Leu Asp Glu Phe Phe

260 265 270

<210> 53

<211> 269

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3')-Ib氨基酸序列

<400> 53

Met Asn Asp Ile Asp Arg Glu Glu Pro Cys Ala Ala Ala Ala Val Pro

1 5 10 15

Glu Ser Met Ala Ala His Val Met Gly Tyr Lys Trp Ala Arg Asp Lys

20 25 30

Val Gly Gln Ser Gly Cys Ala Val Tyr Arg Leu His Ser Lys Ser Gly

35 40 45

Gly Ser Asp Leu Phe Leu Lys His Gly Lys Asp Ala Ala Asp Asp Val

50 55 60

Thr Asp Glu Met Val Arg Leu Arg Trp Leu Ala Gly His Ile Ser Val

65 70 75 80

Pro Ser Val Val Ser Phe Val Arg Thr Pro Asn Gln Ala Trp Leu Leu

85 90 95

Thr Thr Ala Ile His Gly Lys Thr Ala Phe Gln Val Leu Glu Glu Tyr

100 105 110

Pro Asp Ser Gly Glu Asn Ile Val Asp Ala Ala Val Phe Leu Arg Arg

115 120 125

Leu His Ser Ile Pro Val Cys Asn Cys Pro Phe Asn Ser Asp Arg Val

130 135 140

Phe Arg Leu Ala Gln Ala Gln Ser Arg Met Asn Asn Gly Leu Val Asp

145 150 155 160

Val Asp Asp Phe Asp Lys Glu Arg Glu Gly Trp Thr Ala Glu Gln Val

165 170 175

Trp Glu Ala Met His Arg Leu Leu Pro Leu Ala Pro Asp Pro Val Val

180 185 190

Thr His Gly Asp Phe Ser Leu Asp Asn Leu Leu Ile Val Glu Gly Lys

195 200 205

Val Val Gly Cys Ile Asp Val Gly Arg Ala Gly Ile Ala Asp Arg Tyr

210 215 220

Gln Asp Leu Ala Val Leu Trp Asn Cys Leu Glu Glu Phe Glu Pro Ser

225 230 235 240

Leu Gln Glu Arg Leu Val Ala Gln Tyr Gly Ile Ala Asp Pro Asp Arg

245 250 255

Arg Lys Leu Gln Phe His Leu Leu Leu Asp Glu Leu Phe

260 265

<210> 54

<211> 264

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3')-IIa氨基酸序列

<400> 54

Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val

1 5 10 15

Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser

20 25 30

Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe

35 40 45

Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala

50 55 60

Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val

65 70 75 80

Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu

85 90 95

Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys

100 105 110

Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro

115 120 125

Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala

130 135 140

Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu

145 150 155 160

Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala

165 170 175

Arg Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys

180 185 190

Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp

195 200 205

Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala

210 215 220

Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe

225 230 235 240

Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe

245 250 255

Tyr Arg Leu Leu Asp Glu Phe Phe

260

<210> 55

<211> 263

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3')-Vb氨基酸序列

<400> 55

Met Glu Ser Thr Leu Arg Arg Thr Tyr Pro His His Thr Trp His Leu

1 5 10 15

Val Asn Glu Gly Asp Ser Gly Ala Phe Val Tyr Arg Leu Thr Gly His

20 25 30

Gly Pro Glu Leu Tyr Ala Lys Ile Ala Pro Arg Thr Pro Glu Asn Ser

35 40 45

Ala Phe His Leu Asp Gly Glu Ala Asp Arg Leu Asp Trp Leu Ala Arg

50 55 60

His Gly Ile Ser Val Pro Arg Val Val Glu Arg Gly Ala Asp Asp Thr

65 70 75 80

Thr Ala Trp Leu Val Thr Glu Ala Val Pro Gly Ala Ala Ser Ala Glu

85 90 95

Glu Trp Pro Glu Asp Glu Arg Ala Ala Val Val Asp Ala Ile Ala Glu

100 105 110

Met Ala Arg Thr Leu His Glu Leu Pro Val Ser Glu Cys Pro Phe Asp

115 120 125

Arg Arg Leu Asp Val Thr Gly Glu Ala Arg His Asn Val Arg Glu Gly

130 135 140

Leu Val Asp Leu Asp Asp Leu Gln Glu Glu Pro Ala Gly Trp Thr Gly

145 150 155 160

Asp Gln Leu Leu Ala Glu Leu Asp Leu Thr Arg Pro Glu Lys Glu Asp

165 170 175

Leu Val Val Cys His Gly Asp Leu Cys Pro Asn Asn Val Leu Leu Asp

180 185 190

Pro Glu Thr His Arg Val Thr Gly Leu Ile Asp Val Gly Arg Leu Arg

195 200 205

Leu Ala Thr Cys His Ala Asp Ile Ala Leu Ala Ala Arg Glu Leu Ala

210 215 220

Ile Asp Glu Asp Pro Trp Phe Gly Pro Ala Tyr Ala Glu Arg Phe Leu

225 230 235 240

Glu Arg Tyr Gly Ala His His Val Asp Gln Glu Lys Met Ala Phe Tyr

245 250 255

Gln Leu Leu Asp Glu Phe Phe

260

<210> 56

<211> 268

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3')-Va氨基酸序列

<400> 56

Met Asp Asp Ser Thr Leu Arg Arg Lys Tyr Pro His His Glu Trp His

1 5 10 15

Ala Val Asn Glu Gly Asp Ser Gly Ala Phe Val Tyr Gln Leu Thr Gly

20 25 30

Gly Pro Glu Pro Gln Pro Glu Leu Tyr Ala Lys Ile Ala Pro Arg Ala

35 40 45

Pro Glu Asn Ser Ala Phe Asp Leu Ser Gly Glu Ala Asp Arg Leu Glu

50 55 60

Trp Leu His Arg His Gly Ile Pro Val Pro Arg Val Val Glu Arg Gly

65 70 75 80

Ala Asp Asp Thr Ala Ala Trp Leu Val Thr Glu Ala Val Pro Gly Val

85 90 95

Ala Ala Ala Glu Glu Trp Pro Glu His Gln Arg Phe Ala Val Val Glu

100 105 110

Ala Met Ala Glu Leu Ala Arg Ala Leu His Glu Leu Pro Val Glu Asp

115 120 125

Cys Pro Ser Asp Arg Arg Leu Asp Ala Ala Val Ala Glu Ala Arg Arg

130 135 140

Asn Val Ala Glu Gly Leu Val Asp Leu Asp Asp Leu Gln Glu Glu Arg

145 150 155 160

Ala Gly Trp Thr Gly Asp Gln Leu Leu Ala Glu Leu Asp Arg Thr Arg

165 170 175

Pro Glu Lys Glu Asp Leu Val Val Cys His Gly Asp Leu Cys Pro Asn

180 185 190

Asn Val Leu Leu Asp Pro Gly Thr Cys Arg Val Thr Gly Val Ile Asp

195 200 205

Val Gly Arg Leu Gly Val Ala Asp Arg His Ala Asp Ile Ala Leu Ala

210 215 220

Ala Arg Glu Leu Glu Ile Asp Glu Asp Pro Trp Phe Gly Pro Ala Tyr

225 230 235 240

Ala Glu Arg Phe Leu Glu Arg Tyr Gly Ala His Arg Val Asp Lys Glu

245 250 255

Lys Leu Ala Phe Tyr Gln Leu Leu Asp Glu Phe Phe

260 265

<210> 57

<211> 264

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3')-Vc氨基酸序列

<400> 57

Met Tyr Ala Met Leu Arg Arg Lys Tyr Gln His Tyr Glu Trp Thr Ser

1 5 10 15

Val Asn Glu Gly Asp Ser Gly Ala Ser Val Tyr Arg Leu Ala Gly Gln

20 25 30

Gln Pro Glu Leu Tyr Val Lys Phe Ala Pro Arg Glu Pro Glu Asn Ser

35 40 45

Ala Phe Asp Leu Ala Gly Glu Ala Asp Arg Leu Thr Trp Leu Thr Arg

50 55 60

His Gly Ile Pro Val Pro Cys Ile Val Glu Cys Gly Gly Asp Asp Thr

65 70 75 80

Ser Val Phe Leu Val Thr Glu Ala Val Thr Gly Val Ala Ala Ala Glu

85 90 95

Glu Trp Pro Glu His Gln Arg Phe Ala Val Val Glu Ala Met Ala Asp

100 105 110

Leu Ala Arg Thr Leu His Glu Leu Pro Val Gly Gly Cys Pro Phe Asp

115 120 125

Arg Ser Leu Ala Val Thr Val Ala Glu Ala Arg His Asn Leu Arg Glu

130 135 140

Gly Leu Val Asp Leu Asp Asp Leu Gln Glu Glu His Ala Asn Trp Ser

145 150 155 160

Gly Asp Gln Leu Leu Ala Glu Leu Asp Arg Thr Arg Pro Glu Lys Glu

165 170 175

Asp Leu Val Val Cys His Gly Asp Leu Cys Pro Asn Asn Val Leu Leu

180 185 190

Asp Pro Glu Thr Cys Arg Val Thr Gly Met Ile Asp Val Gly Arg Leu

195 200 205

Gly Arg Ala Asp Arg His Ala Asp Ile Ala Leu Ala Ala Arg Glu Leu

210 215 220

Glu Ile Asp Glu Asp Pro Trp Phe Gly Pro Glu Tyr Ala Gln Arg Phe

225 230 235 240

Leu Glu Arg Tyr Gly Ala His His Val Asp Glu Asn Lys Met Ala Phe

245 250 255

Tyr Gln Leu Leu Asp Glu Phe Phe

260

<210> 58

<211> 272

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3")-Ia氨基酸序列

<400> 58

Met Ser Asp His Pro Gly Pro Gly Ala Val Thr Pro Glu Leu Phe Gly

1 5 10 15

Val Gly Gly Asp Trp Leu Ala Val Thr Ala Gly Glu Ser Gly Ala Ser

20 25 30

Val Phe Arg Ala Ala Asp Ala Thr Arg Tyr Ala Lys Cys Val Pro Ala

35 40 45

Ala Asp Ala Ala Gly Leu Glu Ala Glu Arg Asp Arg Ile Ala Trp Leu

50 55 60

Ser Gly Gln Gly Val Pro Gly Pro Arg Val Leu Asp Trp Tyr Ala Gly

65 70 75 80

Asp Ala Gly Ala Cys Leu Val Thr Arg Ala Val Pro Gly Val Pro Ala

85 90 95

Asp Arg Val Gly Ala Asp Asp Leu Arg Thr Ala Trp Gly Ala Val Ala

100 105 110

Asp Ala Val Arg Arg Leu His Glu Val Pro Val Ala Ser Cys Pro Phe

115 120 125

Arg Arg Gly Leu Asp Ser Val Val Asp Ala Ala Arg Asp Val Val Ala

130 135 140

Arg Gly Ala Val His Pro Glu Phe Leu Pro Val Glu Gln Arg Leu Val

145 150 155 160

Pro Pro Ala Glu Leu Leu Ala Arg Leu Thr Gly Glu Leu Ala Arg Arg

165 170 175

Arg Asp Gln Glu Ala Ala Asp Thr Val Val Cys His Gly Asp Leu Cys

180 185 190

Leu Pro Asn Ile Val Leu His Pro Glu Thr Leu Glu Val Ser Gly Phe

195 200 205

Ile Asp Leu Gly Arg Leu Gly Ala Ala Asp Arg His Ala Asp Leu Ala

210 215 220

Leu Leu Leu Ala Asn Ala Arg Glu Thr Trp Val Asp Glu Glu Arg Ala

225 230 235 240

Arg Phe Ala Asp Ala Ala Phe Ala Glu Arg Tyr Gly Ile Ala Pro Asp

245 250 255

Pro Glu Arg Leu Arg Phe Tyr Leu His Leu Asp Pro Leu Thr Trp Gly

260 265 270

<210> 59

<211> 267

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(3")-Ib氨基酸序列

<400> 59

Leu Asn Arg Thr Asn Ile Phe Phe Gly Glu Ser His Ser Asp Trp Leu

1 5 10 15

Pro Val Arg Gly Gly Glu Ser Gly Asp Phe Val Phe Arg Arg Gly Asp

20 25 30

Gly His Ala Phe Ala Lys Ile Ala Pro Ala Ser Arg Arg Gly Glu Leu

35 40 45

Ala Gly Glu Arg Asp Arg Leu Ile Trp Leu Lys Gly Arg Gly Val Ala

50 55 60

Cys Pro Glu Val Ile Asn Trp Gln Glu Glu Gln Glu Gly Ala Cys Leu

65 70 75 80

Val Ile Thr Ala Ile Pro Gly Val Pro Ala Ala Asp Leu Ser Gly Ala

85 90 95

Asp Leu Leu Lys Ala Trp Pro Ser Met Gly Gln Gln Leu Gly Ala Val

100 105 110

His Ser Leu Ser Val Asp Gln Cys Pro Phe Glu Arg Arg Leu Ser Arg

115 120 125

Met Phe Gly Arg Ala Val Asp Val Val Ser Arg Asn Ala Val Asn Pro

130 135 140

Asp Phe Leu Pro Asp Glu Asp Lys Ser Thr Pro Leu His Asp Leu Leu

145 150 155 160

Ala Arg Val Glu Arg Glu Leu Pro Val Arg Leu Asp Gln Glu Arg Thr

165 170 175

Asp Met Val Val Cys His Gly Asp Pro Cys Met Pro Asn Phe Met Val

180 185 190

Asp Pro Lys Thr Leu Gln Cys Thr Gly Leu Ile Asp Leu Gly Arg Leu

195 200 205

Gly Thr Ala Asp Arg Tyr Ala Asp Leu Ala Leu Met Ile Ala Asn Ala

210 215 220

Glu Glu Asn Trp Ala Ala Pro Asp Glu Ala Glu Arg Ala Phe Ala Val

225 230 235 240

Leu Phe Asn Val Leu Gly Ile Glu Ala Pro Asp Arg Glu Arg Leu Ala

245 250 255

Phe Tyr Leu Arg Leu Asp Pro Leu Thr Trp Gly

260 265

<210> 60

<211> 319

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(2")-Ia氨基酸序列

<400> 60

Glu His Glu Leu His Glu Gly Lys Lys Glu Asp Cys Tyr Leu Met Glu

1 5 10 15

Tyr Arg Tyr Asp Asp Asn Ala Thr Asn Val Lys Ala Met Lys Tyr Leu

20 25 30

Ile Glu His Tyr Phe Asp Asn Phe Lys Val Asp Ser Ile Glu Ile Ile

35 40 45

Gly Ser Gly Tyr Asp Ser Val Ala Tyr Leu Val Asn Asn Glu Tyr Ile

50 55 60

Phe Lys Thr Lys Phe Ser Thr Asn Lys Lys Lys Gly Tyr Ala Lys Glu

65 70 75 80

Lys Ala Ile Tyr Asn Phe Leu Asn Thr Asn Leu Glu Thr Asn Val Lys

85 90 95

Ile Pro Asn Ile Glu Tyr Ser Tyr Ile Ser Asp Glu Leu Ser Ile Leu

100 105 110

Gly Tyr Lys Glu Ile Lys Gly Thr Phe Leu Thr Pro Glu Ile Tyr Ser

115 120 125

Thr Met Ser Glu Glu Glu Gln Asn Leu Leu Lys Arg Asp Ile Ala Ser

130 135 140

Phe Leu Arg Gln Met His Gly Leu Asp Tyr Thr Asp Ile Ser Glu Cys

145 150 155 160

Thr Ile Asp Asn Lys Gln Asn Val Leu Glu Glu Tyr Ile Leu Leu Arg

165 170 175

Glu Thr Ile Tyr Asn Asp Leu Thr Asp Ile Glu Lys Asp Tyr Ile Glu

180 185 190

Ser Phe Met Glu Arg Leu Asn Ala Thr Thr Val Phe Glu Gly Lys Lys

195 200 205

Cys Leu Cys His Asn Asp Phe Ser Cys Asn His Leu Leu Leu Asp Gly

210 215 220

Asn Asn Arg Leu Thr Gly Ile Ile Asp Phe Gly Asp Ser Gly Ile Ile

225 230 235 240

Asp Glu Tyr Cys Asp Phe Ile Tyr Leu Leu Glu Asp Ser Glu Glu Glu

245 250 255

Ile Gly Thr Asn Phe Gly Glu Asp Ile Leu Arg Met Tyr Gly Asn Ile

260 265 270

Asp Ile Glu Lys Ala Lys Glu Tyr Gln Asp Ile Val Glu Glu Tyr Tyr

275 280 285

Pro Ile Glu Thr Ile Val Tyr Gly Ile Lys Asn Ile Lys Gln Glu Phe

290 295 300

Ile Glu Asn Gly Arg Lys Glu Ile Tyr Lys Arg Thr Tyr Lys Asp

305 310 315

<210> 61

<211> 332

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(4)-Ib氨基酸序列

<400> 61

Met Thr Gln Glu Ser Leu Leu Leu Leu Asp Arg Ile Asp Ser Asp Asp

1 5 10 15

Ser Tyr Ala Ser Leu Arg Asn Asp Gln Glu Phe Trp Glu Pro Leu Ala

20 25 30

Arg Arg Ala Leu Glu Glu Leu Gly Leu Pro Val Pro Pro Val Leu Arg

35 40 45

Val Pro Gly Glu Ser Thr Asn Pro Val Leu Val Gly Glu Pro Asp Pro

50 55 60

Val Ile Lys Leu Phe Gly Glu His Trp Cys Gly Pro Glu Ser Leu Ala

65 70 75 80

Ser Glu Ser Glu Ala Tyr Ala Val Leu Ala Asp Ala Pro Val Pro Val

85 90 95

Pro Arg Leu Leu Gly Arg Gly Glu Leu Arg Pro Gly Thr Gly Ala Trp

100 105 110

Pro Trp Pro Tyr Leu Val Met Ser Arg Met Thr Gly Thr Thr Trp Arg

115 120 125

Ser Ala Met Asp Gly Thr Thr Asp Arg Asn Ala Leu Leu Ala Leu Ala

130 135 140

Arg Glu Leu Gly Arg Val Leu Gly Arg Leu His Arg Val Pro Leu Thr

145 150 155 160

Gly Asn Thr Val Leu Thr Pro His Ser Glu Val Phe Pro Glu Leu Leu

165 170 175

Arg Glu Arg Arg Ala Ala Thr Val Glu Asp His Arg Gly Trp Gly Tyr

180 185 190

Leu Ser Pro Arg Leu Leu Asp Arg Leu Glu Asp Trp Leu Pro Asp Val

195 200 205

Asp Thr Leu Leu Ala Gly Arg Glu Pro Arg Phe Val His Gly Asp Leu

210 215 220

His Gly Thr Asn Ile Phe Val Asp Leu Ala Ala Thr Glu Val Thr Gly

225 230 235 240

Ile Val Asp Phe Thr Asp Val Tyr Ala Gly Asp Ser Arg Tyr Ser Leu

245 250 255

Tyr Gln Leu His Leu Asn Ala Phe Arg Gly Asp Arg Glu Ile Leu Ala

260 265 270

Ala Leu Leu Asp Gly Ala Gln Trp Lys Arg Thr Glu Asp Phe Ala Arg

275 280 285

Glu Leu Leu Ala Phe Thr Phe Leu His Asp Phe Glu Val Phe Glu Glu

290 295 300

Thr Pro Leu Asp Leu Ser Gly Phe Thr Asp Pro Glu Glu Leu Ala Gln

305 310 315 320

Phe Leu Trp Gly Pro Pro Asp Thr Ala Pro Gly Ala

325 330

<210> 62

<211> 341

<212> PRT

<213> 未知

<220>

<223> 未知的描述：

APH(4)-Ia氨基酸序列

<400> 62

Met Lys Lys Pro Glu Leu Thr Ala Thr Ser Val Glu Lys Phe Leu Ile

1 5 10 15

Glu Lys Phe Asp Ser Val Ser Asp Leu Met Gln Leu Ser Glu Gly Glu

20 25 30

Glu Ser Arg Ala Phe Ser Phe Asp Val Gly Gly Arg Gly Tyr Val Leu

35 40 45

Arg Val Asn Ser Cys Ala Asp Gly Phe Tyr Lys Asp Arg Tyr Val Tyr

50 55 60

Arg His Phe Ala Ser Ala Ala Leu Pro Ile Pro Glu Val Leu Asp Ile

65 70 75 80

Gly Glu Phe Ser Glu Ser Leu Thr Tyr Cys Ile Ser Arg Arg Ala Gln

85 90 95

Gly Val Thr Leu Gln Asp Leu Pro Glu Thr Glu Leu Pro Ala Val Leu

100 105 110

Gln Pro Val Ala Glu Ala Met Asp Ala Ile Ala Ala Ala Asp Leu Ser

115 120 125

Gln Thr Ser Gly Phe Gly Pro Phe Gly Pro Gln Gly Ile Gly Gln Tyr

130 135 140

Thr Thr Trp Arg Asp Phe Ile Cys Ala Ile Ala Asp Pro His Val Tyr

145 150 155 160

His Trp Gln Thr Val Met Asp Asp Thr Val Ser Ala Ser Val Ala Gln

165 170 175

Ala Leu Asp Glu Leu Met Leu Trp Ala Glu Asp Cys Pro Glu Val Arg

180 185 190

His Leu Val His Ala Asp Phe Gly Ser Asn Asn Val Leu Thr Asp Asn

195 200 205

Gly Arg Ile Thr Ala Val Ile Asp Trp Ser Glu Ala Met Phe Gly Asp

210 215 220

Ser Gln Tyr Glu Val Ala Asn Ile Phe Phe Trp Arg Pro Trp Leu Ala

225 230 235 240

Cys Met Glu Gln Gln Thr Arg Tyr Phe Glu Arg Arg His Pro Glu Leu

245 250 255

Ala Gly Ser Pro Arg Leu Arg Ala Tyr Met Leu Arg Ile Gly Leu Asp

260 265 270

Gln Leu Tyr Gln Ser Leu Val Asp Gly Asn Phe Asp Asp Ala Ala Trp

275 280 285

Ala Gln Gly Arg Cys Asp Ala Ile Val Arg Ser Gly Ala Gly Thr Val

290 295 300

Gly Arg Thr Gln Ile Ala Arg Arg Ser Ala Ala Val Trp Thr Asp Gly

305 310 315 320

Cys Val Glu Val Leu Ala Asp Ser Gly Asn Arg Arg Pro Ser Thr Arg

325 330 335

Pro Arg Ala Lys Glu

340

Claims

1.一种具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中所述非天然存在的NPT包含具有以下项的野生型新霉素磷酸转移酶的氨基酸序列：

(a)在对应于SEQ ID NO:1的氨基酸残基36和210的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的所述氨基酸残基处的所述氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基210的所述氨基酸残基处的所述氨基酸取代为对丙氨酸的取代；

(b)在对应于SEQ ID NO:1的氨基酸残基36和182的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的所述氨基酸残基处的所述氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基182的所述氨基酸残基处的所述氨基酸取代为对天冬氨酸的取代；

(c)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的所述氨基酸残基处的所述氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的所述氨基酸残基处的所述氨基酸取代为对苯丙氨酸的取代；

(d)在对应于SEQ ID NO:1的氨基酸残基216和261的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基216的所述氨基酸残基处的所述氨基酸取代为对甘氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基261的所述氨基酸残基处的所述氨基酸取代为对天冬酰胺的取代；

(e)在对应于SEQ ID NO:1的氨基酸残基36和218的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的所述氨基酸残基处的所述氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基218的所述氨基酸残基处的所述氨基酸取代为对丝氨酸的取代；或

(f)在对应于SEQ ID NO:1的氨基酸残基36和216的氨基酸残基处的氨基酸取代，其中在对应于SEQ ID NO:1的氨基酸残基36的所述氨基酸残基处的所述氨基酸取代为对甲硫氨酸的取代，并且在对应于SEQ ID NO:1的氨基酸残基216的所述氨基酸残基处的所述氨基酸取代为对甘氨酸的取代。

2.一种具有新霉素磷酸转移酶活性的非天然存在的新霉素磷酸转移酶(NPT)，其中所述非天然存在的NPT包含具有以下项的SEQ ID NO:1的氨基酸序列：

(a)在SEQ ID NO:1的位置36和210处的氨基酸取代，其中在SEQ ID NO:1的位置36处的所述氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置210处的所述氨基酸取代为对丙氨酸的取代；

(b)在SEQ ID NO:1的位置36和182处的氨基酸取代，其中在SEQ ID NO:1的位置36处的所述氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置182处的所述氨基酸取代为对天冬氨酸的取代；

(c)在SEQ ID NO:1的位置36和218处的氨基酸取代，其中在SEQ ID NO:1的位置36处的所述氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的所述氨基酸取代为对苯丙氨酸的取代；

(d)在SEQ ID NO:1的位置216和261处的氨基酸取代，其中在SEQID NO:1的位置216处的所述氨基酸取代为对甘氨酸的取代，并且在SEQ ID NO:1的位置261处的所述氨基酸取代为对天冬酰胺的取代；

(e)在SEQ ID NO:1的位置36和218处的氨基酸取代，其中在SEQ ID NO:1的位置36处的所述氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置218处的所述氨基酸取代为对丝氨酸的取代；或

(f)在SEQ ID NO:1的位置36和216处的氨基酸取代，其中在SEQ ID NO:1的位置36处的所述氨基酸取代为对甲硫氨酸的取代，并且在SEQ ID NO:1的位置216处的所述氨基酸取代为对甘氨酸的取代。

3.根据权利要求1所述的NPT，其中相比于野生型NPT，所述非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

4.根据权利要求1或3所述的NPT，其中所述野生型NPT包含与SEQID NO:1至少80％、至少90％或至少98％相同的氨基酸序列。

5.根据权利要求1或3所述的NPT，其中所述野生型NPT包含与SEQID NO:1至少60％、至少65％、至少70％或至少75％相同的氨基酸序列。

6.根据权利要求2所述的NPT，其中相比于包含SEQ ID NO:1的所述氨基酸序列的野生型NPT，所述非天然存在的NPT作为选择性标记具有衰减的新霉素磷酸转移酶活性。

7.根据权利要求1至6中任一项所述的NPT，其中相对于用编码野生型NPT的核苷酸序列转染或转化的细菌细胞，在含有25μg/mL、75μg/mL或100μg/mL卡那霉素的板上生长48小时后，用编码所述非天然存在的NPT的核苷酸序列转染或转化的细菌细胞表现出减少的集落形成，如通过集落形成测定所评估的；并且其中任选地，所述细菌细胞为大肠杆菌(E.coli)。

8.根据权利要求1至6中任一项所述的NPT，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞，在含有500μg/mL遗传霉素(G418)的培养基中在组织培养板上生长2周后，用包含编码所述非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞表现出减少的集落形成，如通过集落形成测定所评估的；并且其中任选地，所述哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

9.根据权利要求1至6中任一项所述的NPT，其中相对于用相同但包含编码野生型NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落，用包含编码所述非天然存在的NPT的核苷酸序列的表达载体转染的哺乳动物细胞的G418抗性集落以范围为0.001％至75％的频率产生。

10.根据权利要求2所述的NPT，其中所述非天然存在的NPT包含SEQID NO:38(V36M，G210A)、SEQ ID NO:39(V36M，E182D)、SEQ ID NO:40(V36M，Y218F)、SEQ ID NO:41(D216G，D261N)、SEQ ID NO:42(V36M，Y218S)或SEQ ID NO:43(V36M，D216G)的氨基酸序列。

11.一种核酸序列，所述核酸序列包含编码根据权利要求1至10中任一项所述的非天然存在的NPT的第一核苷酸序列。

12.根据权利要求11所述的核酸序列，其中所述核酸序列还包含编码第二蛋白质或非编码RNA的第二核苷酸序列；并且其中任选地，所述第二蛋白质为治疗性蛋白。

13.根据权利要求11或12所述的核酸序列，其中所述第一核苷酸序列包含SEQ ID NO:20、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:36或SEQ ID NO:37的核苷酸序列。

14.一种载体，所述载体包含根据权利要求11至13中任一项所述的核酸序列。

15.一种体外或离体宿主细胞，所述体外或离体宿主细胞包含根据权利要求1至10中任一项所述的非天然存在的NPT。

16.一种体外或离体宿主细胞，所述体外或离体宿主细胞包含根据权利要求11至13中任一项所述的核酸序列或根据权利要求14所述的载体。

17.根据权利要求16所述的细胞，其中所述核酸序列被稳定整合至所述宿主细胞的基因组中。

18.根据权利要求15至17中任一项所述的细胞，其中所述宿主细胞还包含编码第二蛋白质或非编码RNA的第二核酸序列，并且其中所述第二蛋白质任选地为治疗性蛋白；或者其中任选地，所述第二核酸序列编码非编码RNA；并且其中任选地，所述非编码RNA为shRNA、miRNA、反义RNA、用于Crispr核酸酶的引导RNA、催化RNA、核糖体RNA或tRNA。

19.根据权利要求15至18中任一项所述的细胞，其中所述宿主细胞为细菌、酵母细胞、哺乳动物细胞、植物细胞；任选地其中所述哺乳动物细胞为人细胞。

20.一种用于从其中引入了转基因的宿主细胞群中选择具有高拷贝数的转基因和/或高表达水平的转基因的细胞的方法，所述方法包括：

(a)将核酸序列引入宿主细胞群中，所述核酸序列包含：

(i)第一核苷酸序列，其编码根据权利要求1至10中任一项所述的非天然存在的新霉素磷酸转移酶(NPT)；以及

(ii)第二核苷酸序列，其包含所述转基因；以及

(b)从其中引入了所述核酸序列的所述宿主细胞群中选择在新霉素磷酸转移酶底物的存在下生长的细胞。

21.根据权利要求20所述的方法，其中：

(a)相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后的第二组细胞中的所述转基因的拷贝数，所选择的细胞包含2倍至1000倍的所述转基因的所述拷贝数，其中用包含编码野生型NPT蛋白质的核苷酸序列和所述转基因的核酸序列转染或转化所述第二宿主细胞群；以及/或者

(b)相比于选择在新霉素磷酸转移酶底物的存在下生长的第二宿主细胞群后由第二组细胞的所述转基因的表达水平，所选择的细胞实现了10倍至1000倍的所述转基因的所述表达水平，其中用包含编码野生型NPT蛋白质的核苷酸序列和所述转基因的核酸序列转染或转化所述第二宿主细胞群。

22.根据权利要求20或21所述的方法，其中所述宿主细胞为细菌细胞、酵母细胞、哺乳动物细胞、植物细胞；任选地其中所述哺乳动物细胞为人细胞。

23.根据权利要求20、21或22所述的方法，其中所述核酸序列被稳定整合至所选择的细胞的基因组中。

24.根据权利要求20至23中任一项所述的方法，其中所选择的细胞具有高拷贝数的所述转基因。

25.根据权利要求20至24中任一项所述的方法，其中所选择的细胞具有高表达水平的所述转基因。

26.根据权利要求20至25中任一项所述的方法，其中所选择的细胞已经将所述转基因的5个至100个拷贝整合至它们的基因组DNA中。

27.根据权利要求20至25中任一项所述的方法，其中所选择的细胞已经将所述转基因的1个至5个拷贝整合至它们的基因组DNA中。

28.根据权利要求20至27中任一项所述的方法，其中所述转基因包含病毒基因或生长因子基因，或者所述转基因编码蛋白质或非编码RNA；其中任选地，所述非编码RNA选自由以下项组成的组：反义RNA、miRNA、shRNA、长链非编码RNA、催化RNA、核糖体RNA、tRNA或用于CRISPR核酸酶的引导RNA；并且其中任选地，所述蛋白质为治疗性蛋白或抗原。

29.根据权利要求20至28中任一项所述的方法，其中所述新霉素磷酸转移酶底物为新霉素、卡那霉素或G418。

30.一种使用质粒或转座子的方法，所述质粒或转座子包含编码作为选择性标记的根据权利要求1至10中任一项所述的非天然存在的NPT的核酸序列，所述方法包括：

(a)将包含编码所述非天然存在的NPT的所述核酸序列的所述质粒或转座子引入宿主细胞中；以及

(b)使所述细胞在新霉素磷酸转移酶底物的存在下生长。

31.根据权利要求30所述的方法，其中所述宿主细胞为细菌、酵母细胞、哺乳动物细胞、植物细胞；任选地，其中所述哺乳动物细胞为人细胞。

32.根据权利要求30或31所述的方法，其中所述质粒或转座子还包含编码蛋白质或非编码RNA的第二核苷酸序列；其中任选地，所述蛋白质为病毒蛋白或治疗性蛋白；并且其中任选地，所述非编码RNA为shRNA、miRNA、反义RNA、用于Crispr核酸酶的引导RNA、催化RNA、核糖体RNA或tRNA。

33.根据权利要求30至32中任一项所述的方法，其中所述新霉素磷酸转移酶底物为新霉素、卡那霉素或G418。

34.一种制备包含第二核苷酸序列的宿主细胞的方法，所述方法包括：

(a)将第一核酸序列引入宿主细胞群中，所述第一核酸序列包含：(i)第一核苷酸序列，其编码根据权利要求1至10中任一项所述的非天然存在的NPT，以及(ii)第二核苷酸序列，其包含编码第二蛋白质或非编码RNA的转基因；其中任选地，所述第二蛋白质为治疗性蛋白或抗原，或者任选地，所述非编码区为shRNA、miRNA、反义RNA、用于Crispr核酸酶的引导RNA、催化RNA、核糖体RNA或tRNA；

(b)使所述宿主细胞群在新霉素磷酸转移酶底物的存在下生长，以产生集落；以及

(c)选择在所述新霉素磷酸转移酶底物的存在下生长的细胞集落。

35.一种制备包含第二核苷酸序列的宿主细胞的方法，所述方法包括：

(a)将以下项共引入宿主细胞群中：(i)第一核酸序列，其包含编码根据权利要求1至10中任一项所述的非天然存在的NPT的第一核苷酸序列，以及(ii)第二核酸序列，其包含编码第二蛋白质或非编码RNA的转基因；其中任选地，所述第二蛋白质为治疗性蛋白或抗原，或者任选地，所述非编码区为shRNA、miRNA、反义RNA、用于Crispr核酸酶的引导RNA、催化RNA、核糖体RNA或tRNA；

36.一种制备包含第二核苷酸序列的宿主细胞的方法，所述方法包括：

(a)使宿主细胞群在新霉素磷酸转移酶底物的存在下生长，以产生集落，其中所述宿主细胞群包含：(i)第一核酸序列，其包含编码根据权利要求1至10中任一项所述的非天然存在的NPT的第一核苷酸序列，以及(ii)第二核酸序列，其包含编码第二蛋白质或非编码RNA的转基因；其中任选地，所述第二蛋白质为治疗性蛋白或抗原，或者任选地，所述非编码区为shRNA、miRNA、反义RNA、用于Crispr核酸酶的引导RNA、催化RNA、核糖体RNA或tRNA；以及

(b)选择在所述新霉素磷酸转移酶底物的存在下生长的细胞集落。

37.一种制备包含第二核苷酸序列的宿主细胞的方法，所述方法包括：

38.根据权利要求34至37中任一项所述的方法，其中所述宿主细胞为哺乳动物细胞；任选地其中所述哺乳动物细胞为人细胞。

39.根据权利要求38所述的方法，其中所述哺乳动物细胞为HEK293细胞、CHO细胞、PER.C6细胞、鼠NS0细胞、纤维肉瘤HT-1080细胞、鼠Sp2/0细胞、BHK细胞或鼠C127细胞。

40.根据权利要求34至39中任一项所述的方法，所述方法还包括培养所选择的细胞集落。

41.根据权利要求34至39中任一项所述的方法，其中所述新霉素磷酸转移酶底物为新霉素、卡那霉素或G418。

42.宿主细胞，所述宿主细胞通过根据权利要求34至41中任一项所述的方法来产生。

43.一种用于制造表达治疗性蛋白或酶的稳定细胞系的方法，所述方法包括：

(a)将一个或多个核酸序列引入宿主细胞群中，其中所述一个或多个核酸序列包含：(i)第一核酸序列，其编码根据权利要求1至10中任一项所述的非天然存在的新霉素磷酸转移酶(NPT)；以及(ii)第二核酸序列，其编码所述治疗性蛋白或酶；

(b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及

(c)培养所选择的细胞，以产生表达所述治疗性蛋白或酶的稳定细胞系。

44.根据权利要求43所述的方法，其中所述稳定细胞系表达所述治疗性蛋白或酶，任选地其中所述治疗性蛋白为抗体或抗体片段。

45.一种稳定细胞系，所述稳定细胞系通过根据权利要求43或44所述的方法来产生。

46.一种制备病毒生产细胞系的方法，所述方法包括：

(a)将一个或多个核酸序列引入宿主细胞群中，其中所述一个或多个核酸序列包含：(i)第一核酸序列，其编码根据权利要求1至10中任一项所述的非天然存在的新霉素磷酸转移酶(NPT)；以及(ii)第二核酸序列，其编码一种或多种病毒蛋白，其中所述一种或多种病毒蛋白包括衣壳蛋白、包膜蛋白、复制所必需的病毒蛋白或它们的组合；以及

(b)从所述细胞群中选择在新霉素磷酸转移酶底物的存在下生长的细胞；以及

(c)繁殖所选择的细胞，以产生病毒生产细胞系。

47.根据权利要求46所述的方法，其中所述一种或多种病毒蛋白包括AAV衣壳蛋白；AAV衣壳蛋白和AAV rep蛋白；包膜蛋白；腺病毒复制所需的腺病毒E1区蛋白；逆转录病毒包膜蛋白；逆转录病毒gag蛋白；逆转录病毒逆转录酶；或逆转录病毒包膜蛋白、gag蛋白和逆转录酶。

48.一种病毒生产细胞系，所述病毒生产细胞系通过根据权利要求46或47所述的方法来制备。

49.一种病毒生产细胞系，所述病毒生产细胞系包含一个或多个核酸序列，其中所述一个或多个核酸序列包含：

(a)第一核酸序列，其编码根据权利要求1至10中任一项所述的非天然存在的新霉素磷酸转移酶(NPT)；以及

(b)第二核酸序列，其编码一种或多种病毒蛋白，其中所述一种或多种病毒蛋白包括衣壳蛋白、包膜蛋白、复制所必需的病毒蛋白或它们的组合。

50.根据权利要求49所述的病毒生产细胞系，其中所述一种或多种病毒蛋白包括AAV衣壳蛋白；AAV衣壳蛋白和AAV rep蛋白；包膜蛋白；腺病毒复制所需的腺病毒E1区蛋白；逆转录病毒包膜蛋白；逆转录病毒gag蛋白；逆转录病毒逆转录酶；或逆转录病毒包膜蛋白、gag蛋白和逆转录酶。

51.一种用于制造表达抗原的细胞系的方法，所述方法包括：

(a)将一个或多个核酸序列引入宿主细胞群中，其中所述一个或多个核酸序列包含：(i)第一核酸序列，其编码根据权利要求1至10中任一项所述的非天然存在的新霉素磷酸转移酶(NPT)；以及(ii)第二核酸序列，其编码抗原；其中任选地，所述抗原为病毒抗原、细菌抗原、真菌抗原或癌抗原；

(b)从步骤(a)的细胞群中选择在G418的存在下生长的细胞；以及

(c)培养所选择的细胞，以产生表达所述抗原的细胞系。

52.一种抗原生产细胞系，所述抗原生产细胞系通过根据权利要求51所述的方法来制备。

53.根据权利要求43、44、46、47或51所述的方法，其中所述细胞系为哺乳动物细胞系；任选地，其中所述哺乳动物细胞系为人细胞系。

54.根据权利要求43、44、46、47或51所述的方法，其中所述细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。

55.一种抗原生产细胞系，所述抗原生产细胞系包含一个或多个核酸序列，其中所述一个或多个核酸序列包含：

(b)第二核酸序列，其编码一种或多种抗原；其中任选地，所述一种或多种抗原为病毒抗原、细菌抗原、真菌抗原或癌抗原。

56.根据权利要求45、48、49、50、52或55所述的细胞系，其中所述细胞系为哺乳动物细胞系；任选地其中所述哺乳动物细胞系为人细胞系。

57.根据权利要求45、48、49、50、52或55所述的细胞系，其中所述细胞系为CHO、PER.C6、鼠NS0、HEK293、纤维肉瘤HT-1080、鼠Sp2/0、BHK或鼠C127细胞系。

58.一种选择性标记工具，其用于当被引入细菌细胞时赋予对卡那霉素的抗性，并且当被引入哺乳动物细胞时赋予对G418的抗性；其中任选地，所述选择性标记工具包含SEQ IDNO:20的核酸序列；SEQ ID NO:32的核酸序列；SEQ ID NO:33的核酸序列；SEQ ID NO:34的核酸序列；SEQ ID NO:36的核酸序列；或SEQ ID NO:37的核酸序列。

59.一种用于制造生产细胞系的方法，所述方法包括：

(a)用包含核酸序列和工具的表达载体转化细菌或哺乳动物细胞，所述核酸序列编码一种或多种病毒蛋白，如果经转化的细胞为细菌细胞，则所述工具用于在卡那霉素的存在下生长，并且如果所述经转化的细胞为哺乳动物细胞，则所述工具用于在G418的存在下生长，以制备经转化的细胞；以及

(b)在卡那霉素或G418的存在下培养经转化的细胞，以获得生产细胞系，其中所述生产细胞系表达来自AAV、腺病毒、逆转录病毒、慢病毒、单纯疱疹病毒、牛痘病毒或杆状病毒的一种或多种病毒蛋白。

60.一种用于选择具有外源核酸序列的稳定染色体整合的细胞的方法，所述方法包括：

(a)用包含用于在G418的存在下生长的工具的外源核酸序列转化真核细胞群；

(b)在G418的存在下培养经转化的细胞群，以产生能够在G418的存在下生长的经转化的细胞集落；以及

(c)从步骤(b)中产生的集落中选择细胞，以获得具有外源核酸的稳定染色体整合的细胞；其中任选地，所述外源核酸序列还包含转基因，并且所选择的细胞表达所述转基因；或者所述外源核酸序列破坏所选择的细胞的内源性基因的表达。

61.一种用于选择具有稳定游离体的哺乳动物细胞的方法，所述方法包括：

(a)用包含用于在G418的存在下生长的工具的质粒转化哺乳动物细胞群；

(c)从步骤(b)中产生的集落中选择细胞，以获得具有包含所述质粒的稳定游离体的细胞；其中任选地，所述质粒还包含EBNA1 OriP核酸序列，并且所选择的细胞表达EBNA1。

62.一种用于选择瞬时表达转基因的哺乳动物细胞的方法，所述方法包括：

(a)将编码转基因的核酸和用于在G418的存在下生长的工具引入哺乳动物细胞群中；

(b)在G418的存在下培养所述哺乳动物细胞群48小时至72小时；以及

(c)从经培养的哺乳动物细胞群中选择在G418的存在下生长的哺乳动物细胞，其中所选择的哺乳动物细胞瞬时表达所述转基因；其中任选地，所述转基因包含编码Crispr内切核酸酶或Crispr引导RNA的核酸序列。

63.根据权利要求59至62所述的方法，其中所述工具为编码非天然存在的新霉素磷酸转移酶的核苷酸序列，所述核苷酸序列包含选自由以下项组成的组的氨基酸序列：SEQ IDNO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42和SEQ ID NO:43。