CN113383081A

CN113383081A - 基质附着区和促进基因表达的用途

Info

Publication number: CN113383081A
Application number: CN201980091439.0A
Authority: CN
Inventors: 尼基尔·高尔
Original assignee: Celltheon Corp
Current assignee: Celltheon Corp
Priority date: 2018-12-07
Filing date: 2019-12-06
Publication date: 2021-09-10
Also published as: EP3891288A1; US20220017916A1; CA3161115A1; JP2022511077A; AU2019395023A1; EP3891288A4; WO2020118169A1; KR20210113222A

Abstract

本发明涉及新鉴定的基质附着区（MAR）和嵌合序列。本发明还公开了核苷酸构建体，所述核苷酸构建体在相对于蛋白质编码序列的合适的位置包含MAR，以用于蛋白质的最佳表达。

Description

基质附着区和促进基因表达的用途

相关申请的交叉引用

本申请根据35 U.S.C. §119(e)要求2018年12月7日提交的美国临时申请序列号62/776,643的利益，其全部内容通过引用并入本文。

背景技术

基因序列的转录（即mRNA的生成）在许多不同的水平受到控制。转录起始位点或启动子具有不同的强度，并且给定基因的转录起始频率也可以通过增强子序列增加。转录过程中的暂停可以影响转录速率，从而影响在给定时间段内产生的转录物的量。前体mRNA剪接、聚腺苷酸化和切割的速率也可以影响由转录单位产生的mRNA的水平。此外，mRNA分子内的序列可以调节其从细胞核到细胞质的转运、以及其转换率（即其细胞质稳定性）。

体外的多肽（例如治疗性抗体、生长因子）的表达对于制药工业而言是重要的，并且使蛋白表达最大化的方法是有需要的。

概述

本发明描述了一种用于评估基质附着区（MAR）的强度的新技术，并且表明了该技术可用于鉴定以前未知的新的MAR序列。本发明还描述了嵌合MAR序列。

本发明还描述了核苷酸构建体，所述核苷酸构建体包括顺式MAR位置（placement）和相关的其他序列，以用于感兴趣的基因（GOI）的最佳表达。

因此，根据本发明的一个实施方案，提供了一种重组多核苷酸，其包含：编码序列；启动子，其被配置为启动编码序列的转录；以及基质附着区（MAR）核心，其选自SEQ ID NO:1、5、9和13和与SEQ ID NO: 1、5、9和13中任何一个具有至少75%序列同一性（sequenceidentity）的核酸序列，其中MAR核心能够附着到哺乳动物细胞核基质。

另一个实施方案提供了一种将编码序列转染到细胞的方法，其包含：在用于将第一和第二多核苷酸转染到细胞中的条件下，将细胞与包含编码序列和用于启动编码序列的转录的启动子的第一多核苷酸和包含选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少75%序列同一性的核酸序列的基质附着区（MAR）核心的不连接的（unlinked）第二多核苷酸接触，其中MAR核心能够附着到哺乳动物细胞核基质。

本发明还提供了嵌合基质附着区（MAR），其包含：（a）MAR核心，其选自SEQ ID NO:1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少75%序列同一性的核酸序列，其中MAR核心能够附着到哺乳动物细胞核基质；（b）5’侧翼区，其选自SEQ ID NO: 2、6、10、14、18、22、26、30和34和与SEQ ID NO: 2、6、10、14、18、22、26、30和34中的任何一个具有至少75%序列同一性的核酸序列；以及（c）3’侧翼区，其选自SEQ ID NO: 3、7、11、15、19、23、27、31和35和与SEQ ID NO: 3、7、11、15、19、23、27、31和35中的任何一个具有至少75%序列同一性的核酸序列，其中MAR核心、5’侧翼区和3’侧翼区不是来自相同的天然MAR。

附图说明

图1比较了两种MAR序列（作为对照的MAR X29（一种已知的MAR），以及通过本发明的技术鉴定的MAR斑马鱼（Zebrafish））的强度。

图2展示了使用不包含任何MAR序列的构建体作为对照，MAR斑马鱼核心的强度。

图3是实施例2中所描述的含有MAR核心的构建体的载体图。

图4是如实施例2中所描述的不包含MAR核心元件的对照构建体的载体图。

详细描述

I. 定义

所有的数字标示（包括范围），例如pH、温度、时间、浓度和分子质量，都是近似值，其通过0.1的增量变化（+）或（-）。应当理解的是，尽管并非总是明确地表明，但术语“约”位于所有的数字标示之前。还应当理解的是，尽管并非总是明确地表明，但本文所述的试剂仅是示例性的，并且其等效物是本领域已知的。

如说明书和权利要求书中所使用的，除非上下文中明确地规定，否则单数形式“一个”、“一种”、“所述”包含复数形式。例如术语“一种/一个多核苷酸”包括多种多核苷酸，包括其混合物。

术语“多核苷酸”和“寡核苷酸”被可互换地使用，并且是指任何长度的核苷酸的聚合形式，无论是脱氧核糖核苷酸还是核糖核苷酸还是其类似物。多核苷酸可以包括被修饰的核苷酸，例如甲基化的核苷酸和核苷酸类似物。如果存在，则可以在组装多核苷酸之前或之后赋予对核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分打断。在聚合之后可以进一步修饰多核苷酸，例如通过与标记组分偶联。该术语也指双链和单链分子。除非另有说明或要求，否则本发明的多核苷酸的任何实施方案包括双链形式和已知或预测构成双链形式的两种互补单链形式中的每一种。

II. 新的基质附着区（MAR）序列

本发明描述了一种经由电脑（in silico）量化MAR元件的强度的方法，以及使用该方法量化从序列数据库中鉴定的新的MAR序列的强度。

通过序列比较和结构-活性分析，本发明人发现MAR元件可以由中央富含AT的核心区和含有转录因子结合基序的5'和3'侧翼区组成。

核心区可以富含(ATAT)n微卫星。结合基序可以靶向SATB1、NMP4、CEBP、Fast和Hox转录因子。MAR可以结合的其他细胞核基质蛋白包括：ARBP蛋白（附着区结合蛋白），其识别MAR中的共有序列ATTTCA^C/_GTTGTAAAA；NMP-2蛋白，仅定位于细胞核基质中；Sp1、ATF、CCAAT、C/EBP和AP-1转录因子；酵母ACBP蛋白（ARS共有结合蛋白），其与ARS元件相互作用；组织特异性人SATB1蛋白，其主要在胸腺中表达，其与特殊的一类一条链上有A、T或C，但没有G的富含AT的MAR的小沟结合；Matrin 3蛋白（一种人和大鼠细胞的内部细胞核基质网络的酸性蛋白），matrin F/G；转录蛋白因子RFP。

分析结果帮助发明人寻找新的MAR序列，从而发现了与阳性对照MAR X29相比在促进基因表达方面高效的四个新的MAR序列（Arope et al. (2013) PLoS ONE 8(11):e79262）。

本发明进一步证明，这些新鉴定的MAR序列的核心可以与来自其他MAR的5’和3’侧翼区形成功能性MAR，提供另外的有用的嵌合MAR序列。

因此，根据本发明的一个实施方案，提供了一种重组多核苷酸，其包含：编码序列；启动子，其被配置为启动编码序列的转录；以及本文所述的基质附着区（MAR）核心及其变体。这种新的MAR核心的实施例列于表1中。参见，例如，SEQ ID NO: 1、5、9和13。

基质附着区或MAR是真核生物的染色体的DNA中细胞核基质附着的序列。作为将真核生物的基因组在细胞核内组织成功能单元的结构DNA组件，MAR可以在细胞核内介导染色质的结构组织。这些元件构成染色质支架的DNA的锚点，并且用于将染色质组织成结构域。由MAR元件介导的染色质的动态和复杂组织在基因表达的调节中起着重要作用。

MAR核心的变体是与参考MAR核心（例如，SEQ ID NO: 1、5、9和13）具有一定序列同一性（例如，至少75%、80%、85%、90%、95%、97%、98%或99%）并具有预期的MAR功能（例如，附着到哺乳动物核基质的能力）的核酸序列。

在一些实施方案中，MAR核心的变体富含AT，例如在序列中具有至少75%、80%、85%、90%或95%的A或T。

MAR核心能够与MAR的5’侧翼区（例如SEQ ID NO: 2、6、10、14和18中的任何一个或其变体（与SEQ ID NO: 2、6、10、14和18中的任何一个具有至少75%、80%、85%、90%、95%、97%、98%或99%序列同一性的核酸序列））一起存在。在一些实施方案中，5’侧翼区位于MAR核心的5’侧，并距离MAR核心100个核苷酸之内。

在一些实施方案中，MAR核心能够与MAR的3’侧翼区（例如SEQ ID NO: 3、7、11、15和19中的任何一个或其变体（与SEQ ID NO: 3、7、11、15和19中的任何一个具有至少75%、80%、85%、90%、95%、97%、98%或99%序列同一性的核酸序列））一起存在。在一些实施方案中，3’侧翼区位于MAR核心的3’侧，并距离MAR核心100个核苷酸之内。

包括MAR核心、5’侧翼区和3’侧翼区的非限制性MAR序列包括SEQ ID NO: 4、8、12和16和与SEQ ID NO: 4、8、12和16中的任何一个具有至少75%、80%、85%、90%、95%、97%、98%或99%序列同一性的核酸序列，其中MAR核心能够附着到哺乳动物细胞核基质。

III. 嵌合MAR序列

正如所提供的，这些新鉴定的MAR序列的核心能够与来自其他MAR的5’和3’侧翼区形成功能性MAR，提供另外的有用的嵌合MAR序列。

在一个实施方案中，本发明的嵌合MAR包括如本文所公开的MAR核心，其在5’侧具有5’侧翼区。在一个实施方案中，本发明的嵌合MAR包括如本文所公开的MAR核心，其在3’侧具有3’侧翼区。在一个实施方案中，本发明的嵌合MAR包括如本文所公开的MAR核心，其在5’侧具有5’侧翼区且在3’侧具有3’侧翼区。

5’侧翼区能够选自本领域已知的或本文公开的任何5’侧翼区或3’侧翼区。在一些实施方案中，5’侧翼区能够选自本领域已知的或本文公开的任何5’侧翼区。

3’侧翼区能够选自本领域已知的或本文公开的任何5’侧翼区或3’侧翼区。在一些实施方案中，5’侧翼区能够选自本领域已知的或本文公开的任何3’侧翼区。

MAR核心、MAR 5’侧翼区和MAR 3’侧翼区中的每一个也能够被核酸变体（例如，与参考序列具有至少75%、80%、85%、90%、95%、97%、98%或99%的序列同一性）取代。

本文公开的MAR核心包括SEQ ID NO：1、5、9和13。本文公开的5’侧翼区包括SEQ IDNO：2、6、10、14、18、22、26、30和34。本文公开的3’侧翼区包括SEQ ID NO：3、7、11、15、19、23、27、31和35。

在一些实施方案中，本文新鉴定的MAR侧翼序列也能够与本文新发现的或已知的其他核心序列融合以产生新的嵌合MAR序列。在一些实施方案中，嵌合MAR序列包括表1的MAR核心区中的任何一个、表1的MAR 5’侧翼序列中的任何一个、以及表1的MAR 3’侧翼序列中的任何一个。

IV. 基因表达

本文公开的MAR序列和构建体能够被用于促进细胞中的基因表达。当感兴趣的基因被包含在含有MAR（单独的或具有5’和/或3’侧翼区的MAR）的构建体中时，可以将构建体导入宿主细胞中以表达感兴趣的基因。

本文公开的MAR序列还能够作为反式作用元件被用于以反式来促进基因表达。例如，可以将包含本文公开的任何MAR序列（单独的或具有5’和/或3’侧翼区的野生型或嵌合型MAR）的构建体导入到用包含感兴趣基因（GOI，或转基因）的构建体进一步转染（或已转染）的细胞中，使得MAR序列能够帮助GOI的表达。

因此，根据本文公开的一个实施方案，提供了一种将编码序列转染至细胞的方法，其包含：在用于将第一和第二多核苷酸转染到细胞中的条件下，将细胞与包含编码序列和用于启动编码序列的转录的启动子的第一多核苷酸和包含如本文所公开的基质附着区（MAR）核心的不连接的第二多核苷酸接触。在一些实施方案中，MAR核心选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少75%序列同一性的核酸序列，其中MAR核心能够附着到哺乳动物细胞核基质。

在一些实施方案中，第二多核苷酸进一步包含5’侧翼区，所述5’侧翼区选自SEQID NO: 2、6、10、14和18和与SEQ ID NO: 2、6、10、14和18中的任何一个具有至少75%序列同一性的核酸序列。在一些实施方案中，5’侧翼区位于MAR核心的5’侧，并距离MAR核心100个核苷酸之内。

在一些实施方案中，第二多核苷酸进一步包含3’侧翼区，所述3’侧翼区选自SEQID NO: 3、7、11、15和19和与SEQ ID NO: 3、7、11、15和19中的任何一个具有至少75%序列同一性的核酸序列。在一些实施方案中，3’侧翼区位于MAR核心的3’侧，并距离MAR核心100个核苷酸之内。

在一些实施方案中，完整的MAR序列选自SEQ ID NO: 4、8、12和16和与SEQ ID NO:4、8、12和16中的任何一个具有至少75%序列同一性的核酸序列，其中MAR能够附着到哺乳动物细胞核基质。

本发明还提供了通过本发明公开的方法制备的转染细胞。

在本发明公开的任何构建体或载体中，能够包括另外的转录调控序列和/或转录后调控序列。转录调控序列能够包括例如启动子、增强子和聚腺苷酸化信号。转录后调控序列包括例如内含子和PRE。

在某些实施方案中，在载体中存在多克隆位点（MCS）（也被称为“多接头（polylinker）”），以便于插入异源序列。例如，可以将MCS置于启动子和聚腺苷酸化信号之间，以促进转基因序列的插入。在含有转基因序列的载体中，含有启动子、转基因序列、聚腺苷酸化信号的载体的部分被称为“表达盒（expression cassette）”。

在真核生物的细胞中有活性的启动子是本领域已知的。示例性的真核生物的启动子包括例如SV40早期启动子、SV40晚期启动子、巨细胞病毒（CMV）启动子、巨细胞病毒主要立即早期（CMV-MIE）启动子、EF1-α（翻译延长因子-1α子单元）启动子、Ubc（泛素C）启动子、PGK（磷酸甘油酸激酶）启动子、肌动蛋白启动子等。还可参见Boshart et al., GenBankAccession No.K03104; Uetsuki et al. (1989) J. Biol. Chem.264:5791-5798;Schorpp et al. (1996) Nucleic Acids Res.24:1787-1788; Hamaguchi et al. (2000)J. Virology74:10778-10784; Dreos et al. (2013) Nucleic Acids Res.41(D1):D157-D164以及http://epd.vital-it.ch（在2014年7月16日登入）的真核生物的启动子数据库。

载体上还可以包含增强子。非限制性实施例包括在CMV启动子和内含子A序列中的增强子。先前显示五种胚胎干细胞（ESC）转录因子占据了超增强子（Oct4、Sox2、Nanog、Klf4和Esrrb），并且还有许多另外的转录因子有助于ESC的控制。另外的六种转录因子（Nr5a2、Prdm14、Tcfcp2l1、Smad3、Stat3和Tcf3）占据了典型的增强子和超级增强子，并且所有这些都富含超级增强子。这些中的任一种或本领域中进一步已知的都可以在本发明中使用。

在真核生物的细胞中有活性的聚腺苷酸化信号是本领域已知的，包括但不限于SV40聚腺苷酸化信号、牛生长激素（BGH）聚腺苷酸化信号和单纯疱疹病毒胸苷激酶基因聚腺苷酸化信号。聚腺苷酸化信号指导前体mRNA的3’末端切割、在切割位点处前体mRNA的聚腺苷酸化、和聚腺苷酸化信号下游的转录终止。核心序列AAUAAA通常存在于聚腺苷酸化信号中。还可参见Cole et al. (1985) Mol. Cell. Biol. 5:2104-2113。

可以被用在本发明的载体中的示例性的内含子包括人类/小鼠/大鼠/其他物种巨细胞病毒主要立即早期（MIE）基因的β-珠蛋白（globin）内含子和第一内含子（也称为“内含子A”）。

可以被包括在本发明的载体中的另外的转录后调控元件包括但不限于CMV MIE的5’-非翻译区、人Hsp70基因、来自血管内皮生长因子（VEGF）基因的SP163序列、以及与腺病毒晚期mRNA相关的三联前导序列。参见例如Mariati et al. (2010) Protein Expression and Purification69:9-15。

在某些实施方案中，本文公开的载体含有编码在真核生物的细胞中起作用的选择标记物（即真核生物的选择标记物）的核苷酸序列，使得当施加适当的选择时，不含有该选择标记物的细胞死亡或者比含有该选择标记物的细胞明显慢得多地生长。在真核生物的细胞中起作用的示例性的选择标记物是谷氨酰胺合成酶（GS）基因；通过在缺乏谷氨酰胺的培养基中培养细胞、或者用L-蛋氨酸亚砜亚胺（L-Methioniene Sulfoximine）进行选择、或同时使用上述两者来施加选择。在真核生物的细胞中起作用的另一个示例性的选择标记物是编码对新霉素（neo）的抗性的基因；通过在含有新霉素、遗传霉素或G418的培养基中培养细胞而施加选择。另外的选择标记物包括二氢叶酸还原酶（DHFR，赋予对氨甲喋呤的抗性）、嘌呤霉素-N-乙酰转移酶（提供对嘌呤霉素的抗性）和潮霉素激酶（提供对潮霉素B的抗性）。在真核生物的细胞中起作用的另外的选择标记物是在本领域已知的。

编码上述选择标记物的序列被可操作地连接至启动子和聚腺苷酸化信号。如上所述，在真核生物的细胞中起作用的启动子和聚腺苷酸化信号是在本领域已知的。

在某些实施方案中，本文公开的载体可以含有两个或更多个表达盒。例如，含有两个表达盒（其中一个编码抗体重链，另一个编码抗体轻链）的载体可以被用于产生功能性抗体分子。

本文公开的载体还含有在原核细胞中起作用的复制起点（即原核复制起点）。在原核细胞中起作用的复制起点在本领域中是已知的，并且包括但不限于大肠杆菌的oriC起点；质粒起点，例如pSC101起点、pBR322起点（rep）和pUC起点；以及病毒（即噬菌体）复制起点。用于鉴定原核复制起点的方法被提供在例如Sernova & Gelfand (2008) Brief. Bioinformatics9(5):376-391。

本文公开的载体还含有在原核细胞中起作用的选择标记物（即原核选择标记物）。在原核细胞中起作用的选择标记物是在本领域中已知的，并且包括例如编码赋予对氨苄青霉素、卡那霉素、氯霉素或四环素中的任何一种的抗性的多肽的序列。赋予对氨苄青霉素（和其他β-内酰胺抗生素）的抗性的多肽的实施例是β-内酰胺酶（bla）酶。卡那霉素抗性可以由新霉素磷酸转移酶基因的活性产生；而氯霉素抗性是由氯霉素乙酰转移酶介导的。

示例性的转基因包括任何重组蛋白或例如激素（例如生长激素）、促红细胞生成素、抗体、多克隆、单克隆抗体（例如利妥昔单抗）、抗体缀合物、融合蛋白（例如IgG-融合蛋白）、白细胞介素、CD蛋白、MHC蛋白、酶和凝血因子。抗体重链和抗体轻链可以由单独的载体或由含有两个表达盒的相同载体表达。

本发明提供了用于在细胞中表达重组多肽的方法。所述方法包括将如本文所述的载体导入细胞中，并在其中载体被瞬时地或稳定地保持在细胞中的条件下培养细胞。细胞可以是原核生物的或真核生物的，例如通过与CRISP/Cas9的靶向整合而产生的稳定细胞系。可以被用于表达重组多肽的经培养的真核生物的细胞是在本领域中已知的。这样的细胞包括真菌细胞（例如酵母）、昆虫细胞、植物细胞和哺乳动物细胞。相应地，本发明提供了包含如本文所述的载体的细胞。

示例性的酵母细胞包括但不限于木霉属菌种（Trichoderma sp.）、巴斯德毕赤酵母（Pichiapastoris）、粟酒裂殖酵母（Schizosaccharomyces pombae）和酿酒酵母（Saccharomycescerevisiae）。示例性的昆虫细胞系包括但不限于Sf9、Sf21和果蝇（Drosophila）S2细胞。示例性的植物细胞包括但不限于拟南芥（Arabidopsis）细胞和烟草BY2细胞。

可用于表达重组多肽的经培养的哺乳动物细胞系包括中国仓鼠卵巢（CHO）细胞、人胚胎肾（HEK）细胞、病毒转化的HEK细胞（例如HEK293细胞）、NS0细胞、SP20细胞、CV-1细胞、幼仓鼠肾（BHK）细胞、3T3细胞、Jurkat细胞、HeLa细胞、COS细胞、PERC.6细胞、CAP^®细胞和CAP-T^®细胞（后两种细胞系可从德国科隆的Cevec Pharmaceuticals公司商业地获得）。CHO细胞的许多衍生物也是可用的，例如CHO-DXB11、CHO-DG-44、CHO-K1、CHO-S或工程化的CHO细胞，例如CHO-M、CK1 SV CHO和CHOZN。也可以使用哺乳动物原代细胞。

在某些实施方案中，在无血清培养基中培养细胞。例如，为了制造施用于患者的治疗性蛋白，表达细胞必须在无血清培养基中生长。在另外的实施方案中，在用于多肽表达之前，细胞已经预先适应无血清培养基中的生长。

可以使用本领域已知的方法将如本文所述的载体引入上述细胞中的任一个中。这样的方法包括但不限于聚乙二醇（PEG）介导的方法、电穿孔、生物射弹输送（即粒子轰击）、原生质体融合、DEAE-葡聚糖介导的方法、以及磷酸钙共沉淀。还可参见Sambrook et al.“Molecular Cloning: A Laboratory Manual,” 第三版, Cold Spring HarborLaboratory Press, 2001；以及Ausubel et al., “Current Protocols in MolecularBiology,” John Wiley & Sons, New York, 1987以及定期的更新。

用于细胞培养的标准方法在本领域中是已知的。参见例如R. I. Freshney“Culture of Animal Cells: A Manual of Basic Technique,” 第五版, Wiley, NewYork, 2005。

实施例

通过参考以下实施例进一步理解本发明，这些实施例旨在纯粹是本发明的示例。本发明的范围不受限于示例性的实施例，其仅意图作为本发明的单个方面的说明。任何功能上等同的方法都在本发明的范围内。根据前面的描述和附图，除本文所述的那些之外，本发明的各种修改对于本领域技术人员而言将变得显而易见。这些修改落入所附权利要求的范围内。

实施例1.寻找新的MAR

该实施例开发了一种经由电脑量化基质附着区（MAR）元件的强度的方法，以及使用该方法量化一些示例性MAR序列的强度。

基于基序的MAR鉴定

进行文献检索以识别与MAR鉴定相关的所有基序，特别是寻找MAR特异性转录因子、染色质结合域、DNA弯曲和DNA解旋序列。总结了潜在有用的特征并用于进一步的MAR评估。

MAR元件可以由中央富含AT的核心区和含有转录因子结合基序的5’和3’侧翼区组成。核心区可能富含(ATAT)n微卫星。

MAR可以包含“MAR识别特征”并通常通过包含“MAR识别特征”进行分类。二重（bipartite）元件由两个不同的序列AATAAYAA和AWRTAANNWWGNNNC组成。其他MAR指示序列由各种转录因子和DNA结构基序组成。示例性序列包括DNA解旋基序、AP-1、A-box和T-box、NMP-2、SATB1、Hox4D、TEF、Pit1和Fast。

通过检索鉴定出4个新的MAR元件，分别命名为MAR斑马鱼、MAR鲤鱼（CyprinusCarpio）、MAR 12-RP13和MAR 17XX_fos。它们以及一些已知元件（MAR 1-68、MAR S4、MARX29、小鼠c-myc 5MAR和SPR2A-MAR）的完整序列、核心以及核心的5’和3’侧翼区列于表1中。

表1. MAR序列

注意：在全长序列中，核心区用粗体和下划线表示，侧翼区用下划线表示。

实施例2. MAR斑马鱼的测试

对鉴定的MAR元件中的一个（MAR斑马鱼）进行实验测试，并与来自文献的最强的已知的MAR进行比较，其示出高两倍的效力。

体外比较MAR斑马鱼（新鉴定的MAR元件）与MAR X29（对照，参考Arope et al.(2013) PLoS ONE 8(11): e79262）。

然后对不包括全长MAR斑马鱼的侧翼区的MAR斑马鱼核心进行实验测试，与不包含任何MAR序列的构建体进行比较。

材料与方法

Neon 转染是用CT MCB细胞进行的。使用BalanCD + 4 mM Gln 培养基用于转染。通过Bio-Rad（Gene Pulser II设置为900 uF，300 v，电阻0）进行的瞬时转染。细胞在转染的24小时前分裂。第0天生存力和VCD以百万个细胞/ml表示。使用5 μg重链和轻链DNA进行转染。10 μg GFP DNA被用作外部对照以检查转染效率。通过将甲硫氨酸亚砜亚胺（MSX）在导致有利于表达感兴趣的重组蛋白（利妥昔单抗轻链）的细胞生长的选择性压力的水平维持14天产生稳定的库（pool）。在14天补料分批（fed batch）定量分析中比较所得的重组库。通过生物层干涉仪或ELISA分析在收获当天和整个培养过程中的滴度。使用仅一种浓度的MSX（80 mM）重复上述库生成的实验方法以生成用于测试MAR斑马鱼核心的库。

结果

MAR X29和MAR斑马鱼的体外比较结果如图1所示。在两种选择标记物浓度（80 mM和100 mM的甲硫氨酸亚砜亚胺（MSX））下，MAR斑马鱼的表现均明显优于MAR X29。因此，该实施例验证了实施例1中开发的检索和经由电脑的方法。

在进一步的实验中，与没有任何MAR元件的构建体相比，测试了单独的MAR核心序列的效力。如图2所示，MAR斑马鱼核心序列比无MAR对照产生显著更高的滴度。

应该理解的是，虽然已经结合上述实施方案描述了本发明，但是前面的描述和实施例旨在进行说明而不是限制本发明的范围。本发明范围内的其他方面、优点和修改对于本发明所属领域的技术人员来说将是显而易见的。

序列表

<110> 赛尔希恩公司

<120> 基质附着区和促进基因表达的用途

<130> 21F-1869-CNP

<150> 62/776643

<151> 2018-12-07

<160> 36

<170> PatentIn version 3.5

<210> 1

<211> 186

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 1

aaataattaa ttagcaaata atttatatat ttatatattt atatatatat atatatatat 60

atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 120

atatatatat atatatatat atatatatat aaatatataa atatatatat atatatatat 180

attggt 186

<210> 2

<211> 185

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 2

aaatatttca aaaattaagc aaagaaactt tcacagtatg actaataata ttttttcttc 60

tggagaaagt cttatttgtc ttatttcggc tagaataaaa acagttttta attttttaaa 120

caccatttta cggacaaaat tattagcccc tttaagctat atttattttc aatagtctac 180

agaac 185

<210> 3

<211> 98

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 3

gggagaagca gtccaatgtg gctgtatata tatattatta tttttttttt tttaaataca 60

aacaattaag ctgtcgaact gttgtataaa cacaatat 98

<210> 4

<211> 1879

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 4

atgcaaagga ctctttctgt aaaatatctg ctgtaaaaat ctaaaggatt tgagggttgc 60

actcccaaag gctcctgaga gcttgtgtaa aataagcctt cctaactgct gctttctcac 120

tttagtcaat tttggccttt tttatattca tatacagtaa atgttgctct aatcaatgtg 180

gatgatcatt atcagtatat gactcgaaaa atattttaaa cttctctttg cttctagacc 240

aggatttgaa ggaatattct atttttaatg acactgcttt gcaatattta tgattcttaa 300

agtcaaacag agtgaaacag aagtaaacat gtcatgatgt acactcacat gaaacaatct 360

ctgaaatgaa gaatgaatga agaaagttgt gttgctaaca aaatggagga agactcacga 420

atagacaaaa gcagggcaga aacgagacac gcacccgtgt acatatatac agttgaagtc 480

agacttatta gccccccttt gatttttttt tcttttttta aatatttcaa aaattaagca 540

aagaaacttt cacagtatga ctaataatat tttttcttct ggagaaagtc ttatttgtct 600

tatttcggct agaataaaaa cagtttttaa ttttttaaac accattttac ggacaaaatt 660

attagcccct ttaagctata tttattttca atagtctaca gaacaaataa ttaattagca 720

aataatttat atatttatat atttatatat atatatatat atatatatat atatatatat 780

atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 840

atatatatat atataaatat ataaatatat atatatatat atatattggt gggagaagca 900

gtccaatgtg gctgtatata tatattatta tttttttttt tttaaataca aacaattaag 960

ctgtcgaact gttgtataaa cacaatatca ctcgagttgc agtccgatgt gactatatat 1020

tggcactggt gggagatttg cattcattgt gacaatatac agccacattg cattgctacg 1080

agtgtgatat tatgtttata caccagttca acagcataat cgtgtgtaat aaaaagataa 1140

tcaaacacgg aagaggaact actttcttcc gccattcatt cacatctgca gcttacgtca 1200

gaacagcaga agctgttgct cattcatata tataatatat ataaatttgt atacttacag 1260

acgacacagt ggctcagtgg ttagcactgt ctcctcacag caagaaggtc actgtttcaa 1320

gtccaggctg ggtccgccgg catttgtgtg tggagtttgc ttgtttttcc cgtgttaatg 1380

tgtatggatg tttcccagta ctgggttgca gctggaaggg catccgctgt gtaaaactta 1440

tgctggataa gttggcagtt cattccgctg tgtcaacccc tgatgaataa agggattaag 1500

ccaaatgaaa atgaatgaat gatttaatac tcttgtttaa gtcttagtgc cgattatata 1560

tagatatgtg gtgttagatc aaaccagtgt tcattttgac agcaaaattt gatttagttt 1620

tagtcatttt ttagtcttcc atattcgtta tagcatcagt ctatatacag tcaactaaat 1680

taaacatgat tttagtcaac ttcatgcatt ttcacatgga caaggtcatt aaaattctac 1740

aggatcaggt tgtaccaact ctatctcatg gaaatttgta actttttgat tgtggctaat 1800

tcgtatgaat ttgtatgatc tcatttgtac aatttagtat tatttgctca tcccccagtg 1860

atggttggat ttagggttg 1879

<210> 5

<211> 225

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 5

tatccaaata tatatatata tatatatata tatatactat atatatatat atatatatat 60

atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 120

atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 180

atatatatat atatatatat tttttttttt ttttttaaga aaaca 225

<210> 6

<211> 106

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 6

caaatttgct atacaaaaac ctaaatgtaa taaagttaca tccataaaag tgacttttta 60

ttacttttga aacacaacag atttatgccc tgtctatatc cagttc 106

<210> 7

<211> 109

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 7

gttataataa ttttataatc tctcacaata ttgctgtttt actgattttt gaataaatgc 60

agccttggtg agcataagag actttttcta aaaactttga aaagtctta 109

<210> 8

<211> 2679

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 8

tgttacatta ggctgaaaac acactgtgta tgtgcatatt ttcccttaaa tacataaaga 60

agtaatgggt ggcgtacctg tattggttat agactccagg gcagtataac atggctgtga 120

atagactctg ttgtggacat acactccata acaccaaact gatcccgtag aacgatgtca 180

ccaggaaaag aaggagcgtc aaaatgaact gcctgtgatt ggcttgacct acacagctgt 240

ttatcctgtc atggaaagtc acatacatac aagacacaaa taataagcaa cacatttaca 300

gatattttca ttcaaacaat ttagaacaat tatactattt tctctcttgt caatgtagct 360

ttaatgagaa ttatgtggct catggcatgt tcatatttat atttgtgcct gtgtgtgtgt 420

tgaagtagca tggagacaga ttggcctggt gagagctccc tttactgtgc tgaaaactgt 480

gttcctgttg cctttgcaca tgtctcacca gcctgcctgc tccagtgacg tcttttggga 540

atcagcttga acatatgtgt gtgtctgatg gggtagggaa cacatgcata caagtgtgaa 600

gagatcagaa aatgaatcaa atcattggca tgaccactaa tttaaacaat tcattttgga 660

attgttcagc tacttctgta gtaaggattt gcaataagcc agatatctta gaaggaaagg 720

cacaaatatc aacattaaaa ttaatatttg aaataacaga aaatatattc ggttgactga 780

ttatccaaca aacacaagtg taaagtgata tttttaatga acatctaaaa ttacaatgca 840

acggtaagtc tgtgaagctg agatgattaa aatgtgatct ttatgaatga aagcagatgg 900

ccacaatgct ctctctcctt ttattgttta taaatcataa atcatcaatt catatagtaa 960

cttttttaga ttttgaatat ttatttatgt aaagttttaa atattattga atagtaaata 1020

atttaatatg ataatcattt ataaaagtgt atatttgtaa atacaattat ttttaaaata 1080

tataaatgat gaaaaaaatt taaatataag aataaacact tttataaata atacaaggca 1140

aatttgctat acaaaaacct aaatgtaata aagttacatc cataaaagtg actttttatt 1200

acttttgaaa cacaacagat ttatgccctg tctatatcca gttctatcca aatatatata 1260

tatatatata tatatatata ctatatatat atatatatat atatatatat atatatatat 1320

atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 1380

atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 1440

atattttttt tttttttttt aagaaaacag ttataataat tttataatct ctcacaatat 1500

tgctgtttta ctgatttttg aataaatgca gccttggtga gcataagaga ctttttctaa 1560

aaactttgaa aagtcttacc gacaacatat tattgaatgg cagtgtaaat atagatcgtt 1620

ttgtcattta gagaatattt aattaatgtt taatacactt cacactagga atgaagtgct 1680

cgtactcaat ttttaaagaa gaaggaatga gaaacccacc aaacacagtg gtggtccatt 1740

cgaaggacac atgccccaca gatcctgcag tgccctgccc ttggtgggcg cacctgtcgg 1800

cacacagggc ataacttctt ctttccttcg ttttccccat ttgactgact gattcctttg 1860

cagggggcgg agtctccagg tatgtttgtg ctctgattgg ttgtacagat actgttaatt 1920

ccctgagcta atgactggga tttgacaaag cctggtcctt gtttggtgcg cacaagggag 1980

ataagggtca acatcatgcc tgtcgtcaca gtaaccagct gcagattact gacgtctcct 2040

ctgggaacga tctcagtaag gaaaagatag tacatgtagg caagggagaa aagtgccaag 2100

ctaaggaaaa acaatgtgcg tcttttcctt ctgtgagtca catagtaata ccaaagcacc 2160

agtcctggta gggcagttag gacaacaact cccaacatac agttaattgc tgctactcgc 2220

aacagaccag gaattaatac catgggaggt aagacagaga tttccaatcg aaggggtcct 2280

acggcacaac atggcaaacc caaacgatca gccatacaag agacgaaacg agagaagatg 2340

tctggcttgt cttgctctcc tctgactaac ctattgagaa agagtgacaa attcaccatt 2400

catcatttac acactattat gttatcagtt ttatgtatgg aaatgacaag gtgcaaacgg 2460

acaaaattat ttaattcaac tacacttttt aaagtgtaaa aatgtaaagt gtcaaaagtt 2520

tatatcaata aatgtaatgt aaaaccatct ctgcatgcca tgatcttaac tggttgacct 2580

ctgacctttc acaggcatca tctagttctt cacagtcaca gcagcagtac tctctttgct 2640

ggtcgatgtc tccacagcag cacagagggt catctggtt 2679

<210> 9

<211> 350

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 9

atatatatat gttagtgata tatatataaa atatatatca ctcttattat atattatata 60

tattatataa tatataatat attatattat ataatatatt atatattata taatatatat 120

aatatattat atattatata atataatata ttatatatta tataataata taatatatta 180

tatattatat aataatatat aatatattat ataataatat ataataatat ataatatatt 240

attatataat atataataat atataataat ataataatgt gattatatta tatataatat 300

gtaatataat aatgtatata tattatatat gcattatata taatgatttt 350

<210> 10

<211> 186

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 10

aattgcataa gccaatccct tgcaataaat aaaatagatc gagatgtaga tagacagaga 60

tccagatcct actggttcca ttttcctggc agaaccatga tggatatgat atatgtccca 120

taaagagcct cccagtggtg tctttttgtt ttgtaaagat ggttttaatc cacagattta 180

agagtg 186

<210> 11

<211> 153

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 11

ctatcaaatg tatatttaaa tctacctact tgtgttatat atttatatat gtgtgtgtga 60

tatgtataat tttaaaatat atctgtatag ctacttaatt tgtatttcca gcccaattca 120

gtctagtgac agaaaatata actcatcaag tct 153

<210> 12

<211> 4061

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 12

tacccagtaa ttcttaaact acttactcca gcacttggcc catggcaaat ttcctggtag 60

ccatatgtac atatacacat gcttttaaat acataaacgt atgtacatat acttttaatt 120

tactactaag attttataca ttttccagta gtttgtatga tgaacatgta tatacctccc 180

tttaaagtta aacaataaaa aaatcttaat ttttctacct taaaatctcc tctcatcacg 240

tcatccaatg atagccgctg ttaacatcat gttcctattt acttctgctt gtttctctga 300

agatgtacgt gagtgggtaa acacgatgta atttgacatt gcggttttta atagcatatc 360

acaaatattt tcctgttata atttcattca caaacatggt tctgatagtt acataatatt 420

acaccatatg atcatttcct agtttactta gctatttcct atggttggat attcttggct 480

tgtttccaat atttttctat tctaattcat ctccaacaaa agtcatcatc tgtgaatctt 540

tctctgcatc tctaagtatt tccttagaat aaactcctag agtgaatctg ttagcacatt 600

tgtttctctc ttttaattaa caactggaaa atgattattg cagacacatt ctcttcaagt 660

gaatatttct tctcggctga actttgcttt actgagtatt tttccctccc ttggctgcat 720

tttcattctt cttttgctgt tttgcgtttc actcccacct acaaaatatc caagttccct 780

ctcccaaaat aaaacccctc ttggttcatg gcagagtcaa ctttgttcag ctgtctttac 840

cctgcaggtc caaaggtcta ttgcccagag tatttgctga ggggataaga ggtgccaggt 900

cctcatcaga gtaatctttg catcttccat tttagatgat gaggctgagg ctaaataact 960

ttttgtgact tgaacaaaat cacgcccgtc attttggagc agagattgga cccagaccat 1020

ctgactgcag tgcacttggt tactacacaa cagccctgga agctgcaacc tgaggacctc 1080

cagcctcaca tgaatcatct tcatccacca accttctccc atctgggttc ccacactcct 1140

cccatcaccc agcatggggg gcctcatggt ggtggttgac ccttcctcta tctccacctg 1200

catatggggc acattctccc caaacctcac tccagtccaa tctcacctca accccactgt 1260

ctcgctcata gggttgagga aagacagaat aaaccctggc tgggaaaagt cactttagtc 1320

aatgtacggt cagttttacg tgtcagcttg gccaggctag agtccccagt catccaaacg 1380

cccagttgac tgtaagcaaa gactatccta gataatttgg tcggcctgag acattcagtt 1440

aaaagaccat aagagcagaa ctgaaaacag aaaattctgc ctgtggactg cagcgccagc 1500

tcctgcctga gagtttccag cctgaccttc ctaaacttgc ctactaatcc cccacaattg 1560

cataagccaa tcccttgcaa taaataaaat agatcgagat gtagatagac agagatccag 1620

atcctactgg ttccattttc ctggcagaac catgatggat atgatatatg tcccataaag 1680

agcctcccag tggtgtcttt ttgttttgta aagatggttt taatccacag atttaagagt 1740

gatatatata tgttagtgat atatatataa aatatatatc actcttatta tatattatat 1800

atattatata atatataata tattatatta tataatatat tatatattat ataatatata 1860

taatatatta tatattatat aatataatat attatatatt atataataat ataatatatt 1920

atatattata taataatata taatatatta tataataata tataataata tataatatat 1980

tattatataa tatataataa tatataataa tataataatg tgattatatt atatataata 2040

tgtaatataa taatgtatat atattatata tgcattatat ataatgattt tctatcaaat 2100

gtatatttaa atctacctac ttgtgttata tatttatata tgtgtgtgtg atatgtataa 2160

ttttaaaata tatctgtata gctacttaat ttgtatttcc agcccaattc agtctagtga 2220

cagaaaatat aactcatcaa gtctgggtaa tctcaaataa ttcggctaaa ttcctcaatt 2280

catcaatttc tccctcctcc agcctccgca taattgattc taactttcag ggagttgaag 2340

cagcactgcc ctggggggct ctcttccagc tctcagcccc tccctgcaca gctctggtgc 2400

ccacggggat gcgcccacgg ggatgcaagg ccctgtatga ccatcagacc tcctgtcctc 2460

acttgagatg tttatttcta gtccccagtc ctgccccaac cacaggatgt aacccagacc 2520

ctggtctcta ttccaagatt catccttgtc aagcggttct cagcagcatg cctctgccac 2580

gcccagtcac agaggacgat attggctccc ctctttatgg ggggaggata aaaaggatca 2640

tatcccagac ccctgggctt aaggcttcca tgttcccatc tctactcttt aatgccagga 2700

tgacataggg tactttctgc aggcatagac aaccaggcag gaagaggggc ccatgttcct 2760

tgtaatctca gatcacaagt accctctggg gatctatcac cccaagcttg gtgcatggac 2820

aaggggtacc ttattctctt cctttcttct aagactatgc actgcctctc ccccaggcaa 2880

atggaatctt gtcaattcca agtgagtttg gaaaaactca ttctttttta cttattgttt 2940

agatcggaac ctaaaatcga aagttccagg aagctcaagt tcttataact aaaaaggctt 3000

ttctctctca agagcattgg ctctgtcttt tccatgttct actttgaaac acaaaagctg 3060

agctcgacat tgatttaatt gctttttatt tgaatgattg ctataagtga caccttttgg 3120

ggcagtatgt cctagctggt tgaattagag ttgggaaaca cattgcaaga aagggtagaa 3180

agaggcatac tttattgaat cttttggagt aacttttgtg cctgttacca caagcttatt 3240

tttgataaga tgcttcctaa ctttcctcgc tcacccctac ctcatctcag ggccaagcac 3300

gaaagttgtt ttatacatgc taggtttggc tgatttcaat gtgacttccc cagggcagaa 3360

gagacagtgg ttgaaggatg aagaatcaac ctacccgggg gaatcaaaga ttgatcccag 3420

ggaatggagc agatataatt aaataagttt tttctttccc cagtgtatct aatattcatt 3480

tttgtattta cttggagcaa atgaatttaa atgaattttt agttagagtt aaatcaactc 3540

attaaaacac attgaaggaa ttagaaatgt aaaatcattt cctgctgcaa ttcattcatc 3600

tctaagtcta taactgactt gaatctaggt aaaggtcatt gcttaaaggg gacagtggcc 3660

cttattcttg caacctacaa acttttacag tttgcatgga gttttcacat ccatgaactc 3720

aagcaagact gaataggcct gtatggtgaa caaacaggag taaatgcctc cactattcag 3780

gggaggaaag tgagctcaaa aaagtttaat attgttgcct aaggatactc aaccagcaaa 3840

tggcaatatc gagacaggag caggtcttca gtccaaaccc acagagcaga gcttgcccag 3900

gaagctgatc attcttgtac caccttctcc atcactggac ctacaccctg cccttcttta 3960

cccagctctg acctctcaga tgctgaacct ggggtgccct tgtcattgaa cttcgagttg 4020

cattattttc ccattgtttt acctacaatt aacttgccgt c 4061

<210> 13

<211> 1700

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 13

agactctgtc tcaaatatat atatatttat atatatatat tttatattta atatatataa 60

tatatattat atataaattt attatatata atatatatta tatataaatt tattatatat 120

aatatatatt atatatatta tatgttatat atatttatta catataatat ataatatata 180

tttattatat ataatatata tttattatat attatatatt atatatttta tattttatat 240

atattatata attttatatt ttatatatat tatataatta atatttaata tatattatat 300

atatatatat aatatatatt tattatatat aatatatatt tattatatat tatatattat 360

atatttatat tttatatata ttatatattt atattttata tatattatat atttatattt 420

tatatatatt atatataata tatatattat atattttata tataatatat atttattata 480

catattttat attatatata atatatattt attatatatt tttatatata ttatatataa 540

tatatatata tttatatata tatattttat atttaatata tataatatat attatatata 600

aatttattat atataatata tattatatat aaatttatta tatataatat atattatata 660

tattatatgt tatatatatt tattacatat aatatataat atatatttat tatatataat 720

atatatttat tatatattat atattatata tttatatttt atatatatta tatatttata 780

ttttatatat attatatatt tatattttat atatattata tataatatat atattatatc 840

ttttatatat aatatatatt tattatacat attttatatt atatataata tatatattat 900

atatatatat atatatatat ttatatatat atatatttat atattttata tatatataat 960

atatattaat tatatataat atatatatta tatatatatt atatataata cgtaatatat 1020

atttattata tatattttgt atatattata tattatatat ttattatata tattttatat 1080

atattatgta tattttatat acaatacata atatatattt tatatacaat atataatata 1140

tattttatat acaatatata atatatattt tatataatat atttttatat aatatatatt 1200

ttatattata tataatatat attttatata ttatatataa tatatatttt atattatata 1260

taatatatat tttatactat atataatata tattttatac attatataat atatatttta 1320

tactatatat aatatatatt ttatacatta tataatatat attttatata ttatataata 1380

tatattttat gttatataat atatatttta tgtattatat aacatatatt ttatgtatta 1440

tataacgtat attttatata ttatgtaacg tatattttat atattatgta acgtatattt 1500

tatatattat gtaacgtata ttttatatat tatgtaatat atattttata tattatatat 1560

tttgtatatt atatattttg tatatgatat attatatatt ttatatatta tatattatat 1620

attttgtata ttatatatta tatattttat atataatata tcatatatat tttatatata 1680

tataaagcat cagtaaacaa 1700

<210> 14

<211> 177

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 14

taacatggtg aaatatcatc tctactaaaa atacaaaaaa ttagccaggc gtggtggcgg 60

gcgcctgtgg tcccagctac ttgggaggct gagggaggag aatggcgtga acccaggagg 120

catagcttgc agtgagccga gattgcacca ctgcactcca gcctgggcaa cagagca 177

<210> 15

<211> 249

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 15

ctctagagcc aggcaccgtg actcactcct gtgatcccag cttttcgaaa ggctgaggca 60

ggaggatcgc ttgaggccag gagttcaaga ccagccttgg caacatagtg agactctccc 120

gtctctaaaa caacaacaac aaaaggttaa ttaaaaatta aaagaaaaga aaactccaca 180

gccaccttct ccaggaaaat aagtcccaaa gccacttgcc actgatgcag aggtgcgcag 240

agcccgagg 249

<210> 16

<211> 5274

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 16

gacagatggg attattcatt tttataaaat atttaaccca acaaatccaa aatatcattt 60

cagcatgtaa ataatacaga tggtccccaa tttaaccatg gttccattaa aggatttttt 120

ttgactttaa taatggattt atcagaatat aacctcatca taagttgagg aacatctgta 180

taaaaatata ttaatgagat accctacatt cattatcctt tgtataccaa gtcttaccat 240

gtggattttg cacttcccac acatctcaat atggaccagc catatcacgt gccccctgcc 300

agatgcatct agtggctttc acatcggaca gctccacact agaatgacag taaggcacag 360

aaccagacag tccccccgct tccagctcct gatcaaccac ttgtagccat gggagctttg 420

gagactgcct taatagttat gaatctaagc taggtgtcat ggctcacacc tgtaatccca 480

actctttggg acgccaagat ggatggatag cttgaggctt tttttttttt tttttttttt 540

tttagacaag agtctcgctc tgttgccagg ctggagtgca gtggcacgat cttggctcac 600

tgcaacctcc gcctcccagg ttcaagggat tctcctgcct cagcctcccc ctgagtagct 660

gagactacag gtgcgcacca ccacgcccag ctaatttttg tatttttagt agagacagag 720

tttcaccatg ttggccagaa tggtctcgat cacttgacct catgatccac ccacctcagc 780

ctcacaaagt gctgggatta caggcgtgag ccaccgcgcc cggccagctt gacgcttgag 840

tccaggaatt caagaccagc ctgggcaaca tggtcgaaac cctgtctcta ctgaaaaaaa 900

aaaaaaaaaa ttatccgggc atggtgacac acgcctacag tcccagctac cccagaggct 960

gaggtgggag gatcattgaa cccctaaaag tcaaggctga agtgatccaa gattgcatca 1020

ctgaactcca gtctgggtga tgggagtgag accctgtctc aaaaaaaaaa aaaaatagaa 1080

aagctctgaa tctatgggtt ctagccctgg gaaattctgg ataacatgga gttaacagtt 1140

cacctgcctc aggtgagata atgtaaaact agaaaggtcc ataccattgt gatgtctaat 1200

tgaatctatt tatcaaaaca gtacccaaat gcagtatgtt cagaaacctt atactgttag 1260

gtaataataa ccataaacaa gataaaaaat atgggctggg tgtggtggct cccactgtta 1320

tcctagcatt ttgggaggcg aaggcaggag gatcacttga ggctgggagt ttgagaacaa 1380

cctgggcaac atagcaagac cccatctcta taaaaaaaca tataaatata atataaagat 1440

atatatattt tatatatata catatatttg tacctgttaa cgtggggtga ggggtgcagg 1500

gagggtggaa aggagaaagt cataatatta agcatcagta ggccgggcgc agtggctcat 1560

gcctgtaatc ccagcacttt gggaggctga ggcgggcaga tcacaaggtc aggagattga 1620

gatcatcctg gctaacatgg tgaaatatca tctctactaa aaatacaaaa aattagccag 1680

gcgtggtggc gggcgcctgt ggtcccagct acttgggagg ctgagggagg agaatggcgt 1740

gaacccagga ggcatagctt gcagtgagcc gagattgcac cactgcactc cagcctgggc 1800

aacagagcaa gactctgtct caaatatata tatatttata tatatatatt ttatatttaa 1860

tatatataat atatattata tataaattta ttatatataa tatatattat atataaattt 1920

attatatata atatatatta tatatattat atgttatata tatttattac atataatata 1980

taatatatat ttattatata taatatatat ttattatata ttatatatta tatattttat 2040

attttatata tattatataa ttttatattt tatatatatt atataattaa tatttaatat 2100

atattatata tatatatata atatatattt attatatata atatatattt attatatatt 2160

atatattata tatttatatt ttatatatat tatatattta tattttatat atattatata 2220

tttatatttt atatatatta tatataatat atatattata tattttatat ataatatata 2280

tttattatac atattttata ttatatataa tatatattta ttatatattt ttatatatat 2340

tatatataat atatatatat ttatatatat atattttata tttaatatat ataatatata 2400

ttatatataa atttattata tataatatat attatatata aatttattat atataatata 2460

tattatatat attatatgtt atatatattt attacatata atatataata tatatttatt 2520

atatataata tatatttatt atatattata tattatatat ttatatttta tatatattat 2580

atatttatat tttatatata ttatatattt atattttata tatattatat ataatatata 2640

tattatatct tttatatata atatatattt attatacata ttttatatta tatataatat 2700

atatattata tatatatata tatatatatt tatatatata tatatttata tattttatat 2760

atatataata tatattaatt atatataata tatatattat atatatatta tatataatac 2820

gtaatatata tttattatat atattttgta tatattatat attatatatt tattatatat 2880

attttatata tattatgtat attttatata caatacataa tatatatttt atatacaata 2940

tataatatat attttatata caatatataa tatatatttt atataatata tttttatata 3000

atatatattt tatattatat ataatatata ttttatatat tatatataat atatatttta 3060

tattatatat aatatatatt ttatactata tataatatat attttataca ttatataata 3120

tatattttat actatatata atatatattt tatacattat ataatatata ttttatatat 3180

tatataatat atattttatg ttatataata tatattttat gtattatata acatatattt 3240

tatgtattat ataacgtata ttttatatat tatgtaacgt atattttata tattatgtaa 3300

cgtatatttt atatattatg taacgtatat tttatatatt atgtaatata tattttatat 3360

attatatatt ttgtatatta tatattttgt atatgatata ttatatattt tatatattat 3420

atattatata ttttgtatat tatatattat atattttata tataatatat catatatatt 3480

ttatatatat ataaagcatc agtaaacaac tctagagcca ggcaccgtga ctcactcctg 3540

tgatcccagc ttttcgaaag gctgaggcag gaggatcgct tgaggccagg agttcaagac 3600

cagccttggc aacatagtga gactctcccg tctctaaaac aacaacaaca aaaggttaat 3660

taaaaattaa aagaaaagaa aactccacag ccaccttctc caggaaaata agtcccaaag 3720

ccacttgcca ctgatgcaga ggtgcgcaga gcccgaggaa cacggagtca tagcagctct 3780

gcaaattgat tttattccag gctaaaagat gctatttctc aaaaaaagga gctgggagcg 3840

tctctgttca tgaattcatt tttcaggggt ggggtgattt caagagtcca ggctgtttcc 3900

tgaccatgca cactgttccg gcctggaagc ctcagacccc agccaggctg accacgagcc 3960

agacccggag taagcttcgt cccatgcttc ctgtcggtcc gggcagcctg agtttcctgg 4020

tgacccttcc ctgcacccag ccaattcaaa ggtctggcaa ggcctggtgc cagccaagaa 4080

aatctgaggc agccaggttt gttatttcaa atctctaaac cttcagacct ctgtgcttgg 4140

cttacatatg tgaaagttaa aacaaggatg tgtgtcgcag tggtgattat aattcaagta 4200

agcaaagatc cctgcatgac cagccttcga atgtcagccc atgctgaagt taacacattt 4260

aactcataga acaaaatagt taaaatgagg agtggatgca aaatggtact gccattctag 4320

aaaacagttg gcagtttctt ataaagttaa acgtacgctt accacaagac ccagcaatca 4380

ccctcccaga gaaatgaaaa tttatgttca tataaaatat tgtacacaaa taattataac 4440

agctttattt gtaatagtca tgtatcaatc aggattctcc aaggaaacag gaccaataga 4500

agagagatat atacataata aatcatatat ataaatgata tatataagaa gttatatata 4560

tatacacaaa cacatacata tattgtgata acctaccttg ttttaacctg agtgactctc 4620

tcctagcaga gagagccaga cagactccat tttagtttct tcattcacag ccccctttat 4680

cccccttaag ggaataacta gtgcaagctg actctaagca catccagtaa tgcacctgct 4740

gataagatat tgaggcaggc tgtaccagca gctcctggga atgtgctcgg tggaaggtat 4800

ctaaaagccc ctgcatttat ctcttagtga tagtttaagc ccctgcacct ggaactgttt 4860

atcttttaca actgcttcta taaccaatta attttttaac tttttgcctg ttctgcttct 4920

gtaaaactgc ttcagttaaa ctccccctcc cctatttaga ccatagtata aaagagaatc 4980

tagccccttc ttcggggctg agagaatttt gagtgctagc tgtctctcag tcgccggcta 5040

ataaaggact ccataatttg tctcaaagtg tggcgtttct ctataactcg cttggttaca 5100

acactatctc tcagggatct ccaaagaaat agaacctata ggatatatct atctataata 5160

aatcattgcc aggcatggtg gctcacccag tactttggga ggccaagtca ggaggatcac 5220

ttgagcccag gagtttgagg ccacctgagc aacatagtga gaccctgtct ctac 5274

<210> 17

<211> 965

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 17

ccagctactc gggaggctga ggcaggagaa cggcttgaac ccaggaggtg gaggttgcag 60

tgagctgaga tcgcgccact gcactccagc ctgggcgaca gagcgagact ctgtctcaaa 120

aaaaaaatat atatatatat atatatacac atatatatat aaaatatata tatatacaca 180

catatatata taaaatatat atatatacac acatatatat aaaatatata tatatacaca 240

catatatata aaatatatat atacacacat atatataaaa tatatatata cacacatata 300

tataaaatat atatatacac acatatatat aaaatatata tatacacaca tatatataaa 360

atatatatat acacacatat atataaaata tatatataca cacatatata taaaatatat 420

atatacacac atatatataa aatatatata tacacacata tatataaaat atatatatac 480

acacatatat ataaaatata tatatacaca catatataaa atatatatat acacacatat 540

ataaaatata tatatacaca tatatataaa atatatatat acacatatat ataaaatata 600

tatacacaca tatatataaa atatatatat acacacatat atataaaata tatatataca 660

catatatata aaatatatat atacacatat atataaaata tatatatata cacatatata 720

taaaatatat atacacacat atatataaag tatatatata cacacatata tataaaatat 780

atatatacac atatatataa aatatatata tacacatata tataaaatat atatatacac 840

atatatataa aaatatatat atatattttt taaaatattc caattgtctc actttgtgga 900

tgagaaaaag aagtagttag aggtcaagta acttggccta catcttttct caagattgta 960

aactc 965

<210> 18

<211> 256

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 18

ctgtgctccc ttaacatcct attttatctg tatatatata tattcttcca aatatccatg 60

ggaaaaaaaa tctgatcata aaaatatttt aggctgggag tggtggctca cgcctgtaat 120

cccagcactt tgggaggctg aggtgggcgg atcatgaggt caagagatcg agaccatcct 180

gaccaatatg gtgaaacccc atctctacta aagatacaaa actattagct ggacgtggtg 240

gcacgtgcct gtagtc 256

<210> 19

<211> 240

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 19

ctagtgagca ataaccacat cttcattttc tttgtataaa acaagaaagt ttagcatgaa 60

aaaggtactc aattacaaat gtgttggatt gaattgaaga cccttggaag gggattttgt 120

acctgaggat ctctttcttt tggccatatt gttcaatgga caaaatttag ccttcgaagg 180

caggccgatt tgaggttaat actaccttta ccacttgata gctatgtgac cttggccatg 240

<210> 20

<211> 3612

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 20

gactctagat tataccaacc tcataaaata agagcatata taaaagcaaa tgctcttatc 60

ttgcagatcc ctgaactgag gaggcaagat cagtttggca gttgaagcag ctggaatctg 120

caattcagag aatctaagaa aagacaaccc tgaagagaga gacccagaaa cctagcagga 180

gtttctccaa acattcaagg ctgagggata aatgttacat gcacagggtg agcctccaga 240

ggcttgtcca ttagcaactg ctacagtttc attatctcag ggatcacaga ttgtgctacc 300

tattgcctac catctgaaaa cagttgcttc ctatatttca tccagtttaa tatttattta 360

aaccaagaag gttaatctgg caccagctat tccgttgtga gtggatgtga aagtaccaat 420

tccattctgt tttactatta actatccttt gccttaatat gtatcagtag gtggcttgtt 480

gctaggaaat attaaatgaa tggcatgttt cataggttgt gtttaaagtt gttttttgag 540

ttaaatcttt ctttaataat actttctgat gtcaaaaaca cttagaagtc atggtgttga 600

acatctatat agggttggat ctaaaatagc ttcttaacct ttcctaacca ctgtttttgt 660

ttgtttgttt ttaactaagc atccagtttg ggaaattctg aattagggga atcataaaag 720

gtttcatttt agctgggcca cataaggaaa gtaagatatc aaattgtaaa aatcgttaag 780

aacttctatc ccatctgaag tgtgggttag gtgcctcttc tctgtgctcc cttaacatcc 840

tattttatct gtatatatat atattcttcc aaatatccat gggaaaaaaa atctgatcat 900

aaaaatattt taggctggga gtggtggctc acgcctgtaa tcccagcact ttgggaggct 960

gaggtgggcg gatcatgagg tcaagagatc gagaccatcc tgaccaatat ggtgaaaccc 1020

catctctact aaagatacaa aactattagc tggacgtggt ggcacgtgcc tgtagtccca 1080

gctactcggg aggctgaggc aggagaacgg cttgaaccca ggaggtggag gttgcagtga 1140

gctgagatcg cgccactgca ctccagcctg ggcgacagag cgagactctg tctcaaaaaa 1200

aaaatatata tatatatata tatacacata tatatataaa atatatatat atacacacat 1260

atatatataa aatatatata tatacacaca tatatataaa atatatatat atacacacat 1320

atatataaaa tatatatata cacacatata tataaaatat atatatacac acatatatat 1380

aaaatatata tatacacaca tatatataaa atatatatat acacacatat atataaaata 1440

tatatataca cacatatata taaaatatat atatacacac atatatataa aatatatata 1500

tacacacata tatataaaat atatatatac acacatatat ataaaatata tatatacaca 1560

catatatata aaatatatat atacacacat atataaaata tatatataca cacatatata 1620

aaatatatat atacacatat atataaaata tatatataca catatatata aaatatatat 1680

acacacatat atataaaata tatatataca cacatatata taaaatatat atatacacat 1740

atatataaaa tatatatata cacatatata taaaatatat atatatacac atatatataa 1800

aatatatata cacacatata tataaagtat atatatacac acatatatat aaaatatata 1860

tatacacata tatataaaat atatatatac acatatatat aaaatatata tatacacata 1920

tatataaaaa tatatatata tattttttaa aatattccaa ttgtctcact ttgtggatga 1980

gaaaaagaag tagttagagg tcaagtaact tggcctacat cttttctcaa gattgtaaac 2040

tcctagtgag caataaccac atcttcattt tctttgtata aaacaagaaa gtttagcatg 2100

aaaaaggtac tcaattacaa atgtgttgga ttgaattgaa gacccttgga aggggatttt 2160

gtacctgagg atctctttct tttggccata ttgttcaatg gacaaaattt agccttcgaa 2220

ggcaggccga tttgaggtta atactacctt taccacttga tagctatgtg accttggcca 2280

tgtggtttca acagtctgaa cctcattttc tctgtgtatg tgtggtcctc cttacaagtt 2340

tgtgaaaaat gtgaagtcct tagccatgat agcccaatat aacaggctaa atgataatag 2400

gtttatgttc ttttccttta tattctcaga taagcactgt ccaagtttga ggtgttttga 2460

ggtctcgcct gatttggatt gtttgagttt atgctattct ttgaattctt tgagctgttc 2520

tgaagcagtg tatcatgaac aaaaacatcc ccagttcagt ccaaacccct ggttacatat 2580

cattcttatg ccatgttata accagtttga gagtgttccc tctgttattg catttaagtt 2640

tcagcctcac acagaaattc agcagccaat ttctaagccc taagcataaa atctggggtg 2700

gggggggggg atggcctgaa gagcagcatt atgaatagca ccattataat taatgatctc 2760

tcaggaagat ttacaatcac aggtagcaga taaaacaaat agtactgctt ctgcacttcc 2820

cctcctttta ttcgctatga aattttatgg gaaatcagtc cagtgaaaaa tgtaagctct 2880

taatctttcc cagaaatcct acctcatttg atgaatactt tgagggaatg aattagagca 2940

tttttttctt ttatagtcta cttcgcattt acgaagtgag gacggtagct taggctgcct 3000

ggccaactga tgagaaggtc agaggcattt ttagagacct ctgttgtctt tcattcatgt 3060

tcattttcca caaggcaagt aatttccaac aaatcagtgt cttcattagt aataagatta 3120

ttaacaacaa taatagtcat agtaactatt cagtgagagt ccattatata tcaggcattc 3180

tacaaggtac tttatataca tctgagtaaa cctcacacaa ttctacaggg aggtatttct 3240

atccccattt aacaaataag gaaacgaagt ccaagtaaat taacttgccc aaggtcacac 3300

agatagtacc tggcagaaca ggaatttaaa cctaaatttg tccaactcca aaagcagcct 3360

tctatttgtt ataaatgctg cctctcatta tcacatattt tattattaac aacaacaaac 3420

ataccaatta gcttaagata caatacaacc agataatcat gatgacaaca gtaattgtta 3480

tactattata ataaaataga tgttttgtat gttactataa tcttgaattt gaatagaaat 3540

ttgcatttct gaaagcatgt tcctgtcatc taatatgatt ctgtatctat taaaatagta 3600

ctacatctag ag 3612

<210> 21

<211> 599

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 21

atatgtatat atgtatatat gtatatatgt atatatgtat atatgtatat atgtatatat 60

gtatatatgt atatatgtat atatgtatat atgtatatat gtatatatgt atatatgtat 120

atatgtatat atgtatatat gtatatatgt atatatgtat atatgtatat atgtatatat 180

gtatatatgt atatatgtat atatgtatat atgtatatat gtatatatgt atatatgtat 240

atatgtatat atgtatatac gtatatatgc atatacgtat atatgtatat atgtatatat 300

gtatatatgt atatatgtat atatgtatat atgtatatat gtatatatgt atgtatgtat 360

gtatgtatgt atatatgtat atatgtatgt atgtatgtat gtatgtatgt atgtatatat 420

gtatatatat atgtatgtat gtatgtatgt atgtatgtat atgtgtatat gtgtatatgt 480

gtatatgtgt atatgtgtat atatgtatat atgtatatat gtatatatgt atatgtgtat 540

atgtgtatat gtgtatatat gtatatatgt atatatgtat atatgtatat atataacat 599

<210> 22

<211> 205

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 22

gctctttcct ttagttaagc ttatgaaata gtgtttctct catgtttcct ctatattctc 60

tcttttgcct tcctgtttct tcctgttgat tccatcccat tggagtgaaa tcttatgatc 120

ttttggcatc aacaaagtga tctgcatcca aataattcca catctcattc catgttgact 180

gtggatctat atatatatat atgta 205

<210> 23

<211> 352

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 23

agtattaaat tatatataca tatataagtg aaatgtcaca atcttctaga acttgctctg 60

tatgtccact taacatggta gagtgagcta tgtcagcatt ttctatttcc tgtgaatcat 120

tctgtgtgtt gccaagaaga aatatgatat attctgaggt tatgaaatga tattttggtc 180

atcatgtttc tcatcctatt ttcatattac ctaaatactt ttgcttttaa aattattatt 240

attaataata atataattat ttatacaata atatttaaat aatatattta tttaatataa 300

ttattatatt tcacataaaa gcaatagttc cagtgttaca aattgtaggc aa 352

<210> 24

<211> 5460

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 24

ctcgaggtct caagataaga atgactgctg taactcaaat ccaccaaagc tatttgtgtt 60

agaatgcttt cctttggtaa taacataata ccacagagtg agtgaatgta tcaagcaaag 120

tactcactca taatctctcc acccaaatga ctttgtcttc taaaattaaa cccttcccag 180

aggcctctcc ccttaatacc atattgggct cttcacactt cttccaacat cgccttccat 240

cctggccctt ccaacctccc ttctgtttgt gctaggaaca gctcaaggcc tcctatctac 300

cacagagtta catggcttgc cccttgccaa ccccccagta ccacacagtg agtgcaaaat 360

ctcaccacat tcagaaccca gtcactattc aaatcatatt ttaacctttg cagtactgac 420

tacttttgat tcatctaaac attactgaac tttattctag aaaacattta agaaatttgt 480

agttaggttc atcctttgag accttacatt taatttcttt ctatgtaaac ggaaagcatt 540

gttcagtccc acgctcatta tggcaaccca cttccaagta cttcgtttac tacgtgggct 600

ggaatcatac agttttctgt tgtgcttgtg ggagcagatc cccctaacct ctgctgattt 660

ttctcaccac ttatcataca tttattacat gcatgcactg ctgtgtgagt ttctaaatac 720

ttgggtagca attctctact attactttaa ttttcctact tgtctgcaaa tacgaaaagt 780

agcttgaaag aacttcagat ctttgttgtt atctgttgca aacactccat ttttctgttg 840

tagcaaaaaa aaaaaaaaag acatccatag ttgtcaatga gaatgcaaga tacatacatt 900

ctgcacctgt gtgctaacat aagtggctgc cctgtgactc agagattgct tgtccttctc 960

ctaagcctat ccttttttgt tactttggat acttttgttc aatgaatcca gaaaaagtgt 1020

ttttcagatt caccatgtga ccctcattta aaacctgtaa tccccctatg gttaagttcc 1080

tgcttttgtt tctgttttct ttctttcagt aaaaggaatt gaacccagtc cttccactta 1140

ctatctgagc atatggctct tttagattat gatgttggtg gtgttcattg gtctcaccaa 1200

aatgctaaag aagccttcat cttctacttg tgggtagtct ttacattcat tactgcaagt 1260

ttagtttatg tggtagtacc agatcctttg cttcttttga cttcatgcct acctaacagc 1320

gctctttcct ttagttaagc ttatgaaata gtgtttctct catgtttcct ctatattctc 1380

tcttttgcct tcctgtttct tcctgttgat tccatcccat tggagtgaaa tcttatgatc 1440

ttttggcatc aacaaagtga tctgcatcca aataattcca catctcattc catgttgact 1500

gtggatctat atatatatat atgtaatatg tatatatgta tatatgtata tatgtatata 1560

tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta 1620

tatatgtata tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata 1680

tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta 1740

tatatgtata tatgtatata tgtatatatg tatatatgta tatacgtata tatgcatata 1800

cgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta 1860

tatatgtata tatgtatgta tgtatgtatg tatgtatata tgtatatatg tatgtatgta 1920

tgtatgtatg tatgtatgta tatatgtata tatatatgta tgtatgtatg tatgtatgta 1980

tgtatatgtg tatatgtgta tatgtgtata tgtgtatatg tgtatatatg tatatatgta 2040

tatatgtata tatgtatatg tgtatatgtg tatatgtgta tatatgtata tatgtatata 2100

tgtatatatg tatatatata acatagtatt aaattatata tacatatata agtgaaatgt 2160

cacaatcttc tagaacttgc tctgtatgtc cacttaacat ggtagagtga gctatgtcag 2220

cattttctat ttcctgtgaa tcattctgtg tgttgccaag aagaaatatg atatattctg 2280

aggttatgaa atgatatttt ggtcatcatg tttctcatcc tattttcata ttacctaaat 2340

acttttgctt ttaaaattat tattattaat aataatataa ttatttatac aataatattt 2400

aaataatata tttatttaat ataattatta tatttcacat aaaagcaata gttccagtgt 2460

tacaaattgt aggcaatggg ctgttctgat tatctaagtt gggcccagga tatgtgctga 2520

atagttaaag cacatgccca gcatgtatga gggtaaaagg atgggtggat gtagtgaccc 2580

atttgtaatt taagccttag caggcagagg tgtgacccat agtgcaaagt acatagtcat 2640

tataaggtca tctatatcac aatctctgga ttagattgat tgaacctgct cagtgaccaa 2700

tgtgttagca atatacagga ggatgataac atcaacgtca gaagacacat tgaagggctt 2760

acaaatagtg cccatttact ttaatacaga aaaattcaat gtaccctcta ggcaatttca 2820

acttttagtc tcttggtagg atagtctaca tttagaatgg ctaattcata aattagaaag 2880

cttcttcacc ccctactttt ctggttattt ctctatgaat gtggtaggca tgagttagta 2940

cacatgtttc catgtacatg tgtttctatg tgtctgcatg catatggtag aatgtactca 3000

tattctatgt acagttagaa caatatttat attgtcaaag aaatcaaaag gagtattata 3060

agcttcagaa ataaggataa gtttgaaata ttcattgttt tattttttac agtatttttt 3120

cctttgagaa ttctatgtaa agtactttga acatatttgc cttcaactcc tccctcactt 3180

tcaccctctc ttcattcctc cctttccttt ccactcaaag ttgagattcc tttatttatt 3240

tatttatcct tcaaatatca ctggtactat ccacatgatc tcaggattga ggtctgctct 3300

gacgtgtcat cctgctttca tgcaatggcc ttataggtgg aacaacatta tgaactaacc 3360

agtaccccgg agctcttgac tctagctgca tatatatcaa aagatggcct agtcggccat 3420

cactggaaag agaggctcat tggacttgca aactttatat gccccagtac aggggaacac 3480

cagggccaaa aagggggagt gggtgggcag gggagtgggg gtgggtggat atgggggact 3540

tttggtatag cattggaaat gtaaatgagt taaataccta ataaaaaatg gaaaaaaaaa 3600

gtttctaatg tgtgtttcta gaaacttcct ctcttaaagc aacaacatgt ccatgagcaa 3660

tatagaattg aagatcacca tcaaatcctc tttattcctc attgtttcca tcatgtacta 3720

ccagacctct ttaaagtgta gtacagtgtg ttaggaaatg agcagattat cctgggtatg 3780

tgctaaatta gctactgagt caaaatacat tttttgctga acattaagtg tttggtcatt 3840

tctgggcaaa agaaagaaag aaagaaagaa aagaaagaaa gaaaggaagg aaggaaggaa 3900

ggaaggaagg aaggaaggaa agaaggaagg aaagaaaaaa tggatgtaaa ttgttctgac 3960

agcatctgtc tgagtcaggc agtggaatga aggaggaatc ctagagaatg cacaggaaag 4020

cagcccaagg agagtgtggg ctgaaaggca tcatgttaga aacatgcact cgatgacaga 4080

accttgagaa aaaggaactc aagcaaaagc acttatttaa aattgtaaaa cgcactttat 4140

tcatagccat gggggatgtc aatattccaa gcataagaat gatcagtttc caatcactgt 4200

gaacccccaa aacacaaagt gaaaacccac tactttattt gatgagattt ggggttgctc 4260

tattaattta taaaatcaga gtaagacacg atataaatga aacgattgta gttctaaagc 4320

agcggcactt ccctgaacag tgtcattttg acaagtaact gctaacatct tcaggtcaca 4380

gcgactgaag aaaaagtagg gaaagaaggc tggctgtgct gtttgacatt ttcttttctt 4440

atctggtgac atgaagagaa gctctgggtc cccctactct tgttcatata tctgttgctt 4500

ttatgctgca tcctgaggtt tgaagaaatg catttggcac tgagaaaaga tgaggagaga 4560

atgccttgga catggtccta acatgctttg gtactgagaa aagagagcag aggagatgac 4620

atagaatagg agagataatt tggcctattt tggccttcat ctgagtgata gattttactt 4680

aacaaataga aacaaagttt tacttataaa cagaaccaat gacctgtgtc atctctgata 4740

tattgagctt tgaattcagt gaaattatga actaaatata tcactccata attttctaag 4800

agggctattt gtatagtttc agtgatagtg tgacaaagtg taatctaaat ttctaaaaag 4860

taaaataagt agataaaata gtaggtagaa tagtataata atagaataag tataggtatg 4920

gactagaata aatagacaaa atagtagata aaatgctaat gattttgttg acagggtaat 4980

catgaatatt tttattattt agctaaagaa ccaatgttca tgtactcaag aagtgtattg 5040

aggaacttag gaaattagtc tgaacaggtg agagggtgcg ccagagaacc tgacagcttc 5100

tggaacaggc ggaagcacag aggcactgag gcagcaccct gtgtgggccg gggacagccg 5160

gccaccttcc ggaccggagg acaggtgccc gcccggctgg ggaggcgacc taagccacag 5220

cagcagcggt cgccatcttg gtccgggacc cgccgaactt aggaaattag tctgaacagg 5280

tgagagggtg cgccagagaa cctgacagct tctggaacag gcagaagcac agaggcgctg 5340

aggcagcacc ctgtgtgggc cggggacagc cggccacctt ccggaccgga ggacaggtgc 5400

ccacccggct ggggaggcgg cctaagccac agcagcagcg gtcgccatct tggtcccggg 5460

<210> 25

<211> 220

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 25

taggcaacag agtgagatca tgtgtcatat atatatatat atatatatat atatatatat 60

atatatacac acacacacac atatatatat acacatatat atacgtatat atatatatgt 120

atatatatac atatatatac atatatatat atacgtatat atatacgtat atatatatca 180

atgtaaatta tttgggaaat ttggtatgaa tagtcttccc 220

<210> 26

<211> 134

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 26

aaatacaaaa attagccagg tgtggtggca tgtgcctgta gtcctaccta ctcgggaggc 60

tgaggcacaa gaatcgcttg aatgtgggag gtggaggttg cagtgacctg agatcgtgcc 120

actgcactcc agcc 134

<210> 27

<211> 246

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 27

tgtgaacaca gatcataaaa tcatatatca agcagacaaa taagtagtag tcacttatat 60

gcttatactt gtaacttaaa gtaaaagaat tacaaaagca tatgacaaag actaatttta 120

agatatccta atttaaattg ttttctaaaa gtgtgtatac cattttacct atcatatgaa 180

taatttagaa acatgtttat aaaattaatg tccaaatcca ttcaaaagtt ttgtaatgca 240

gatcac 246

<210> 28

<211> 3361

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 28

agcgccgaat tcgatccctt tataaaacca caatataatg gagtgctata atttcaaaca 60

gtgtttggtc tgctggcaga gtggtcattc taacagcagt cacagtagag tagaaataag 120

actgcagtat atctaaggca aaaagctgag gtttcaggag cttgaaggta aagaggaaga 180

aagaaatggg aatgggaatt ggaaagacaa atatcgttaa gagaaaattg cttttaggag 240

aggggaaaga atctatgtgt acttaagact atggaatcaa tcccatttaa gctgggaaac 300

tagtttcata tataactaat aaattttatt tacagaatat ctatttacct gatctaggct 360

tcaagccaaa gggactgtgt gaaaaaccat cagttctgtc atattcctaa aaaaaaatta 420

aaaagttaaa aataaataaa taataaaact tcttttcttt caaaataatc aaggtgctta 480

ttcacatcca ttccaatttg gggaaatact tattttccta tgattagcga agagaaaagt 540

aacttgcatt tcaattcaag ttgatacatg tcacttttaa gaggtcaact aatatttgct 600

agttgagcta accatatagg ctttaaatac tttcatagta gaaagaaaat gaaaatcatt 660

agtgaactgt ataaaataga tcatactttt tgaaagaatc agactgaagt ttccgaaaaa 720

aagaagtaag cttcaatgaa aaggtaagtg aatttagcat ttactcagca tctactatgg 780

acttaacacc taacagtaga taatctgaag gcaaacatat ttgtataggg actgcagaat 840

gatagatgat aaatatcatc tcttctattt gaatgaatat tttttcaaat ctttcacaca 900

cagtggtttg ctatggaaag atttgtagta cattaaacaa atctgaagat ggagttagaa 960

agcttaggct atgttttgag cacaacatat aatttctctg tgattgtttc ttcatctttc 1020

aaatgaggtt actgtgaaga ttaaatgaga taactaaatg atgataaaat aatgtaatct 1080

tagcagcacc ttatttaatc tgtgcaacaa ctctgtgaag tgagtagggc tcagcttcag 1140

tcacttctct gccatttatt aactaagata gtttggaaag ttacccatct cttcagctgt 1200

aaaatgatga ggatcatacc tattttatgg ggctgctttt aggtacaaat atacaggcaa 1260

gcactttgtt aatactaaag cattacacca attagtttta ctcttttcca ttcacacatg 1320

aaattaatgt aatcagaatt ctgtagatta cctaaatctt ctgttaacac gtgatatgca 1380

gttcaggtta aatgtcagtt gagttaccaa agcacataca tactcaccac cctatccaaa 1440

tctacaagcc tcccagtttg tcttcactat tttggttaaa ttaatatgaa ttcctagatg 1500

aaaatttcac tgatccaaat gaaataaaaa atatattaca aaactcacac ctgtaatctc 1560

aacattttgg gaggccaagg caggtagatc acttgaggcc aggagttcaa gaccagcctg 1620

atcaacatgg tgaaaccctg tctctactaa aatacaaaaa ttagccaggt gtggtggcat 1680

gtgcctgtag tcctacctac tcgggaggct gaggcacaag aatcgcttga atgtgggagg 1740

tggaggttgc agtgacctga gatcgtgcca ctgcactcca gcctaggcaa cagagtgaga 1800

tcatgtgtca tatatatata tatatatata tatatatata tatatatata cacacacaca 1860

cacatatata tatacacata tatatacgta tatatatata tgtatatata tacatatata 1920

tacatatata tatatacgta tatatatacg tatatatata tcaatgtaaa ttatttggga 1980

aatttggtat gaatagtctt ccctgtgaac acagatcata aaatcatata tcaagcagac 2040

aaataagtag tagtcactta tatgcttata cttgtaactt aaagtaaaag aattacaaaa 2100

gcatatgaca aagactaatt ttaagatatc ctaatttaaa ttgttttcta aaagtgtgta 2160

taccatttta cctatcatat gaataattta gaaacatgtt tataaaatta atgtccaaat 2220

ccattcaaaa gttttgtaat gcagatcacc cacaacaaca aagaatccta gcctattaaa 2280

aaagcaacac cacctacata taatgaaata ttagcagcat ctatgtaacc aaagttacac 2340

agtgaatttg ggccatccaa cactttgagc aaagtgttga attcatcaaa tgaatgtgta 2400

atcatttact tactaatgcc aatacacttt aaggtaatct taagtagaag agatagagtt 2460

tagaattttt taaatttatc tcttgttgta aagcaataga cttgaataaa taaattagaa 2520

gaatcagtca ttcaagccac cagagtattt gatcgagatt tcacaaactc taactttctg 2580

atacccattc tcccaaaaac gtgtaacctc ctgtcgatag gaacaaccca ctgcagggat 2640

gtttctcgtg gaaaaaggaa atttcttttg cattggtttc agacctaact ggttacaaga 2700

aaaaccaaag gccattgcac aatgctgaag tacttttttc aaatttaaaa tttgaaagtt 2760

gttcttaaaa tctatcattt attttaaaat acggatgaat gagaaagcat agatttgata 2820

aagtgaattc ttttctgcaa tctacagaca cttccaaaaa tcactacaga cactacagac 2880

actacagaaa atcataaata aacaagtgct agtatcaata tttttaccaa aaaatggcat 2940

tcttagaatt ttttataggc tagaaggttt gtacaaacta atctgccacg gattttaaaa 3000

tatgagtgaa taaattatat tgcaaaaaaa atcaggttac agagaactgg caaggaagac 3060

tcttatgtaa aacacagaaa acatacaaaa cgtattttta agacaaataa aaacagaact 3120

tgtacctcag atgatactgg agattgtgtt gacatattag cattatcact gtcttgctaa 3180

aacataaaaa taaaaagatg gaagatgaaa ttacaataca aatgatgatt taaacatata 3240

aaaggaaaat aaaaattgtt ctgaccaact actaaaggaa gacctactaa agatatgcca 3300

tccagcacat tgccactcta catgtggtct gtaaaccagc agcataggcg gccgcattag 3360

c 3361

<210> 29

<211> 143

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 29

attcaacagc tgaatcctaa attgcaaact cagtggctaa taacaacttt gaacaatgag 60

caccttatac acgctactgt attttctttt ctttcttttt tttttttttt ttttttttta 120

aaccgggtag cagtgagaga ggt 143

<210> 30

<211> 64

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 30

tgtagtcatt ttgcaatcct taaagctgaa ttgtgcaatg agctcgatga aggaagatac 60

tatc 64

<210> 31

<211> 73

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 31

ttctttaagt gccttggggc gaggagtccg gaataagaag acttctttgg gttttaaagt 60

gtaggataag caa 73

<210> 32

<211> 1697

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 32

agccctgccc ccatccgacc tccgccctcg ttggcttcgc aacgctgtgg tctctgtggc 60

cagtagaggg cacacttact ttactttcac aaatccgaga gccacaaccc gggtggtggg 120

gggtgagggg gcggggaaag agtctctgca gcaaaacgca gactagggat tggtggctct 180

tggtgtttga ggcaaaatcc tagaggctgt agtcattttg caatccttaa agctgaattg 240

tgcaatgagc tcgatgaagg aagatactat cattcaacag ctgaatccta aattgcaaac 300

tcagtggcta ataacaactt tgaacaatga gcaccttata cacgctactg tattttcttt 360

tctttctttt tttttttttt tttttttttt aaaccgggta gcagtgagag aggtttcttt 420

aagtgccttg gggcgaggag tccggaataa gaagacttct ttgggtttta aagtgtagga 480

taagcaaatc ccgagggaat atgcattata taataaatct agaaccaatg cacagagcaa 540

aagactcatg tttctggttg gttaataagc tagattatcg tgtatatata aagtgtgtat 600

gtatacgttt ggggattgta cagaatgcac agcgtagtat tcaggaaaaa ggaaactggg 660

aaattaatgt ataaattaaa atcagctttt aattagctta acacacacat acgaaggcaa 720

aaatgtaacg ttactttgat ctgatcaggg ccgacttttt tttttaagtg cataattacg 780

attccagtaa taaaagggga aagcttgggt ttgtcctggg aggaaggggt taacggtttt 840

ctttattcta gggtctctgc aggctcccca gatctgggtt ggcaattcac tcctccccct 900

ttctgggaag tccgggtttt ccccaacccc ccaattcatg gcatattctc gcgtctagcg 960

ccttgatttt ccccacccca gctcctaaac cagagtctgc tgcaaactgg ctccacaggg 1020

gcaaagagga tttgcctctt gtgaaaaccg actgtggccc tggaactgtg tggaggtgta 1080

tggggtgtag accggcagag actcctcccg gaggagccgg gtagagcgca cccgccgcca 1140

ctttactgga ctgcgcaggg agacctacag gggaaagagc cgcctccaca ccacccgccg 1200

ggtggaagtc cgaaccggag gtgctggagt gtgtgtgtgg gggggggggg gaatctgcct 1260

tttggcagca aattgggggg gggggtcgtt ctggaaagaa tgtgcccagt caacataact 1320

gtacgaccaa aggcaaaata cacaatgcct tccccgcgag atggagtggc tgtttatccc 1380

taagtggctc tccaagtata cgtggcagtg agttgctgag caattttaat aaaattccag 1440

acatcgtttt tcctgcatag acctcatctg cggttgatca ccctctatca ctccacacac 1500

tgagcggggg ctcctagata actcattcgt tcgtccttcc ccctttctaa attctgtttt 1560

ccccagcctt agagagacgc ctggccgccc gggacgtgcg tgacgcggtc cagggtacat 1620

ggcgtattgt gtggagcgag gcagctgttc cacctgcggt gactgatata cgcagggcaa 1680

gaacacagtt cagccga 1697

<210> 33

<211> 146

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 33

tcacagacac tacagaatgt tttggagatt atgtaatatt taaaatattc aaattatact 60

aaaaatgtat gtaaaatgta ttgaacatag gcaagtttca atacatagat tttgagtgaa 120

tgcttgcaac tttggttcca ttctct 146

<210> 34

<211> 77

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 34

tctgactctg cactctgcaa cctactctaa tattacatat gataacatga gtctatgcag 60

ctgttctcta tagatat 77

<210> 35

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 35

ctacttcctt aaggtggtgt ccaagagtac atttttataa ataaaaagtt atagtacact 60

cctaagggca gcaagtagaa aacgtgctag ggagactcga tctcactttg 110

<210> 36

<211> 2195

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 36

aagcttcctt ggaattaatg gtcagataag gagctctagc aatatcactt taaatgctta 60

atatacaata tttagaaaac cttatgattg taaagagctt aaaaaagatg tgaaagaaca 120

atcactaaag cattgacaac atatgtgtgt tagtgaacaa tatgtaccaa aatggacaga 180

tgagaggtgt acattggggt gtgagttgat aatccagcag actgtgggac tagagggtct 240

acgaaaaaca aaggaagaac atacaaacaa attttaaaac actgtctttc aacactaaaa 300

ctgttggaat agagagcaag aatacatatt ggattcacat tcagtttatt tctcagattc 360

agactagtgc tctgactctg cactctgcaa cctactctaa tattacatat gataacatga 420

gtctatgcag ctgttctcta tagatattca cagacactac agaatgtttt ggagattatg 480

taatatttaa aatattcaaa ttatactaaa aatgtatgta aaatgtattg aacataggca 540

agtttcaata catagatttt gagtgaatgc ttgcaacttt ggttccattc tctctacttc 600

cttaaggtgg tgtccaagag tacattttta taaataaaaa gttatagtac actcctaagg 660

gcagcaagta gaaaacgtgc tagggagact cgatctcact ttggaatcta tcctgggaga 720

caaatgcctc tacaaatgga ttagagaaga cagttttaaa gaggaagata atcaggtaaa 780

atctggggtt ttatgagaga aagaaagagg tagaagaaaa aatttcaagc tcgaacatcg 840

gatcaggtgg cacaatgcgg tcaatgcctg caaactcagg gtaagtatta ttctccctgt 900

ttacagttcc gtggaggaga agtgacttgc ctgtggtcat acaacagagc aaagaaaagg 960

cttgagctag aactcaggcc tttgttaggt ctccccttcc tcctagcaca ttggcaaatt 1020

gcatgaggaa agtagaggta cagttgagtt catgtacaac aataaggcat tcaggtaaag 1080

tgaatgaggg cagaagtttt atgatttagg gaaggtgtaa gacaggaaaa tatctttgtt 1140

cccaattaag aaagagatcc cttgaccatc agttagagat tcccccaagt ccctctttgc 1200

cataagtcac tgaaactgag atccaaggca tggcttctgt gagtcaggag agcttaaccc 1260

agaggagaga tttcagaaca ggatatttcc tattttgagt atcctgctca tgccagtcat 1320

ggataaattt gcatctggct taagaaatta ctggatcagc attgttttgg gtagtttcac 1380

ttcctgctgg gtggggtagc aggctctata aagagatcct ctgctgcacg actcttaaac 1440

ccctggtacc tgagcactga tctgccttgg agaacctggt gagtcggctt ccttgagttc 1500

ctctgttctt tgtgccctga aatgttgagt ttaatctgaa tatggcaagt ttggtggatc 1560

caatcctatg aaaattgact tgatgctact tagtggatga aaatttaaga ttagagcaca 1620

attatatgct attttagctt tcttttgtta tacaggtagg tatccatatg gacagagaag 1680

ttaaggggta acctttgata tgaagaagaa aaaagaacaa agtatttttc tttattctct 1740

tgctttctag tgtcctttac aaaggtttgt gtcttagcag gtgtgaaaga ctacaattct 1800

ccctgagcag ccctttgctc tatgcccaag tcagcccact tggactttat aacagataat 1860

gatgatagga atagcatatt agattgccca gggtgtctga acttgtgact gcctttcttg 1920

aattggttat tttcagggaa ataagatgct tgattcttta taacagagat aatttatttg 1980

gaaaaattgt atgagaaaac acaggatttc ctagggacaa tgaagcaatt tgttaaagtg 2040

gaagggagaa accagaaagt cttgaaaagg taattaagaa tttaaataat ttcttggaga 2100

ttggagaaat aatatgccat ggtattacac aagctttggc ttctctctct ggaggattcc 2160

cttcccacga acactgttgt atcatttctt tcaga 2195

Claims

1.一种重组多核苷酸，其包含：编码序列；启动子，其被配置为启动所述编码序列的转录；以及基质附着区（MAR）核心，其选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中任何一个具有至少90%序列同一性的核酸序列，其中MAR核心能够附着到哺乳动物细胞核基质。

2.根据权利要求1所述的多核苷酸，其进一步包含5’侧翼区，所述5’侧翼区选自SEQ IDNO: 2、6、10和14和与SEQ ID NO: 2、6、10和14中的任何一个具有至少75%序列同一性的核酸序列。

3.根据权利要求2所述的多核苷酸，其中所述5’侧翼区位于MAR核心的5’侧，并距离所述MAR核心100个核苷酸之内。

4.根据权利要求1至3中的任一项所述的多核苷酸，其进一步包含3’侧翼区，所述3’侧翼区选自SEQ ID NO: 3、7、11和15和与SEQ ID NO: 3、7、11和15中的任何一个具有至少75%序列同一性的核酸序列。

5.根据权利要求4所述的多核苷酸，其中所述3’侧翼区位于MAR核心的3’侧，并距离所述MAR核心100个核苷酸之内。

6.根据权利要求1所述的多核苷酸，其包含MAR，所述MAR选自SEQ ID NO: 4、8、12和16和与SEQ ID NO: 4、8、12和16中的任何一个具有至少75%序列同一性的核酸序列，其中所述MAR能够附着到哺乳动物细胞核基质。

7.一种包含如权利要求1至6中的任一项所述的多核苷酸的细胞。

8.一种将编码序列转染到细胞的方法，其包含：在用于将第一和第二多核苷酸转染到细胞中的条件下，将所述细胞与包含所述编码序列和用于启动所述编码序列的转录的启动子的第一多核苷酸和包含选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少90%序列同一性的核酸序列的基质附着区（MAR）核心的不连接的第二多核苷酸接触，其中MAR核心能够附着到哺乳动物细胞核基质。

9.根据权利要求8所述的方法，其中所述第二多核苷酸进一步包含5’侧翼区，所述5’侧翼区选自SEQ ID NO: 2、6、10和14和与SEQ ID NO: 2、6、10和14中的任何一个具有至少75%序列同一性的核酸序列。

10.根据权利要求9所述的方法，其中所述5’侧翼区位于所述MAR核心的5’侧，并距离所述MAR核心100个核苷酸之内。

11.根据权利要求8至10中的任一项所述的方法，其中所述第二多核苷酸进一步包含3’侧翼区，所述3’侧翼区选自SEQ ID NO: 3、7、11和15和与SEQ ID NO: 3、7、11和15中的任何一个具有至少75%序列同一性的核酸序列。

12.根据权利要求11所述的方法，其中所述3’侧翼区位于所述MAR核心的3’侧，并距离所述MAR核心100个核苷酸之内。

13.根据权利要求8所述的方法，其中所述第二多核苷酸进一步包含MAR，所述MAR选自SEQ ID NO: 4、8、12和16和与SEQ ID NO: 4、8、12和16中的任何一个具有至少75%序列同一性的核酸序列，其中所述MAR能够附着到哺乳动物细胞核基质。

14.一种通过权利要求8至13中的任一项所述的方法制备的转染细胞。

15.一种嵌合基质附着区（MAR），其包含：

（a）MAR核心，其选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中任何一个具有至少75%序列同一性的核酸序列，其中所述MAR核心能够附着到哺乳动物细胞核基质，

（b）5’侧翼区，其选自SEQ ID NO: 2、6、10、14、18、22、26、30和34和与SEQ ID NO: 2、6、10、14、18、22、26、30和34中的任何一个具有至少75%序列同一性的核酸序列，以及

（c）3’侧翼区，其选自SEQ ID NO: 3、7、11、15、19、23、27、31和35和与SEQ ID NO: 3、7、11、15、19、23、27、31和35中的任何一个具有至少75%序列同一性的核酸序列，

其中所述MAR核心、所述5’侧翼区和所述3’侧翼区不是来自相同的天然MAR。