CN101517085A

CN101517085A - 调控性核酸元件

Info

Publication number: CN101517085A
Application number: CNA2007800359296A
Authority: CN
Inventors: 芭芭拉·埃南克尔; 克斯廷·索特
Original assignee: Boehringer Ingelheim Pharma GmbH and Co KG
Current assignee: Boehringer Ingelheim Pharma GmbH and Co KG
Priority date: 2006-07-26
Filing date: 2007-06-15
Publication date: 2009-08-26
Anticipated expiration: 2027-06-15
Also published as: PT2049671E; EP2049671A1; CA2658595A1; US9708626B2; US9045776B2; DK2049671T3; AR061472A1; KR20090046887A; EA200900212A1; SI2049671T1; NO20090057L; PL2049671T3; TW200815591A; US20080124760A1; EA016880B1; CY1113711T1; AU2007278368B2; ES2401654T3; JP5270544B2; IL196676A0

Abstract

本发明是关于DNA序列，尤其是转录或表达增强元件(TE元件)，及其与增强子、启动子、产物基因及可选择标记一起在表达载体上的用途。本发明描述序列No.1及TE元件TE－01、TE－02、TE－03、TE－04、TE－06、TE－07、TE－08、TE－10、TE－11或TE－12。而TE－06、TE－07或TE－08因尺寸小而尤其优选。序列No.1源自位于CHO细胞的Ub/S27a基因的编码区上游的序列区。当稳定整合至真核基因组(优选CHO－DG44基因组)时，TE元件会引起产物基因的表达增强。藉此可克服、遮蔽或消除染色体位置效应。因此，可使转染混合物中高产者的比例以及绝对表达量增加高达15倍。

Description

调控性核酸元件

背景技术

技术领域

本发明是关于称为TE元件的顺式活性核酸序列。TE元件优选是源自CHO基因组。将其用于(例如)稳定细胞群中的表达载体中可使所要染色体基因座中目的基因(GOI)的表达与先前所用的载体相比至少高两倍。

背景技术

哺乳动物细胞为产生复杂生物药蛋白质的优选宿主细胞，因为翻译后修饰在功能上及从药物动力学观点来看与人类相容。主要相关细胞类型为融合瘤细胞、骨髓瘤细胞、CHO(中国仓鼠卵巢)细胞及BHK(幼仓鼠肾)细胞。培养宿主细胞逐渐在无血清及无蛋白质的产生条件下进行。其缘由为成本相应降低、纯化重组蛋白中的干扰减少及引入病原体(例如朊病毒及病毒)的可能性降低。使用CHO细胞作为宿主细胞变得越来越普遍，因为此等细胞适于悬浮生长于无血清及无蛋白质的培养基中，而且被管理当局视为及接受为安全的制造性细胞。

为产生表达目的异源基因的稳定哺乳动物细胞系，通常将异源基因与可选择标记基因(诸如新霉素磷酸转移酶(NPT))一起通过转染引入所要细胞系内。异源基因及可选择标记基因可在宿主细胞中自单个载体或自分开共转染的载体起始而被表达。转染后两至三天，将经转染的细胞转移至含有选择剂(例如当使用新霉素磷酸转移酶基因(NPT基因)时为G418)的培养基中，且在此等选择性条件下培养数周。将整合有外源DNA的所得高度生长的耐药性细胞分离，且研究所要的基因产物(目的基因)的表达。

生物药制造需要具有高产率和稳定产率的细胞系。用于制造性细胞的表达载体具有诸如CMV增强子及启动子的强的、一般情况下是组成型的表达启动子及增强子，以便可实现高产物表达。由于必须保证在尽可能长的时间内表达产物，因此应选择基因组内已稳定整合产物基因的细胞。此举可利用可选择标记(诸如新霉素磷酸转移酶(NPT)及二氢叶酸还原酶(DHFR))来实现。

通过表达载体宿主细胞基因组中的随机整合，人们获得具有不同表达量的所需要的基因产物细胞，因为其表达不仅仅由前置启动子或启动子/增强子组合的强度来决定。整合位点处存在的染色质结构可对表达量具有负面与正面影响。因此，越来越多地将在染色质水平上正面影响表达的顺式活性元件整合至表达载体中。此等元件包括存在于(例如)β-球蛋白基因的5’区中(Li等人，2002)及TCRα基因的3’区中的基因座控制区(LCR)。其促使偶联转基因在染色质中高组织特异性表达，此表达的特征为其不取决于位置而取决于拷贝数。此等特性表明LCR能够使其天然组织中的染色质开放(Ortiz等人，1997)。在各种形式的β-地中海贫血症中，β-球蛋白基因座完整但不表达。缺乏表达的原因为β-球蛋白基因的5’方向上的严重缺失。此β-球蛋白LCR的缺失导致遍布整个基因座的封闭染色质构型，且导致基因表达的抑制(Li等人，2002)。LCR与表达细胞染色质中的DNAse I-超敏位点(HS)位置重叠。存在HS亦表明开放的染色质。HS含有一系列针对转录因子的不同的一般性结合位点及组织特异性结合位点。转录因子与DNA相互作用而产生HS的开放染色质结构(Li等人，2002)。已知许多LCR是由多个HS组成，HS的功能或多或少彼此有别。举例而言，TCRα基因仅在T细胞组织中在内源性控制下表达。视组织及表达状况而定，基因座可以各种染色质模式存在。在3’区中，其具有含8个HS的基因座控制区。HS 2-6(LCR的6kb部分片段)具有染色质开放活性且无组织特异性。HS 7、HS 8及HS1(3kb)使胸腺中的T细胞特异性表达具有组织特异性。仅在所有HS的完全组合的情况下，TCRαLCR才具有完全功能(Ortiz等人，1997)。TCRαLCR的个别HS功能的更明确的细分及说明可见于Ortiz等人，1999中。此实例表明LCR在功能上极其复杂且可由不同控制元件(诸如增强子、静止子及隔离子)组成。划分各种结构域之间的LCR功能的其他实例为TCRγ基因座及β-球蛋白基因座。前者是由DNAse I-超敏位点HsA及增强子3'EC_γ1组成。亦认为TCRγ-LCR除具有其一般功能外亦在TCRγ基因重组中发挥一定作用(Baker等人，1999)。β-球蛋白基因座具有5种具有可区分功能的HS，其亦需要组织特异性启动子以便充分行使功能。由于DNA甲基化作用导致封闭的染色质结构且使基因失活，因此LCR亦可能在DNA的组织特异性去甲基化作用中发挥额外重要作用。通过增强组蛋白乙酰化作用来活化基因表达的活化机制亦有可能(Li等人，2002)。

骨架/基质结合区(S/MAR)为以高亲和力在活体外结合细胞核的基质或骨架的组份的DNA序列。其形成染色质结构域的结构性边界且亦可能形成染色质结构域的功能性边界(Zahn-Zabal等人，2001)。S/MAR能够与增强子相互作用且能够局部增加染色质中DNA的可及性，且由此可增加稳定整合的异源基因在细胞系中、转基因动物及植物中的表达(Klehr等人，1991；Stief等人，1989；Jenuwein等人，1997；Zahn-Zabal等人，2001)。然而，其不能完全保护染色体基因座免受邻近元件的影响以便可实现位置独立性表达(Poljak等人，1994)。MAR的作用可被利用，以增加在转染实验中(高)表达细胞克隆或转基因动物的比例(McKnight等人，1992；Zahn-Zabal等人，2001)。然而，亦有报导MAR不赋予高表达，但在发育特异性基因的正确调控中发挥重要作用(McKnight等人，1992)。

隔离子定义为相互影响的相邻区域之间的中性边界，例如活性与非活性染色质之间的中性边界(边界元件)。其可限制增强子的作用或隔离与其相抵的整个DNA结构域，且保护经稳定转染的报导基因免受位置效应影响(Bell及Felsenfeld，1999；Udvardy，1999)。因此，此等元件可使得表达与基因组位置无关。其亦可防止无选择压力的情况下的转基因静止(Pikaart等人，1998)。隔离子的另一推测功能为限制复制范围(Bell及Felsenfeld，1999)。最先被描述的隔离子为源自果蝇(Drosophila)的scs及scs’。其构成hsp70热休克基因的边界且抑制位置效应(Udvardy等人，1985)。

已发现含有CpG岛，源自dhfr基因(中国仓鼠)的富含GC的片段为另一具有隔离功能的元件(Poljak等人，1994)。该片段单独对报导基因表达不呈现任何影响。然而，该片段位于表达促进SAR与报导基因之间，能够很大程度上阻碍SAR元件的增强表达作用。可能此富含GC的片段阻断SAR元件的染色质开放机制且因而充当隔离子。具有伸长CPG岛的元件甲基化的可能性较高，因为其可由DNA甲基转移酶识别，该酶使胞嘧啶转化成5-甲基胞嘧啶的。从而形成非活性染色质(Poljak等人，1994)。

在人类ADA基因(腺苷脱氨酶)的第一内含子中，Aronow与其同事定义一种新的调控元件，其主要促进取决于基因拷贝数但与位置无关的表达(Aronow等人，1995)。该元件长达1kb，且仅在其侧接200bp的T细胞特异性增强子时才行使功能。若两个片段中仅有一个存在，或若该等片段在序列及取向上排列错误，则该元件无功能性，因为这阻碍了增强子上DNaseI-超敏位点的形成。

Cobra Therapeutics公司在其专利WO 02/081677中描述另一种影响染色质的元件。遍在性染色质开放元件(Ubiquitous Chromatin Opening Elements，dUCOE)是具有遍在性表达的管家基因(人类hnRNP A2基因、人类β-肌动蛋白基因、人类PDCD2基因)的染色体区域中形成开放染色质结构的原因。所有此等基因在甲基化相对较弱的未翻译区中具有富含CpG的岛。CpG岛未经甲基化表明此处存在活性染色质。UCOE有助于提供不依赖于基因组环境及细胞或组织的性质的表达强度。

Immunex公司亦描述可增加表达的顺式活性DNA序列(US 6,027,915、US 6,309,851)。称为表达增强序列元件(Expression Augmenting SequenceElement，EASE)的该元件推动重组蛋白在哺乳动物细胞中的高度表达，在瞬间表达系统中无活性，且不具有可见于LCR及S/MAR的典型序列特性。由于其不含有开放阅读框架，因此其亦不是编码反式活性蛋白质的序列。该片段长为14.5kb，源自CHO细胞的基因组DNA且可使经稳定整合的报导基因的表达增加8倍。该元件超过50％的活性局限于1.8kb长的片段，而此片段的前600个碱基对是正确功能所必需的。具有高EASE活性的序列部分的额外特性为存在多个HMG-I(Y)结合位点。HMG-I(Y)蛋白属于高活动性组非组蛋白染色质蛋白的家族。其亦称为“结构型转录因子”且形成哺乳动物基因的新类别反式调控子。HMG-I(Y)蛋白识别富含GC的序列且以其所谓的AT钩(DNA结合结构域)结合在小DNA沟中。此可导致DNA拓扑发生局部变化且从而导致基因表达改变。美国专利6,309,841的作者推测EASE的作用与MTX诱导的经整合质粒的扩增有关。在MTX诱导的基因扩增中，存在所谓的断裂-融合-桥接循环。易推测HMG-I(Y)蛋白在导致DNA断裂形成及移除的DNA结构变化中的作用。

用于增加哺乳动物细胞中基因表达的其他元件描述于Kwaks等人，2003中。此等所谓的STAR元件(Stimulatory and Anti-Repressor Elements)可由筛选具有500至2100bp DNA片段的人类基因文库而得到。筛选使用特定设计的报导质粒来进行。报导基因仅当其与人类基因库的抗抑制物元件在功能上连接时才可能表达。以由此所获得的STAR元件，作者能够保护转基因免受哺乳动物细胞基因组中的位置效应影响。与小鼠基因组的比较表明大部分此等STAR元件在人类基因组与鼠科基因组中均存在，且在此等两物种内为高度保守的。

建立高度表达所要蛋白质的细胞系的主要问题在于重组载体随机及无定向整合至宿主细胞基因组的转录活性基因座或转录非活性基因座中。因此，获得展示完全不同的异源基因表达率的细胞群，而细胞产率通常遵循正态分布。为鉴别极高度表达目的异源基因的细胞克隆，因此必需检查及测试大量克隆，从而导致时间、劳力及成本的高消耗。因此，对用于转染的载体系统加以改良的努力旨在通过使用适当的顺式活性元件首先允许、其次增强经稳定整合的转殖基因的转录。在染色质水平发挥作用的顺式活性元件包括(例如)已描述的基因座控制区、骨架-基质结合区、隔离子等。一些此等元件保护特定基因免受周围染色质影响。其他元件呈现增强子样活性，但此局限于经稳定整合的构建体。另外的元件集数种此等功能于一身。通常不能明显地将其确切归类于特定群组。在稳定细胞系中，转基因产物基因的表达如此在很大程度上受染色体位置效应制约。此现象是基于染色质结构的影响和/或在外来DNA整合位点处存在内在调控元件。此导致表达量差异极大。因此，在细胞选择期间，常产生产物表达极低或完全无产物表达的克隆。此等染色体位置效应亦为产生表达高含量治疗性蛋白质的稳定制造性细胞系通常为耗时、高产能消耗且昂贵的过程的原因。具有高产率的稳定细胞系一般是通过利用通常与药剂诱导的基因扩增相组合的阳性可选择标记(例如二氢叶酸还原酶/甲氨蝶呤(methotrexate)或谷氨酰胺合成酶/甲硫氨酸磺基肟(methionine sulfoximine)进行选择来制得。将用此选择策略制得的细胞池及克隆以复杂筛选方法对高度和稳定表达进行研究。大部分克隆不产生或仅产生平均量的产物，而仅有少数克隆为高产者。混合群中高产者的比例可(例如)通过可选择标记的突变来增加(Sautter及Enenkel，2005，WO 2004/050884)。然而，需要进一步增加各个别克隆的比产率(specific productivity)以及经转染的细胞群内高产者的比例。

应增加经稳定转染的细胞，尤其是CHO细胞或其他制造相关性细胞的比产率及转染批次中的高产者的比例。此应形成对更有效率的细胞系的最新研发。因此，可在较短时间内建立更多较高产率的细胞系且从而节省劳力、时间及成本。

发明内容

本发明是关于可使目的基因在经稳定转染的细胞中的转录或表达增加的、称为“TE元件”的调控核酸，尤其是具有SEQ ID No.1的核酸，或其片段或衍生物。令人惊奇的是已展示在稳定整合至宿主基因组(诸如CHO-DG44基因组)中的表达载体上与启动子、产物基因、可选择标记及任选增强子一起使用此种TE元件(例如)可克服、遮蔽或消除染色体位置效应。因此，使转染批次中高产者的比例以及绝对表达量均增加。

本发明进一步是关于含有以下各物的表达载体：SEQ ID No.1的转录或表达增加区、片段或衍生物，优选为TE元件TE-00(SEQ ID No.2)、TE-01(SEQ ID No.3)、TE-02(SEQ ID No.4)、TE-03(SEQ ID No.5)、TE-04(SEQ IDNo.6)、TE-06(SEQ ID No.8)、TE-07(SEQ ID No.9)、TE-08(SEQ ID No.10)、TE-10(SEQ ID No.12)、TE-11(SEQ ID No.13)、TE-12(SEQ ID No.14)、TE-13(SEQ ID No.15)、TE-14(SEQ ID No.16)、TE-15(SEQ ID No.17)、TE-16(SEQ ID No.18)、TE-17(SEQ ID No.19)、TE-18(SEQ ID No.20)和TE-21(SEQ ID No.21)。TE-06、TE-07、TE-08及TE-13因尺寸小而尤其优选。

SEQ ID No.1源自位于自CHO-细胞所分离的遍在蛋白/S27a基因的编码区上游的序列区，该基因编码细胞核糖体代谢中的必需蛋白质。

与迄今所用的表达载体相比，将顺式活性TE元件额外引入表达载体中可使经稳定转染的细胞池，尤其是CHO-DG44细胞池的产率高出多达7倍。另一方面，在CHO-DG44细胞池的瞬间转染中，引入TE元件不能实现产率提高。因此，在稳定细胞池中所观测到的产率提高并非基于存在于TE元件中的增强子。因此，染色体整合是TE元件引起产率提高所绝对必需的。此表明TE元件可抑制、遮蔽或消除染色体位置负面效应。因此，已制造且鉴别顺式活性元件，其特征在于特别适用于选择及富集高产率细胞且因此能够减少分离及鉴别高产克隆中时间、成本及产能的消耗。

本发明的可能应用包括研发高产细胞系，其在(例如)制造生物药、基于细胞的分析性检定、高产量物质筛选或制造用于NMR光谱分析、其他检定的重组蛋白产物等中是需要的。由于较高的比产率及几乎不表达或不表达产物的细胞减少，因此可在较短时间内建立更多较高产率的细胞从而节省劳力及成本。其他可能应用为制造稳定的、改良的宿主细胞系(例如，引入抗细胞凋亡或糖基化基因)、转基因动物或植物，及在基因治疗中的应用。

本发明并非来源于先前技术。

具有SEQ ID No.1的核酸为自中国仓鼠(Cricetulus griseus)基因组分离的核酸序列。其来自位于遍在蛋白/S27a基因的编码区上游的序列区。

具有SEQ ID No.1的核酸具有44％的平均GC含量且不含有任何更冗长的GC重复序列段。此GC含量与针对哺乳动物基因组DNA所述的约40％的平均GC含量相当(Delgado等人，1998)。用newcpgseek(EMBOSS序列分析软件包)寻找GC丰富区，仅得到五个非常短的序列区域，其具有绝对提高的CpG二聚体频率和/或与GpC相比提高的CpG比例：SEQ ID No.1的核苷酸2242-2259(18bp)、3129-3146(18bp)、3215-3240(26bp)、3417-3461(44bp)和3658-3788(131bp)。该搜索结果显示，该核酸序列不含延长的CpG岛。

此外，SEQ ID No.1还含有两个串联重复序列(核苷酸2179-2244和核苷酸1027-1080)以及两个反向重复序列(核苷酸8-47和核苷酸1726-1766)，其利用EMBOSS程序被鉴定为是串联和反向重复的(etandem andeinverted)。TE-08相应含有一个反向重复序列。在1bp到1578bp之间的序列区域中，相应地存在一个串联重复序列和一个反向重复序列。

具有SEQ ID No.1的核酸的一部分已描述于WO 97/15664中：SEQ IDNo.1的核苷酸1579至3788对应于WO 97/15664中的SEQ ID No.5的核苷酸1至2201，但有差异。在根据本发明的SEQ ID No.1制备期间，将4个额外核苷酸通过克隆方法引入，此由填补现存ECORI切割位点的反应来形成。此额外4个核苷酸的插入发生于WO 97/15664中的序列SEQ ID No.5的核苷酸357与358之间。然而，本发明的具有SEQ ID No.1的核酸序列的核苷酸1至1578组成新颖的迄今未知的序列区，其在本发明的范围为经分离的。此外，WO 97/15664未揭示本发明的SEQ ID No.1或其片段或衍生物在与启动子/增强子组合(该启动子/增强子组合使得功能上连接的目的基因可转录)在功能上连接时，可增加目的基因的转录或表达，而此与染色体整合位点无关。更确切言之，WO 97/15664揭示使用遍在蛋白/S27a基因的5’UTR序列作为启动子，而根据WO 97/15664中图5的位置-161至-45的序列区是启动子活性所必需的。此序列区仅部分存在于本发明的SEQ ID No.1的核酸及自其衍生而得具有SEQ ID No.2的片段(根据WO 97/15664中图5的位置-161至-89)中。SEQ ID No.1的其他片段及衍生物完全不含此序列区。此外，当使用标准比对演算法(诸如BLAST时)，本发明的SEQ ID No.1的核酸不与以下专利申请案中所述的核酸序列展示出序列同源性，以下序列亦可以顺式在染色质水平正面影响表达：

a)WO 00/05393中的UCOE核酸序列

b)US 6,309,841中的EASE核酸序列

c)WO 03/004704中的STAR核酸序列。

甚至使用更复杂的比对策略，也没有找到与a)-c)的这些核酸序列之间延展的序列同源性。

附图说明

图1：基本载体的示意图

使用A所示的载体在CHO-DG44细胞中表达重组单克隆IgG1抗体。在此情况下，“E/P”为CMV增强子与仓鼠遍在蛋白/S27a启动子的组合，“P”仅为启动子元件且“T”为经转录mRNA的多聚腺苷酸化所必需的转录终止信号。各转录单元内转录起始的位置及方向由箭头指示。对于克隆TE元件，SpeI切割位点(“SpeI”)存在于启动子/增强子组合之前。可扩增的可选择标记二氢叶酸还原酶缩写为“DHFR”。可选择标记新霉素磷酸转移酶含有点突变D227G且在图中相应缩写为“D227G”。源自脑心肌炎病毒的“IRES”元件充当双顺反子转录单元内的内部核糖体结合位点，且使得其后绿色荧光蛋白“GFP”可翻译。“HC”及“LC”分别编码人源化单克隆IgG1抗体的重链及轻链。

使用B所示的载体在CHO-DG44中表达重组蛋白MCP1。“E/P”为CMV增强子与CMV启动子的组合，“P”仅为启动子元件且“T”为经转录mRNA的多聚腺苷酸化所需的转录终止信号。各转录单元内转录起始的位置及方向由箭头指示。对于克隆TE元件，将具有限制性核酸内切酶切割位点的序列区“A”(衔接子)插在启动子之前。可选择标记新霉素磷酸转移酶含有点突变F204I且在图中相应缩写成F240I。源自脑心肌炎病毒的IRES元件充当双顺反子转录单元内的内部核糖体结合位点，且使得其后红色荧光蛋白“dsRed”可翻译。“MCP-1”编码人类单核细胞趋化蛋白-1。

图2：MCP-1基本载体的示意图

使用此图所示的载体在CHO-DG44细胞中表达重组蛋白MCP-1。“E/P”为CMV增强子与CMV启动子的组合，“P”仅为启动子元件且“T”为经转录mRNA的多聚腺苷酸化所需的转录终止信号。各转录单元内转录起始的位置及方向由箭头指示。对于克隆TE元件，将具有限制性核酸内切酶切割位点的序列区“A”(衔接子)插在启动子之前。可选择标记二氢叶酸还原酶在图中缩写为“dhfr”。源自脑心肌炎病毒的IRES元件充当双顺反子转录单元内的内部核糖体结合位点，且使得其后红色荧光蛋白“dsRed”可翻译。“MCP-1”编码人类单核细胞趋化蛋白-1。

图3：CHO遍在蛋白/S27S基因的5’序列

包含3788bp的序列区(SEQ ID No.1)分离自CHO(中国仓鼠卵巢)细胞的基因组，且位于Ub/S27a基因的编码区上游，该基因为遍在蛋白单元(Ub)与小核糖体亚单元的核糖体蛋白(S27a)的融合体。

图4：TE元件00至12的图示

此图示意性展示亚克隆于质粒中，位于CHO遍在蛋白/S27a基因的编码区上游的3788bp的基因组序列区。由此基因组序列(SEQ ID No.1)(亦称为TE元件A)，可制备不同长度的部分片段(下文称TE元件)。TE元件00(SEQ ID No.2)是自此序列的亚克隆中作为Sac II限制性片段分离的，且被克隆至目标载体pBID-HC及pBING-LC的SpeI切割位点。此等载体含有IgGI的重链(HC)或轻链的基因(参见图1A)。因此，形成表达载本，其中TE元件00以顺向及逆向定位于启动子上游。TE元件01至12可使用多种引物对(参见图5及6)通过PCR制得，且经由BamHI/BsrGI克隆至基本质粒pTE4/MCP-1(图1B)及pTE5/MCP-1(图2)中。

图5：TE元件00至12

此表展示由TE-A序列(SEQ ID No.1)制得的TE元件00至21的尺寸及起始位置与末端位置。对于通过PCR制得的片段，另外给出所用引物。元件的尺寸等级为约500bp，且与起始序列TE-A(SEQ ID No.1)相比在5’端或3’端具有缺失。

图6：用于合成TE元件01至12的引物

此等引物以5’-3’方向展示。名称中具有“顺向”的引物为与SEQ ID No.1顺向的引物，具有“逆向”的引物为逆向的引物。各引物由以下各物组成：5’端6个任意核苷酸，其后为BamHI或BsrGI切割位点及与SEQ ID No.1中的序列的一部分100％同源的约20至30个核苷酸的序列。引物中与SEQID No.1同源的区域展示为粗体。使用一个顺向引物及一个逆向引物扩增SEQ ID No.1的序列区。将所得PCR产物经由BamHI及BsrGI克隆至基本质粒pTE4/MCP-1(图1B)或pTE5/MCP-1(图2)中。

图7：转染系列B的FACS测量

此图展示与无TE元件00的细胞相比，在具有TE元件00的细胞中GFP表达的相对增强。对此，将CHO-DG4细胞用质粒组合pBING-LC与pBID-HC转染，该等组合彼此间不同之处仅为TE元件00的存在及取向。在于无HT的培养基中经由添加G418对经转染的细胞池进行长达两至三周的选择后，通过FACS分析法测量GFP荧光。除作为阴性对照的未经转染的CHO-DG44细胞(DG44)外，各曲线图由各情况下转染系列B的10个池的GFP荧光值的平均值组成。每池研究20000个细胞。“对照”表示基本质粒pBING-LC与pBID-HC，“逆向”表示基本载体中TE元件00为逆向，而“顺向”指示基本载体中TE元件00为顺向。

图8：转染系列C的FACS测量

此图展示与不含有TE元件的细胞群中的细胞相比，含有TE元件01、02、05、06、08或09的稳定细胞群中表达dsRed2细胞的比例。对此，将CHO-DG44细胞用质粒pTE4/MCP-1或由其所获得的额外含有上述TE元件之一的衍生物转染。在于添加G418的培养基中对经转染的细胞池进行长达约三周的选择后，通过FACS分析法测量dsRed2荧光。每池测量10000个细胞且减去未经转染的CHO-DG44细胞的固有荧光值。各值为转染系列C的6个池的表达dsRed2的细胞的平均百分比。

图9：TE元件对比产率的影响

此图以图示(A)或表格形式(B)展示，与无TE元件的对照池相比，IgG1或MCP-1的表达量因存在TE元件而获得的变化。细胞池是通过用基本质粒pBING-LC及pBID-HC或pTE4/MCP-1(“对照”)及由其所获得的衍生物稳定转染CHO-DG44细胞而制得，各衍生物额外含有TE元件(顺向“00”)(“00顺向”)及逆向“00”(“00逆向”)、“01”至“12”)。在于无HT的培养基中经由添加G418(系列A及B)或于含HT的培养基中经由添加G418(系列C及D)对经转染的细胞池进行长达两至三周的选择后，通过ELISA测量细胞培养物上清液中的蛋白质表达且计算每天每个细胞的比产率。经由在75cm²T形烧瓶中，以2-2-3天的传代节律数次传代进行经稳定转染的CHO-DG44细胞的培养。在系列A中，经8次传代培养取自质粒组合“00逆向”及“00顺向”的4个池及对照的3个池；在系列B中，经6次传代培养各质粒组合的各10个池；且在系列C及D中，经由6次传代培养各类型质粒的各6个池。对质粒组合及系列的池的比产率取平均值且将各系列中的对照平均值设定为1。将具有TE元件的池的比产率平均值与此值相比较。

图10：TE元件对经DHFR选择的细胞池的比产率的影响

此图以曲线图(A)或表(B)的形式展示，与无TE元件的对照池相比，MCP-1的表达量因存在TE元件而产生的变化。细胞池是通过用基本质粒pTE5/MCP-1(“对照”)或由其所获得的各自额外含有TE元件(“01”至“12”)的衍生物稳定转染CHO-DG44细胞而制得(系列E)。在于无HT培养基中对经转染的细胞池进行长达两至三周的选择后，通过ELISA测量细胞培养物上清液中的蛋白质表达且计算每天每个细胞的比产率。经由在75cm²T形烧瓶中，以2-2-3天的传代节律数次传代进行经稳定转染的CHO-DG44细胞的培养。培养中各质粒变异体的6个池经6次传代。对质粒变异体的池的比产率取平均值且将对照平均值设定为1。将具有TE元件的池的比产率平均值与此值相比较。

图11：测试TE元件的增强子活性

与无TE元件的对照载体相比，当使用具有TE元件的表达载体时，CHO-DG44细胞的瞬间转染未展示MCP-1滴度显著增加。因此TE元件01至12不充当增强子且因此仅在整合至染色体中时才促使表达显著增加。用pTE4/MCP-1(对照)及自其所获得的各自额外含有TE元件(“01”至“12”)的衍生物转染6个池。同时共转染SEAP表达质粒以测定转染效率(SEAP＝分泌型碱性磷酸酶)。以总体积3ml培养48小时后，移除细胞培养物上清液且通过ELISA测定MCP-1滴度且测定SEAP活性。相对于通过SEAP表达所测定的转染效率修正MCP-1滴度。图中展示6个平行池的平均值与标准偏差。

图12：其他TE元件

迄今为止的结果指示：选择此图中所示的序列ID No.1的片段亦可使得基因表达增加。克隆及稳定转染此等额外TE元件旨在更清晰地表征序列IDNo.1以便更准确地定位对功能至关重要的序列区。

图13：TE元件的不同位置及组合的测试

此图描述可能的表达载体的选择，其中使用TE元件的不同位置、取向及组合来研究是否可以此方式达成表达的额外增加。TE元件不仅可与产物基因侧接，而且多个相同或不同的短TE元件亦可纵向连接在一起，诸如TE元件06与08或新的TE元件13与14。

图14：TE元件TE 13至TE 18对特定MCP-1表达的影响

此图示意性展示与无TE元件的对照池相比，MCP-1的表达量因TE元件的存在而产生的变化。细胞池是通过用基本质粒pTE4/MCP-1(“对照”)或由其所获得的各自额外含有TE元件(“13”至“18”)的衍生物稳定转染CHO-DG44细胞而制得(系列F)。在于补充有HT的培养基+G418(400μg/ml)中对经转染的细胞池进行长达两至三周的选择后，通过ELISA测量细胞培养物上清液中的蛋白质表达且计算每天每个细胞的比产率。经由在75cm²T形烧瓶中，以2-2-3天的传代节律数次传代进行经稳定转染的CHO-DG44细胞的培养。各质粒变异体的4个池在培养中经5至6次传代。对质粒变异体的池的比产率取平均值且将对照平均值设定为1。将具有TE元件的池的比产率平均值与此值相比较。

图15：各种位置及各种组合的TE元件对MCP-1表达的影响

此图示意性展示与无TE元件的对照池相比，MCP-1的表达量因不同TE元件的存在及组合而产生的变化。细胞池是通过用基本质粒pTE4/MCP-1(“对照”)或由其所获得的各自额外含有一或两个TE元件(“06及08、08逆向、09逆向、A”)的衍生物稳定转染CHO-DG44细胞而制得(系列G)。在于补充有HT的培养基+G418(400μg/ml)中对经转染的细胞池进行长达两至三周的选择后，通过ELISA测量细胞培养物上清液中的蛋白质表达且计算每天每个细胞的比产率。经由在6孔培养盘(MAT6)中，以2-2-3天的传代节律数次传代进行经稳定转染的CHO-DG44细胞的培养。各质粒变异体的6个池在培养中经6次传代。对质粒变异体的池的比产率取平均值且将对照平均值设定为1。将具有TE元件的池的比产率平均值与此值相比较。

图16：以IgG-4抗体测试TE元件TE-08

使用此图所示的载体在CHO-DG44细胞中表达重组单克隆IgG4抗体。在此情况下，E/P为CMV增强子与启动子的组合，P仅为启动子元件且T为经转录mRNA的多聚腺苷酸化所需的转录终止信号。各转录单元内转录起始的位置及方向由箭头指示。克隆轻链(LC)及重链(HC)的基因替代MCP-1-IRES-dsRed2序列盒(图1B及2)。其分别编码人源化单株IgG-4抗体的重链及轻链。可扩增的可选择标记二氢叶酸还原酶缩写为“dhfr”。可选择标记新霉素磷酸转移酶含有点突变F240I且在图中相应缩写为F240I。

发明详述

本发明说明书范围内所使用的术语及命名具有下文中所定义的以下含义。一般术语“含有”包括更具体术语“由...组成”。此外，无限制性使用术语“单数”及“复数”。

术语“TE元件”表示调控核酸。

术语“TE元件”或“表达增强元件”或“转录增强元件”或“表达或转录增强核酸元件”在本文中以同义使用。此等术语均指调控核酸序列。

特定言之，“TE元件”或“表达增强元件”或“转录增强元件”或“表达或转录增强核酸元件”意谓自中国仓鼠(Cricetulus griseus)基因组分离的序列ID No.1(包括其互补序列)，或其任何部分、片段或区域，或序列ID No.1的衍生物或该衍生物的部分、片段或区域之一，当其稳定整合至染色体中时可使目的基因的转染或表达增加。亦意谓序列ID No.1的部分、片段、区域或衍生物的任意组合，其是由多个相同或不同的SEQ ID No.1的部分、片段、区域或衍生物组成，而各组份又可以任意取向且以任意间距彼此相对排列，或可与其他调控序列组合，且可使目的基因的转录或表达增加。术语TE元件可指SEQ ID No.1本身及其任意片段、部分、区域或衍生物。

此外，术语“TE元件”、“转录增强或表达增强核酸元件”或其片段、部分、区域或衍生物除中国仓鼠(Cricetulus griseus)序列的部分外亦涵盖源自其他生物体的相应功能性同源核苷酸序列。此等其他生物体的实例包括人类、小鼠、大鼠、猴及其他哺乳动物及啮齿动物、爬行动物、鸟类、鱼类及植物。

“片段”或“部分”或“区域”(此等术语以同义使用)意谓序列与SIQID No.1或其互补序列的部分区域100％一致的核酸分子(单链或双链)。已知克隆通过限制酶消化或通过PCR所制得的片段可引起该片段末端区中的修饰，亦即添加或缺失核苷酸或经由引物另外引入核苷酸，此为填补反应或断裂反应的结果。片段的定义包括片段末端区中的此等变异，即使此等序列区与SEQ ID No.1的序列同一性小于100％。序列ID No.1的“部分”或“片段”或“区域”包括(例如)TE-00(序列ID No.2)、TE-01(序列ID No.3)、TE-02(序列ID No.4)、TE-03(序列ID No.5)、TE-04(序列ID No.6)、TE-05(序列ID No.7)、TE-06(序列ID No.8)、TE-07(序列ID No.9)、TE-08(序列ID No.10)、TE-09(序列ID No.11)、TE-10(序列ID No.12)、TE-11(序列IDNo.13)、TE-12(序列ID No.14)、TE-13(序列ID No.15)、TE-14(序列ID No.16)、TE-15(序列ID No.17)、TE-16(序列ID No.18)、TE-17(序列ID No.19)、TE-18(序列ID No.20)、TE-21(序列ID No.21)。优选地，片段经稳定染色体整合后可使得功能上连接的目的基因的转录或表达增加。可使目的基因的转录或表达增加的序列ID No.1的“部分”或“片段”或“区域”例如为TE-00(序列ID No.2)、TE-01(序列ID No.3)、TE-02(序列ID No.4)、TE-03(序列ID No.5)、TE-04(序列ID No.6)、TE-06(序列ID No.8)、TE-07(序列ID No.9)、TE-08(序列ID No.10)、TE-10(序列ID No.12)、TE-11(序列IDNo.13)、TE-12(序列ID No.14)、TE-13(序列ID No.15)、TE-14(序列ID No.16)、TE-15(序列ID No.17)、TE-16(序列ID No.18)、TE-17(序列ID No.19)、TE-18(序列ID No.20)和TE-21(序列ID No.21)。然而，术语“片段”亦包括可使目的基因的转录或表达增加的、任意取向的SEQ ID No.1的其他所有可能部分，尤其是完全或至少部分处于TE-00(序列ID No.2)的5’区中的部分。此对应于SEQ ID No.1中介于1bp与1578bp之间的部分区域。片段TE-08(SEQ ID No.10)亦优选。

在本发明中，“衍生物”意谓与SEQ ID No.1或其互补序列或与SEQ IDNo.1的部分或片段或区域或SEQ ID No.1的互补序列具有至少70％的序列同一性，优选至少约80％的序列同一性，优选至少约85％的序列同一性，尤其优选至少约90％的序列同一性，且最佳至少约95％的序列同一性，且经染色体整合后可使目的基因的转录或表达增加的核酸分子(单链或双链)。在一方面，与SEQ ID No.1的序列差异可基于源自其他生物体的同源内源性核苷酸序列的差异。在另一方面，其亦可基于核苷酸序列的有意修饰，例如至少一或多个核苷酸的取代、插入或缺失。缺失、插入及取代突变体可通过“定点诱变”和/或“基于PCR的诱变技术”来制得。相应方法(例如)已由Lottspeich及Zorbas描述(1998；第36.1章及其他参考文献)。序列同一性可使用所谓的标准比对演算法，诸如“BLAST”“(Altschul，S.F.Gish，W.，Miller，W.，Myers，E.W.&Lipman，D.J.(1990)“Basic local alignmentsearch tool”J.Mol.Biol.215：403-410；Madden，T.L.，Tatusov，R.L.&Zhang，J.(1996)“Applications of network BLAST server”Meth.Enzymol.266：131-141；Zhang，J.&Madden，T.L.(1997)“PowerBLAST：A new network BLASTapplication for interactive or automated sequence analysis and annotation”Genome Res.7：649-656)，来与参考序列(在此情况下为序列ID No.1)相符合。序列在其连续性相对应时达成相符且可使用标准比对演算法来鉴别。

根据本发明，“衍生物”意谓与SEQ ID No.1或与SEQ ID No.1的片段或部分或区域的序列或SEQ ID No.1的互补序列杂交的核酸分子(单链或双链)。优选地，杂交是在严格杂交及洗涤条件(例如，在65℃下含有5xSSC的缓冲液中杂交；在42℃下用0.2xSSC/0.1％SDS洗涤)下进行。相应技术描述于(例如)Ausubel等人，1994中。优选地，SEQ ID No.1的部分或片段或区域包括所有或至少部分核苷酸位置1bp与1578bp之间的序列区。此对应于TE-00序列(SEQ ID No.2)的5’序列区。片段TE-08(SEQ ID No.10)亦优选。

术语“变异体”是指用于特定转染混合物中的表达载体。此等载体包括基本载体(pTE4/MCP-1或pTE5/MCP-1)或基本载体组合(pBING-LC+pBID-HC)以及含有一或多个不同位置、组合及取向的TE元件的基本载体。

在引物的情况下，术语“取向”是指引物相对于SEQ ID No.1的排列。所有序列顺序与SEQ ID No.1所示的序列在5’-3’顺序上一致的引物(＝前向引物)均与此序列取向相同，此亦称为“顺向”。序列顺序与SEQ ID No.1所示的序列互补的引物(＝反向引物)与此序列取向相反，此亦称为“逆向”。在本发明中，与TE元件相关的术语“取向”是指相对于目的基因的排列。SEQ ID No.1所示的序列表示位于遍在蛋白/S27a基因的编码区的5’(亦称为“上游”)的基因组序列。SEQ ID No.1中所示的此序列沿其后遍在蛋白/S27a基因的编码区的方向延伸，可达此基因的起始密码子。此排列因此称为“顺向”。类似地，在本发明中，当SEQ ID No.1中所示的序列或其任意部分、片段、区域或衍生物在表达载体中与目的基因的起始密码子存在于相同DNA链上时，TE元件处于顺向。相反，若与SEQ ID No.1互补的序列或其任意部分、片段、区域或衍生物在表达载体中与目的基因的起始密码子存在于相同DNA链上时，则TE元件处于“逆向”。除非另有说明，否则当提及TE元件时，总是两种取向都包括/意谓，亦即：顺向和逆向。

“染色体整合”意谓将任意核酸序列整合至细胞的基因组(亦即染色体)中，此整合为视情况以任何所要数目、位置及取向整合至一或多个染色体中。此外，术语“染色体整合”亦包括将任何所要核酸序列整合至合成染色体、人造染色体或微型染色体中。

目的基因：

本发明的表达载体中所包含的目的基因包含编码目的产物的任何长度的核苷酸序列。基因产物或“目的产物”通常为蛋白质、多肽、肽或其片段或衍生物。然而，其亦可为RNA或反义RNA。目的基因可以其全长形式、缩短形式、融合基因形式或经标记基因形式存在。其可为基因组DNA，或优选为cDNA，或相应片段或融合体。目的基因可为天然基因序列，或其可经突变或经另外修饰。该等修饰包括密码子最优化(以适应特定宿主细胞)及人源化。目的基因可(例如)编码分泌型、细胞质、核定位、膜结合或细胞表面结合的多肽。

术语“核酸”、“核苷酸序列”或“核酸序列”表示寡核苷酸、核苷酸、聚核苷酸及其片段，以及以单链或双链形式存在且可代表基团的编码链或非编码链的基因组或合成来源的DNA或RNA。核酸序列可使用标准技术进行修饰，标准技术诸如定点诱变或PCR介导的诱变(例如Sambrook等人，1989或Ausubel等人，1994中所述)。

“编码”意谓核酸中的特定核苷酸序列(例如染色体或mRNA中的基因)在生物过程中充当其他聚合物及大分子(诸如rRNA、tRNA、mRNA、其他RNA分子、cDNA或多肽)的合成基质的特性或能力。因此，若所要蛋白质是通过某mRNA的转录及后续翻译在细胞或其他生物系统中产生，则该基因编码该蛋白质。核苷酸序列与mRNA序列一致且通常亦可获得于序列资料库(例如EMBL或GenBank)的编码链、以及充当转录基质的基因或cDNA的非编码链均可称为编码产物或蛋白质。编码蛋白质的核酸亦包括基于简并遗传密码因而具有不同顺序的核苷酸序列、但可产生蛋白质的相同氨基酸序列的核酸。编码蛋白质的核酸序列亦可含有内含子。

术语“cDNA”表示通过自由基因产生的mRNA或其他RNA逆转录及合成第二DNA链而制得的去氧核糖核酸。若cDNA以双链DNA分子形式存在，则其含有编码链与非编码链。

术语“内含子”表示具有任何长度的非编码核苷酸序列。其天然存在于多种真核基因中，且可通过称为剪接的方法自预先转录的mRNA前体中消除。此需要在5’端及3’端处准确切除内含子，且正确连接所形成的mRNA末端，以产生具有以便达成成功蛋白质合成的正确阅读框架的、经成熟加工的mRNA。许多与此剪接过程相关的剪接供体及剪接接受体位点(亦即恰位于外显子-内含子或内含子-外显子界面处的序列)迄今已得到表征。回顾可参见Ohshima等人，1987。

目的蛋白质/产物

具有生物药重要性的蛋白质/多肽例如包括(但不限于)抗体、酶、细胞因子、淋巴因子、粘附分子、受体及其衍生物或片段。通常，可使用充当促效剂或拮抗剂和/或具有治疗性或诊断性应用的所有多肽。其他目的蛋白质例如为(但不限于)在所谓的“细胞工程”范围内用于改变宿主细胞特性的蛋白质/多肽，诸如抗细胞凋亡蛋白、伴侣蛋白、代谢酶、糖基化酶及其衍生物或片段。

术语“多肽”是用于氨基酸序列或蛋白质，指具有任何长度的氨基酸聚合物。此术语亦包括通过诸如糖基化、磷酸化、乙酰化或蛋白加工的反应经翻译后修饰的蛋白质。多肽的结构可在保留其生物活性的同时(例如)通过取代、缺失或插入氨基酸及与其他蛋白质融合来修饰。此外，多肽可多聚化且形成同聚体及异聚体。

治疗性蛋白质的实例为胰岛素、胰岛素样生长因子、人类生长激素(hGH)及其他生长因子、受体、组织血纤维蛋白溶解酶原活化因子(tPA)、红细胞生成素(EPO)、细胞因子(例如白细胞介素(IL)，诸如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18)、干扰素(IFN)-α、干扰素-β、干扰素-γ、干扰素-Ω或干扰素-τ、肿瘤坏死因子(TNF)(诸如TNF-α、TNF-β或TNF-γ)、TRAIL、G-CSF、GM-CSF、M-CSF、MCP-1及VEGF。其他实例为单克隆抗体、多克隆抗体、多特异性抗体及单链抗体及其片段，诸如Fab、Fab’、F(ab’)₂、Fc及Fc’片段、免疫球蛋白轻链(L)及重链(H)及其恒定区、可变区或高变区以及Fv及Fd片段(Chamov等人，1999)。抗体可为人类或非人类起源。人源化抗体及嵌合抗体亦可。

Fab片段(抗原结合片段＝Fab)是由经相邻恒定区连接在一起的双链的可变区组成。其可(例如)自常规抗体通过用蛋白酶(诸如木瓜酶)处理或通过DNA克隆而产生。其他抗体片段为F(ab’)₂片段，其可通过用胃蛋白酶进行蛋白水解消化来产生。

通过基因克隆亦可制备仅由重链(VH)及轻链(VL)的可变区组成的缩短抗体片段。此等片段称为Fv片段(片段可变区＝可变区部分的片段)。由于在此等Fv片段中不可能经由恒定链的半胱氨酸基团形成共价键，因此此等Fv片段通常通过某些其他方法达成稳定。为此，重链与轻链的可变区通常藉助于约10至30个氨基酸，优选15个氨基酸的短肽片段连接在一起。由此产生VH与VL经肽接头连接在一起的单一多肽链。该等抗体片段亦称为单链Fv片段(scFv)。scFv抗体的实例是已知的且已有描述，例如参见Huston等人，1988。

在过去数年中已研发多种用于制备多聚scFv衍生物的策略。目的旨在制备具有经改良的药物动力学特性及增加的结合亲和力的重组抗体。为达成scFv片段的多聚化，将其制成具有多聚化结构域的融合蛋白。多聚化结构域可例如为IgG的CH3区或螺旋结构(“卷曲螺旋结构”)，诸如亮氨酸拉链结构域。在其他策略中，利用scFv片段的VH区与VL区之间的相互作用实现多聚化(例如，双功能抗体、三功能抗体及五功能抗体)。

术语“双功能抗体”在此项技术中用于表示二价、同二聚scFv衍生物。通过叠合VH/VL链使scFv分子中的肽接头缩短为5-10个氨基酸而形成同二聚体。双功能抗体另外可经由所插入的二硫键达成稳定。双功能抗体的实例可见于文献中，例如Perisic等人，1994。

术语“微型抗体”在此项技术中用于表示二价、同二聚scFv衍生物。其是由融合蛋白组成，该融合蛋白含有作为二聚化区的免疫球蛋白(优选IgG，最佳IgG1)的CH3。此区藉助于亦为IgG的铰链区及接头区与scFv片段连接。该等微型抗体的实例已由Hu等人，1996描述。

术语“三功能抗体”在此项技术中用于表示三价、同三聚scFv衍生物(Kortt等人，1997)。VH-VL直接融合而不使用接头序列可形成三聚体。

此项技术中称为微抗体的具有二价、三价或四价结构的片段亦为scFv片段的衍生物。多聚化是藉助于二聚、三聚或四聚卷曲螺旋结构达成(Pack等人，1993及1995；Lovejoy等人，1993)。

编码荧光蛋白的基因：

在另一实施例中，本发明的表达载体含有与目的基因在功能上连接的编码荧光蛋白的基因。优选地，两种基因在单一异源启动子控制下转录，使得目的蛋白质/产物与荧光蛋白由双顺反子mRNA编码。此使得可藉助于荧光蛋白的表达率鉴别大量产生目的蛋白质/产物的细胞。或者，编码荧光蛋白的基因的转录可在其自身启动子的控制下进行。

荧光蛋白可为(例如)绿色、蓝绿色、蓝色、黄色或其他颜色的荧光蛋白。一特定实例为自水母(Aequorea victoria)或海肾(Renilla reniformis)获得的绿色荧光蛋白(GFP)及由其所形成的突变体；例如参见Bennet等人，1998；Chalfie等人，1994；WO 01/04306及其中所引用的文献。

其他荧光蛋白及其编码基因描述于WO 00/34318、WO 00/34326、WO00/34526及WO 01/27150中，该等专利以引用的方式并入本文中。此等荧光蛋白为珊瑚虫网(Anthozoa)物种的非生物发光生物体的荧光团，该等生物体例如海葵(Anemonia majano)、羽珊瑚(Clavularia sp.)、花群海葵I(Zoanthussp.I)、花群海葵II(Zoanthus sp.II)、白花菇珊瑚(Discosoma striata)、“红色”圆盘拟珊瑚海葵(Discosoma sp.“red”)、“绿色”圆盘拟珊瑚海葵、“洋红色”圆盘拟珊瑚海葵、沟迎风海葵(Anemonia sulcata)、青色多管水母(Aequorea coerulescens)。

根据本发明所使用的荧光蛋白除野生型蛋白质外亦含有天然或经基因工程设计的突变体及变异体、其片段、衍生物或(例如)已与其他蛋白质或肽融合的变异体。所引入的突变可(例如)改变激励或发射光谱、发色团的形成、蛋白质的消光系数或稳定性。此外，可通过密码子最优化改良在哺乳动物细胞或其他物种中的表达。根据本发明，荧光蛋白亦可以与可选择标记，优选可扩增的可选择标记(诸如二氢叶酸还原酶(DHFR))融合的形式使用。

荧光蛋白所发射的荧光使得可(例如)通过流式细胞计数法使用荧光活化细胞分选仪(FACS)或通过荧光显微法检测蛋白质。

其他调控元件：

表达载体含有至少一种异源启动子，其使得目的基因可表达且优选亦使得荧光蛋白可表达。

术语“启动子”表示允许且控制与其在功能上联接的基团或序列的转录的聚核苷酸序列。启动子含有结合RNA聚合酶的识别序列及转录起始位点。为在特定细胞类型或宿主细胞中表达所要序列，必须选择适当的功能性启动子。本领域技术人员熟悉各种来源的多种启动子，包括组成性启动子、诱导性启动子及可抑制性启动子。其保藏于诸如GenBank的资料池中，且可以单独元件或克隆于聚核苷酸序列内的元件的形式自商业或个人来源获得。在诱导性启动子中，启动子的活性可回应于信号而减弱或增强。诱导性启动子的一实例为四环素(tet)启动子。此启动子含有可由四环素调控的反式活化蛋白(tTA)诱导的四环素操纵子序列(tetO)。在四环素存在下，tTA与tetO的结合受到抑制。其他诱导性启动子的实例为jun、fos、金属硫蛋白及热休克启动子(亦参见Sambrook等人，1989；Gossen等人，1994)。

尤其适用于在真核细胞中促成高表达的启动子包括(例如)仓鼠的遍在蛋白/S27a启动子(WO 97/15664)、SV 40早期启动子、腺病毒主要晚期启动子、小鼠金属硫蛋白-I启动子、劳斯(Rous)肉瘤病毒的长末端重复区、人类巨细胞病毒的早期启动子。其他异源哺乳动物启动子的实例为肌动蛋白、免疫球蛋白或热休克启动子。

相应异源启动子可与其他调控序列在功能上联接，用以增强/调控表达序列盒中的转录活性。

举例而言，启动子可与增强子序列在功能上连接，用以增强转录活性。对此，可使用一或多个增强子和/或增强子序列的数个拷贝，例如CMV或SV40增强子。因此，在另一实施例中，本发明的表达载体含有一或多个增强子/增强子序列，优选为CMV或SV40增强子。

术语增强子表示以顺式方位作用于启动子活性且从而刺激与此启动子在功能上联接的基因的转录的聚核苷酸序列。与启动子不同，增强子的作用不依赖于位置及取向，且因此其可定位于转录单元之前或之后、内含子内或甚至编码区内。增强子可定位于紧邻转录单元，也可远离启动子。其亦可与启动子具有实体性及功能性重叠。本领域技术人员了解来自各种来源的多种增强子(及保藏于诸如GenBank的资料库中的增强子，例如SV40增强子、CMV增强子、多瘤病毒增强子、腺病毒增强子)，该等增强子可以独立元件或克隆于聚核苷酸序列内的元件的形式获得(例如保藏于ATCC或来自商业及个人来源)。多种启动子序列亦含有增强子序列，诸如常用的CMV启动子。人类CMV增强子是迄今为止所鉴别的最强增强子之一。诱导性增强子的一实例为金属硫蛋白增强子，其可由糖皮质激素或重金属刺激。

其他可能的修饰例如为引入多个Sp1结合位点。亦可使启动子序列与控制/调控转录活性的调控序列组合。因此，可使得启动子具有可抑制性/诱导性。此可(例如)通过与为上调或下调转录因子的结合位点的序列连接来完成。举例而言，上述转录因子Sp1对转录活性具有正面作用。另一实例为活化蛋白AP1的结合位点，活化蛋白AP1可对转录起到正面与负面作用。AP1的活性可由各种因子(诸如生长因子、细胞因子及血清)控制(Faisst等人，1992及其中所引用的参考文献)。亦可如下增加转录效率：通过使一处、两处、三处或三处以上碱基突变(取代、插入或缺失)来改变启动子序列，且接着以报导基因测定判定此突变是否增强启动子活性。

额外调控元件主要包括异源启动子、增强子、终止信号及多聚腺苷酸化信号及其他表达控制元件。用于各种细胞类型的诱导性及组成性调控序列均为已知的。

“转录调控元件”通常包含待表达基因序列上游的启动子、转录起始位点及终止位点及多聚腺苷酸化信号。

术语“转录起始位点”是指构筑体中与并入初级转录物(亦即mRNA前体)中的第一核酸相对应的核酸。转录起始位点可与启动子序列重叠。

术语“转录终止位点”是指通常位于目的基因或待转录基因部分的3’端且使经由RNA聚合酶的转录终止的核苷酸序列。

“多聚腺苷酸化信号”为在真核mRNA 3’端的特定位点处引起断裂、且在断裂的3’端转录后并入约100-200个腺嘌呤核苷酸的序列(polyA尾)的信号序列。多聚腺苷酸化信号包含断裂位点上游约10-30个核苷酸处的序列AATAAA及位于下游的序列。已知多种多聚腺苷酸化元件，诸如tk polyA、SV40晚期及早期polyA或BGH polyA(例如US 5,122,458中所述)。

“翻译调控元件”包含用于各待表达多肽的翻译起始位点(AUG)、终止密码子及polyA信号。对达成最佳表达合理的是移除、添加或改变待表达核酸序列的5’-和/或3’-未翻译区，以消除任何潜在不适当的额外翻译起始密码子或其他可能在转录量或表达量上影响表达的序列。或者，为促进表达，可在起始密码子的上游紧邻插入核糖体共有结合位点。为产生分泌型多肽，目的基因通常含有信号序列，其编码将合成多肽转运至且穿过ER膜的信号前体肽。信号序列通常但不总是位于分泌型蛋白质的氨基末端，且在蛋白质穿过ER膜后由信号肽酶裂解。基因序列通常但非必定含有其自身信号序列。若不存在天然信号序列，则可以已知方式引入异源信号序列。多种此类信号序列已为本领域技术人员所知且保藏于诸如GenBank及EMBL的序列资料库中。

另一种调控元件为内部核糖体进入位点(IRES)。IRES元件包含独立于5’-端甲基鸟苷帽(帽结构)及上游基因而在功能上活化翻译起始、且在动物细胞中使得可自单一转录物翻译两个顺反子(开放阅读框架)的序列。IRES元件提供独立的核糖体进入位点用于翻译紧邻位于下游的开放阅读框架。与可为多顺反子性的细菌mRNA(亦即，其可编码由mRNA相继翻译的多种不同多肽或产物)相比，大部分动物细胞的mRNA为单顺反子的且仅编码一种蛋白质或产物。在真核细胞中的多顺反子转录物的情况下，翻译可自上游最近的翻译起始位点起始且由第一个终止密码子终止，之后转录物可自核糖体中释放。因此，在翻译期间仅产生由mRNA编码的第一个多肽或产物。相比而言，具有与转录物中的第二或后续开放阅读框架在功能上连接的IRES元件的多顺反子转录物允许随后翻译位于IRES元件下游的开放阅读框架，从而在真核细胞中产生两种或两种以上由相同转录物编码的多肽或产物。

IRES元件可具有多种长度及多种来源且可(例如)源自脑心肌炎病毒(EMCV)或其他小核糖核酸病毒。多种IRES序列及其在载体构筑中的用途已描述于文献中，例如参见Pelletier等人，1988；Jang等人，1989；Davies等人，1992；Adam等人，1991；Morgan等人，1992；Sugimoto等人，1994；Ramesh等人，1996；Mosser等人，1997。

使位于下游的基因序列与IRES元件的3’端在功能上连接，亦即将间距选择成使得基因的表达不受影响或仅受微小影响或对于预定目的而言具有足够的表达。IRES元件与位于其下游的基因的起始密码子之间的可允许足够表达的最佳距离可通过简单实验通过改变间距且使用报导基因检定测定随间距变化的表达率来判定。

通过所述方法可获得对于异源基因产物的表达具有重要价值的最佳表达序列盒。因此，藉助于一或多种该等方法所获得的表达序列盒为本发明的另一目标。

仓鼠-遍在蛋白/S27a启动子：

在另一实施例中，本发明的表达载体含有仓鼠的遍在蛋白/S27a启动子，其优选是功能性连接至目的基因上，且甚至更佳是功能性连接至目的基因及编码荧光蛋白或可选择标记的基因上。

仓鼠的遍在蛋白/S27a启动子为WO 97/15664中所描述的强效同源启动子。该启动子优选具有以下特征中的至少一者：富含GC的序列区、Sp1结合位点、多嘧啶元件、无TATA盒。具有Sp1结合位点但无TATA盒的启动子尤其优选。可经组成性活化且尤其在含血清、低血清及无血清的细胞培养条件下具有相等活性的启动子亦优选。在另一实施例中，其为诱导性启动子，尤其为可通过移除血清而活化的启动子。

尤其有利的实施例为具有WO 97/15664的图5中所含的核苷酸序列的启动子。含有图5中位置-161至-45的序列的启动子序列尤其优选。

本专利说明书的实例中所使用的启动子各含有具有对应于WO97/15664的图5中的片段-372至+111的序列的DNA分子且代表优选启动子，亦即应含有此序列区的优选启动子。

本发明的表达载体的制备

本发明的表达载体理论上可通过此项技术中已知的习知方法，例如Sambrook等人(1989)所述的方法来制备。Sambrook亦描述载体的功能性组份，例如适当的启动子(除仓鼠遍在蛋白/S27a启动子外)、增强子、终止信号及多聚腺苷酸化信号、抗生素耐性基因、可选择标记、复制起点及剪接信号。可使用习知克隆载体制备该表达载体，例如质粒、噬菌体、噬菌粒、粘粒或病毒载体(诸如杆状病毒、逆转录病毒、腺病毒、腺相关病毒及单纯疱疹型病毒)以及合成或人造染色体/微型染色体。真核表达载体通常亦含有原核序列，诸如使得载体可在细菌中复制及选择的复制起点及抗生素耐性基因。已知多种含有用于引入聚核苷酸序列的多克隆位点的真核表达载体，且有些载体可购自各公司，诸如Stratagene，La Jolla，CA，USA；Invitrogen，Carlsbad，CA，USA；Promega，Madison，WI，USA或BD Biosciences Clontech，Palo Alto，CA，USA。

举例而言，可以本领域技术人员熟悉的方式将异源启动子、目的基因、可选择标记及任选编码荧光蛋白的基因、额外调控元件(诸如内部核糖体进入位点(IRES)、增强子、多聚腺苷酸化信号及诸如TE元件的其他顺式活性元件)引入表达载体。本发明的表达载体至少含有异源启动子、目的基因及TE元件。优选地，表达载体亦含有编码荧光蛋白的基因。根据本发明尤其优选使用遍在蛋白/S27a启动子作为异源启动子。异源启动子(优选遍在蛋白/S27a启动子)、目的基因及TE元件在功能上连接在一起或在功能上连接的表达载体尤其优选。

在本说明书的范围内，术语“功能性连接”或“在功能上连接”是指两个或两个以上核酸序列或部分序列，其定位成使其可执行各自预定功能。举例而言，启动子/增强子、启动子/TE元件或启动子/增强子/TE元件与编码基因序列若能够以顺式位置控制或调节连接基因序列的转录，则其在功能上连接。通常(但非必定)，功能上连接的DNA序列靠近在一起，且若两个编码基因序列连接或在分泌信号序列的情况下处于相同阅读框架中。尽管功能上连接的启动子通常位于编码基因序列的上游，但其并非必须靠近该序列。增强子或TE元件同样不必靠近，限制条件为其应有助于基因序列的转录或表达。为此目的，增强子或TE元件可位于基因序列的上游与下游，任选与该序列相隔一定距离。多聚腺苷酸化位点当其以一定方式位于基因序列的3’端使得转录经由编码序列前进至多聚腺苷酸化信号，则其与基因序列在功能上连接。可根据习知重组方法实现连接，例如通过PCR技术、通过适当限制性切割位点处的接合或通过剪接。若无适当的限制性切割位点可用，则可以本身已知的方式使用合成性寡核苷酸连接子或衔接子。

在所述实施例之一中，异源启动子(优选遍在蛋白/S27a启动子或CMV启动子)、目的基因及编码荧光蛋白的基因在功能上连接在一起。此意谓(例如)目的基因与编码荧光蛋白的基因自相同异源启动子开始被表达。在一尤其优选的实施例中，功能性连接经由IRES元件而发生，使得由两基因合成双顺反子mRNA。本发明的表达载体可另外含有在功能上作用于一或多个启动子的增强子元件和/或TE元件。异源启动子(优选遍在蛋白/S27a启动子或其修饰形式或CMV启动子)与增强子元件(例如SV40增强子或CMV增强子元件)及TE元件连接的表达载体尤其优选。

表达载体内基因的表达基本上可自一或多个转录单元起始进行。术语转录单元定义为含有一或多个待转录基因的区域。转录单元内的基因以一定方式在功能上彼此连接，使得该单元内的所有基因均处于相同启动子、启动子/增强子或启动子/增强子/TE元件的转录控制下。由于此基因转录连接，可由转录单元转录一种以上蛋白质或产物，且从而使其得以表达。各转录单元含有其中所含基因序列的转录及翻译所必需的调控元件。各转录单元可含有相同或不同的调控元件。IRES元件或内含子可用于转录单元内基因的功能性连接。

表达载体可含有用于表达目的基因、可选择标记及可选择的编码荧光蛋白的基因的单一转录单元。或者，此等基因亦可排列于两个或两个以上转录单元中。基因在转录单元内可具有各种组合。在本发明的另一实施例中，可将一个以上由一个、两个或两个以上转录单元组成的表达载体通过共转染或以任何所要顺序相继转染插入宿主细胞中。可选择各载体上调控元件与基因的任何组合，只要能确保转录单元的足够表达。若需要，可将其他调控元件(诸如TE元件)及基因(例如，其他目的基因或可选择标记)安置于表达载体上。

根据本发明，彼等表达载体亦优选，其含有一或多个TE元件且(替代目的基因)仅具有使得可经由限制性核酸内切酶的识别序列克隆目的基因的多克隆位点的。各种限制性核酸内切酶的各种识别序列以及相关限制性核酸内切酶在先前技术中是已知的。优选使用由至少6个核苷酸组成的序列作为识别序列。适当识别序列的清单可见于(例如)Sambrook等人，1989中。

根据本发明，替代目的基因而仅具有多克隆位点(该多克隆位点使得可经由限制性核酸内切酶的识别序列克隆目的基因)及另外在表达载体的不同位置具有一或多个(优选多个)克隆位点(该克隆位点另外使得可经由限制性核酸内切酶的识别序列克隆TE元件)的彼等表达载体亦优选。各种限制性核酸内切酶的各种识别序列以及相关限制性核酸内切酶在先前技术中是已知的。优选使用由至少6个核苷酸组成的序列作为识别序列。适当识别序列的清单可见于(例如)Sambrook等人，1989中。

宿主细胞：

对于用本发明的表达载体转染而言，使用真核宿主细胞，优选为哺乳动物细胞且更尤其为啮齿动物细胞，诸如小鼠、大鼠及仓鼠细胞系。用本发明的表达载体成功转染相应细胞可产生经转化经基因修饰的重组或转基因细胞，其亦为本发明的目标。

用于本发明的目的的优选宿主细胞为仓鼠细胞，诸如BHK21、BHKTK^-、CHO、CHO-K1、CHO-DUKX、CHO-DUKX B1及CHO-DG44细胞或此等细胞系的衍生物/子代。尤其优选为CHO-DG44、CHO-DUKX、CHO-K1及BHK21细胞，尤其是CHO-DG44及CHO-DUKX细胞。小鼠骨髓瘤细胞，优选NS0及Sp2/0细胞及此等细胞系的衍生物/子代亦适用。

可根据本发明使用的仓鼠及小鼠细胞的实例提供于下表1中。然而，此等细胞的衍生物及子代、其他哺乳动物细胞(包括但不限于人类、小鼠、大鼠、猴、啮齿动物的细胞系)或真核细胞(包括但不限于酵母、昆虫、鸟类及植物细胞)亦可用作产生生物药蛋白质的宿主细胞。

表1：仓鼠及小鼠制造性细胞系

细胞系	保藏编号
细胞系	保藏编号	NS0	ECACC No.85110503
Sp2/0-Ag14	ATCC CRL-1581	NS0	ECACC No.85110503
Sp2/0-Ag14	ATCC CRL-1581	BHK21	ATCC CCL-10
BHK TK^-	ECACC No.85011423	BHK21	ATCC CCL-10
BHK TK^-	ECACC No.85011423	HaK	ATCC CCL-15
2254-62.2(BHK-21-衍生物)	ATCC CRL-8544	HaK	ATCC CCL-15
2254-62.2(BHK-21-衍生物)	ATCC CRL-8544	CHO	ECACC No.8505302
CHO-K1	ATCC CCL-61	CHO	ECACC No.8505302
CHO-K1	ATCC CCL-61	CHO-DUKX(＝CHO duk^-，CHO/dhfr^-)	ATCC CRL-9096
CHO-DUKX B1	ATCC CRL-9010	CHO-DUKX(＝CHO duk^-，CHO/dhfr^-)	ATCC CRL-9096
CHO-DUKX B1	ATCC CRL-9010	CHO-DG44	Urlaub等人，Cell 33[2]，405-412，1983
CHO Pro-5	ATCC CRL-1781	CHO-DG44	Urlaub等人，Cell 33[2]，405-412，1983
CHO Pro-5	ATCC CRL-1781	V79	ATCC CCC-93

B14AF28-G3	ATCC CCL-14
B14AF28-G3	ATCC CCL-14	CHL	ECACC No.87111906

用聚核苷酸或本发明的表达载体之一转染真核宿主细胞可通过习知方法来进行(Sambrook等人，1989；Ausubel等人，1994)。适当的转染方法包括(例如)脂质粒介导的转染、磷酸钙共沉淀、电穿孔、聚阳离子(例如DEAE葡聚糖)介导的转染、原生质体融合、显微注射及病毒感染。根据本发明，优选进行稳定转染，其中构筑体整合至宿主细胞的基因组中或人造染色体/微型染色体中，或以稳定方式游离地包含于宿主细胞中。可获得最佳转染频率及所述宿主细胞内异源基因的表达的转染方法优选。根据定义，插入宿主细胞内的每个序列或每个基因均称为相对于宿主细胞的“异源序列”或“异源基因”。即使待引入的序列或待引入的基因与宿主细胞的内源序列或内源基因一致，此定义亦适用。举例而言，引入仓鼠宿主细胞中的仓鼠肌动蛋白基因根据定义为异源基因。

根据本发明，优选为已经本文中所述的本发明的表达载体之一转染的重组哺乳动物细胞，优选啮齿动物细胞，最佳仓鼠细胞，诸如CHO或BHK细胞。

在异质蛋白质(诸如单克隆抗体(mAb))的重组制备中，转染适当宿主细胞理论上可通过两种不同的方法来进行。此类mAb由大量亚单元重链及轻链组成。可使编码此等亚单元的基因容纳于单一质粒上的独立转录单元或多顺反子转录单元中，接着用该质粒转染宿主细胞。此举旨在确保整合至宿主细胞的基因组中后的基因的化学计量代表。然而，在独立转录单元的情况下，必须因此确保编码不同蛋白质的mRNA表现出相同的稳定性以及转录及翻译效率。在第二种情况下，基因的表达在多顺反子转录单元内藉助于单一启动子而发生，且仅形成一种转录物。通过使用IRES元件，在第二顺反子及后续顺反子中获得高效基因内部翻译起始。然而，此等顺反子的表达率比第一顺反子的表达率低，第一顺反子的翻译起始藉助于所谓的“帽”依赖性起始前复合体而大体上比IRES依赖性翻译起始更有效。为达成顺反子的真正等摩尔表达，例如可引入与IRES元件一起确保均一表达率的其他顺反子间元件(WO 94/05785)。

根据本发明制备多种异源蛋白质的一种其它可能性是连续转染，其中整合在不同表达载体中的基因在时间上分开转染。例如，抗体的重链和轻链在两步转染步骤中先后引入细胞。

根据本发明优选的另一种同时产生多种异源蛋白的可能方法为共转染，其中将基因单独整合至不同的表达载体中。此方法的优点在于可调节基因与基因产物彼此的特定比例，从而消除mRNA稳定性及转录及翻译效率方面的任何差异。此外，表达载体因尺寸小而更为稳定且在克隆期间与转染期间更易于操控。

因此，在本发明的一特定实施例中，另外用一或多个具有编码一或多种其他目的蛋白质的基因的载体转染(优选共转染)宿主细胞。用于共转染的其他载体(例如)在相同启动子控制下，优选在相同启动子/增强子组合控制下，或尤其优选在相同启动子/增强子/TE元件组合控制下，或在相同启动子/增强子组合与不同TE元件控制下编码其他目的蛋白质，以及编码至少一种可选择标记，例如二氢叶酸还原酶。在本发明的另一实施例中，用于转染的载体可含有一或多个任何组合、位置及取向的TE元件。

在本发明的另一特定实施例中，将宿主细胞用至少两个真核表达载体共转染，该两个载体中的至少一者含有至少一种编码至少目的蛋白质的基因，而另一载体含有一或多个任何组合、位置及取向的本发明的核酸且视情况亦编码至少一种目的基因，且此等本发明的核酸通过与另一载体共整合将其转录增强活性或表达增强活性赋予位于另一共转染载体上的目的基因。

根据本发明，优选在无血清条件下，任选在不含动物蛋白质/肽的培养基中建立、调适及培养宿主细胞。市售培养基的实例包括Ham’s F12(Sigma，Deisenhofen，DE)、RPMI-1640(Sigma)、Dulbecco’s经改良Eagle’s培养基(DMEM；Sigma)、最低必需培养基(MEM；Sigma)、Iscove’s经改良Dulbecco’s培养基(IMDM；Sigma)、CD-CHO(Invitrogen，Carlsbad，CA，USA)、CHO-S-SFMII(Invitrogen)、无血清CHO-培养基(Sigma)及无蛋白质CHO-培养基(Sigma)。此等培养基各自可视情况补充有多种化合物，例如激素和/或其他生长因子(例如胰岛素、运铁蛋白、表皮生长因子、胰岛素样生长因子)、盐(例如氯化钠、钙盐、镁盐、磷酸盐)、缓冲液(例如HEPES)、核苷(例如腺苷、胸苷)、谷氨酰胺、葡萄糖或其他等效营养物、抗生素和/或痕量元素。尽管根据本发明无血清的培养基优选，但亦可使用已混有适量血清的培养基培养宿主细胞。为选择表达一或多种可选择标记基因的经基因修饰的细胞，可将一或多种选择剂添加至培养基中。

术语“选择剂”是指一种影响缺乏所述可选择标记基因的宿主细胞的生长或存活的物质。在本发明的范围内，优选使用遗传霉素(geneticin)(G418)作为培养基添加剂用于选择带有野生型或优选经修饰的新霉素磷酸转移酶基因的异源宿主细胞。培养基中的所用G418浓度优选介于100与800μg/mL之间，最佳为200至400微克G418/毫升培养基。若将用多种表达载体转染宿主细胞，例如若将数种目的基因单独引入宿主细胞中，则其通常具有不同的可选择标记基因。

可选择标记基因是一种使得可通过向培养基中添加相应选择剂来特定选择含有此基因的细胞的基因。举例而言，可使用抗生素耐性基因作为阳性可选择标记。仅已经此基因转化的细胞能够在相应抗生素存在下生长且从而得以选择。另一方面，未经转化的细胞不能在此等选择条件下生长或存活。存在阳性、阴性及双功能性可选择标记。阳性可选择标记通过赋予选择剂耐性或通过弥补宿主细胞中的新陈代谢或分解代谢缺陷而允许选择且由此富集经转化的细胞。相比之下，接收阴性可选择标记的基因的细胞可经由阴性可选择标记被选择性清除。其实例为单纯疱疹型病毒的胸苷激酶基因，同时添加阿昔洛韦(acyclovir)或更昔洛韦(gancyclovir)时该基因在细胞中表达可导致清除该等细胞。本发明中所使用的可选择标记(包括可扩增的可选择标记)包括经基因修饰的突变体及变异体、片段、功能等效物、衍生物、同源物及与其他蛋白质或肽的融合体，其限制条件为可选择标记保留其选择特性。该等衍生物在被认为具有选择性的区域或结构域的氨基酸序列中展现相当大的同源性。文献中描述了大量的可选择标记基因，包括双功能(阳性/阴性)标记(例如参见WO 92/08796及WO 94/28143)。通常用于真核细胞中的可选择标记的实例包括氨基糖苷磷酸转移酶(APH)、潮霉素磷酸转移酶(HYG)、二氢叶酸还原酶(DHFR)、胸苷激酶(TK)、谷氨酰胺合成酶、天冬酰胺合成酶的基因以赋予新霉素(G418)、嘌呤霉素(puromycin)、组氨醇D、博莱霉素(bleomycin)、腐草霉素(phleomycin)及争光霉素(zeocin)耐性的基因。

术语“经修饰的新霉素磷酸转移酶”(NPT)涵盖WO 2004/050884中所述的所有突变体，尤其是突变体D227G(Asp227Gly)，其特征为氨基酸位置227处的天冬氨酸(Asp，D)被甘氨酸(Gly，G)取代；且尤其优选为突变体F240I(Phe240Ile)，其特征为氨基酸位置240处的苯丙氨酸(Phe，F)被异亮氨酸(Ile，I)取代。

因此，本发明包括一种制备及选择重组哺乳动物细胞的方法，其包含以下步骤：(i)用编码至少一种目的蛋白质/产物及新霉素磷酸转移酶(优选经修饰)的基因转染宿主细胞，其中为增强转录或表达，使至少目的基因与至少一个TE元件在功能上连接；(ii)在能够使不同基因得到表达的条件下培养该等细胞；及(iii)通过在诸如G418的选择剂存在下培养该等细胞来选择此等经共整合的基因。优选地，在无血清的培养基中培养经转染的细胞。优选地，G418的浓度为至少200μg/mL。然而，浓度亦可为至少400μg/mL。

可扩增的可选择标记基因：

此外，本发明的细胞亦可视情况经历一或多个基因扩增步骤，其中将其在可使得可扩增的可选择标记基因扩增的选择剂存在下培养。

先决条件为宿主细胞另外经编码可扩增的可选择标记的基因转染。可使编码可扩增的可选择标记的基因存在于本发明的表达载体之一上或藉助于另一载体引入宿主细胞中。

可扩增的可选择标记基因通常编码真核细胞在特定培养条件下生长所需的酶。举例而言，可扩增的可选择标记基因可编码二氢叶酸还原酶(DHFR)。在此情况下，若在选择剂甲氨蝶呤(MTX)存在下培养用此基因转染的宿主细胞，则此基因可扩增。

下表2提供可根据本发明使用的其他可扩增的可选择标记基因及相关选择剂的实例，其描述于Kaufman，Methods in Enzymology，185：537-566(1990)的综述中。

表2：可扩增的可选择标记基因

可扩增的可选择标记基因	保藏编号	选择剂
可扩增的可选择标记基因	保藏编号	选择剂	二氢叶酸还原酶	M19869(仓鼠)E00236(小鼠)	甲氨蝶呤(MTX)
金属硫蛋白	D10551(仓鼠)M13003(人类)M11794(大鼠)	镉	二氢叶酸还原酶	M19869(仓鼠)E00236(小鼠)	甲氨蝶呤(MTX)
金属硫蛋白	D10551(仓鼠)M13003(人类)M11794(大鼠)	镉	CAD(氨甲酰基磷酸合成	M23652(仓鼠)	N-磷酸乙酰基-L-天冬

酶：天冬氨酸氨甲酰基转移酶：二氢乳清酸酶)	D78586(人类)	氨酸
酶：天冬氨酸氨甲酰基转移酶：二氢乳清酸酶)	D78586(人类)	氨酸	腺苷脱氨酶	K02567(人类)M10319(小鼠)	Xyl-A-或腺苷，2’去氧助间型霉素(2'deoxycoformycin
AMP(腺苷酸)脱氨酶	D12775(人类)J02811(大鼠)	腺嘌呤，偶氮丝氨酸，助间型霉素	腺苷脱氨酶	K02567(人类)M10319(小鼠)	Xyl-A-或腺苷，2’去氧助间型霉素(2'deoxycoformycin
AMP(腺苷酸)脱氨酶	D12775(人类)J02811(大鼠)	腺嘌呤，偶氮丝氨酸，助间型霉素	UMP合酶	J03626(人类)	6-氮杂尿苷，吡唑并呋喃
IMP 5’-脱氢酶	J04209(仓鼠)J04208(人类)M33934(小鼠)	霉酚酸	UMP合酶	J03626(人类)	6-氮杂尿苷，吡唑并呋喃
IMP 5’-脱氢酶	J04209(仓鼠)J04208(人类)M33934(小鼠)	霉酚酸	黄嘌呤-鸟嘌呤-磷酸核糖基转移酶	X00221(大肠杆菌(E.coli))	霉酚酸与限制性黄嘌呤
突变体次黄嘌呤转磷酸核糖基酶(HGPRTase)或突变体胸苷激酶	J00060(仓鼠)M13542，K02581(人类)J00423，M68489(小鼠)M63983(大鼠)M36160(疱疹病毒)	次黄嘌呤，氨基蝶呤及胸苷(HAT)	黄嘌呤-鸟嘌呤-磷酸核糖基转移酶	X00221(大肠杆菌(E.coli))	霉酚酸与限制性黄嘌呤
突变体次黄嘌呤转磷酸核糖基酶(HGPRTase)或突变体胸苷激酶		次黄嘌呤，氨基蝶呤及胸苷(HAT)	胸苷酸合成酶	D00596(人类)M13019(小鼠)L12138(大鼠)	5-氟脱氧尿苷
P-糖蛋白170(MDR1)	AF016535(人类)J03398(小鼠)	数种药物，例如阿霉素(adriamycin)、长春新碱(vicristin)、秋水仙碱(colchicine)	胸苷酸合成酶	D00596(人类)M13019(小鼠)L12138(大鼠)	5-氟脱氧尿苷
P-糖蛋白170(MDR1)	AF016535(人类)J03398(小鼠)	数种药物，例如阿霉素(adriamycin)、长春新碱(vicristin)、秋水仙碱(colchicine)	核糖核苷酸还原酶	M124223，K02927(小鼠)	阿非迪霉素(aphidicoline)
谷氨酰胺合成酶	AF150961(仓鼠)U09114，M60803(小鼠)M29579(大鼠)	甲硫氨酸磺基肟(methioninesulfoximine)(MSX)	核糖核苷酸还原酶	M124223，K02927(小鼠)	阿非迪霉素(aphidicoline)

天冬酰胺合酶	M27838(仓鼠)M27396(人类)U38940(小鼠)U07202(大鼠)	β-天冬酰基异羟肟酸(β-aspartylhydroxamate)，脲基丙氨酸，5’氮杂胞苷
天冬酰胺合酶	M27838(仓鼠)M27396(人类)U38940(小鼠)U07202(大鼠)	β-天冬酰基异羟肟酸(β-aspartylhydroxamate)，脲基丙氨酸，5’氮杂胞苷	精氨基琥珀酸合酶	X01630(人类)M31690(小鼠)M26198(牛)	刀豆氨酸(canavanin)
鸟氨酸脱羧酶	M34158(人类)J03733(小鼠)M16982(大鼠)	α-二氟甲基鸟氨酸	精氨基琥珀酸合酶	X01630(人类)M31690(小鼠)M26198(牛)	刀豆氨酸(canavanin)
鸟氨酸脱羧酶	M34158(人类)J03733(小鼠)M16982(大鼠)	α-二氟甲基鸟氨酸	HMG-CoA还原酶	L00183，M12705(仓鼠)M11058(人类)	康百汀(compactin)
N-乙酰氨基葡萄糖转移酶	M55621(人类)	衣霉素(tunicamycin)	HMG-CoA还原酶	L00183，M12705(仓鼠)M11058(人类)	康百汀(compactin)
N-乙酰氨基葡萄糖转移酶	M55621(人类)	衣霉素(tunicamycin)	苏氨酰基-tRNA合成酶	M63180(人类)	疏螺体素(borrelidin)
Na⁺K⁺-ATP酶	J05096(人类)M14511(大鼠)	哇巴因(ouabain)	苏氨酰基-tRNA合成酶	M63180(人类)	疏螺体素(borrelidin)

根据本发明，所用的可扩增的可选择标记基因优选为编码具有DHFR功能的多肽的基因，例如编码DHFR的基因或编码荧光蛋白与DHFR的融合蛋白的基因。DHFR为生物合成嘌呤所必需的。缺乏DHFR基因的细胞不能生长于缺乏嘌呤的培养基中。因此，DHFR基因为适用于选择及扩增在无嘌呤的培养基中培养的细胞中的基因的可选择标记。与DHFR基因一起使用的选择性培养基为甲氨蝶呤(MTX)。

哺乳动物细胞(优选小鼠骨髓瘤及仓鼠细胞)为对于使用DHFR作为可扩增的可选择标记而言的优选宿主细胞。细胞系CHO-DUKX(ATCCCRL-9096)及CHO-DG44(Urlaub等人，1983)尤其优选，因为其因突变而本身不具有DHFR活性。为能够亦在具有自身内源DHFR活性的其他细胞类型中利用DHFR诱导的扩增，可在转染过程中使用编码对甲氨蝶呤具有低敏感性的蛋白质的突变DHFR基因(Simonson等人，1983；Wigler等人，1980；Haber等人，1982)。

当使用DHFR阴性基本细胞(诸如CHO-DG44或CHO-DUKX)时，DHFR标记尤其适用于选择及后续扩增，因为此等细胞不表达内源DHFR且从而不能生长于无嘌呤的培养基中。因此，在此可使用DHFR基因作为主导选择标记且在无次黄嘌呤/胸苷的培养基中选择所转化的细胞。

因此，本发明包括一种制备及选择重组哺乳动物细胞的方法，其包含以下步骤：(i)用编码至少一种目的蛋白质/产物及可扩增的可选择标记DHFR的基因转染宿主细胞，其中为增强转录或表达，使至少目的基因与至少一个TE元件在功能上连接；(ii)在能够使不同基因得到表达的条件下培养该等细胞；及(iii)通过在使得至少可扩增的可选择标记基因可扩增的选择剂(诸如甲氨蝶呤)存在下培养该等细胞来使此等经共整合的基因扩增。优选地，在无血清存在下在无次黄嘌呤/胸苷的培养基中且添加递增浓度的MTX来培养经转染的细胞。优选地，第一扩增步骤中MTX的浓度为至少100nM。然而，MTX的浓度亦可为至少250nM且可逐步增至1μM。在个别情况下，亦可使用超过1μM的浓度，例如2μM。

本发明亦包括一种制备及选择重组哺乳动物细胞的方法，其包含以下步骤：(i)用编码至少一种目的蛋白质/产物、新霉素磷酸转移酶(优选经修饰)及可扩增的可选择标记DHFR的基因转染宿主细胞，其中为增强转录或表达，使至少目的基因与至少一个TE元件在功能上连接；(ii)在能够使不同基因得到表达的条件下培养该等细胞；(iii)通过在诸如G418的选择剂存在下在无次黄嘌呤/胸苷的培养基中培养该等细胞培养来选择此等经共整合的基因；及(iv)通过在使得至少可扩增的可选择标记基因可扩增的选择剂(诸如甲氨蝶呤)存在下培养该等细胞来使此等经共整合的基因扩增。优选地，在无血清存在下在补充有至少200μg/mL G418，优选400μg/mL或甚至更多G418的无次黄嘌呤/胸苷的培养基中且添加递增浓度的MTX来培养经转染的细胞。优选地，第一扩增步骤中MTX的浓度为至少100nM。然而，MTX的浓度亦可为至少250nM且可逐步增至1μM。在个别情况下，亦可使用超过1μM的浓度，例如2μM。

亦可通过荧光活化细胞分选(FACS)选择所转化的细胞。对此，可使用细菌β-半乳糖苷酶、细胞表面标记或荧光蛋白(例如，自水母及海肾或其他物种获得的绿色荧光蛋白(GFP)及其变异体；自非生物发光生物体，诸如圆盘拟珊瑚海葵、海葵(Anemonia sp.)、羽珊瑚、花群海葵、青色多管水母获得的红色荧光蛋白及发出其他颜色荧光的蛋白质及其变异体)选择所转化的细胞。

基因表达及高产宿主细胞的选择：

术语基因表达是指异源基因序列在宿主细胞中的转录和/或翻译。表达率通常可基于存在于宿主细胞中的相应mRNA的量或基于由目的基因编码所产生的基因产物的量来测定。所选核苷酸序列经转录而产生的mRNA的量可(例如)通过Northern印迹杂交、核糖核酸酶-RNA-保护、细胞RNA的原位杂交或通过PCR方法(例如定量PCR)来测定(Sambrook等人，1989；Ausubel等人，1994)。由所选核苷酸序列编码的蛋白质亦可通过多种方法来测定，诸如ELISA、蛋白质A HPLC、Western印迹、放射免疫测定、免疫沉淀、检测蛋白质的生物活性、先将蛋白质免疫染色再执行FACS分析或荧光显微法、通过FACS分析或荧光显微法直接检测荧光蛋白(Sambrook等人，1989；Ausubel等人，1994)。此等方法可用以(例如)研究本发明的SEQ ID No.1的TE元件或其任何部分、片段或区域或其衍生物或组合是否可使得目的基因的转录或表达增加。

“表达、转录或产率增强”意谓与对照相比，引入宿主细胞内的异源序列(例如编码治疗性蛋白质的基因)的表达或合成增强。若通过本文中所述的本发明的方法培养本发明的细胞且若此细胞比产率升高至1.3倍或1.5倍或优选具有两倍的比产率，则存在表达、转录或产率的增强。若本发明的细胞具有至少三倍的比产率，则亦存在表达、转录或产率的增强。若本发明的细胞具有至少四倍的比产率，则存在表达、转录或产率的显著增强。若本发明的细胞具有至少五倍的比产率，则存在表达、转录或产率的显著增强。若本发明的细胞具有至少六倍的比产率，则存在表达、转录或产率的显著增强。若本发明的细胞具有至少七倍的比产率，则存在表达、转录或产率的显著增强。

可通过使用本发明的的表达载体之一且使用本发明的方法之一达成增强的表达、转录或产率。

可将相应方法与经FACS辅助的对重组宿主细胞的选择相组合，该等宿主细胞含有作为额外可选择标记的一或多种荧光蛋白(例如GFP)或细胞表面标记。其他用于获得表达增加的方法(其中也可能使用不同方法的组合)例如基于使用操控染色体结构的顺式活性元件(例如LCR、UCOE、EASE、隔离子、S/MAR、STAR元件)，基于使用(人造)转录因子，用天然或合成药剂处理细胞以上调内源或异源基因表达，改良mRNA或蛋白质的稳定性(半衰期)，改良mRNA翻译的起始，通过使用游离型质粒增加基因剂量(基于使用病毒序列作为复制起点，例如SV40、多瘤病毒、腺病毒、EBV或BPV)，使用扩增促进序列(Hemann等人，1994)或基于DNA多联体的活体外扩增系统(Monaco等人，1996)。

因此，在另一实施例中，本发明亦是关于用于获得及选择表达至少一种目的异源基因的重组哺乳动物细胞的方法，且该方法的特征在于：(i)将重组哺乳动物细胞用本发明的表达载体及可扩增的可选择标记基因转染；(ii)将该等哺乳动物细胞在使得目的基因、经修饰的新霉素磷酸转移酶基因及编码荧光蛋白的基因可表达的条件下培养；(iii)在至少一种选择性作用于哺乳动物细胞的生长且使表达新霉素磷酸转移酶基因的那些细胞优先生长的选择剂存在下培养该等哺乳动物细胞；(iv)通过流式细胞分析分选荧光蛋白呈高表达的哺乳动物细胞；(v)将分选出的细胞在可扩增的可选择标记基因可表达的条件下培养；及(vi)将使可扩增的可选择标记基因扩增的选择剂添加至培养基中。

根据本发明，将制造性细胞复制且用以制备目的编码基因产物的方法亦优选。为此，优选将所选高产细胞在使得目的基因可表达的条件下培养于无血清的培养基中且优选培养于悬浮液培养物中。目的蛋白质/产物优选是以分泌型基因产物的形式自细胞培养基获得。然而，若蛋白质是在无分泌信号的情况下表达，则亦可自细胞溶胞物中分离基因产物。为获得大体上不含其他重组蛋白及宿主细胞蛋白的纯均质产物，可执行常规纯化程序。首先，将细胞及细胞碎片自培养基或溶胞物中移除。接着，可自所要基因产物中除去污染性可溶蛋白质、多肽及核酸，例如通过免疫亲和柱及离子交换柱分馏、乙醇沉淀、逆相HPLC或葡聚糖凝胶、二氧化硅或阳离子交换树脂(诸如DEAE)层析进行分离。可用以纯化由重组宿主细胞表达的异源蛋白质的方法已为本领域技术人员所知且已描述于文献中，例如Harris等人，1995及Scopes 1988。

本发明的组合物

本发明是关于一种核酸，其含有TE-13(SEQ ID No.15)或TE-13(SEQID No.15)的片段或它们的互补核苷酸序列、或含有TE-13(SEQ ID No.15)的衍生物或其片段或它们的互补核苷酸序列，且在经染色体整合后可使得表达系统中目的基因的转录或表达增加。

本发明是关于一种核酸，其含有TE-13(SEQ ID No.15)或TE-13(SEQID No.15)的片段或它们的互补核苷酸序列，或含有TE-13(SEQ ID No.15)的衍生物或其片段或它们的互补核苷酸序列，且在经染色体整合后可使得表达系统中目的基因的转录或表达增加，其限制条件为该片段或衍生物包含至少一个来自介于1bp与1578bp之间(相对于SEQ ID No.01)的核酸区域中的序列区域。这里所说的序列区域是指至少10bp、15bp、20bp、50bp、100bp的核酸区域。

本发明是关于一种核酸，其含有TE-13(SEQ ID No.15)或TE-13(SEQID No.15)的片段或它们的互补核苷酸序列，或含有TE-13(SEQ ID No.15)的衍生物或其片段或它们的互补核苷酸序列，且在经染色体整合后可使得表达系统中目的基因的转录或表达增加，其限制条件为该片段或衍生物包含至少一个TE-09(SEQ ID No.11)或TE-08(SEQ ID No.10)或TE-13(SEQID No.15)中的序列区。序列区同样意谓至少10bp、15bp、20bp、50bp、100bp的核酸区。

目的基因的表达增强可(例如)通过以ELISA测量产物滴度来测量。

在一优选实施例中，本发明是关于一种核酸，其含有TE-08(SEQ ID No.10)或TE-08(SEQ ID No.10)的片段或它们的互补核苷酸序列，或含有TE-08(SEQ ID No.10)的衍生物或其片段或它们的互补核苷酸序列，且在经染色体整合后可使得表达系统中目的基因的转录或表达增加。

在上述本发明的核酸的一优选实施例中，限制条件为该片段或衍生物必须亦包括至少一个来自介于1bp与1578bp之间(相对于SEQ ID No.01)的核酸区中的序列区。

在上述本发明的核酸的一尤其优选实施例中，限制条件为该片段或衍生物亦包括至少一个TE-09(SEQ ID No.11)或TE-08(SEQ ID No.11)或TE-13(SEQ ID No.15)中的序列区。序列区在此意谓至少10bp、15bp、20bp、50bp、100bp的核酸区。

在另一实施例中，本发明是关于一种核酸，其含有SEQ ID No.1或SEQ ID No.1的片段或它们的互补核苷酸序列，或含有SEQ ID No.1的衍生物或其片段或它们的互补核苷酸序列，其在经染色体整合后可使得表达系统中目的基因的转录或表达增加。

在上述本发明的核酸的一优选实施例中，限制条件为该片段或衍生物亦包含至少一个来自介于1bp与1578bp之间(相对于SEQ ID No.01)的核酸区中的序列区。

在上述本发明的核酸的一尤其优选实施例中，限制条件为该片段或衍生物亦包含至少一个TE-09(SEQ ID No.11)或TE-08(SEQ ID No.11)或TE-13(SEQ ID No.15)中的序列区。序列区意谓至少10bp、15bp、20bp、50bp、100bp的核酸区。

本发明亦是关于一种用于增加目的基因的转录或表达的具有SEQ IDNo.1的核酸(＝TE元件)或其片段或其衍生物或它们的互补核苷酸序列，其可使得目的基因的转录或表达增加。

目的基因的表达增加可(例如)通过以ELISA测量产物滴度来测量。

本发明尤其是关于在严格条件下与以下各物质杂交的本发明的核酸：

(a)核酸序列TE-13(SEQ ID No.15)或TE-08(SEQ ID No.10)的区域，或

(b)TE-13或TE-08的互补核酸序列，或

(c)与(a)或(b)具有至少约70％序列同一性的核酸序列，优选至少约80％序列同一性或至少约85％序列同一性，最佳至少约90％序列同一性且最佳至少约95％序列同一性。

在一特定实施例中，本发明的核酸具有至少511bp的长度(＝SEQ ID No.15TE-13的长度)或至少1015bp的长度(＝SEQ ID No.10TE-08的长度)。

在一优选实施例中，本发明是关于TE元件TE-00(SEQ ID No.2)的5’片段。此片段对应于SEQ ID No.1中介于1bp与1578bp之间的部分或该部分的互补核苷酸序列。

本发明尤其是关于一种核酸或一种转录增强或表达增强核酸元件(TE元件)，其含有TE-13(SEQ ID No.15)或TE-08(SEQ ID No.10)或其衍生物或它们的互补核苷酸序列，其在经染色体整合后可使得目的基因的转录或表达增加。

本发明优选是关于一种经分离的核酸或经分离的核酸分子或经分离的核酸序列或经分离的转录增强核酸元件或经分离的TE元件。

本发明尤其是关于一种经分离的核酸，其含有TE-08(SEQ ID No.10)或其互补核苷酸序列且在经染色体整合后可使得表达系统中目的基因的转录或表达增加。

在一实施例中，该核酸或转录增强核酸单元或经分离的核酸含有TE元件或SEQ ID No.1的衍生物，其与TE元件序列或其互补序列的相应部分，尤其与相对于SEQ ID No.1的核苷酸位置1bp与1578bp之间的序列区(对应于TE-00序列的5’序列区)，且尤其优选与TE-13(SEQ ID No.15)或TE-08(SEQ ID No.10)具有至少约70％的序列同一性，优选至少约80％的序列同一性或至少约85％的序列同一性，最佳至少约90％的序列同一性且最佳至少约95％的序列同一性。

在一优选实施例中，该核酸或转录增强核酸元件或经分离的核酸含有TE-08核酸(SEQ ID No.10)的衍生物或优选TE-13核酸(SEQ ID No.15)的衍生物，其与TE元件序列或其互补序列的相应部分具有至少约70％的序列同一性，优选至少约80％的序列同一性或至少约85％的序列同一性，最佳至少约90％的序列同一性且最佳至少约95％的序列同一性。

在另一实施例中，本发明是关于一种核酸或转录增强核酸元件或经分离的核酸或TE元件的衍生物，其与TE元件的序列或与TE元件的互补序列，尤其与相对于SEQ ID No.1的核苷酸位置1bp与1578bp之间的序列区(对应于TE-00序列(SEQ ID No 2)的5’序列区)杂交，或尤其与TE-08元件(SEQ ID No.10)杂交。杂交优选在严格杂交及洗涤条件下进行。

在另一优选实施例中，本发明的核酸或转录增强元件(TE元件)是选自：TE-00(SEQ ID No.2)、TE-01(SEQ ID No.3)、TE-02(SEQ ID No.4)、TE-03(SEQ ID No.5)、TE-04(SEQ ID No.6)、TE-06(SEQ ID No.8)、TE-07(SEQ IDNo.9)、TE-08(SEQ ID No.10)、TE-10(SEQ ID No.12)、TE-11(SEQ ID No.13)、TE-12(SEQ ID No.14)、TE-13(SEQ ID No.15)、TE-14(SEQ ID No.16)、TE-15(SEQ ID No.17)、TE-16(SEQ ID No.18)、TE-17(SEQ ID No.19)、TE-18(SEQ ID No.20)及TE-21(SEQ ID No.21)。

在另一实施例中，该核酸或转录增强元件(TE元件)的特征在于该核酸为TE-00(SEQ ID No.2)、TE-06(SEQ ID No.8)、TE-10(SEQ ID No.12)、TE-11(SEQ ID No.13)或TE-12(SEQ ID No.14)，优选为TE-06(SEQ ID No.8)。

在一优选实施例中，该核酸或转录增强元件(TE元件)的特征在于该核酸为TE-01(SEQ ID No.3)、TE-02(SEQ ID No.4)、TE-03(SEQ ID No.5)、TE-07(SEQ ID No.9)、TE-08(SEQ ID No.10)。

在一尤其优选实施例中，该核酸或转录增强元件(TE元件)为TE-08(SEQ ID No.10)。

在一尤其优选实施例中，该核酸或转录增强元件(TE元件)为TE-18(SEQ ID No.20)。

在另一实施例中，该核酸或转录增强元件(TE元件)的特征在于其为TE-01(SEQ ID No.3)的片段或衍生物，优选为TE-13(SEQ ID No.15)、TE-14(SEQ ID No.16)、TE-15(SEQ ID No.17)、TE-16(SEQ ID No.18)、TE-17(SEQID No.19)、TE-18(SEQ ID No.20)。

在一优选实施例中，本发明的核酸为TE-13(SEQ ID No.15)。

在另一实施例中，本发明的核酸或片段或衍生物为经分离的核酸。

本发明亦是关于如权利要求1至12项中任一项的本发明的核酸，其特征在于含有以下序列的核酸是与异源序列连接：TE-13(SEQ ID No.15)或TE-08(SEQ ID No.10)或TE-07(SEQ ID No.9)或TE-06(SEQ ID No.8)，或此等序列的片段或它们的互补核苷酸序列，或此等序列的衍生物或此等序列的片段的衍生物，优选为TE-13(SEQ ID No.15)或TE-08(SEQ ID No.10)或此等序列的片段或此等序列的衍生物或此等序列的片段的衍生物或它们的互补核苷酸序列。

在一优选实施例中，与异源基因序列连接的核酸可为表达载体，例如质粒、噬菌体、噬菌粒、粘粒、病毒载体或尤其是靶向载体。

然而，与异源基因序列连接的核酸亦可为其他任何合成核酸分子，诸如合成、人造或微型染色体。

本发明进一步是关于一种真核表达载体，其特征在于此表达载体含有一或多个本发明的核酸或一或多个本发明的转录增强元件(TE元件)。

在一特定实施例中，该真核表达载体的特征在于其含有启动子和/或目的异源基因和/或可选择标记和/或任选增强子。

本发明进一步是关于一种真核表达载体，其特征在于此表达载体含有一或多个本发明的核酸或一或多个转录增强元件(TE元件)及启动子和/或目的异源基因和/或可选择标记和/或任选增强子。

在另一实施例中，该真核表达载体的特征在于其为用于有目的地整合目的基因的靶向载体。

在一优选实施例中，该真核表达载体的特征在于该启动子为异源启动子，诸如人类巨细胞病毒的早期启动子(CMV启动子)、SV40早期启动子、腺病毒主要晚期启动子、小鼠金属硫蛋白-I启动子、劳斯肉瘤病毒的长末端重复区、肌动蛋白启动子、免疫球蛋白或热休克启动子，优选为CMV启动子。

在另一优选实施例中，该真核表达载体的特征在于该启动子为异源启动子，优选为遍在蛋白/S27a启动子，最佳为仓鼠遍在蛋白/S27a启动子。

在一特定实施例中，该真核表达载体的特征在于其含有数个相同或不同的彼此间呈任何取向的本发明的核酸或TE元件的组合，其中一或多个核酸或TE元件位于目的基因之前(亦即其5’侧)且/或一或多个核酸或TE元件位于目的基因之后(亦即其3’侧)。

在一优选实施例中，该真核表达载体的特征在于经组合的核酸或TE元件为TE-06(SEQ ID No.8)且尤其优选为TE-08(SEQ ID No.10)。

优选的核酸或TE元件的组合为一个TE-06元件(SEQ ID No.8)位于目的基因之前(亦即其5’侧)且一个TE-06元件(SEQ ID No.8)位于目的基因之后(亦即其3’侧)，以及3个TE-06元件(SEQ ID No.8)位于目的基因之后(亦即其3’侧)(亦参见图13)。

在一尤其优选实施例中，该真核表达载体的特征在于一或多个TE-08核酸或元件(SEQ ID No.10)位于目的基因之前(亦即其5’侧)且一或多个TE-08元件位于目的基因之后(亦即其3’侧)，优选为一个TE-08元件(SEQ IDNo.10)在前且一个在后(亦参见图13)。

其他优选的TE核酸或元件的组合为两个TE-08核酸/元件(SEQ ID No.10)位于目的基因之前和/或之后。

在另一实施例中，该真核表达载体的特征在于多个(优选为3个)TE-06核酸或元件(SEQ ID No.8)位于目的基因之后(亦即其3’侧)(参见图13)。

在一优选实施例中，该真核表达载体的特征在于一或多个TE-08核酸或元件(SEQ ID No.10)与一或多个TE-06核酸或元件(SEQ ID No.8)的组合位于目的基因之前(亦即其5’侧)和/或之后(亦即其3’侧)，优选组合为TE-08核酸或元件(SEQ ID No.10)与其后的TE-06核酸或元件(SEQ ID No.8)的组合位于目的基因之前(亦即其5’侧)(亦参见图13)。

在一优选实施例中，该真核表达载体的特征在于其另外含有整合酶。

在另一优选实施例中，将宿主细胞用至少两个真核表达载体共转染，而该两个载体中的至少一者含有至少一种编码至少一种目的蛋白质的基因，且另一载体含有一或多个任何组合、位置及取向的本发明的核酸且视情况亦编码至少一种目的基因，且通过与另一载体共整合此等本发明的核酸将其转录增强作用或表达增强作用赋予位于另一共转染载体上的目的基因。

在一特定实施例中，该真核表达载体的特征在于可选择标记为DHFR或Neo，例如Neo F240I。

本发明进一步是关于一种制备真核表达载体的方法，其特征为将本发明的核酸整合至表达载体中。

本发明进一步是关于一种真核宿主细胞，其特征在于其含有本发明的真核表达载体。

在一特定实施例中，该真核宿主细胞的特征在于其为高产者，亦即其比产率高于无本发明的TE元件或核酸的对等真核宿主细胞，此宿主细胞的表达量可增加至两倍、三倍、四倍、五倍、六倍、七倍或十倍，或增加至两倍以上、三倍以上、四倍以上、五倍以上、七倍以上或十倍以上，优选为达到五倍或达到三倍以上。

在一尤其优选实施例中，该真核宿主细胞的特征在于表达载体是稳定地整合至基因组中。

在另一实施例中，该真核宿主细胞为仓鼠或小鼠细胞，诸如CHO、NS0、Sp2/0-Ag14、BHK21、BHK TK^-、HaK、2254-62.2(BHK-21衍生物)、CHO-K1、CHO-DUKX(＝CHO duk^-、CHO/dhfr^-)、CHO-DUKX B1、CHO-DG44、CHOPro-5、V79、B14AF28-G3、CHL细胞，优选为CHO细胞且尤其优选为CHO-DG44细胞。

在另一实施例中，该真核宿主细胞为哺乳动物细胞，包括(但不限于)人类、小鼠、大鼠、猴或啮齿动物细胞系。

在另一实施例中，该宿主细胞为真核细胞，包括(但不限于)酵母、昆虫、鸟类及植物细胞。

在另一特定实施例中，该真核宿主细胞的特征在于其另外含有抗细胞凋亡基因，诸如BCL-xL、BCL-2、BCL-w、BFL-1、A1、MCL-1、BOO、BRAG-1、NR-13、CDN-1、CDN-2、CDN-3、BHRF-1、LMW5-HL或CED-9，优选为Bcl-xL或BCL-2，最佳为BCL-xL。

本发明进一步是关于一种发展经稳定转染的高产真核宿主细胞系的方法，该方法由以下步骤表征：

(a)将至少一个本发明的核酸或一个本发明的TE元件整合至含有目的基因的真核表达载体中；

(b)用此表达载体转染真核宿主细胞；

(c)选择经转染的高产宿主细胞。

(a)将目的基因整合至含有至少一个本发明的核酸或本发明的TE元件的真核表达载体中；

(b)用此表达载体转染真核宿主细胞；

(c)选择经转染的高产宿主细胞。

在一特定实施例中，该方法的特征在于还含有至少一个额外扩增步骤。

本发明亦是关于一种制备及选择重组哺乳动物细胞的方法，该方法由以下步骤表征：

(a)用编码至少目的蛋白质/产物、新霉素磷酸转移酶(优选经修饰)及可扩增的可选择标记DHFR的基因转染宿主细胞，其中为增强转录或表达，使至少目的基因与至少一个如权利要求1至14中任一项的核酸在功能上连接；

(b)在能够使不同基因得到表达的条件下培养该等细胞；

(c)通过在诸如G418的选择剂存在下在无次黄嘌呤/胸苷的培养基中培养该等细胞来选择此等经共整合的基因，及

(d)通过在使得至少可扩增的可选择标记基因可扩增的选择剂(诸如甲氨蝶呤)存在下培养该等细胞来使此等经共整合的基因扩增。

在一特定实施例中，此方法的特征在于在无血清存在下在补充有至少200μg/mL G418，优选400μg/mL或更多G418的无次黄嘌呤/胸苷的培养基中且添加递增浓度的MTX来培养经转染的细胞。

在另一特定实施例中，此方法的特征在于第一扩增步骤中MTX的浓度为至少100nM或至少250nM且逐步增至1μM或1μM以上。在个别情况下，MTX浓度可为2μM。

在另一特定实施例中，此方法的特征在于额外的克隆步骤。

在本发明的方法的另一实施例中，宿主细胞为啮齿动物/仓鼠细胞，诸如CHO、NS0、Sp2/0-Ag14、BHK21、BHK TK^-、HaK、2254-62.2(BHK-21衍生物)、CHO-K1、CHO-DUKX(＝CHO duk^-、CHO/dhfr^-)、CHO-DUKX B1、CHO-DG44、CHO Pro-5、V79、B14AF28-G3、CHL细胞，优选为CHO细胞且尤其优选为CHO-DG44细胞。

在本发明的一优选方法中，表达载体含有可选择标记，诸如DHFR或NPT，例如NPT F240I或NPT D227G。

在本发明的方法的一尤其优选实施例中，高产者的比例可增加至两倍、三倍、四倍、五倍、六倍、七倍或十倍，或增加至两倍以上、三倍以上、四倍以上、五倍以上、七倍以上或十倍以上，优选为增加至五倍或增加至三倍以上。

本发明进一步是关于一种制备生物药产物的方法，该方法由以下步骤表征：

(b)用此表达载体转染真核宿主细胞；

(c)选择经转染的高产宿主细胞，及

(d)在使得目的基因可表达的条件下培养所获得的经转染的高产宿主细胞。

(a)将目的基因整合至含有至少一个本发明的核酸或一个本发明的TE元件的真核表达载体中；

(b)用此表达载体转染真核宿主细胞；

(c)选择经转染的高产宿主细胞，及

在一特定实施例中，本发明的方法的特征在于包含至少一个额外扩增步骤。

在一特定实施例中，本发明的方法的特征在于如下的额外步骤：

(e)收集并纯化目的蛋白质。

本发明进一步是关于本发明的核酸或本发明的转录增强元件(TE元件)于真核表达载体中的用途，其是用于增加在真核宿主细胞中表达系统中目的基因的转录或表达或用于制备生物药产物。

本发明亦是关于本发明的核酸或本发明的转录增强元件(TE元件)用于产生转基因动物或植物的用途。

本发明进一步是关于本发明的核酸或本发明的转录增强元件(TE元件)在基因治疗中的用途。

本发明尤其是关于本发明的核酸或本发明的转录增强元件(TE元件)作为药物或在药物组合物中的用途。

本发明进一步是关于一种试剂盒，其是由本发明的核酸或本发明的TE元件、任选表达载体、任选宿主细胞及任选转染试剂组成。

在一优选实施例中，本发明是关于一种核酸，特定言之为经分离的核酸，更确切言之为除TE元件TE-00(SEQ ID No.2)以外的具有SEQ ID No.1的转录增强或表达增强核酸元件(TE元件)或其片段或其衍生物，其在经染色体整合后可使得目的基因的转录或表达增加。

在另一实施例中，本发明是关于除TE元件TE-00(SEQ ID No.2)、TE-04(SEQ ID No.6)及TE-06(SEQ ID No.8)以外的本发明的核酸。

在另一实施例中，本发明是关于除TE元件TE-00(SEQ ID No.2)、TE-04(SEQ ID No.6)、TE-05(SEQ ID No.7)及TE-06(SEQ ID No.8)以外的本发明的核酸。

目的基因的表达增加可(例如)通过利用ELISA测量产物滴度来测量。

本发明的另一实施例是关于一种长度超过160bp，优选长度超过170bp的本发明的TE元件、片段或衍生物。在一特定实施例中，TE元件片段的长度介于160bp与1.2kb之间或介于170bp与1kb之间，优选超过200bp且介于200bp与1kb之间。

在一优选实施例中，TE元件片段位于SEQ ID No.1中介于1bp与1578bp之间的部分中(此片段对应于元件TE-00(SEQ ID No.2)的5’片段)且长度超过113bp或超过132bp且优选长度超过160bp或超过170bp。在一特定实施例中，TE元件片段的长度介于113bp与1.2kb之间、或介于132bp与1.2kb之间、或介于160bp与1.2kb之间，优选超过200bp且介于200bp与1kb之间。

在另一实施例中，TE元件片段不具有任何相邻序列。此意谓片段不是一个更大序列或序列区的一部分，例如在其前(5’侧)或其后(3’侧)无其他序列相连。

在另一特定实施例中，本发明是关于不含任何CpG岛的本发明的核酸。

由以下实验中可明显看出当将具有与不具有TE元件的真核宿主细胞相比较时，目的基因的比产率的相对变化可展示出增长至七倍。

总结有关产物滴度及比产率的资料显示，平均而言几乎所有具SEQ IDNo.1的片段或衍生物的TE元件的细胞池均比无TE元件的细胞池表达更多的目的基因。在两个独立转染系列中(各情况下使用不同的可选择标记(NPT或DHFR))，TE元件01(SEQ ID No.3)、02(SEQ ID No.4)及08(SEQ ID No.10)产生最高产率。其能够使产率增加至4至7倍。当然，3kb及2.5kb的TE元件01(SEQ ID No.3)及02(SEQ ID No.4)对于另外与表达载体连接而言非常大。另一方面，更令人感兴趣的是尺寸仅为1kb的TE元件08(SEQID No.10)，其能够使表达增加至5-6倍。TE元件06(SEQ ID No.8)在两个转染系列中产生三倍的比产率，该元件尺寸仅为381bp。由于较小载体通常更为稳定且更易于在克隆期间与转染期间处理，因此使表达载体尽可能的小是非常有利的。因此，使用TE-元件06(SEQ ID No.8)及08(SEQ ID No.10)以及13(SEQ ID No.15)作为转录促进元件尤其有利。

在下实施例亦显示含有TE元件3(SEQ ID No.5)、04(SEQ ID No.6)或07(SEQ ID No.9)的细胞池展示目的基因约3至3.5倍的表达，且具有TE元件10(SEQ ID No.12)、11(SEQ ID No.13)或12(SEQ ID No.14)的细胞池展示目的基因约2倍的表达。

与无TE元件的对照池相比，与可选择标记NPT F240I一起使用的TE元件08(SEQ ID No.10)展现目的基因的比产率的最大增长(增加至5倍)。与可选择标记DHFR一起使用的TE元件08(SEQ ID No.10)展示更佳增长，增加至约6.0倍。

此外，测试系列中TE元件02(SEQ ID No.4)与可选择标记DHFR展示目的基因的产率增加至6.8倍。

TE元件13展示最大升高(增加至15倍)。

以下实施例亦表明在一测试系列中具有TE元件05(SEQ ID No.7)及09(SEQ ID No.11)的池未展现目的基因的表达增加，且一测试系列中甚至展示比对照池低的目的基因的表达。因此，此等两元件及可能此等序列区中的部分片段可能在某些情况下具有抑制作用，尽管此并非必定情形。

此外，在以下实施例中由所测试的不同TE元件所达成的比产率的相对变化很大程度上与载体系统无关，亦即与所用的可选择标记或特定目的基因无关。

以下实施例亦表明标记基因表达的变化与目的基因表达的变化相关。

由以下实施例亦可明显看出所测试的TE元件均无增强子作用。因此，可清楚了解TE元件仅在染色体水平促使目的基因的表达增加。

以下实施例亦表明多个相同或不同的短TE元件(诸如TE元件06及08或21)的组合或级联可产生额外表达增强作用。

实施例

缩写

AP：碱性磷酸酶

Asp(＝D)：天冬氨酸

bp：碱基对

CHO：中国仓鼠卵巢

DHFR：二氢叶酸还原酶

ELISA：酶联免疫吸附测定

FACS：荧光活化细胞分选仪

GFP：绿色荧光蛋白

Gly(＝G)：甘氨酸

HT：次黄嘌呤/胸苷

IgG：免疫球蛋白G

Ile(＝I)：异亮氨酸

IRES：内部核糖体进入位点

kb：千碱基

mAb：单克隆抗体

MCP-1：单核细胞趋化蛋白-1

MTX：甲氨蝶呤

NPT：新霉素磷酸转移酶

PCR：聚合酶链式反应

Phe(＝F)：苯丙氨酸

SEAP：分泌型碱性磷酸酶

Ub：遍在蛋白

UTR：未翻译区

方法

细胞培养及转染

在细胞培养瓶中，在37℃下在潮湿气氛及5％CO₂中，在补充有次黄嘌呤及胸苷(HT)的无血清的CHO-S-SFMII培养基(Invitrogen GmbH，Karlsruhe，DE)中以悬浮细胞形式永久性培养细胞CHO-DG44/dhfr^-/-(Urlaub等人，1983)。用Coulter Counter Z2(Beckmann Coulter)或用Cedex(Innovatis)测定细胞数及存活力，且接着将细胞以1×10⁵-3×10⁵/mL的浓度接种且每隔2-3天传代一次。

使用Lipofectamine Plus试剂(Invitrogen GmbH)转染CHO-DG44。对于各转染混合物，将总共1.0-1.3μg的质粒-DNA、4μL的Lipofectamine及6μL的Plus试剂依照制造商说明书混合在一起，且以200μL的体积添加至位于0.8mL补充有HT的CHO-S-SFMII培养基中的6×10⁵个细胞中。在细胞培育箱中在37℃下培育3小时后，添加2mL补充有HT的CHO-S-SFMII培养基。培养48小时后，收集转染混合物(瞬间转染)或使转染混合物经历选择。对于基于NPT的选择，将细胞在转染后2天转移至含有400μg/mL G418(Invitrogen)、补充有HT的CHO-S-SFMII培养基中。对于基于DHFR的选择，将细胞在转染后2天转移至无HT的CHO-S-SFMII培养基中。若进行共转染(其中一表达载体含有DHFR而另一表达载体含有NPT可选择标记)，则在基于DHFR及基于NPT的选择中，将细胞在转染后2天转移至未添加次黄嘌呤及胸苷的CHO-S-SFMII培养基中，且此外将G418(Invitrogen)以400μg/mL的浓度添加至培养基中。

可通过将选择剂MTX(Sigma，Deisenhofen，DE)以5-2000nM的浓度添加至无HT的CHO-S-SFMII培养基中来达成经整合的异源基因基于DHFR的基因扩增。

表达载体

为分析表达，使用真核表达载体，所述载体基于pAD-CMV载体(Werner等人，1998)且通过CMV增强子/仓鼠遍在蛋白/S27a启动子(WO 97/15664)或CMV增强子/CMV启动子的组合介导异源基因的表达。尽管基本载体pBID含有可充当可扩增的可选择标记的dhfr-微型基因(例如参见EP-0-393-438)，但在载体pBING中dhfr微型基因已置换为经修饰的NPT基因。此基因为NPT变异体D227G(Asp227Gly)。如WO2004/050884中所述来执行用NPT变异体D227G及IRES-GFP基因区来克隆pBING。基本质粒pTE4含有可选择标记NPT变异体F240I(Phe240Ile)，且pTE4为质粒pBING的衍生物。除将NPT变异体D227G置换为NPT变异体F240I外，亦将GFP置换为来自载体pDsRed2(Clontech，Palo Alto，CA，USA)的红色荧光蛋白DsRed2。基本质粒pTE5含有可选择标记DHFR且为载体pBIDG(WO2004/050884)的衍生物，其中GFP亦置换为来自载体pDsRed2(Clontech，Palo Alto，CA，USA)的红色荧光蛋白DsRed2。

为表达单克隆人源化IgG1抗体，将重链以1.4kb SalI/SpeI片段形式克隆至经XbaI及SalI消化的质粒pBID中，以得到质粒pBID-HC(图1A)。另一方面，将轻链以0.7kb BamHI/HindIII片段形式克隆至质粒pBING的BglII/HindIII切割位点，从而产生质粒pBING-LC(图1A)。

将人类MCP-1 cDNA(Yoshimura等人，1989)以0.3kb HindIII/EcoRI片段形式克隆至载体pTE4或pTE5的相应切割位点，从而产生质粒pTE4/MCP-1及pTE5/MCP-1(分别参见图1B及图2)。

FACS(荧光活化细胞分选仪)

使用BD FACScalibur(BD Bioscience)进行流式细胞分析。FACS配备有激励波长为488nm的氦-氩激光器。荧光强度在适于特定荧光蛋白的波长下吸收，且藉助于所附软件Cell Quest Pro进行处理。

ELISA(酶联免疫吸附测定)

使用OptEIA Human MCP-1 Set试剂盒，依照制造商说明书(BDBiosciences Pharmingen，Heidelberg，DE)，通过ELISA量化上清液中经稳定转染或经瞬间转染的CHO-DG44细胞中的MCP-1滴度。

在一方面使用山羊抗人类IgG Fc片段(Dianova，Hamburg，DE)，且另一方面使用AP偶联的山羊抗人类κ轻链抗体(Sigma)，根据标准程序(CurrentProtocols in Molecular Biology，Ausubel等人，1994，已更新)通过ELISA量化上清液中经稳定转染的CHO-DG44细胞中的IgG1 mAb。使用经纯化的IgG1抗体作为标准。

根据公式pg/((Ct-Co)t/ln(Ct-Co))计算产率(pg/细胞/天)，式中Co及Ct分别为接种及收集后的细胞数且t为培养时间。

SEAP测定

使用SEAP报导基因测定，依照制造商说明书(Roche Diagnostics GmbH，Mannheim，DE)量化培养物上清液中经瞬间转染的CHO-DG44细胞中的SEAP滴度。

实施例1：TE元件TE-A的分离及克隆

自WO97/15664中所述的仓鼠基因组中包含遍在蛋白/S27a基因的编码区以及相邻的包括Ub/S27a-启动子的5’UTR区的序列起始，分离进一步上游迄今未知的序列区。为此，使用衔接子接合的基因组CHO-DG44DNA作为“巢式PCR”的基质。使用与衔接子互补的引物或与WO97/15664中所列序列SEQ ID No.5的5’区中的仓鼠序列互补的引物(引物Ub20：5’-CTCCACACATTTACACATGGACAC-3’(SEQ ID No.39)，对应于WO97/15664中SEQ ID No.5的核苷酸62至85(互补序列))的组合来进行第一轮PCR。接着，使用由内部衔接子引物与内部(“巢式”)仓鼠特异性引物(引物Ub21：5′-GGGTTTCTCTGTGTAATAGCCATG-3′(SEQ ID No.40)，对应于WO97/15664中SEQ ID No.5的核苷酸16至39(互补序列))组成的第二引物组合来进行第二轮PCR。将所得重叠DNA片段——该片段起始于具有已知序列的仓鼠特异性引物端、且接着并入位于上游的未知新序列区——亚克隆至pCR2.1 TOPO载体(Invitrogen)中且通过测序加以分析。自仓鼠Ub/S27a基因的上游获得全部348bp的迄今未知的新序列。

基于此新的序列信息，使用上述“巢式PCR”分离另一更上游的DNA区。此次，使用衔接子引物及引物Ub33(5′-ATCTCACTGTGTCTACCAACTTAG-3′(SEQ ID No.41)，位于新分离的348bp序列的5’区中，对应于SEQ ID No.1的核苷酸1268-1291(互补序列))进行第一轮PCR，且使用内部衔接子引物及进一步靠内的仓鼠特异性引物Ub32a(5′-TCTGCACCACCACTACCTGACT-3′(SEQ ID No.42)，位于新分离的384bp序列内引物Ub33的上游，对应于SEQ ID No.1的核苷酸1243-1264(互补序列))进行第二轮PCR。将所得经扩增的物质亚克隆至pCR2.1TOPO载体(Invitrogen)中且测序。其含有来自仓鼠Ub/S27a基因上游的另一1239bp的迄今未知的新序列。

利用重叠PCR片段的序列信息，使用引物Ub34(5′-CTAAGAGTACTTGCCATGAGAGCCTGAA-3′(SEQ ID No.43)，位于新分离的1239bp序列的最外5’端，仅部分存在于SEQ ID No.1中(核苷酸1至14))及Ub35(5′-CATTGATACACCACCAAAGAACTTG-3′(SEQ ID No.44)，对应于SEQ ID No.1的核苷酸1941至1965(互补序列))，通过PCR扩增来自CHO-DG44基因组DNA的集合在一起的序列区，其包含所有至此所分离的部分片段，且有383bp延伸至WO 97/15664中SEQ ID No.5的5’序列区中。将所得2kb DNA片段与WO 97/15664中所述的序列ID No.5的5，UTR区经由内源EcoRI切割位点(位置353-358)接合，但此切割位点可用Klenow DNA聚合酶通过填补反应消除。以同样方式消除新分离的基因组区中的第二个内源EcoRI切割位点，从而在SEQ ID No.1中形成相对原基因组序列而言是额外的核苷酸326至329。与内源仓鼠序列相比，以此方式在SEQ ID No.1中插入总共8个额外核苷酸。将从位于仓鼠Ub/S27a基因上游的序列区中得到的3788bp DNA片段命名为具有序列ID No.1的TE元件A，且将其亚克隆至载体pBluescript SKM(Stratagene，La Jolla，CA)中。

实施例2：多种TE表达载体的产生

从来自CHO基因组的3.8kb TE元件TE-A(图3，序列ID No.1)起始，通过PCR制备多种片段，其与TE元件TE-A相比在5’-端或3’-端具有缺失(图4及图5)。为合成此等片段，使用顺向引物与一反向引物的组合(图5及图6)。为进行克隆，经由引物将BamHI切割位点连接于片段的5’-端、且将BsrGI切割位点连接于片段的3’-端。由此产生12种具有不同长度的TE元件，其命名为TE-01至TE-12(图4及5)。在用BsrGI及BamHI消化后，将此等片段以顺向的方向克隆至基本质粒pTE4/MCP-1(图1B)或pTE5/MCP-1(图2)的衔接子区中。

通过SacII限制性酶消化，从TE-A的亚克隆分离片段TE-00(SEQ ID No.2)，且将其经由位于启动子/增强子元件的5’的SpeI切割位点以顺向与逆向克隆至基本载体pBING-LC(图1A)或pBID-HC(图1A)中。

TE元件的序列

TE-A(序列ID NO.1)

ccatgagagcctgaagacctgagttgatacccagaacccagatcaagatggaggagagaaccagccccactaag

ctgtcccctgacccccataaatgcctccctgtccagttatgccacacaatgataggtgaatacagaaaaacacccttc

ctttagacactaagcggattcctcttacgcataccagttaagtgatagttcttaggcttcaactcagcactttaaaaagtt

tatattttgcaatgctggggactaaattagggttgtgcacatgctaagtaagcactctacttttgtatcacattttaataatt

gtaagaattaattcgtgaaatagtagctgagacaatagatttgtttctttcatgtgggaactgctgtgtgtgcttcttgctg

atgcaaacaaggtcaaatactttattccccagtgtctgcctagccctgtaacacttctctattatacaatgaccacaaat

aattaggtgagtgggttttgtttcattttaaattgttgctattttagagacaggatttcttgcaaacctggttggtcttaaact

ccgtatgtagctgagaatgaccttgaaaaccttcctgtcccacccctcaaattccagaattatagacacccaccacat

ggcttaataagtaaacaacaacaataaaagcatgacttctgggtctggagggagggcttgccagttaagagcaatg

gatactttcccatagaacctgggtttgactcccagcactaacctacatggtgatagtgatgcagcagacatacatgag

ggcaacacacacatgggcacatacacacgcacccgcccaccatggcttttcccccatcacttagacagccatattta

aacgtagtggagccaggctggggtggtggcccacacctttaatcccagcactccagaaggcagaggtaggcgga

tctctgtgggtttgagaccagcctggtctacaagagctagttccaggacagcctccaaagccatagagaaaccctat

ctcaaaaaactgaaacaacaacaacaacaaaacaaaataaaaaaacaacaaaagaatcttagtggttcagtggttc

cacacacaggaaagtagaaagggccttgatgggaaggttttcagagggaggagtatggatgagacaggatgata

gtgaaaagaactcaaattaattaaatatttgaaactatctaagaataaaagctaaaatatttaaaattacagtcaggtagt

ggtggtgcagagggctaagttggtagacacagtgagatccaggccagccagggctacctagtgagaccttgttca

aataactaataaaatatacaaaataaaggagacaccacaataattttgaaatgtaaaagactaaatttaccttttatattg

atgagttggataaaaaaatcaatttaccagagaacataaagtagtcccatcaaagacaaaagcaatatatgattaaac

tctaatttaaaagtttgttagagcctggcaacgtggcacatacctttaatcccagcaccagggagacagaggccatc

ctggtctaaaaagtgatctccaggacagccatggctattacacagagaaaccctgtctggaaaaacaaaaaattagt

gtccatgtgtaaatgtgtggagtatgcttgtcatgccacatacagaggtagagggcagtttatgggagtcagttcctat

tcttcctttatgggggacctggggactgaactcaggtcatcaggcttggcagaaagtgcattagctcacggagcctt

atcattggcgaaagctctctcaagtagaaaatcaatgtgtttgctcatagtgcaatcattatgtttcgagaggggaagg

gtacaatcgttggggcatgtgtggtcacatctgaatagcagtagctccctaggagaattaattccaagttctttggtgg

tgtatcaatgcccttaaaggggtcaacaactttttttccctctgacaaaactatcttcttatgtccttgtccctcatatttga

agtattttattctttgcagtgttgaatatcaattctagcacctcagacatgttaggtaagtaccctacaactcaggttaact

aatttaatttaactaatttaaccccaacactttttctttgtttatccacatttgtggagtgtgtgtgtgtgtgtgtgtgtgtgtg

tgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgcgcgcgcgcgcgcgctcggatcattctaccttttgtttaaaaaat

gttagtccaggggtggggtgcactgtgaaagtctgagggtaacttgctggggtcagttctttccactataggacaga

actccaggtgtcaactctttactgacagaaccatccaaatagccctatctaattttagttttttatttatttattttttgtttttcg

agacagggtttctctgtggctttggaggctgtcctggaactagctcttgtagaccaggctggtctcgaactcagagat

ccacctgcctctgcctcctgagtgctgggattaaaggcatgcgccaccaacgcttggctctacctaattttaaaagag

attgtgtgtcacaagggtgtcatgtcgccctgcaaccaccccccccccaaaaaaaaaaaaaaaaaaacttcactga

agctgaagcacgatgatttggttactctggctggccaatgagctctagggagtctcctgtcaaacagaatctcaaca

ggcgcagcagtcttttttaaagtggggttacaacacaggtttttgcatatcaggcattttatctaagctatttcccagcca

aaaatgtgtattttggaggcagcagagctaatagattaaaatgagggaagagcccacacaggttattaggaagata

agcatcttctttatataaaacaaaaccaaaccaaactggaggaggtctacctttagggatggaagaaaagacatttag

agggtgcaatagaaagggcactgagtttgtgaggtggaggactgggagagggcgcaaccgctttaactgtcctgt

tttgcctattttttggggacagcacatgttcctatttttcccaggatgggcaatctccacgtccaaacttgcggtcgagg

actacagtcattttgcaggtttccttactgtatggcttttaaaacgtgcaaaggtgaccattaaccgtttcacgctggga

gggcacgtgcggctcagatgcttcctctgactgagggccaggagggggctacacggaagaggccacacccgca

cttgggaagactcgatttgggcttcagctggctgagacgccccagcaggctcctcggctacaccttcagccccgaa

tgccttccggcccataacccttcccttctaggcatttccggcgaggacccaccctcgcgccaaacattcggccccat

cccccggtcctcacctgaatctctaactctgactccagagtttagagactataaccagatagcccggatgtgtggaac

tgcatcttgggacgagtagttttagcaaaaagaaagcgacgaaaaactacaattcccagacagacttgtgttacctct

cttctcatgctaaacaagccccctttaaaggaaagcccctcttagtcgcatcgactgtgtaagaaaggcgtttgaaac

attttaatgttgggcacaccgtttcgaggaccgaaatgagaaagagcatagggaaacggagcgcccgagctagtc

tggcactgcgttagacagccgcgg

TE元件00(序列ID NO.2)

gatctccaggacagccatggctattacacagagaaaccctgtctggaaaaacaaaaaattagtgtccatgtgtaaat

gtgtggagtatgcttgtcatgccacatacagaggtagagggcagtttatgggagtcagttcctattcttcctttatggg

ggacctggggactgaactcaggtcatcaggcttggcagaaagtgcattagctcacggagccttatcattggcgaaa

gctctctcaagtagaaaatcaatgtgtttgctcatagtgcaatcattatgtttcgagaggggaagggtacaatcgttgg

ggcatgtgtggtcacatctgaatagcagtagctccctaggagaattaattccaagttctttggtggtgtatcaatgccct

taaaggggtcaacaactttttttccctctgacaaaactatcttcttatgtccttgtccctcatatttgaagtattttattctttg

cagtgttgaatatcaattctagcacctcagacatgttaggtaagtaccctacaactcaggttaactaatttaatttaacta

atttaaccccaacactttttctttgtttatccacatttgtggagtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtg

tgtgtgtgtgtgtgtgtgtgtgcgcgcgcgcgcgcgctcggatcattctaccttttgtttaaaaaatgttagtccaggg

gtggggtgcactgtgaaagtctgagggtaacttgctggggtcagttctttccactataggacagaactccaggtgtc

aactctttactgacagaaccatccaaatagccctatctaattttagttttttatttatttattttttgtttttcgagacagggttt

ctctgtggctttggaggctgtcctggaactagctcttgtagaccaggctggtctcgaactcagagatccacctgcctc

tgcctcctgagtgctgggattaaaggcatgcgccaccaacgcttggctctacctaattttaaaagagattgtgtgtcac

aagggtgtcatgtcgccctgcaaccaccccccccccaaaaaaaaaaaaaaaaaaacttcactgaagctgaagcac

gatgatttggttactctggctggccaatgagctctagggagtctcctgtcaaacagaatctcaacaggcgcagcagt

cttttttaaagtggggttacaacacaggtttttgcatatcaggcattttatctaagctatttcccagccaaaaatgtgtattt

tggaggcagcagagctaatagattaaaatgagggaagagcccacacaggttattaggaagataagcatcttctttat

ataaaacaaaaccaaaccaaactggaggaggtctacctttagggatggaagaaaagacatttagagggtgcaata

gaaagggcactgagtttgtgaggtggaggactgggagagggcgcaaccgctttaactgtcctgttttgcctatttttt

ggggacagcacatgttcctatttttcccaggatgggcaatctccacgtccaaacttgcggtcgaggactacagtcatt

ttgcaggtttccttactgtatggcttttaaaacgtgcaaaggtgaccattaaccgtttcacgctgggagggcacgtgcg

gctcagatgcttcctctgactgagggccaggagggggctacacggaagaggccacacccgcacttgggaagact

cgatttgggcttcagctggctgagacgccccagcaggctcctcggctacaccttcagccccgaatgccttccggcc

cataacccttcccttctaggcatttccggcgaggacccaccctcgcgccaaacattcggccccatcccccggtcctc

acctgaatctctaactctgactccagagtttagagactataaccagatagcccggatgtgtggaactgcatcttggga

cgagtagttttagcaaaaagaaagcgacgaaaaactacaattcccagacagacttgtgttacctctcttctcatgctaa

acaagccccctttaaaggaaagcccctcttagtcgcatcgactgtgtaagaaaggcgtttgaaacattttaatgttgg

gcacaccgtttcgaggaccgaaatgagaaagagcatagggaaacggagcgcccgagctagtctggcactgcgtt

agacagccgcgg

TE元件01(序列ID NO.3)

gttgctattttagagacaggatttcttgcaaacctggttggtcttaaactccgtatgtagctgagaatgaccttgaaaac

cttcctgtcccacccctcaaattccagaattatagacacccaccacatggcttaataagtaaacaacaacaataaaag

catgacttctgggtctggagggagggcttgccagttaagagcaatggatactttcccatagaacctgggtttgactcc

cagcactaacctacatggtgatagtgatgcagcagacatacatgagggcaacacacacatgggcacatacacacg

cacccgcccaccatggcttttcccccatcacttagacagccatatttaaacgtagtggagccaggctggggtggtgg

cccacacctttaatcccagcactccagaaggcagaggtaggcggatctctgtgggtttgagaccagcctggtctac

aagagctagttccaggacagcctccaaagccatagagaaaccctatctcaaaaaactgaaacaacaacaacaaca

aaacaaaataaaaaaacaacaaaagaatcttagtggttcagtggttccacacacaggaaagtagaaagggccttga

tgggaaggttttcagagggaggagtatggatgagacaggatgatagtgaaaagaactcaaattaattaaatatttga

aactatctaagaataaaagctaaaatatttaaaattacagtcaggtagtggtggtgcagagggctaagttggtagaca

cagtgagatccaggccagccagggctacctagtgagaccttgttcaaataactaataaaatatacaaaataaagga

gacaccacaataattttgaaatgtaaaagactaaatttaccttttatattgatgagttggataaaaaaatcaatttaccag

agaacataaagtagtcccatcaaagacaaaagcaatatatgattaaactctaatttaaaagtttgttagagcctggcaa

cgtggcacatacctttaatcccagcaccagggagacagaggccatcctggtctaaaaagtgatctccaggacagc

catggctattacacagagaaaccctgtctggaaaaacaaaaaattagtgtccatgtgtaaatgtgtggagtatgcttgt

catgccacatacagaggtagagggcagtttatgggagtcagttcctattcttcctttatgggggacctggggactgaa

ctcaggtcatcaggcttggcagaaagtgcattagctcacggagccttatcattggcgaaagctctctcaagtagaaa

atcaatgtgtttgctcatagtgcaatcattatgtttcgagaggggaagggtacaatcgttggggcatgtgtggtcacat

ctgaatagcagtagctccctaggagaattaattccaagttctttggtggtgtatcaatgcccttaaaggggtcaacaac

tttttttccctctgacaaaactatcttcttatgtccttgtccctcatatttgaagtattttattctttgcagtgttgaatatcaatt

ctagcacctcagacatgttaggtaagtaccctacaactcaggttaactaatttaatttaactaatttaaccccaacactttt

tctttgtttatccacatttgtggagtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgt

gtgcgcgcgcgcgcgcgctcggatcattctaccttttgtttaaaaaatgttagtccaggggtggggtgcactgtgaa

agtctgagggtaacttgctggggtcagttctttccactataggacagaactccaggtgtcaactctttactgacagaac

catccaaatagccctatctaattttagttttttatttatttattttttgtttttcgagacagggtttctctgtggctttggaggct

gtcctggaactagctcttgtagaccaggctggtctcgaactcagagatccacctgcctctgcctcctgagtgctggg

attaaaggcatgcgccaccaacgcttggctctacctaattttaaaagagattgtgtgtcacaagggtgtcatgtcgcc

ctgcaaccaccccccccccaaaaaaaaaaaaaaaaaaacttcactgaagctgaagcacgatgatttggttactctg

gctggccaatgagctctagggagtctcctgtcaaacagaatctcaacaggcgcagcagtcttttttaaagtggggtta

caacacaggtttttgcatatcaggcattttatctaagctatttcccagccaaaaatgtgtattttggaggcagcagagct

aatagattaaaatgagggaagagcccacacaggttattaggaagataagcatcttctttatataaaacaaaaccaaac

caaactggaggaggtctacctttagggatggaagaaaagacatttagagggtgcaatagaaagggcactgagtttg

tgaggtggaggactgggagagggcgcaaccgctttaactgtcctgttttgcctattttttggggacagcacatgttcct

atttttcccaggatgggcaatctccacgtccaaacttgcggtcgaggactacagtcattttgcaggtttccttactgtat

ggcttttaaaacgtgcaaaggtgaccattaaccgtttcacgctgggagggcacgtgcggctcagatgcttcctctga

ctgagggccaggagggggctacacggaagaggccacacccgcacttgggaagactcgatttgggcttcagctg

gctgagacgccccagcaggctcctcggctacaccttcagccccgaatgccttccggcccataacccttcccttctag

gcatttccggcgaggacccaccctcgcgccaaacattcggccccatcccccggtcctcacctgaatctctaactctg

actccagagtttagagactataaccagatag

TE元件02(序列ID NO.4)

caaagccatagagaaaccctatctcaaaaaactgaaacaacaacaacaacaaaacaaaataaaaaaacaacaaaa

gaatcttagtggttcagtggttccacacacaggaaagtagaaagggccttgatgggaaggttttcagagggaggag

tatggatgagacaggatgatagtgaaaagaactcaaattaattaaatatttgaaactatctaagaataaaagctaaaat

atttaaaattacagtcaggtagtggtggtgcagagggctaagttggtagacacagtgagatccaggccagccagg

gctacctagtgagaccttgttcaaataactaataaaatatacaaaataaaggagacaccacaataattttgaaatgtaa

aagactaaatttaccttttatattgatgagttggataaaaaaatcaatttaccagagaacataaagtagtcccatcaaag

acaaaagcaatatatgattaaactctaatttaaaagtttgttagagcctggcaacgtggcacatacctttaatcccagca

ccagggagacagaggccatcctggtctaaaaagtgatctccaggacagccatggctattacacagagaaaccctg

tctggaaaaacaaaaaattagtgtccatgtgtaaatgtgtggagtatgcttgtcatgccacatacagaggtagagggc

agtttatgggagtcagttcctattcttcctttatgggggacctggggactgaactcaggtcatcaggcttggcagaaa

gtgcattagctcacggagccttatcattggcgaaagctctctcaagtagaaaatcaatgtgtttgctcatagtgcaatc

attatgtttcgagaggggaagggtacaatcgttggggcatgtgtggtcacatctgaatagcagtagctccctaggag

aattaattccaagttctttggtggtgtatcaatgcccttaaaggggtcaacaactttttttccctctgacaaaactatcttct

tatgtccttgtccctcatatttgaagtattttattctttgcagtgttgaatatcaattctagcacctcagacatgttaggtaag

taccctacaactcaggttaactaatttaatttaactaatttaaccccaacactttttctttgtttatccacatttgtggagtgt

gtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgcgcgcgcgcgcgcgctcgga

tcattctaccttttgtttaaaaaatgttagtccaggggtggggtgcactgtgaaagtctgagggtaacttgctggggtc

agttctttccactataggacagaactccaggtgtcaactctttactgacagaaccatccaaatagccctatctaatttta

gttttttatttatttattttttgtttttcgagacagggtttctctgtggctttggaggctgtcctggaactagctcttgtagacc

aggctggtctcgaactcagagatccacctgcctctgcctcctgagtgctgggattaaaggcatgcgccaccaacgc

ttggctctacctaattttaaaagagattgtgtgtcacaagggtgtcatgtcgccctgcaaccaccccccccccaaaaa

aaaaaaaaaaaaaacttcactgaagctgaagcacgatgatttggttactctggctggccaatgagctctagggagtc

tcctgtcaaacagaatctcaacaggcgcagcagtcttttttaaagtggggttacaacacaggtttttgcatatcaggca

ttttatctaagctatttcccagccaaaaatgtgtattttggaggcagcagagctaatagattaaaatgagggaagagcc

cacacaggttattaggaagataagcatcttctttatataaaacaaaaccaaaccaaactggaggaggtctacctttag

ggatggaagaaaagacatttagagggtgcaatagaaagggcactgagtttgtgaggtggaggactgggagaggg

cgcaaccgctttaactgtcctgttttgcctattttttggggacagcacatgttcctatttttcccaggatgggcaatctcca

cgtccaaacttgcggtcgaggactacagtcattttgcaggtttccttactgtatggcttttaaaacgtgcaaaggtgac

cattaaccgtttcacgctgggagggcacgtgcggctcagatgcttcctctgactgagggccaggagggggctaca

cggaagaggccacacccgcacttgggaagactcgatttgggcttcagctggctgagacgccccagcaggctcct

cggctacaccttcagccccgaatgccttccggcccataacccttcccttctaggcatttccggcgaggacccaccct

cgcgccaaacattcggccccatcccccggtcctcacctgaatctctaactctgactccagagtttagagactataacc

agatag

TE元件03(序列ID NO.5)

acctttaatcccagcaccagggagacagaggccatcctggtctaaaaagtgatctccaggacagccatggctatta

cacagagaaaccctgtctggaaaaacaaaaaattagtgtccatgtgtaaatgtgtggagtatgcttgtcatgccacat

acagaggtagagggcagtttatgggagtcagttcctattcttcctttatgggggacctggggactgaactcaggtcat

caggcttggcagaaagtgcattagctcacggagccttatcattggcgaaagctctctcaagtagaaaatcaatgtgtt

tgctcatagtgcaatcattatgtttcgagaggggaagggtacaatcgttggggcatgtgtggtcacatctgaatagca

gtagctccctaggagaattaattccaagttctttggtggtgtatcaatgcccttaaaggggtcaacaactttttttccctct

gacaaaactatcttcttatgtccttgtccctcatatttgaagtattttattctttgcagtgttgaatatcaattctagcacctca

gacatgttaggtaagtaccctacaactcaggttaactaatttaatttaactaatttaaccccaacactttttctttgtttatcc

acatttgtggagtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgcgcgcgc

gcgcgcgctcggatcattctaccttttgtttaaaaaatgttagtccaggggtggggtgcactgtgaaagtctgagggt

aacttgctggggtcagttctttccactataggacagaactccaggtgtcaactctttactgacagaaccatccaaatag

ccctatctaattttagttttttatttatttattttttgtttttcgagacagggtttctctgtggctttggaggctgtcctggaacta

gctcttgtagaccaggctggtctcgaactcagagatccacctgcctctgcctcctgagtgctgggattaaaggcatg

cgccaccaacgcttggctctacctaattttaaaagagattgtgtgtcacaagggtgtcatgtcgccctgcaaccaccc

cccccccaaaaaaaaaaaaaaaaaaacttcactgaagctgaagcacgatgatttggttactctggctggccaatga

gctctagggagtctcctgtcaaacagaatctcaacaggcgcagcagtcttttttaaagtggggttacaacacaggtttt

tgcatatcaggcattttatctaagctatttcccagccaaaaatgtgtattttggaggcagcagagctaatagattaaaat

gagggaagagcccacacaggttattaggaagataagcatcttctttatataaaacaaaaccaaaccaaactggagg

aggtctacctttagggatggaagaaaagacatttagagggtgcaatagaaagggcactgagtttgtgaggtggagg

actgggagagggcgcaaccgctttaactgtcctgttttgcctattttttggggacagcacatgttcctatttttcccagg

atgggcaatctccacgtccaaacttgcggtcgaggactacagtcattttgcaggtttccttactgtatggcttttaaaac

gtgcaaaggtgaccattaaccgtttcacgctgggagggcacgtgcggctcagatgcttcctctgactgagggccag

gagggggctacacggaagaggccacacccgcacttgggaagactcgatttgggcttcagctggctgagacgccc

cagcaggctcctcggctacaccttcagccccgaatgccttccggcccataacccttcccttctaggcatttccggcg

aggacccaccctcgcgccaaacattcggccccatcccccggtcctcacctgaatctctaactctgactccagagttt

agagactataaccagatag

TE元件04(序列ID NO.6)

ctatcttcttatgtccttgtccctcatatttgaagtattttattctttgcagtgttgaatatcaattctagcacctcagacatgtt

aggtaagtaccctacaactcaggttaactaatttaatttaactaatttaaccccaacactttttctttgtttatccacatttgt

ggagtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgcgcgcgcgcgcgc

gctcggatcattctaccttttgtttaaaaaatgttagtccaggggtggggtgcactgtgaaagtctgagggtaacttgct

ggggtcagttctttccactataggacagaactccaggtgtcaactctttactgacagaaccatccaaatagccctatct

aattttagttttttatttatttattttttgtttttcgagacagggtttctctgtggctttggaggctgtcctggaactagctcttgt

agaccaggctggtctcgaactcagagatccacctgcctctgcctcctgagtgctgggattaaaggcatgcgccacc

aacgcttggctctacctaattttaaaagagattgtgtgtcacaagggtgtcatgtcgccctgcaaccacccccccccc

aaaaaaaaaaaaaaaaaaacttcactgaagctgaagcacgatgatttggttactctggctggccaatgagctctagg

gagtctcctgtcaaacagaatctcaacaggcgcagcagtcttttttaaagtggggttacaacacaggtttttgcatatc

aggcattttatctaagctatttcccagccaaaaatgtgtattttggaggcagcagagctaatagattaaaatgagggaa

gagcccacacaggttattaggaagataagcatcttctttatataaaacaaaaccaaaccaaactggaggaggtctac

ctttagggatggaagaaaagacatttagagggtgcaatagaaagggcactgagtttgtgaggtggaggactggga

gagggcgcaaccgctttaactgtcctgttttgcctattttttggggacagcacatgttcctatttttcccaggatgggca

atctccacgtccaaacttgcggtcgaggactacagtcattttgcaggtttccttactgtatggcttttaaaacgtgcaaa

ggtgaccattaaccgtttcacgctgggagggcacgtgcggctcagatgcttcctctgactgagggccaggagggg

gctacacggaagaggccacacccgcacttgggaagactcgatttgggcttcagctggctgagacgccccagcag

gctcctcggctacaccttcagccccgaatgccttccggcccataacccttcccttctaggcatttccggcgaggacc

caccctcgcgccaaacattcggccccatcccccggtcctcacctgaatctctaactctgactccagagtttagagact

ataaccagatag

TE元件05(序列ID NO.7)

caggctggtctcgaactcagagatccacctgcctctgcctcctgagtgctgggattaaaggcatgcgccaccaacg

cttggctctacctaattttaaaagagattgtgtgtcacaagggtgtcatgtcgccctgcaaccaccccccccccaaaa

aaaaaaaaaaaaaaacttcactgaagctgaagcacgatgatttggttactctggctggccaatgagctctagggagt

ctcctgtcaaacagaatctcaacaggcgcagcagtcttttttaaagtggggttacaacacaggtttttgcatatcaggc

attttatctaagctatttcccagccaaaaatgtgtattttggaggcagcagagctaatagattaaaatgagggaagagc

ccacacaggttattaggaagataagcatcttctttatataaaacaaaaccaaaccaaactggaggaggtctaccttta

gggatggaagaaaagacatttagagggtgcaatagaaagggcactgagtttgtgaggtggaggactgggagagg

gcgcaaccgctttaactgtcctgttttgcctattttttggggacagcacatgttcctatttttcccaggatgggcaatctc

cacgtccaaacttgcggtcgaggactacagtcattttgcaggtttccttactgtatggcttttaaaacgtgcaaaggtg

accattaaccgtttcacgctgggagggcacgtgcggctcagatgcttcctctgactgagggccaggagggggcta

cacggaagaggccacacccgcacttgggaagactcgatttgggcttcagctggctgagacgccccagcaggctc

ctcggctacaccttcagccccgaatgccttccggcccataacccttcccttctaggcatttccggcgaggacccacc

ctcgcgccaaacattcggccccatcccccggtcctcacctgaatctctaactctgactccagagtttagagactataa

ccagatag

TE元件06(序列ID NO.8)

Cttgcggtcgaggactacagtcattttgcaggtttccttactgtatggcttttaaaacgtgcaaaggtgaccattaacc

gtttcacgctgggagggcacgtgcggctcagatgcttcctctgactgagggccaggagggggctacacggaaga

ggccacacccgcacttgggaagactcgatttgggcttcagctggctgagacgccccagcaggctcctcggctaca

ccttcagccccgaatgccttccggcccataacccttcccttctaggcatttccggcgaggacccaccctcgcgccaa

acattcggccccatcccccggtcctcacctgaatctctaactctgactccagagtttagcgactataaccagatag

TE元件07(序列ID NO.9)

Gcctgaagacctgagttgatacccagaacccagatcaagatggaggagagaaccagccccactaagctgtcccc

tgacccccataaatgcctccctgtccagttatgccacacaatgataggtgaatacagaaaaacacccttcctttagac

actaagcggattcctcttacgcataccagttaagtgatagttcttaggcttcaactcagcactttaaaaagtttatattttg

caatgctggggactaaattagggttgtgcacatgctaagtaagcactctacttttgtatcacattttaataattgtaagaa

ttaattcgtgaaatagtagctgagacaatagatttgtttctttcatgtgggaactgctgtgtgtgcttcttgctgatgcaaa

caaggtcaaatactttattccccagtgtctgcctagccctgtaacacttctctattatacaatgaccacaaataattaggt

gagtgggttttgtttcattttaaattgttgctattttagagacaggatttc

TE元件08(序列ID NO.10)

Gcctgaagacctgagttgatacccagaacccagatcaagatggaggagagaaccagccccactaagctgtcccc

tgacccccataaatgcctccctgtccagttatgccacacaatgataggtgaatacagaaaaacacccttcctttagac

gagtgggttttgtttcattttaaattgttgctattttagagacaggatttcttgcaaacctggttggtcttaaactccgtatgt

agctgagaatgaccttgaaaaccttcctgtcccacccctcaaattccagaattatagacacccaccacatggcttaat

aagtaaacaacaacaataaaagcatgacttctgggtctggagggagggcttgccagttaagagcaatggatactttc

ccatagaacctgggtttgactcccagcactaacctacatggtgatagtgatgcagcagacatacatgagggcaaca

cacacatgggcacatacacacgcacccgcccaccatggcttttcccccatcacttagacagccatatttaaacgtag

tggagccaggctggggtggtggcccacacctttaatcccagcactccagaaggcagaggtaggcggatctctgtg

ggtttgagaccagcctggtctacaagagctagttccaggacagcctccaaagccatagagaaaccctatc

TE元件09(序列ID NO.11)

gcctgaagacctgagttgatacccagaacccagatcaagatggaggagagaaccagccccactaagctgtcccct

gacccccataaatgcctccctgtccagttatgccacacaatgataggtgaatacagaaaaacacccttcctttagaca

ctaagcggattcctcttacgcataccagttaagtgatagttcttaggcttcaactcagcactttaaaaagtttatattttgc

aatgctggggactaaattagggttgtgcacatgctaagtaagcactctacttttgtatcacattttaataattgtaagaatt

aattcgtgaaatagtagctgagacaatagatttgtttctttcatgtgggaactgctgtgtgtgcttcttgctgatgcaaac

aaggtcaaatactttattccccagtgtctgcctagccctgtaacacttctctattatacaatgaccacaaataattaggtg

agtgggttttgtttcattttaaattgttgctattttagagacaggatttcttgcaaacctggttggtcttaaactccgtatgta

gctgagaatgaccttgaaaaccttcctgtcccacccctcaaattccagaattatagacacccaccacatggcttaata

agtaaacaacaacaataaaagcatgacttctgggtctggagggagggcttgccagttaagagcaatggatactttcc

catagaacctgggtttgactcccagcactaacctacatggtgatagtgatgcagcagacatacatgagggcaacac

acacatgggcacatacacacgcacccgcccaccatggcttttcccccatcacttagacagccatatttaaacgtagt

ggagccaggctggggtggtggcccacacctttaatcccagcactccagaaggcagaggtaggcggatctctgtg

ggtttgagaccagcctggtctacaagagctagttccaggacagcctccaaagccatagagaaaccctatctcaaaa

aactgaaacaacaacaacaacaaaacaaaataaaaaaacaacaaaagaatcttagtggttcagtggttccacacac

aggaaagtagaaagggccttgatgggaaggttttcagagggaggagtatggatgagacaggatgatagtgaaaa

gaactcaaattaattaaatatttgaaactatctaagaataaaagctaaaatatttaaaattacagtcaggtagtggtggt

gcagagggctaagttggtagacacagtgagatccaggccagccagggctacctagtgagaccttgttcaaataact

aataaaatatacaaaataaaggagacaccacaataattttgaaatgtaaaagactaaatttaccttttatattgatgagtt

ggataaaaaaatcaatttaccagagaacataaagtagtcccatcaaagacaaaagcaatatatgattaaactctaattt

aaaagtttgttagagcctggcaacgtggcacatacctttaatcccagcaccagg

TE元件10(序列ID NO.12)

gcctgaagacctgagttgatacccagaacccagatcaagatggaggagagaaccagccccactaagctgtcccct

gacccccataaatgcctccctgtccagttatgccacacaatgataggtgaatacagaaaaacacccttcctttagaca

gctgagaatgaccttgaaaaccttcctgtcccacccctcaaattccagaattatagacacccaccacatggcttaata

agtaaacaacaacaataaaagcatgacttctgggtctggagggagggcttgccagttaagagcaatggatactttcc

catagaacctgggtttgactcccagcactaacctacatggtgatagtgatgcagcagacatacatgagggcaacac

acacatgggcacatacacacgcacccgcccaccatggcttttcccccatcacttagacagccatatttaaacgtagt

ggagccaggctggggtggtggcccacacctttaatcccagcactccagaaggcagaggtaggcggatctctgtg

ggtttgagaccagcctggtctacaagagctagttccaggacagcctccaaagccatagagaaaccctatctcaaaa

aactgaaacaacaacaacaacaaaacaaaataaaaaaacaacaaaagaatcttagtggttcagtggttccacacac

aggaaagtagaaagggccttgatgggaaggttttcagagggaggagtatggatgagacaggatgatagtgaaaa

gcagagggctaagttggtagacacagtgagatccaggccagccagggctacctagtgagaccttgttcaaataact

ggataaaaaaatcaatttaccagagaacataaagtagtcccatcaaagacaaaagcaatatatgattaaactctaattt

aaaagtttgttagagcctggcaacgtggcacatacctttaatcccagcaccagggagacagaggccatcctggtct

aaaaagtgatctccaggacagccatggctattacacagagaaaccctgtctggaaaaacaaaaaattagtgtccatg

tgtaaatgtgtggagtatgcttgtcatgccacatacagaggtagagggcagtttatgggagtcagttcctattcttcctt

tatgggggacctggggactgaactcaggtcatcaggcttggcagaaagtgcattagctcacggagccttatcattg

gcgaaagctctctcaagtagaaaatcaatgtgtttgctcatagtgcaatcattatgtttcgagaggggaagggtacaa

tcgttggggcatgtgtggtcacatctgaatagcagtagctccctaggagaattaattccaagttctttggtggtgtatca

atgcccttaaaggggtcaacaactttttttccctctgacaaaactatcttcttatgtccttgtccc

TE元件11(序列ID NO.13)

gcctgaagacctgagttgatacccagaacccagatcaagatggaggagagaaccagccccactaagctgtcccct

gacccccataaatgcctccctgtccagttatgccacacaatgataggtgaatacagaaaaacacccttcctttagaca

agtgggttttgtttcattttaaattgttgctattttagagacaggatttettgcaaacctggttggtcttaaactccgtatgta

gctgagaatgaccttgaaaaccttcctgtcccacccctcaaattccagaattatagacacccaccacatggcttaata

agtaaacaacaacaataaaagcatgacttctgggtctggagggagggcttgccagttaagagcaatggatactttcc

catagaacctgggtttgactcccagcactaacctacatggtgatagtgatgcagcagacatacatgagggcaacac

acacatgggcacatacacacgcacccgcccaccatggcttttcccccatcacttagacagccatatttaaacgtagt

ggagccaggctggggtggtggcccacacctttaatcccagcactccagaaggcagaggtaggcggatctctgtg

ggtttgagaccagcctggtctacaagagctagttccaggacagcctccaaagccatagagaaaccctatcccaaaa

aactgaaacaacaacaacaacaaaacaaaataaaaaaacaacaaaagaatcttagtggttcagtggttccacacac

aggaaagtagaaagggccttgatgggaaggttttcagagggaggagtatggatgagacaggatgatagtgaaaa

gcagagggctaagttggtagacacagtgagatccaggccagccagggctacctagtgagaccttgttcaaataact

ggataaaaaaatcaatttaccagagaacataaagtagtcccatcaaagacaaaagcaatatatgattaaactctaattt

aaaagtttgttagagcctggcaacgtggcacatacctttaatcccagcaccagggagacagaggccatcctggtct

aaaaagtgatctccaggacagccatggctattacacagagaaaccctgtctggaaaaacaaaaaattagtgtccatg

tatgggggacctggggactgaactcaggtcatcaggcttggcagaaagtgcattagctcacggagccttatcattg

gcgaaagctctctcaagtagaaaatcaatgtgtttgctcatagtgcaatcattatgtttcgagaggggaagggtacaa

atgcccttaaaggggtcaacaactttttttccctctgacaaaactatcttcttatgtccttgtccctcatatttgaagtatttt

attctttgcagtgttgaatatcaattctagcacctcagacatgttaggtaagtaccctacaactcaggttaactaatttaat

ttaactaatttaaccccaacactttttctttgtttatccacatttgtggagtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgt

gtgtgtgtgtgtgtgtgtgtgtgtgtgtgcgcgcgcgcgcgcgctcggatcattctaccttttgtttaaaaaatgttagt

ccaggggtggggtgcactgtgaaagtctgagggtaacttgctggggtcagttctttccactataggacagaactcca

ggtgtcaactctttactgacagaaccatccaaatagccctatctaattttagttttttatttatttattttttgtttttcgagaca

gggtttctctgtggctttggaggctgtcctggaactagctcttgtagaccaggctggtctcgaactcag

TE元件12(序列ID NO.14)

gcctgaagacctgagttgatacccagaacccagatcaagatggaggagagaaccagccccactaagctgtcccct

gacccccataaatgcctccctgtccagttatgccacacaatgataggtgaatacagaaaaacacccttcctttagaca

gctgagaatgaccttgaaaaccttcctgtcccacccctcaaattccagaattatagacacccaccacatggcttaata

agtaaacaacaacaataaaagcatgacttctgggtctggagggagggcttgccagttaagagcaatggatactttcc

catagaacctgggtttgactcccagcactaacctacatggtgatagtgatgcagcagacatacatgagggcaacac

acacatgggcacatacacacgcacccgcccaccatggcttttcccccatcacttagacagccatatttaaacgtagt

ggagccaggctggggtggtggcccacacctttaatcccagcactccagaaggcagaggtaggcggatctctgtg

ggtttgagaccagcctggtctacaagagctagttccaggacagcctccaaagccatagagaaaccctatctcaaaa

aactgaaacaacaacaacaacaaaacaaaataaaaaaacaacaaaagaatcttagtggttcagtggttccacacac

aggaaagtagaaagggccttgatgggaaggttttcagagggaggagtatggatgagacaggatgatagtgaaaa

gcagagggctaagttggtagacacagtgagatccaggccagccagggctacctagtgagaccttgttcaaataact

ggataaaaaaatcaatttaccagagaacataaagtagtcccatcaaagacaaaagcaatatatgattaaactctaattt

aaaagtttgttagagcctggcaacgtggcacatacctttaatcccagcaccagggagacagaggccatcctggtct

aaaaagtgatctccaggacagccatggctattacacagagaaaccctgtctggaaaaacaaaaaattagtgtccatg

tatgggggacctggggactgaactcaggtcatcaggcttggcagaaagtgcattagctcacggagccttatcattg

gcgaaagctctctcaagtagaaaatcaatgtgtttgctcatagtgcaatcattatgtttcgagaggggaagggtacaa

ccaggggtggggtgcactgtgaaagtctgagggtaacttgctggggtcagttctttccactataggacagaactcca

gggtttctctgtggctttggaggctgtcctggaactagctcttgtagaccaggctggtctcgaactcagagatccacc

tgcctctgcctcctgagtgctgggattaaaggcatgcgccaccaacgcttggctctacctaattttaaaagagattgtg

tgtcacaagggtgtcatgtcgccctgcaaccaccccccccccaaaaaaaaaaaaaaaaaaacttcactgaagctga

agcacgatgatttggttactctggctggccaatgagctctagggagtctcctgtcaaacagaatctcaacaggcgca

gcagtcttttttaaagtggggttacaacacaggtttttgcatatcaggcattttatctaagctatttcccagccaaaaatgt

gtattttggaggcagcagagctaatagattaaaatgagggaagagcccacacaggttattaggaagataagcatctt

ctttatataaaacaaaaccaaaccaaactggaggaggtctacctttagggatggaagaaaagacatttagagggtgc

aatagaaagggcactgagtttgtgaggtggaggactgggagagggcgcaaccgctttaactgtcctgttttgcctat

tttttggggacagcacatgttcctatttttcccaggatgggcaatctccacgtccaaacttgcggtcgaggactacag

实施例3：TE元件变异体TE-00对GFP及免疫球蛋白G1(IgG1)的表达的影响

在CHO-DG44细胞内的两个独立的稳定转染系列中，对TE元件TE-00对位于细胞质内的GFP(绿色荧光蛋白)及分泌型单克隆IgG1抗体的表达的影响进行研究。为此，将CHO-DG44细胞用以下质粒组合或质粒变异体共转染：

a)无TE元件的对照质粒pBING-LC(图1A)及pBID-HC(图1A)

b)在启动子/增强子上游具有以顺向整合的TE元件TE-00的pBING-LC及pBID-HC

c)在启动子/增强子上游具有以逆向整合的TE元件TE-00的pBING-LC及pBID-HC。

在转染系列A中，制备4个池；在转染系列B中，每种变异体制备10个池。使用等摩尔的两种质粒。为使得分子总数相同，对照混合物中系列A中转染所用的DNA的总量为1μg，而在含有TE元件的混合物中此量为1.3μg。此差异是由不同质粒尺寸所引起，由于具有TE元件的质粒比对照质粒大1.3倍。由于转染混合物中所用的DNA的量可影响转染效率，因此在系列B中用300ng“模拟DNA”(＝无产物基因、TE元件及真核可选择标记的载体)平衡DNA的总量，以使得具有对照质粒的混合物亦含有总计1.3μg的DNA。作为阴性对照，亦在各转染系列中操作模拟转染池，亦即以同样方式处理，但在转染混合物中不添加DNA。转染后两天用HT/+G418(400μg/mL)对经稳定转染的细胞进行选择。

选择之后，通过FACS测定表达GFP的细胞的比例。在曲线图重叠中比较两转染系列中的变异体得出具有TE元件00的池中表达GFP细胞的比例比具有对照质粒的池大(图7)。在质粒中存在顺向或逆向的TE元件的各池之间未发现任何型式的差异。因此，TE元件00的作用(亦即，增加混合群中具有较高产率的细胞的比例)与TE元件00的取向无关。

此外，测定经六至八次传代(传代节律2-2-3天)的时间后各池的IgG1滴度及比产率。此再次证明含有TE元件00的细胞池平均表达超过无TE元件的细胞池(图9，系列A及B)。在两个系列中，可证明池产率因TE元件的存在而加倍，而此与元件在表达质粒中克隆的取向无关。

实施例4：TE元件TE-01至TE-12对MCP-1的表达的影响

研究在CHO-DG44细胞的三个稳定转染系列(系列C、D及E)中，与无TE元件情况下的表达相比，TE元件TE-01至TE-12对分泌型MCP-1的表达的影响。在所有三个系列中，每种质粒变异体制备6个池。系列C及D中的基本质粒为pTE4/MCP-1(图1B；可选择标记NPT＝新霉素磷酸转移酶F240I)，系列E中为pTE5/MCP-1(图2；可选择标记DHFR＝二氢叶酸还原酶)。此等质粒不含TE元件(＝对照混合物)或在启动子/增强子的上游含有处于顺向的TE元件TE-01至TE-12之一。为将由转染混合物中DNA的不同量所引起的对转染效率的影响降至最小，使用总计1.2μg的质粒-DNA。视所引入的TE元件的尺寸而定，质粒尺寸介于6.7kb与10.7kb之间不等。然而，为确保所有混合物中测试质粒的分子总数保持恒定，在具有较小质粒分子的混合物中用所谓的模拟质粒平衡DNA的总量，该模拟质粒既不含有产物基因及TE元件，亦不含有任何真核可选择标记。作为阴性对照，对于各转染系列，亦操作模拟转染池，亦即以同样方式处理，但不添加DNA至转染混合物中。转染后两天，在系列C及D中用补充有HT的CHO-S-SFMII+G418(400μg/mL)且在系列E中用无HT的CHO-S-SFMII对经稳定转染的细胞进行选择。

选择之后，通过FACS测定表达dsRed2的细胞的比例。图8展示系列C中存活的转染细胞的相对荧光百分比。与对照池相比，含有TE元件TE-01、TE-02或TE-08的池含有约3至3.5倍的表达dsRed2的细胞，且具有元件TE-06的池含有约2倍的表达dsRed2的细胞。另一方面，与对照池相比，在具有片段TE-05及TE-09的池中，表达dsRed2的细胞的比例未明显提高。

此外，经6次传代(传代节律2-2-3天)的时间后MCP-1产物滴度及比产率亦升高。图9(系列C及D)及图10(系列E)展示相对MCP-1比产率。与无TE元件的对照池相比，与可选择标记NPT-F240I一起使用的元件TE-08展示MCP-1比产率的最大增长(增长至5.3倍)(图9)。在此变异体中与可选择标记DHFR组合可达成6倍的增长(图10)。与对照池相比，TE元件01、02及03可使NPT选择池的产率增加至4至4.5倍(图9)且使DHFR选择池的产率增加至2.6至6.8倍(图10)。在所有系列中，长仅为300bp的TE元件06亦能够使产率增加至2.5至3.2倍(图9及10)。用片段TE-04及TE-07达成的增长亦为此数量级(图10)。使用稍长片段TE-10、TE-11及TE-12的池展示双倍的MCP-1表达(图9及10)。显然，在所有此等池中，几乎不表达或不表达产物的细胞的数目减少，且因此细胞群中总体高产者的比例提高。此指示TE元件能够抑制、遮蔽或消除负面染色体位置效应。

相比之下，如有关dsRed2表达中已经见到的，与对照相比，通过使用片段TE-05及TE-09未能增加表达(图8)，且在某些情况下表达甚至更低(图9及10)。此等元件或此等序列区中的部分片段因此可能甚至具有抑制作用。

总之，所观测到的MCP-1表达的变化与稳定细胞池中表达dsRed2的细胞的比例有关。

实施例5：TE元件TE-01至TE-12增强子活性的测试

通过瞬间转染CHO-DG44细胞，进行测试以了解所观测到的产物表达的增加实际上是基于TE元件的染色质开放作用还是基于增强子活性。当质粒在瞬间转染中未整合至基因组内时，直接由质粒读出遗传信息。因此，不存在染色体位置效应。若仍存在对基因表达的正面影响，则此等影响可归因于存在于TE元件中的增强子。该等增强子可以顺式定位作用于启动子的活性(与位置及取向无关)且刺激功能上连接的基因的转录。

在图11中所示的瞬间表达研究中，将6个池用基本质粒pTE4/MCP-1(＝对照；图1B)或其衍生物转染，该等衍生物各自额外在启动子/增强子和上游含有TE元件TE-01至TE-12之一。在以3mL总体积培养48小时后，进行收集且通过ELISA测定细胞培养物上清液中的MCP-1滴度。通过用SEAP表达质粒共转染(每种转染混合物添加100ng质粒DNA)及随后测量SEAP活性来修正转染效率的差异。图11展示6个平行池的平均值。资料表明，在所有池中细胞培养物上清液中的MCP-1滴度极其类似，且在表达上与无TE元件的对照质粒pTE4/MCP-1无显著差异。因此，在经稳定转染的细胞池中，由某些TE元件所引起的2倍以上的产率提高并非基于TE序列中存在增强子。因此，对于通过TE元件获得表达增强而言，染色体整合是绝对必需的。

实施例6：其他TE元件的制备及不同TE元件位置及组合的测试

可以类似于实施例2中所述的方法产生序列ID No.1的其他部分片段或其衍生物，且如实施例3及5中所述测试其对产率的正面影响。可能的片段的一些实例展示于图12中。迄今所获得的结果指示(例如)图12中所示的序列ID No.1的区域亦可促使基因表达增加。在稳定转染系列中，更精确表征此等新的TE元件对比产率的影响，以便定位及进一步缩小具有功能重要性的序列区的范围。将功能缩小在特定序列区的范围内及与此相关的片段长度的可能降低有利于表达载体的有效使用，因为表达质粒越小越稳定，且越易于在克隆和转染期间操控。

此外，可在质粒内以彼此间的任何取向以及任何位置排列相似或不同的片段区。亦可在稳定转染系列中研究何种组合有可能使表达达成最佳增长。图13中展示某些实施例，该等实施例无任何限制性。因此，举例而言，研究应判定TE元件TE-06及TE-08当侧接于产物基因两侧或相继排列时能否促使表达额外增强。此外，亦可设想诸如TE元件06及08的可相同或不同的短TE元件的级联(例如)亦可产生额外的表达增强作用。

其他TE元件

TE元件13(序列ID NO.15)

cttcctgtcccacccctcaaattccagaattatagacacccaccacatggcttaataagtaaacaacaacaataaaag

catgacttctgggtctggagggagggcttgccagttaagagcaatggatactttcccatagaacctgggtttgactcc

cagcactaacctacatggtgatagtgatgcagcagacatacatgagggcaacacacacatgggcacatacacacg

cacccgcccaccatggcttttcccccatcacttagacagccatatttaaacgtagtggagccaggctggggtggtgg

cccacacctttaatcccagcactccagaaggcagaggtaggcggatctctgtgggtttgagaccagcctggtctac

aagagctagttccaggacagcctccaaagccatagagaaaccctatc

TE元件14(序列ID NO.16)

caaagccatagagaaaccctatctcaaaaaactgaaacaacaacaacaacaaaacaaaataaaaaaacaacaaaa

gaatcttagtggttcagtggttccacacacaggaaagtagaaagggccttgatgggaaggttttcagagggaggag

tatggatgagacaggatgatagtgaaaagaactcaaattaattaaatatttgaaactatctaagaataaaagctaaaat

atttaaaattacagtcaggtagtggtggtgcagagggctaagttggtagacacagtgagatccaggccagccagg

gctacctagtgagaccttgttcaaataactaataaaatatacaaaataaaggagacaccacaataattttgaaatgtaa

ccagg

TE元件15(序列ID NO.17)

cttcctgtcccacccctcaaattccagaattatagacacccaccacatggcttaataagtaaacaacaacaataaaag

catgacttctgggtctggagggagggcttgccagttaagagcaatggatactttcccatagaacctgggtttgactcc

cagcactaacctacatggtgatagtgatgcagcagacatacatgagggcaacacacacatgggcacatacacacg

cacccgcccaccatggcttttcccccatcacttagacagccatatttaaacgtagtggagccaggctggggtggtgg

cccacacctttaatcccagcactccagaaggcagaggtaggcggatctctgtgggtttgagaccagcctggtctac

aagagctagttccaggacagcctccaaagccatagagaaaccctatctcaaaaaactgaaacaacaacaacaaca

aaacaaaataaaaaaacaacaaaagaatcttagtggttcagtggttccacacacaggaaagtagaaagggccttga

tgggaaggttttcagagggaggagtatggatgagacaggatgatagtgaaaagaactcaaattaattaaatatttga

aactatctaagaataaaagctaaaatatttaaaattacagtcaggtagtggtggtgcagagggctaagttggtagaca

cagtgagatccaggccagccagggctacctagtgagaccttgttcaaataactaataaaatatacaaaataaagga

agaacataaagtagtcccatcaaagacaaaagcaatatatgattaaactctaatttaaaagtttgttagagcctggcaa

cgtggcacatacctttaatcccagcaccagg

TE元件16(序列ID NO.18)

acctttaatcccagcaccagggagacagaggccatcctggtctaaaaagtgatctccaggacagccatggctatta

cacagagaaaccctgtctggaaaaacaaaaaattagtgtccatgtgtaaatgtgtggagtatgcttgtcatgccacat

acagaggtagagggcagtttatgggagtcagttcctattcttcctttatgggggacctggggactgaactcaggtcat

caggcttggcagaaagtgcattagctcacggagccttatcattggcgaaagctctctcaagtagaaaatcaatgtgtt

tgctcatagtgcaatcattatgtttcgagaggggaagggtacaatcgttggggcatgtgtggtcacatctgaatagca

gacaaaactatcttcttatgtccttgtccc

TE元件17(序列ID NO.19)

caaagccatagagaaaccctatctcaaaaaactgaaacaacaacaacaacaaaacaaaataaaaaaacaacaaaa

gaatcttagtggttcagtggttccacacacaggaaagtagaaagggccttgatgggaaggttttcagagggaggag

tatggatgagacaggatgatagtgaaaagaactcaaattaattaaatatttgaaactatctaagaataaaagctaaaat

atttaaaattacagtcaggtagtggtggtgcagagggctaagttggtagacacagtgagatccaggccagccagg

gctacctagtgagaccttgttcaaataactaataaaatatacaaaataaaggagacaccacaataattttgaaatgtaa

aagactaaatttaccttttatattgatgagttggataaaaaaatcaatttaccagagaacataaagtagccccatcaaag

ccagggagacagaggccatcctggtctaaaaagtgatctccaggacagccatggctattacacagagaaaccctg

tctggaaaaacaaaaaattagtgtccatgtgtaaatgtgtggagtatgcttgtcatgccacatacagaggtagagggc

agtttatgggagtcagttcctattcttcctttatgggggacctggggactgaactcaggtcatcaggcttggcagaaa

gtgcattagctcacggagccttatcattggcgaaagctctctcaagtagaaaatcaatgtgtttgctcatagtgcaatc

attatgtttcgagaggggaagggtacaatcgttggggcatgtgtggtcacatctgaatagcagtagctccctaggag

tatgtccttgtccc

TE元件18(序列ID NO.20)

cttcctgtcccacccctcaaattccagaattatagacacccaccacatggcttaataagtaaacaacaacaataaaag

catgacttctgggtctggagggagggcttgccagttaagagcaatggatactttcccatagaacctgggtttgactcc

cagcactaacctacatggtgatagtgatgcagcagacatacatgagggcaacacacacatgggcacatacacacg

cacccgcccaccatggcttttcccccatcacttagacagccatatttaaacgtagtggagccaggctggggtggtgg

cccacacctttaatcccagcactccagaaggcagaggtaggcggatctctgtgggtttgagaccagcctggtctac

aagagctagttccaggacagcctccaaagccatagagaaaccctatctcaaaaaactgaaacaacaacaacaaca

aaacaaaataaaaaaacaacaaaagaatcttagtggttcagtggttccacacacaggaaagtagaaagggccttga

tgggaaggttttcagagggaggagtatggatgagacaggatgatagtgaaaagaactcaaattaattaaatatttga

aactatctaagaataaaagctaaaatatttaaaattacagtcaggtagtggtggtgcagagggctaagttggtagaca

cagtgagatccaggccagccagggctacctagtgagaccttgttcaaataactaataaaatatacaaaataaagga

agaacataaagtagtcccatcaaagacaaaagcaatatatgattaaactctaatttaaaagtttgttagagcctggcaa

cgtggcacatacctttaatcccagcaccagggagacagaggccatcctggtctaaaaagtgatctccaggacagc

catggctattacacagagaaaccctgtctggaaaaacaaaaaattagtgtccatgtgtaaatgtgtggagtatgcttgt

catgccacatacagaggtagagggcagtttatgggagtcagttcctattcttcctttatgggggacctggggactgaa

ctcaggtcatcaggcttggcagaaagtgcattagctcacggagccttatcattggcgaaagctctctcaagtagaaa

atcaatgtgtttgctcatagtgcaatcattatgtttcgagaggggaagggtacaatcgttggggcatgtgtggtcacat

ctgaatagcagtagctccctaggagaattaattccaagttctttggtggtgtatcaatgcccttaaaggggtcaacaac

tttttttccctctgacaaaactatcttcttatgtccttgtccc

TE元件21(序列ID NO.21)

cttgcggtcgaggactacagtcattttgcaggtttccttactgtatggcttttaaaacgtgcaaaggtgaccattaaccg

tttcacgctgggagggcacgtgcggctcagatgcttcctctgactgagggccaggagggggctacacggaagag

gccacacccgcacttgggaagactcgatttgggcttcagctggctgagacgccccagcaggctcctcggctacac

cttcagccccgaatgccttccggcccataacccttcccttctaggcatttccggcgaggacccaccctcgcgccaaa

cattcggccccatcccccggtcctcacctgaatctctaactctgactccagagtttagagactataaccagatag

实施例7：TE元件TE-13至TE-18对MCP-1的表达的影响

研究在CHO-DG44细胞的稳定转染系列(系列F)中，与无TE元件情况下的表达相比，TE元件TE-13至TE-18对分泌型MCP-1的表达的影响。每种质粒变异体制备4个池。在所有系列中，基本质粒为pTE4/MCP-1(图1B；可选择标记NPT＝新霉素磷酸转移酶F240I)。各种质粒变异体不含TE元件(＝对照混合物)或于启动子/增强子的上游含有处于顺向的TE元件TE-13至TE-18之一(图12)。为将由转染混合物中DNA的不同量所引起的对转染效率的任何影响降至最小，各情况下均使用总计1.2μg的质粒DNA。视所引入的TE元件的尺寸而定，质粒尺寸介于6.7kb与8.2kb之间不等。作为阴性对照，在各转染系列中同时操作模拟转染池，亦即以同样方式处理，但在转染混合物中不添加DNA。转染后两天，使用补充有HT的CHO-S-SFMII+G418(400μg/mL)对经稳定转染的细胞进行选择。

MCP-1的产物滴度及比产率经5至6次传代(传代节律2-2-3天)得到提高。图14(系列F)展示相对MCP-1比产率。该等各元件均可使MCP-1平均表达增加。使用元件13获得最大增长(15倍)，其甚至超过元件08所产生的10倍增长。

实施例8：各种位置及各种组合的TE元件对MCP-1表达的影响

研究在CHO-DG44细胞的两个稳定转染系列(系列G及H)中，与无TE元件情况下的表达相比，表达质粒中各种组合及各种位置的TE元件TE-06及TE-08对分泌型MCP-1的表达的影响。在两个系列中，每种质粒变异体制备6个池。基本质粒为pTE4/MCP-1(图1B；可选择标记NPT＝新霉素磷酸转移酶F240I)。个别质粒变异体不含TE元件(＝对照混合物)，或在增强子/启动子元件之前含有TE-08或TE-A，或在增强子/启动子元件之前含有TE-06与TE-08的组合，或在增强子/启动子元件之前含有逆向的TE-08或TE-09(系列G)。在系列H中，在增强子/启动子元件(E/P)之前且另外在终止信号(T)之后使用元件TE-06及TE-21或TE-08(图13)。为将由转染混合物中DNA的不同量所引起的对转染效率的任何影响降至最小，各情况下均使用总计1.2μg的质粒DNA。视所引入的TE元件的尺寸而定，质粒尺寸介于6.7kb与10.2kb之间不等。作为阴性对照，在各转染系列中同时操作模拟转染池，亦即以同样方式处理，但在转染混合物中不添加DNA。转染后两天，使用补充有HT的CHO-S-SFMII+G418(300μg/mL)对经稳定转染的细胞进行选择。

经6次传代(传代节律2-2-3天)的时间后MCP-1的产物滴度及比产率提高。图15展示系列G的相对MCP-1比产率。所有元件均可使MCP-1平均表达增加。最大增长(4倍)是由元件TE-A产生。在表达序列盒之前及之后使用元件TE-06及TE-21或TE-08同样带来增长。

实施例9：TE元件TE-08对两种免疫球蛋白G-4(IgG-4)的表达的影响

研究在CHO-DG44细胞的稳定转染系列(系列J)中，与无TE元件情况下的表达相比，TE元件TE-08对两种IgG-4抗体的表达的影响。用基本质粒pBIN-LC2或pBIN-LC3及pBID-HC2或pBID-HC3制备24个池，且用pBIN-LC2/TE08或pBIN-LC3/TE08及pBID-HC2/TE08或pBID-HC3/TE08制备24个池(图16；可选择标记NPT＝新霉素磷酸转移酶F240I及dhfr＝二氢叶酸还原酶)。为将由转染混合物中DNA的不同量所引起的对转染效率的任何影响降至最小，在各情况下均使用总计1.2μg的质粒DNA。视所引入的TE元件的尺寸而定，质粒尺寸介于6.1kb与7.5kb之间不等。作为阴性对照，在各转染系列中同时操作模拟转染池，亦即以同样方式处理，但不添加DNA至转染混合物中。转染后两天，使用无HT的CHO-S-SFMII+G418(400μg/mL)对经稳定转染的细胞进行选择。

经4次传代(传代节律2-2-3天)的时间，IGG-4的产物滴度及比产率提高。元件08使得IgG4抗体的表达的平均表达率增加。此外，元件TE-08的存在亦可增加获得高产细胞池的机率。

实施例10：TE元件对293F细胞中的蛋白质表达的影响

研究在HEK293游离型细胞的稳定转染系列(系列K)中，与无TE元件情况下的MCP-1表达相比，各种TE元件对分泌型MCP-1的表达的影响。基本质粒为pTE4-4/MCP-1(图1B；可选择标记NPT＝新霉素磷酸转移酶F240I)。在增强子/启动子的上游顺向使用元件TE-08、TE-13及TE-A，且每种质粒变异体制备7-10个池。为将由转染混合物中DNA的不同量所引起的对转染效率的任何影响降至最小，在各情况下均使用总计1.2μg的质粒DNA。视所引入的TE元件的尺寸而定，质粒尺寸介于6.7kb与10.2kb之间不等。作为阴性对照，在各转染系列中同时操作模拟转染池，亦即以同样方式处理，但不添加DNA至转染混合物中。转染后两天，用293SFMII培养基+4mM谷氨酰胺+G418(100μg/ml)对经稳定转染的细胞进行选择。

经5至6次传代(传代节律2-2-3天)的时间，MCP-1的产物滴度及比产率提高。

实施例11：TE元件TE-08对酶(SEAP)表达的影响

研究在CHO-DG44细胞的稳定转染系列(系列L)中，与无TE元件情况下的SEAP表达相比，TE元件TE-08对酶(SEAP)表达的影响。每种质粒变异体制备6个池。基本质粒为pTE-4/SEAP。其是通过将MCP-1-IRES-DsRed2表达盒替换为SEAP来产生。将元件TE-08克隆至衔接子A中(图1B；可选择标记NPT＝新霉素磷酸转移酶F240I)。为将由转染混合物中DNA的不同量所引起的对转染效率的任何影响降至最小，在各情况下均使用总计1.2μg的质粒DNA。视所引入的TE元件的尺寸而定，质粒尺寸介于6.6kb与7.6kb之间不等。作为阴性对照，在各转染系列中同时操作测试模拟转染池，亦即以同样方式处理，但不添加DNA至转染混合物中。转染后两天，用补充有HT的CHO-S-SFMII+G418(400μg/mL)对经稳定转染的细胞进行选择。

使用可购得的SEAP测定(Clontech)来测定相对SEAP表达，且相对SEAP表达经6次传代(传代节律2-2-3天)的时间提高。

参考文献清单

Adam，M.A.等人，J Virol 1991，65，4985-4990。

Altschul，S.F.等人，Nucleic Acids Res.1997，25，3389-3402。

Altschul，S.F.等人，J Mol Biol 1990，215，403-410。

Aronow，B.J.等人，Mol.Cell.Biol.1995，15，1123-1135。

Ausubel，F.M.等人，Current Protocols in molecular biology.New York：Greene Publishing Associates及Wiley-Interscience 1994(更新)。

Baker，J.E.，Journal of Experimental Medicine 1999，190，669-679。

Bell，A.C.及Felsenfeld，G.，Current Opinion in Genetics&Development1999，9，191-198。

Bennett，R.P.等人，Bio Techniques 1998，24，478-482。

Chalfie，M.等人，Science 1994，263，802-805。

Chamov，S.M.等人，Antibody Fusion Proteins，Wiley-Liss Inc.，1999。

Davies，M.V.等人，J Virol 1992，66，1924-1932。

Delgado，S.等人，EMBO Journal 1998，17，2426-2435。

Faisst，S.等人，Nucleic Acids Research 1992，20，3-26。

Gossen，M.等人，Curr Opi Biotech 1994，5，516-520。

Haber，D.A.等人，Somatic Cell Genetics 1982，8，499-508。

Harris等人，Protein Purification：A Practical Approach，Pickwood及Hames编，IRL Press，1995。

Hemann，C.等人，DNA Cell Biol 1994，13(4)，437-445。

Hu，S.等人，Cancer Res.1996，56(13)，3055-3061。

Huston，C.等人，Proc Natl Acad Sci USA 1988，85(16)，5879-5883。

Jang，S.K.等人，J Virol 1989，63，1651-1660。

Jenuwein，T.等人，Nature 1997，385，269-272。

Kaufman，R.J.，Methods in Enzymology 1990，185，537-566

Klehr，D.等人，Biochemistry 1991，30，1264-1270。

Kortt，A.A.等人，Protein Engineering 1997，10(4)，423-433。

Kwaks，T.H.J.等人，Nature Biotechnology 2003，21，553-558。

Li，Q.等人，Blood 2002，100，3077-3086。

Lottspeich F.及Zorbas H.编，Bioanalytic，Spektrum Akad.Verl.，1998。

Lovejoy，B.等人，Science 1993，259，1288-1293。

McKnight，R.A.等人，PNAS 1992，89，6943-6947。

Monaco，L.等人，Gene 1996，180，145-15。

Morgan，R.A.等人，Nucleic Acids Research 1992，20，1293-1299。

Mosser，D.D.等人，Bio Techniques 1997，22，150-161。

Ortiz，B.D.等人，Molecular&Cellular Biology 1999，19，1901-1909。

Ortiz，B.D.等人，EMBO J 1997，16，5037-5045。

Ohshima，Y.等人，J Mol Biol 1987，195，247-259。

Pack，P.等人，Biotechnology 1993，11，1271-1277。

Pack，P.等人，J Mol Biol 1995，246(11)，28-34。

Pelletier，J.等人，Nature 1988，334，320-325。

Perisic，O.等人，Structure 1994，2，1217-1226。

Pikaart，M.J.等人，Genes Dev 1998，12，2852-2862。

Poljak，L.等人，Nucl.Acids.Res 1994，22，4386-4394。

Ramesh，N.等人，Nucleic Acids Research 1996，24，2697-2700。

Sambrook，J.等人，Molecular Cloning：A Laboratory Manual Cold SpringHarbor Laboratory，Cold Spring Harbor，New York，1989。

Sautter，K.及Enenkel，B.，Biotechnology and Bioengineering 2005，89，530-538。

Scopes，R.，Protein Purification，Springer Verlag，1988。

Simonson，C.C.等人，Proc Natl Acad Sci USA 1983，80，2495-2499。

Stief，A.等人，Nature 1989，341，343-345。

Sugimoto et al.，Biotechnology 1994，12，694-698。

Udvardy，A.等人，Journal of Molecular Biology 1985，185，341-358。

Udvardy，A.，EMBO J 1999，18，1-8。

Urlaub，G.等人，Cell 1983，33，405-412。

Urlaub，G.等人，Somatic Cell&Molecular Genetics 1986，12，555-566。

Werner，R.G.等人，Arzneimittel-Forschung 1998，48，870-880。

Wigler，M.等人，Proc Natl Acad Sci USA 1980，77，3567-3570。

Yoshimura，T.，FEBS Letters 1989，244，487-493。

Zahn-Zabal，M.等人，Journal of Biotechnology 2001，87，29-42。

WO 97/15664

EP-0-393-438

WO 2004/050884

WO 02/081677

US 6,027,915

US 6,309,851

WO 01/04306

WO 00/34318

WO 00/34326

WO 00/34526

WO 01/27150

US 5,122,458

WO 94/05785

WO 92/08796

WO 94/28143

WO 03/004704

序列表

<110>贝林格尔英格海姆法玛两合公司(Boehringer Ingelheim Pharma GmbH&Co.KG)

<120>调控性核酸元件

<130>P01-2092

<160>44

<170>PatentIn version 3.3

<210>1

<211>3788

<212>DNA

<213>人工的

<220>

<223>中国仓鼠(Cricetulus griseus)衍生物，8个额外的核苷酸

<400>1

ccatgagagc ctgaagacct gagttgatac ccagaaccca gatcaagatg gaggagagaa 60

ccagccccac taagctgtcc cctgaccccc ataaatgcct ccctgtccag ttatgccaca 120

caatgatagg tgaatacaga aaaacaccct tcctttagac actaagcgga ttcctcttac 180

gcataccagt taagtgatag ttcttaggct tcaactcagc actttaaaaa gtttatattt 240

tgcaatgctg gggactaaat tagggttgtg cacatgctaa gtaagcactc tacttttgta 300

tcacatttta ataattgtaa gaattaattc gtgaaatagt agctgagaca atagatttgt 360

ttctttcatg tgggaactgc tgtgtgtgct tcttgctgat gcaaacaagg tcaaatactt 420

tattccccag tgtctgccta gccctgtaac acttctctat tatacaatga ccacaaataa 480

ttaggtgagt gggttttgtt tcattttaaa ttgttgctat tttagagaca ggatttcttg 540

caaacctggt tggtcttaaa ctccgtatgt agctgagaat gaccttgaaa accttcctgt 600

cccacccctc aaattccaga attatagaca cccaccacat ggcttaataa gtaaacaaca 660

acaataaaag catgacttct gggtctggag ggagggcttg ccagttaaga gcaatggata 720

ctttcccata gaacctgggt ttgactccca gcactaacct acatggtgat agtgatgcag 780

cagacataca tgagggcaac acacacatgg gcacatacac acgcacccgc ccaccatggc 840

ttttccccca tcacttagac agccatattt aaacgtagtg gagccaggct ggggtggtgg 900

cccacacctt taatcccagc actccagaag gcagaggtag gcggatctct gtgggtttga 960

gaccagcctg gtctacaaga gctagttcca ggacagcctc caaagccata gagaaaccct 1020

atctcaaaaa actgaaacaa caacaacaac aaaacaaaat aaaaaaacaa caaaagaatc 1080

ttagtggttc agtggttcca cacacaggaa agtagaaagg gccttgatgg gaaggttttc 1140

agagggagga gtatggatga gacaggatga tagtgaaaag aactcaaatt aattaaatat 1200

ttgaaactat ctaagaataa aagctaaaat atttaaaatt acagtcaggt agtggtggtg 1260

cagagggcta agttggtaga cacagtgaga tccaggccag ccagggctac ctagtgagac 1320

cttgttcaaa taactaataa aatatacaaa ataaaggaga caccacaata attttgaaat 1380

gtaaaagact aaatttacct tttatattga tgagttggat aaaaaaatca atttaccaga 1440

gaacataaag tagtcccatc aaagacaaaa gcaatatatg attaaactct aatttaaaag 1500

tttgttagag cctggcaacg tggcacatac ctttaatccc agcaccaggg agacagaggc 1560

catcctggtc taaaaagtga tctccaggac agccatggct attacacaga gaaaccctgt 1620

ctggaaaaac aaaaaattag tgtccatgtg taaatgtgtg gagtatgctt gtcatgccac 1680

atacagaggt agagggcagt ttatgggagt cagttcctat tcttccttta tgggggacct 1740

ggggactgaa ctcaggtcat caggcttggc agaaagtgca ttagctcacg gagccttatc 1800

attggcgaaa gctctctcaa gtagaaaatc aatgtgtttg ctcatagtgc aatcattatg 1860

tttcgagagg ggaagggtac aatcgttggg gcatgtgtgg tcacatctga atagcagtag 1920

ctccctagga gaattaattc caagttcttt ggtggtgtat caatgccctt aaaggggtca 1980

acaacttttt ttccctctga caaaactatc ttcttatgtc cttgtccctc atatttgaag 2040

tattttattc tttgcagtgt tgaatatcaa ttctagcacc tcagacatgt taggtaagta 2100

ccctacaact caggttaact aatttaattt aactaattta accccaacac tttttctttg 2160

tttatccaca tttgtggagt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 2220

gtgtgtgtgt gtgtgtgtgt gcgcgcgcgc gcgcgctcgg atcattctac cttttgttta 2280

aaaaatgtta gtccaggggt ggggtgcact gtgaaagtct gagggtaact tgctggggtc 2340

agttctttcc actataggac agaactccag gtgtcaactc tttactgaca gaaccatcca 2400

aatagcccta tctaatttta gttttttatt tatttatttt ttgtttttcg agacagggtt 2460

tctctgtggc tttggaggct gtcctggaac tagctcttgt agaccaggct ggtctcgaac 2520

tcagagatcc acctgcctct gcctcctgag tgctgggatt aaaggcatgc gccaccaacg 2580

cttggctcta cctaatttta aaagagattg tgtgtcacaa gggtgtcatg tcgccctgca 2640

accacccccc ccccaaaaaa aaaaaaaaaa aaacttcact gaagctgaag cacgatgatt 2700

tggttactct ggctggccaa tgagctctag ggagtctcct gtcaaacaga atctcaacag 2760

gcgcagcagt cttttttaaa gtggggttac aacacaggtt tttgcatatc aggcatttta 2820

tctaagctat ttcccagcca aaaatgtgta ttttggaggc agcagagcta atagattaaa 2880

atgagggaag agcccacaca ggttattagg aagataagca tcttctttat ataaaacaaa 2940

accaaaccaa actggaggag gtctaccttt agggatggaa gaaaagacat ttagagggtg 3000

caatagaaag ggcactgagt ttgtgaggtg gaggactggg agagggcgca accgctttaa 3060

ctgtcctgtt ttgcctattt tttggggaca gcacatgttc ctatttttcc caggatgggc 3120

aatctccacg tccaaacttg cggtcgagga ctacagtcat tttgcaggtt tccttactgt 3180

atggctttta aaacgtgcaa aggtgaccat taaccgtttc acgctgggag ggcacgtgcg 3240

gctcagatgc ttcctctgac tgagggccag gagggggcta cacggaagag gccacacccg 3300

cacttgggaa gactcgattt gggcttcagc tggctgagac gccccagcag gctcctcggc 3360

tacaccttca gccccgaatg ccttccggcc cataaccctt cccttctagg catttccggc 3420

gaggacccac cctcgcgcca aacattcggc cccatccccc ggtcctcacc tgaatctcta 3480

actctgactc cagagtttag agactataac cagatagccc ggatgtgtgg aactgcatct 3540

tgggacgagt agttttagca aaaagaaagc gacgaaaaac tacaattccc agacagactt 3600

gtgttacctc tcttctcatg ctaaacaagc cccctttaaa ggaaagcccc tcttagtcgc 3660

atcgactgtg taagaaaggc gtttgaaaca ttttaatgtt gggcacaccg tttcgaggac 3720

cgaaatgaga aagagcatag ggaaacggag cgcccgagct agtctggcac tgcgttagac 3780

agccgcgg 3788

<210>2

<211>2210

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>2

gatctccagg acagccatgg ctattacaca gagaaaccct gtctggaaaa acaaaaaatt 60

agtgtccatg tgtaaatgtg tggagtatgc ttgtcatgcc acatacagag gtagagggca 120

gtttatggga gtcagttcct attcttcctt tatgggggac ctggggactg aactcaggtc 180

atcaggcttg gcagaaagtg cattagctca cggagcctta tcattggcga aagctctctc 240

aagtagaaaa tcaatgtgtt tgctcatagt gcaatcatta tgtttcgaga ggggaagggt 300

acaatcgttg gggcatgtgt ggtcacatct gaatagcagt agctccctag gagaattaat 360

tccaagttct ttggtggtgt atcaatgccc ttaaaggggt caacaacttt ttttccctct 420

gacaaaacta tcttcttatg tccttgtccc tcatatttga agtattttat tctttgcagt 480

gttgaatatc aattctagca cctcagacat gttaggtaag taccctacaa ctcaggttaa 540

ctaatttaat ttaactaatt taaccccaac actttttctt tgtttatcca catttgtgga 600

gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 660

gtgcgcgcgc gcgcgcgctc ggatcattct accttttgtt taaaaaatgt tagtccaggg 720

gtggggtgca ctgtgaaagt ctgagggtaa cttgctgggg tcagttcttt ccactatagg 780

acagaactcc aggtgtcaac tctttactga cagaaccatc caaatagccc tatctaattt 840

tagtttttta tttatttatt ttttgttttt cgagacaggg tttctctgtg gctttggagg 900

ctgtcctgga actagctctt gtagaccagg ctggtctcga actcagagat ccacctgcct 960

ctgcctcctg agtgctggga ttaaaggcat gcgccaccaa cgcttggctc tacctaattt 1020

taaaagagat tgtgtgtcac aagggtgtca tgtcgccctg caaccacccc ccccccaaaa 1080

aaaaaaaaaa aaaaacttca ctgaagctga agcacgatga tttggttact ctggctggcc 1140

aatgagctct agggagtctc ctgtcaaaca gaatctcaac aggcgcagca gtctttttta 1200

aagtggggtt acaacacagg tttttgcata tcaggcattt tatctaagct atttcccagc 1260

caaaaatgtg tattttggag gcagcagagc taatagatta aaatgaggga agagcccaca 1320

caggttatta ggaagataag catcttcttt atataaaaca aaaccaaacc aaactggagg 1380

aggtctacct ttagggatgg aagaaaagac atttagaggg tgcaatagaa agggcactga 1440

gtttgtgagg tggaggactg ggagagggcg caaccgcttt aactgtcctg ttttgcctat 1500

tttttgggga cagcacatgt tcctattttt cccaggatgg gcaatctcca cgtccaaact 1560

tgcggtcgag gactacagtc attttgcagg tttccttact gtatggcttt taaaacgtgc 1620

aaaggtgacc attaaccgtt tcacgctggg agggcacgtg cggctcagat gcttcctctg 1680

actgagggcc aggagggggc tacacggaag aggccacacc cgcacttggg aagactcgat 1740

ttgggcttca gctggctgag acgccccagc aggctcctcg gctacacctt cagccccgaa 1800

tgccttccgg cccataaccc ttcccttcta ggcatttccg gcgaggaccc accctcgcgc 1860

caaacattcg gccccatccc ccggtcctca cctgaatctc taactctgac tccagagttt 1920

agagactata accagatagc ccggatgtgt ggaactgcat cttgggacga gtagttttag 1980

caaaaagaaa gcgacgaaaa actacaattc ccagacagac ttgtgttacc tctcttctca 2040

tgctaaacaa gcccccttta aaggaaagcc cctcttagtc gcatcgactg tgtaagaaag 2100

gcgtttgaaa cattttaatg ttgggcacac cgtttcgagg accgaaatga gaaagagcat 2160

agggaaacgg agcgcccgag ctagtctggc actgcgttag acagccgcgg 2210

<210>3

<211>3005

<212>DNA

<213>人工的

<220>

<223>中国仓鼠(Cricetulus griseus)，通过取代4个碱基来处理内源EcoRI位点

<400>3

gttgctattt tagagacagg atttcttgca aacctggttg gtcttaaact ccgtatgtag 60

ctgagaatga ccttgaaaac cttcctgtcc cacccctcaa attccagaat tatagacacc 120

caccacatgg cttaataagt aaacaacaac aataaaagca tgacttctgg gtctggaggg 180

agggcttgcc agttaagagc aatggatact ttcccataga acctgggttt gactcccagc 240

actaacctac atggtgatag tgatgcagca gacatacatg agggcaacac acgcatgggc 300

acatacacac gcacccgccc accatggctt ttcccccatc acttagacag ccatatttaa 360

acgtagtgga gccaggctgg ggtggtggcc cacaccttta atcccagcac tccagaaggc 420

agaggtaggc ggatctctgt gggtttgaga ccagcctggt ctacaagagc tagttccagg 480

acagcctcca aagccataga gaaaccctat ctcaaaaaac tgaaacaaca acaacaacaa 540

aacaaaataa aaaaacaaca aaagaatctt agtggttcag tggttccaca cacaggaaag 600

tagaaagggc cttgatggga aggttttcag agggaggagt atggatgaga caggatgata 660

gtgaaaagaa ctcaaattaa ttaaatattt gaaactatct aagaataaaa gctaaaatat 720

ttaaaattac agtcaggtag tggtggtgca gagggctaag ttggtagaca cagtgagatc 780

caggccagcc agggctacct agtgagacct tgttcaaata actaataaaa tatacaaaat 840

aaaggagaca ccgcaataat tttgaaatgt aaaagactaa atttaccttt tatattgatg 900

agttggataa aaaaatcaat ttaccagaga acataaagta gtcccatcaa agacaaaagc 960

aatatatgat taaactctaa tttaaaagtt tgttagagcc tggcaacgtg gcacatacct 1020

ttaatcccag caccagggag acagaggcca tcctggtcta aaaagtgatc tccaggacag 1080

ccatggctat tacacagaga aaccctgtct ggaaaaacaa aaaattagtg tccatgtgta 1140

aatgtgtgga gtatgcttgt catgccacat acagaggtag agggcagttt atgggagtca 1200

gttcctattc ttcctttatg ggggacctgg ggactgaact caggtcatca ggcttggcag 1260

aaagtgcatt agctcacgga gccttatcat tggcgaaagc tctctcaagt agaaaatcaa 1320

tgtgtttgct catagtgcaa tcattatgtt tcgagagggg aagggtacaa tcgttggggc 1380

atgtgtggtc acatctgaat agcagtagct ccctaggaga attaattcca agttctttgg 1440

tggtgtatca atgcccttaa aggggtcaac aacttttttt ccctctgaca aaactatctt 1500

cttatgtcct tgtccctcat atttgaagta ttttattctt tgcagtgttg aatatcaatt 1560

ctagcacctc agacatgtta ggtaagtacc ctacaactca ggttaactaa tttaatttaa 1620

ctaatttaac cccaacactt tttctttgtt tatccacattt gtggagtgt gtgtgtgtgt 1680

gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgc gcgcgcgcgc 1740

gcgctcggat cattctacct tttgtttaaa aaatgttagt ccaggggtgg ggtgcactgt 1800

gaaagtctga gggtaacttg ctggggtcag ttctttccac tataggacag aactccaggt 1860

gtcaactctt tactgacaga accatccaaa tagccctatc taattttagt tttttattta 1920

tttatttttt gtttttcgag acagggtttc tctgtggctt tggaggctgt cctggaacta 1980

gctcttgtag accaggctgg tctcgaactc agagatccac ctgcctctgc ctcctgagtg 2040

ctgggattaa aggcatgcgc caccaacgct tggctctacc taattttaaa agagattgtg 2100

tgtcacaagg gtgtcatgtc gccctgcaac cacccccccc ccaaaaaaaa aaaaaaaaaa 2160

acttcactga agctgaagca cgatgatttg gttactctgg ctggccaatg agctctaggg 2220

agtctcctgt caaacagaat ctcaacaggc gcagcagtct tttttaaagt ggggttacaa 2280

cacaggtttt tgcatatcag gcattttatc taagctattt cccagccaaa aatgtgtatt 2340

ttggaggcag cagagctaat agattaaaat gagggaagag cccacacagg ttattaggaa 2400

gataagcatc ttctttatat aaaacaaaac caaaccaaac tggaggaggt ctacctttag 2460

ggatggaaga aaagacattt agagggtgca atagaaaggg cactgagttt gtgaggtgga 2520

ggactgggag agggcgcaac cgctttaact gtcctgtttt gcctattttt tggggacagc 2580

acatgttcct atttttccca ggatgggcaa tctccacgtc caaacttgcg gtcgaggact 2640

acagtcattt tgcaggtttc cttactgtat ggcttttaaa acgtgcaaag gtgaccatta 2700

accgtttcac gctgggaggg cacgtgcggc tcagatgctt cctctgactg agggccagga 2760

gggggctaca cggaagaggc cacacccgca cttgggaaga ctcgatttgg gcttcagctg 2820

gctgagacgc cccagcaggc tcctcggcta caccttcagc cccgaatgcc ttccggccca 2880

taacccttcc cttctaggca tttccggcga ggacccaccc tcgcgccaaa cattcggccc 2940

catcccccgg tcctcacctg aatctctaac tctgactcca gagtttagag actataacca 3000

gatag 3005

<210>4

<211>2517

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>4

caaagccata gagaaaccct atctcaaaaa actgaaacaa caacaacaac aaaacaaaat 60

aaaaaaacaa caaaagaatc ttagtggttc agtggttcca cacacaggaa agtagaaagg 120

gccttgatgg gaaggttttc agagggagga gtatggatga gacaggatga tagtgaaaag 180

aactcaaatt aattaaatat ttgaaactat ctaagaataa aagctaaaat atttaaaatt 240

acagtcaggt agtggtggtg cagagggcta agttggtaga cacagtgaga tccaggccag 300

ccagggctac ctagtgagac cttgttcaaa taactaataa aatatacaaa ataaaggaga 360

caccacaata attttgaaat gtaaaagact aaatttacct tttatattga tgagttggat 420

aaaaaaatca atttaccaga gaacataaag tagtcccatc aaagacaaaa gcaatatatg 480

attaaactct aatttaaaag tttgttagag cctggcaacg tggcacatac ctttaatccc 540

agcaccaggg agacagaggc catcctggtc taaaaagtga tctccaggac agccatggct 600

attacacaga gaaaccctgt ctggaaaaac aaaaaattag tgtccatgtg taaatgtgtg 660

gagtatgctt gtcatgccac atacagaggt agagggcagt ttatgggagt cagttcctat 720

tcttccttta tgggggacct ggggactgaa ctcaggtcat caggcttggc agaaagtgca 780

ttagctcacg gagccttatc attggcgaaa gctctctcaa gtagaaaatc aatgtgtttg 840

ctcatagtgc aatcattatg tttcgagagg ggaagggtac aatcgttggg gcatgtgtgg 900

tcacatctga atagcagtag ctccctagga gaattaattc caagttcttt ggtggtgtat 960

caatgccctt aaaggggtca acaacttttt ttccctctga caaaactatc ttcttatgtc 1020

cttgtccctc atatttgaag tattttattc tttgcagtgt tgaatatcaa ttctagcacc 1080

tcagacatgt taggtaagta ccctacaact caggttaact aatttaattt aactaattta 1140

accccaacac tttttctttg tttatccaca tttgtggagt gtgtgtgtgt gtgtgtgtgt 1200

gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gcgcgcgcgc gcgcgctcgg 1260

atcattctac cttttgttta aaaaatgtta gtccaggggt ggggtgcact gtgaaagtct 1320

gagggtaact tgctggggtc agttctttcc actataggac agaactccag gtgtcaactc 1380

tttactgaca gaaccatcca aatagcccta tctaatttta gttttttatt tatttatttt 1440

ttgtttttcg agacagggtt tctctgtggc tttggaggct gtcctggaac tagctcttgt 1500

agaccaggct ggtctcgaac tcagagatcc acctgcctct gcctcctgag tgctgggatt 1560

aaaggcatgc gccaccaacg cttggctcta cctaatttta aaagagattg tgtgtcacaa 1620

gggtgtcatg tcgccctgca accacccccc ccccaaaaaa aaaaaaaaaa aaacttcact 1680

gaagctgaag cacgatgatt tggttactct ggctggccaa tgagctctag ggagtctcct 1740

gtcaaacaga atctcaacag gcgcagcagt cttttttaaa gtggggttac aacacaggtt 1800

tttgcatatc aggcatttta tctaagctat ttcccagcca aaaatgtgta ttttggaggc 1860

agcagagcta atagattaaa atgagggaag agcccacaca ggttattagg aagataagca 1920

tcttctttat ataaaacaaa accaaaccaa actggaggag gtctaccttt agggatggaa 1980

gaaaagacat ttagagggtg caatagaaag ggcactgagt ttgtgaggtg gaggactggg 2040

agagggcgca accgctttaa ctgtcctgtt ttgcctattt tttggggaca gcacatgttc 2100

ctatttttcc caggatgggc aatctccacg tccaaacttg cggtcgagga ctacagtcat 2160

tttgcaggtt tccttactgt atggctttta aaacgtgcaa aggtgaccat taaccgtttc 2220

acgctgggag ggcacgtgcg gctcagatgc ttcctctgac tgagggccag gagggggcta 2280

cacggaagag gccacacccg cacttgggaa gactcgattt gggcttcagc tggctgagac 2340

gccccagcag gctcctcggc tacaccttca gccccgaatg ccttccggcc cataaccctt 2400

cccttctagg catttccggc gaggacccac cctcgcgcca aacattcggc cccatccccc 2460

ggtcctcacc tgaatctcta actctgactc cagagtttag agactataac cagatag 2517

<210>5

<211>1989

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>5

acctttaatc ccagcaccag ggagacagag gccatcctgg tctaaaaagt gatctccagg 60

acagccatgg ctattacaca gagaaaccct gtctggaaaa acaaaaaatt agtgtccatg 120

tgtaaatgtg tggagtatgc ttgtcatgcc acatacagag gtagagggca gtttatggga 180

gtcagttcct attcttcctt tatgggggac ctggggactg aactcaggtc atcaggcttg 240

gcagaaagtg cattagctca cggagcctta tcattggcga aagctctctc aagtagaaaa 300

tcaatgtgtt tgctcatagt gcaatcatta tgtttcgaga ggggaagggt acaatcgttg 360

gggcatgtgt ggtcacatct gaatagcagt agctccctag gagaattaat tccaagttct 420

ttggtggtgt atcaatgccc ttaaaggggt caacaacttt ttttccctct gacaaaacta 480

tcttcttatg tccttgtccc tcatatttga agtattttat tctttgcagt gttgaatatc 540

aattctagca cctcagacat gttaggtaag taccctacaa ctcaggttaa ctaatttaat 600

ttaactaatt taaccccaac actttttctt tgtttatcca catttgtgga gtgtgtgtgt 660

gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgcgcgcgc 720

gcgcgcgctc ggatcattct accttttgtt taaaaaatgt tagtccaggg gtggggtgca 780

ctgtgaaagt ctgagggtaa cttgctgggg tcagttcttt ccactatagg acagaactcc 840

aggtgtcaac tctttactga cagaaccatc caaatagccc tatctaattt tagtttttta 900

tttatttatt ttttgttttt cgagacaggg tttctctgtg gctttggagg ctgtcctgga 960

dctagctctt gtagaccagg ctggtctcga actcagagat ccacctgcct ctgcctcctg 1020

agtgctggga ttaaaggcat gcgccaccaa cgcttggctc tacctaattt taaaagagat 1080

tgtgtgtcac aagggtgtca tgtcgccctg caaccacccc ccccccaaaa aaaaaaaaaa 1140

aaaaacttca ctgaagctga agcacgatga tttggttact ctggctggcc aatgagctct 1200

agggagtctc ctgtcaaaca gaatctcaac aggcgcagca gtctttttta aagtggggtt 1260

acaacacagg tttttgcata tcaggcattt tatctaagct atttcccagc caaaaatgtg 1320

tattttggag gcagcagagc taatagatta aaatgaggga agagcccaca caggttatta 1380

ggaagataag catcttcttt atataaaaca aaaccaaacc aaactggagg aggtctacct 1440

ttagggatgg aagaaaagac atttagaggg tgcaatagaa agggcactga gtttgtgagg 1500

tggaggactg ggagagggcg caaccgcttt aactgtcctg ttttgcctat tttttgggga 1560

cagcacatgt tcctattttt cccaggatgg gcaatctcca cgtccaaact tgcggtcgag 1620

gactacagtc attttgcagg tttccttact gtatggcttt taaaacgtgc aaaggtgacc 1680

attaaccgtt tcacgctggg agggcacgtg cggctcagat gcttcctctg actgagggcc 1740

aggagggggc tacacggaag aggccacacc cgcacttggg aagactcgat ttgggcttca 1800

gctggctgag acgccccagc aggctcctcg gctacacctt cagccccgaa tgccttccgg 1860

cccataaccc ttcccttcta ggcatttccg gcgaggaccc accctcgcgc caaacattcg 1920

gccccatccc ccggtcctca cctgaatctc taactctgac tccagagttt agagactata 1980

accagatag 1989

<210>6

<211>1512

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>6

ctatcttctt atgtccttgt ccctcatatt tgaagtattt tattctttgc agtgttgaat 60

atcaattcta gcacctcaga catgttaggt aagtacccta caactcaggt taactaattt 120

aatttaacta atttaacccc aacacttttt ctttgtttat ccacatttgt ggagtgtgtg 180

tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgcgcg 240

cgcgcgcgcg ctcggatcat tctacctttt gtttaaaaaa tgttagtcca ggggtggggt 300

gcactgtgaa agtctgaggg taacttgctg gggtcagttc tttccactat aggacagaac 360

tccaggtgtc aactctttac tgacagaacc atccaaatag ccctatctaa ttttagtttt 420

ttatttattt attttttgtt tttcgagaca gggtttctct gtggctttgg aggctgtcct 480

ggaactagct cttgtagacc aggctggtct cgaactcaga gatccacctg cctctgcctc 540

ctgagtgctg ggattaaagg catgcgccac caacgcttgg ctctacctaa ttttaaaaga 600

gattgtgtgt cacaagggtg tcatgtcgcc ctgcaaccac ccccccccca aaaaaaaaaa 660

aaaaaaaact tcactgaagc tgaagcacga tgatttggtt actctggctg gccaatgagc 720

tctagggagt ctcctgtcaa acagaatctc aacaggcgca gcagtctttt ttaaagtggg 780

gttacaacac aggtttttgc atatcaggca ttttatctaa gctatttccc agccaaaaat 840

gtgtattttg gaggcagcag agctaataga ttaaaatgag ggaagagccc acacaggtta 900

ttaggaagat aagcatcttc tttatataaa acaaaaccaa accaaactgg aggaggtcta 960

cctttaggga tggaagaaaa gacatttaga gggtgcaata gaaagggcac tgagtttgtg 1020

aggtggagga ctgggagagg gcgcaaccgc tttaactgtc ctgttttgcc tattttttgg 1080

ggacagcaca tgttcctatt tttcccagga tgggcaatct ccacgtccaa acttgcggtc 1140

gaggactaca gtcattttgc aggtttcctt actgtatggc ttttaaaacg tgcaaaggtg 1200

accattaacc gtttcacgct gggagggcac gtgcggctca gatgcttcct ctgactgagg 1260

gccaggaggg ggctacacgg aagaggccac acccgcactt gggaagactc gatttgggct 1320

tcagctggct gagacgcccc agcaggctcc tcggctacac cttcagcccc gaatgccttc 1380

cggcccataa cccttccctt ctaggcattt ccggcgagga cccaccctcg cgccaaacat 1440

tcggccccat cccccggtcc tcacctgaat ctctaactct gactccagag tttagagact 1500

ataaccagat ag 1512

<210>7

<211>1013

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>7

caggctggtc tcgaactcag agatccacct gcctctgcct cctgagtgct gggattaaag 60

gcatgcgcca ccaacgcttg gctctaccta attttaaaag agattgtgtg tcacaagggt 120

gtcatgtcgc cctgcaacca cccccccccc aaaaaaaaaa aaaaaaaaac ttcactgaag 180

ctgaagcacg atgatttggt tactctggct ggccaatgag ctctagggag tctcctgtca 240

aacagaatct caacaggcgc agcagtcttt tttaaagtgg ggttacaaca caggtttttg 300

catatcaggc attttatcta agctatttcc cagccaaaaa tgtgtatttt ggaggcagca 360

gagctaatag attaaaatga gggaagagcc cacacaggtt attaggaaga taagcatctt 420

ctttatataa aacaaaacca aaccaaactg gaggaggtct acctttaggg atggaagaaa 480

agacatttag agggtgcaat agaaagggca ctgagtttgt gaggtggagg actgggagag 540

ggcgcaaccg ctttaactgt cctgttttgc ctattttttg gggacagcac atgttcctat 600

ttttcccagg atgggcaatc tccacgtcca aacttgcggt cgaggactac agtcattttg 660

caggtttcct tactgtatgg cttttaaaac gtgcaaaggt gaccattaac cgtttcacgc 720

tgggagggca cgtgcggctc agatgcttcc tctgactgag ggccaggagg gggctacacg 780

gaagaggcca cacccgcact tgggaagact cgatttgggc ttcagctggc tgagacgccc 840

cagcaggctc ctcggctaca ccttcagccc cgaatgcctt ccggcccata acccttccct 900

tctaggcatt tccggcgagg acccaccctc gcgccaaaca ttcggcccca tcccccggtc 960

ctcacctgaa tctctaactc tgactccaga gtttagagac tataaccaga tag 1013

<210>8

<211>381

<212>DNA

<213>人工的

<220>

<223>中国仓鼠(Cricetulus griseus)序列中的突变体/点突变

<400>8

cttgcggtcg aggactacag tcattttgca ggtttcctta ctgtatggct tttaaaacgt 60

gcaaaggtga ccattaaccg tttcacgctg ggagggcacg tgcggctcag atgcttcctc 120

tgactgaggg ccaggagggg gctacacgga agaggccaca cccgcacttg ggaagactcg 180

atttgggctt cagctggctg agacgcccca gcaggctcct cggctacacc ttcagccccg 240

aatgccttcc ggcccataac ccttcccttc taggcatttc cggcgaggac ccaccctcgc 300

gccaaacatt cggccccatc ccccggtcct cacctgaatc tctaactctg actccagagt 360

ttagcgacta taaccagata g 381

<210>9

<211>529

<212>DNA

<213>中国仓鼠(Cricetulu sgriseus)

<400>9

gcctgaagac ctgagttgat acccagaacc cagatcaaga tggaggagag aaccagcccc 60

actaagctgt cccctgaccc ccataaatgc ctccctgtcc agttatgcca cacaatgata 120

ggtgaataca gaaaaacacc cttcctttag acactaagcg gattcctctt acgcatacca 180

gttaagtgat agttcttagg cttcaactca gcactttaaa aagtttatat tttgcaatgc 240

tggggactaa attagggttg tgcacatgct aagtaagcac tctacttttg tatcacattt 300

taataattgt aagaattaat tcgtgaaata gtagctgaga caatagattt gtttctttca 360

tgtgggaact gctgtgtgtg cttcttgctg atgcaaacaa ggtcaaatac tttattcccc 420

agtgtctgcc tagccctgta acacttctct attatacaat gaccacaaat aattaggtga 480

gtgggtttt gtttcatttta aattgttgct attttagaga caggatttc 529

<210>10

<211>1015

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>10

gcctgaagac ctgagttgat acccagaacc cagatcaaga tggaggagag aaccagcccc 60

actaagctgt cccctgaccc ccataaatgc ctccctgtcc agttatgcca cacaatgata 120

ggtgaataca gaaaaacacc cttcctttag acactaagcg gattcctctt acgcatacca 180

gttaagtgat agttcttagg cttcaactca gcactttaaa aagtttatat tttgcaatgc 240

tggggactaa attagggttg tgcacatgct aagtaagcac tctacttttg tatcacattt 300

taataattgt aagaattaat tcgtgaaata gtagctgaga caatagattt gtttctttca 360

tgtgggaact gctgtgtgtg cttcttgctg atgcaaacaa ggtcaaatac tttattcccc 420

agtgtctgcc tagccctgta acacttctct attatacaat gaccacaaat aattaggtga 480

gtgggttttg tttcatttta aattgttgct attttagaga caggatttct tgcaaacctg 540

gttggtctta aactccgtat gtagctgaga atgaccttga aaaccttcct gtcccacccc 600

tcaaattcca gaattataga cacccaccac atggcttaat aagtaaacaa caacaataaa 660

agcatgactt ctgggtctgg agggagggct tgccagttaa gagcaatgga tactttccca 720

tagaacctgg gtttgactcc cagcactaac ctacatggtg atagtgatgc agcagacata 780

catgagggca acacacacat gggcacatac acacgcaccc gcccaccatg gcttttcccc 840

catcacttag acagccatat ttaaacgtag tggagccagg ctggggtggt ggcccacacc 900

tttaatccca gcactccaga aggcagaggt aggcggatct ctgtgggttt gagaccagcc 960

tggtctacaa gagctagttc caggacagcc tccaaagcca tagagaaacc ctatc 1015

<210>11

<211>1541

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>11

gcctgaagac ctgagttgat acccagaacc cagatcaaga tggaggagag aaccagcccc 60

actaagctgt cccctgaccc ccataaatgc ctccctgtcc agttatgcca cacaatgata 120

ggtgaataca gaaaaacacc cttcctttag acactaagcg gattcctctt acgcatacca 180

gttaagtgat agttcttagg cttcaactca gcactttaaa aagtttatat tttgcaatgc 240

tggggactaa attagggttg tgcacatgct aagtaagcac tctacttttg tatcacattt 300

taataattgt aagaattaat tcgtgaaata gtagctgaga caatagattt gtttctttca 360

tgtgggaact gctgtgtgtg cttcttgctg atgcaaacaa ggtcaaatac tttattcccc 420

agtgtctgcc tagccctgta acacttctct attatacaat gaccacaaat aattaggtga 480

gtgggttttg tttcatttta aattgttgct attttagaga caggatttct tgcaaacctg 540

gttggtctta aactccgtat gtagctgaga atgaccttga aaaccttcct gtcccacccc 600

tcaaattcca gaattataga cacccaccac atggcttaat aagtaaacaa caacaataaa 660

agcatgactt ctgggtctgg agggagggct tgccagttaa gagcaatgga tactttccca 720

tagaacctgg gtttgactcc cagcactaac ctacatggtg atagtgatgc agcagacata 780

catgagggca acacacacat gggcacatac acacgcaccc gcccaccatg gcttttcccc 840

catcacttag acagccatat ttaaacgtag tggagccagg ctggggtggt ggcccacacc 900

tttaatccca gcactccaga aggcagaggt aggcggatct ctgtgggttt gagaccagcc 960

tggtctacaa gagctagttc caggacagcc tccaaagcca tagagaaacc ctatctcaaa 1020

aaactgaaac aacaacaaca acaaaacaaa ataaaaaaac aacaaaagaa tcttagtggt 1080

tcagtggttc cacacacagg aaagtagaaa gggccttgat gggaaggttt tcagagggag 1140

gagtatggat gagacaggat gatagtgaaa agaactcaaa ttaattaaat atttgaaact 1200

atctaagaat aaaagctaaa atatttaaaa ttacagtcag gtagtggtgg tgcagagggc 1260

taagttggta gacacagtga gatccaggcc agccagggct acctagtgag accttgttca 1320

aataactaat aaaatataca aaataaagga gacaccacaa taattttgaa atgtaaaaga 1380

ctaaatttac cttttatatt gatgagttgg ataaaaaaat caatttacca gagaacataa 1440

agtagtccca tcaaagacaa aagcaatata tgattaaact ctaatttaaa agtttgttag 1500

agcctggcaa cgtggcacat acctttaatc ccagcaccag g 1541

<210>12

<211>2020

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>12

gcctgaagac ctgagttgat acccagaacc cagatcaaga tggaggagag aaccagcccc 60

actaagctgt cccctgaccc ccataaatgc ctccctgtcc agttatgcca cacaatgata 120

ggtgaataca gaaaaacacc cttcctttag acactaagcg gattcctctt acgcatacca 180

gttaagtgat agttcttagg cttcaactca gcactttaaa aagtttatat tttgcaatgc 240

tggggactaa attagggttg tgcacatgct aagtaagcac tctacttttg tatcacattt 300

taataattgt aagaattaat tcgtgaaata gtagctgaga caatagattt gtttctttca 360

tgtgggaact gctgtgtgtg cttcttgctg atgcaaacaa ggtcaaatac tttattcccc 420

agtgtctgcc tagccctgta acacttctct attatacaat gaccacaaat aattaggtga 480

gtgggttttg tttcatttta aattgttgct attttagaga caggatttct tgcaaacctg 540

gttggtctta aactccgtat gtagctgaga atgaccttga aaaccttcct gtcccacccc 600

tcaaattcca gaattataga cacccaccac atggcttaat aagtaaacaa caacaataaa 660

agcatgactt ctgggtctgg agggagggct tgccagttaa gagcaatgga tactttccca 720

tagaacctgg gtttgactcc cagcactaac ctacatggtg atagtgatgc agcagacata 780

catgagggca acacacacat gggcacatac acacgcaccc gcccaccatg gcttttcccc 840

catcacttag acagccatat ttaaacgtag tggagccagg ctggggtggt ggcccacacc 900

tttaatccca gcactccaga aggcagaggt aggcggatct ctgtgggttt gagaccagcc 960

tggtctacaa gagctagttc caggacagcc tccaaagcca tagagaaacc ctatctcaaa 1020

aaactgaaac aacaacaaca acaaaacaaa ataaaaaaac aacaaaagaa tcttagtggt 1080

tcagtggttc cacacacagg aaagtagaaa gggccttgat gggaaggttt tcagagggag 1140

gagtatggat gagacaggat gatagtgaaa agaactcaaa ttaattaaat atttgaaact 1200

atctaagaat aaaagctaaa atatttaaaa ttacagtcag gtagtggtgg tgcagagggc 1260

taagttggta gacacagtga gatccaggcc agccagggct acctagtgag accttgttca 1320

aataactaat aaaatataca aaataaagga gacaccacaa taattttgaa atgtaaaaga 1380

ctaaatttac cttttatatt gatgagttgg ataaaaaaat caatttacca gagaacataa 1440

agtagtccca tcaaagacaa aagcaatata tgattaaact ctaatttaaa agtttgttag 1500

agcctggcaa cgtggcacat acctttaatc ccagcaccag ggagacagag gccatcctgg 1560

tctaaaaagt gatctccagg acagccatgg ctattacaca gagaaaccct gtctggaaaa 1620

acaaaaaatt agtgtccatg tgtaaatgtg tggagtatgc ttgtcatgcc acatacagag 1680

gtagagggca gtttatggga gtcagttcct attcttcctt tatgggggac ctggggactg 1740

aactcaggtc atcaggcttg gcagaaagtg cattagctca cggagcctta tcattggcga 1800

aagctctctc aagtagaaaa tcaatgtgtt tgctcatagt gcaatcatta tgtttcgaga 1860

ggggaagggt acaatcgttg gggcatgtgt ggtcacatct gaatagcagt agctccctag 1920

gagaattaat tccaagttct ttggtggtgt atcaatgccc ttaaaggggt caacaacttt 1980

ttttccctct gacaaaacta tcttcttatg tccttgtccc 2020

<210>13

<211>2516

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>13

gcctgaagac ctgagttgat acccagaacc cagatcaaga tggaggagag aaccagcccc 60

actaagctgt cccctgaccc ccataaatgc ctccctgtcc agttatgcca cacaatgata 120

ggtgaataca gaaaaacacc cttcctttag acactaagcg gattcctctt acgcatacca 180

gttaagtgat agttcttagg cttcaactca gcactttaaa aagtttatat tttgcaatgc 240

tggggactaa attagggttg tgcacatgct aagtaagcac tctacttttg tatcacattt 300

taataattgt aagaattaat tcgtgaaata gtagctgaga caatagattt gtttctttca 360

tgtgggaact gctgtgtgtg cttcttgctg atgcaaacaa ggtcaaatac tttattcccc 420

agtgtctgcc tagccctgta acacttctct attatacaat gaccacaaat aattaggtga 480

gtgggttttg tttcatttta aattgttgct attttagaga caggatttct tgcaaacctg 540

gttggtctta aactccgtat gtagctgaga atgaccttga aaaccttcct gtcccacccc 600

tcaaattcca gaattataga cacccaccac atggcttaat aagtaaacaa caacaataaa 660

agcatgactt ctgggtctgg agggagggct tgccagttaa gagcaatgga tactttccca 720

tagaacctgg gtttgactcc cagcactaac ctacatggtg atagtgatgc agcagacata 780

catgagggca acacacacat gggcacatac acacgcaccc gcccaccatg gcttttcccc 840

catcacttag acagccatat ttaaacgtag tggagccagg ctggggtggt ggcccacacc 900

tttaatccca gcactccaga aggcagaggt aggcggatct ctgtgggttt gagaccagcc 960

tggtctacaa gagctagttc caggacagcc tccaaagcca tagagaaacc ctatctcaaa 1020

aaactgaaac aacaacaaca acaaaacaaa ataaaaaaac aacaaaagaa tcttagtggt 1080

tcagtggttc cacacacagg aaagtagaaa gggccttgat gggaaggttt tcagagggag 1140

gagtatggat gagacaggat gatagtgaaa agaactcaaa ttaattaaat atttgaaact 1200

atctaagaat aaaagctaaa atatttaaaa ttacagtcag gtagtggtgg tgcagagggc 1260

taagttggta gacacagtga gatccaggcc agccagggct acctagtgag accttgttca 1320

aataactaat aaaatataca aaataaagga gacaccacaa taattttgaa atgtaaaaga 1380

ctaaatttac cttttatatt gatgagttgg ataaaaaaat caatttacca gagaacataa 1440

agtagtccca tcaaagacaa aagcaatata tgattaaact ctaatttaaa agtttgttag 1500

agcctggcaa cgtggcacat acctttaatc ccagcaccag ggagacagag gccatcctgg 1560

tctaaaaagt gatctccagg acagccatgg ctattacaca gagaaaccct gtctggaaaa 1620

acaaaaaatt agtgtccatg tgtaaatgtg tggagtatgc ttgtcatgcc acatacagag 1680

gtagagggca gtttatggga gtcagttcct attcttcctt tatgggggac ctggggactg 1740

aactcaggtc atcaggcttg gcagaaagtg cattagctca cggagcctta tcattggcga 1800

aagctctctc aagtagaaaa tcaatgtgtt tgctcatagt gcaatcatta tgtttcgaga 1860

ggggaagggt acaatcgttg gggcatgtgt ggtcacatct gaatagcagt agctccctag 1920

gagaattaat tccaagttct ttggtggtgt atcaatgccc ttaaaggggt caacaacttt 1980

ttttccctct gacaaaacta tcttcttatg tccttgtccc tcatatttga agtattttat 2040

tctttgcagt gttgaatatc aattctagca cctcagacat gttaggtaag taccctacaa 2100

ctcaggttaa ctaatttaat ttaactaatt taaccccaac actttttctt tgtttatcca 2160

catttgtgga gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 2220

gtgtgtgtgt gtgcgcgcgc gcgcgcgctc ggatcattct accttttgtt taaaaaatgt 2280

tagtccaggg gtggggtgca ctgtgaaagt ctgagggtaa cttgctgggg tcagttcttt 2340

ccactatagg acagaactcc aggtgtcaac tctttactga cagaaccatc caaatagccc 2400

tatctaattt tagtttttta tttatttatt ttttgttttt cgagacaggg tttctctgtg 2460

gctttggagg ctgtcctgga actagctctt gtagaccagg ctggtctcga actcag 2516

<210>14

<211>3148

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>14

gcctgaagac ctgagttgat acccagaacc cagatcaaga tggaggagag aaccagcccc 60

actaagctgt cccctgaccc ccataaatgc ctccctgtcc agttatgcca cacaatgata 120

ggtgaataca gaaaaacacc cttcctttag acactaagcg gattcctctt acgcatacca 180

gttaagtgat agttcttagg cttcaactca gcactttaaa aagtttatat tttgcaatgc 240

tggggactaa attagggttg tgcacatgct aagtaagcac tctacttttg tatcacattt 300

taataattgt aagaattaat tcgtgaaata gtagctgaga caatagattt gtttctttca 360

tgtgggaact gctgtgtgtg cttcttgctg atgcaaacaa ggtcaaatac tttattcccc 420

agtgtctgcc tagccctgta acacttctct attatacaat gaccacaaat aattaggtga 480

gtgggttttg tttcatttta aattgttgct attttagaga caggatttct tgcaaacctg 540

gttggtctta aactccgtat gtagctgaga atgaccttga aaaccttcct gtcccacccc 600

tcaaattcca gaattataga cacccaccac atggcttaat aagtaaacaa caacaataaa 660

agcatgactt ctgggtctgg agggagggct tgccagttaa gagcaatgga tactttccca 720

tagaacctgg gtttgactcc cagcactaac ctacatggtg atagtgatgc agcagacata 780

catgagggca acacacacat gggcacatac acacgcaccc gcccaccatg gcttttcccc 840

catcacttag acagccatat ttaaacgtag tggagccagg ctggggtggt ggcccacacc 900

tttaatccca gcactccaga aggcagaggt aggcggatct ctgtgggttt gagaccagcc 960

tggtctacaa gagctagttc caggacagcc tccaaagcca tagagaaacc ctatctcaaa 1020

aaactgaaac aacaacaaca acaaaacaaa ataaaaaaac aacaaaagaa tcttagtggt 1080

tcagtggttc cacacacagg aaagtagaaa gggccttgat gggaaggttt tcagagggag 1140

gagtatggat gagacaggat gatagtgaaa agaactcaaa ttaattaaat atttgaaact 1200

atctaagaat aaaagctaaa atatttaaaa ttacagtcag gtagtggtgg tgcagagggc 1260

taagttggta gacacagtga gatccaggcc agccagggct acctagtgag accttgttca 1320

aataactaat aaaatataca aaataaagga gacaccacaa taattttgaa atgtaaaaga 1380

ctaaatttac cttttatatt gatgagttgg ataaaaaaat caatttacca gagaacataa 1440

agtagtccca tcaaagacaa aagcaatata tgattaaact ctaatttaaa agtttgttag 1500

agcctggcaa cgtggcacat acctttaatc ccagcaccag ggagacagag gccatcctgg 1560

tctaaaaagt gatctccagg acagccatgg ctattacaca gagaaaccct gtctggaaaa 1620

acaaaaaatt agtgtccatg tgtaaatgtg tggagtatgc ttgtcatgcc acatacagag 1680

gtagagggca gtttatggga gtcagttcct attcttcctt tatgggggac ctggggactg 1740

aactcaggtc atcaggcttg gcagaaagtg cattagctca cggagcctta tcattggcga 1800

aagctctctc aagtagaaaa tcaatgtgtt tgctcatagt gcaatcatta tgtttcgaga 1860

ggggaagggt acaatcgttg gggcatgtgt ggtcacatct gaatagcagt agctccctag 1920

gagaattaat tccaagttct ttggtggtgt atcaatgccc ttaaaggggt caacaacttt 1980

ttttccctct gacaaaacta tcttcttatg tccttgtccc tcatatttga agtattttat 2040

tctttgcagt gttgaatatc aattctagca cctcagacat gttaggtaag taccctacaa 2100

ctcaggttaa ctaatttaat ttaactaatt taaccccaac actttttctt tgtttatcca 2160

catttgtgga gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 2220

gtgtgtgtgt gtgcgcgcgc gcgcgcgctc ggatcattct accttttgtt taaaaaatgt 2280

tagtccaggg gtggggtgca ctgtgaaagt ctgagggtaa cttgctgggg tcagttcttt 2340

ccactatagg acagaactcc aggtgtcaac tctttactga cagaaccatc caaatagccc 2400

tatctaattt tagtttttta tttatttatt ttttgttttt cgagacaggg tttctctgtg 2460

gctttggagg ctgtcctgga actagctctt gtagaccagg ctggtctcga actcagagat 2520

ccacctgcct ctgcctcctg agtgctggga ttaaaggcat gcgccaccaa cgcttggctc 2580

tacctaattt taaaagagat tgtgtgtcac aagggtgtca tgtcgccctg caaccacccc 2640

ccccccaaaa aaaaaaaaaa aaaaacttca ctgaagctga agcacgatga tttggttact 2700

ctggctggcc aatgagctct agggagtctc ctgtcaaaca gaatctcaac aggcgcagca 2760

gtctttttta aagtggggtt acaacacagg tttttgcata tcaggcattt tatctaagct 2820

atttcccagc caaaaatgtg tattttggag gcagcagagc taatagatta aaatgaggga 2880

agagcccaca caggttatta ggaagataag catcttcttt atataaaaca aaaccaaacc 2940

aaactggagg aggtctacct ttagggatgg aagaaaagac atttagaggg tgcaatagaa 3000

agggcactga gtttgtgagg tggaggactg ggagagggcg caaccgcttt aactgtcctg 3060

ttttgcctat tttttgggga cagcacatgt tcctattttt cccaggatgg gcaatctcca 3120

cgtccaaact tgcggtcgag gactacag 3148

<210>15

<211>511

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>15

gttgctattt tagagacagg atttcttgca aacctggttg gtcttaaact ccgtatgtag 60

ctgagaatga ccttgaaaac cttcctgtcc cacccctcaa attccagaat tatagacacc 120

caccacatgg cttaataagt aaacaacaac aataaaagca tgacttctgg gtctggaggg 180

agggcttgcc agttaagagc aatggatact ttcccataga acctgggttt gactcccagc 240

actaacctac atggtgatag tgatgcagca gacatacatg agggcaacac acacatgggc 300

acatacacac gcacccgccc accatggctt ttcccccatc acttagacag ccatatttaa 360

acgtagtgga gccaggctgg ggtggtggcc cacaccttta atcccagcac tccagaaggc 420

agaggtaggc ggatctctgt gggtttgaga ccagcctggt ctacaagagc tagttccagg 480

acagcctcca aagccataga gaaaccctat c 511

<210>16

<211>549

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>16

caaagccata gagaaaccct atctcaaaaa actgaaacaa caacaacaac aaaacaaaat 60

aaaaaaacaa caaaagaatc ttagtggttc agtggttcca cacacaggaa agtagaaagg 120

gccttgatgg gaaggttttc agagggagga gtatggatga gacaggatga tagtgaaaag 180

aactcaaatt aattaaatat ttgaaactat ctaagaataa aagctaaaat atttaaaatt 240

acagtcaggt agtggtggtg cagagggcta agttggtaga cacagtgaga tccaggccag 300

ccagggctac ctagtgagac cttgttcaaa taactaataa aatatacaaa ataaaggaga 360

caccacaata attttgaaat gtaaaagact aaatttacct tttatattga tgagttggat 420

aaaaaaatca atttaccaga gaacataaag tagtcccatc aaagacaaaa gcaatatatg 480

attaaactct aatttaaaag tttgttagag cctggcaacg tggcacatac ctttaatccc 540

agcaccagg 549

<210>17

<211>1037

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>17

gttgctattt tagagacagg atttcttgca aacctggttg gtcttaaact ccgtatgtag 60

ctgagaatga ccttgaaaac cttcctgtcc cacccctcaa attccagaat tatagacacc 120

caccacatgg cttaataagt aaacaacaac aataaaagca tgacttctgg gtctggaggg 180

agggcttgcc agttaagagc aatggatact ttcccataga acctgggttt gactcccagc 240

actaacctac atggtgatag tgatgcagca gacatacatg agggcaacac acacatgggc 300

acatacacac gcacccgccc accatggctt ttcccccatc acttagacag ccatatttaa 360

acgtagtgga gccaggctgg ggtggtggcc cacaccttta atcccagcac tccagaaggc 420

agaggtaggc ggatctctgt gggtttgaga ccagcctggt ctacaagagc tagttccagg 480

acagcctcca aagccataga gaaaccctat ctcaaaaaac tgaaacaaca acaacaacaa 540

aacaaaataa aaaaacaaca aaagaatctt agtggttcag tggttccaca cacaggaaag 600

tagaaagggc cttgatggga aggttttcag agggaggagt atggatgaga caggatgata 660

gtgaaaagaa ctcaaattaa ttaaatattt gaaactatct aagaataaaa gctaaaatat 720

ttaaaattac agtcaggtag tggtggtgca gagggctaag ttggtagaca cagtgagatc 780

caggccagcc agggctacct agtgagacct tgttcaaata actaataaaa tatacaaaat 840

aaaggagaca ccacaataat tttgaaatgt aaaagactaa atttaccttt tatattgatg 900

agttggataa aaaaatcaat ttaccagaga acataaagta gtcccatcaa agacaaaagc 960

aatatatgat taaactctaa tttaaaagtt tgttagagcc tggcaacgtg gcacatacct 1020

ttaatcccag caccagg 1037

<210>18

<211>500

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>18

acctttaatc ccagcaccag ggagacagag gccatcctgg tctaaaaagt gatctccagg 60

acagccatgg ctattacaca gagaaaccct gtctggaaaa acaaaaaatt agtgtccatg 120

tgtaaatgtg tggagtatgc ttgtcatgcc acatacagag gtagagggca gtttatggga 180

gtcagttcct attcttcctt tatgggggac ctggggactg aactcaggtc atcaggcttg 240

gcagaaagtg cattagctca cggagcctta tcattggcga aagctctctc aagtagaaaa 300

tcaatgtgtt tgctcatagt gcaatcatta tgtttcgaga ggggaagggt acaatcgttg 360

gggcatgtgt ggtcacatct gaatagcagt agctccctag gagaattaat tccaagttct 420

ttggtggtgt atcaatgccc ttaaaggggt caacaacttt ttttccctct gacaaaacta 480

tcttcttatg tccttgtccc 500

<210>19

<211>1028

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>19

caaagccata gagaaaccct atctcaaaaa actgaaacaa caacaacaac aaaacaaaat 60

aaaaaaacaa caaaagaatc ttagtggttc agtggttcca cacacaggaa agtagaaagg 120

gccttgatgg gaaggttttc agagggagga gtatggatga gacaggatga tagtgaaaag 180

aactcaaatt aattaaatat ttgaaactat ctaagaataa aagctaaaat atttaaaatt 240

acagtcaggt agtggtggtg cagagggcta agttggtaga cacagtgaga tccaggccag 300

ccagggctac ctagtgagac cttgttcaaa taactaataa aatatacaaa ataaaggaga 360

caccacaata attttgaaat gtaaaagact aaatttacct tttatattga tgagttggat 420

aaaaaaatca atttaccaga gaacataaag tagtcccatc aaagacaaaa gcaatatatg 480

attaaactct aatttaaaag tttgttagag cctggcaacg tggcacatac ctttaatccc 540

agcaccaggg agacagaggc catcctggtc taaaaagtga tctccaggac agccatggct 600

attacacaga gaaaccctgt ctggaaaaac aaaaaattag tgtccatgtg taaatgtgtg 660

gagtatgctt gtcatgccac atacagaggt agagggcagt ttatgggagt cagttcctat 720

tcttccttta tgggggacct ggggactgaa ctcaggtcat caggcttggc agaaagtgca 780

ttagctcacg gagccttatc attggcgaaa gctctctcaa gtagaaaatc aatgtgtttg 840

ctcatagtgc aatcattatg tttcgagagg ggaagggtac aatcgttggg gcatgtgtgg 900

tcacatctga atagcagtag ctccctagga gaattaattc caagttcttt ggtggtgtat 960

caatgccctt aaaggggtca acaacttttt ttccctctga caaaactatc ttcttatgtc 1020

cttgtccc 1028

<210>20

<211>1516

<212>DNA

<213>中国仓鼠(Cricctulus griseus)

<400>20

gttgctattt tagagacagg atttcttgca aacctggttg gtcttaaact ccgtatgtag 60

ctgagaatga ccttgaaaac cttcctgtcc cacccctcaa attccagaat tatagacacc 120

caccacatgg cttaataagt aaacaacaac aataaaagca tgacttctgg gtctggaggg 180

agggcttgcc agttaagagc aatggatact ttcccataga acctgggttt gactcccagc 240

actaacctac atggtgatag tgatgcagca gacatacatg agggcaacac acacatgggc 300

acatacacac gcacccgccc accatggctt ttcccccatc acttagacag ccatatttaa 360

acgtagtgga gccaggctgg ggtggtggcc cacaccttta atcccagcac tccagaaggc 420

agaggtaggc ggatctctgt gggtttgaga ccagcctggt ctacaagagc tagttccagg 480

acagcctcca aagccataga gaaaccctat ctcaaaaaac tgaaacaaca acaacaacaa 540

aacaaaataa aaaaacaaca aaagaatctt agtggttcag tggttccaca cacaggaaag 600

tagaaagggc cttgatggga aggttttcag agggaggagt atggatgaga caggatgata 660

gtgaaaagaa ctcaaattaa ttaaatattt gaaactatct aagaataaaa gctaaaatat 720

ttaaaattac agtcaggtag tggtggtgca gagggctaag ttggtagaca cagtgagatc 780

caggccagcc agggctacct agtgagacct tgttcaaata actaataaaa tatacaaaat 840

aaaggagaca ccacaataat tttgaaatgt aaaagactaa atttaccttt tatattgatg 900

agttggataa aaaaatcaat ttaccagaga acataaagta gtcccatcaa agacaaaagc 960

aatatatgat taaactctaa tttaaaagtt tgttagagcc tggcaacgtg gcacatacct 1020

ttaatcccag caccagggag acagaggcca tcctggtcta aaaagtgatc tccaggacag 1080

ccatggctat tacacagaga aaccctgtct ggaaaaacaa aaaattagtg tccatgtgta 1140

aatgtgtgga gtatgcttgt catgccacat acagaggtag agggcagttt atgggagtca 1200

gttcctattc ttcctttatg ggggacctgg ggactgaact caggtcatca ggcttggcag 1260

aaagtgcatt agctcacgga gccttatcat tggcgaaagc tctctcaagt agaaaatcaa 1320

tgtgtttgct catagtgcaa tcattatgtt tcgagagggg aagggtacaa tcgttggggc 1380

atgtgtggtc acatctgaat agcagtagct ccctaggaga attaattcca agttctttgg 1440

tggtgtatca atgcccttaa aggggtcaac aacttttttt ccctctgaca aaactatctt 1500

cttatgtcct tgtccc 1516

<210>21

<211>381

<212>DNA

<213>中国仓鼠(Cricetulus griseus)

<400>21

cttgcggtcg aggactacag tcattttgca ggtttcctta ctgtatggct tttaaaacgt 60

gcaaaggtga ccattaaccg tttcacgctg ggagggcacg tgcggctcag atgcttcctc 120

tgactgaggg ccaggagggg gctacacgga agaggccaca cccgcacttg ggaagactcg 180

atttgggctt cagctggctg agacgcccca gcaggctcct cggctacacc ttcagccccg 240

aatgccttcc ggcccataac ccttcccttc taggcatttc cggcgaggac ccaccctcgc 300

gccaaacatt cggccccatc ccccggtcct cacctgaatc tctaactctg actccagagt 360

ttagagacta taaccagata g 381

<210>22

<211>34

<212>DNA

<213>人工的

<220>

<223>引物

<400>22

ctatgaggat ccgcctgaag acctgagttg atac 34

<210>23

<211>37

<212>DNA

<213>人工的

<220>

<223>引物

<400>23

tatgcaggat ccgttgctat tttagagaca ggatttc 37

<210>24

<211>35

<212>DNA

<213>人工的

<220>

<223>引物

<400>24

tatgcaggat cccaaagcca tagagaaacc ctatc 35

<210>25

<211>33

<212>DNA

<213>人工的

<220>

<223>引物

<400>25

tatgcaggat ccacctttaa tcccagcacc agg 33

<210>26

<211>35

<212>DNA

<213>人工的

<220>

<223>引物

<400>26

ctatgaggat ccctatcttc ttatgtcctt gtccc 35

<210>27

<211>32

<212>DNA

<213>人工的

<220>

<223>引物

<400>27

tatgcaggat cccaggctgg tctcgaactc ag 32

<210>28

<211>32

<212>DNA

<213>人工的

<220>

<223>引物

<400>28

ctatgaggat cccttgcggt cgaggactac ag 32

<210>29

<211>34

<212>DNA

<213>人工的

<220>

<223>引物

<400>29

ctatgatgta cagcctgaag acctgagttg atac 34

<210>30

<211>39

<212>DNA

<213>人工的

<220>

<223>引物

<400>30

attgcatgta cactatctgg ttatagtctc taaactctg 39

<210>31

<211>37

<212>DNA

<213>人工的

<220>

<223>引物

<400>31

atagcatgta cagaaatcct gtctctaaaa tagcaac 37

<210>32

<211>35

<212>DNA

<213>人工的

<220>

<223>引物

<400>32

atagcatgta cagatagggt ttctctatgg ctttg 35

<210>33

<211>33

<212>DNA

<213>人工的

<220>

<223>1物

<400>33

atacgatgta cacctggtgc tgggattaaa ggt 33

<210>34

<211>35

<212>DNA

<213>人工的

<220>

<223>引物

<400>34

atagcatgta cagggacaag gacataagaa gatag 35

<210>35

<211>32

<212>DNA

<213>人工的

<220>

<223>引物

<400>35

tagttatgta cactgagttc gagaccagcc tg 32

<210>36

<211>32

<212>DNA

<213>人工的

<220>

<223>引物

<400>36

atagcatgta cactgtagtc ctcgaccgca ag 32

<210>37

<211>33

<212>DNA

<213>人工的

<220>

<223>引物

<400>37

atacgaggat cccctggtge tgggattaaa ggt 33

<210>38

<211>35

<212>DNA

<213>人工的

<220>

<223>引物

<400>38

atagcaggat ccgatagggt ttctctatgg ctttg 35

<210>39

<211>24

<212>DNA

<213>人工的

<220>

<223>引物

<400>39

ctccacacat ttacacatgg acac 24

<210>40

<211>24

<212>DNA

<213>人工的

<220>

<223>引物

<400>40

gggtttctct gtgtaatagc catg 24

<210>41

<211>24

<212>DNA

<213>人工的

<220>

<223>引物

<400>41

atctcactgt gtctaccaac ttag 24

<210>42

<211>22

<212>DNA

<213>人工的

<220>

<223>引物

<400>42

tctgcaccac cactacctga ct 22

<210>43

<211>28

<212>DNA

<213>人工的

<220>

<223>引物

<400>43

ctaagagtac ttgccatgag agcctgaa 28

<210>44

<211>25

<212>DNA

<213>人工的

<220>

<223>引物

<400>44

cattgataca ccaccaaaga acttg 25

Claims

1.一种核酸，其包含：TE-13(SEQ ID No.15)、或TE-13(SEQ ID No.15)的片段、或与TE-13或TE-13的片段互补的核苷酸序列、或TE-13(SEQ IDNo.15)的衍生物、或该衍生物的片段、或与该衍生物或该衍生物的片段互补的核苷酸序列，其中该核酸在经染色体整合后使得表达系统中目的基因的转录或表达增加。

2.一种核酸，其包含：TE-08(SEQ ID No.10)、或TE-08(SEQ ID No.10)的片段、或与TE-08或TE-08的片段互补核苷酸序列、或TE-08(SEQ ID No.10)的衍生物、或该衍生物的片段、或与该衍生物或该衍生物的片段互补的核苷酸序列，其中该核酸在经染色体整合后使得表达系统中目的基因的转录或表达增加。

3.一种核酸，其包含：SEQ ID No.1，或SEQ ID No.1的片段、或与SEQ ID No.1或SEQ ID No.1的片段互补的核苷酸序列，或SEQ ID No.1的衍生物、或该衍生物的片段、或与该衍生物或该衍生物的片段互补的核苷酸序列，其中该核酸在经染色体整合后使得表达系统中目的基因的转录或表达增加，其中所述片段或衍生物包含至少一个由SEQ ID NO.1的1bp至1578bp之间的核酸区域组成的序列区域。

4.如权利要求1至3中任一项所述的核酸，其特征在于表达系统中目的基因的转录或表达与不包含TE元件的对照物相比增加例如是通过ELISA测量产物滴度来测定。

5.如权利要求1至4中任一项所述的核酸，其在严格条件下与下列杂交：

(a)核酸序列TE-13(SEQ ID No.15)或TE-08(SEQ ID No.10)的区域，或

(b)核酸序列TE-13(SEQ ID No.15)或TE-08(SEQ ID No.10)的互补核酸序列，或

(c)与(a)或(b)具有至少约70％序列同一性的核酸序列，优选至少约80％或85％序列同一性，更优选至少约90％序列同一性，及最优选至少约95％序列同一性。

6.如权利要求5所述的核酸，其特征在于此核酸具有至少511bp的长度(＝SEQ ID No.15所示TE-13的长度)，或至少1015bp的长度(＝SEQ ID No.10所示TE-08的长度)。

7.如权利要求1至6中任一项所述的核酸，其中该核酸是选自：TE-00(SEQ ID No.2)、TE-01(SEQ ID No.3)、TE-02(SEQ ID No.4)、TE-03(SEQ IDNo.5)、TE-04(SEQ ID No.6)、TE-06(SEQ ID No.8)、TE-07(SEQ ID No.9)、TE-08(SEQ ID No.10)、TE-10(SEQ ID No.12)、TE-11(SEQ ID No.13)、TE-12(SEQ ID No.14)、TE-13(SEQ ID No.15)、TE-14(SEQ ID No.16)、TE-15(SEQ ID No.17)、TE-16(SEQ ID No.18)、TE-17(SEQ ID No.19)、TE-18(SEQ ID No.20)及TE-21(SEQ ID No.21)。

8.如权利要求1至7中任一项所述的核酸，其特征在于该核酸为TE-00(SEQ ID No.2)、TE-06(SEQ ID No.8)、TE-21(SEQ ID No.21)、TE-10(SEQID No.12)、TE-11(SEQ ID No.13)或TE-12(SEQ ID No.14)，优选为TE-06(SEQ ID No.8)。

9.如权利要求1至7中任一项所述的核酸，其特征在于该核酸为TE-01(SEQ ID No.3)、TE-02(SEQ ID No.4)、TE-03(SEQ ID No.5)、TE-07(SEQ IDNo.9)或TE-08(SEQ ID No.10)。

10.如权利要求9所述的核酸，其中该核酸为TE-08(SEQ ID No.10)。

11.如权利要求1至7中任一项所述的核酸，其特征在于该核酸为TE-01(SEQ ID No.3)的片段或衍生物，优选为TE-13(SEQ ID No.15)、TE-14(SEQ ID No.16)、TE-15(SEQ ID No.17)、TE-16(SEQ ID No.18)、TE-17(SEQID No.19)或TE-18(SEQ ID No.20)。

12.如权利要求11所述的核酸，其中该核酸为TE-13(SEQ ID No.15)。

13.如权利要求1至12中任一项所述的核酸，其中该核酸或该片段或该衍生物为分离的核酸。

14.如权利要求1至13中任一项所述的核酸，其特征在于包含以下序列的核酸是与异源序列连接的：TE-13(SEQ ID No.15)或TE-08(SEQ ID No.10)或TE-07(SEQ ID No.9)或TE-06(SEQ ID No.8)或TE-21(SEQ ID No.21)，或这些序列的片段，或与这些序列或它们的片段互补的核苷酸序列，或这些序列的衍生物，或这些序列的片段的衍生物，或它们的互补核苷酸序列，优选为TE-13(SEQ ID No.15)或TE-08(SEQ ID No.10)或这些序列的片段或这些序列的衍生物或这些序列的片段的衍生物。

15.一种真核表达载体，其特征在于所述表达载体包含如权利要求1至14中任一项所述的核酸。

16.如权利要求15所述的真核表达载体，其特征在于其包含启动子和/或目的异源基因和/或可选择标记和/或任选增强子。

17.如权利要求15至16中任一项所述的真核表达载体，其特征在于其包含数个相同或不同的如权利要求1至14中任一项所述的核酸的组合，其中一个或多个所述核酸位于该目的基因之前(亦即5’侧)和/或一个或多个所述核酸位于该目的基因之后(亦即3’侧)。

18.如权利要求17所述的真核表达载体，其特征在于所述被组合的核酸为TE-06(SEQ ID No.8)，优选为TE-08(SEQ ID No.10)。

19.如权利要求17或18所述的真核表达载体，其特征在于一或多个TE-08核酸(SEQ ID No.10)与一或多个TE-06核酸(SEQ ID No.8)或TE-21核酸(SEQ ID No.21)的组合位于该目的基因之前(亦即5’侧)和/或之后(亦即3’侧)，优选TE-08核酸(SEQ ID No.10)与位于其后的TE-06核酸(SEQ ID No.8)或TE-21核酸(SEQ ID No.21)的组合位于该目的基因之前(亦即5’侧)。

20.如权利要求17所述的真核表达载体，其特征在于一或多个TE-08核酸(SEQ ID No.10)位于该目的基因之前(亦即5’侧)，且一或多个TE-08核酸位于该目的基因之后(亦即3’侧)，优选为一个TE-08核酸在目的基因之前且一个TE-08核酸在目的基因之后。

21.如权利要求15至20中任一项所述的真核表达载体，其特征在于其包含一或多个分布于2个质粒上的如权利要求1至14中任一项所述的核酸。

22.如权利要求15至21中任一项所述的真核表达载体，其特征在于该可选择标记为DHFR或Neo，诸如Neo F240I。

23.一种产生真核表达载体的方法，其特征为将如权利要求1至14中任一项所述的核酸整合至表达载体中。

24.一种真核宿主细胞，其特征在于其包含如权利要求15至23中任一项所述的真核表达载体。

25.如权利要求24所述的真核宿主细胞，其特征在于其为高产者，亦即其比产率高于无TE元件的同等真核宿主细胞，所述高产宿主细胞的表达量增加至两倍、三倍、四倍、五倍、六倍、七倍或十倍，或增加两倍以上、三倍以上、四倍以上、五倍以上、七倍以上或十倍以上，优选为高达五倍或三倍以上。

26.如权利要求24或25所述的真核宿主细胞，其特征在于该表达载体是稳定地整合至基因组中。

27.如权利要求24-26中任一项所述的真核宿主细胞，其中该宿主细胞为哺乳动物细胞，诸如CHO、NS0、Sp2/0-Ag14、BHK21、BHK TK^-、HaK、2254-62.2(BHK-21衍生物)、CHO-K1、CHO-DUKX(＝CHO duk^-、CHO/dhfr^-)、CHO-DUKX B1、CHO-DG44、CHO Pro-5、V79、B14AF28-G3、CHL细胞，优选为CHO细胞且尤其优选为CHO-DG44细胞。

28.如权利要求24-27中任一项所述的真核宿主细胞，其特征在于其另外包含抗细胞凋亡基因，诸如BCL-xL、BCL-2、BCL-w、BFL-1、A1、MCL-1、BOO、BRAG-1、NR-13、CDN-1、CDN-2、CDN-3、BHRF-1、LMW5-HL或CED-9，优选为Bcl-xL或BCL-2，最佳为BCL-xL。

29.一种形成经稳定转染的高产真核宿主细胞系的方法，其特征在于具有下列步骤：

(a)将如权利要求1至14中任一项所述的核酸整合至包含目的基因的真核表达载体中；

(b)用此表达载体转染真核宿主细胞；

(c)选择经转染的高产宿主细胞。

30.如权利要求29所述的方法，特征在于其具有额外的扩增步骤。

31.如权利要求29或30所述的方法，特征在于其具有额外的克隆步骤。

32.一种制备及选择重组哺乳动物细胞的方法，特征在于其具有下列步骤：

(a)用至少编码目的蛋白质/产物、新霉素磷酸转移酶(所述新霉素磷酸转移酶优选经修饰的)、及可扩增的可选择标记DHFR的基因转染宿主细胞，其中为了增强转录或表达，该一个或多个目的基因至少是功能性连接至至少一种如权利要求1-14中任一项所述的核酸；

(b)在能够使这些不同基因得到表达的条件下培养所述细胞；

(c)通过在诸如G418的选择剂存在下在无次黄嘌呤/胸苷的培养基中培养这些细胞，以选择这些经共整合的基因，及

(d)通过在选择剂存在下培养这些细胞以使这些经共整合的基因扩增，所述选择剂至少使得该可扩增的可选择标记基因得以扩增，所述选择剂诸如甲氨蝶呤。

32.如权利要求32所述的方法，其特征在于该经转染的细胞培养在无次黄嘌呤/胸苷的培养基中，该培养基在无血清存在下补充有至少200μg/mL G418，优选400μg/mL或更多G418，且添加递增浓度的MTX。

33.如权利要求32或33所述的方法，其特征在于该第一扩增步骤中该MTX的浓度为至少100nM或至少250nM，且逐步增至1μM或更高。

35.如权利要求29-34中任一项所述的方法，其与改善目的蛋白质的糖基化的方法相组合。

36.如权利要求29-35中任一项所述的方法，其中该宿主细胞为哺乳动物细胞，诸如CHO、NS0、Sp2/0-Ag14、BHK21、BHK TK^-、HaK、2254-62.2(BHK-21衍生物)、CHO-K1、CHO-DUKX(＝CHO duk^-、CHO/dhfr^-)、CHO-DUKX B1、CHO-DG44、CHO Pro-5、V79、B14AF28-G3、CHL细胞，优选为CHO细胞，且尤其优选为CHO-DG44细胞。

37.如权利要求29-36中任一项所述的方法，其中该表达载体包含可选择标记，诸如DHFR或Neo，例如Neo F240I。

38.如权利要求29-37中任一项所述的方法，其中高产者的比例增加至两倍、三倍、四倍、五倍、六倍、七倍或十倍，或增加两倍以上、三倍以上、四倍以上、五倍以上、七倍以上或十倍以上，优选为升高至五倍或三倍以上。

39.一种制备生物药产物的方法，其特征在于具有下列步骤：

(a)将权利要求1至14中任一项所述的核酸整合至包含目的基因的真核表达载体中；

(b)用此表达载体转染真核宿主细胞；

(c)选择经转染的高产宿主细胞，及

(d)在使得该一个或多个目的基因表达的条件下培养该所获得的经转染的高产宿主细胞。

40.如权利要求39所述的方法，其特征在于具有下列额外步骤：

(e)收集并纯化目的蛋白质。

41.一种如权利要求1至14中任一项所述的核酸在真核表达载体中用以增加真核宿主细胞的表达系统中目的基因的转录或表达或用于制备生物药产物的用途。

42.权利要求1至14中任一项所述的核酸用于产生转基因动物或植物的用途。

43.权利要求1至14中任一项所述的核酸用于基因治疗的用途。

44.权利要求1至14中任一项所述的核酸元件用作药物或用于药物组合物中的用途。

45.一种试剂盒，其是由权利要求1至14中任一项所述的一种或多种核酸、一种或多种表达载体、一种或多种宿主细胞及任选一种或多种转染试剂组成。