CN113699147B

CN113699147B - 基于四环素和Cumate的共调控序列

Info

Publication number: CN113699147B
Application number: CN202010442506.3A
Authority: CN
Inventors: 薛博夫; 杨银辉; 刘科; 马墨
Original assignee: Shenzhen Eureka Biology Technology Co ltd
Current assignee: Shenzhen Eureka Biology Technology Co ltd
Priority date: 2020-05-22
Filing date: 2020-05-22
Publication date: 2023-06-09
Anticipated expiration: 2040-05-22
Also published as: EP4155408A1; JP2023528291A; US20220364103A1; US11680267B2; EP4155408A4; CN113699147A; WO2021232632A1

Abstract

本申请提供一种用于调控目的核酸片段的转录的核酸序列，所述核酸序列包含至少2个拷贝的能与受四环素或其衍生物调控的反式激活物rtTA结合的TetO‑操作子序列、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的与受cumate调控的转录阻遏物CymR结合的CuO‑操作子序列。本申请还提供包含所述核酸序列的载体和宿主细胞以及用于在宿主细胞中诱导表达目的核酸片段的方法。

Description

基于四环素和Cumate的共调控序列

发明领域

本发明涉及用于调控目的核酸片段转录的基于四环素和Cumate依赖的核酸序列。具体地，本发明涉及用于调控目的核酸片段转录的核酸序列，所述核酸序列包含至少2个拷贝的结合四环素依赖的反式激活物（reverse tetracycline controlledtransactivator，rtTA）的TetO-操作子序列（Tet operator，TetO）、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的结合CymR转录阻遏物（transcriptionrepressor）的CuO-操作子序列（Cumate operator，CuO）。进一步，在上述核酸序列3'端下游和被调控目的核酸片段5’端上游之间还存在可剪接的内含子序列，其可用于在保持无诱导泄露的情况下，进一步提高诱导后转录活性。再进一步，本发明还涉及含有以上调控序列的载体、病毒、细胞、转基因植物或动物。

背景技术

基因表达可以通过对其中的几个步骤，包括转录，RNA剪接，翻译和翻译后修饰，进行调控来实现对基因表达的调控，在转录步骤对特定基因或目的核酸片段进行调控是最广泛、最有效的表达调控方式。通过外源因素控制细胞、植物或动物体内特定基因和核酸片段的转录和表达开启或关闭的诱导表达系统在生物基础科研、生物制药、基因治疗、细胞治疗、转基因植物或动物改良等领域起关键作用。通常上述的诱导表达系统在设计上由两个部分组成：1）在被调控目的核酸片段5’端上游的一段特定核酸序列，一般可以和转录激活物或阻遏物结合调控目的核酸片段的转录，比如包含操作子（operator）的核酸序列（此核酸序列以下称为响应元件）；2）在受外部因素调控下，能和上述特定核酸序列结合或分离，一般带有转录激活或阻遏功能的单个或多个调控物，通常是表达后的蛋白。外部因素可以是环境因素，例如温度、光照等；或某种成分物质，例如参与生命活动的代谢物、荷尔蒙、金属离子或人造化合物等。

“四环素诱导表达系统（Tetracycline inducible system 或 Tet System）”是目前在科学研究上和商业上最广泛使用的诱导表达系统之一 (参见，例如，Gossen, M. andH. Bujard (1992). "Tight control of gene expression in mammalian cells bytetracycline-responsive promoters."Proc Natl Acad Sci U S A89(12): 5547-5551., 美国专利号5,888,981, 5,814,618, 6,004,941, 5,814,618, 7,541,446, WO96/01313和WO00/75347 (上述文献通过引用结合于此))。其主要由四环素依赖的调控物和含有TetO操作子的响应元件组成，通过使用四环素诱导的方式调控和含有TetO操作子的响应元件相连的目的核酸片段的转录。此含有TetO操作子的响应元件可以在没有四环素的条件下和转录激活物结合，并在结合后启动下游被调控目的核酸片段转录；也可以在组成型活跃启动子（constitutively active promoter）的下游，被调控目的核酸片段的上游，然后在没有四环素的条件下和四环素依赖的阻遏物结合，抑制下游被调控的目的核酸片段转录。传统上，四环素依赖的调控物在没有四环素的条件下和TetO操作子结合，在有四环素的条件下和TetO操作子分离。比如基于此原理设计的激活物，通过去除环境中的四环素可以启动被调控目的核酸片段的转录(美国专利号5,464,758, 6,914,124, 5,789,156, 6,271,348, WO96/01313和WO00/75347)。之后发展出反式的四环素依赖的调控物，其仅在有四环素的条件下和TetO操作子结合。基于反式的四环素依赖的激活物，在环境中加入四环素可以激活被调控目的核酸片段转录(美国专利号5,654,168, 6,136,954, 5,789,156,6,271,348, 6,087,166, 6,271,341, 7,541,446, WO96/01313和WO00/75347)，比如在培养基中加入四环素激活被调控目的核酸片段转录或给转基因动物注射四环素激活体内由基因工程转入的被调控目的基因的转录和表达。

被调控核酸片段在诱导条件下的转录活性和非诱导条件下的泄露转录活性是评价诱导表达系统优劣的两个重要指标，好的诱导表达系统需要具有更高的诱导转录活性和更低的泄露转录活性。四环素诱导系统自第一次报道以来被多个实验室优化，其性能不断提升。主要优化包括四环素依赖的调控物和含有TetO操作子的响应元件。在四环素依赖的调控物优化方面主要集中在（1）在尽可能保持诱导后转录活性的情况下，降低无诱导条件下的泄露转录活性，提高诱导/泄露转录活性比例；（2）优化调控物和四环素及其衍生物做为诱导剂结合的特异性和亲和力，在更低的四环素及其衍生物浓度下达到最大诱导转录活性, 同时降低调控物在无诱导剂条件和响应元件的亲和力。（参见Zhou, X., et al.(2006). "Optimization of the Tet-On system for regulated gene expressionthrough viral evolution."Gene Ther13(19): 1382-1390., 美国专利号8,383,364, 7,541,446）。优化含有TetO操作子的响应元件主要集中在（1）优化TetO操作子的拷贝数目和连接序列。在提高响应元件性能的同时，增强多拷贝连续TetO操作子序列的稳定性尤其是在病毒载体上的稳定性；（2）在不显著影响诱导后转录活性的条件下，降低最小启动子（mini promoter）的无诱导基础泄露转录活性，提高诱导/泄露转录活性比例（参见Loew,R., et al. (2010). "Improved Tet-responsive promoters with minimizedbackground expression."BMC Biotechnol10: 81.，美国专利号9,181,556）。目前广泛使用的商业四环素诱导系统主要为Clontech Laboratories, Inc.公司的Tet-On®Advanced Inducible Gene Expression Systems（文件编号：PT3898-1 (102312)，其中的四环素依赖的反式激活物rtTA和含有TetO操作子的响应元件TRE(含有多拷贝连续TetO操作子序列和最小启动子序列的核酸序列，TetResponse Element，下文称为TRE)在下文中分别被称为rtTA_adv和TRE_adv），Tet-Off® Advanced Inducible Gene Expression Systems（文件编号：PT3945-1（101612））和Tet-On® 3G Inducible Expression Systems （文件编号：PT5148-1（010814），其中的四环素依赖的调控物rtTA和含有TetO操作子的响应元件TRE在下文中分别被称为rtTA_3G和TRE_3G）。

Cumate诱导系统（Cumate Inducible System）开发自Pseudomonas putida的p-cym操纵子，由在组成型活性启动子TATA盒下游的CuO操作子和Cumate及其衍生物依赖的并能和CuO操作子结合的阻遏物CymR蛋白组成。在无Cumate的条件下，CymR蛋白和CuO操作子结合，抑制下游被调控目的核酸片段的转录；当CymR蛋白和Cumate结合后，其和CuO操作子的亲和力下降并分离，下游被调控目的核酸片段转录不再受抑制。比如将CuO操作子连接在被调控目的核酸片段和组成型活性启动子序列之间，同时在细胞内组成性活跃表达CymR阻遏物。当培养基中没有Cumate及其衍生物诱导剂时，表达的CymR蛋白与CuO操作子结合抑制被调控目的核酸片段转录；当培养基中添加诱导剂时，与Cumate及其衍生物结合的CymR蛋白和CuO操作子分离，被调控目的核酸片段的转录不再受抑制（参照WO02088346A2、WO2006037215A1 (上述文献通过引用结合于此))。

Cumate诱导系统的优化主要集中在（1）优化最短的有效CuO操作子序列。（2）筛选可以溶于水的和p-cumate功能相似的Cumate及衍生物诱导剂。（3）构建类似Tet-Off的诱导系统，由CymR激活物（如构建CymR和HSV VP-16转录激活结构域的融合蛋白）和含有多拷贝连续CuO操作子的响应元件（序列包含多段重复CuO序列和下游最小启动子）组成。在无Cumate诱导剂的条件下，CymR激活物和CuO操作子结合激活被调控目的核酸片段的转录；在有Cumate诱导剂的条件下，CymR激活物和CuO操作子分离，被调控目的核酸片段停止转录。（4）构建类似Tet-On的诱导系统，由反式CymR激活物（通过突变和筛选，使得反式CymR在有Cumate诱导剂时和CuO操作子结合，没有Cumate诱导剂时和CuO操作子分离，并且构建反式CymR和HSV VP-16转录激活结构域的融合蛋白做为反式CymR激活物）和含有多拷贝连续CuO操作子的响应元件组成。在有Cumate诱导剂条件下，反式CymR激活物和响应元件结合，激活被调控目的核酸片段转录；在没有Cumate诱导剂条件下，反式CymR激活物和响应元件分离，被调控目的核酸片段停止转录（参照：Mullick, A., et al. (2006). "The cumate gene-switch: a system for regulated expression in mammalian cells."BMC Biotechnol6: 43.; WO02088346A2、WO2006037215A1）。目前广泛使用的Cumate诱导系统主要为SBI System Biosciences公司的SparQ Cumate Switch系统（文件编号：1-090810）。

在目前的各种诱导表达系统开发和改进中，主要优化都集中在降低被调控目的核酸片段在无诱导条件下的基础泄露转录活性的控制上，而在诱导条件下的转录活性不是优化重点，导致被诱导表达系统调控的目的核酸片段的诱导后转录活性低于常见的组成型活性启动子（constitutively active promoter）控制下的转录活性。而在生物技术开发中，提高目的核酸片段在诱导后的绝对转录活性和控制其在无诱导条件下的泄露转录活性同样重要。比如在生物制药领域中，生产带有细胞毒性的重组蛋白或病毒载体，既需要提高目的核酸片段编码的蛋白在诱导后的表达量，也需要为保证生产细胞系的培养状态和稳定性而控制目的核酸片段在无诱导条件下的泄露表达量。所以一种既能提高目的核酸片段在诱导条件下的转录活性，同时又能控制该目的核酸片段在无诱导条件下的泄露转录活性的诱导表达系统可以广泛促进生物技术在诸多领域的研究、开发和产业化。

发明内容

本发明涉及四环素和Cumate依赖的，能调控目的核酸片段转录的核酸序列，具体地，所述核酸序列包含至少2个拷贝的结合四环素或其衍生物依赖的反式激活物（reversetetracycline controlled transactivator，rtTA）的TetO操作子序列（Tet operator，TetO）、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的结合CymR转录阻遏物（transcription repressor）的CuO-操作子序列（Cumate operator，CuO）。进一步，在上述核酸序列3’端下游和被调控目的核酸片段5’端上游之间存在的可以剪接的内含子序列可以在保持无诱导泄露的情况下，进一步提高诱导后转录活性。再进一步，本发明还涉及含有以上调控序列并以调控基因表达为目的的载体、病毒、细胞、转基因植物或动物。

术语“目的核酸片段”一般可以指脱氧核糖核酸片段（DNA片段），根据应用目的可以是指基因，如编码蛋白的核酸序列；可以为一段核糖核酸(RNA)，如RNA病毒的全部或部分基因组RNA片段、微小RNA（microRNA，简称miRNA）、小分子干扰核糖核酸（smallinterfering RNA，简称siRNA）、长链非编码核糖核酸（long non-doding RNAs，简称LncRNA），CRISPR基因编辑系统的导向RNA（guide RNA，gRNA）、转运核糖核酸（transferRNA，简称tRNA）、核糖体核糖核酸(Ribosomal RNA，简称rRNA)、适体（Aptamers）、能和其他核酸结合的核糖核酸片段、能和特定蛋白结合的核糖核酸片段、或任意一段核糖核酸；也可以是以上一段或多段核酸序列的组合。

术语“载体”是一种包含核酸分子，通常被用作将外来遗传物质，如上述目的核酸片段，人工携带到另一个细胞中的媒介物，并且在其中复制和/或表达。在功能上，所有载体一般都可以用于克隆并携带外来目的核酸片段，同时也有专门设计的用于核酸片段转录和蛋白质表达的表达载体。质粒，病毒载体，粘粒(cosmids)和人工染色体是载体的四种主要类型。其中，最常用的载体是质粒。所有工程质粒载体都包含在细菌中复制的复制起点，用于插入目的核酸片段的多克隆位点和用于选择阳性菌株的标记基因。病毒载体是另一种常用载体，通常用来将遗传物质，如目的核酸片段输送到细胞中。此过程可以在生物体内（体内）或细胞培养物中（体外）进行。基于病毒自身进化出的多种分子机制，如对遗传物质的保护、基于受体对宿主细胞的选择、遗传物质向宿主细胞内的递送、在宿主细胞内的复制和/或表达、对宿主细胞生长、代谢、繁殖复制和防御机制的调整、以及在高等动物体内对免疫系统的抑制和/或逃逸，可以有效地将目的核酸片段转移到感染的靶细胞内。除了被用于分子生物学研究中，病毒载体还常被用于基因治疗、细胞治疗、免疫治疗和疫苗开发。

通常诱导表达系统在增强被调控目的核酸片段的诱导后转录活性的同时也会增加其在无诱导条件下的泄露转录活性；而常用的控制无诱导条件下泄露转录活性的策略比如通过点突变降低反式激活物在无诱导剂的条件下和操作子的亲和力或降低操作子下游的最小启动子的基础活性都会影响诱导后的最大转录活性。这使得绝大多数的单一诱导表达系统都为了平衡在无诱导条件下的泄露转录活性而降低了在诱导条件下对被调控目的核酸片段的转录激活活性。设计含有多调控组件的复合诱导表达系统是解决上述问题的有效方向。在本发明实现的复合诱导表达系统中，一方面优化提高第一诱导表达系统中的激活物和相应响应元件组合的诱导后最大转录活性，另一方面用第二诱导表达系统中的阻遏物和相应相应响应元件组合控制复合诱导表达系统因此提高的泄露转录活性，所述的复合诱导表达系统比如使用Tet-On诱导表达系统做为第一诱导表达系统，Cumate诱导表达系统做为第二诱导表达系统。上述复合诱导表达系统的复合响应元件序列包含至少2个拷贝的结合受四环素或其衍生物调控的反式激活物（reverse tetracycline controlledtransactivator，rtTA）的TetO操作子序列（tet operator）、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的结合CymR转录阻遏物（transcription repressor）的CuO操作子序列（CuO operator）。

本发明人发现，Tet-On和Cumate复合诱导表达系统的诱导转录活性和无诱导泄露转录活性受（1）多拷贝TetO操作子及其连接核酸序列，（2）TRE响应元件中最小启动子序列；（3）CuO操作子和最小启动子中TATA盒相对位置三个条件影响。第三代Tet-On系统中TRE_3G响应元件比第二代Tet-On系统中TRE_adv响应元件控制更严格，有更低的非诱导泄露转录活性；CuO操作子和TATA盒越近对泄露转录活性控制越严格但同时对诱导转录活性影响越大，越远对泄露转录活性控制越弱但同时对诱导转录活性影响越小。基于以上发现，本发明的用于调控目的核酸片段转录的核酸序列包含：至少2个拷贝(例如2、3、4、5、6、7或更多个，优选7个)的能与受四环素或其衍生物调控的反式激活物rtTA结合的TetO-操作子序列，优选地所述TetO-操作子序列如SEQ ID NO: 24所示；一段包含TATA盒序列的最小启动子序列，优选地所述最小启动子序列如SEQ ID NO:25或SEQ ID NO:26所示，更优选地所述最小启动子序列如SEQ ID NO:25所示；以及与受cumate调控的转录阻遏物CymR结合的CuO-操作子序列，优选地所述CuO操作子序列如SEQ ID NO:27所示。优选地, 至少一段CuO操作子序列在上述启动子TATA盒的下游，优选在TATA盒下游10bp至100bp之间，如14bp，30bp，50bp和100bp; 进一步优选地，有且仅有一段CuO序列在TATA盒的下游30bp至50bp；更近一步，有且仅有一段CuO序列在TATA盒的下游30bp或50bp位置。优选地，本发明的用于调控目的核酸片段转录的核酸序列如SEQ ID NO:23、SEQ ID NO:28、SEQ ID NO:29或SEQ ID NO:30所示，更优选地，如SEQ ID NO:23或SEQ ID NO:28所示。

在表达质粒中启动子下游的内含子一般可以提高转录信使RNA（mRNA）的稳定性并提高mRNA转运出细胞核的效率（参照Akef, A., et al. (2015). "Splicing promotesthe nuclear export of beta-globin mRNA by overcoming nuclear retentionelements."RNA21(11): 1908-1920）并提高目的核酸片段的表达量。本发明人发现在单一诱导表达系统中的响应元件3’端下游连接可剪接的内含子同样也能提高诱导后被调控目的核酸片段的表达量，但同时会显著增加被调控目的核酸片段的无诱导泄露表达量。本发明所述四环素和Cumate依赖的复合响应元件序列3’端下游以及被调控目的核酸片段5’端上游之间连接可以剪接的内含子序列可以在不显著增加无诱导泄露表达量的同时显著提高诱导表达量。基于此，在本发明中，优选地，在所述四环素和Cumate依赖的复合响应元件序列3’端下游以及目的核酸片段5’端上游之间连接可剪接的内含子片段。上述内含子的选择并无特定限制，本领域技术人员可以理解，凡是在哺乳动物细胞中能进行RNA剪接（Splicing）的序列都能实现上述功能。可以选择的内含子序列包括但不限于常用的克隆载体上的内含子如：兔β-球蛋白内含子、源自人β-球蛋白和免疫球蛋白重链内含子的杂合内含子、EF-1α内含子A、SV40内含子、源自腺病毒和免疫球蛋白重链内含子的杂合内含子、修饰的人巨细胞病毒内含子、源自鸡β-肌动蛋白(CBA)和小鼠微小病毒(MMV)内含子的杂合内含子、源自鸡β-肌动蛋白和兔β-球蛋白内含子的嵌合物和mP1内含子；也可以是任意真核生物任意基因的任意内含子；或者是基于内含子剪接规则设计的人造内含子序列。本发明实施例使用的内含子序列可以是如SEQ ID NO:31 所示。

上述Tet-On和Cumate复合诱导表达系统在无四环素或其衍生物和Cumate诱导剂(Cumate或其功能类似物)的环境下，rtTA反式激活物不能和复合响应元件结合，同时CymR阻遏物和复合响应元件中CuO操作子结合进一步抑制被调控的目的核酸片段因为rtTA反式激活物非特异性结合或最小启动子的基础活性引起的泄露转录活性；在仅有Cumate诱导剂的环境下，rtTA反式激活物和结合了Cumate诱导剂的CymR阻遏物都不和复合响应元件结合，被调控目的核酸片段因为rtTA反式激活物非特异性结合或最小启动子的基础活性引起极低量转录；在仅有四环素或其衍生物的环境下，rtTA反式激活物和复合响应元件中TetO操作子结合激活被调控目的核酸片段转录，但CymR阻遏物同时也和复合响应元件中的CuO操作子结合使得被调控目的核酸片段仅能有限转录；在四环素或其衍生物和Cumate诱导剂同时存在的环境下，rtTA反式激活物和复合响应元件中的TetO操作子结合，同时结合了Cumate诱导剂的CymR阻遏物和复合响应元件中CuO操作子分离，使得被调控目的核酸片段最大活性转录。上述rtTA反式激活物核酸编码序列优选经过人密码子优化的SEQ ID NO:18；CymR优选经过人密码子优化的SEQ ID NO:15。

上述Tet-On和Cumate复合诱导表达系统在生物基础科研、生物制药、基因治疗、细胞治疗、转基因植物或动物改良中都能应用，包括但不限于在细胞、动物或植物中，控制编码蛋白质的核酸序列转录的开启或关闭；控制非蛋白编码核酸序列的转录的开启和关闭，如RNA病毒的全部或部分基因组RNA片段、微小RNA（microRNA，简称miRNA）、小分子干扰核糖核酸（small interfering RNA，简称siRNA）、长链非编码核糖核酸（long non-dodingRNAs，简称LncRNA），CRISPR基因编辑系统的导向RNA（guide RNA，gRNA）、转运核糖核酸（transfer RNA，简称tRNA）、核糖体核糖核酸(Ribosomal RNA，简称rRNA)、适体（Aptamers）、能和其它核酸结合的核糖核酸片段、能和特定蛋白结合的核糖核酸片段、或任意一段核糖核酸；也可以是以上一段或多段核酸序列的组合。在一方面，上述Tet-On和Cumate复合诱导表达系统可以用于表达和生产在基因治疗、细胞治疗或免疫治疗领域的病毒载体；用于表达和生产有细胞毒性、或不稳定的蛋白质；用于在疫苗领域表达生产减毒疫苗或病毒样颗粒（viral like partical，简称VLP）疫苗；用于在转基因动物或植物中控制目的核酸片段转录表达的开启或关闭。

在本发明中，可用于Tet-On诱导表达系统的四环素及其衍生物包括在结构上与四环素相似的化合物，其能够与本发明所述四环素依赖的反式激活物rtTA相结合，其结合常数Ka至少达到10^-6M；优选地，其结合常数Ka达到或强于10^-9M。四环素衍生物例如可以选自：多西环素(Dox)、脱水四环素(Atc)、氯四环素、土霉素和脱氧四环素。

在本发明中，可用于Cumate诱导表达系统的，与阻遏物CymR相结合的Cumate功能类似物例如可以选自：对乙基苯甲酸、对丙基苯甲酸、对异丙基苯甲酸、对异丁基苯甲酸、对叔丁基苯甲酸, 对正二甲基氨基苯甲酸, 对正乙基氨基苯甲酸。以及例如在美国专利号7,745,592中描述的其他Cumate功能类似物。

可以转入包含本发明的四环素和Cumate的共调控序列的载体的宿主细胞在原理上可以为任意细胞例如是细菌、真菌、动物细胞或植物细胞。在另一方面，本发明所述的四环素和Cumate的共调控序列也可以通过病毒载体使用，例如制备的病毒载体所含核酸片段中含有本发明的四环素和Cumate的共调控序列，在DNA病毒载体中(如腺病毒、腺相关病毒)以脱氧核糖核酸存在，在RNA病毒载体中(如逆转录病毒)以核糖核酸存在。

如本领域技术人员可以理解的，对于转录受本发明的调控核酸序列控制的目的核酸片段没有特别的限制，只要其转录可以受控于本发明的调控核酸序列即可。

在一个方面，本发明提供以下各项：

第1项：核酸序列，所述核酸序列包含至少2个拷贝的能与受四环素或其衍生物调控的反式激活物rtTA结合的TetO-操作子序列、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的与受cumate调控的转录阻遏物CymR结合的CuO-操作子序列，其中所述CuO-操作子序列在所述TATA盒序列的3’端下游，和所述TATA盒的距离间隔为10bp至100bp，优选为30bp至50bp，更优选为50bp。

第2项：根据第1项所述的核酸序列，其中所述TetO-操作子序列如SEQ ID NO: 24所示，及/或所述最小启动子序列如SEQ ID NO: 25或SEQ ID NO:26所示，及/或所述CuO-操作子序列如SEQ ID NO:27所示。

第3项：根据第2项所述的核酸序列，所述核酸序列如SEQ ID NO:23、 SEQ ID NO:28、SEQ ID NO:29或SEQ ID NO:30所示。

第4项：根据第1-3项中任一项所述的核酸序列，所述核酸序列在3’端还包含可剪接的内含子序列。

第5项：载体，所述载体包含根据第1-4项中任一项所述的核酸序列。

第6项：根据第5项所述的载体，其中所述载体是表达载体，所述表达载体包含处于根据第1-4项中任一项所述的核酸序列的3’端下游的目的核酸片段，并且所述目的核酸片段的转录受根据第1-4项中任一项所述的核酸序列的控制。

第7项：宿主细胞，所述宿主细胞包含根据第1-4项中任一项所述的核酸序列或根据第5或6项所述的载体。

第8项：在宿主细胞中诱导表达目的核酸片段的方法，所述方法包括以下步骤：

(1) 将根据第6项所述的载体以及rtTA的编码序列和CymR的编码序列转入所述宿主细胞中；

(2) 在经过(1)的所述宿主细胞中表达rtTA和CymR；以及

(3) 向经过(2)的所述宿主细胞提供四环素或其衍生物以及cumate或其功能类似物。

第9项：根据第8项所述的方法，其中所述rtTA是rtTA_adv或rtTA_3G，优选为rtTA_3G，更优选地所述rtTA的编码序列如SEQ ID NO. 18所示。

第10项：根据第8项所述的方法，其中所述CymR的编码序列如SEQ ID NO. 15所示。

附图简述

图1显示实施例2中CuO操作子在复合响应元件中的位置及数量对目的核酸片段诱导表达量和无诱导泄露表达量的影响。图1A显示仅加入DOX诱导剂和同时加入DOX和Cuamte诱导剂对应的Luciferase检测实验的RLU值；图1B显示加入Cumate和无加入Cuamte诱导剂RLU值得比值。

图2显示实施例3中单调控响应元件、复合调控响应元件及响应元件下游连接内含子对目的核酸片段诱导表达量和无诱导泄露表达量的影响。图2A显示有/无DOX和Cumate诱导剂对应的Luciferase检测实验的RLU值；图2B显示有/无DOX和Cumate诱导剂RLU值得比值。

图3显示实施例4中不同内含子对TRE_3GCuO复合响应元件诱导表达和无诱导泄露表达影响。图3A显示有/无DOX和Cumate诱导剂对应的Luciferase检测实验的RLU值；图3B显示有/无DOX和Cumate诱导剂RLU值得比值。

图4显示实施例5中被TRE_3GCuO和TRE_3GCuO-BGI调控的目的核酸片段在不同诱导组合下的诱导转录活性。纵坐标显示不同诱导剂条件下Luciferase检测实验的RLU值；4种颜色的柱状图显示四种加入诱导剂的组合；途中横线上数字代表对应的诱导条件下和无诱导条件下（白色）RLU比值。

具体实施方式

提供以下实施例用以对本发明的技术方案进行说明，以下实施例不应被认为是对本发明的范围和精神的限制。

实施例1：质粒构建方法

以下实施例所使用的分子克隆技术，例如，DNA片段的PCR扩增、DNA片段的限制性内切酶酶切、DNA片段的凝胶回收、两段或多段DNA片段的T4 DNA连接酶连接、连接产物感受态细胞的转化、质粒小量制备及鉴定等方法均为本领域熟知技术。以下实施例中涉及以下试剂：PCR酶(Thermo，F-530S) ；限制性内切酶(NEB)；T4 DNA连接酶(Invitrogen，15224041) ；DNA片段凝胶回收试剂盒(Omega，D2500-02) ；质粒小提试剂盒(TIANGEN，DP105-03) ；感受态细胞(XL-10 Gold，湖南丰晖生物科技有限公司，JZ011)；SEQ ID NO:1至SEQ ID NO:22 所示的核酸序列由金斯瑞合成并用于本发明所述质粒构建, 质粒测序鉴定由Invitrogen公司完成。表1为构建质粒的引物信息；表2为附录序列SEQ ID NO:1至SEQID NO:31的元件组成说明；表3为质粒中各功能元件说明；表4为本发明构建的质粒编号及对应名称。。以下实施例中所涉及的各质粒所采用的元件序列信息为实现本发明的示例，本领域技术人员可以预期将以下实施例中所用质粒上各元件序列替换成其它生物学功能类似的元件序列也能达到本发明所述效果，包括但不限于质粒的骨架序列（如复制原点(replication origin)、抗性基因等）、酶切位点序列、转座子重复序列、诱导系统响应元件序列、隔离子(Insulator)序列、启动子序列、内含子序列、聚腺苷酸信号(PolyA)序列、不同密码子优化的基因序列、以上各功能元件序列和基因序列的突变体以及各功能元件序列和基因序列的克隆位置、克隆顺序和克隆方向。具体的质粒构建方法如下所示：

1. 构建质粒18BF007：将合成序列SEQ ID NO:2 (2900bp)用NotI和AsiSI酶切并连接在质粒18BF003 (SEQ ID NO:1)的NotI和AsiSI酶切位点，从而构建得到质粒18BF007。

2. 构建质粒18BF011：将18BF007质粒用MluI和SphI酶切，凝胶回收1730bp片段并将其连接在18BF003质粒的MluI和SphI酶切位点从而构建得到质粒18BF011。

3. 构建质粒18BF210：将合成序列SEQ ID NO:3 (1208bp)用SpeI和AgeI酶切并连接在质粒18BF011的AvrII和AgeI酶切位点，从而构建得到质粒18BF210。

4. 构建质粒18BF211，18BF212，18BF213，18BF214，18BF215，18BF216，18BF217和18BF218：将合成序列SEQ ID NO:4（908bp）、序列SEQ ID NO:5（880bp）、序列SEQ ID NO:6（890bp）和序列SEQ ID NO:7（845bp）分别用MluI和ClaI酶切并分别连接在质粒18BF210的MluI和ClaI酶切位点，从而分别构建得到质粒18BF212、18BF211、18BF214和18BF213。将质粒18BF211、18BF212、18BF213和18BF214分别用BstBI酶切，并分别凝胶回收DNA片段3932bp（18BF211）、3960bp（18BF212）、3897bp（18BF213）和3942bp（18BF214），并用T4连接酶连接以分别构建质粒18BF215、18BF216、18BF217和18BF218。

5. 构建质粒18BF229、18BF232、18BF233、18BF234、18BF235、18BF236、18BF237、18BF240和18BF241：以pGL3-Basic (Promega，E1751)为模板，Luc-F(SEQ ID NO:32)和Luc-R(SEQ ID NO:33)为引物PCR扩增luciferase基因片段(1728bp)，并用BamHI和XhoI酶切处理，分别连接在质粒18BF210、18BF217、18BF218、18BF215、18BF216、18BF211、18BF212、18BF213和18BF214的BamHI和XhoI酶切位点，从而构建得到质粒18BF229、18BF232、18BF233、18BF234、18BF235、18BF236、18BF237、18BF240和18BF241。

6. 构建质粒18BF251、18BF252、18BF253、18BF254、18BF255、18BF256和18BF257：将合成序列SEQ ID NO:8 (414bp)、序列SEQ ID NO:9 (414bp)、序列SEQ ID NO:10（415bp）、序列SEQ ID NO:11（472bp）、序列SEQ ID NO:12（588bp）、序列SEQ ID NO:13（704bp）和序列SEQ ID NO:22（376bp）分别用MluI和ClaI酶切并分别连接在质粒18BF235的MluI和ClaI酶切位点，从而分别构建得到质粒18BF251、18BF252、18BF253、18BF254、18BF255、18BF256和18BF257。

7. 构建质粒18BF261、18BF262、18BF263和18BF264：以序列17为模板，BGI(C&R)-F(SEQ ID NO:34)和BGI(C&R)-R(SEQ ID NO:35)为引物PCR扩增BGI(C&R)内含子序列(1036bp)；以pEF1alpha-IRES-AcGFP1(Clontech)为模板，Intron(EF-1a)-F(SEQ ID NO:36)和Intron(EF-1a)-R(SEQ ID NO:37)为引物PCR扩增Intron(EF-1a)内含子序列(962bp)；以pSI（Promega#E1721）质粒为模板，Intron(pSI)-F(SEQ ID NO:38)和Intron(pSI)-R(SEQ ID NO:39)为引物PCR扩增Intron(pSI)内含子序列 (152bp)，并将以上三段PCR产物分别用ClaI和BamHI酶切处理，连接在质粒18BF235的ClaI和BamHI酶切位点，从而构建得到质粒18BF261、18BF263和18BF264。将合成的序列14 (210bp)用ClaI和BamHI酶切，并分接在质粒18BF235的ClaI和BamHI酶切位点，从而构建得到质粒18BF262。

8. 构建质粒19BF075和19BF074：将合成的序列SEQ ID NO:15 (633bp)和序列SEQID NO:16 (1496bp)分别用ClaI和XhoI以及SpeI和AgeI酶切处理并依次连接在18BF007质粒的ClaI和XhoI酶切位点以及AvrII和AgeI酶切位点从而构建得到19BF073质粒。将合成的序列SEQ ID NO:17 (1979bp)用MluI和AgeI酶切并连接在18BF007质粒的MluI和AgeI酶切位点，替换CMV-BGI-MCS-pA序列，从而构建得到18BF008质粒。将合成的序列SEQ ID NO:18(768bp)和序列SEQ ID NO:19 (765bp)分别用ClaI和XhoI酶切并分别连接在18BF008质粒的ClaI和XhoI酶切位点从而分别构建得到18BF085和18BF084质粒。将质粒19BF073用SpeI和AgeI酶切，凝胶回收3821bp片段并将其分别连接在18BF085和18BF084质粒的AvrII和AgeI酶切位点从而分别构建得到19BF075和19BF074质粒。

9. 构建质粒18BF019：将合成的序列SEQ ID NO:21 (1044bp)和序列SEQ ID NO:20 (1320bp)分别用BamHI和XhoI以及XhoI和BglII酶切并连接在18BF011质粒的BamHI和BglII酶切位点从而构建得到18BF019质粒。

10. 构建质粒19BF229、19BF235和19BF237：将质粒18BF229、18BF235和18BF237分别用MluI和AgeI酶切，分别凝胶回收4605bp（18BF229）、3847bp（18BF235）和4341bp（18BF237）片段并将其分别连接在18BF007质粒的MluI和AgeI酶切位点从而分别构建得到19BF229、19BF235和19BF237质粒。

表 1. 引物信息列表

表2. 附录序列元件组成说明

表3. 质粒功能元件说明

表4. 质粒编号及名称

实施例2: CuO操作子位置及数量对诱导表达量和无诱导泄露表达量的影响

本实施例所述实验为研究和验证CuO操作子在Tet-On和Cumate复合响应元件的位置和拷贝数对复合响应元件诱导表达量和无诱导泄露表达量的影响以及优化确认最优的CuO操作子位置和拷贝数。本实施例基于TRE_3G响应元件中7xTetO序列和最小启动子序列#1(SEQ ID NO:25)，在TATA盒下游间隔10bp至100bp范围内，分别在间隔14bp、30bp、50bp和100bp的位置上连接CuO操作子序列设计了TRE_3GCuO₁₄（SEQ ID NO:8中10-317bp）、TRE_3GCuO₃₀（SEQ ID NO:28）、 TRE_3GCuO₅₀（SEQ ID NO:23）和 TRE_3GCuO₁₀₀（SEQ ID NO:10中10-403bp）响应元件，并在以上响应元件3’端下游连接Luciferase报告基因序列，构建质粒18BF251、18BF252、18BF235和18BF253。进一步，为研究多拷贝CuO操作子的影响，在TATA盒下游间隔50bp的位置，分别插入了2、4和6个拷贝CuO操作子序列设计了TRE_3GCuO_2x（SEQ ID NO:11中10-411bp）、TRE_3GCuO_4x（SEQ ID NO:12中10-527bp）和TRE_3GCuO_6x（SEQ ID NO:13中10-643bp）响应元件，并在以上响应元件下游3’端连接Luciferase报告基因序列，构建质粒18BF254、18BF255和18BF256。在稳定表达rtTA_3G和CymR基因的293T-rtTA_3G-CymR细胞内，瞬时转染上述质粒，通过测量同时加入DOX和Cumate诱导剂样品和仅加入DOX诱导剂对照的luciferase荧光值验证优化CuO操作子最优位置和数量。具体实验方法如下：

1. 用SB转座子系统构建293T-rtTA_adv-CymR和293T-rtTA_3G-CymR细胞：

将293T细胞按照1.5E+06个细胞每60mm培养皿接种，在37℃、5% CO₂的环境下，培养在添加10%FBS (ExCell，11H116) 的DMEM(Sigam，D6429) 完全培养基中。培养24小时后，按照PEI方法进行转染，转染时每60mm培养皿加入500μL转染试剂，其中含有总质粒量为5.5ug，总质粒量与PEI MAX (Polysciences，24765-1)的质量比为1:4。其中按照质粒19BF074:18BF019摩尔比10:1进行转染以获得293T-rtTA_adv-CymR细胞；按照质粒19BF075:18BF019摩尔比10:1进行转染以获得293T-rtTA_3G-CymR细胞。质粒与PEI MAX混合均匀，静置15分钟后加入培养皿中，转染3小时后，更换培养基为DMEM完全培养基，转染操作完成。转染24小时后，用胰酶消化细胞并全部接种于100mm培养皿(Corning，430167)中，并用200μg/ml潮霉素 (Hygromycin，生工A600230-0001)药物筛选至少三代后，细胞在药物压力下生长和原始293T细胞一致后，进行以下实验。

2. 基于Luciferase荧光强度检测在DOX和Cumate诱导或仅DOX诱导条件下各响应元件效能

将293T-rtTA_3G-CymR细胞按照2.5E+04个细胞每孔接种于96孔板(Corning 3916)中，培养基为100微升DMEM完全培养基。培养24小时后，按照PEI方法进行转染以下质粒18BF234（TRE_3G）、18BF251（TRE_3GCuO₁₄）、18BF252(TRE_3GCuO₃₀)、18BF235（TRE_3GCuO₅₀）、18BF253（TRE_3GCuO₁₀₀）、18BF254(TRE_3GCuO_2x)、18BF255(TRE_3GCuO_4x)和18BF256（TRE_3GCuO_6x），转染时每孔加入10μL转染试剂，其中含有总质粒量为0.3ug，包含0.01ug以上8种待测质粒和0.29微克18BF003空质粒。总质粒量与PEI MAX (Polysciences，24765-1)的质量比为1:4，每种质粒转染6个孔。转染3小时后更换DMEM完全培养基，在其中3孔内加入诱导剂1ug/ml DOX(盐酸多西环素(DOX)，生工生物工程(上海)股份有限公司，A600889)和200ug/ml Cumate(Aladdin，I107765)；另外三个孔内仅加入1ug/ml DOX。转染后24小时，使用Steady-Glo^®Luciferase Assay System (Promega，E2610)试剂盒，并按照其操作说明(Promega，FB037)检测各孔相对荧光单位RLU (relative light unit)，检测仪器为荧光酶标仪(PerkinElmer VictorⅤ)。

结果如图1所示：CuO操作子序列影响Tet-On诱导表达系统响应元件的诱导表达量，且CuO操作子距离TRE响应元件TATA盒越近，诱导后的表达量越低。但随着CuO操作子与TATA盒距离增大，无Cumate诱导的泄露表达量越高。在综合诱导后表达量、无Cumate诱导泄露表达量和Cumate诱导/泄露表达量比例等结果，确定CuO在与TATA盒间隔30bp至50bp之间是结果最优，诱导表达量分别为3.06E+06 RLU和4.53E+06 RLU，分别为TRE_3G响应元件诱导表达量的44.5%和66.0%；基于Cumate诱导表达系统的诱导/泄露表达量比例分别为TRE_3G响应元件的4.21倍和2.81倍。增加CuO操作子的拷贝至2，4或6会进一步降低诱导后表达量，且不会提高Cumate诱导/泄露表达量比例。基于以上结果，在间隔TRE响应元件TATA盒30bp至50bp距离插入CuO操作子且仅插入1个拷贝为最优条件。

基于TRE_adv响应元件中7xTetO序列和最小启动子序列#2(SEQ ID NO:26)，在TATA盒下游间隔32bp和52bp的位置上连接CuO操作子序列按照上述方法设计了TRE_advCuO₃₂（SEQID NO:29）和TRE_advCuO₅₂（SEQ ID NO:30）响应元件，并在以上响应元件3’端下游连接Luciferase报告基因序列，构建质粒18BF257和18BF233。通过和上述相同实验方法，检测诱导表达量分别为3.26+06 RLU和4.88E+06 RLU, 分别为TRE_adv响应元件诱导表达量的37.8%和53.4%；基于Cuamte诱导表达系统的诱导/泄露表达量比例分别为TRE_adv响应元件的4.97倍和3.23倍。后续实施例以TRE_advCuO₅₂和TRE_3GCuO₅₀响应元件进行实验，并分别标记为TRE_advCuO和TRE_3GCuO响应元件。

实施例3: 单调控/复合调控及内含子对诱导表达量和无诱导泄露表达量的影响

在Tet-On诱导表达系统中， TRE响应元件的TetO操作子连接序列和最小启动子序列以及反式激活物rtTA的不同突变体综合影响诱导转录活性和泄露转录活性。此外响应元件3’端下游，被调控目的核酸片段5’端上游连接可剪切的内含子序列可能增强信使核糖核酸运输和稳定性，但同样可能影响诱导表达系统响应元件的诱导转录活性和泄露转录活性。基于此，本实施例对比（1）基于TRE_adv和TRE_3G响应元件序列设计的Tet-On和Cumate复合响应元件TRE_advCuO和TRE_3GCuO，（2）是否连接内含子，（3）被反式激活物rtTA_adv或rtTA_3G调控，三个条件组合下的Luciferase基因诱导表达量和诱导/泄露表达量比例确认最优复合响应元件设计方案。本实施例共对比8种设计方案：分别为TRE_adv（18BF232）、TRE_advCuO(18BF233)、TRE_3G（18BF234）、TRE_3GCuO（18BF235）、TRE_adv-BGI（18BF240，响应元件为TRE_adv，并且响应元件3’端和Luciferase基因5’端之间连接人β-球蛋白内含子）、TRE_advCuO-BGI（18BF241，响应元件为TRE_advCuO，并且响应元件3’端和Luciferase基因5’端之间连接人β-球蛋白内含子）、TRE_3G-BGI（18BF236，响应元件为TRE_3G，并且响应元件3’端和Luciferase基因5’端之间连接人β-球蛋白内含子）和TRE_3GCuO-BGI（18BF237，响应元件为TRE_3GCuO，并且响应元件3’端和Luciferase基因5’端之间连接人β-球蛋白内含子）。启动子CMV-BGI（18BF229，启动子为CMV，并且CMV启动子3’端和Luciferase基因5’端之间连接人β-球蛋白内含子）做为阳性对照。在稳定表达rtTA_adv和CymR基因的293T-rtTA_adv-CymR细胞内和稳定表达rtTA_3G和CymR基因的293T-rtTA_3G-CymR细胞内，分别瞬时转染上述质粒，通过测量加入DOX和Cumate诱导剂样品和无诱导对照的luciferase荧光值验证最优复合响应元件组合。具体实验方法如下：

将实施例2中构建的293T-rtTA_adv-CymR 和293T-rtTA_3G-CymR细胞分别按照2.5E+04个细胞每孔接种于96孔板(Corning 3916)中，培养基为100微升DMEM完全培养基。培养24小时后，按照PEI方法转染上述9种质粒，转染时每孔加入10μL转染试剂，其中含有总质粒量为0.3ug，包含0.01ug上述9种质粒待测质粒和0.29微克18BF003空质粒。总质粒量与PEIMAX (Polysciences，24765-1)的质量比为1:4，每种质粒分别在293T-rtTA_adv-CymR 和293T-rtTA_3G-CymR细胞各转染6个孔。转染3小时后更换DMEM完全培养基，在每种细胞其中3孔内加入诱导剂1ug/ml DOX和200ug/ml Cumate；另外三个孔内加入等量培养基对照。转染后24小时，使用Steady-Glo^®Luciferase Assay System (Promega，E2610)试剂盒，并按照其操作说明(Promega，FB037)检测各孔相对荧光单位RLU (relative light unit)，检测仪器为荧光酶标仪(Perkin Elmer VictorⅤ)。

实验结果如图2所示：（1）TRECuO复合响应元件对比TRE单调控响应元件显著提高了诱导/泄露表达量比例一到两个数量级。TRE_3GCuO复合响应元件对比TRE_advCuO复合响应元件能更好的控制泄露表达。在293T-rtTA_adv-CymR细胞中，TRE_3GCuO和TRE_advCuO的诱导/泄露表达量比例分别为1565和1345倍，提高16.4%；在293T-rtTA_3G-CymR细胞中，TRE_3GCuO和TRE_advCuO的诱导/泄露表达量比例分别为2635和1915倍，提高37.6%。但TRECuO复合响应元件对比TRE单调控响应元件的诱导表达量显著下降。在293T-rtTA_adv-CymR细胞中，TRE_3GCuO和TRE_advCuO的诱导表达量分别为对应的TRE_3G和TRE_adv单调控响应元件的50.4%和36.3%；在293T-rtTA_3G-CymR细胞中，TRE_3GCuO和TRE_advCuO的诱导表达量分别为单调控响应元件的61.8%和40.3%。（2）在诱导表达量方面，TRE_3GCuO复合响应元件对比TRE_advCuO复合响应元件对下游的内含子更加敏感，在有内含子BGI的设计中，诱导表达量显著提高。TRE_3GCuO和TRE_3GCuO-BGI诱导表达量在293T-rtTA_adv-CymR细胞中分别为3.4E+06 RLU和10.6E+06 RLU，分别是TRE_3G诱导表达量的50.4%和157.9%，连接内含子可以提高TRE_3GCuO复合响应元件诱导后表达量2.13倍；在293T-rtTA_3G-CymR细胞中分别为4.24E+06和11.3E+06，分别是TRE_3G诱导表达量的61.8%和165.0%，连接内含子可以提高TRE_3GCuO复合响应元件诱导后表达量1.67倍。（3）对比诱导后表达量，反式激活物rtTA_3G在8种设计方案中和rtTA_adv没有显著区别，但在对比诱导/泄露表达量比例上rtTA_3G有显著优势，其8种设计方案的诱导/泄露表达量比例平均值为1110倍是rtTA_adv的1.68倍（rtTA_adv诱导/泄露表达量比例平均值为661倍）。

基于以上结果，TRE_3GCuO复合响应元件对比TRE_adv和TRE_3G以及TRE_advCuO复合响应元件拥有更好控制泄露表达的能力；在下游连接内含子BGI后可以在维持TRE_3GCuO复合响应元件控制泄露表达的同时极大的提高其诱导表达量。在受rtTA_3G调控条件下，TRE_3GCuO-BGI的诱导表达量分别为TRE_adv的80.6%、TRE_adv-BGI的80.5%、TRE_advCuO 的199.9%、TRE_advCuO-BGI 的147.0%、TRE_3G的165.0%、TRE_3G-BGI 的81.5%和TRE_3GCuO的 267.2%，达到组成型活性启动子CMV-BGI的84.7%；TRE_3GCuO-BGI的诱导/无诱导表达量比例分别为TRE_adv24.5倍、TRE_adv-BGI 43.4倍、TRE_advCuO 1.2倍、TRE_advCuO-BGI 1.6倍、TRE_3G5.9倍、TRE_3G-BGI 8.9倍和TRE_3GCuO 的0.8倍。

实施例4: 不同内含子对TRE_3GCuO复合响应元件诱导表达和无诱导泄露表达影响

在上述实施例3中，连接内含子BGI显著提升了TRE_3GCuO复合诱导响应元件的诱导转录活性以及Luciferase目的基因的表达量。本实施例验证其它内含子是否有相似效果。本实施例将4种常用质粒载体上的内含子克隆到TRE_3GCuO复合响应元件3’端下游和luciferase报告基因5’端上游之间，分别构建含有BGI(C&R)、Intron(mP1)、Intron(EF-1a)和Intron(pSI)内含子的质粒18BF261、18BF262、18BF263和18BF264，质粒构建具体方法见实施例1描述。在稳定表达rtTA_3G和CymR基因的293T-rtTA_3G-CymR细胞内，分别瞬时转染上述质粒以及TRE_3GCuO（18BF235）、TRE_3GCuO-BGI（18BF237）和CMV-BGI（18BF229）质粒，通过测量加入DOX和Cumate诱导剂样品和无诱导对照的luciferase荧光值验证各内含子对TRE_3GCuO复合响应元件诱导表达和无诱导泄露表达的影响。具体实验方法如下：

将293T-rtTA_3G-CymR细胞按照2.5E+04个细胞每孔接种于96孔板(Corning 3916)中，培养基为100微升DMEM完全培养基。培养24小时后，按照PEI方法分别转染上述7种质粒，转染时每孔加入10μL转染试剂，其中含有总质粒量为0.3ug，包含0.01ug以上7种待测质粒和0.29微克18BF003空质粒。总质粒量与PEI MAX (Polysciences，24765-1)的质量比为1:4，每种质粒转染6个孔。转染3小时后更换DMEM完全培养基，在其中3孔内加入诱导剂1ug/mlDOX和200ug/ml Cumate；另外三个孔内加入等量培养基。转染后24小时，使用Steady-Glo^®Luciferase Assay System (Promega，E2610)试剂盒，并按照其操作说明(Promega，FB037)检测各孔相对荧光单位RLU (relative light unit)，检测仪器为荧光酶标仪(PerkinElmer VictorⅤ)。

实验结果如图3所示：含有四种其它内含子的质粒18BF261、18BF262、18BF263和18BF264在诱导表达量和诱导/泄露表达量比例上和TRE_3GCuO-BGI（18BF237）无显著差异，都能达到实施例3所述TRE_3GCuO-BGI的设计效果。在内含子里，需要有 5' 剪接位点(5'splice site)、3' 剪接位点(3' splice site)及剪接分枝位点(branch point)来进行剪接。本实施例证明符合上述条件，能剪接的内含子都能达到本发明所述的实验效果。因此本发明所述效果不应受到特定内含子序列约束，凡是在哺乳动物细胞中能进行RNA剪接（Splicing）的序列都能实现上述功能。可以选择的内含子序列包括但不限于常用的克隆载体上的内含子如：兔β-球蛋白内含子、源自人β-球蛋白和免疫球蛋白重链内含子的杂合内含子、EF-1α内含子A、SV40内含子、源自腺病毒和免疫球蛋白重链内含子的杂合内含子、修饰的人巨细胞病毒内含子、源自鸡β-肌动蛋白(CBA)和小鼠微小病毒(MMV)内含子的杂合内含子、源自鸡β-肌动蛋白和兔β-球蛋白内含子的嵌合物和mP1内含子；也可以是任意真核生物任意基因的任意内含子；或者是基于内含子剪接规则设计的人造内含子序列。

实施例5: 研究TRE_3GCuO复合响应元件在不同诱导组合下的诱导转录活性。

本实施例构建受Tet-ON和Cumate复合调控的，基于TRE_3GCuO或TRE_3GCuO-内含子设计，以Luciferase为报告基因的稳定细胞系，并基于这些细胞系检测无诱导剂、仅加Cumate、仅加DOX或同时加DOX和Cumate 诱导剂4种诱导条件组合下，报告基因的不同诱导转录活性。本实施例仅以Luciferase报告基因为例，原则上本发明所述方法不受目的核酸片段影响。具体实验方法如下：

1. 利用SB转座子系统构建DOX和Cumate复合调控Luciferase稳定细胞系：

将293T细胞按照1.5E+06个细胞每60mm培养皿接种，在37℃、5% CO₂的环境下，培养在添加10%FBS (ExCell，11H116) 的DMEM(Sigam，D6429) 完全培养基中。培养24小时后，按照PEI方法进行转染，转染时每60mm培养皿加入500μL转染试剂，总质粒量为5.5ug，总质粒量与PEI MAX (Polysciences，24765-1)的质量比为1:4，共构建3种Luciferase稳定细胞系。其中转染质粒按照19BF075:19BF229:18BF019摩尔比5:5:1进行转染以获得293T(T&C)-CMV-BGI-Luc细胞; 其中转染质粒按照19BF075:19BF235:18BF019摩尔比5:5:1进行转染以获得293T(T&C)-TRE_3GCuO-Luc细胞; 其中转染质粒按照19BF075:19BF237:18BF019摩尔比5:5:1进行转染以获得293T(T&C)-TRE_3GCuO-BGI-Luc细胞。质粒与PEI MAX混合均匀后，静置15分钟后加入培养皿中，转染3小时后，更换培养基为DMEM完全培养基，转染操作完成。转染24小时后，用胰酶消化细胞并全部接种于100mm培养皿(Corning，430167)中，并用200μg/ml潮霉素 (Hygromycin，生工A600230-0001)药物筛选至少三代。当细胞在药物压力下生长和原始293T细胞一致后，再用极限稀释法将上述三种细胞分别稀释至1个细胞每孔接种于96孔板内，待细胞长至大约50% 孔底面积时，在荧光显微镜下挑选EGFP绿色荧光强度较强、发光均匀的孔，每种细胞挑选3个独立克隆进行以下实验。

2. 利用不同DOX和Cumate组合诱导Luciferase表达:

将上述3种细胞，每种3个独立克隆分别按照2.5E+04个细胞每孔接种于96孔板(Corning 3916)中，每个克隆接种8个孔，培养基为100微升DMEM完全培养基。培养24小时后，更换培养基并在每个细胞克隆8个培养孔中取复孔分别加入（1）等量培养基、（2）终浓度200ug/ml Cumate、（3）终浓度1ug/ml DOX或（4）终浓度1ug/ml DOX和200ug/ml Cumate。再培养24小时后，使用Steady-Glo^®Luciferase Assay System (Promega，E2610)试剂盒，并按照其操作说明(Promega，FB037)检测各孔相对荧光单位RLU (relative light unit)，检测仪器为荧光酶标仪(Perkin Elmer VictorⅤ)。

实验结果如图4所示：在仅加入Cumate的条件下，TRE_3GCuO和TRE_3GCuO-BGI的诱导转录活性为1.36E+04 RLU和4.16E+04 RLU，对比无诱导条件分别提升了4.31倍和3.27倍。在仅加入DOX的条件下，TRE_3GCuO和TRE_3GCuO-BGI的诱导转录活性为2.14E+05 RLU和5.34E+05 RLU，对比无诱导条件分别提升了67.66倍和42.07倍；对比仅加入Cumate诱导条件下提升了15.71倍和12.86倍。在同时加入DOX和Cumate的条件下，TRE_3GCuO和TRE_3GCuO-BGI的诱导转录活性为7.54E+06 RLU和1.29E+07 RLU，对比无诱导条件分别提升了2381.05倍和1011.81倍；对比仅加入Cumate诱导条件下提升了552.99倍和309.27倍；对比仅加入DOX诱导条件下提升了35.19倍和24.05倍。基于以上结果，TRE_3GCuO和TRE_3GCuO-BGI复合响应元件按照不同诱导剂调控组合可以在不同转录活性级下调控目的核酸片段的诱导转录活性，其调控范围分别为4.31倍至2381.05倍和3.27倍至1011.81倍，在同时加入DOX和Cumate诱导剂时，最大诱导转录活性分别可以达到CMV启动子的47.84%和81.54%。再进一步优化DOX和/或Cumate诱导剂浓度的条件下，可以进一步在不同转录活性级下细致调控目的核酸片段的转录活性。

序列表

<110> 深圳市深研生物科技有限公司

<120> 基于四环素和Cumate的共调控序列

<130> P20200001B

<160> 39

<170> PatentIn version 3.5

<210> 1

<211> 1893

<212> DNA

<213> 人工序列

<400> 1

actgcggccg ccctgcaggt caactagtga cgtcttaatt aattgccggc tggaacgcgt 60

ttcgaacatc gattgaattc tggccaagtg gatccgctag ctctagagtc gacggtacca 120

agcttgcctc gagccatgga gatctgcatg ccctaggtcc ggaaccggtt ggcgcgccat 180

ctggcagcga tcgccgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt 240

atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta 300

tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 360

tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac 420

gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg 480

aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc 540

gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg 600

ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat 660

gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg 720

gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg 780

atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc 840

ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt 900

cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct 960

cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc 1020

gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca 1080

cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct 1140

cactgattaa gcattggtaa cgtacggaag ttagagaaaa ggcataagta gaaaagatca 1200

aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 1260

caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 1320

taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag ccgtagttag 1380

gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 1440

cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 1500

taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 1560

agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 1620

ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 1680

gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 1740

acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 1800

acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcatctca 1860

tgaaaattat gcaaattgag ccagtcaggc agt 1893

<210> 2

<211> 2900

<212> DNA

<213> 人工序列

<400> 2

gcggccgcat ctatacagtt gaagtcggaa gtttacatac acttaagttg gagtcattaa 60

aactcgtttt tcaactactc cacaaatttc ttgttaacaa acaatagttt tggcaagtca 120

gttaggacat ctactttgtg catgacacaa gtcatttttc caacaattgt ttacagacag 180

attatttcac ttataattca ctgtatcaca attccagtgg gtcagaagtt tacatacact 240

aagttgactg tgcctttaaa cagcttggaa aattccagaa aatgatgtca tggctttagc 300

ctgcagggag ggacagcccc cccccaaagc ccccagggat gtaattacgt ccctcccccg 360

ctagggggca gcagcgagcc gcccggggct ccgctccggt ccggcgctcc ccccgcatcc 420

ccgagccggc agcgtgcggg gacagcccgg gcacggggaa ggtggcacgg gatcgctttc 480

ctctgaacgc ttctcgctgc tctttgagcc tgcagacacc tggggggata cggggaaaag 540

gacctgcagg tcaactagtg acgtcttaat taattgccgg ctggacgtac gcgtctagtt 600

attaatagta atcaattacg gggtcattag ttcatagccc atatatggag ttccgcgtta 660

cataacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc ccattgacgt 720

caataatgac gtatgttccc atagtaacgc caatagggac tttccattga cgtcaatggg 780

tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat atgccaagta 840

cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc cagtacatga 900

ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct attaccatgg 960

tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca cggggatttc 1020

caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat caacgggact 1080

ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg cgtgtacggt 1140

gggaggtcta tataagcaga gctcgtttag tgaaccgtca gatcgcctgg agacgccatc 1200

cacgctgttt tgacctccat agaagacacc gggaccgatc cagcctccgc ggattcgaat 1260

cccggccggg aacggtgcat tggaacgcgg attccccgtg ccaagagtga cgtaagtacc 1320

gcctatagag tctataggcc cacaaaaaat gctttcttct tttaatatac ttttttgttt 1380

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 1440

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 1500

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 1560

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 1620

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 1680

cctcccacag ctcctgggca acgtgctggt ctgtgtgctg gcccatcact ttggcaaaga 1740

attgggattc gaacatcgat tgaattctgg ccaggatccg ctagctctag agtcgacggt 1800

accagtacta agcttgcctc gagccatgga gatctacggg tggcatccct gtgacccctc 1860

cccagtgcct ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat 1920

aaaattaagt tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag 1980

gggggtggta tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta 2040

ttgggaacca agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg 2100

ggttcaagcg attctcctgc ctcagcctcc cgagttgttg ggattccagg caagcatgac 2160

caggctcagc taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct 2220

ggtctccaac tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt 2280

acaggcgtga accactgctc ccttccctgt ccttgcatgc cctaggcagc tgtccggaac 2340

cggtgtttaa acaggccttt tccccgtatc cccccaggtg tctgcaggct caaagagcag 2400

cgagaagcgt tcagaggaaa gcgatcccgt gccaccttcc ccgtgcccgg gctgtccccg 2460

cacgctgccg gctcggggat gcggggggag cgccggaccg gagcggagcc ccgggcggct 2520

cgctgctgcc ccctagcggg ggagggacgt aattacatcc ctgggggctt tggggggggg 2580

ctgtccctca ggccttggcg cgccctaaag ccatgacatc attttctgga attttccaag 2640

ctgtttaaag gcacagtcaa cttagtgtat gtaaacttct gacccactgg aattgtgata 2700

cagtgaatta taagtgaaat aatctgtctg taaacaattg ttggaaaaat gacttgtgtc 2760

atgcacaaag tagatgtcct aactgacttg ccaaaactat tgtttgttaa caagaaattt 2820

gtggagtagt tgaaaaacga gttttaatga ctccaactta agtgtatgta aacttccgac 2880

ttcaactgta tagcgatcgc 2900

<210> 3

<211> 1208

<212> DNA

<213> 人工序列

<400> 3

actagtgtgt gtcagttagg gtgtggaaag tccccaggct ccccagcagg cagaagtatg 60

caaagcatgc atctcaatta gtcagcaacc aggtgtggaa agtccccagg ctccccagca 120

ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc gcccctaact 180

ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca tggctgacta 240

atttttttta tttatgcaga ggccgaggcc gcctctgcct ctgagctatt ccagaagtag 300

tgaggaggct tttttggagg ccataggctt ttgcaaaaag ctatggtgag caagggcgag 360

gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac 420

aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag 480

ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc 540

tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag 600

tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 660

tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 720

aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 780

aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc 840

aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 900

acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 960

gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 1020

gccgccggga tcactctcgg catggacgag ctgtacaagt aaaacttgtt tattgcagct 1080

tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 1140

ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttacctagg cagctgtccg 1200

gaaccggt 1208

<210> 4

<211> 908

<212> DNA

<213> 人工序列

<400> 4

acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60

gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120

ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180

acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240

gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300

tcagatcgcc tggagcaatt ccacatacaa acagaccaga ttgtctgttt gttacacttt 360

tgtcttatac caactttccg taccacttcc taccctcgta aattcgaatc ccggccggga 420

acggtgcatt ggaacgcgga ttccccgtgc caagagtgac gtaagtaccg cctatagagt 480

ctataggccc acaaaaaatg ctttcttctt ttaatatact tttttgttta tcttatttct 540

aatactttcc ctaatctctt tctttcaggg caataatgat acaatgtatc atgcctcttt 600

gcaccattct aaagaataac agtgataatt tctgggttaa ggcaatagca atatttctgc 660

atataaatat ttctgcatat aaattgtaac tgatgtaaga ggtttcatat tgctaatagc 720

agctacaatc cagctaccat tctgctttta ttttatggtt gggataaggc tggattattc 780

tgagtccaag ctaggccctt ttgctaatca tgttcatacc tcttatcttc ctcccacagc 840

tcctgggcaa cgtgctggtc tgtgtgctgg cccatcactt tggcaaagaa ttgggattcg 900

aaatcgat 908

<210> 5

<211> 880

<212> DNA

<213> 人工序列

<400> 5

acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60

gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120

ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180

acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240

gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300

tcagatcgcc tggagcaatt ccacaacact tttgtcttat accaactttc cgtaccactt 360

cctaccctcg taaattcgaa tcccggccgg gaacggtgca ttggaacgcg gattccccgt 420

gccaagagtg acgtaagtac cgcctataga gtctataggc ccacaaaaaa tgctttcttc 480

ttttaatata cttttttgtt tatcttattt ctaatacttt ccctaatctc tttctttcag 540

ggcaataatg atacaatgta tcatgcctct ttgcaccatt ctaaagaata acagtgataa 600

tttctgggtt aaggcaatag caatatttct gcatataaat atttctgcat ataaattgta 660

actgatgtaa gaggtttcat attgctaata gcagctacaa tccagctacc attctgcttt 720

tattttatgg ttgggataag gctggattat tctgagtcca agctaggccc ttttgctaat 780

catgttcata cctcttatct tcctcccaca gctcctgggc aacgtgctgg tctgtgtgct 840

ggcccatcac tttggcaaag aattgggatt cgaaatcgat 880

<210> 6

<211> 890

<212> DNA

<213> 人工序列

<400> 6

acgcgtgacg aggatcgttc gagcgagttt actccctatc agtgatagag aacgtatgtc 60

gagtttactc cctatcagtg atagagaacg atgtcgagtt tactccctat cagtgataga 120

gaacgtatgt cgagtttact ccctatcagt gatagagaac gtatgtcgag tttactccct 180

atcagtgata gagaacgtat gtcgagttta tccctatcag tgatagagaa cgtatgtcga 240

gtttactccc tatcagtgat agagaacgta tgtcgaggta ggcgtgtacg gtgggaggcc 300

tatataagca accggtgttt agtgaaccgt cagatcgcct ggagacgcca tcataataca 360

aacagaccag attgtctgtt tgttttcgaa tcccggccgg gaacggtgca ttggaacgcg 420

gattccccgt gccaagagtg acgtaagtac cgcctataga gtctataggc ccacaaaaaa 480

tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt ccctaatctc 540

tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt ctaaagaata 600

acagtgataa tttctgggtt aaggcaatag caatatttct gcatataaat atttctgcat 660

ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa tccagctacc 720

attctgcttt tattttatgg ttgggataag gctggattat tctgagtcca agctaggccc 780

ttttgctaat catgttcata cctcttatct tcctcccaca gctcctgggc aacgtgctgg 840

tctgtgtgct ggcccatcac tttggcaaag aattgggatt cgaaatcgat 890

<210> 7

<211> 845

<212> DNA

<213> 人工序列

<400> 7

acgcgtgacg aggatcgttc gagcgagttt actccctatc agtgatagag aacgtatgtc 60

gagtttactc cctatcagtg atagagaacg atgtcgagtt tactccctat cagtgataga 120

gaacgtatgt cgagtttact ccctatcagt gatagagaac gtatgtcgag tttactccct 180

atcagtgata gagaacgtat gtcgagttta tccctatcag tgatagagaa cgtatgtcga 240

gtttactccc tatcagtgat agagaacgta tgtcgaggta ggcgtgtacg gtgggaggcc 300

tatataagca gagctcgttt agtgaaccgt cagatcgcct tcgaatcccg gccgggaacg 360

gtgcattgga acgcggattc cccgtgccaa gagtgacgta agtaccgcct atagagtcta 420

taggcccaca aaaaatgctt tcttctttta atatactttt ttgtttatct tatttctaat 480

actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg cctctttgca 540

ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata tttctgcata 600

taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc taatagcagc 660

tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg attattctga 720

gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc ccacagctcc 780

tgggcaacgt gctggtctgt gtgctggccc atcactttgg caaagaattg ggattcgaaa 840

tcgat 845

<210> 8

<211> 414

<212> DNA

<213> 人工序列

<400> 8

acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60

gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120

ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180

acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240

gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt acaaacagac 300

cagattgtct gtttgtttta gtgaaccgtc agatcgcctg gagcaattcc acaacacttt 360

tgtcttatac caactttccg taccacttcc taccctcgta aattcgaaat cgat 414

<210> 9

<211> 414

<212> DNA

<213> 人工序列

<400> 9

acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60

gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120

ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180

acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240

gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300

tcagatacaa acagaccaga ttgtctgttt gtttcgcctg gagcaattcc acaacacttt 360

tgtcttatac caactttccg taccacttcc taccctcgta aattcgaaat cgat 414

<210> 10

<211> 415

<212> DNA

<213> 人工序列

<400> 10

acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60

gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120

ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180

acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240

gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300

tcagatcgcc tggagcaatt ccacaacact tttgtcttat accaactttc cgtaccactt 360

cctaccctcg taaaatacaa acagaccaga ttgtctgttt gttttcgaaa tcgat 415

<210> 11

<211> 472

<212> DNA

<213> 人工序列

<400> 11

acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60

gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120

ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180

acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240

gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300

tcagatcgcc tggagcaatt ccacatacaa acagaccaga ttgtctgttt gttttcgata 360

ttaggatatc actccgttta aactacaaac agaccagatt gtctgtttgt tacacttttg 420

tcttatacca actttccgta ccacttccta ccctcgtaaa ttcgaaatcg at 472

<210> 12

<211> 588

<212> DNA

<213> 人工序列

<400> 12

acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60

gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120

ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180

acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240

gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300

tcagatcgcc tggagcaatt ccacatacaa acagaccaga ttgtctgttt gttttcgata 360

ttaggatatc gtgtgcatca aagtacaaac agaccagatt gtctgtttgt tcagctgcat 420

gcatctcaat tagtcagcaa ctacaaacag accagattgt ctgtttgttg gcagaagtat 480

gatatcactc cgtttaaact acaaacagac cagattgtct gtttgttaca cttttgtctt 540

ataccaactt tccgtaccac ttcctaccct cgtaaattcg aaatcgat 588

<210> 13

<211> 704

<212> DNA

<213> 人工序列

<400> 13

acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60

gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120

ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180

acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240

gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300

tcagatcgcc tggagcaatt ccacatacaa acagaccaga ttgtctgttt gttttcgata 360

ttaggatatc gtgtgcatca aagtacaaac agaccagatt gtctgtttgt tcagctgcaa 420

catgccttac aaggagagaa atacaaacag accagattgt ctgtttgttc ctaggtttat 480

atagtgaata gagttaggct acaaacagac cagattgtct gtttgttcag ctgcatgcat 540

ctcaattagt cagcaactac aaacagacca gattgtctgt ttgttggcag aagtatgata 600

tcactccgtt taaactacaa acagaccaga ttgtctgttt gttacacttt tgtcttatac 660

caactttccg taccacttcc taccctcgta aattcgaaat cgat 704

<210> 14

<211> 210

<212> DNA

<213> 人工序列

<400> 14

gtcaatcgat gctgccgcag caaaagcagg agcagatgcc gccgtcgcag gcgaagatgt 60

cgcagacgga ggaggcgatg ctgccggcgg aggaggcgaa gtaagtagag ggctgggctg 120

ggctgtgggg ggtgtggggt gcgggactgg gcagtctggg agtccctctc accacttttc 180

ttacctttct aggatgctgc cggatccgac 210

<210> 15

<211> 633

<212> DNA

<213> 人工序列

<400> 15

atcgatgcca ccatgtctcc aaagaggaga acccaggcag agagggcaat ggagacacag 60

ggcaagctga tcgccgccgc cctgggcgtg ctgagggaga agggatacgc aggcttccgc 120

atcgccgatg tgccaggagc cgccggcgtg tcccggggcg cacagtctca ccacttccct 180

accaagctgg agctgctgct ggccacattt gagtggctgt atgagcagat caccgagagg 240

agccgcgcca ggctggcaaa gctgaagcca gaggacgatg tgatccagca gatgctggac 300

gatgccgccg agttctttct ggacgatgac tttagcatct ccctggatct gatcgtggcc 360

gccgatagag accccgccct gagggagggc atccagagga cagtggagag aaacaggttc 420

gtggtggagg atatgtggct gggcgtgctg gtgtctcgcg gcctgagccg ggatgacgca 480

gaggacatcc tgtggctgat ctttaacagc gtgcggggcc tggccgtgag atccctgtgg 540

cagaaggaca aggagcggtt cgagcgcgtg cggaattcca ccctggagat cgccagagag 600

aggtacgcca agtttaagag atgataactc gag 633

<210> 16

<211> 1496

<212> DNA

<213> 人工序列

<400> 16

actagtgtgt gtcagttagg gtgtggaaag tccccaggct ccccagcagg cagaagtatg 60

caaagcatgc atctcaatta gtcagcaacc aggtgtggaa agtccccagg ctccccagca 120

ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc gcccctaact 180

ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca tggctgacta 240

atttttttta tttatgcaga ggccgaggcc gcctctgcct ctgagctatt ccagaagtag 300

tgaggaggct tttttggagg ccataggctt ttgcaaaaag ctatgaaaaa gcctgaactc 360

acagcgactt ctgttgagaa gtttctgatc gaaaagttcg acagcgttag cgacctgatg 420

cagctctcgg agggcgagga atctagggct ttcagcttcg atgtaggagg gcgtggatat 480

gtcctgcggg taaatagctg cgccgatggt ttctacaaag atcgttatgt ttatcggcac 540

tttgcatcgg ctgcgctccc gattcccgaa gtgcttgaca ttggggagtt cagcgagagc 600

ctgacctatt gcatctcccg ccgcgcacag ggcgtaactt tgcaagacct ccctgaaacc 660

gaactgcccg ctgttctaca acctgtcgcg gaggctatgg acgctattgc tgctgccgat 720

ctttcccaga cttccgggtt cggcccattt ggaccgcaag gaatcggtca atacactaca 780

tggcgtgatt tcatttgcgc gattgctgat ccccatgtgt atcattggca aactgtgatg 840

gatgataccg tcagcgcgag tgtcgcgcag gctctcgatg agctgatgct ttgggccgag 900

gattgccccg aagttcgcca cttggtccac gcggatttcg gcagcaacaa tgtcctgaca 960

gataatggcc gcataacagc ggtcattgat tggagcgaag ctatgttcgg ggattcccaa 1020

tacgaggtcg ctaacatctt tttctggcgt ccttggttgg cttgtatgga gcagcaaacg 1080

cgctactttg aaagacgaca tccagagctt gcaggatcgc ctcggctccg ggcgtatatg 1140

ctccgcattg gtcttgacca actctatcag agcttggtgg acggcaattt cgatgatgct 1200

gcttgggcgc agggtcgatg tgatgcaatc gtccgaagtg gagccgggac tgtcgggcga 1260

acacaaatcg cccgcagaag cgcagccgtc tggaccgatg gctgtgtaga agttctcgcc 1320

gatagtggaa acagacgccc ctctactcgt ccgagggcaa aggaatagaa cttgtttatt 1380

gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 1440

ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta accggt 1496

<210> 17

<211> 1979

<212> DNA

<213> 人工序列

<400> 17

acgcgtgaca ttgattattg acatgttatt aatagtaatc aattacgggg tcattagttc 60

atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120

cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180

tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240

tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 300

ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 360

acgtattagt catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc 420

ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 480

cagcgatggg ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg 540

ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa 600

agtttccttt tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc 660

gggcgttcga aggagtcgct gcgacgctgc cttcgccccg tgccccgctc cgccgccgcc 720

tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac 780

ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg 840

tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg 900

gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc 960

ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg 1020

agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc 1080

gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa 1140

ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc 1200

cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg 1260

ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc 1320

cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg 1380

tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg 1440

cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa 1500

atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct 1560

cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc 1620

ttctggcgtg tgaccggcgg ctcttgagcc tctgctaacc atgttcatgc cttcttcttt 1680

ttcctacagc ttcgaacctg ggcaacgtgc tggttattgt gctgtctcat cattttggca 1740

aaatcgattg aattctggcc aagtggatcc gctagctcta gagtcgacgg taccagtact 1800

aagcttgcct cgaggatatc ccatggagat ctatggggac atcatgaagc cccttgagca 1860

tctgacttct ggctaataaa ggaaatttat tttcattgca atagtgtgtt ggaatttttt 1920

gtgtctctca ctcggaagga catatgggag catgccctag gcagctgtcc ggaaccggt 1979

<210> 18

<211> 768

<212> DNA

<213> 人工序列

<400> 18

atcgatgcca ccatgagccg cctggataag tccaaagtga tcaactctgc cctggagctg 60

ctgaatggag tgggaatcga gggactgacc acaaggaagc tggcacagaa gctgggagtg 120

gagcagccta ccctgtactg gcacgtgaag aacaagcgcg ccctgctgga cgcactgcca 180

atcgagatgc tggatcggca ccacacacac agctgcccac tggagggaga gtcctggcag 240

gattttctgc ggaacaatgc caagtcttat agatgtgcac tgctgagcca cagggacgga 300

gcaaaggtgc acctgggaac caggcccaca gagaagcagt acgagaccct ggagaaccag 360

ctggccttcc tgtgccagca gggcttttcc ctggagaatg ccctgtatgc cctgtctgcc 420

gtgggccact ttaccctggg atgcgtgctg gaggagcagg agcaccaggt ggccaaggag 480

gagagagaga caccaaccac agatagcatg ccccctctgc tgaagcaggc catcgagctg 540

ttcgacaggc agggagcaga gccagccttc ctgtttggcc tggagctgat catctgcggc 600

ctggagaagc agctgaagtg tgagtccgga ggacctacag acgcactgga cgatttcgac 660

ctggatatgc tgccagccga tgccctggac gattttgacc tggatatgct gcccgccgac 720

gccctggatg actttgacct ggacatgctg cctggctgat aactcgag 768

<210> 19

<211> 765

<212> DNA

<213> 人工序列

<400> 19

atcgatgcca ccatgtccag actggacaag agcaaagtca taaacggcgc tctggaatta 60

ctcaatggag tcggtatcga aggcctgacg acaaggaaac tcgctcaaaa gctgggagtt 120

gagcagccta ccctgtactg gcacgtgaag aacaagcggg ccctgctcga tgccctgcca 180

atcgagatgc tggacaggca tcatacccac ttctgccccc tggaaggcga gtcatggcaa 240

gactttctgc ggaacaacgc caagtcattc cgctgtgctc tcctctcaca tcgcgacggg 300

gctaaagtgc atctcggcac ccgcccaaca gagaaacagt acgaaaccct ggaaaatcag 360

ctcgcgttcc tgtgtcagca aggcttctcc ctggagaacg cactgtacgc tctgtccgcc 420

gtgggccact ttacactggg ctgcgtattg gaggaacagg agcatcaagt agcaaaagag 480

gaaagagaga cacctaccac cgattctatg cccccacttc tgagacaagc aattgagctg 540

ttcgaccggc agggagccga acctgccttc cttttcggcc tggaactaat catatgtggc 600

ctggagaaac agctaaagtg cgaaagcggc gggccggccg acgcccttga cgattttgac 660

ttagacatgc tcccagccga tgcccttgac gactttgacc ttgatatgct gcctgctgac 720

gctcttgacg attttgacct tgacatgctc cccgggtaac tcgag 765

<210> 20

<211> 1320

<212> DNA

<213> 人工序列

<400> 20

ctcgaggccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 60

gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 120

gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 180

ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 240

gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 300

ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 360

agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 420

tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 480

ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaaacgtcta ggccccccga 540

accacgggga cgtggttttc ctttgaaaaa cacgatgata atatggccac aaccatggtg 600

agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 660

gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 720

ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 780

accaccctga cctggggcgt gcagtgcttc agccgctacc ccgaccacat gaagcagcac 840

gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag 900

gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 960

cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 1020

gagtacaact acatcagcca caacgtctat atcaccgccg acaagcagaa gaacggcatc 1080

aaggccaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct cgccgaccac 1140

taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 1200

agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 1260

gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gtaaagatct 1320

<210> 21

<211> 1044

<212> DNA

<213> 人工序列

<400> 21

ggatccgcca ccatgggcaa gtccaaggag atctctcagg acctgagaaa gaggatcgtg 60

gatctgcaca agagcggcag ctccctggga gcaatctcca agcgcctggc agtgcctcgg 120

tctagcgtgc agaccatcgt gcgcaagtac aagcaccacg gcaccacaca gccttcttat 180

cggagcggcc ggagaagggt gctgagccca cgcgacgagc ggacactggt gcgcaaggtg 240

cagatcaacc cccggaccac agccaaggat ctggtgaaga tgctggagga gaccggcaca 300

aaggtgtcca tctctaccgt gaagagagtg ctgtacaggc acaacctgaa gggccactcc 360

gccagaaaga agcctctgct gcagaatagg cacaagaagg caaggctgag gttcgcaacc 420

gcacacggcg acaaggatcg cacattttgg cggaacgtgc tgtggtctga cgagaccaag 480

atcgagctgt tcggccacaa tgatcacaga tacgtgtgga ggaagaaggg cgaggcctgc 540

aagcccaaga ataccatccc tacagtgaag cacggaggag gctccatcat gctgtgggga 600

tgttttgcag caggaggaac aggcgccctg cacaagatcg acggcatcat ggatgccgtg 660

cagtatgtgg acatcctgaa gcagcacctg aagacctctg tgagaaagct gaagctgggc 720

aggaagtggg tgttccagca cgacaacgat ccaaagcaca caagcaaggt ggtggccaag 780

tggctgaagg acaataaggt gaaggtgctg gagtggccca gccagtcccc tgatctgaac 840

ccaatcgaga atctgtgggc cgagctgaag aagagagtga gggcccggag acccaccaac 900

ctgacacagc tgcaccagct gtgccaggag gagtgggcca agatccaccc aaattactgt 960

ggcaagctgg tggagggcta tcccaagagg ctgacccagg tgaagcagtt taagggcaac 1020

gccacaaagt attgataact cgag 1044

<210> 22

<211> 376

<212> DNA

<213> 人工序列

<400> 22

acgcgtgacg aggatcgttc gagcgagttt actccctatc agtgatagag aacgtatgtc 60

gagtttactc cctatcagtg atagagaacg atgtcgagtt tactccctat cagtgataga 120

gaacgtatgt cgagtttact ccctatcagt gatagagaac gtatgtcgag tttactccct 180

atcagtgata gagaacgtat gtcgagttta tccctatcag tgatagagaa cgtatgtcga 240

gtttactccc tatcagtgat agagaacgta tgtcgaggta ggcgtgtacg gtgggaggcc 300

tatataagca accggtgttt agtgaaccgt cagatctaca aacagaccag attgtctgtt 360

tgttttcgaa atcgat 376

<210> 23

<211> 344

<212> DNA

<213> 人工序列

<400> 23

tccctatcag tgatagagaa cgtatgaaga gtttactccc tatcagtgat agagaacgta 60

tgcagacttt actccctatc agtgatagag aacgtataag gagtttactc cctatcagtg 120

atagagaacg tatgaccagt ttactcccta tcagtgatag agaacgtatc tacagtttac 180

tccctatcag tgatagagaa cgtatatcca gtttactccc tatcagtgat agagaacgta 240

ttaggcgtgt acggtgggcg cctataaaag cagagctcgt ttagtgaacc gtcagatcgc 300

ctggagcaat tccacataca aacagaccag attgtctgtt tgtt 344

<210> 24

<211> 19

<212> DNA

<213> 人工序列

<400> 24

tccctatcag tgatagaga 19

<210> 25

<211> 28

<212> DNA

<213> 人工序列

<400> 25

taggcgtgta cggtgggcgc ctataaaa 28

<210> 26

<211> 29

<212> DNA

<213> 人工序列

<400> 26

taggcgtgta cggtgggagg cctatataa 29

<210> 27

<211> 28

<212> DNA

<213> 人工序列

<400> 27

tacaaacaga ccagattgtc tgtttgtt 28

<210> 28

<211> 324

<212> DNA

<213> 人工序列

<400> 28

tccctatcag tgatagagaa cgtatgaaga gtttactccc tatcagtgat agagaacgta 60

tgcagacttt actccctatc agtgatagag aacgtataag gagtttactc cctatcagtg 120

atagagaacg tatgaccagt ttactcccta tcagtgatag agaacgtatc tacagtttac 180

tccctatcag tgatagagaa cgtatatcca gtttactccc tatcagtgat agagaacgta 240

ttaggcgtgt acggtgggcg cctataaaag cagagctcgt ttagtgaacc gtcagataca 300

aacagaccag attgtctgtt tgtt 324

<210> 29

<211> 332

<212> DNA

<213> 人工序列

<400> 29

tccctatcag tgatagagaa cgtatgtcga gtttactccc tatcagtgat agagaacgat 60

gtcgagttta ctccctatca gtgatagaga acgtatgtcg agtttactcc ctatcagtga 120

tagagaacgt atgtcgagtt tactccctat cagtgataga gaacgtatgt cgagtttatc 180

cctatcagtg atagagaacg tatgtcgagt ttactcccta tcagtgatag agaacgtatg 240

tcgaggtagg cgtgtacggt gggaggccta tataagcaac cggtgtttag tgaaccgtca 300

gatctacaaa cagaccagat tgtctgtttg tt 332

<210> 30

<211> 352

<212> DNA

<213> 人工序列

<400> 30

tccctatcag tgatagagaa cgtatgtcga gtttactccc tatcagtgat agagaacgat 60

gtcgagttta ctccctatca gtgatagaga acgtatgtcg agtttactcc ctatcagtga 120

tagagaacgt atgtcgagtt tactccctat cagtgataga gaacgtatgt cgagtttatc 180

cctatcagtg atagagaacg tatgtcgagt ttactcccta tcagtgatag agaacgtatg 240

tcgaggtagg cgtgtacggt gggaggccta tataagcaac cggtgtttag tgaaccgtca 300

gatcgcctgg agacgccatc ataatacaaa cagaccagat tgtctgtttg tt 352

<210> 31

<211> 488

<212> DNA

<213> 人工序列

<400> 31

tcccggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg acgtaagtac 60

cgcctataga gtctataggc ccacaaaaaa tgctttcttc ttttaatata cttttttgtt 120

tatcttattt ctaatacttt ccctaatctc tttctttcag ggcaataatg atacaatgta 180

tcatgcctct ttgcaccatt ctaaagaata acagtgataa tttctgggtt aaggcaatag 240

caatatttct gcatataaat atttctgcat ataaattgta actgatgtaa gaggtttcat 300

attgctaata gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag 360

gctggattat tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct 420

tcctcccaca gctcctgggc aacgtgctgg tctgtgtgct ggcccatcac tttggcaaag 480

aattggga 488

<210> 32

<211> 31

<212> DNA

<213> 人工序列

<400> 32

tcaggatcca tctgcgatct aagtaagctt g 31

<210> 33

<211> 29

<212> DNA

<213> 人工序列

<400> 33

tcaactcgag ctagaattac acggcgatc 29

<210> 34

<211> 27

<212> DNA

<213> 人工序列

<400> 34

gtcaatcgat ggagtcgctg cgcgctg 27

<210> 35

<211> 29

<212> DNA

<213> 人工序列

<400> 35

gtcggatccc tgtaggaaaa agaagaagg 29

<210> 36

<211> 26

<212> DNA

<213> 人工序列

<400> 36

gtcaatcgat gtaagtgccg tgtgtg 26

<210> 37

<211> 30

<212> DNA

<213> 人工序列

<400> 37

gtcggatccc tgaaatggaa gaaaaaaact 30

<210> 38

<211> 30

<212> DNA

<213> 人工序列

<400> 38

gtcaatcgat gtaagtatca aggttacaag 30

<210> 39

<211> 25

<212> DNA

<213> 人工序列

<400> 39

gtcggatccc tgtggagaga aaggc 25

Claims

1.核酸序列，所述核酸序列包含至少2个拷贝的能与受四环素或其衍生物调控的反式激活物rtTA结合的TetO-操作子序列、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的与受cumate调控的转录阻遏物CymR结合的CuO-操作子序列，其中所述CuO-操作子序列在所述TATA盒序列的3’端下游，和所述TATA盒的距离间隔为30bp至50bp。

2.根据权利要求1所述的核酸序列，其中所述CuO-操作子序列和所述TATA盒的距离间隔为50bp。

3. 根据权利要求1所述的核酸序列，其中所述TetO-操作子序列如SEQ ID NO: 24所示，及/或所述最小启动子序列如SEQ ID NO: 25或SEQ ID NO:26所示，及/或所述CuO-操作子序列如SEQ ID NO:27所示。

4. 根据权利要求3所述的核酸序列，所述核酸序列如SEQ ID NO:23、 SEQ ID NO:28、SEQ ID NO:29或SEQ ID NO:30所示。

5.根据权利要求1-4中任一项所述的核酸序列，所述核酸序列在3’端还包含可剪接的内含子序列。

6.载体，所述载体包含根据权利要求1-5中任一项所述的核酸序列。

7.根据权利要求6所述的载体，其中所述载体是表达载体，所述表达载体包含处于根据权利要求1-5中任一项所述的核酸序列的3’端下游的目的核酸片段，并且所述目的核酸片段的转录受根据权利要求1-5中任一项所述的核酸序列的控制。

8.宿主细胞，所述宿主细胞包含根据权利要求1-5中任一项所述的核酸序列或根据权利要求6或7所述的载体。

9.在宿主细胞中诱导表达目的核酸片段的方法，所述方法包括以下步骤：

(1) 将根据权利要求7所述的载体以及rtTA的编码序列和CymR的编码序列转入所述宿主细胞中；

(2) 在经过(1)的所述宿主细胞中表达rtTA和CymR；以及

10.根据权利要求9所述的方法，其中所述rtTA是rtTA_adv或rtTA_3G。

11. 根据权利要求9所述的方法，其中所述rtTA的编码序列如SEQ ID NO. 18所示。

12. 根据权利要求9所述的方法，其中所述CymR的编码序列如SEQ ID NO. 15所示。