CN113699147A - 基于四环素和Cumate的共调控序列 - Google Patents
基于四环素和Cumate的共调控序列 Download PDFInfo
- Publication number
- CN113699147A CN113699147A CN202010442506.3A CN202010442506A CN113699147A CN 113699147 A CN113699147 A CN 113699147A CN 202010442506 A CN202010442506 A CN 202010442506A CN 113699147 A CN113699147 A CN 113699147A
- Authority
- CN
- China
- Prior art keywords
- sequence
- nucleic acid
- cuo
- tre
- rtta
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/635—Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/90—Vectors containing a transposable element
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
- C12N2830/002—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
- C12N2830/002—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
- C12N2830/003—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor tet inducible
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/42—Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本申请提供一种用于调控目的核酸片段的转录的核酸序列,所述核酸序列包含至少2个拷贝的能与受四环素或其衍生物调控的反式激活物rtTA结合的TetO‑操作子序列、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的与受cumate调控的转录阻遏物CymR结合的CuO‑操作子序列。本申请还提供包含所述核酸序列的载体和宿主细胞以及用于在宿主细胞中诱导表达目的核酸片段的方法。
Description
发明领域
本发明涉及用于调控目的核酸片段转录的基于四环素和Cumate依赖的核酸序列。具体地,本发明涉及用于调控目的核酸片段转录的核酸序列,所述核酸序列包含至少2个拷贝的结合四环素依赖的反式激活物(reverse tetracycline controlledtransactivator,rtTA)的TetO-操作子序列(Tet operator,TetO)、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的结合CymR转录阻遏物(transcriptionrepressor)的CuO-操作子序列(Cumate operator,CuO)。进一步,在上述核酸序列3'端下游和被调控目的核酸片段5’端上游之间还存在可剪接的内含子序列,其可用于在保持无诱导泄露的情况下,进一步提高诱导后转录活性。再进一步,本发明还涉及含有以上调控序列的载体、病毒、细胞、转基因植物或动物。
背景技术
基因表达可以通过对其中的几个步骤,包括转录,RNA剪接,翻译和翻译后修饰,进行调控来实现对基因表达的调控,在转录步骤对特定基因或目的核酸片段进行调控是最广泛、最有效的表达调控方式。通过外源因素控制细胞、植物或动物体内特定基因和核酸片段的转录和表达开启或关闭的诱导表达系统在生物基础科研、生物制药、基因治疗、细胞治疗、转基因植物或动物改良等领域起关键作用。通常上述的诱导表达系统在设计上由两个部分组成:1)在被调控目的核酸片段5’端上游的一段特定核酸序列,一般可以和转录激活物或阻遏物结合调控目的核酸片段的转录,比如包含操作子(operator)的核酸序列(此核酸序列以下称为响应元件);2)在受外部因素调控下,能和上述特定核酸序列结合或分离,一般带有转录激活或阻遏功能的单个或多个调控物,通常是表达后的蛋白。外部因素可以是环境因素,例如温度、光照等;或某种成分物质,例如参与生命活动的代谢物、荷尔蒙、金属离子或人造化合物等。
“四环素诱导表达系统(Tetracycline inducible system或Tet System)”是目前在科学研究上和商业上最广泛使用的诱导表达系统之一(参见,例如,Gossen,M.andH.Bujard(1992)."Tight control of gene expression in mammalian cells bytetracycline-responsive promoters."Proc Natl Acad Sci U S A 89(12):5547-5551.,美国专利号5,888,981,5,814,618,6,004,941,5,814,618,7,541,446,WO96/01313和WO00/75347(上述文献通过引用结合于此))。其主要由四环素依赖的调控物和含有TetO操作子的响应元件组成,通过使用四环素诱导的方式调控和含有TetO操作子的响应元件相连的目的核酸片段的转录。此含有TetO操作子的响应元件可以在没有四环素的条件下和转录激活物结合,并在结合后启动下游被调控目的核酸片段转录;也可以在组成型活跃启动子(constitutively active promoter)的下游,被调控目的核酸片段的上游,然后在没有四环素的条件下和四环素依赖的阻遏物结合,抑制下游被调控的目的核酸片段转录。传统上,四环素依赖的调控物在没有四环素的条件下和TetO操作子结合,在有四环素的条件下和TetO操作子分离。比如基于此原理设计的激活物,通过去除环境中的四环素可以启动被调控目的核酸片段的转录(美国专利号5,464,758,6,914,124,5,789,156,6,271,348,WO96/01313和WO00/75347)。之后发展出反式的四环素依赖的调控物,其仅在有四环素的条件下和TetO操作子结合。基于反式的四环素依赖的激活物,在环境中加入四环素可以激活被调控目的核酸片段转录(美国专利号5,654,168,6,136,954,5,789,156,6,271,348,6,087,166,6,271,341,7,541,446,WO96/01313和WO00/75347),比如在培养基中加入四环素激活被调控目的核酸片段转录或给转基因动物注射四环素激活体内由基因工程转入的被调控目的基因的转录和表达。
被调控核酸片段在诱导条件下的转录活性和非诱导条件下的泄露转录活性是评价诱导表达系统优劣的两个重要指标,好的诱导表达系统需要具有更高的诱导转录活性和更低的泄露转录活性。四环素诱导系统自第一次报道以来被多个实验室优化,其性能不断提升。主要优化包括四环素依赖的调控物和含有TetO操作子的响应元件。在四环素依赖的调控物优化方面主要集中在(1)在尽可能保持诱导后转录活性的情况下,降低无诱导条件下的泄露转录活性,提高诱导/泄露转录活性比例;(2)优化调控物和四环素及其衍生物做为诱导剂结合的特异性和亲和力,在更低的四环素及其衍生物浓度下达到最大诱导转录活性,同时降低调控物在无诱导剂条件和响应元件的亲和力。(参见Zhou,X.,et al.(2006)."Optimization of the Tet-On system for regulated gene expression through viralevolution."Gene Ther 13(19):1382-1390.,美国专利号8,383,364,7,541,446)。优化含有TetO操作子的响应元件主要集中在(1)优化TetO操作子的拷贝数目和连接序列。在提高响应元件性能的同时,增强多拷贝连续TetO操作子序列的稳定性尤其是在病毒载体上的稳定性;(2)在不显著影响诱导后转录活性的条件下,降低最小启动子(mini promoter)的无诱导基础泄露转录活性,提高诱导/泄露转录活性比例(参见Loew,R.,et al.(2010)."Improved Tet-responsive promoters with minimized background expression."BMC Biotechnol 10:81.,美国专利号9,181,556)。目前广泛使用的商业四环素诱导系统主要为Clontech Laboratories,Inc.公司的Advanced Inducible Gene ExpressionSystems(文件编号:PT3898-1(102312),其中的四环素依赖的反式激活物rtTA和含有TetO操作子的响应元件TRE(含有多拷贝连续TetO操作子序列和最小启动子序列的核酸序列,Tet Response Element,下文称为TRE)在下文中分别被称为rtTAadv和TREadv),Advanced Inducible Gene Expression Systems(文件编号:PT3945-1(101612))和3G Inducible Expression Systems(文件编号:PT5148-1(010814),其中的四环素依赖的调控物rtTA和含有TetO操作子的响应元件TRE在下文中分别被称为rtTA3G和TRE3G)。
Cumate诱导系统(Cumate Inducible System)开发自Pseudomonas putida的p-cym操纵子,由在组成型活性启动子TATA盒下游的CuO操作子和Cumate及其衍生物依赖的并能和CuO操作子结合的阻遏物CymR蛋白组成。在无Cumate的条件下,CymR蛋白和CuO操作子结合,抑制下游被调控目的核酸片段的转录;当CymR蛋白和Cumate结合后,其和CuO操作子的亲和力下降并分离,下游被调控目的核酸片段转录不再受抑制。比如将CuO操作子连接在被调控目的核酸片段和组成型活性启动子序列之间,同时在细胞内组成性活跃表达CymR阻遏物。当培养基中没有Cumate及其衍生物诱导剂时,表达的CymR蛋白与CuO操作子结合抑制被调控目的核酸片段转录;当培养基中添加诱导剂时,与Cumate及其衍生物结合的CymR蛋白和CuO操作子分离,被调控目的核酸片段的转录不再受抑制(参照WO02088346A2、WO2006037215A1(上述文献通过引用结合于此))。
Cumate诱导系统的优化主要集中在(1)优化最短的有效CuO操作子序列。(2)筛选可以溶于水的和p-cumate功能相似的Cumate及衍生物诱导剂。(3)构建类似Tet-Off的诱导系统,由CymR激活物(如构建CymR和HSV VP-16转录激活结构域的融合蛋白)和含有多拷贝连续CuO操作子的响应元件(序列包含多段重复CuO序列和下游最小启动子)组成。在无Cumate诱导剂的条件下,CymR激活物和CuO操作子结合激活被调控目的核酸片段的转录;在有Cumate诱导剂的条件下,CymR激活物和CuO操作子分离,被调控目的核酸片段停止转录。(4)构建类似Tet-On的诱导系统,由反式CymR激活物(通过突变和筛选,使得反式CymR在有Cumate诱导剂时和CuO操作子结合,没有Cumate诱导剂时和CuO操作子分离,并且构建反式CymR和HSV VP-16转录激活结构域的融合蛋白做为反式CymR激活物)和含有多拷贝连续CuO操作子的响应元件组成。在有Cumate诱导剂条件下,反式CymR激活物和响应元件结合,激活被调控目的核酸片段转录;在没有Cumate诱导剂条件下,反式CymR激活物和响应元件分离,被调控目的核酸片段停止转录(参照:Mullick,A.,et al.(2006)."The cumate gene-switch:a system for regulated expression in mammalian cells."BMC Biotechnol6:43.;WO02088346A2、WO2006037215A1)。目前广泛使用的Cumate诱导系统主要为SBISystem Biosciences公司的SparQ Cumate Switch系统(文件编号:1-090810)。
在目前的各种诱导表达系统开发和改进中,主要优化都集中在降低被调控目的核酸片段在无诱导条件下的基础泄露转录活性的控制上,而在诱导条件下的转录活性不是优化重点,导致被诱导表达系统调控的目的核酸片段的诱导后转录活性低于常见的组成型活性启动子(constitutively active promoter)控制下的转录活性。而在生物技术开发中,提高目的核酸片段在诱导后的绝对转录活性和控制其在无诱导条件下的泄露转录活性同样重要。比如在生物制药领域中,生产带有细胞毒性的重组蛋白或病毒载体,既需要提高目的核酸片段编码的蛋白在诱导后的表达量,也需要为保证生产细胞系的培养状态和稳定性而控制目的核酸片段在无诱导条件下的泄露表达量。所以一种既能提高目的核酸片段在诱导条件下的转录活性,同时又能控制该目的核酸片段在无诱导条件下的泄露转录活性的诱导表达系统可以广泛促进生物技术在诸多领域的研究、开发和产业化。
发明内容
本发明涉及四环素和Cumate依赖的,能调控目的核酸片段转录的核酸序列,具体地,所述核酸序列包含至少2个拷贝的结合四环素或其衍生物依赖的反式激活物(reversetetracycline controlled transactivator,rtTA)的TetO操作子序列(Tet operator,TetO)、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的结合CymR转录阻遏物(transcription repressor)的CuO-操作子序列(Cumate operator,CuO)。进一步,在上述核酸序列3’端下游和被调控目的核酸片段5’端上游之间存在的可以剪接的内含子序列可以在保持无诱导泄露的情况下,进一步提高诱导后转录活性。再进一步,本发明还涉及含有以上调控序列并以调控基因表达为目的的载体、病毒、细胞、转基因植物或动物。
术语“目的核酸片段”一般可以指脱氧核糖核酸片段(DNA片段),根据应用目的可以是指基因,如编码蛋白的核酸序列;可以为一段核糖核酸(RNA),如RNA病毒的全部或部分基因组RNA片段、微小RNA(microRNA,简称miRNA)、小分子干扰核糖核酸(smallinterfering RNA,简称siRNA)、长链非编码核糖核酸(long non-doding RNAs,简称LncRNA),CRISPR基因编辑系统的导向RNA(guide RNA,gRNA)、转运核糖核酸(transferRNA,简称tRNA)、核糖体核糖核酸(Ribosomal RNA,简称rRNA)、适体(Aptamers)、能和其他核酸结合的核糖核酸片段、能和特定蛋白结合的核糖核酸片段、或任意一段核糖核酸;也可以是以上一段或多段核酸序列的组合。
术语“载体”是一种包含核酸分子,通常被用作将外来遗传物质,如上述目的核酸片段,人工携带到另一个细胞中的媒介物,并且在其中复制和/或表达。在功能上,所有载体一般都可以用于克隆并携带外来目的核酸片段,同时也有专门设计的用于核酸片段转录和蛋白质表达的表达载体。质粒,病毒载体,粘粒(cosmids)和人工染色体是载体的四种主要类型。其中,最常用的载体是质粒。所有工程质粒载体都包含在细菌中复制的复制起点,用于插入目的核酸片段的多克隆位点和用于选择阳性菌株的标记基因。病毒载体是另一种常用载体,通常用来将遗传物质,如目的核酸片段输送到细胞中。此过程可以在生物体内(体内)或细胞培养物中(体外)进行。基于病毒自身进化出的多种分子机制,如对遗传物质的保护、基于受体对宿主细胞的选择、遗传物质向宿主细胞内的递送、在宿主细胞内的复制和/或表达、对宿主细胞生长、代谢、繁殖复制和防御机制的调整、以及在高等动物体内对免疫系统的抑制和/或逃逸,可以有效地将目的核酸片段转移到感染的靶细胞内。除了被用于分子生物学研究中,病毒载体还常被用于基因治疗、细胞治疗、免疫治疗和疫苗开发。
通常诱导表达系统在增强被调控目的核酸片段的诱导后转录活性的同时也会增加其在无诱导条件下的泄露转录活性;而常用的控制无诱导条件下泄露转录活性的策略比如通过点突变降低反式激活物在无诱导剂的条件下和操作子的亲和力或降低操作子下游的最小启动子的基础活性都会影响诱导后的最大转录活性。这使得绝大多数的单一诱导表达系统都为了平衡在无诱导条件下的泄露转录活性而降低了在诱导条件下对被调控目的核酸片段的转录激活活性。设计含有多调控组件的复合诱导表达系统是解决上述问题的有效方向。在本发明实现的复合诱导表达系统中,一方面优化提高第一诱导表达系统中的激活物和相应响应元件组合的诱导后最大转录活性,另一方面用第二诱导表达系统中的阻遏物和相应相应响应元件组合控制复合诱导表达系统因此提高的泄露转录活性,所述的复合诱导表达系统比如使用Tet-On诱导表达系统做为第一诱导表达系统,Cumate诱导表达系统做为第二诱导表达系统。上述复合诱导表达系统的复合响应元件序列包含至少2个拷贝的结合受四环素或其衍生物调控的反式激活物(reverse tetracycline controlledtransactivator,rtTA)的TetO操作子序列(tet operator)、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的结合CymR转录阻遏物(transcription repressor)的CuO操作子序列(CuO operator)。
本发明人发现,Tet-On和Cumate复合诱导表达系统的诱导转录活性和无诱导泄露转录活性受(1)多拷贝TetO操作子及其连接核酸序列,(2)TRE响应元件中最小启动子序列;(3)CuO操作子和最小启动子中TATA盒相对位置三个条件影响。第三代Tet-On系统中TRE3G响应元件比第二代Tet-On系统中TREadv响应元件控制更严格,有更低的非诱导泄露转录活性;CuO操作子和TATA盒越近对泄露转录活性控制越严格但同时对诱导转录活性影响越大,越远对泄露转录活性控制越弱但同时对诱导转录活性影响越小。基于以上发现,本发明的用于调控目的核酸片段转录的核酸序列包含:至少2个拷贝(例如2、3、4、5、6、7或更多个,优选7个)的能与受四环素或其衍生物调控的反式激活物rtTA结合的TetO-操作子序列,优选地所述TetO-操作子序列如SEQ ID NO:24所示;一段包含TATA盒序列的最小启动子序列,优选地所述最小启动子序列如SEQ ID NO:25或SEQ ID NO:26所示,更优选地所述最小启动子序列如SEQ ID NO:25所示;以及与受cumate调控的转录阻遏物CymR结合的CuO-操作子序列,优选地所述CuO操作子序列如SEQ ID NO:27所示。优选地,至少一段CuO操作子序列在上述启动子TATA盒的下游,优选在TATA盒下游10bp至100bp之间,如14bp,30bp,50bp和100bp;进一步优选地,有且仅有一段CuO序列在TATA盒的下游30bp至50bp;更近一步,有且仅有一段CuO序列在TATA盒的下游30bp或50bp位置。优选地,本发明的用于调控目的核酸片段转录的核酸序列如SEQ ID NO:23、SEQ ID NO:28、SEQ ID NO:29或SEQ ID NO:30所示,更优选地,如SEQ ID NO:23或SEQ ID NO:28所示。
在表达质粒中启动子下游的内含子一般可以提高转录信使RNA(mRNA)的稳定性并提高mRNA转运出细胞核的效率(参照Akef,A.,et al.(2015)."Splicing promotes thenuclear export of beta-globin mRNA by overcoming nuclear retention elements."RNA 21(11):1908-1920)并提高目的核酸片段的表达量。本发明人发现在单一诱导表达系统中的响应元件3’端下游连接可剪接的内含子同样也能提高诱导后被调控目的核酸片段的表达量,但同时会显著增加被调控目的核酸片段的无诱导泄露表达量。本发明所述四环素和Cumate依赖的复合响应元件序列3’端下游以及被调控目的核酸片段5’端上游之间连接可以剪接的内含子序列可以在不显著增加无诱导泄露表达量的同时显著提高诱导表达量。基于此,在本发明中,优选地,在所述四环素和Cumate依赖的复合响应元件序列3’端下游以及目的核酸片段5’端上游之间连接可剪接的内含子片段。上述内含子的选择并无特定限制,本领域技术人员可以理解,凡是在哺乳动物细胞中能进行RNA剪接(Splicing)的序列都能实现上述功能。可以选择的内含子序列包括但不限于常用的克隆载体上的内含子如:兔β-球蛋白内含子、源自人β-球蛋白和免疫球蛋白重链内含子的杂合内含子、EF-1α内含子A、SV40内含子、源自腺病毒和免疫球蛋白重链内含子的杂合内含子、修饰的人巨细胞病毒内含子、源自鸡β-肌动蛋白(CBA)和小鼠微小病毒(MMV)内含子的杂合内含子、源自鸡β-肌动蛋白和兔β-球蛋白内含子的嵌合物和mP1内含子;也可以是任意真核生物任意基因的任意内含子;或者是基于内含子剪接规则设计的人造内含子序列。本发明实施例使用的内含子序列可以是如SEQ ID NO:31所示。
上述Tet-On和Cumate复合诱导表达系统在无四环素或其衍生物和Cumate诱导剂(Cumate或其功能类似物)的环境下,rtTA反式激活物不能和复合响应元件结合,同时CymR阻遏物和复合响应元件中CuO操作子结合进一步抑制被调控的目的核酸片段因为rtTA反式激活物非特异性结合或最小启动子的基础活性引起的泄露转录活性;在仅有Cumate诱导剂的环境下,rtTA反式激活物和结合了Cumate诱导剂的CymR阻遏物都不和复合响应元件结合,被调控目的核酸片段因为rtTA反式激活物非特异性结合或最小启动子的基础活性引起极低量转录;在仅有四环素或其衍生物的环境下,rtTA反式激活物和复合响应元件中TetO操作子结合激活被调控目的核酸片段转录,但CymR阻遏物同时也和复合响应元件中的CuO操作子结合使得被调控目的核酸片段仅能有限转录;在四环素或其衍生物和Cumate诱导剂同时存在的环境下,rtTA反式激活物和复合响应元件中的TetO操作子结合,同时结合了Cumate诱导剂的CymR阻遏物和复合响应元件中CuO操作子分离,使得被调控目的核酸片段最大活性转录。上述rtTA反式激活物核酸编码序列优选经过人密码子优化的SEQ ID NO:18;CymR优选经过人密码子优化的SEQ ID NO:15。
上述Tet-On和Cumate复合诱导表达系统在生物基础科研、生物制药、基因治疗、细胞治疗、转基因植物或动物改良中都能应用,包括但不限于在细胞、动物或植物中,控制编码蛋白质的核酸序列转录的开启或关闭;控制非蛋白编码核酸序列的转录的开启和关闭,如RNA病毒的全部或部分基因组RNA片段、微小RNA(microRNA,简称miRNA)、小分子干扰核糖核酸(small interfering RNA,简称siRNA)、长链非编码核糖核酸(long non-dodingRNAs,简称LncRNA),CRISPR基因编辑系统的导向RNA(guide RNA,gRNA)、转运核糖核酸(transfer RNA,简称tRNA)、核糖体核糖核酸(Ribosomal RNA,简称rRNA)、适体(Aptamers)、能和其它核酸结合的核糖核酸片段、能和特定蛋白结合的核糖核酸片段、或任意一段核糖核酸;也可以是以上一段或多段核酸序列的组合。在一方面,上述Tet-On和Cumate复合诱导表达系统可以用于表达和生产在基因治疗、细胞治疗或免疫治疗领域的病毒载体;用于表达和生产有细胞毒性、或不稳定的蛋白质;用于在疫苗领域表达生产减毒疫苗或病毒样颗粒(viral like partical,简称VLP)疫苗;用于在转基因动物或植物中控制目的核酸片段转录表达的开启或关闭。
在本发明中,可用于Tet-On诱导表达系统的四环素及其衍生物包括在结构上与四环素相似的化合物,其能够与本发明所述四环素依赖的反式激活物rtTA相结合,其结合常数Ka至少达到10-6M;优选地,其结合常数Ka达到或强于10-9M。四环素衍生物例如可以选自:多西环素(Dox)、脱水四环素(Atc)、氯四环素、土霉素和脱氧四环素。
在本发明中,可用于Cumate诱导表达系统的,与阻遏物CymR相结合的Cumate功能类似物例如可以选自:对乙基苯甲酸、对丙基苯甲酸、对异丙基苯甲酸、对异丁基苯甲酸、对叔丁基苯甲酸,对正二甲基氨基苯甲酸,对正乙基氨基苯甲酸。以及例如在美国专利号7,745,592中描述的其他Cumate功能类似物。
可以转入包含本发明的四环素和Cumate的共调控序列的载体的宿主细胞在原理上可以为任意细胞例如是细菌、真菌、动物细胞或植物细胞。在另一方面,本发明所述的四环素和Cumate的共调控序列也可以通过病毒载体使用,例如制备的病毒载体所含核酸片段中含有本发明的四环素和Cumate的共调控序列,在DNA病毒载体中(如腺病毒、腺相关病毒)以脱氧核糖核酸存在,在RNA病毒载体中(如逆转录病毒)以核糖核酸存在。
如本领域技术人员可以理解的,对于转录受本发明的调控核酸序列控制的目的核酸片段没有特别的限制,只要其转录可以受控于本发明的调控核酸序列即可。
在一个方面,本发明提供以下各项:
第1项:核酸序列,所述核酸序列包含至少2个拷贝的能与受四环素或其衍生物调控的反式激活物rtTA结合的TetO-操作子序列、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的与受cumate调控的转录阻遏物CymR结合的CuO-操作子序列,其中所述CuO-操作子序列在所述TATA盒序列的3’端下游,和所述TATA盒的距离间隔为10bp至100bp,优选为30bp至50bp,更优选为50bp。
第2项:根据第1项所述的核酸序列,其中所述TetO-操作子序列如SEQ ID NO:24所示,及/或所述最小启动子序列如SEQ ID NO:25或SEQ ID NO:26所示,及/或所述CuO-操作子序列如SEQ ID NO:27所示。
第3项:根据第2项所述的核酸序列,所述核酸序列如SEQ ID NO:23、SEQ ID NO:28、SEQ ID NO:29或SEQ ID NO:30所示。
第4项:根据第1-3项中任一项所述的核酸序列,所述核酸序列在3’端还包含可剪接的内含子序列。
第5项:载体,所述载体包含根据第1-4项中任一项所述的核酸序列。
第6项:根据第5项所述的载体,其中所述载体是表达载体,所述表达载体包含处于根据第1-4项中任一项所述的核酸序列的3’端下游的目的核酸片段,并且所述目的核酸片段的转录受根据第1-4项中任一项所述的核酸序列的控制。
第7项:宿主细胞,所述宿主细胞包含根据第1-4项中任一项所述的核酸序列或根据第5或6项所述的载体。
第8项:在宿主细胞中诱导表达目的核酸片段的方法,所述方法包括以下步骤:
(1)将根据第6项所述的载体以及rtTA的编码序列和CymR的编码序列转入所述宿主细胞中;
(2)在经过(1)的所述宿主细胞中表达rtTA和CymR;以及
(3)向经过(2)的所述宿主细胞提供四环素或其衍生物以及cumate或其功能类似物。
第9项:根据第8项所述的方法,其中所述rtTA是rtTAadv或rtTA3G,优选为rtTA3G,更优选地所述rtTA的编码序列如SEQ ID NO.18所示。
第10项:根据第8项所述的方法,其中所述CymR的编码序列如SEQ ID NO.15所示。
附图简述
图1显示实施例2中CuO操作子在复合响应元件中的位置及数量对目的核酸片段诱导表达量和无诱导泄露表达量的影响。图1A显示仅加入DOX诱导剂和同时加入DOX和Cuamte诱导剂对应的Luciferase检测实验的RLU值;图1B显示加入Cumate和无加入Cuamte诱导剂RLU值得比值。
图2显示实施例3中单调控响应元件、复合调控响应元件及响应元件下游连接内含子对目的核酸片段诱导表达量和无诱导泄露表达量的影响。图1A显示有/无DOX和Cumate诱导剂对应的Luciferase检测实验的RLU值;图1B显示有/无DOX和Cumate诱导剂RLU值得比值。
图3显示实施例4中不同内含子对TRE3GCuO复合响应元件诱导表达和无诱导泄露表达影响。图1A显示有/无DOX和Cumate诱导剂对应的Luciferase检测实验的RLU值;图1B显示有/无DOX和Cumate诱导剂RLU值得比值。
图4显示实施例5中被TRE3GCuO和TRE3GCuO-BGI调控的目的核酸片段在不同诱导组合下的诱导转录活性。纵坐标显示不同诱导剂条件下Luciferase检测实验的RLU值;4种颜色的柱状图显示四种加入诱导剂的组合;途中横线上数字代表对应的诱导条件下和无诱导条件下(白色)RLU比值。
具体实施方式
提供以下实施例用以对本发明的技术方案进行说明,以下实施例不应被认为是对本发明的范围和精神的限制。
实施例1:质粒构建方法
以下实施例所使用的分子克隆技术,例如,DNA片段的PCR扩增、DNA片段的限制性内切酶酶切、DNA片段的凝胶回收、两段或多段DNA片段的T4 DNA连接酶连接、连接产物感受态细胞的转化、质粒小量制备及鉴定等方法均为本领域熟知技术。以下实施例中涉及以下试剂:PCR酶(Thermo,F-530S);限制性内切酶(NEB);T4 DNA连接酶(Invitrogen,15224041);DNA片段凝胶回收试剂盒(Omega,D2500-02);质粒小提试剂盒(TIANGEN,DP105-03);感受态细胞(XL-10Gold,湖南丰晖生物科技有限公司,JZ011);SEQ ID NO:1至SEQ IDNO:22所示的核酸序列由金斯瑞合成并用于本发明所述质粒构建,质粒测序鉴定由Invitrogen公司完成。表1为构建质粒的引物信息;表2为附录序列SEQ ID NO:1至SEQ IDNO:31的元件组成说明;表3为质粒中各功能元件说明;表4为本发明构建的质粒编号及对应名称。。以下实施例中所涉及的各质粒所采用的元件序列信息为实现本发明的示例,本领域技术人员可以预期将以下实施例中所用质粒上各元件序列替换成其它生物学功能类似的元件序列也能达到本发明所述效果,包括但不限于质粒的骨架序列(如复制原点(replication origin)、抗性基因等)、酶切位点序列、转座子重复序列、诱导系统响应元件序列、隔离子(Insulator)序列、启动子序列、内含子序列、聚腺苷酸信号(PolyA)序列、不同密码子优化的基因序列、以上各功能元件序列和基因序列的突变体以及各功能元件序列和基因序列的克隆位置、克隆顺序和克隆方向。具体的质粒构建方法如下所示:
1.构建质粒18BF007:将合成序列SEQ ID NO:2(2900bp)用NotI和AsiSI酶切并连接在质粒18BF003(SEQ ID NO:1)的NotI和AsiSI酶切位点,从而构建得到质粒18BF007。
2.构建质粒18BF011:将18BF007质粒用MluI和SphI酶切,凝胶回收1730bp片段并将其连接在18BF003质粒的MluI和SphI酶切位点从而构建得到质粒18BF011。
3.构建质粒18BF210:将合成序列SEQ ID NO:3(1208bp)用SpeI和AgeI酶切并连接在质粒18BF011的AvrII和AgeI酶切位点,从而构建得到质粒18BF210。
4.构建质粒18BF211,18BF212,18BF213,18BF214,18BF215,18BF216,18BF217和18BF218:将合成序列SEQ ID NO:4(908bp)、序列SEQ ID NO:5(880bp)、序列SEQ ID NO:6(890bp)和序列SEQ ID NO:7(845bp)分别用MluI和ClaI酶切并分别连接在质粒18BF210的MluI和ClaI酶切位点,从而分别构建得到质粒18BF212、18BF211、18BF214和18BF213。将质粒18BF211、18BF212、18BF213和18BF214分别用BstBI酶切,并分别凝胶回收DNA片段3932bp(18BF211)、3960bp(18BF212)、3897bp(18BF213)和3942bp(18BF214),并用T4连接酶连接以分别构建质粒18BF215、18BF216、18BF217和18BF218。
5.构建质粒18BF229、18BF232、18BF233、18BF234、18BF235、18BF236、18BF237、18BF240和18BF241:以pGL3-Basic(Promega,E1751)为模板,Luc-F(SEQ ID NO:32)和Luc-R(SEQ ID NO:33)为引物PCR扩增luciferase基因片段(1728bp),并用BamHI和XhoI酶切处理,分别连接在质粒18BF210、18BF217、18BF218、18BF215、18BF216、18BF211、18BF212、18BF213和18BF214的BamHI和XhoI酶切位点,从而构建得到质粒18BF229、18BF232、18BF233、18BF234、18BF235、18BF236、18BF237、18BF240和18BF241。
6.构建质粒18BF251、18BF252、18BF253、18BF254、18BF255、18BF256和18BF257:将合成序列SEQ ID NO:8(414bp)、序列SEQ ID NO:9(414bp)、序列SEQ ID NO:10(415bp)、序列SEQ ID NO:11(472bp)、序列SEQ ID NO:12(588bp)、序列SEQ ID NO:13(704bp)和序列SEQ ID NO:22(376bp)分别用MluI和ClaI酶切并分别连接在质粒18BF235的MluI和ClaI酶切位点,从而分别构建得到质粒18BF251、18BF252、18BF253、18BF254、18BF255、18BF256和18BF257。
7.构建质粒18BF261、18BF262、18BF263和18BF264:以序列17为模板,BGI(C&R)-F(SEQ ID NO:34)和BGI(C&R)-R(SEQ ID NO:35)为引物PCR扩增BGI(C&R)内含子序列(1036bp);以pEF1alpha-IRES-AcGFP1(Clontech)为模板,Intron(EF-1a)-F(SEQ ID NO:36)和Intron(EF-1a)-R(SEQ ID NO:37)为引物PCR扩增Intron(EF-1a)内含子序列(962bp);以pSI(Promega#E1721)质粒为模板,Intron(pSI)-F(SEQ ID NO:38)和Intron(pSI)-R(SEQ ID NO:39)为引物PCR扩增Intron(pSI)内含子序列(152bp),并将以上三段PCR产物分别用ClaI和BamHI酶切处理,连接在质粒18BF235的ClaI和BamHI酶切位点,从而构建得到质粒18BF261、18BF263和18BF264。将合成的序列14(210bp)用ClaI和BamHI酶切,并分接在质粒18BF235的ClaI和BamHI酶切位点,从而构建得到质粒18BF262。
8.构建质粒19BF075和19BF074:将合成的序列SEQ ID NO:15(633bp)和序列SEQID NO:16(1496bp)分别用ClaI和XhoI以及SpeI和AgeI酶切处理并依次连接在18BF007质粒的ClaI和XhoI酶切位点以及AvrII和AgeI酶切位点从而构建得到19BF073质粒。将合成的序列SEQ ID NO:17(1979bp)用MluI和AgeI酶切并连接在18BF007质粒的MluI和AgeI酶切位点,替换CMV-BGI-MCS-pA序列,从而构建得到18BF008质粒。将合成的序列SEQ ID NO:18(768bp)和序列SEQ ID NO:19(765bp)分别用ClaI和XhoI酶切并分别连接在18BF008质粒的ClaI和XhoI酶切位点从而分别构建得到18BF085和18BF084质粒。将质粒19BF073用SpeI和AgeI酶切,凝胶回收3821bp片段并将其分别连接在18BF085和18BF084质粒的AvrII和AgeI酶切位点从而分别构建得到19BF075和19BF074质粒。
9.构建质粒18BF019:将合成的序列SEQ ID NO:21(1044bp)和序列SEQ ID NO:20(1320bp)分别用BamHI和XhoI以及XhoI和BglII酶切并连接在18BF011质粒的BamHI和BglII酶切位点从而构建得到18BF019质粒。
10.构建质粒19BF229、19BF235和19BF237:将质粒18BF229、18BF235和18BF237分别用MluI和AgeI酶切,分别凝胶回收4605bp(18BF229)、3847bp(18BF235)和4341bp(18BF237)片段并将其分别连接在18BF007质粒的MluI和AgeI酶切位点从而分别构建得到19BF229、19BF235和19BF237质粒。
表1.引物信息列表
SEQ ID NO: | 引物名称 | 引物序列(5'-3') |
32 | Luc-F | TCAGGATCCATCTGCGATCTAAGTAAGCTTG |
33 | Luc-R | TCAACTCGAGCTAGAATTACACGGCGATC |
34 | BGI(C&R)-F | GTCAATCGATGGAGTCGCTGCGCGCTG |
35 | BGI(C&R)-R | GTCGGATCCCTGTAGGAAAAAGAAGAAGG |
36 | Intron(EF-1a)-F | GTCAATCGATGTAAGTGCCGTGTGTG |
37 | Intron(EF-1a)-R | GTCGGATCCCTGAAATGGAAGAAAAAAACT |
38 | Intron(pSI)-F | GTCAATCGATGTAAGTATCAAGGTTACAAG |
39 | Intron(pSI)-R | GTCGGATCCCTGTGGAGAGAAAGGC |
表2.附录序列元件组成说明
表3.质粒功能元件说明
表4.质粒编号及名称
实施例2:CuO操作子位置及数量对诱导表达量和无诱导泄露表达量的影响
本实施例所述实验为研究和验证CuO操作子在Tet-On和Cumate复合响应元件的位置和拷贝数对复合响应元件诱导表达量和无诱导泄露表达量的影响以及优化确认最优的CuO操作子位置和拷贝数。本实施例基于TRE3G响应元件中7xTetO序列和最小启动子序列#1(SEQ ID NO:25),在TATA盒下游间隔10bp至100bp范围内,分别在间隔14bp、30bp、50bp和100bp的位置上连接CuO操作子序列设计了TRE3GCuO14(SEQ ID NO:8中10-317bp)、TRE3GCuO30(SEQ ID NO:28)、TRE3GCuO50(SEQ ID NO:23)和TRE3GCuO100(SEQ ID NO:10中10-403bp)响应元件,并在以上响应元件3’端下游连接Luciferase报告基因序列,构建质粒18BF251、18BF252、18BF235和18BF253。进一步,为研究多拷贝CuO操作子的影响,在TATA盒下游间隔50bp的位置,分别插入了2、4和6个拷贝CuO操作子序列设计了TRE3GCuO2x(SEQ ID NO:11中10-411bp)、TRE3GCuO4x(SEQ ID NO:12中10-527bp)和TRE3GCuO6x(SEQ ID NO:13中10-643bp)响应元件,并在以上响应元件下游3’端连接Luciferase报告基因序列,构建质粒18BF254、18BF255和18BF256。在稳定表达rtTA3G和CymR基因的293T-rtTA3G-CymR细胞内,瞬时转染上述质粒,通过测量同时加入DOX和Cumate诱导剂样品和仅加入DOX诱导剂对照的luciferase荧光值验证优化CuO操作子最优位置和数量。具体实验方法如下:
1.用SB转座子系统构建293T-rtTA adv-CymR和293T-rtTA3G-CymR细胞:
将293T细胞按照1.5E+06个细胞每60mm培养皿接种,在37℃、5%CO2的环境下,培养在添加10%FBS(ExCell,11H116)的DMEM(Sigam,D6429)完全培养基中。培养24小时后,按照PEI方法进行转染,转染时每60mm培养皿加入500μL转染试剂,其中含有总质粒量为5.5ug,总质粒量与PEI MAX(Polysciences,24765-1)的质量比为1:4。其中按照质粒19BF074:18BF019摩尔比10:1进行转染以获得293T-rtTAadv-CymR细胞;按照质粒19BF075:18BF019摩尔比10:1进行转染以获得293T-rtTA3G-CymR细胞。质粒与PEI MAX混合均匀,静置15分钟后加入培养皿中,转染3小时后,更换培养基为DMEM完全培养基,转染操作完成。转染24小时后,用胰酶消化细胞并全部接种于100mm培养皿(Corning,430167)中,并用200μg/ml潮霉素(Hygromycin,生工A600230-0001)药物筛选至少三代后,细胞在药物压力下生长和原始293T细胞一致后,进行以下实验。
2.基于Luciferase荧光强度检测在DOX和Cumate诱导或仅DOX诱导条件下各响应元件效能
将293T-rtTA3G-CymR细胞按照2.5E+04个细胞每孔接种于96孔板(Corning 3916)中,培养基为100微升DMEM完全培养基。培养24小时后,按照PEI方法进行转染以下质粒18BF234(TRE3G)、18BF251(TRE3GCuO14)、18BF252(TRE3GCuO30)、18BF235(TRE3GCuO50)、18BF253(TRE3GCuO100)、18BF254(TRE3GCuO2x)、18BF255(TRE3GCuO4x)和18BF256(TRE3GCuO6x),转染时每孔加入10μL转染试剂,其中含有总质粒量为0.3ug,包含0.01ug以上8种待测质粒和0.29微克18BF003空质粒。总质粒量与PEI MAX(Polysciences,24765-1)的质量比为1:4,每种质粒转染6个孔。转染3小时后更换DMEM完全培养基,在其中3孔内加入诱导剂1ug/ml DOX(盐酸多西环素(DOX),生工生物工程(上海)股份有限公司,A600889)和200ug/ml Cumate(Aladdin,I107765);另外三个孔内仅加入1ug/ml DOX。转染后24小时,使用 Luciferase Assay System(Promega,E2610)试剂盒,并按照其操作说明(Promega,FB037)检测各孔相对荧光单位RLU(relative light unit),检测仪器为荧光酶标仪(PerkinElmer VictorⅤ)。
结果如图1所示:CuO操作子序列影响Tet-On诱导表达系统响应元件的诱导表达量,且CuO操作子距离TRE响应元件TATA盒越近,诱导后的表达量越低。但随着CuO操作子与TATA盒距离增大,无Cumate诱导的泄露表达量越高。在综合诱导后表达量、无Cumate诱导泄露表达量和Cumate诱导/泄露表达量比例等结果,确定CuO在与TATA盒间隔30bp至50bp之间是结果最优,诱导表达量分别为3.06E+06RLU和4.53E+06RLU,分别为TRE3G响应元件诱导表达量的44.5%和66.0%;基于Cumate诱导表达系统的诱导/泄露表达量比例分别为TRE3G响应元件的4.21倍和2.81倍。增加CuO操作子的拷贝至2,4或6会进一步降低诱导后表达量,且不会提高Cumate诱导/泄露表达量比例。基于以上结果,在间隔TRE响应元件TATA盒30bp至50bp距离插入CuO操作子且仅插入1个拷贝为最优条件。
基于TREadv响应元件中7xTetO序列和最小启动子序列#2(SEQ ID NO:26),在TATA盒下游间隔32bp和52bp的位置上连接CuO操作子序列按照上述方法设计了TREadvCuO32(SEQID NO:29)和TREadvCuO52(SEQ ID NO:30)响应元件,并在以上响应元件3’端下游连接Luciferase报告基因序列,构建质粒18BF257和18BF233。通过和上述相同实验方法,检测诱导表达量分别为3.26+06RLU和4.88E+06RLU,分别为TREadv响应元件诱导表达量的37.8%和53.4%;基于Cuamte诱导表达系统的诱导/泄露表达量比例分别为TREadv响应元件的4.97倍和3.23倍。后续实施例以TREadvCuO52和TRE3GCuO50响应元件进行实验,并分别标记为TREadvCuO和TRE3GCuO响应元件。
实施例3:单调控/复合调控及内含子对诱导表达量和无诱导泄露表达量的影响
在Tet-On诱导表达系统中,TRE响应元件的TetO操作子连接序列和最小启动子序列以及反式激活物rtTA的不同突变体综合影响诱导转录活性和泄露转录活性。此外响应元件3’端下游,被调控目的核酸片段5’端上游连接可剪切的内含子序列可能增强信使核糖核酸运输和稳定性,但同样可能影响诱导表达系统响应元件的诱导转录活性和泄露转录活性。基于此,本实施例对比(1)基于TREadv和TRE3G响应元件序列设计的Tet-On和Cumate复合响应元件TREadvCuO和TRE3GCuO,(2)是否连接内含子,(3)被反式激活物rtTAadv或rtTA3G调控,三个条件组合下的Luciferase基因诱导表达量和诱导/泄露表达量比例确认最优复合响应元件设计方案。本实施例共对比8种设计方案:分别为TREadv(18BF232)、TREadvCuO(18BF233)、TRE3G(18BF234)、TRE3GCuO(18BF235)、TREadv-BGI(18BF240,响应元件为TREadv,并且响应元件3’端和Luciferase基因5’端之间连接人β-球蛋白内含子)、TREadvCuO-BGI(18BF241,响应元件为TREadvCuO,并且响应元件3’端和Luciferase基因5’端之间连接人β-球蛋白内含子)、TRE3G-BGI(18BF236,响应元件为TRE3G,并且响应元件3’端和Luciferase基因5’端之间连接人β-球蛋白内含子)和TRE3GCuO-BGI(18BF237,响应元件为TRE3GCuO,并且响应元件3’端和Luciferase基因5’端之间连接人β-球蛋白内含子)。启动子CMV-BGI(18BF229,启动子为CMV,并且CMV启动子3’端和Luciferase基因5’端之间连接人β-球蛋白内含子)做为阳性对照。在稳定表达rtTAadv和CymR基因的293T-rtTAadv-CymR细胞内和稳定表达rtTA3G和CymR基因的293T-rtTA3G-CymR细胞内,分别瞬时转染上述质粒,通过测量加入DOX和Cumate诱导剂样品和无诱导对照的luciferase荧光值验证最优复合响应元件组合。具体实验方法如下:
将实施例2中构建的293T-rtTAadv-CymR和293T-rtTA3G-CymR细胞分别按照2.5E+04个细胞每孔接种于96孔板(Corning 3916)中,培养基为100微升DMEM完全培养基。培养24小时后,按照PEI方法转染上述9种质粒,转染时每孔加入10μL转染试剂,其中含有总质粒量为0.3ug,包含0.01ug上述9种质粒待测质粒和0.29微克18BF003空质粒。总质粒量与PEI MAX(Polysciences,24765-1)的质量比为1:4,每种质粒分别在293T-rtTAadv-CymR和293T-rtTA3G-CymR细胞各转染6个孔。转染3小时后更换DMEM完全培养基,在每种细胞其中3孔内加入诱导剂1ug/ml DOX和200ug/ml Cumate;另外三个孔内加入等量培养基对照。转染后24小时,使用Luciferase Assay System(Promega,E2610)试剂盒,并按照其操作说明(Promega,FB037)检测各孔相对荧光单位RLU(relative light unit),检测仪器为荧光酶标仪(Perkin Elmer VictorⅤ)。
实验结果如图2所示:(1)TRECuO复合响应元件对比TRE单调控响应元件显著提高了诱导/泄露表达量比例一到两个数量级。TRE3GCuO复合响应元件对比TREadvCuO复合响应元件能更好的控制泄露表达。在293T-rtTAadv-CymR细胞中,TRE3GCuO和TREadvCuO的诱导/泄露表达量比例分别为1565和1345倍,提高16.4%;在293T-rtTA3G-CymR细胞中,TRE3GCuO和TREadvCuO的诱导/泄露表达量比例分别为2635和1915倍,提高37.6%。但TRECuO复合响应元件对比TRE单调控响应元件的诱导表达量显著下降。在293T-rtTAadv-CymR细胞中,TRE3GCuO和TREadvCuO的诱导表达量分别为对应的TRE3G和TREadv单调控响应元件的50.4%和36.3%;在293T-rtTA3G-CymR细胞中,TRE3GCuO和TREadvCuO的诱导表达量分别为单调控响应元件的61.8%和40.3%。(2)在诱导表达量方面,TRE3GCuO复合响应元件对比TREadvCuO复合响应元件对下游的内含子更加敏感,在有内含子BGI的设计中,诱导表达量显著提高。TRE3GCuO和TRE3GCuO-BGI诱导表达量在293T-rtTAadv-CymR细胞中分别为3.4E+06RLU和10.6E+06RLU,分别是TRE3G诱导表达量的50.4%和157.9%,连接内含子可以提高TRE3GCuO复合响应元件诱导后表达量2.13倍;在293T-rtTA3G-CymR细胞中分别为4.24E+06和11.3E+06,分别是TRE3G诱导表达量的61.8%和165.0%,连接内含子可以提高TRE3GCuO复合响应元件诱导后表达量1.67倍。(3)对比诱导后表达量,反式激活物rtTA3G在8种设计方案中和rtTAadv没有显著区别,但在对比诱导/泄露表达量比例上rtTA3G有显著优势,其8种设计方案的诱导/泄露表达量比例平均值为1110倍是rtTAadv的1.68倍(rtTAadv诱导/泄露表达量比例平均值为661倍)。
基于以上结果,TRE3GCuO复合响应元件对比TREadv和TRE3G以及TREadvCuO复合响应元件拥有更好控制泄露表达的能力;在下游连接内含子BGI后可以在维持TRE3GCuO复合响应元件控制泄露表达的同时极大的提高其诱导表达量。在受rtTA3G调控条件下,TRE3GCuO-BGI的诱导表达量分别为TREadv的80.6%、TREadv-BGI的80.5%、TREadvCuO的199.9%、TREadvCuO-BGI的147.0%、TRE3G的165.0%、TRE3G-BGI的81.5%和TRE3GCuO的267.2%,达到组成型活性启动子CMV-BGI的84.7%;TRE3GCuO-BGI的诱导/无诱导表达量比例分别为TREadv 24.5倍、TREadv-BGI 43.4倍、TREadvCuO 1.2倍、TREadvCuO-BGI 1.6倍、TRE3G 5.9倍、TRE3G-BGI 8.9倍和TRE3GCuO的0.8倍。
实施例4:不同内含子对TRE3GCuO复合响应元件诱导表达和无诱导泄露表达影响
在上述实施例3中,连接内含子BGI显著提升了TRE3GCuO复合诱导响应元件的诱导转录活性以及Luciferase目的基因的表达量。本实施例验证其它内含子是否有相似效果。本实施例将4种常用质粒载体上的内含子克隆到TRE-3GCuO复合响应元件3’端下游和luciferase报告基因5’端上游之间,分别构建含有BGI(C&R)、Intron(mP1)、Intron(EF-1a)和Intron(pSI)内含子的质粒18BF261、18BF262、18BF263和18BF264,质粒构建具体方法见实施例1描述。在稳定表达rtTA3G和CymR基因的293T-rtTA3G-CymR细胞内,分别瞬时转染上述质粒以及TRE3GCuO(18BF235)、TRE3GCuO-BGI(18BF237)和CMV-BGI(18BF229)质粒,通过测量加入DOX和Cumate诱导剂样品和无诱导对照的luciferase荧光值验证各内含子对TRE3GCuO复合响应元件诱导表达和无诱导泄露表达的影响。具体实验方法如下:
将293T-rtTA3G-CymR细胞按照2.5E+04个细胞每孔接种于96孔板(Corning 3916)中,培养基为100微升DMEM完全培养基。培养24小时后,按照PEI方法分别转染上述7种质粒,转染时每孔加入10μL转染试剂,其中含有总质粒量为0.3ug,包含0.01ug以上7种待测质粒和0.29微克18BF003空质粒。总质粒量与PEI MAX(Polysciences,24765-1)的质量比为1:4,每种质粒转染6个孔。转染3小时后更换DMEM完全培养基,在其中3孔内加入诱导剂1ug/mlDOX和200ug/ml Cumate;另外三个孔内加入等量培养基。转染后24小时,使用Luciferase Assay System(Promega,E2610)试剂盒,并按照其操作说明(Promega,FB037)检测各孔相对荧光单位RLU(relative light unit),检测仪器为荧光酶标仪(PerkinElmer VictorⅤ)。
实验结果如图3所示:含有四种其它内含子的质粒18BF261、18BF262、18BF263和18BF264在诱导表达量和诱导/泄露表达量比例上和TRE3GCuO-BGI(18BF237)无显著差异,都能达到实施例3所述TRE3GCuO-BGI的设计效果。在内含子里,需要有5'剪接位点(5'splicesite)、3'剪接位点(3'splice site)及剪接分枝位点(branch point)来进行剪接。本实施例证明符合上述条件,能剪接的内含子都能达到本发明所述的实验效果。因此本发明所述效果不应受到特定内含子序列约束,凡是在哺乳动物细胞中能进行RNA剪接(Splicing)的序列都能实现上述功能。可以选择的内含子序列包括但不限于常用的克隆载体上的内含子如:兔β-球蛋白内含子、源自人β-球蛋白和免疫球蛋白重链内含子的杂合内含子、EF-1α内含子A、SV40内含子、源自腺病毒和免疫球蛋白重链内含子的杂合内含子、修饰的人巨细胞病毒内含子、源自鸡β-肌动蛋白(CBA)和小鼠微小病毒(MMV)内含子的杂合内含子、源自鸡β-肌动蛋白和兔β-球蛋白内含子的嵌合物和mP1内含子;也可以是任意真核生物任意基因的任意内含子;或者是基于内含子剪接规则设计的人造内含子序列。
实施例5:研究TRE3GCuO复合响应元件在不同诱导组合下的诱导转录活性。
本实施例构建受Tet-ON和Cumate复合调控的,基于TRE3GCuO或TRE3GCuO-内含子设计,以Luciferase为报告基因的稳定细胞系,并基于这些细胞系检测无诱导剂、仅加Cumate、仅加DOX或同时加DOX和Cumate诱导剂4种诱导条件组合下,报告基因的不同诱导转录活性。本实施例仅以Luciferase报告基因为例,原则上本发明所述方法不受目的核酸片段影响。具体实验方法如下:
1.利用SB转座子系统构建DOX和Cumate复合调控Luciferase稳定细胞系:
将293T细胞按照1.5E+06个细胞每60mm培养皿接种,在37℃、5%CO2的环境下,培养在添加10%FBS(ExCell,11H116)的DMEM(Sigam,D6429)完全培养基中。培养24小时后,按照PEI方法进行转染,转染时每60mm培养皿加入500μL转染试剂,总质粒量为5.5ug,总质粒量与PEI MAX(Polysciences,24765-1)的质量比为1:4,共构建3种Luciferase稳定细胞系。其中转染质粒按照19BF075:19BF229:18BF019摩尔比5:5:1进行转染以获得293T(T&C)-CMV-BGI-Luc细胞;其中转染质粒按照19BF075:19BF235:18BF019摩尔比5:5:1进行转染以获得293T(T&C)-TRE3GCuO-Luc细胞;其中转染质粒按照19BF075:19BF237:18BF019摩尔比5:5:1进行转染以获得293T(T&C)-TRE3GCuO-BGI-Luc细胞。质粒与PEI MAX混合均匀后,静置15分钟后加入培养皿中,转染3小时后,更换培养基为DMEM完全培养基,转染操作完成。转染24小时后,用胰酶消化细胞并全部接种于100mm培养皿(Corning,430167)中,并用200μg/ml潮霉素(Hygromycin,生工A600230-0001)药物筛选至少三代。当细胞在药物压力下生长和原始293T细胞一致后,再用极限稀释法将上述三种细胞分别稀释至1个细胞每孔接种于96孔板内,待细胞长至大约50%孔底面积时,在荧光显微镜下挑选EGFP绿色荧光强度较强、发光均匀的孔,每种细胞挑选3个独立克隆进行以下实验。
2.利用不同DOX和Cumate组合诱导Luciferase表达:
将上述3种细胞,每种3个独立克隆分别按照2.5E+04个细胞每孔接种于96孔板(Corning 3916)中,每个克隆接种8个孔,培养基为100微升DMEM完全培养基。培养24小时后,更换培养基并在每个细胞克隆8个培养孔中取复孔分别加入(1)等量培养基、(2)终浓度200ug/ml Cumate、(3)终浓度1ug/ml DOX或(4)终浓度1ug/ml DOX和200ug/ml Cumate。再培养24小时后,使用Luciferase Assay System(Promega,E2610)试剂盒,并按照其操作说明(Promega,FB037)检测各孔相对荧光单位RLU(relative light unit),检测仪器为荧光酶标仪(Perkin Elmer VictorⅤ)。
实验结果如图4所示:在仅加入Cumate的条件下,TRE3GCuO和TRE3GCuO-BGI的诱导转录活性为1.36E+04RLU和4.16E+04RLU,对比无诱导条件分别提升了4.31倍和3.27倍。在仅加入DOX的条件下,TRE3GCuO和TRE3GCuO-BGI的诱导转录活性为2.14E+05RLU和5.34E+05RLU,对比无诱导条件分别提升了67.66倍和42.07倍;对比仅加入Cumate诱导条件下提升了15.71倍和12.86倍。在同时加入DOX和Cumate的条件下,TRE3GCuO和TRE3GCuO-BGI的诱导转录活性为7.54E+06RLU和1.29E+07RLU,对比无诱导条件分别提升了2381.05倍和1011.81倍;对比仅加入Cumate诱导条件下提升了552.99倍和309.27倍;对比仅加入DOX诱导条件下提升了35.19倍和24.05倍。基于以上结果,TRE3GCuO和TRE3GCuO-BGI复合响应元件按照不同诱导剂调控组合可以在不同转录活性级下调控目的核酸片段的诱导转录活性,其调控范围分别为4.31倍至2381.05倍和3.27倍至1011.81倍,在同时加入DOX和Cumate诱导剂时,最大诱导转录活性分别可以达到CMV启动子的47.84%和81.54%。再进一步优化DOX和/或Cumate诱导剂浓度的条件下,可以进一步在不同转录活性级下细致调控目的核酸片段的转录活性。
序列表
<110> 深圳市深研生物科技有限公司
<120> 基于四环素和Cumate的共调控序列
<130> P20200001B
<160> 39
<170> PatentIn version 3.5
<210> 1
<211> 1893
<212> DNA
<213> 人工序列
<400> 1
actgcggccg ccctgcaggt caactagtga cgtcttaatt aattgccggc tggaacgcgt 60
ttcgaacatc gattgaattc tggccaagtg gatccgctag ctctagagtc gacggtacca 120
agcttgcctc gagccatgga gatctgcatg ccctaggtcc ggaaccggtt ggcgcgccat 180
ctggcagcga tcgccgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt 240
atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta 300
tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 360
tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac 420
gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg 480
aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc 540
gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg 600
ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat 660
gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg 720
gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg 780
atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc 840
ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt 900
cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct 960
cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc 1020
gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca 1080
cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct 1140
cactgattaa gcattggtaa cgtacggaag ttagagaaaa ggcataagta gaaaagatca 1200
aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 1260
caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 1320
taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag ccgtagttag 1380
gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 1440
cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 1500
taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 1560
agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 1620
ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 1680
gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 1740
acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 1800
acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcatctca 1860
tgaaaattat gcaaattgag ccagtcaggc agt 1893
<210> 2
<211> 2900
<212> DNA
<213> 人工序列
<400> 2
gcggccgcat ctatacagtt gaagtcggaa gtttacatac acttaagttg gagtcattaa 60
aactcgtttt tcaactactc cacaaatttc ttgttaacaa acaatagttt tggcaagtca 120
gttaggacat ctactttgtg catgacacaa gtcatttttc caacaattgt ttacagacag 180
attatttcac ttataattca ctgtatcaca attccagtgg gtcagaagtt tacatacact 240
aagttgactg tgcctttaaa cagcttggaa aattccagaa aatgatgtca tggctttagc 300
ctgcagggag ggacagcccc cccccaaagc ccccagggat gtaattacgt ccctcccccg 360
ctagggggca gcagcgagcc gcccggggct ccgctccggt ccggcgctcc ccccgcatcc 420
ccgagccggc agcgtgcggg gacagcccgg gcacggggaa ggtggcacgg gatcgctttc 480
ctctgaacgc ttctcgctgc tctttgagcc tgcagacacc tggggggata cggggaaaag 540
gacctgcagg tcaactagtg acgtcttaat taattgccgg ctggacgtac gcgtctagtt 600
attaatagta atcaattacg gggtcattag ttcatagccc atatatggag ttccgcgtta 660
cataacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc ccattgacgt 720
caataatgac gtatgttccc atagtaacgc caatagggac tttccattga cgtcaatggg 780
tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat atgccaagta 840
cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc cagtacatga 900
ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct attaccatgg 960
tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca cggggatttc 1020
caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat caacgggact 1080
ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg cgtgtacggt 1140
gggaggtcta tataagcaga gctcgtttag tgaaccgtca gatcgcctgg agacgccatc 1200
cacgctgttt tgacctccat agaagacacc gggaccgatc cagcctccgc ggattcgaat 1260
cccggccggg aacggtgcat tggaacgcgg attccccgtg ccaagagtga cgtaagtacc 1320
gcctatagag tctataggcc cacaaaaaat gctttcttct tttaatatac ttttttgttt 1380
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 1440
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 1500
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 1560
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 1620
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 1680
cctcccacag ctcctgggca acgtgctggt ctgtgtgctg gcccatcact ttggcaaaga 1740
attgggattc gaacatcgat tgaattctgg ccaggatccg ctagctctag agtcgacggt 1800
accagtacta agcttgcctc gagccatgga gatctacggg tggcatccct gtgacccctc 1860
cccagtgcct ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat 1920
aaaattaagt tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag 1980
gggggtggta tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta 2040
ttgggaacca agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg 2100
ggttcaagcg attctcctgc ctcagcctcc cgagttgttg ggattccagg caagcatgac 2160
caggctcagc taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct 2220
ggtctccaac tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt 2280
acaggcgtga accactgctc ccttccctgt ccttgcatgc cctaggcagc tgtccggaac 2340
cggtgtttaa acaggccttt tccccgtatc cccccaggtg tctgcaggct caaagagcag 2400
cgagaagcgt tcagaggaaa gcgatcccgt gccaccttcc ccgtgcccgg gctgtccccg 2460
cacgctgccg gctcggggat gcggggggag cgccggaccg gagcggagcc ccgggcggct 2520
cgctgctgcc ccctagcggg ggagggacgt aattacatcc ctgggggctt tggggggggg 2580
ctgtccctca ggccttggcg cgccctaaag ccatgacatc attttctgga attttccaag 2640
ctgtttaaag gcacagtcaa cttagtgtat gtaaacttct gacccactgg aattgtgata 2700
cagtgaatta taagtgaaat aatctgtctg taaacaattg ttggaaaaat gacttgtgtc 2760
atgcacaaag tagatgtcct aactgacttg ccaaaactat tgtttgttaa caagaaattt 2820
gtggagtagt tgaaaaacga gttttaatga ctccaactta agtgtatgta aacttccgac 2880
ttcaactgta tagcgatcgc 2900
<210> 3
<211> 1208
<212> DNA
<213> 人工序列
<400> 3
actagtgtgt gtcagttagg gtgtggaaag tccccaggct ccccagcagg cagaagtatg 60
caaagcatgc atctcaatta gtcagcaacc aggtgtggaa agtccccagg ctccccagca 120
ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc gcccctaact 180
ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca tggctgacta 240
atttttttta tttatgcaga ggccgaggcc gcctctgcct ctgagctatt ccagaagtag 300
tgaggaggct tttttggagg ccataggctt ttgcaaaaag ctatggtgag caagggcgag 360
gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac 420
aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag 480
ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc 540
tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag 600
tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 660
tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 720
aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 780
aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc 840
aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 900
acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 960
gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 1020
gccgccggga tcactctcgg catggacgag ctgtacaagt aaaacttgtt tattgcagct 1080
tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 1140
ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttacctagg cagctgtccg 1200
gaaccggt 1208
<210> 4
<211> 908
<212> DNA
<213> 人工序列
<400> 4
acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60
gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120
ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180
acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240
gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300
tcagatcgcc tggagcaatt ccacatacaa acagaccaga ttgtctgttt gttacacttt 360
tgtcttatac caactttccg taccacttcc taccctcgta aattcgaatc ccggccggga 420
acggtgcatt ggaacgcgga ttccccgtgc caagagtgac gtaagtaccg cctatagagt 480
ctataggccc acaaaaaatg ctttcttctt ttaatatact tttttgttta tcttatttct 540
aatactttcc ctaatctctt tctttcaggg caataatgat acaatgtatc atgcctcttt 600
gcaccattct aaagaataac agtgataatt tctgggttaa ggcaatagca atatttctgc 660
atataaatat ttctgcatat aaattgtaac tgatgtaaga ggtttcatat tgctaatagc 720
agctacaatc cagctaccat tctgctttta ttttatggtt gggataaggc tggattattc 780
tgagtccaag ctaggccctt ttgctaatca tgttcatacc tcttatcttc ctcccacagc 840
tcctgggcaa cgtgctggtc tgtgtgctgg cccatcactt tggcaaagaa ttgggattcg 900
aaatcgat 908
<210> 5
<211> 880
<212> DNA
<213> 人工序列
<400> 5
acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60
gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120
ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180
acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240
gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300
tcagatcgcc tggagcaatt ccacaacact tttgtcttat accaactttc cgtaccactt 360
cctaccctcg taaattcgaa tcccggccgg gaacggtgca ttggaacgcg gattccccgt 420
gccaagagtg acgtaagtac cgcctataga gtctataggc ccacaaaaaa tgctttcttc 480
ttttaatata cttttttgtt tatcttattt ctaatacttt ccctaatctc tttctttcag 540
ggcaataatg atacaatgta tcatgcctct ttgcaccatt ctaaagaata acagtgataa 600
tttctgggtt aaggcaatag caatatttct gcatataaat atttctgcat ataaattgta 660
actgatgtaa gaggtttcat attgctaata gcagctacaa tccagctacc attctgcttt 720
tattttatgg ttgggataag gctggattat tctgagtcca agctaggccc ttttgctaat 780
catgttcata cctcttatct tcctcccaca gctcctgggc aacgtgctgg tctgtgtgct 840
ggcccatcac tttggcaaag aattgggatt cgaaatcgat 880
<210> 6
<211> 890
<212> DNA
<213> 人工序列
<400> 6
acgcgtgacg aggatcgttc gagcgagttt actccctatc agtgatagag aacgtatgtc 60
gagtttactc cctatcagtg atagagaacg atgtcgagtt tactccctat cagtgataga 120
gaacgtatgt cgagtttact ccctatcagt gatagagaac gtatgtcgag tttactccct 180
atcagtgata gagaacgtat gtcgagttta tccctatcag tgatagagaa cgtatgtcga 240
gtttactccc tatcagtgat agagaacgta tgtcgaggta ggcgtgtacg gtgggaggcc 300
tatataagca accggtgttt agtgaaccgt cagatcgcct ggagacgcca tcataataca 360
aacagaccag attgtctgtt tgttttcgaa tcccggccgg gaacggtgca ttggaacgcg 420
gattccccgt gccaagagtg acgtaagtac cgcctataga gtctataggc ccacaaaaaa 480
tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt ccctaatctc 540
tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt ctaaagaata 600
acagtgataa tttctgggtt aaggcaatag caatatttct gcatataaat atttctgcat 660
ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa tccagctacc 720
attctgcttt tattttatgg ttgggataag gctggattat tctgagtcca agctaggccc 780
ttttgctaat catgttcata cctcttatct tcctcccaca gctcctgggc aacgtgctgg 840
tctgtgtgct ggcccatcac tttggcaaag aattgggatt cgaaatcgat 890
<210> 7
<211> 845
<212> DNA
<213> 人工序列
<400> 7
acgcgtgacg aggatcgttc gagcgagttt actccctatc agtgatagag aacgtatgtc 60
gagtttactc cctatcagtg atagagaacg atgtcgagtt tactccctat cagtgataga 120
gaacgtatgt cgagtttact ccctatcagt gatagagaac gtatgtcgag tttactccct 180
atcagtgata gagaacgtat gtcgagttta tccctatcag tgatagagaa cgtatgtcga 240
gtttactccc tatcagtgat agagaacgta tgtcgaggta ggcgtgtacg gtgggaggcc 300
tatataagca gagctcgttt agtgaaccgt cagatcgcct tcgaatcccg gccgggaacg 360
gtgcattgga acgcggattc cccgtgccaa gagtgacgta agtaccgcct atagagtcta 420
taggcccaca aaaaatgctt tcttctttta atatactttt ttgtttatct tatttctaat 480
actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg cctctttgca 540
ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata tttctgcata 600
taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc taatagcagc 660
tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg attattctga 720
gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc ccacagctcc 780
tgggcaacgt gctggtctgt gtgctggccc atcactttgg caaagaattg ggattcgaaa 840
tcgat 845
<210> 8
<211> 414
<212> DNA
<213> 人工序列
<400> 8
acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60
gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120
ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180
acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240
gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt acaaacagac 300
cagattgtct gtttgtttta gtgaaccgtc agatcgcctg gagcaattcc acaacacttt 360
tgtcttatac caactttccg taccacttcc taccctcgta aattcgaaat cgat 414
<210> 9
<211> 414
<212> DNA
<213> 人工序列
<400> 9
acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60
gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120
ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180
acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240
gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300
tcagatacaa acagaccaga ttgtctgttt gtttcgcctg gagcaattcc acaacacttt 360
tgtcttatac caactttccg taccacttcc taccctcgta aattcgaaat cgat 414
<210> 10
<211> 415
<212> DNA
<213> 人工序列
<400> 10
acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60
gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120
ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180
acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240
gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300
tcagatcgcc tggagcaatt ccacaacact tttgtcttat accaactttc cgtaccactt 360
cctaccctcg taaaatacaa acagaccaga ttgtctgttt gttttcgaaa tcgat 415
<210> 11
<211> 472
<212> DNA
<213> 人工序列
<400> 11
acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60
gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120
ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180
acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240
gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300
tcagatcgcc tggagcaatt ccacatacaa acagaccaga ttgtctgttt gttttcgata 360
ttaggatatc actccgttta aactacaaac agaccagatt gtctgtttgt tacacttttg 420
tcttatacca actttccgta ccacttccta ccctcgtaaa ttcgaaatcg at 472
<210> 12
<211> 588
<212> DNA
<213> 人工序列
<400> 12
acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60
gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120
ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180
acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240
gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300
tcagatcgcc tggagcaatt ccacatacaa acagaccaga ttgtctgttt gttttcgata 360
ttaggatatc gtgtgcatca aagtacaaac agaccagatt gtctgtttgt tcagctgcat 420
gcatctcaat tagtcagcaa ctacaaacag accagattgt ctgtttgttg gcagaagtat 480
gatatcactc cgtttaaact acaaacagac cagattgtct gtttgttaca cttttgtctt 540
ataccaactt tccgtaccac ttcctaccct cgtaaattcg aaatcgat 588
<210> 13
<211> 704
<212> DNA
<213> 人工序列
<400> 13
acgcgttact ccctatcagt gatagagaac gtatgaagag tttactccct atcagtgata 60
gagaacgtat gcagacttta ctccctatca gtgatagaga acgtataagg agtttactcc 120
ctatcagtga tagagaacgt atgaccagtt tactccctat cagtgataga gaacgtatct 180
acagtttact ccctatcagt gatagagaac gtatatccag tttactccct atcagtgata 240
gagaacgtat taggcgtgta cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg 300
tcagatcgcc tggagcaatt ccacatacaa acagaccaga ttgtctgttt gttttcgata 360
ttaggatatc gtgtgcatca aagtacaaac agaccagatt gtctgtttgt tcagctgcaa 420
catgccttac aaggagagaa atacaaacag accagattgt ctgtttgttc ctaggtttat 480
atagtgaata gagttaggct acaaacagac cagattgtct gtttgttcag ctgcatgcat 540
ctcaattagt cagcaactac aaacagacca gattgtctgt ttgttggcag aagtatgata 600
tcactccgtt taaactacaa acagaccaga ttgtctgttt gttacacttt tgtcttatac 660
caactttccg taccacttcc taccctcgta aattcgaaat cgat 704
<210> 14
<211> 210
<212> DNA
<213> 人工序列
<400> 14
gtcaatcgat gctgccgcag caaaagcagg agcagatgcc gccgtcgcag gcgaagatgt 60
cgcagacgga ggaggcgatg ctgccggcgg aggaggcgaa gtaagtagag ggctgggctg 120
ggctgtgggg ggtgtggggt gcgggactgg gcagtctggg agtccctctc accacttttc 180
ttacctttct aggatgctgc cggatccgac 210
<210> 15
<211> 633
<212> DNA
<213> 人工序列
<400> 15
atcgatgcca ccatgtctcc aaagaggaga acccaggcag agagggcaat ggagacacag 60
ggcaagctga tcgccgccgc cctgggcgtg ctgagggaga agggatacgc aggcttccgc 120
atcgccgatg tgccaggagc cgccggcgtg tcccggggcg cacagtctca ccacttccct 180
accaagctgg agctgctgct ggccacattt gagtggctgt atgagcagat caccgagagg 240
agccgcgcca ggctggcaaa gctgaagcca gaggacgatg tgatccagca gatgctggac 300
gatgccgccg agttctttct ggacgatgac tttagcatct ccctggatct gatcgtggcc 360
gccgatagag accccgccct gagggagggc atccagagga cagtggagag aaacaggttc 420
gtggtggagg atatgtggct gggcgtgctg gtgtctcgcg gcctgagccg ggatgacgca 480
gaggacatcc tgtggctgat ctttaacagc gtgcggggcc tggccgtgag atccctgtgg 540
cagaaggaca aggagcggtt cgagcgcgtg cggaattcca ccctggagat cgccagagag 600
aggtacgcca agtttaagag atgataactc gag 633
<210> 16
<211> 1496
<212> DNA
<213> 人工序列
<400> 16
actagtgtgt gtcagttagg gtgtggaaag tccccaggct ccccagcagg cagaagtatg 60
caaagcatgc atctcaatta gtcagcaacc aggtgtggaa agtccccagg ctccccagca 120
ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc gcccctaact 180
ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca tggctgacta 240
atttttttta tttatgcaga ggccgaggcc gcctctgcct ctgagctatt ccagaagtag 300
tgaggaggct tttttggagg ccataggctt ttgcaaaaag ctatgaaaaa gcctgaactc 360
acagcgactt ctgttgagaa gtttctgatc gaaaagttcg acagcgttag cgacctgatg 420
cagctctcgg agggcgagga atctagggct ttcagcttcg atgtaggagg gcgtggatat 480
gtcctgcggg taaatagctg cgccgatggt ttctacaaag atcgttatgt ttatcggcac 540
tttgcatcgg ctgcgctccc gattcccgaa gtgcttgaca ttggggagtt cagcgagagc 600
ctgacctatt gcatctcccg ccgcgcacag ggcgtaactt tgcaagacct ccctgaaacc 660
gaactgcccg ctgttctaca acctgtcgcg gaggctatgg acgctattgc tgctgccgat 720
ctttcccaga cttccgggtt cggcccattt ggaccgcaag gaatcggtca atacactaca 780
tggcgtgatt tcatttgcgc gattgctgat ccccatgtgt atcattggca aactgtgatg 840
gatgataccg tcagcgcgag tgtcgcgcag gctctcgatg agctgatgct ttgggccgag 900
gattgccccg aagttcgcca cttggtccac gcggatttcg gcagcaacaa tgtcctgaca 960
gataatggcc gcataacagc ggtcattgat tggagcgaag ctatgttcgg ggattcccaa 1020
tacgaggtcg ctaacatctt tttctggcgt ccttggttgg cttgtatgga gcagcaaacg 1080
cgctactttg aaagacgaca tccagagctt gcaggatcgc ctcggctccg ggcgtatatg 1140
ctccgcattg gtcttgacca actctatcag agcttggtgg acggcaattt cgatgatgct 1200
gcttgggcgc agggtcgatg tgatgcaatc gtccgaagtg gagccgggac tgtcgggcga 1260
acacaaatcg cccgcagaag cgcagccgtc tggaccgatg gctgtgtaga agttctcgcc 1320
gatagtggaa acagacgccc ctctactcgt ccgagggcaa aggaatagaa cttgtttatt 1380
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 1440
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta accggt 1496
<210> 17
<211> 1979
<212> DNA
<213> 人工序列
<400> 17
acgcgtgaca ttgattattg acatgttatt aatagtaatc aattacgggg tcattagttc 60
atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240
tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 300
ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 360
acgtattagt catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc 420
ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 480
cagcgatggg ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg 540
ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa 600
agtttccttt tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc 660
gggcgttcga aggagtcgct gcgacgctgc cttcgccccg tgccccgctc cgccgccgcc 720
tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac 780
ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg 840
tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg 900
gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc 960
ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg 1020
agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc 1080
gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa 1140
ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc 1200
cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg 1260
ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc 1320
cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg 1380
tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg 1440
cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa 1500
atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct 1560
cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc 1620
ttctggcgtg tgaccggcgg ctcttgagcc tctgctaacc atgttcatgc cttcttcttt 1680
ttcctacagc ttcgaacctg ggcaacgtgc tggttattgt gctgtctcat cattttggca 1740
aaatcgattg aattctggcc aagtggatcc gctagctcta gagtcgacgg taccagtact 1800
aagcttgcct cgaggatatc ccatggagat ctatggggac atcatgaagc cccttgagca 1860
tctgacttct ggctaataaa ggaaatttat tttcattgca atagtgtgtt ggaatttttt 1920
gtgtctctca ctcggaagga catatgggag catgccctag gcagctgtcc ggaaccggt 1979
<210> 18
<211> 768
<212> DNA
<213> 人工序列
<400> 18
atcgatgcca ccatgagccg cctggataag tccaaagtga tcaactctgc cctggagctg 60
ctgaatggag tgggaatcga gggactgacc acaaggaagc tggcacagaa gctgggagtg 120
gagcagccta ccctgtactg gcacgtgaag aacaagcgcg ccctgctgga cgcactgcca 180
atcgagatgc tggatcggca ccacacacac agctgcccac tggagggaga gtcctggcag 240
gattttctgc ggaacaatgc caagtcttat agatgtgcac tgctgagcca cagggacgga 300
gcaaaggtgc acctgggaac caggcccaca gagaagcagt acgagaccct ggagaaccag 360
ctggccttcc tgtgccagca gggcttttcc ctggagaatg ccctgtatgc cctgtctgcc 420
gtgggccact ttaccctggg atgcgtgctg gaggagcagg agcaccaggt ggccaaggag 480
gagagagaga caccaaccac agatagcatg ccccctctgc tgaagcaggc catcgagctg 540
ttcgacaggc agggagcaga gccagccttc ctgtttggcc tggagctgat catctgcggc 600
ctggagaagc agctgaagtg tgagtccgga ggacctacag acgcactgga cgatttcgac 660
ctggatatgc tgccagccga tgccctggac gattttgacc tggatatgct gcccgccgac 720
gccctggatg actttgacct ggacatgctg cctggctgat aactcgag 768
<210> 19
<211> 765
<212> DNA
<213> 人工序列
<400> 19
atcgatgcca ccatgtccag actggacaag agcaaagtca taaacggcgc tctggaatta 60
ctcaatggag tcggtatcga aggcctgacg acaaggaaac tcgctcaaaa gctgggagtt 120
gagcagccta ccctgtactg gcacgtgaag aacaagcggg ccctgctcga tgccctgcca 180
atcgagatgc tggacaggca tcatacccac ttctgccccc tggaaggcga gtcatggcaa 240
gactttctgc ggaacaacgc caagtcattc cgctgtgctc tcctctcaca tcgcgacggg 300
gctaaagtgc atctcggcac ccgcccaaca gagaaacagt acgaaaccct ggaaaatcag 360
ctcgcgttcc tgtgtcagca aggcttctcc ctggagaacg cactgtacgc tctgtccgcc 420
gtgggccact ttacactggg ctgcgtattg gaggaacagg agcatcaagt agcaaaagag 480
gaaagagaga cacctaccac cgattctatg cccccacttc tgagacaagc aattgagctg 540
ttcgaccggc agggagccga acctgccttc cttttcggcc tggaactaat catatgtggc 600
ctggagaaac agctaaagtg cgaaagcggc gggccggccg acgcccttga cgattttgac 660
ttagacatgc tcccagccga tgcccttgac gactttgacc ttgatatgct gcctgctgac 720
gctcttgacg attttgacct tgacatgctc cccgggtaac tcgag 765
<210> 20
<211> 1320
<212> DNA
<213> 人工序列
<400> 20
ctcgaggccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 60
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 120
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 180
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 240
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 300
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 360
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 420
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 480
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaaacgtcta ggccccccga 540
accacgggga cgtggttttc ctttgaaaaa cacgatgata atatggccac aaccatggtg 600
agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 660
gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 720
ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 780
accaccctga cctggggcgt gcagtgcttc agccgctacc ccgaccacat gaagcagcac 840
gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag 900
gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 960
cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 1020
gagtacaact acatcagcca caacgtctat atcaccgccg acaagcagaa gaacggcatc 1080
aaggccaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct cgccgaccac 1140
taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 1200
agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 1260
gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gtaaagatct 1320
<210> 21
<211> 1044
<212> DNA
<213> 人工序列
<400> 21
ggatccgcca ccatgggcaa gtccaaggag atctctcagg acctgagaaa gaggatcgtg 60
gatctgcaca agagcggcag ctccctggga gcaatctcca agcgcctggc agtgcctcgg 120
tctagcgtgc agaccatcgt gcgcaagtac aagcaccacg gcaccacaca gccttcttat 180
cggagcggcc ggagaagggt gctgagccca cgcgacgagc ggacactggt gcgcaaggtg 240
cagatcaacc cccggaccac agccaaggat ctggtgaaga tgctggagga gaccggcaca 300
aaggtgtcca tctctaccgt gaagagagtg ctgtacaggc acaacctgaa gggccactcc 360
gccagaaaga agcctctgct gcagaatagg cacaagaagg caaggctgag gttcgcaacc 420
gcacacggcg acaaggatcg cacattttgg cggaacgtgc tgtggtctga cgagaccaag 480
atcgagctgt tcggccacaa tgatcacaga tacgtgtgga ggaagaaggg cgaggcctgc 540
aagcccaaga ataccatccc tacagtgaag cacggaggag gctccatcat gctgtgggga 600
tgttttgcag caggaggaac aggcgccctg cacaagatcg acggcatcat ggatgccgtg 660
cagtatgtgg acatcctgaa gcagcacctg aagacctctg tgagaaagct gaagctgggc 720
aggaagtggg tgttccagca cgacaacgat ccaaagcaca caagcaaggt ggtggccaag 780
tggctgaagg acaataaggt gaaggtgctg gagtggccca gccagtcccc tgatctgaac 840
ccaatcgaga atctgtgggc cgagctgaag aagagagtga gggcccggag acccaccaac 900
ctgacacagc tgcaccagct gtgccaggag gagtgggcca agatccaccc aaattactgt 960
ggcaagctgg tggagggcta tcccaagagg ctgacccagg tgaagcagtt taagggcaac 1020
gccacaaagt attgataact cgag 1044
<210> 22
<211> 376
<212> DNA
<213> 人工序列
<400> 22
acgcgtgacg aggatcgttc gagcgagttt actccctatc agtgatagag aacgtatgtc 60
gagtttactc cctatcagtg atagagaacg atgtcgagtt tactccctat cagtgataga 120
gaacgtatgt cgagtttact ccctatcagt gatagagaac gtatgtcgag tttactccct 180
atcagtgata gagaacgtat gtcgagttta tccctatcag tgatagagaa cgtatgtcga 240
gtttactccc tatcagtgat agagaacgta tgtcgaggta ggcgtgtacg gtgggaggcc 300
tatataagca accggtgttt agtgaaccgt cagatctaca aacagaccag attgtctgtt 360
tgttttcgaa atcgat 376
<210> 23
<211> 344
<212> DNA
<213> 人工序列
<400> 23
tccctatcag tgatagagaa cgtatgaaga gtttactccc tatcagtgat agagaacgta 60
tgcagacttt actccctatc agtgatagag aacgtataag gagtttactc cctatcagtg 120
atagagaacg tatgaccagt ttactcccta tcagtgatag agaacgtatc tacagtttac 180
tccctatcag tgatagagaa cgtatatcca gtttactccc tatcagtgat agagaacgta 240
ttaggcgtgt acggtgggcg cctataaaag cagagctcgt ttagtgaacc gtcagatcgc 300
ctggagcaat tccacataca aacagaccag attgtctgtt tgtt 344
<210> 24
<211> 19
<212> DNA
<213> 人工序列
<400> 24
tccctatcag tgatagaga 19
<210> 25
<211> 28
<212> DNA
<213> 人工序列
<400> 25
taggcgtgta cggtgggcgc ctataaaa 28
<210> 26
<211> 29
<212> DNA
<213> 人工序列
<400> 26
taggcgtgta cggtgggagg cctatataa 29
<210> 27
<211> 28
<212> DNA
<213> 人工序列
<400> 27
tacaaacaga ccagattgtc tgtttgtt 28
<210> 28
<211> 324
<212> DNA
<213> 人工序列
<400> 28
tccctatcag tgatagagaa cgtatgaaga gtttactccc tatcagtgat agagaacgta 60
tgcagacttt actccctatc agtgatagag aacgtataag gagtttactc cctatcagtg 120
atagagaacg tatgaccagt ttactcccta tcagtgatag agaacgtatc tacagtttac 180
tccctatcag tgatagagaa cgtatatcca gtttactccc tatcagtgat agagaacgta 240
ttaggcgtgt acggtgggcg cctataaaag cagagctcgt ttagtgaacc gtcagataca 300
aacagaccag attgtctgtt tgtt 324
<210> 29
<211> 332
<212> DNA
<213> 人工序列
<400> 29
tccctatcag tgatagagaa cgtatgtcga gtttactccc tatcagtgat agagaacgat 60
gtcgagttta ctccctatca gtgatagaga acgtatgtcg agtttactcc ctatcagtga 120
tagagaacgt atgtcgagtt tactccctat cagtgataga gaacgtatgt cgagtttatc 180
cctatcagtg atagagaacg tatgtcgagt ttactcccta tcagtgatag agaacgtatg 240
tcgaggtagg cgtgtacggt gggaggccta tataagcaac cggtgtttag tgaaccgtca 300
gatctacaaa cagaccagat tgtctgtttg tt 332
<210> 30
<211> 352
<212> DNA
<213> 人工序列
<400> 30
tccctatcag tgatagagaa cgtatgtcga gtttactccc tatcagtgat agagaacgat 60
gtcgagttta ctccctatca gtgatagaga acgtatgtcg agtttactcc ctatcagtga 120
tagagaacgt atgtcgagtt tactccctat cagtgataga gaacgtatgt cgagtttatc 180
cctatcagtg atagagaacg tatgtcgagt ttactcccta tcagtgatag agaacgtatg 240
tcgaggtagg cgtgtacggt gggaggccta tataagcaac cggtgtttag tgaaccgtca 300
gatcgcctgg agacgccatc ataatacaaa cagaccagat tgtctgtttg tt 352
<210> 31
<211> 488
<212> DNA
<213> 人工序列
<400> 31
tcccggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg acgtaagtac 60
cgcctataga gtctataggc ccacaaaaaa tgctttcttc ttttaatata cttttttgtt 120
tatcttattt ctaatacttt ccctaatctc tttctttcag ggcaataatg atacaatgta 180
tcatgcctct ttgcaccatt ctaaagaata acagtgataa tttctgggtt aaggcaatag 240
caatatttct gcatataaat atttctgcat ataaattgta actgatgtaa gaggtttcat 300
attgctaata gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag 360
gctggattat tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct 420
tcctcccaca gctcctgggc aacgtgctgg tctgtgtgct ggcccatcac tttggcaaag 480
aattggga 488
<210> 32
<211> 31
<212> DNA
<213> 人工序列
<400> 32
tcaggatcca tctgcgatct aagtaagctt g 31
<210> 33
<211> 29
<212> DNA
<213> 人工序列
<400> 33
tcaactcgag ctagaattac acggcgatc 29
<210> 34
<211> 27
<212> DNA
<213> 人工序列
<400> 34
gtcaatcgat ggagtcgctg cgcgctg 27
<210> 35
<211> 29
<212> DNA
<213> 人工序列
<400> 35
gtcggatccc tgtaggaaaa agaagaagg 29
<210> 36
<211> 26
<212> DNA
<213> 人工序列
<400> 36
gtcaatcgat gtaagtgccg tgtgtg 26
<210> 37
<211> 30
<212> DNA
<213> 人工序列
<400> 37
gtcggatccc tgaaatggaa gaaaaaaact 30
<210> 38
<211> 30
<212> DNA
<213> 人工序列
<400> 38
gtcaatcgat gtaagtatca aggttacaag 30
<210> 39
<211> 25
<212> DNA
<213> 人工序列
<400> 39
gtcggatccc tgtggagaga aaggc 25
Claims (10)
1.核酸序列,所述核酸序列包含至少2个拷贝的能与受四环素或其衍生物调控的反式激活物rtTA结合的TetO-操作子序列、1个拷贝的包含TATA盒序列的最小启动子序列和至少1个拷贝的与受cumate调控的转录阻遏物CymR结合的CuO-操作子序列,其中所述CuO-操作子序列在所述TATA盒序列的3’端下游,和所述TATA盒的距离间隔为10bp至100bp,优选为30bp至50bp,更优选为50bp。
2.根据权力要求1所述的核酸序列,其中所述TetO-操作子序列如SEQ ID NO:24所示,及/或所述最小启动子序列如SEQ ID NO:25或SEQ ID NO:26所示,及/或所述CuO-操作子序列如SEQ ID NO:27所示。
3.根据权力要求2所述的核酸序列,所述核酸序列如SEQ ID NO:23、SEQ ID NO:28、SEQID NO:29或SEQ ID NO:30所示。
4.根据权利要求1-3中任一项所述的核酸序列,所述核酸序列在3’端还包含可剪接的内含子序列。
5.载体,所述载体包含根据权利要求1-4中任一项所述的核酸序列。
6.根据权利要求5所述的载体,其中所述载体是表达载体,所述表达载体包含处于根据权利要求1-4中任一项所述的核酸序列的3’端下游的目的核酸片段,并且所述目的核酸片段的转录受根据权利要求1-4中任一项所述的核酸序列的控制。
7.宿主细胞,所述宿主细胞包含根据权利要求1-4中任一项所述的核酸序列或根据权利要求5或6所述的载体。
8.在宿主细胞中诱导表达目的核酸片段的方法,所述方法包括以下步骤:
(1)将根据权利要求6所述的载体以及rtTA的编码序列和CymR的编码序列转入所述宿主细胞中;
(2)在经过(1)的所述宿主细胞中表达rtTA和CymR;以及
(3)向经过(2)的所述宿主细胞提供四环素或其衍生物以及cumate或其功能类似物。
9.根据权利要求8所述的方法,其中所述rtTA是rtTAadv或rtTA3G,优选为rtTA3G,更优选地所述rtTA的编码序列如SEQ ID NO.18所示。
10.根据权利要求8所述的方法,其中所述CymR的编码序列如SEQ ID NO.15所示。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010442506.3A CN113699147B (zh) | 2020-05-22 | 2020-05-22 | 基于四环素和Cumate的共调控序列 |
US17/766,685 US11680267B2 (en) | 2020-05-22 | 2020-09-16 | Co-regulatory sequences based on tetracycline and Cumate |
EP20936609.5A EP4155408A4 (en) | 2020-05-22 | 2020-09-16 | COREGULATORY SEQUENCE BASED ON TETRACYCLINE AND CUMAT |
JP2022571240A JP2023528291A (ja) | 2020-05-22 | 2020-09-16 | テトラサイクリンとCumateに基づく共制御配列 |
PCT/CN2020/115520 WO2021232632A1 (zh) | 2020-05-22 | 2020-09-16 | 基于四环素和Cumate的共调控序列 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010442506.3A CN113699147B (zh) | 2020-05-22 | 2020-05-22 | 基于四环素和Cumate的共调控序列 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113699147A true CN113699147A (zh) | 2021-11-26 |
CN113699147B CN113699147B (zh) | 2023-06-09 |
Family
ID=78646308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010442506.3A Active CN113699147B (zh) | 2020-05-22 | 2020-05-22 | 基于四环素和Cumate的共调控序列 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11680267B2 (zh) |
EP (1) | EP4155408A4 (zh) |
JP (1) | JP2023528291A (zh) |
CN (1) | CN113699147B (zh) |
WO (1) | WO2021232632A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230304062A1 (en) * | 2021-10-18 | 2023-09-28 | Regeneron Pharmaceuticals, Inc. | Controlled transcription of polynucleotides |
WO2023147488A1 (en) | 2022-01-28 | 2023-08-03 | Iovance Biotherapeutics, Inc. | Cytokine associated tumor infiltrating lymphocytes compositions and methods |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002020811A2 (en) * | 2000-09-09 | 2002-03-14 | Basf Plant Science Gmbh | Modified tet-inducible system for regulation of gene expression in plants |
WO2002088346A2 (en) * | 2001-05-01 | 2002-11-07 | National Research Council Of Canada | A system for inducible expression in eukaryotic cells |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5888981A (en) | 1993-06-14 | 1999-03-30 | Basf Aktiengesellschaft | Methods for regulating gene expression |
US5866755A (en) | 1993-06-14 | 1999-02-02 | Basf Aktiengellschaft | Animals transgenic for a tetracycline-regulated transcriptional inhibitor |
US5464758A (en) | 1993-06-14 | 1995-11-07 | Gossen; Manfred | Tight control of gene expression in eucaryotic cells by tetracycline-responsive promoters |
US5814618A (en) | 1993-06-14 | 1998-09-29 | Basf Aktiengesellschaft | Methods for regulating gene expression |
EP0705334A1 (en) | 1993-06-14 | 1996-04-10 | Basf Aktiengesellschaft | Tight control of gene expression in eucaryotic cells by tetracycline-responsive promoters |
US5789156A (en) | 1993-06-14 | 1998-08-04 | Basf Ag | Tetracycline-regulated transcriptional inhibitors |
US6004941A (en) | 1993-06-14 | 1999-12-21 | Basf Aktiengesellschaft | Methods for regulating gene expression |
US5654168A (en) | 1994-07-01 | 1997-08-05 | Basf Aktiengesellschaft | Tetracycline-inducible transcriptional activator and tetracycline-regulated transcription units |
US6087166A (en) | 1997-07-03 | 2000-07-11 | Basf Aktiengesellschaft | Transcriptional activators with graded transactivation potential |
EP1200607B1 (en) | 1999-06-07 | 2010-02-24 | TET Systems Holding GmbH & Co. KG | Tet repressor-based transcriptional regulatory proteins |
CA2580515C (en) | 2004-10-04 | 2017-05-02 | National Research Council Of Canada | Expression system, components thereof and methods of use |
CA2630348C (en) | 2005-11-17 | 2016-01-12 | Stichting Voor De Technische Wetenschappen | Inducible expression systems |
JP5576382B2 (ja) | 2008-10-01 | 2014-08-20 | テット・システムズ・ゲーエムベーハー・ウント・カンパニー・カーゲー | テトラサイクリン誘導可能な転写制御配列 |
CN113584083A (zh) * | 2020-04-30 | 2021-11-02 | 深圳市深研生物科技有限公司 | 用于逆转录病毒载体的生产细胞和包装细胞及其制备方法 |
-
2020
- 2020-05-22 CN CN202010442506.3A patent/CN113699147B/zh active Active
- 2020-09-16 WO PCT/CN2020/115520 patent/WO2021232632A1/zh active Application Filing
- 2020-09-16 EP EP20936609.5A patent/EP4155408A4/en active Pending
- 2020-09-16 JP JP2022571240A patent/JP2023528291A/ja active Pending
- 2020-09-16 US US17/766,685 patent/US11680267B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002020811A2 (en) * | 2000-09-09 | 2002-03-14 | Basf Plant Science Gmbh | Modified tet-inducible system for regulation of gene expression in plants |
WO2002088346A2 (en) * | 2001-05-01 | 2002-11-07 | National Research Council Of Canada | A system for inducible expression in eukaryotic cells |
Non-Patent Citations (2)
Title |
---|
FENG-JUN LI 等: "An efficient cumate-inducible system for procyclic and bloodstream form Trypanosoma brucei", MOLECULAR & BIOCHEMICAL PARASITOLOGY * |
SUGURU SATO 等: "Generation of mouse iPS cells using an inducible expression of transgenes via the cumate gene-switch", ANALYTICAL BIOCHEMISTRY * |
Also Published As
Publication number | Publication date |
---|---|
US20220364103A1 (en) | 2022-11-17 |
US11680267B2 (en) | 2023-06-20 |
JP2023528291A (ja) | 2023-07-04 |
WO2021232632A1 (zh) | 2021-11-25 |
EP4155408A4 (en) | 2024-08-14 |
EP4155408A1 (en) | 2023-03-29 |
CN113699147B (zh) | 2023-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2023204146A1 (en) | Novel AAV8 Mutant Capsids And Compositions Containing Same | |
DK2150617T3 (en) | Regions with increased expression and stability | |
AU738156B2 (en) | Viral vectors and their uses | |
AU781628B2 (en) | Recombinase-based methods for producing expression vectors and compositions for use in practicing the same | |
US20030119104A1 (en) | Chromosome-based platforms | |
KR20210143897A (ko) | 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합 | |
CN113584083A (zh) | 用于逆转录病毒载体的生产细胞和包装细胞及其制备方法 | |
KR20210144861A (ko) | 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위 | |
WO2002088346A2 (en) | A system for inducible expression in eukaryotic cells | |
CN113699147B (zh) | 基于四环素和Cumate的共调控序列 | |
WO1998012339A9 (en) | Viral vectors and their uses | |
KR101476010B1 (ko) | 고생산성 세포의 수립을 위한 발현 벡터 및 고생산성 세포 | |
CN110637090A (zh) | 用于表达大型核酸转基因的质粒载体 | |
CN106544326B (zh) | 顺行跨多级突触、跨神经元的示踪系统 | |
CN111094569A (zh) | 光控性病毒蛋白质、其基因及包含该基因的病毒载体 | |
CN113699146B (zh) | 启动元件及包含其的逆转录病毒基因组转录盒和载体 | |
DK2788489T3 (en) | VECTORS THAT HAVE TOXIC GENES, AND RELATED PROCEDURES AND APPLICATIONS | |
KR101655492B1 (ko) | 동물세포를 사용해서 외래유전자 유래 단백질을 대량으로 생산하기 위한 발현 벡터, 및 그의 이용 | |
KR20240037192A (ko) | 게놈 통합을 위한 방법 및 조성물 | |
JP2021510080A (ja) | T細胞に高い転写活性を有するキメラプロモーター | |
CN101238214A (zh) | 使用改进的调节表达系统治疗疾病 | |
KR101604502B1 (ko) | 동물세포를 사용해서 외래유전자 유래 단백질을 대량으로 생산하기 위한 발현 벡터, 및 그의 이용 | |
KR20240029020A (ko) | Dna 변형을 위한 crispr-트랜스포손 시스템 | |
US20030166890A1 (en) | Gene expression | |
US20220017921A1 (en) | Improved vector systems for cas protein and sgrna delivery, and uses therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |