CN101208435A - 改进的表达元件 - Google Patents
改进的表达元件 Download PDFInfo
- Publication number
- CN101208435A CN101208435A CNA2006800173095A CN200680017309A CN101208435A CN 101208435 A CN101208435 A CN 101208435A CN A2006800173095 A CNA2006800173095 A CN A2006800173095A CN 200680017309 A CN200680017309 A CN 200680017309A CN 101208435 A CN101208435 A CN 101208435A
- Authority
- CN
- China
- Prior art keywords
- polynucleotide
- gene
- promoter
- expression
- ribosomal protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/46—Vector systems having a special element relevant for transcription elements influencing chromatin structure, e.g. scaffold/matrix attachment region, methylation free island
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
本发明涉及能提高可操作相连的转录单元的表达水平的基因元件。尤其是,这些基因元件来自核糖体蛋白基因的5′非翻译区,并可能包括CpG岛。还提供包含这些基因元件的载体和宿主细胞,以及获得高水平重组基因表达的方法。
Description
技术领域
本发明涉及多核苷酸,其包括可改进可操作相连的转录单元表达的元件。这些元件本质上与核糖体蛋白基因启动区相关,并在重组DNA构建体中,基因表达水平高,重复性好。本发明还涉及包括该多核苷酸序列的载体,包括该载体的宿主细胞,以及该多核苷酸、载体或宿主细胞在治疗中的用途,在细胞培养和其它生物技术应用中,用于生产重组蛋白。
背景技术
高等真核生物染色质结构的现行模式假定基因以“域”的形式组织(Dillon,N.&Grosveld,F.Chromatin Domains As Potential Units OfEukaryotic Gene Function.Curr.Opin.Genet.Dev.4,260-264(1994);Higgs,D.R.Do Lcrs Open Chromatin Domains?Cell 95,299-302(1998))。染色质域被设想为以一个缩合的、“封闭”的转录静止状态存在,或以一个非缩合的、“开放”的可转录构型存在。开放的染色质结构的特征在于增加DNase I的敏感性,使DNA次甲基化,并使组蛋白高度乙酰化,其建立被认为是基因表达开始的一项先决条件。
染色质域的开放和封闭性体现在转基因的行为中,该转基因随机整合到宿主细胞基因组中。同一构建体在整合到小鼠基因组中的不同的位点时,可出现不同类型的组织特异性和发展阶段特异性表达(Palmiter,R.D.&Brinster,R.L.Ann.Ref.Genet.20,465-499(1986);Allen,N.D.et al.Nature 333,852-855(1988);Bonnerot,C,Grimber,G.,Briand,P.&Nicolas,J.F.Proc.Natl.Acad.Sci.USA 87:6331-6335(1990))。
基因组织的染色质域模型,表明基因控制元件应与基因组活性区域相关,所述控制元件能够建立和保持一个可转录的、开放的染色质结构。
基因座控制区域(LCRS)是一类转录调控元件,其具有重塑长程染色质的能力。LCR在其功能上,可使转基因小鼠中的顺式连接基因,尤其是单拷贝基因完成与整合位点无关而与转基因拷贝数有关的生理层面的表达(Fraser,P.&Grosveld,F.Curr.Opin.Cell Biol.10,361-365(1998);Li,Q.,Harju,S.&Peterson,K.R.Trends Genet.15:403-408(1999))。最重要的是,这样的表达是组织特异性的。LCR能够阻挡异染色质的扩散,并防止PEV(Kioussis,D.&Festenstein,R.Curr.Opin.Genet.Dev.7,614-619(1997)),其由一系列DNase I高敏感性(HS)位点组成,这些位点可位于所调控基因的5’端或3’端(LI,Q.,HARJU,S.&PETERSON,K.R.TRENDS GENET.15:403-408(1999))。
通过培养生产可产生大量治疗性蛋白产物的哺乳动物细胞系,是一项重要的新兴产业。染色质的位置效应,使该过程变得困难、费时和昂贵。生产这种哺乳动物的“细胞工厂”的最常用的方法为基因扩增,其通过结合耐药基因(例如,二氢叶酸还原酶(DHFR),谷氨酰胺合成酶(Kaufman Rj.Methods Enzymol 185,537-566(1990)),以及维持严格的选择压力来诱导。使用包含高表达基因域LCR的载体和取自适当组织的细胞,可极大地简化程序,得到高比例的具有稳定的高表达水平的克隆细胞系(Needham M,Gooding C,Hudson K,Antoniou M,Grosveld F and Hoims M.Nucleic Acids Res 20,997-1003(1992);Needham M,Egerton M,Millest A,Evans S,Popplewell M,Cerillo G,Mcpheat J,Monk A,Jack A,Johnstone D and Hollis M.Protein ExpRpurif 6,124-131(1995))。
然而,虽然LCR的组织特异性在某些情况下有用,但也是许多应用的主要限制,例如需要在LCR未知的组织中表达的情况,或需要LCR在许多或所有组织中表达的情况。
在美国专利6,689,606及其共同在审专利申请WO 00/0539(纳入本文参考文献中),描述了一些元件,这些元件在其自然染色体背景下,负责建立跨越基因座的开放的染色质结构,该基因座只由在各处都可表达的持家基因组成。这些元件并非来自LCR,其包括延长的无甲基化的CpG岛。
在哺乳类动物DNA中,二核苷酸CPG可由DNA甲基转移酶识别,该酶可将胞嘧啶甲基化转化为5-甲基胞嘧啶。然而,5-甲基胞嘧啶不稳定,可转化为胸腺嘧啶。因此,相比较于人们所预期的偶然发生,CPG二核苷酸的发生频率要小得多。然而,在基因组DNA的一些片段中,CPG的发生频率接近于预期,这些序列被称为“CpG岛”。本文所用的“CpG岛”,是指具有至少200bp的基因序列,其GC含量至少50%,观察/预期的CPG含量的比值最少为0.6(即CPG二核苷酸含量为预期含量的至少60%)(Gardiner-Green M and Frommer M.J Moi Biol 196,261-282(1987);Rice P,Longden I and Bleasby A Trends Genet 16,276-277(2000))。
在现有技术中,无甲基化CPG是公知的(Bird et al(1985)Cell 40:91-99,Tazi and Bird(1990)Cell 60:909-920),其可定义为CpG岛,在CpG岛中,相当比例的胞嘧啶残基未被甲基化,且CpG岛通常延长超过两个间隔很近(0.1-3kb)的背驰转录的基因的5’端。据报道,DNA的这些区域在所有组织的发育过程中,仍然保持低甲基化(Wise andPravtcheva(1999)Genomics 60:258-271)。他们往往与普遍表达的基因的5’端相关,且大约40%的基因呈现出组织限制性表达图谱(Antequera,F.&Bird,A.Proc.Natl.Acad.Sci.USA 90,1195-11999(1993);Cross,S.H.&Bird,A.P.Cum Opin,Genet.Dev.5,309-314(1995)),并且已知其是活性染色质的定位区域。
“延伸”的无甲基化CpG岛,其延伸跨越包含一个以上的转录起始位点的区域和/或延伸多于300bp,优选多个500bp。延伸的无甲基化CpG岛,其边界是通过在功能上对该区域结合限制性内切酶进行PCR来确定的,这些限制性内切酶在其识别序列上消化(切割)DNA的能力,易受任何一个存在的CPG残基的甲基化状态影响。其中一个这样的酶是HpaII,其可识别并消化CpG岛中常见的CCGG位点,但此过程只有在中间的CG残基未被甲基化的时候发生。因此,如果DNA未被甲基化,在使用HpaII消化DNA,对包含HpaII位点的区域进行PCR时,由于HpaII消化不会得到扩增产物。如果DNA被甲基化,PCR只会给出扩增产物。因此,除无甲基化区域,HpaII不消化DNA,会发现PCR扩增产物,由此确定“延伸的无甲基化CpG岛”的边界。
WO00/05393已显示,跨越无甲基化CpG岛的区域包含两个背驰转录启动子,分别来自人类TATA结合蛋白(TBP)/蛋白组分-B1(PSMBI)和异质性细胞核核蛋白A2/B1(hnRNPA2)/异染色质蛋白1Hsγ(HP1Hsγ)基因位点,这些区域可进行重复性好,在生理水平上的基因表达,它们能够防止杂色表达模式和基因沉默,这通常在着丝粒异染色质内,与转基因整合一起出现。
众所周知,与活性转录启动子相关的无甲基化CpG岛,具有重塑染色质的能力,并因此被认为是在持家基因位点建立并维持开放域的主要决定因素(WO00/05393),并由此认为这些元件可增加生产性基因传递事件的比例,并改进转基因表达水平和稳定性。
核糖体是大RNA和蛋白质的复合体,其负责将mRNA翻译成多肽。每个核糖体含有4个核糖体RNA(rRNA)分子和大量核糖体蛋白(目前在哺乳动物细胞中,被认为79个)。核糖体蛋白质的功能包括帮助rRNA折叠,防止细胞核糖核酸酶,并协调蛋白质合成。一些核糖体蛋白质具有额外的核糖体外功能(WOOL,1996,TIBS 21:164-165)。由于不同物种的核糖体在结构和功能上相似,核糖体蛋白的氨基酸序列的保守程度很高,这并不奇怪,在哺乳动物中,大部分核糖体蛋白的序列几乎相同(WOOL etal,1995,BIOCHEM CELL BIOL 73:933-947)。
两个核糖体蛋白反常出现,因为它们是以前肽(PROPEPTIDES,羧基延伸蛋白)与泛素融合的形式表达的。泛素是一种高度保守的具有76个残基的多肽,其参与了各种细胞功能,包括调节细胞内蛋白分解,调控细胞周期及应激反应(HERSHKO&CIECHANOVER,1992,ANNU REV BIOCHEM 61:761-807;COUX ET A/,1996,ANNU REVBIOCHEM 65:801-847)。
泛素由两个不同类别的基因编码。一个是聚泛素基因,其编码泛素重复单元的线性聚合物。另外一个包括编码自然融合蛋白的基因,在此融合蛋白中,单一的泛素分子连接到核糖体蛋白rps27A或rpL40上(Finley et al,1989,Nature 338:394-401;Chan et al,1995,BiochemBiophys Res Commun 215:682-690;Redman&Burris,1996,Biochem J315:315-321)。
PERRY(2005,BMC Evolutionary Biology 5:15)讨论了核糖体蛋白启动子的共同的结构特点。这些启动子可按照TATA盒基序的本质、转录因子结合位点和AUG启动密码子的数量和类型进行分类。然而,这样的分类似乎并不能预测启动子的强度,证据表明,通过测量连接的报告基因的表达,被测的这样的启动子具有等效的转录活性(Hariharan et al,1989,Genes Dev 3:1789-800)。
美国专利6,063,598公开了仓鼠-泛素/S27A启动子,及其促使重组蛋白质高水平生产的用途。但是,并没有暗示它可用于加强主要从其它启动子转录的基因的表达(即一个除仓鼠-泛素/S27A启动子以外的启动子)。
美国专利申请US 2004/0148647公开了一种使用包含仓鼠-泛素/S27A启动子的表达载体的报告基因分析,该启动子功能性连接至目的产物的基因和荧光蛋白报告基因。再次,该申请只公开了构建体,其中目的基因的转录是从仓鼠-泛素/S27A启动子本身开始的。
获得更高、更可靠的表达水平依然是重组基因表达领域的一个目标,尤其是对于体内与离体的治疗应用和体外生产重组蛋白。
发明内容
在本发明的整个说明书和权利要求书中,“包括”与“含有”以及变化的形式,例如“包括”,是指“包括但不限于”,而不是为了(也没有)排除其他部分、添加剂、部件、整数或步骤。
在本发明的整个说明书和权利要求书中,除非上下文另有要求,单数包含复数。尤其是,使用不定冠词时,除非上下文另有规定,在本说明书可以理解为复数也可以理解为单数。
除非与本文不符,本发明某一方面、实施方案或举例所描述的特点、整数、特征、化合物、化学部分或基团,可理解为适用于本文的任何其他方面、实施方案或举例。
定义
本文所用的启动区,定义为基因组的核苷酸序列,其组成为启动子和转录起始位点,连同上游转录起始位点5kb的5’端序列和下游第一外显子远端的500bp的3’端序列。
5’端非翻译区是指基因组或cDNA序列中编码的翻译起始位点的5’端区域。它包括所有上游调控元件。5’上游序列是指基因组序列中编码转录起始位点的5’端序列。
本文所用的“可转录核酸”,是指一种核酸,当其可操作地连接到功能性启动子和其他调节序列时,能被转录为功能性RNA分子,如mRNA。这些序列可以包括编码可翻译多肽序列的开放阅读框。另外,功能性RNA可能有另一种功能,如核糖RNA,核酶或反义RNA。
“基因”通常指可转录核酸的编码区域,转录开始的启动子,以及其他调控序列,如增强子和3’多腺苷酸信号的结合体。基因组DNA基因中也含有内含子。“转录单元”有时被用来描述功能性的结合,包括至少一个启动子和带有可转录核算的最小调控序列,其往往来源于内含子被剪接掉的cDNA。“顺反子”指的是一种编码单一多肽带有功能性起始和终止信号的核酸。“转基因”意味着基因已被从一个基因组中转移到另一个基因组中,虽然这个术语可以更宽松地适用于包含于重组DNA构建体,如载体中的任何基因或甚至可转录核酸。
启动子和增强子是本领域众所周知的术语,其包括以下特点,仅供举例说明,但不局限于此。启动子为5’顺式作用的调控序列,其与转录起始直接相连。启动子元件包括所谓的TATA盒和RNA聚合酶起始选择(RIS)序列,该序列的功能为选择转录起始站点。这些序列还结合多肽,这些多肽尤其方便RNA聚合酶进行转录起始选择。
简单来说,启动子为定向元件,其作用是起始转录位于下游的少于100个(通常小于50个)核苷酸碱基对(bp)的序列。他们包含许多短共有核苷酸序列,这些核苷酸序列可以作为参与转录起始及多亚基复合物(称为预启动复合物)装配的各种蛋白质的结合位点(Mcknightand Tjian,1987,Cell 46:795-805)。在大多数基因中,这种情况发生在一个非常宽的保守序列(称为TATA盒,TATAAA)中,其与TATA盒结合蛋白(TBP,通用转录因子TFIID的亚基)结合。然后连接由十个以上其他转录因子组成的有序组件,最终形成POL II全酶复合体。RNA转录实际上起始于下游一个约25-30碱基的起始位点(Breathnach andChambon,1981,Annu Rev Biochem 50:349-393),该位点也与TBP结合。
大部分功能性启动子包含其他上游启动子元件(UPES),其中最高度保守的是位于上游约70-200bp的CAAT盒(CCAAT,转录因子CBF、C/EBP和NF-1的结合位点)和位于上游类似位置的GC盒(GGGCGG,通用转录因子Sp-1的结合位点)。虽然基准水平的转录仅从TATA盒开始,但对大多数启动子,至少CAAT和GC盒,需要最优水平的转录。
增强子是一种序列,其可非定向地增加位于局部的,但不一定紧靠的(达几kb远)启动子转录(KADONAGA(2004)CELL 116:247-257)。增强子包含有短(8-12BP)共有序列,该序列代表广泛的转录激活蛋白的结合位点(ONDEK ET AL,1988,SCIENCE 236:1237-1244),其中包括,如NF-1和SP-1,这些转录激活蛋白也与启动子元件相关。这些序列往往串联重复或反向重复。
在一些天然转录单元中,包括许多DNA病毒,如巨细胞病毒非常活跃的立即/早期基因转录单元,增强子和启动子元件在功能上,可结合到一个可有效延伸的上游元件中。
启动子可被调节,响应细胞类型、温度、金属离子或其他因素;或组成型,使转录与这些因素无反应。在许多用途中,一个强大的组成型启动子,可在许多类型的细胞中达到一致的高水平的转录,就算不是全部类型的细胞,也是非常有利的。多年来,用于驱动人巨细胞病毒中的立即/早期基因表达的增强子/启动子元件,已非常广泛用于驱动外源基因在真核表达载体中的表达(FOECKING&HOFFSTETTER,1986,GENE 45:101-105)。
假设核糖体蛋白基因启动区在增强和稳定相连转基因的表达方面可能具有有用的活性,并假设,高表达基因的调控区域可能更容易含有一些元件,这些元件对维持染色质的可转录活性构型是非常有效的。这些元件与异源启动子连接后可产生更开放的围绕该启动子的染色质环境,导致表达增加。本领域技术人员都了解,核糖体蛋白基因启动子可与核糖体启动子区分开来,这种核糖体启动子为RNA聚合酶I型依赖性启动子,从中rRNA被转录。
为验证该假设,从指数性生长的CHO-K1和NS0细胞系中获得RNA,并对13443小鼠基因进行微阵列分析。我们把分析限于具有高CpG岛含量和双向启动子可能性的元件。以从hnRNPA2调控区域获得的最小有效序列为标准,将选自这些基因的大约3kb的DNA,以NS0基因组DNA为模板,通过PCR扩增。这些序列接下来被克隆到EGFP表达载体内,并与同一载体的hnRNPA2对照一起转染CHO-K1细胞。
结果发现来自两个核糖体蛋白启动区的序列使实验中所用的异源报告基因序列获得一致地高水平表达。在每一种情况下,启动区包含富含GC的序列,该序列从实际启动子元件上游的5’区域一直延伸到第一外显子,而事实上,延伸到了第一内含子。该富含GC序列符合成为延伸的CpG岛的标准,因为本文定义延伸的CpG岛为延伸超过300BP。
因此,本发明提供了一种分离的多核苷酸,其包含
A)包含来自核糖体蛋白基因启动区的至少500个连续的核苷酸的元件,
B)异源启动子,以及
C)与所述异种启动子相邻的可转录核酸序列
其中可转录核酸序列由所述异源启动子转录,所述元件可增强其转录水平。优选地,所述元件包括来自于多核糖体蛋白基因的大于1kb,更优选地,大于3kb的5’端非编码序列。
连续核苷酸选自启动子区,其从转录起始位点的上游5kb位点(有义链5’端)延伸至第一外显子远端(3’端)下游500bp位点(有义链3’端)。
优选地,所述核糖体蛋白基因选自:RPSA,RPS2,RPS3,RPS3A,RPS4,RPS5,RPS6,RPS7,RPS8,RPS9,RPS10,RPS11,RPS12,RPS13,RPS14,RPS15,RPS15A,RPS16,RPS17,RPS18,RPS19,RPS20,RPS21,RPS23,RPS24,RPS25,RPS26,RPS27,RPS27A,RPS28,RPS29,RPS30,RPL3,RPL4,RPL5,RPL6,RPL7,RPL7A,RPL8,RPL9,RPL10,RPL10A,RPL11,RPL12,RPL13,RPL13A,RPL14,RPL15,RPL17,RPL18,RPL18A,RPL19,RPL21,RPL22,RPL23,RPL23A,RPL24,RPL26,RPL27,RPL28,RPL29,RPL30,RPL31,RPL32,RPL34,RPL35,RPL35A,RPL36,RPL36A,RPL37,RPL37A,RPL38,RPL39,RPL41,RPLP0,RPLP1,RPLP2及其直系同源基因(orthologue)。更优选地,所述核糖体蛋白基因为RPS3或RPS11。
在一个优选实施例中,该元件包含CpG岛,优选为延伸的CpG岛,其具有至少300bp,更优选地,其具有500bp。优选地,CpG岛未被甲基化。优选地,所述元件包含启动子,该启动子来自核糖体蛋白基因,核糖体蛋白基因的转录是从该启动子自然启动的。这种启动子往往被称为内源性启动子。在一个优选实施例中,该元件进一步包含所述核糖体蛋白基因一个或多个外显子。
优选地,核糖体蛋白基因为一种哺乳动物的基因,尽管这些基因及其启动子和5’端上游序列在不同的物种中高度保守,并可能替代为昆虫基因、线虫基因或酵母基因。不过,优选地,该核糖体蛋白基因为人或啮齿动物基因,更优选地,为小鼠基因。
在一个更优选的实施例中,本发明中的分离的多核苷酸包括序列表中SEQ ID NO:1所示的小鼠rps3核苷酸序列的第38-3154位的核苷酸。可替选地,该多核苷酸包括序列表中SEQ ID NO:2所示的小鼠rps11核苷酸序列的第12-3032位的核苷酸。
在一个方面,除所描述的元件外,该多核苷酸还包括启动子,该启动子本质上不与来自核糖体蛋白基因的所述元件相关。在本实施方案中,异源启动子(有别于可能会或可能不会存在于第一元件中的内源启动子),位于该元件下游相邻的可操作连接的位置,该元件包含源自核糖体蛋白基因的5’端序列。在此安排下,该核糖体蛋白基因元件可增强由异源启动子指导的表达。
在一个实施方案中,所述启动子为组成型启动子,更优选地,其选自:巨细胞病毒早期/立即启动子、SV40、EF-1α、鲁斯氏肉瘤病毒(RSV)LTR或HIV2LTR或由此衍生的序列的组合。更优选地,该启动子为巨细胞病毒(CMV)立即/早期启动子。最优选地,该启动子为小鼠或豚鼠CMV立即/早期启动子。
可替选地,所述启动子可以是一个组织特异性启动子,其指导在组织有限范围内的表达。这些启动子是本领域众所周知的,其包括那些来自β-球蛋白、κ和λ免疫球蛋白轻链、免疫球蛋白重链、肌间线蛋白、酪氨酸酶、CD2、白细胞介素3(IL-3)、肌球蛋白轻链、人黑素瘤抑制活性基因启动子及角蛋白的启动子。在一个特别优选的实施方案中,该启动子为肿瘤选择性启动子,其优先指导一个或多个肿瘤类型的表达。这些启动子的例子包括基于癌胚抗原(CEA)、前列腺特异性抗原(PSA)、环氧合酶-2(COX-2)、α-甲胎蛋白(AFP)、酪氨酸酶和T细胞因子1-4(TCF)的启动子。
该可转录核酸可编码任何用于体外表达的有用的多肽,优选地,其可选自抗体、抗体的功能性表位结合片段、生长因子、细胞因子、蛋白激酶、可溶性受体、膜结合受体或凝血因子。可替选地,该可转录核酸可编码用于体内或离体基因治疗的治疗性基因。这种治疗性核酸可以通过取代或补充致病缺陷基因的功能而起作用,所引起的疾病如囊性纤维化、地中海贫血症、镰刀性贫血症、范可尼贫血、血友病、重症联合免疫缺陷病(SCID)、苯丙酮尿症(PKU)、α-1型抗胰蛋白酶缺乏症,裘馨氏肌肉萎缩症、鸟氨酸氨甲酰基转移酶缺乏症或成骨不全症。可替选地,该可转录核酸可编码选择性地在靶细胞,如恶性癌细胞中表达以杀死该细胞的细胞毒性剂或前药转换酶。这些应用以及很多其他应用,是本领域技术人员众所周知的,本发明在提高治疗性核酸表达的相关内容对熟练的技术人员来讲是显而易见的。
在另一个方面,本发明提供了一种载体,其包括本发明上述的多核苷酸。优选地,所述载体为一种适应真核基因表达的表达载体。
典型地,所述适应包括(仅作举例,但不局限于此),提供转录控制序列(启动子序列),调控细胞/组织特异性表达。适应还包括提供可选择的标记和自主复制序列,皆有助于所述载体在真核细胞或原核宿主中维持。可自主维持的载体称为附加型载体。附加型载体是理想的,因为他们可自我复制,所以不需要整合即可坚持。WO98/07876中描述了这种附加型载体。
这种适应有助于编码基因载体的表达,其包括提供转录终止/多腺苷酸化序列。其还包括提供内部核糖体进入位点(IRES),该位点可最大化编码基因载体的表达,这些基因排列在双或多顺反子表达盒中。
这些适应是本领域众所周知的。关于表达载体的构建和通用重组DNA技术,有大量出版文献。请参阅,Sambrook et al(1989)MolecularCloning:A Laboratory Manual,Cold Spring Harbour Laboratory,ColdSpring Harbour,NY and References Therein;Marston,F(1987)DNACloning Techniques:A Practical Approach Vol III IRL Press,Oxford Uk;DNA Cloning:F M Ausubel et al,Current Protocols In Molecular Biology,John Wiley&Sons,Inc.(1994).
该载体可以是附加型载体或整合型载体。优选地,该载体为质粒。可替选地,该载体可以是病毒,如腺病毒、腺相关病毒、疱疹病毒、牛痘病毒、慢病毒或其他反转录病毒。
可替选地,该载体可包含
A)包含来自核糖体蛋白基因启动区的至少500个连续核苷酸的元件;
B)异源启动子;以及
C)多克隆位点,
其中插入到所述多克隆站点的可转录核酸序列能够由所述异源启动子转录,所述元件可增强其转录水平。
本发明的另一个方面,提供了宿主细胞,其包含本文所描述的分离的多核苷酸或载体。优选地,所述宿主细胞为哺乳动物细胞,更优选地,其选自CHO,NS0,BHK,Hela,HepG2。
本发明还提供了一种多肽表达方法,其包括将含有本发明多核苷酸的表达载体插入到本文所描述的适当的宿主细胞中,在合适的条件下,培养所述宿主细胞,使之表达。优选地,所述多肽是一种对治疗有用的多肽。
本发明的另一个方面,提供了一药学制剂,其含有本文所描述的多核苷酸、载体或宿主细胞,和药学上所接受的载体、赋形剂、缓冲剂或介质。
附图简述
图1所示为载体rps3-1005-EGFP的质粒图谱(见实施例1)。
图2所示为载体rps11-1005-EGFP的质粒图谱(见实施例2)。
图3所示为转染后八天,EGFP报告基因被各种rps3构建体在CHO-K1细胞中表达经流式细胞仪分析的结果。图A所示为平均荧光,图B表示表达报告基因到可探测水平的细胞百分比(%阳性细胞)。见实施例1。
图4所示为转染后七天,报告基因被rps11构建体在CHO-K1细胞中表达(流式细胞仪分析)。A和C为总计数,B到E为基于种群中正在表达的细胞的结果。图A所示为在稳定选定的池中细胞的平均荧光,图B所示为阳性细胞百分比(%)。见实施例2。
图5所示为报告基因在稳定转染的NS0细胞中的表达水平,其是受hCMV启动子所驱动,不存在额外的元件,或将8kb的hnRNPA2或3kb的RPS3元件放置到紧邻hCMV启动子的5’端。图A所示为在28天时,稳定池的平均荧光强度,图B所示为阳性细胞百分比(%)。
图6所示为rps11构建体,与图5类似的数据。图A所示为稳定池的平均荧光强度值,由HCMV驱动的构建体,或紧邻启动子的5’端带有8kb的hnRNPA2或3kb的RPS3元件的相同的构建体5’。图B所示为在表达报告基因的池中,细胞的百分比(阳性细胞百分比(%))。
具体实施方式
材料和方法
微阵列分析
按照生产商的操作规程,从约80%汇合的CHO-K1细胞中,用RNeasy RNA提取试剂盒(Qiagen,Crawley,英国),提取总RNA。使用代表13443已知转录本的小鼠70聚体寡核苷酸文库(Operon V.1),对总RNA(2μg/μl)进行微阵列表达分析。辛辛那提大学,基因组学及微阵列实验室,根据参照的操作规程(http://microarray.uc.edu),承担了微阵列分析。
根据增加的荧光,对基因转录本序列进行排列。在先前的研究中,我们详细介绍了HNRPA2B1/CBX3位点作为染色质-重塑元件,使hCMV受益,HNRPA2转录本被确定为基线表达水平。不过,用现有的微阵列分析,HNRPA2转录本几乎检测不到。由于HNRPA2转录本的表达水平为最小的,使用HNRPA2作为我们的参考,已确定3829个序列用于潜在分析。因此,从排序的表达的转录本的最高2%(76个序列)中,根据包含CpG岛和一个或多个假定/已知转录起始位点的标准,确定了7个序列(见表1)。CpG岛的位置、大小和GC∶CG比,使用GrailEXP进行了验证(http://compbio.ornl.gov)。假定/已知转录起始位点从NIX blast分析(http://www.hqmp.mrc.ac.uk)和Ensembl数据库(http://www.ensembl.org)确定。
含有CpG岛的片段的PCR扩增
设计PCR寡核苷酸,根据已知或预计的编码序列结构(见表2),扩增约3kb片段,该片段包含嵌入启动区的完整的CpG岛,同时包括约500bp的编码序列。
PCR反应含有特异于每个基因组片段的寡核苷酸组(每种引物2pmol;表2)。使用FailsafeTM PCR premixes A-F(Cambio,UK),1单位的Taq DNA聚合酶(Promega,UK)和200ng模板DNA进行PCR扩增。最初变性为96℃,2分钟,进行35个PCR扩增循环(94℃,1分钟,55-60℃,1分钟,72℃,5分钟)。最后延伸步骤(72℃,10分钟)。
按照制造商提供的操作规程,使用GFX DNA纯化柱(Amersham公司,UK)对PCR产物进行凝胶纯化,并按照制造商提供的操作规程(TOPO;Invitrogen,UK)进行TOPOTA克隆。为克隆到TOPO载体(Invitrogen,UK)中,包含CpG岛的每个片段获得正义和反义方向。
表达载体构建
将从pEGFP-N1中获得的hCMVI EGFPI sv40pA(Nhe//Age/缺失的多克隆位点)插入到CET 900,然后将该载体的Asc盒插入到CET1005的Asc位点,可构建为对照表达载体(命名为CET1005EGFP,SEQID NO:20)。
除非另有说明,从TOPO2.1(Invitrogen,UK)中的所有CpG岛片段去除。将Terf2ip Acc651/EcoRV片段插入到1005的Acc65I/SwaI中。将GAPDH的SpeI/SnaBI位点插入到1005的PmeI/XbaI中。将RPS3XbaI//SpeI片段插入到1005的XbaI。将TOPO4.0和TOPO2.1(Invitrogen,UK)中的RPS11和TUBA1EcoRI的平头片段分别去除,并插入到10005的PmeI。最后,将A430106P18Rik(EcoRV)和2510006D16Rik(BstXI)片段也插入1005的PmeI。所有含有CpG岛的片段均以正义和反义方向紧邻hCMV启动子上游插入。
细胞系和转染
将CHO-K1细胞在HAMS F12(Invitrogen,Paisley,UK)加上4500mg/l L-丙氨酰-L-谷氨酰胺,10μg/ml青霉素、10μg/ml链霉素和10%(v/v)热灭活胎牛血清(FCS;Invitrogen,Paisley,UK)的培养基中培养。通过电穿孔进行转染,用来自80%汇合培养物的大约107个细胞和BioRad Gene Pulser IITM装置递送单一脉冲975μF,250V。转染使用2μg线性CET1005EGFP质粒和等效摩尔数量的不同大小的表达载体。选择稳定的转染细胞,并在含有12.5μg/ml硫酸嘌呤霉素(Sigma,UK)的生长培养基中维持。
转基因表达定量
用Becton-Dickinson FACScan分析转染有EGFP报告基因构建体的细胞,采用亲本CHO-K1细胞系作为背景自身荧光对照。
表1序列分析
a.基因库登陆号
b.Enseml描述(http://www.enseml.org/)
c.Gailexp(http://compbio.orni.org/gailexp)
d.Gapd-来自人序列
表2PCR寡核苷酸和扩增子大小
位点 | 正义链 | 反义链 | 扩增子 |
Terf2ip | gtagtttctgacttggaaatgt(SEQ ID NO:3) | aactgacctgccatgccattc(SEQ ID NO:4) | 2995bp |
Gapd | gagcagtccggtgtcacta(SED ID NO:5) | gcagagaagcagacagttatg(SEQ ID NO:6) | 3096bp |
RPS3 | cagagcatcaagtacctgtga(SEQ ID NO:7) | taaccactaagccatctctcc(SEQ ID NO:8) | 3056bp |
TUBA1 | caagaacaaggaagctggcc(SEQ ID NO:9) | taaaacccacagcactgtaggg(SEQ ID NO:10) | 3049bp |
RPS11 | aagactgtttgcctcatgcc(SEQ ID NO:11) | ggatgacaatggtcctctgc(SEQ ID NO:12) | 3020bp |
A430106P18Rik | atggttgtaggttcacgtcc(SEQ ID NO:13) | atccctcacattgccaagcc(SEQ ID NO:14) | 3128bp |
2510006D16Rik | acttaagacctgatgcctcc(SEQ ID NO:15) | gctagcttacataggcagcc(SEQ ID NO:16) | 2997bp |
实施例1rps3元件驱动的表达
SEQ ID NO:1示出了RPS2克隆序列(第38-3154位核苷酸);SEQID NO:17示出了完整的pRPS3-1005-EGFP质粒的序列;SEQ ID NO:18示出了完整的pCET1015-EGFP质粒序列。
研究EGFP在CHO-K1池中,转染八天后的表达水平,该CHO-K1池只含有hCMV(对照构建体;pCET1005-EGFP质粒;在转染前用Pmel线形化),以及含有构建体,所述构建体含有8kb的RNPA2片段(pCET1015-EGFP质粒,在转染前用Pmel线形化)和Rps3(pRPS3-1005-EGFP质粒,在转染前用Pmel线形化)。
以含有Rps3的构建体生成的池中,相比较于对照构建体,EGFP表达水平显着增加。添加hCMV启动子上游的Rps3序列,相对于对照或含有hnRNPA2元件的构建体,平均荧光强度分别增加了5.5倍或1.5倍(图3A)。
研究构建体在NS0细胞中的活性。相比较于仅是hCMV启动子,当包含RPS3元件或hnRNPA2元件时,在稳定池中平均荧光强度分别增加了28倍或18倍(图5A)。
在CHO-K1细胞和NS0细胞中,含有hnRNPA2元件时,阳性细胞的比例显著增加,但含有RPS3元件时,这种增幅更大(图3B和5B)。
实施例2rps11元件驱动的表达
SEQ ID NO:2示出了RPS11克隆序列(第12-3032位核苷酸);SEQ ID NO:19示出了pRPS11-1005-EGFP的完整序列。
将含有Rps11的载体和对照载体(PmeI线性化)转染到CHO-K1和NS0细胞系中,经嘌呤霉素选择后获得稳定的池。通过FACscan分析评估EGFP平均表达水平。
hCMV上游Rps11元件的加入,使得EGFP在CHO-K1细胞池中的平均表达水平,相比较于含有上述RNPA2片段的构建体,增加了1.2倍(图4A)。
以含有Rps11的构建体稳定转染的NS0细胞系,其平均EGFP表达水平,相比较于hCMV和RNPA2构建体,(分别)增加了1.8倍和1.5倍。
相比较于RNPA2构建体,以Rps11构建体转染的CHO-K1细胞系,其阳性细胞比例增加(图4B)。此外,相比较于hCMV和RNPA2构建体,以Rps11构建体转染的NS0细胞池,其阳性细胞比例增加(图6B)。
序列表
<110>密理博公司(Millipore Corporation)
<120>改进的表达元件(Improved expression elements)
<130>SCT075082-47
<160>20
<170>PatentIn version 3.2
<210>1
<211>3145
<212>DNA
<213>Mus musculus rps3
<400>1
ctagtaacgg ccgccagtgt gctggaattc gcccttataa ccactgagcc atctctccag 60
ccctgagtca tgattttagt gtgagaggca tcattgaatt ttctgagcac ggccatcagg 120
gtagctggca caggtcttca gatacaagga gatagttata agaaggcagc catggctgtg 180
gtgcactaga aatggagaaa cagcttcatc aggtgacaga ccagtctgac tctgtcccat 240
gattagaagc catcttgtta caaggtcaaa ataagttcat tcctgttttc tgtaacactt 300
gggtttgatc ctgtcgtcaa cccattttct ggaatttgac atgttccata ctccattata 360
ccctgacttc caccctgata agatgttctg ccaagttcct gtgtagccaa cattcccctg 420
gaaatctctc ttcccttgga aaccacctag tcttagaaat tttgagttat ataaattcca 480
cttctatgtt tgatgctatt ctttaaaact ccactttagg gagatagccc tgtctgatag 540
aaaataaaac ttgcttaatt tgtctaaaag agtttaagta atagttttta cttttgttcc 600
gtgggattaa tacagggtga aacagactcc cgtgtttcca gtgtgaagtg agccacacac 660
tgcagtacaa gttatatcag caggttctgc ctctgggcaa tgaacttttg cttgtgtgga 720
catcagggtc tgtgtgaagg gaaggtccta tggcctagat ttatactatt caacagtctg 780
tccccgaagc cctggtgctt tattattttg acaagcccct gctgctggta ttccaccctg 840
ctgcgagtca aaaaagttcc tgtctcggaa aaacaaaaca aaacaaaaca accaaaaaat 900
aaaatttttt tttcccacag gttctagtgg aggtgctcac taccagaaat cctacaaata 960
agcccatctc atggatcagg gtttaccttt gtaataatat taaatctgtg tgcatgtgcg 1020
cacgcatgtg ttttatgctt gcatatatgt atacgcagcc atggttttct actgtcccac 1080
tcactctgta acttactgag ccatccagct ggtcctctaa atacatttca atgaaagttt 1140
tcattagcgt gaacgtgaag gtggtaaaat ctgttagtgt gtgcttatgc ctgtggtttg 1200
cacctctagt ctgaaggttg ctcttttcaa attttttatt tatttacgtt tttacttttg 1260
agtcagaaac tcataaaggc caagctggcc tcgaattcgc tatgtagtca atgatgacct 1320
taaacttgtg accctctact tcgttagtgc tggaacccca agcttgctga gtacagagca 1380
ctttcagacc ggaactagat gtctacttcc tgttccgcct acattacagg ttgctaggtt 1440
acaccccccc tacgccgttt tagacgcaaa acttcatttc ccatgcaaaa cttcatttcc 1500
catgaacact tgcaagggtc gccgcgctgc gcggcgtcat tgctcccgcc ctatatacct 1560
acttccgccc gcgagccact tcctttcctt tcagcggcgc gcggctgcaa gatggcggtg 1620
cagatttcca agaagaggaa ggtaagcgtc tgggcccggt tcgggagtcc gccgcgggtt 1680
ctacaagtgc cagggaggcc tgtggctccg tgatcagtcc tgtggagcgt ctggggccgc 1740
ctgccgtctc ttcgagcctc ggatggccgt agattgtgta ttgggccgga gccgggcgag 1800
tgctgtgtgc ctgggcaagg gagggacaaa ctcctcgagt tctggaccga ctcgaacacc 1860
gggcgcctcc agttccggac tagacacctt tgagcgtttc ttggtctcca taatagtaat 1920
cctgtggcac agttagaggg cgtgtgccat cagatctagt ccagtttctt tagtaagtga 1980
agtttagcag tcccttctct tagtcgcgtg atcctgcaag tggccatagt tgaaagccta 2040
cttactgact gctgccgtgt tcactcggga cccggagctg cagcgtccct gtggttatca 2100
tttcatgggg gaaaagtgtg caggttgcca ggtttagaaa tagatggtct gtcgtttgtg 2160
cttatgcaca cagatgataa acctgttttg agtcaggatt cctctcctat ccgaggtaca 2220
acttacagtc ccagctgtac atgtgctact tggagacaga tttttctttg tctcttgggt 2280
gtagattatg ccgtagagcc cttcgatgaa gaggtgatga cgagtctgag taggaagtgt 2340
tgtctttgtc caagatgcct cactatgctg cgttctgtgg cacagctgaa agcactgtgg 2400
tcaaaagaaa cttcctaaag atgaccaaga ggcatttgtc tgagaagggt tgctgctttt 2460
ctgtagggcc attgggcttg ctctgactaa ccctgtcttc acctcagagg taacttgttt 2520
cctttggttc agtttgtagc tgatggcatc ttcaaagctg agctgaatga atttctcact 2580
cgggagctgg ctgaagatgg ctactctgga gttgaagtcc gagttacacc aaccaggaca 2640
gaaatcatta ttttagccac caggtagaaa taccattgat tgtcacctgt aaatactgtg 2700
tgtactgaga tgctgtgtaa acttgggcca accaagcagt aaatctggcc tcagtgggtg 2760
taactgcttt gttagaactg catttgggaa gaacttacct tccatttaac gtgtgtgctg 2820
gcgttgtggt gggcggcagg tgggatcttg agtaaatggt tgcgcttccc ctctacagga 2880
cacagaatgt tcttggggag aagggtcgtc ggatcagaga gttgaccgca gttgtccaga 2940
agcgctttgg cttccctgaa ggcagcgtag aggtgagttc ctctgcttta tctcccgggg 3000
gttttagact gagttgggat gtggcttctg ctatagaatt gtacttctga aaacctgaca 3060
tggccagtga cagtcacagg tacttgatgc tctgagggcg aattctgcag atatccatca 3120
cactggcggc cgctcgagca tgcat 3145
<210>2
<211>3039
<212>DNA
<213>Mus musculus rps11
<400>2
aattcgccct taagactgtt tgcctcatgc ctgcctggcc tgcccttcct ccgccgccaa 60
ctagggaagt ggggaccaaa ggttccttag gcactgctcc tgtgggtaga ggggacatta 120
gagagctgac agcgcaccac ctgcatgagt ttttattaaa gtgcaaacca tgggatgaat 180
cagttgagct tcagtgttga aaatgagtag cagggctgcc ccacccacct gaccaagtac 240
cctattctgc agctatgaaa atgagatctg cacatgagct ggggttcaca agtgcacact 300
tggagcactg ccttgctcct tcccagcaga ccacaaagca gtatttttct ggaggatttt 360
atgtgctaat aaattatttg acttaagtgt gtacgatgtg tgctgtgcag agaggggcag 420
agggcaccag caggtcatct gcatgggggg cccctttggg tgaatccttg ctcacgggat 480
aggctttgtt gctcaaaagt tgcagatata catcttgggt cctgtcctag atggtgttac 540
tgtaagtcag caccaagata caagagctgg tacctggact gtaggaggtc aggccatgac 600
acaaaggctg ggactaaagg catttaccac gcctgagtct tctggttctt taaacatcaa 660
atccttccgg gggctggcga gatggctcag tggttaagag cacagactgc tcttacgaag 720
gatccgagtt caaatcccag caaccaaatg gtgcctaaca actatccata atgaaatctg 780
atgccctctt ctggagtatc tgagaacagc tacagtgtac ttacatataa tcttaaaaat 840
gcttcccatg ttaaccacca ctagagtttt tattacagct agctgacctg gaagccaagt 900
ccttatgcct ccgtgagtgc tggggttaaa aagatccagc accactcaaa atgtcaatct 960
attttgaaaa tatgctttat actgttctag cccatctgtg cagggctaga acggtgaata 1020
cgagaaactg acacaagctt ttgccacctg gctaaatggt tcctctatta cctggggtgg 1080
tcacctaagg ttagacactc atccacgagt agtcaggaca taaacccatc aaagtgtggg 1140
tagacgcgca gcctgagata ctgtcaacaa aggacatgcg accttggtga cgtcggcctt 1200
taataaaagg aagaaaggtt gactattcgg tcgacgctgg ctgctcctga catcgtatgg 1260
cagatactct gctgtaaagc ggttcacccc tttcttgaga cccgctctgc acggccgctt 1320
ctctctggaa actgaatccc agcacgtgtt tcccaacccg tacggcacgc cttctccgcc 1380
ctaagcctcg ccgtaccaca tgatgcacgt ttcctccaca tcgtgctcct gaaatctcgc 1440
gagatgatag gatcttcccg ccccttagtc ctcccccgtc atggcggcgt acggacagtc 1500
ccaggaacgc gggctctcgc cggaagtacc tcccacctcc gtgaggataa ccccgcgtca 1560
cttccgcccc gacctcgcgt ggtgaataag gaagccggga gcggccctgc ctctcccttt 1620
ctccggcggc cgggaagatg gcggacattc aggttcgagc gtttagttgc tttcccccga 1680
cgcttcggtg tggagcgtat cccttggcgt cctcgttgtc ttacgcatta gctgaagcga 1740
ggatgcctgc gaatgccttc gtctcaggcg gctcggaaat ccgggctcta cgcagtaatg 1800
gggtccctgg cgcttcggga gttggttctt aaagctcaga gcttaacggg tgagggattg 1860
tggcgggagg agggcatcct gcggcgcggg agtcctgcgg cggcagagcc ggggacactg 1920
ggtaaagcag gttttttccc cttgatggag actgaggccc ggacctcgtg cgctctacgg 1980
cagggctgcg gtcccgacct cgctgtagtt ttcagtgtga gcgcagctct ggcctcgatg 2040
agcttaggct tgtcttaaac ttgccatcct gcctcaacct caaccgggat gacagatccg 2100
gcccaccagg ctcggctacg tggacataag cttgaatccc gaatgagtgg atttgtatgt 2160
tttggaggtc cagtctggct gaaaagctct ttttgatctc agccgtgagt tctgcaggct 2220
gtggaggtgt tagatgggac gcagtgtgtg agctaaacta gacttggggt ggttggagag 2280
ccctgaccag ccggttttgg cgattggggc aaataaggtt gaaggtagga aggaagaaat 2340
attgtctctg atttccttga actttacctg caacctcacc aaattctcat ccctacagac 2400
ggagcgtgct taccaaaagc agcctacgat ctttcaaaac aagaagcggg ttctgctggg 2460
agaaaccggc aaggaaaaac tccctcggta ctacaagaat atcggtctag gcttcaagac 2520
gcctaaagag gtacaggacc ctccagcaga tgagatccct gctgccctgc acgtgtggga 2580
gcacagccac cccgccccct tcacagtggc ttcccatggg cccctgggaa ttgtagtatg 2640
ggccctgagg cgtcatcctt ggttctgttt aggaagtggt aatctaaacc ccactttctt 2700
aactttgcag gctattgagg gtacctacat agacaagaaa tgccccttca ctggtaacgt 2760
ctccatccga ggtcggatcc tgtctggtga gtgggatgtt ggaagggtgg ttctaggttc 2820
ctgcgtccag gggcgctggc aagtgatgtc tgttctcacg atggtcttca gatgtcctct 2880
agggcactgc tgagacagcc agttgacaaa gctgatgcca taaatggagc ttcttgggag 2940
ccccgttcaa ctgactccta cctgctaaca cctttctgtt actctcccag gtgtcgtgac 3000
gaagatgaag atgcagagga ccattgtcat ccaagggcg 3039
<210>3
<211>22
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>3
gtagtttctg acttggaaat gt 22
<210>4
<211>21
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>4
aactgacctg ccatgccatt c 21
<210>5
<211>19
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>5
gagcagtccg gtgtcacta 19
<210>6
<211>21
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>6
gcagagaagc agacagttat g 21
<210>7
<211>21
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>7
cagagcatca agtacctgtg a 21
<210>8
<211>21
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>8
taaccactaa gccatctctc c 21
<210>9
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>9
caagaacaag gaagctggcc 20
<210>10
<211>22
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>10
taaaacccac agcactgtag gg 22
<210>11
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>11
aagactgttt gcctcatgcc 20
<210>12
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>12
ggatgacaat ggtcctctgc 20
<210>13
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>13
gtggttgtag gttcacgtcc 20
<210>14
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>14
atccctcaca ttgccaagcc 20
<210>15
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>15
acttaagacc tgatgcctcc 20
<210>16
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>16
gctagcttac ataggcagcc 20
<210>17
<211>8691
<212>DNA
<213>Artificial
<220>
<223>Vector pRPS3 1005 EGFP
<400>17
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60
gggccccccc tcgaagttta aacatttaaa tctagtaacg gccgccagtg tgctggaatt 120
cgcccttata accactgagc catctctcca gccctgagtc atgattttag tgtgagaggc 180
atcattgaat tttctgagca cggccatcag ggtagctggc acaggtcttc agatacaagg 240
agatagttat aagaaggcag ccatggctgt ggtgcactag aaatggagaa acagcttcat 300
caggtgacag accagtctga ctctgtccca tgattagaag ccatcttgtt acaaggtcaa 360
aataagttca ttcctgtttt ctgtaacact tgggtttgat cctgtcgtca acccattttc 420
tggaatttga catgttccat actccattat accctgactt ccaccctgat aagatgttct 480
gccaagttcc tgtgtagcca acattcccct ggaaatctct cttcccttgg aaaccaccta 540
gtcttagaaa ttttgagtta tataaattcc acttctatgt ttgatgctat tctttaaaac 600
tccactttag ggagatagcc ctgtctgata gaaaataaaa cttgcttaat ttgtctaaaa 660
gagtttaagt aatagttttt acttttgttc cgtgggatta atacagggtg aaacagactc 720
ccgtgtttcc agtgtgaagt gagccacaca ctgcagtaca agttatatca gcaggttctg 780
cctctgggca atgaactttt gcttgtgtgg acatcagggt ctgtgtgaag ggaaggtcct 840
atggcctaga tttatactat tcaacagtct gtccccgaag ccctggtgct ttattatttt 900
gacaagcccc tgctgctggt attccaccct gctgcgagtc aaaaaagttc ctgtctcgga 960
aaaacaaaac aaaacaaaac aaccaaaaaa taaaattttt ttttcccaca ggttctagtg 1020
gaggtgctca ctaccagaaa tcctacaaat aagcccatct catggatcag ggtttacctt 1080
tgtaataata ttaaatctgt gtgcatgtgc gcacgcatgt gttttatgct tgcatatatg 1140
tatacgcagc catggttttc tactgtccca ctcactctgt aacttactga gccatccagc 1200
tggtcctcta aatacatttc aatgaaagtt ttcattagcg tgaacgtgaa ggtggtaaaa 1260
tctgttagtg tgtgcttatg cctgtggttt gcacctctag tctgaaggtt gctcttttca 1320
aattttttat ttatttacgt ttttactttt gagtcagaaa ctcataaagg ccaagctggc 1380
ctcgaattcg ctatgtagtc aatgatgacc ttaaacttgt gaccctctac ttcgttagtg 1440
ctggaacccc aagcttgctg agtacagagc actttcagac cggaactaga tgtctacttc 1500
ctgttccgcc tacattacag gttgctaggt tacacccccc ctacgccgtt ttagacgcaa 1560
aacttcattt cccatgcaaa acttcatttc ccatgaacac ttgcaagggt cgccgcgctg 1620
cgcggcgtca ttgctcccgc cctatatacc tacttccgcc cgcgagccac ttcctttcct 1680
ttcagcggcg cgcggctgca agatggcggt gcagatttcc aagaagagga aggtaagcgt 1740
ctgggcccgg ttcgggagtc cgccgcgggt tctacaagtg ccagggaggc ctgtggctcc 1800
gtgatcagtc ctgtggagcg tctggggccg cctgccgtct cttcgagcct cggatggccg 1860
tagattgtgt attgggccgg agccgggcga gtgctgtgtg cctgggcaag ggagggacaa 1920
actcctcgag ttctggaccg actcgaacac cgggcgcctc cagttccgga ctagacacct 1980
ttgagcgttt cttggtctcc ataatagtaa tcctgtggca cagttagagg gcgtgtgcca 2040
tcagatctag tccagtttct ttagtaagtg aagtttagca gtcccttctc ttagtcgcgt 2100
gatcctgcaa gtggccatag ttgaaagcct acttactgac tgctgccgtg ttcactcggg 2160
acccggagct gcagcgtccc tgtggttatc atttcatggg ggaaaagtgt gcaggttgcc 2220
aggtttagaa atagatggtc tgtcgtttgt gcttatgcac acagatgata aacctgtttt 2280
gagtcaggat tcctctccta tccgaggtac aacttacagt cccagctgta catgtgctac 2340
ttggagacag atttttcttt gtctcttggg tgtagattat gccgtagagc ccttcgatga 2400
agaggtgatg acgagtctga gtaggaagtg ttgtctttgt ccaagatgcc tcactatgct 2460
gcgttctgtg gcacagctga aagcactgtg gtcaaaagaa acttcctaaa gatgaccaag 2520
aggcatttgt ctgagaaggg ttgctgcttt tctgtagggc cattgggctt gctctgacta 2580
accctgtctt cacctcagag gtaacttgtt tcctttggtt cagtttgtag ctgatggcat 2640
cttcaaagct gagctgaatg aatttctcac tcgggagctg gctgaagatg gctactctgg 2700
agttgaagtc cgagttacac caaccaggac agaaatcatt attttagcca ccaggtagaa 2760
ataccattga ttgtcacctg taaatactgt gtgtactgag atgctgtgta aacttgggcc 2820
aaccaagcag taaatctggc ctcagtgggt gtaactgctt tgttagaact gcatttggga 2880
agaacttacc ttccatttaa cgtgtgtgct ggcgttgtgg tgggcggcag gtgggatctt 2940
gagtaaatgg ttgcgcttcc cctctacagg acacagaatg ttcttgggga gaagggtcgt 3000
cggatcagag agttgaccgc agttgtccag aagcgctttg gcttccctga aggcagcgta 3060
gaggtgagtt cctctgcttt atctcccggg ggttttagac tgagttggga tgtggcttct 3120
gctatagaat tgtacttctg aaaacctgac atggccagtg acagtcacag gtacttgatg 3180
ctctgagggc gaattctgca gatatccatc acactggcgg ccgctcgagc atgcatctag 3240
aagcttatcg ataccggtgg cgcgccaatt gaattaagat ctggcccaat gggccgtacg 3300
aattcgagct cggtacccgg ggatcctgat ctaatagtaa tcaattacgg ggtcattagt 3360
tcatagccca tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg 3420
accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc 3480
aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc 3540
agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg 3600
gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat 3660
ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg 3720
tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag 3780
tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt 3840
gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctggtttagt 3900
gaaccgtcag atccgtcgcc accatggtga gcaagggcga ggagctgttc accggggtgg 3960
tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg 4020
agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gttcatctgc accaccggca 4080
agctgcccgt gccctggccc accctcgtga ccaccctgac ctacggcgtg cagtgcttca 4140
gccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct 4200
acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg 4260
tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg 4320
aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata 4380
tcatggccga caagcagaag aacggcatca aggtgaactt caagatccgc cacaacatcg 4440
aggacggcag cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc 4500
ccgtgctgct gcccgacaac cactacctga gcacccagtc cgccctgagc aaagacccca 4560
acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg 4620
gcatggacga gctgtacaag taaagcggcc gcgactctag atcataatca gccataccac 4680
atttgtagag gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca 4740
taaaatgaat gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata 4800
aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg 4860
tttgtccaaa ctcatcaatg tatcttaact agagtcgacc tgcaggcatg caagcttacc 4920
ggtggcgcgc gcgccaattg ttaattaaga tctggcccaa tgggccgtac gaattcctta 4980
ggctaccggg taggggaggc gcttttccca aggcagtctg gagcatgcgc tttagcagcc 5040
ccgctgggca cttggcgcta cacaagtggc ctctggcctc gcacacattc cacatccacc 5100
ggccggtagg cgccaaccgg ctccgttctt tggtggcccc ttcgcgccac cttctactcc 5160
tcccctagtc aggaagttcc cccccgcccc gcagctcgcg tcgtgcagga cgtgacaaat 5220
ggaagtagca cgtctcacta gtctcgtgca gatggacagc accgctgagc aatggaagcg 5280
ggtaggcctt tggggcagcg gccaatagca gctttgctcc ttcgctttct gggctcagag 5340
gctgggaagg ggtgggtccg ggggcgggct caggggcggg ctcaggggcg gggcgggcgc 5400
ccgaaggtcc tccggaggcc cggcattctg cacgcttcaa aagcgcacgt ctgccgcgct 5460
gttctcctct tcctcatctc cgggcctttc gaccagctta ccatgaccga gtacaagccc 5520
acggtgcgcc tcgccacccg cgacgacgtc cccagggccg tacgcaccct cgccgccgcg 5580
ttcgccgact accccgccac gcgccacacc gtcgatccgg accgccacat cgagcgggtc 5640
accgagctgc aagaactctt cctcacgcgc gtcgggctcg acatcggcaa ggtgtgggtc 5700
gcggacgacg gcgccgcggt ggcggtctgg accacgccgg agagcgtcga agcgggggcg 5760
gtgttcgccg agatcggccc gcgcatggcc gagttgagcg gttcccggct ggccgcgcag 5820
caacagatgg aaggcctcct ggcgccgcac cggcccaagg agcccgcgtg gttcctggcc 5880
accgtcggcg tctcgcccga ccaccagggc aagggtctgg gcagcgccgt cgtgctcccc 5940
ggagtggagg cggccgagcg cgccggggtg cccgccttcc tggagacctc cgcgccccgc 6000
aacctcccct tctacgagcg gctcggcttc accgtcaccg ccgacgtcga ggtgcccgaa 6060
ggaccgcgca cctggtgcat gacccgcaag cccggtgcct gacgcccgcc ccacgacccg 6120
cagcgcccga ccgaaaggag cgcacgaccc catgcatcgt agacgaaatg accgaccaag 6180
cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg 6240
gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc 6300
tggagttctt cgcccaccct agggggaggc taactgaaac acggaaggag acaataccgg 6360
aaggaacccg cgctatgacg gcaataaaaa gacagaataa aacgcacggt gttgggtcgt 6420
ttgttcataa acgcggggtt cggtcccagg gctggcactc tgtcgatacc ccaccgagac 6480
cccattgggg ccaatacgcc cgcgtttctt ccttttcccc accccacccc ccaagttcgg 6540
gtgaaggccc agggctcgca gccaacgtcg gggcggcagg cccccagctt ttgttccctt 6600
tagtgagggt taatttcgag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 6660
tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 6720
ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 6780
tcgggaaacc tgtcgtgcca gcatcgcgag cacttttcgg ggaaatgtgc gcggaacccc 6840
tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 6900
ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc 6960
ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 7020
gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 7080
caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 7140
ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact 7200
cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 7260
gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 7320
taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 7380
tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 7440
agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg 7500
caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 7560
ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 7620
tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc 7680
agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 7740
tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 7800
agactcgcga cactgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt 7860
gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga 7920
gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 7980
ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 8040
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 8100
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 8160
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 8220
tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 8280
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 8340
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 8400
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 8460
tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag 8520
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 8580
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 8640
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc a 8691
<210>18
<211>13827
<212>DNA
<213>Artificial
<220>
<223>Vector pCET 1015 EGFP
<400>18
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60
gggccccccc tcgaagttta aacatttaaa tctagaagct tcaatgtttt tagcaccctc 120
tgtgtggagg aaaataatgc agattattct aattagtgta atatctaacc acattaaaat 180
atattacata gtaaactaca ctccataatt ttataaattt gactccccag ggtaataaac 240
tagtctctag tctgctcacc ttcaactgta caataaagtc ttggttcttt tgaaatagac 300
ctcaaatgag acacctaaaa ttcaaagtgt ctttacattt aaagacacct acaggaaagc 360
aggtaaaaga gccaggttaa aaacaaattc taaaaccact tagctgcagt taaacatata 420
gtaaagatgc actaaagttt cttactctgt aaatcccttc cacttcagga aatattccac 480
tttcccattc actacacgtc gatctagtac tttttccacg acaaattctt caggctctgc 540
ctcttcaact tttttactct ttccattctg tttttttccc attttttgct aaaataaaac 600
aaaagagaaa ttaagaaata ttcctcttga attttgagca cattttcaag gctcaattgc 660
ttatattatt atcacattcg acataaattt ttacttctat atcccagggc agacaccttc 720
tggaaagatt aaaagtcaac agacaataaa ataaaagaat gctttatctt gttcatttag 780
ttcaaactta caacccacca ccaaaataat acaataaaaa aacactatct ggaaacagtt 840
atttttttcc agtctttttt tttgagacag ggtctcacac tcttgtcgcc caggctggag 900
tgcagtggcg tgatctcagc tcactgcaac ctccgcctcc ccaggttcaa gcagttctca 960
tgcctcagcc tccagagtag ctgggattat aggcggatgc caccatgccg ggctaatttt 1020
ttttgtgttt ttattagaaa cagggtttca ccatgttgac caggctggtc tcaaactcct 1080
gacctgaagt gattcaccag cctgggcctc ccaaagtgct ggcattacag gcgtgagcca 1140
ctgcgcccgg ccctgtagtc ttaaaagacc aagtttacta attttcactc attttaacaa 1200
cactgcaaca aacaactatg caggaagtac ctaaagggtg atccagagaa gcaagtagta 1260
gtgacaggtc ttaggtgaac ctatgacaga ccttgtatcc acccccagat ggtaaaagcc 1320
ccagccccct tctcaattca aatattaatg tcaaaagcat caatgataca gagaaaagat 1380
aaatgcagaa tgaaaacatg gttcaaaatc ctgataccaa ctgcagggtc aactatagag 1440
accactagga ggttcaatta aaggacaaga ttatttttcc ataatctctg tagataatat 1500
ttcctaccac ttagaacaaa actataaagc tatcacttca agagaccaac attacaaatt 1560
tattttaatt ccctaaggtg aaaaaaatcc ttccttcctg gtttctcaag agaaagtcta 1620
tactggtaac caaattcact ttaaacaggc attttctttg gtatgacact atttaagaga 1680
agcaggaaac caacgtgaac cagctctttc caatggctca agatttccta tgagaggact 1740
aaaaatgggg aaaattttta tgagaggatt aaaaatgggg gaaaaaaaac cctgaaatgg 1800
ttaatcagaa gatcctatgg gctgagaagg aatccatctt aacatttcat cttaaagcaa 1860
atgctattgc cgggggcagt ggctcatgcc tgtaatccca gcactttggg aggccgaggt 1920
gggcagatca tctgaggtca ggagtttgag accagcctga ccaacatgga gaaaccccgt 1980
ttctactaaa aatacaaaat tagccaggca tagtggtgca tgcctgtaat cccagctact 2040
tgggaggctg aggcaggaga actgcttgaa cccaggaggc ttaagttgcg gtgagccaag 2100
atcacgccat tgcactctag cctggacaac aagagaaaaa ctctgtctca aaaaaacaca 2160
aaaacaaaaa acccaaatac tatttaaaaa agataaacct taattgctca atcattaaag 2220
ccatcccaca agtaaagcag caagcagaaa aaagttaaga acacctcaag gctacagaag 2280
gacatttcaa gctatgcagg catatgaagt gtgcagacag atatgtaaga aaggcctcaa 2340
gactgcaaaa gggcatttca agctatgcaa gcatataggt aacacataca cacacacaaa 2400
ataaaatccc ctgaaataca aaaacatgca gcaaacacct gacgtttttg gataccattt 2460
ctaagtcagg tgttatgatt ctcattagtc aagatacttg agtactgggc ccaaacagct 2520
ttctgccact gtacagtaca agaaggtagg aataatggtg ggaggagcaa agacaaactg 2580
taatagacag aagtgtatca gatacctata ctacatgaaa aacaaaacag ctactgccac 2640
aaagggagaa ggctaacaaa ataaagtcaa caataaatac agaaaatgaa aaggatacac 2700
actaaggttt acaaaaaaaa aaaggcagac aaaatgccat acagtattca ttcactacta 2760
tggcattcat aagctagttt caaatgctca ctattttctt ttatagtata tatttgcctt 2820
aacccagcac ttttttccaa aagtggatga gtcaaaataa atttcccatt atttaagtga 2880
aattaacagc acacatatct cacaacacta atgaattttt aaaatggaaa gttaagaact 2940
tttaaagtgg ccaacctgtg atccttcaca aaataaacta aatacaataa cagaccccaa 3000
aggctatcaa ttgcgtgcaa aaacaacttc tgttttccag ggtaaacaga atctaatgca 3060
gaatctaatg cagggtaaac agacttaatg cagaatctaa tgatggcaca aattaaaaat 3120
cactaacgtg ccctttttag tgtgaaaccc agagagagca catacaagcc aaaaacaaat 3180
gctttatttt acctaggaga cattaacatt cacctttacg tgtttaagat taatgcaatg 3240
ttaaatattg tgaaaactgt aactttgaat ttcatgattt ttatgtgaat attccagggt 3300
ttaaaaaaac ttgtaacatg acatggctga ataagataaa aaaaaaatct agccttttct 3360
cccttctggc tcatatttgc gatttcgatc attttgttta aaaaacaaaa cactgcaatg 3420
aattaaactt aatattcttc tatgttttag agtaagttaa aacaagataa agtgaccaaa 3480
gtaatttgaa agattcaatg acttttgctc caacctaggt gcacaaggta ccttgttctt 3540
taaattgggc tttaatgaaa atacttctcc agaattctgg ggatttaaga aaaattatgc 3600
caaccaacaa gggctttacc attttatgta acatttttca acgctgcaaa aatgtgtgta 3660
tttctatttg aagataaaaa tcctcagcaa aatccacatt gcactgtcct tcaaagatta 3720
gccttctttg aactagttaa gacactatta agccaagcca gtatctccct gtaatgaatt 3780
cgtttttctc ttaattttcc cctgtaattt acactgggag agctgggaaa tatgtggatg 3840
taaatttctc agccacagag atgcaaagtt atactgtggg gaaaaaaaac ttgagttaaa 3900
tccttacata ttttaggttt tcattaactt accaatgtag ttttgttgga ggccattttt 3960
tttattgcag acttgaagag ctattactag aaaaatgcat gacagttaag gtaagtttgc 4020
atgacacaaa aaaggtaact aaatacaaat tctgtttgga ttccaacccc caagtagaga 4080
gcgcacactt tcaaacgtga atacaaatcc agagtagatc tgcgctccta cctacattgc 4140
ttatgatgta cttaagtacg tgtcctaacc atgtgagtct agaaagactt tactggggat 4200
cctggtacct aaaacagctt cacatggctt aaaatagggg accaatgtct tttccaatct 4260
aagtcccatt tataataaag tccatgttcc atttttaaag gacaatcctt tcggtttaaa 4320
accaggcacg attacccaaa caactcacaa cggtaaagca ctgtgaatct tctctgttct 4380
gcaatcccaa cttggtttct gctcagaaac cctccctctt tccaatcggt aattaaataa 4440
caaaaggaaa aaacttaaga tgcttcaacc ccgtttcgtg acactttgaa aaaagaatca 4500
cctcttgcaa acacccgctc ccgacccccg ccgctgaagc ccggcgtcca gaggcctaag 4560
cgcgggtgcc cgcccccacc cgggagcgcg ggcctcgtgg tcagcgcatc cgcggggaga 4620
aacaaaggcc gcggcacggg ggctcaaggg cactgcgcca caccgcacgc gcctaccccc 4680
gcgcggccac gttaactggc ggtcgccgca gcctcgggac agccggccgc gcgccgccag 4740
gctcgcggac gcgggaccac gcgccgccct ccgggaggcc caagtctcga cccagccccg 4800
cgtggcgctg ggggaggggg cgcctccgcc ggaacgcggg tgggggaggg gagggggaaa 4860
tgcgctttgt ctcgaaatgg ggcaaccgtc gccacagctc cctaccccct cgagggcaga 4920
gcagtccccc cactaactac cgggctggcc gcgcgccagg ccagccgcga ggccaccgcc 4980
cgaccctcca ctccttcccg cagctcccgg cgcggggtcc ggcgagaagg ggaggggagg 5040
ggagcggaga accgggcccc cgggacgcgt gtggcatctg aagcaccacc agcgagcgag 5100
agctagagag aaggaaagcc accgacttca ccgcctccga gctgctccgg gtcgcgggtc 5160
tgcagcgtct ccggccctcc gcgcctacag ctcaagccac atccgaaggg ggagggagcc 5220
gggagctgcg cgcggggccg ccggggggag gggtggcacc gcccacgccg ggcggccacg 5280
aagggcgggg cagcgggcgc gcgcgcggcg gggggagggg ccggcgccgc gcccgctggg 5340
aattggggcc ctagggggag ggcggaggcg ccgacgaccg cggcacttac cgttcgcggc 5400
gtggcgcccg gtggtcccca aggggaggga agggggaggc ggggcgagga cagtgaccgg 5460
agtctcctca gcggtggctt ttctgcttgg cagcctcagc ggctggcgcc aaaaccggac 5520
tccgcccact tcctcgcccg ccggtgcgag ggtgtggaat cctccagacg ctgggggagg 5580
gggagttggg agcttaaaaa ctagtacccc tttgggacca ctttcagcag cgaactctcc 5640
tgtacaccag gggtcagttc cacagacgcg ggccaggggt gggtcattgc ggcgtgaaca 5700
ataatttgac tagaagttga ttcgggtgtt tccggaaggg gccgagtcaa tccgccgagt 5760
tggggcacgg aaaacaaaaa gggaaggcta ctaagatttt tctggcgggg gttatcattg 5820
gcgtaactgc agggaccacc tcccgggttg agggggctgg atctccaggc tgcggattaa 5880
gcccctcccg tcggcgttaa tttcaaactg cgcgacgttt ctcacctgcc ttcgccaagg 5940
caggggccgg gaccctattc caagaggtag taactagcag gactctagcc ttccgcaatt 6000
cattgagcgc atttacggaa gtaacgtcgg gtactgtctc tggccgcaag ggtgggagga 6060
gtacgcattt ggcgtaaggt ggggcgtaga gccttcccgc cattggcggc ggatagggcg 6120
tttacgcgac ggcctgacgt agcggaagac gcgttagtgg gggggaaggt tctagaaaag 6180
cggcggcagc ggctctagcg gcagtagcag cagcgccggg tcccgtgcgg aggtgctcct 6240
cgcagagttg tttctcgagc agcggcagtt ctcactacag cgccaggacg agtccggttc 6300
gtgttcgtcc gcggagatct ctctcatctc gctcggctgc gggaaatcgg gctgaagcga 6360
ctgagtccgc gatggaggta acgggtttga aatcaatgag ttattgaaaa gggcatggcg 6420
aggccgttgg cgcctcagtg gaagtcggcc agccgcctcc gtgggagaga ggcaggaaat 6480
cggaccaatt cagtagcagt ggggcttaag gtttatgaac ggggtcttga gcggaggcct 6540
gagcgtacaa acagcttccc caccctcagc ctcccggcgc catttccctt cactgggggt 6600
gggggatggg gagctttcac atggcggacg ctgccccgct ggggtgaaag tggggcgcgg 6660
aggcgggaat tcttattccc tttctaaagc acgctgcttc gggggccacg gcgtctcctc 6720
ggcgagcgtt tcggcgggca gcaggtcctc gtgagcgagg ctgcggagct tcccctcccc 6780
ctctctcccg ggaaccgatt tggcggccgc cattttcatg gctcgccttc ctctcagcgt 6840
tttccttata actcttttat tttcttagtg tgctttctct atcaagaagt agaagtggtt 6900
aactattttt tttttcttct cgggctgttt tcatatcgtt tcgaggtgga tttggagtgt 6960
tttgtgagc ttggatcttta gagtcctgcg cacctcatta aaggcgctca gccttcccct 7020
cgatgaaatg gcgccattgc gttcggaagc cacaccgaag agcggggagg gggggtgctc 7080
cgggtttgcg ggcccggttt cagagaagat atcaccaccc agggcgtcgg gccgggttca 7140
atgcgagccg taggacaaag aaaccatttt atgtttttcc tgtctttttt ttcctttgag 7200
taacggtttt atctgggtct gcagtcagta aaacgacaga tgaaccgcgg caaaataaac 7260
ataaattgga agccatcggc cacgaggggc agggacgaag gtggttttct gggcggggga 7320
gggatattcg cgtcagaatc ctttactgtt cttaaggatt ccgtttaagt tgtagagctg 7380
actcatttta agtaatgttg ttactgagaa gtttaaccct tacgggacag atccatggac 7440
ctttatagat gattacgagg aaagtgaaat aacgattttg tccttagtta tacttcgatt 7500
aaaacatggc ttcagaggct ccttcctgta atgcgtatgg attgatgtgc aaaactgttt 7560
tgggcctggg ccgctctgta tttgaacttt gttacttttc tcattttgtt tgcaatcttg 7620
gttgaacatt acattgataa gcataaggtc tcaagcgaag ggggtctacc tggttatttt 7680
tctttgaccc taagcacgtt tataaaataa cattgtttaa aatcgatagt ggacatcggg 7740
taagtttgga taaattgtga ggtaagtaat gagtttttgc tttttgttag tgatttgtaa 7800
aacttgttat aaatgtacat tatccgtaat ttcagtttag agataaccta tgtgctgacg 7860
acaattaaga ataaaaacta gctgaaaaaa tgaaaataac tatcgtgaca agtaaccatt 7920
tcaaaagact gctttgtgtc tcataggagc tagtttgatc atttcagtta attttttctt 7980
taatttttac gagtcatgaa aactacagga aaaaaaatct gaactgggtt ttaccactac 8040
tttttaggag ttgggagcat gcgaatggag ggagagctcc gtagaactgg gatgagagca 8100
gcaattaatg ctgcttgcta ggaacaaaaa ataattgatt gaaaattacg tgtgactttt 8160
tagtttgcat tatgcgtttg tagcagttgg tcctggatat cactttctct cgtttgaggt 8220
tttttaacct agttaacttt taagacaggt ttccttaaca ttcataagtg cccagaatac 8280
agctgtgtag tacagcatat aaagatttca gctctgaggt ttttcctatt gacttggaaa 8340
attgttttgt gcctgtcgct tgccacatgg ccaatcaagt aagcttatcg ataccggtgg 8400
cgcgccaatt gaattaagat ctggcccaat gggccgtacg aattcgagct cggtacccgg 8460
ggatcctgat ctaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 8520
tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 8580
cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 8640
gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 8700
tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 8760
agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 8820
ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac 8880
ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 8940
aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc 9000
gtgtacggtg ggaggtctat ataagcagag ctggtttagt gaaccgtcag atccgtcgcc 9060
accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct ggtcgagctg 9120
gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg cgatgccacc 9180
tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt gccctggccc 9240
accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc cgaccacatg 9300
aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga gcgcaccatc 9360
ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga gggcgacacc 9420
ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa catcctgggg 9480
cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga caagcagaag 9540
aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag cgtgcagctc 9600
gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct gcccgacaac 9660
cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg cgatcacatg 9720
gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga gctgtacaag 9780
taaagcggcc gcgactctag atcataatca gccataccac atttgtagag gttttacttg 9840
ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg 9900
ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 9960
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 10020
tatcttaact agagtcgacc tgcaggcatg caagcttacc ggtggcgcgc caattgttaa 10080
ttaagatctg gcccaatggg ccgtacgaat tccttaggct accgggtagg ggaggcgctt 10140
ttcccaaggc agtctggagc atgcgcttta gcagccccgc tgggcacttg gcgctacaca 10200
agtggcctct ggcctcgcac acattccaca tccaccggcc ggtaggcgcc aaccggctcc 10260
gttctttggt ggccccttcg cgccaccttc tactcctccc ctagtcagga agttcccccc 10320
cgccccgcag ctcgcgtcgt gcaggacgtg acaaatggaa gtagcacgtc tcactagtct 10380
cgtgcagatg gacagcaccg ctgagcaatg gaagcgggta ggcctttggg gcagcggcca 10440
atagcagctt tgctccttcg ctttctgggc tcagaggctg ggaaggggtg ggtccggggg 10500
cgggctcagg ggcgggctca ggggcggggc gggcgcccga aggtcctccg gaggcccggc 10560
attctgcacg cttcaaaagc gcacgtctgc cgcgctgttc tcctcttcct catctccggg 10620
cctttcgacc agcttaccat gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac 10680
gacgtcccca gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc 10740
cacaccgtcg atccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc 10800
acgcgcgtcg ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg 10860
gtctggacca cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc 10920
atggccgagt tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg 10980
ccgcaccggc ccaaggagcc cgcgtggttc ctggccaccg tcggcgtctc gcccgaccac 11040
cagggcaagg gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc 11100
ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc 11160
ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc 11220
cgcaagcccg gtgcctgacg cccgccccac gacccgcagc gcccgaccga aaggagcgca 11280
cgaccccatg catcgtagac gaaatgaccg accaagcgac gcccaacctg ccatcacgag 11340
atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg 11400
ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccctaggg 11460
ggaggctaac tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa 11520
taaaaagaca gaataaaacg cacggtgttg ggtcgtttgt tcataaacgc ggggttcggt 11580
cccagggctg gcactctgtc gataccccac cgagacccca ttggggccaa tacgcccgcg 11640
tttcttcctt ttccccaccc caccccccaa gttcgggtga aggcccaggg ctcgcagcca 11700
acgtcggggc ggcaggcccc cagcttttgt tccctttagt gagggttaat ttcgagcttg 11760
gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac 11820
aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc 11880
acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagcat 11940
cgcgagcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 12000
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 12060
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 12120
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 12180
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 12240
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 12300
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 12360
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 12420
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 12480
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 12540
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 12600
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 12660
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 12720
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 12780
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 12840
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 12900
gataggtgcc tcactgatta agcattggta actgtcagac tcgcgacact gcattaatga 12960
atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 13020
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 13080
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 13140
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 13200
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 13260
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 13320
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 13380
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 13440
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 13500
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 13560
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 13620
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 13680
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 13740
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 13800
tctgacgctc agtggaacga aaactca 13827
<210>19
<211>8585
<212>DNA
<213>Artificial
<220>
<223>Vector pRPS11 1005 EGFP
<400>19
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60
gggccccccc tcgaagttta attcgccctt aagactgttt gcctcatgcc tgcctggcct 120
gcccttcctc cgccgccaac tagggaagtg gggaccaaag gttccttagg cactgctcct 180
gtgggtagag gggacattag agagctgaca gcgcaccacc tgcatgagtt tttattaaag 240
tgcaaaccat gggatgaatc agttgagctt cagtgttgaa aatgagtagc agggctgccc 300
cacccacctg accaagtacc ctattctgca gctatgaaaa tgagatctgc acatgagctg 360
gggttcacaa gtgcacactt ggagcactgc cttgctcctt cccagcagac cacaaagcag 420
tatttttctg gaggatttta tgtgctaata aattatttga cttaagtgtg tacgatgtgt 480
gctgtgcaga gaggggcaga gggcaccagc aggtcatctg catggggggc ccctttgggt 540
gaatccttgc tcacgggata ggctttgttg ctcaaaagtt gcagatatac atcttgggtc 600
ctgtcctaga tggtgttact gtaagtcagc accaagatac aagagctggt acctggactg 660
taggaggtca ggccatgaca caaaggctgg gactaaaggc atttaccacg cctgagtctt 720
ctggttcttt aaacatcaaa tccttccggg ggctggcgag atggctcagt ggttaagagc 780
acagactgct cttacgaagg atccgagttc aaatcccagc aaccaaatgg tgcctaacaa 840
ctatccataa tgaaatctga tgccctcttc tggagtatct gagaacagct acagtgtact 900
tacatataat cttaaaaatg cttcccatgt taaccaccac tagagttttt attacagcta 960
gctgacctgg aagccaagtc cttatgcctc cgtgagtgct ggggttaaaa agatccagca 1020
ccactcaaaa tgtcaatcta ttttgaaaat atgctttata ctgttctagc ccatctgtgc 1080
agggctagaa cggtgaatac gagaaactga cacaagcttt tgccacctgg ctaaatggtt 1140
cctctattac ctggggtggt cacctaaggt tagacactca tccacgagta gtcaggacat 1200
aaacccatca aagtgtgggt agacgcgcag cctgagatac tgtcaacaaa ggacatgcga 1260
ccttggtgac gtcggccttt aataaaagga agaaaggttg actattcggt cgacgctggc 1320
tgctcctgac atcgtatggc agatactctg ctgtaaagcg gttcacccct ttcttgagac 1380
ccgctctgca cggccgcttc tctctggaaa ctgaatccca gcacgtgttt cccaacccgt 1440
acggcacgcc ttctccgccc taagcctcgc cgtaccacat gatgcacgtt tcctccacat 1500
cgtgctcctg aaatctcgcg agatgatagg atcttcccgc cccttagtcc tcccccgtca 1560
tggcggcgta cggacagtcc caggaacgcg ggctctcgcc ggaagtacct cccacctccg 1620
tgaggataac cccgcgtcac ttccgccccg acctcgcgtg gtgaataagg aagccgggag 1680
cggccctgcc tctccctttc tccggcggcc gggaagatgg cggacattca ggttcgagcg 1740
tttagttgct ttcccccgac gcttcggtgt ggagcgtatc ccttggcgtc ctcgttgtct 1800
tacgcattag ctgaagcgag gatgcctgcg aatgccttcg tctcaggcgg ctcggaaatc 1860
cgggctctac gcagtaatgg ggtccctggc gcttcgggag ttggttctta aagctcagag 1920
cttaacgggt gagggattgt ggcgggagga gggcatcctg cggcgcggga gtcctgcggc 1980
ggcagagccg gggacactgg gtaaagcagg ttttttcccc ttgatggaga ctgaggcccg 2040
gacctcgtgc gctctacggc agggctgcgg tcccgacctc gctgtagttt tcagtgtgag 2100
cgcagctctg gcctcgatga gcttaggctt gtcttaaact tgccatcctg cctcaacctc 2160
aaccgggatg acagatccgg cccaccaggc tcggctacgt ggacataagc ttgaatcccg 2220
aatgagtgga tttgtatgtt ttggaggtcc agtctggctg aaaagctctt tttgatctca 2280
gccgtgagtt ctgcaggctg tggaggtgtt agatgggacg cagtgtgtga gctaaactag 2340
acttggggtg gttggagagc cctgaccagc cggttttggc gattggggca aataaggttg 2400
aaggtaggaa ggaagaaata ttgtctctga tttccttgaa ctttacctgc aacctcacca 2460
aattctcatc cctacagacg gagcgtgctt accaaaagca gcctacgatc tttcaaaaca 2520
agaagcgggt tctgctggga gaaaccggca aggaaaaact ccctcggtac tacaagaata 2580
tcggtctagg cttcaagacg cctaaagagg tacaggaccc tccagcagat gagatccctg 2640
ctgccctgca cgtgtgggag cacagccacc ccgccccctt cacagtggct tcccatgggc 2700
ccctgggaat tgtagtatgg gccctgaggc gtcatccttg gttctgttta ggaagtggta 2760
atctaaaccc cactttctta actttgcagg ctattgaggg tacctacata gacaagaaat 2820
gccccttcac tggtaacgtc tccatccgag gtcggatcct gtctggtgag tgggatgttg 2880
gaagggtggt tctaggttcc tgcgtccagg ggcgctggca agtgatgtct gttctcacga 2940
tggtcttcag atgtcctcta gggcactgct gagacagcca gttgacaaag ctgatgccat 3000
aaatggagct tcttgggagc cccgttcaac tgactcctac ctgctaacac ctttctgtta 3060
ctctcccagg tgtcgtgacg aagatgaaga tgcagaggac cattgtcatc caagggcgaa 3120
acatttaaat ctagaagctt atcgataccg gtggcgcgcc aattgaatta agatctggcc 3180
caatgggccg tacgaattcg agctcggtac ccggggatcc tgatctaata gtaatcaatt 3240
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 3300
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 3360
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 3420
actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 3480
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 3540
acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag 3600
tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt 3660
gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac 3720
aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataagc 3780
agagctggtt tagtgaaccg tcagatccgt cgccaccatg gtgagcaagg gcgaggagct 3840
gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 3900
cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat 3960
ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg 4020
cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc 4080
catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 4140
gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 4200
catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 4260
ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat 4320
ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc 4380
catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct 4440
gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 4500
cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccgcgact ctagatcata 4560
atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 4620
ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 4680
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 4740
cattctagtt gtggtttgtc caaactcatc aatgtatctt aactagagtc gacctgcagg 4800
catgcaagct taccggtggc gcgcgcgcca attgttaatt aagatctggc ccaatgggcc 4860
gtacgaattc cttaggctac cgggtagggg aggcgctttt cccaaggcag tctggagcat 4920
gcgctttagc agccccgctg ggcacttggc gctacacaag tggcctctgg cctcgcacac 4980
attccacatc caccggccgg taggcgccaa ccggctccgt tctttggtgg ccccttcgcg 5040
ccaccttcta ctcctcccct agtcaggaag ttcccccccg ccccgcagct cgcgtcgtgc 5100
aggacgtgac aaatggaagt agcacgtctc actagtctcg tgcagatgga cagcaccgct 5160
gagcaatgga agcgggtagg cctttggggc agcggccaat agcagctttg ctccttcgct 5220
ttctgggctc agaggctggg aaggggtggg tccgggggcg ggctcagggg cgggctcagg 5280
ggcggggcgg gcgcccgaag gtcctccgga ggcccggcat tctgcacgct tcaaaagcgc 5340
acgtctgccg cgctgttctc ctcttcctca tctccgggcc tttcgaccag cttaccatga 5400
ccgagtacaa gcccacggtg cgcctcgcca cccgcgacga cgtccccagg gccgtacgca 5460
ccctcgccgc cgcgttcgcc gactaccccg ccacgcgcca caccgtcgat ccggaccgcc 5520
acatcgagcg ggtcaccgag ctgcaagaac tcttcctcac gcgcgtcggg ctcgacatcg 5580
gcaaggtgtg ggtcgcggac gacggcgccg cggtggcggt ctggaccacg ccggagagcg 5640
tcgaagcggg ggcggtgttc gccgagatcg gcccgcgcat ggccgagttg agcggttccc 5700
ggctggccgc gcagcaacag atggaaggcc tcctggcgcc gcaccggccc aaggagcccg 5760
cgtggttcct ggccaccgtc ggcgtctcgc ccgaccacca gggcaagggt ctgggcagcg 5820
ccgtcgtgct ccccggagtg gaggcggccg agcgcgccgg ggtgcccgcc ttcctggaga 5880
cctccgcgcc ccgcaacctc cccttctacg agcggctcgg cttcaccgtc accgccgacg 5940
tcgaggtgcc cgaaggaccg cgcacctggt gcatgacccg caagcccggt gcctgacgcc 6000
cgccccacga cccgcagcgc ccgaccgaaa ggagcgcacg accccatgca tcgtagacga 6060
aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca ccgccgcctt 6120
ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga tcctccagcg 6180
cggggatctc atgctggagt tcttcgccca ccctaggggg aggctaactg aaacacggaa 6240
ggagacaata ccggaaggaa cccgcgctat gacggcaata aaaagacaga ataaaacgca 6300
cggtgttggg tcgtttgttc ataaacgcgg ggttcggtcc cagggctggc actctgtcga 6360
taccccaccg agaccccatt ggggccaata cgcccgcgtt tcttcctttt ccccacccca 6420
ccccccaagt tcgggtgaag gcccagggct cgcagccaac gtcggggcgg caggccccca 6480
gcttttgttc cctttagtga gggttaattt cgagcttggc gtaatcatgg tcatagctgt 6540
ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 6600
agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 6660
tgcccgcttt ccagtcggga aacctgtcgt gccagcatcg cgagcacttt tcggggaaat 6720
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 6780
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 6840
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 6900
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 6960
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 7020
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 7080
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 7140
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 7200
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 7260
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 7320
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 7380
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 7440
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 7500
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 7560
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 7620
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 7680
cattggtaac tgtcagactc gcgacactgc attaatgaat cggccaacgc gcggggagag 7740
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 7800
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 7860
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 7920
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 7980
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 8040
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 8100
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 8160
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 8220
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 8280
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 8340
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 8400
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 8460
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 8520
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 8580
actca 8585
<210>20
<211>5546
<212>DNA
<213>Artificial
<220>
<223>Vector pCET 1005 EGFP
<400>20
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60
gggccccccc tcgaagttta aacatttaaa tctagaagct tatcgatacc ggtggcgcgc 120
caattgaatt aagatctggc ccaatgggcc gtacgaattc gagctcggta cccggggatc 180
ctgatctaat agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc 240
gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg 300
acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa 360
tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca 420
agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac 480
atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc 540
atggtgatgc ggttttggca gtacatcaat gggcgtggat agcggtttga ctcacgggga 600
tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg 660
gactttccaa aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg taggcgtgta 720
cggtgggagg tctatataag cagagctggt ttagtgaacc gtcagatccg tcgccaccat 780
ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg 840
cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg 900
caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct 960
cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca 1020
gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt 1080
caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt 1140
gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa 1200
gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg 1260
catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga 1320
ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta 1380
cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct 1440
gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaaag 1500
cggccgcgac tctagatcat aatcagccat accacatttg tagaggtttt acttgcttta 1560
aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt 1620
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 1680
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 1740
taactagagt cgacctgcag gcatgcaagc ttaccggtgg cgcgcgcgcc aattgttaat 1800
taagatctgg cccaatgggc cgtacgaatt ccttaggcta ccgggtaggg gaggcgcttt 1860
tcccaaggca gtctggagca tgcgctttag cagccccgct gggcacttgg cgctacacaa 1920
gtggcctctg gcctcgcaca cattccacat ccaccggccg gtaggcgcca accggctccg 1980
ttctttggtg gccccttcgc gccaccttct actcctcccc tagtcaggaa gttccccccc 2040
gccccgcagc tcgcgtcgtg caggacgtga caaatggaag tagcacgtct cactagtctc 2100
gtgcagatgg acagcaccgc tgagcaatgg aagcgggtag gcctttgggg cagcggccaa 2160
tagcagcttt gctccttcgc tttctgggct cagaggctgg gaaggggtgg gtccgggggc 2220
gggctcaggg gcgggctcag gggcggggcg ggcgcccgaa ggtcctccgg aggcccggca 2280
ttctgcacgc ttcaaaagcg cacgtctgcc gcgctgttct cctcttcctc atctccgggc 2340
ctttcgacca gcttaccatg accgagtaca agcccacggt gcgcctcgcc acccgcgacg 2400
acgtccccag ggccgtacgc accctcgccg ccgcgttcgc cgactacccc gccacgcgcc 2460
acaccgtcga tccggaccgc cacatcgagc gggtcaccga gctgcaagaa ctcttcctca 2520
cgcgcgtcgg gctcgacatc ggcaaggtgt gggtcgcgga cgacggcgcc gcggtggcgg 2580
tctggaccac gccggagagc gtcgaagcgg gggcggtgtt cgccgagatc ggcccgcgca 2640
tggccgagtt gagcggttcc cggctggccg cgcagcaaca gatggaaggc ctcctggcgc 2700
cgcaccggcc caaggagccc gcgtggttcc tggccaccgt cggcgtctcg cccgaccacc 2760
agggcaaggg tctgggcagc gccgtcgtgc tccccggagt ggaggcggcc gagcgcgccg 2820
gggtgcccgc cttcctggag acctccgcgc cccgcaacct ccccttctac gagcggctcg 2880
gcttcaccgt caccgccgac gtcgaggtgc ccgaaggacc gcgcacctgg tgcatgaccc 2940
gcaagcccgg tgcctgacgc ccgccccacg acccgcagcg cccgaccgaa aggagcgcac 3000
gaccccatgc atcgtagacg aaatgaccga ccaagcgacg cccaacctgc catcacgaga 3060
tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt tccgggacgc 3120
cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc accctagggg 3180
gaggctaact gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat 3240
aaaaagacag aataaaacgc acggtgttgg gtcgtttgtt cataaacgcg gggttcggtc 3300
ccagggctgg cactctgtcg ataccccacc gagaccccat tggggccaat acgcccgcgt 3360
ttcttccttt tccccacccc accccccaag ttcgggtgaa ggcccagggc tcgcagccaa 3420
cgtcggggcg gcaggccccc agcttttgtt ccctttagtg agggttaatt tcgagcttgg 3480
cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca 3540
acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca 3600
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagcatc 3660
gcgagcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat 3720
tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa 3780
aggaagagta tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt 3840
tgccttcctg tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag 3900
ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt 3960
tttcgccccg aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg 4020
gtattatccc gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag 4080
aatgacttgg ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta 4140
agagaattat gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg 4200
acaacgatcg gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta 4260
actcgccttg atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac 4320
accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt 4380
actctagctt cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca 4440
cttctgcgct cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag 4500
cgtgggtctc gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta 4560
gttatctaca cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag 4620
ataggtgcct cactgattaa gcattggtaa ctgtcagact cgcgacactg cattaatgaa 4680
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 4740
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 4800
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 4860
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 4920
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 4980
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5040
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5100
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5160
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5220
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 5280
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 5340
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 5400
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 5460
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 5520
ctgacgctca gtggaacgaa aactca 5546
Claims (27)
1.一种分离的多核苷酸,其包括
a)包含来自核糖体蛋白基因启动区的至少500个连续的核苷酸的元件,
b)异源启动子,以及
c)与所述异源启动子相邻的可转录核酸序列,其中可转录核酸序列由所述异源启动子转录,以及所述元件增强其转录水平。
2.根据权利要求1所述的多核苷酸,其中所述的核糖体蛋白基因选自RPSA,RPS2,RPS3,RPS3A,RPS4,RPS5,RPS6,RPS7,RPS8,RPS9,RPS10,RPS11,RPS12,RPS13,RPS14,RPS15,RPS15A,RPS16,RPS17,RPS18,RPS19,RPS20,RPS21,RPS23,RPS24,RPS25,RPS26,RPS27,RPS28,RPS29,RPS30,RPL3,RPL4,RPL5,RPL6,RPL7,RPL7A,RPL8,RPL9,RPL10,RPL10A,RPL11,RPL12,RPL13,RPL13A,RPL14,RPL15,RPL17,RPL18,RPL18A,RPL19,RPL21,RPL22,RPL23,RPL23A,RPL24,RPL26,RPL27,RPL27A,RPL28,RPL29,RPL30,RPL31,RPL32,RPL34,RPL35,RPL35A,RPL36,RPL36A,RPL37,RPL37A,RPL38,RPL39,RPL41,RPLP0,RPLP1,RPLP2。
3.根据权利要求1或2所述的多核苷酸,其中所述的核糖体蛋白基因是RPS3或RPS11。
4.根据权利要求1至3所述的多核苷酸,其中所述元件包含来自核糖体蛋白基因启动区的至少1000个连续的核苷酸。
5.根据以上任一权利要求所述的多核苷酸,其中所述元件包括所述核糖体蛋白基因的一个或多个外显子。
6.前述权利要求中任一项所述的多核苷酸,其中所述元件包括CpG岛。
7.根据权利要求5所述的多核苷酸,其中所述元件包括延伸的CpG岛。
8.根据权利要求6所述的多核苷酸,其中所述元件包括延伸的无甲基化的CpG岛。
9.前述权利要求中任一项所述的多核苷酸,其中核糖体蛋白基因是哺乳动物的基因。
10.根据权利要求9所述的多核苷酸,其中核糖体蛋白基因是鼠类基因。
11.根据权利要求10所述的多核苷酸,其包括SEQ ID NO:1的核苷酸序列。
12.根据权利要求10所述的多核苷酸,其包括SEQ ID NO:2的核苷酸序列。
13.根据权利要求9所述的多核苷酸,其中核糖体蛋白基因是人类基因。
14.前述权利要求中任一项所述的多核苷酸,其中所述异源启动子为组成型启动子。
15.根据权利要求14所述的多核苷酸,其中所述组成型启动子选自:巨细胞病毒早期/立即启动子、SV40、EF-1α、鲁斯氏肉瘤病毒(RSV)LTR和HIV2LTR。
16.根据权利要求1-13任一项所述的多核苷酸,其中所述异源启动子为组织特异性启动子。
17.根据权利要求16所述的多核苷酸,其中异源启动子为肿瘤选择性启动子。
18.根据权利要求17所述的多核苷酸,其中所述启动子选自:基于癌胚抗原(CEA)、前列腺特异性抗原(PSA)、环氧合酶-2(COX-2)、α-甲胎蛋白(AFP)、酪氨酸酶和T细胞因子1-4(TCF)的启动子。
19.前述权利要求中任一项所述的多核苷酸,其中所述可转录核酸编码一种多肽,所述多肽选自:抗体、抗体的功能性表位结合片段、生长因子、细胞因子、蛋白激酶、可溶性受体、膜结合受体、凝血因子等。
20.一种载体,其包含前述权利要求中任一项所述的多核苷酸。
21.根据权利要求20的真核表达载体。
22.一种真核表达载体,其包括:
a)包含来自核糖体蛋白基因启动区的至少500个连续核苷酸的元件;
b)异源启动子;以及
c)多克隆位点,
其中插入到所述多克隆位点的可转录核酸序列能够由所述异源启动子转录,以及所述元件增强其转录水平。
23.一种宿主细胞,其包含根据权利要求1-19任一项所述的分离的多核苷酸,或权利要求20-22任一项所述的载体。
24.根据权利要求23所述的宿主细胞,其中该细胞选自:CHO、NS0、BHK、HeLa、HepG2。
25.一种多肽的表达方法,其包括将根据权利要求21或22所述的表达载体插入到合适的宿主细胞中,并将该宿主细胞在合适条件下培养,使其表达。
26.根据权利要求25所述的方法,其中所述多肽是一种治疗用的多肽。
27.一种药物制剂,其包含根据权利要求1-19任一项所述的多核苷酸,根据权利要求20-22任一项所述的载体,或根据权利要求23或24所述的宿主细胞,和药学上可接受的载体、赋形剂、缓冲剂或介质。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0509965.0 | 2005-05-17 | ||
GBGB0509965.0A GB0509965D0 (en) | 2005-05-17 | 2005-05-17 | Improved expression elements |
US68227705P | 2005-05-18 | 2005-05-18 | |
US60/682,277 | 2005-05-18 | ||
PCT/GB2006/001656 WO2006123097A2 (en) | 2005-05-17 | 2006-05-09 | Improved expression elements |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101208435A true CN101208435A (zh) | 2008-06-25 |
CN101208435B CN101208435B (zh) | 2012-05-23 |
Family
ID=34708242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800173095A Active CN101208435B (zh) | 2005-05-17 | 2006-05-09 | 改进的表达元件 |
Country Status (9)
Country | Link |
---|---|
US (2) | US7632661B2 (zh) |
EP (2) | EP1891223B1 (zh) |
JP (1) | JP5080452B2 (zh) |
CN (1) | CN101208435B (zh) |
AT (1) | ATE494381T1 (zh) |
DE (1) | DE602006019422D1 (zh) |
ES (1) | ES2358680T3 (zh) |
GB (1) | GB0509965D0 (zh) |
WO (1) | WO2006123097A2 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108135151A (zh) * | 2015-09-02 | 2018-06-08 | 瑞泽恩制药公司 | 前列腺癌的啮齿动物模型 |
CN111249457A (zh) * | 2020-04-13 | 2020-06-09 | 吉林大学 | 核糖体蛋白sa抗体在免疫调节中的医用用途 |
CN111304231A (zh) * | 2013-12-30 | 2020-06-19 | 库瑞瓦格股份公司 | 人工核酸分子 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK2332972T3 (en) | 2003-06-24 | 2018-04-23 | Genzyme Corp | Hitherto UNKNOWN BETA-ACTIN AND RPS21 PROMOTORS AND APPLICATIONS |
US8105575B2 (en) * | 2006-10-10 | 2012-01-31 | Viromed Co., Ltd. | Expression vectors with improved safety |
CN101627123A (zh) * | 2007-01-08 | 2010-01-13 | 米利波尔公司 | 消除基因扩增的高表达细胞系 |
WO2009155950A1 (en) | 2008-06-27 | 2009-12-30 | King Faisal Specialist Hospital And Research Centre | Cloning-free method of generating transcriptionally and post-transcriptionally controllable expression active linear reporter constructs |
US20110190156A1 (en) * | 2008-07-15 | 2011-08-04 | Trustees Of Dartmouth College | Molecular signatures for diagnosing scleroderma |
EP2411007A4 (en) * | 2009-03-27 | 2012-12-05 | Uab Research Foundation | MODULATION OF IRES-MEDIATED TRANSLATION |
WO2010147464A1 (en) | 2009-06-15 | 2010-12-23 | Cellagenics B.V. | Use of a cysteine synthesizing enzyme as selectable marker |
WO2012030218A1 (en) | 2010-09-01 | 2012-03-08 | Cellagenics B.V. | Nucleic acid fragments from a ribosomal protein promoter for enhancing gene expression |
TW201632625A (zh) | 2011-11-28 | 2016-09-16 | 第一三共股份有限公司 | 源自人類基因的啟動子 |
WO2013163404A1 (en) * | 2012-04-27 | 2013-10-31 | The Uab Research Foundation | TREATING VIRAL INFECTIONS HAVING VIRAL RNAs TRANSLATED BY A NON-IRES MEDIATED MECHANISM |
US11254951B2 (en) | 2014-12-30 | 2022-02-22 | Curevac Ag | Artificial nucleic acid molecules |
EP3495486B1 (en) * | 2013-12-30 | 2020-12-16 | CureVac AG | Artificial nucleic acid molecules |
AU2015332577B2 (en) * | 2014-10-15 | 2021-12-23 | Amgen Inc. | Promoter and regulatory elements for improved expression of heterologous genes in host cells |
EP3589329B1 (en) | 2017-05-11 | 2022-10-12 | Zentrum für Forschungsförderung in der Pädiatrie GmbH | Concept for the treatment of monogenetic disorders |
US20210317498A1 (en) | 2018-08-09 | 2021-10-14 | Daiichi Sankyo Company, Limited | PROMOTER of Hspa8 GENE |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5583009A (en) | 1992-12-08 | 1996-12-10 | University Of Washington | Method of preparing recombinant proteins in transgenic animals containing metallothionein gene elements that bestow tissue-independent copy number-dependent, position-indepedent gene expression |
US5610053A (en) * | 1993-04-07 | 1997-03-11 | The United States Of America As Represented By The Department Of Health And Human Services | DNA sequence which acts as a chromatin insulator element to protect expressed genes from cis-acting regulatory sequences in mammalian cells |
US6110666A (en) | 1994-06-09 | 2000-08-29 | Medical Research Council | Locus control subregions conferring integration-site independent transgene expression abstract of the disclosure |
DE19539493A1 (de) * | 1995-10-24 | 1997-04-30 | Thomae Gmbh Dr K | Starker homologer Promotor aus Hamster |
WO1998007876A2 (en) | 1996-08-16 | 1998-02-26 | Medical Research Council | Self-replicating episomal expression vectors conferring tissue-specific gene expression |
JP4220673B2 (ja) * | 1998-07-21 | 2009-02-04 | ミリポア・コーポレイション | 遍在性クロマチンオープニングエレメント(ucoe)を含むポリヌクレオチド |
ATE539161T1 (de) * | 1998-07-21 | 2012-01-15 | Millipore Corp | Ein ein allgegenwärtiges chromatin-öffnendes element (ucoe) enthaltendes polynucleotid |
GB0022995D0 (en) * | 2000-09-20 | 2000-11-01 | Cobra Therapeutics Ltd | Polynucleotide |
KR100996016B1 (ko) | 2000-09-20 | 2010-11-22 | 밀리포어 코포레이션 | 폴리뉴클레오티드 |
ATE460493T1 (de) * | 2001-04-05 | 2010-03-15 | Millipore Corp | Gesteigerte genexpression |
US7812148B2 (en) | 2001-04-05 | 2010-10-12 | Millipore Corporation | Vectors comprising CpG islands without position effect varigation and having increased expression |
AU2002310321A1 (en) * | 2001-06-04 | 2002-12-16 | Corixa Corporation | Compositions and methods for high-level, large-scale production of recombinant proteins |
KR20040044433A (ko) | 2001-07-10 | 2004-05-28 | 아이덱 파마슈티칼즈 코포레이션 | 세포자멸사 과정의 저해 및 세포 기능의 개선 |
US7384744B2 (en) * | 2002-11-29 | 2008-06-10 | Boehringer Ingelheim Pharma Gmbh & Co., Kg | Expression vector, methods for the production of heterologous gene products and for the selection of recombinant cells producing high levels of such products |
-
2005
- 2005-05-17 GB GBGB0509965.0A patent/GB0509965D0/en not_active Ceased
-
2006
- 2006-05-09 ES ES06727026T patent/ES2358680T3/es active Active
- 2006-05-09 DE DE602006019422T patent/DE602006019422D1/de active Active
- 2006-05-09 CN CN2006800173095A patent/CN101208435B/zh active Active
- 2006-05-09 WO PCT/GB2006/001656 patent/WO2006123097A2/en not_active Application Discontinuation
- 2006-05-09 AT AT06727026T patent/ATE494381T1/de not_active IP Right Cessation
- 2006-05-09 EP EP06727026A patent/EP1891223B1/en active Active
- 2006-05-09 EP EP10177866A patent/EP2295589A1/en not_active Withdrawn
- 2006-05-09 JP JP2008511772A patent/JP5080452B2/ja active Active
- 2006-05-17 US US11/435,930 patent/US7632661B2/en active Active
-
2009
- 2009-09-09 US US12/584,634 patent/US20100015107A1/en not_active Abandoned
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111304231A (zh) * | 2013-12-30 | 2020-06-19 | 库瑞瓦格股份公司 | 人工核酸分子 |
CN108135151A (zh) * | 2015-09-02 | 2018-06-08 | 瑞泽恩制药公司 | 前列腺癌的啮齿动物模型 |
CN111249457A (zh) * | 2020-04-13 | 2020-06-09 | 吉林大学 | 核糖体蛋白sa抗体在免疫调节中的医用用途 |
WO2021208749A1 (zh) * | 2020-04-13 | 2021-10-21 | 吉林大学 | 核糖体蛋白sa抗体在免疫调节中的医用用途 |
Also Published As
Publication number | Publication date |
---|---|
EP1891223A2 (en) | 2008-02-27 |
GB0509965D0 (en) | 2005-06-22 |
ES2358680T3 (es) | 2011-05-12 |
ATE494381T1 (de) | 2011-01-15 |
CN101208435B (zh) | 2012-05-23 |
DE602006019422D1 (de) | 2011-02-17 |
US7632661B2 (en) | 2009-12-15 |
EP1891223B1 (en) | 2011-01-05 |
JP2008539781A (ja) | 2008-11-20 |
WO2006123097A3 (en) | 2007-01-11 |
EP2295589A1 (en) | 2011-03-16 |
WO2006123097A2 (en) | 2006-11-23 |
JP5080452B2 (ja) | 2012-11-21 |
US20080097088A1 (en) | 2008-04-24 |
US20100015107A1 (en) | 2010-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101208435A (zh) | 改进的表达元件 | |
AU2020260491B2 (en) | Gene therapies for lysosomal disorders | |
ES2805045T3 (es) | Vectores lentivirales | |
KR102006527B1 (ko) | 전립선-연관 항원의 발현을 위한 벡터 | |
KR20190065251A (ko) | 모듈러 AAV 전달 시스템을 통한 CRISPR-Cas 게놈 가공 | |
US20030119104A1 (en) | Chromosome-based platforms | |
CN101233238A (zh) | 人细胞系中重组人蛋白质的无血清稳定转染和生产 | |
CN1533432A (zh) | 高水平、大规模生产重组蛋白的组合体和方法 | |
JP2003534775A (ja) | タンパク質を不安定化する方法とその使用 | |
KR20210150486A (ko) | 리소좀 장애에 대한 유전자 요법 | |
CN111094569A (zh) | 光控性病毒蛋白质、其基因及包含该基因的病毒载体 | |
KR20230019063A (ko) | C9orf72 연관 질환의 치료를 위한 삼중 기능 아데노-연관 바이러스 (aav) 벡터 | |
KR20210118402A (ko) | 위스콧-알드리치(Wiskott-Aldrich) 증후군에 대한 조혈 줄기 세포-유전자 치료요법 | |
KR20240037192A (ko) | 게놈 통합을 위한 방법 및 조성물 | |
US20030166890A1 (en) | Gene expression | |
US20240082327A1 (en) | Retroviral vectors | |
CN114645066B (zh) | 一种用于艾滋病基因治疗的核酸构建体 | |
DK2921048T3 (en) | SUS SCROFA V2G: SAFE HARBOR PLACE FOR LONG-TERM EXPRESSION AND HIGH INTEGRATION OF TRANSGENERS IN A PIG | |
TW202246508A (zh) | 反轉錄病毒載體 | |
KR100955756B1 (ko) | 개량된 유전자 발현 | |
TW202424202A (zh) | 逆轉錄病毒載體 | |
CA2522166C (en) | Lambda integrase mutein for use in recombination | |
WO2024062259A1 (en) | Retroviral vector comprising rre inserted within an intron | |
KR20210150487A (ko) | 리소좀 장애를 위한 유전자 요법 | |
US20030053991A1 (en) | Retinoic acid receptor beta-2, its agonists, and gene theraphy vectors for the treatment of neurological disorders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee |
Owner name: EMD MILLIPORE CORPORATION Free format text: FORMER NAME: MILLIPORE CORP. |
|
CP01 | Change in the name or title of a patent holder |
Address after: Massachusetts, USA Patentee after: Millipore Corp. Address before: Massachusetts, USA Patentee before: Millipore Corp. |