CN101208435A - 改进的表达元件 - Google Patents

改进的表达元件 Download PDF

Info

Publication number
CN101208435A
CN101208435A CNA2006800173095A CN200680017309A CN101208435A CN 101208435 A CN101208435 A CN 101208435A CN A2006800173095 A CNA2006800173095 A CN A2006800173095A CN 200680017309 A CN200680017309 A CN 200680017309A CN 101208435 A CN101208435 A CN 101208435A
Authority
CN
China
Prior art keywords
polynucleotide
gene
promoter
expression
ribosomal protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800173095A
Other languages
English (en)
Other versions
CN101208435B (zh
Inventor
大卫·约翰·辛普森
史蒂文·杰兰特·威廉姆斯
阿利斯泰尔·辛普森·欧文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMD Millipore Corp
Original Assignee
Millipore Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Millipore Corp filed Critical Millipore Corp
Publication of CN101208435A publication Critical patent/CN101208435A/zh
Application granted granted Critical
Publication of CN101208435B publication Critical patent/CN101208435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/46Vector systems having a special element relevant for transcription elements influencing chromatin structure, e.g. scaffold/matrix attachment region, methylation free island

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

本发明涉及能提高可操作相连的转录单元的表达水平的基因元件。尤其是,这些基因元件来自核糖体蛋白基因的5′非翻译区,并可能包括CpG岛。还提供包含这些基因元件的载体和宿主细胞,以及获得高水平重组基因表达的方法。

Description

改进的表达元件
技术领域
本发明涉及多核苷酸,其包括可改进可操作相连的转录单元表达的元件。这些元件本质上与核糖体蛋白基因启动区相关,并在重组DNA构建体中,基因表达水平高,重复性好。本发明还涉及包括该多核苷酸序列的载体,包括该载体的宿主细胞,以及该多核苷酸、载体或宿主细胞在治疗中的用途,在细胞培养和其它生物技术应用中,用于生产重组蛋白。
背景技术
高等真核生物染色质结构的现行模式假定基因以“域”的形式组织(Dillon,N.&Grosveld,F.Chromatin Domains As Potential Units OfEukaryotic Gene Function.Curr.Opin.Genet.Dev.4,260-264(1994);Higgs,D.R.Do Lcrs Open Chromatin Domains?Cell 95,299-302(1998))。染色质域被设想为以一个缩合的、“封闭”的转录静止状态存在,或以一个非缩合的、“开放”的可转录构型存在。开放的染色质结构的特征在于增加DNase I的敏感性,使DNA次甲基化,并使组蛋白高度乙酰化,其建立被认为是基因表达开始的一项先决条件。
染色质域的开放和封闭性体现在转基因的行为中,该转基因随机整合到宿主细胞基因组中。同一构建体在整合到小鼠基因组中的不同的位点时,可出现不同类型的组织特异性和发展阶段特异性表达(Palmiter,R.D.&Brinster,R.L.Ann.Ref.Genet.20,465-499(1986);Allen,N.D.et al.Nature 333,852-855(1988);Bonnerot,C,Grimber,G.,Briand,P.&Nicolas,J.F.Proc.Natl.Acad.Sci.USA 87:6331-6335(1990))。
基因组织的染色质域模型,表明基因控制元件应与基因组活性区域相关,所述控制元件能够建立和保持一个可转录的、开放的染色质结构。
基因座控制区域(LCRS)是一类转录调控元件,其具有重塑长程染色质的能力。LCR在其功能上,可使转基因小鼠中的顺式连接基因,尤其是单拷贝基因完成与整合位点无关而与转基因拷贝数有关的生理层面的表达(Fraser,P.&Grosveld,F.Curr.Opin.Cell Biol.10,361-365(1998);Li,Q.,Harju,S.&Peterson,K.R.Trends Genet.15:403-408(1999))。最重要的是,这样的表达是组织特异性的。LCR能够阻挡异染色质的扩散,并防止PEV(Kioussis,D.&Festenstein,R.Curr.Opin.Genet.Dev.7,614-619(1997)),其由一系列DNase I高敏感性(HS)位点组成,这些位点可位于所调控基因的5’端或3’端(LI,Q.,HARJU,S.&PETERSON,K.R.TRENDS GENET.15:403-408(1999))。
通过培养生产可产生大量治疗性蛋白产物的哺乳动物细胞系,是一项重要的新兴产业。染色质的位置效应,使该过程变得困难、费时和昂贵。生产这种哺乳动物的“细胞工厂”的最常用的方法为基因扩增,其通过结合耐药基因(例如,二氢叶酸还原酶(DHFR),谷氨酰胺合成酶(Kaufman Rj.Methods Enzymol 185,537-566(1990)),以及维持严格的选择压力来诱导。使用包含高表达基因域LCR的载体和取自适当组织的细胞,可极大地简化程序,得到高比例的具有稳定的高表达水平的克隆细胞系(Needham M,Gooding C,Hudson K,Antoniou M,Grosveld F and Hoims M.Nucleic Acids Res 20,997-1003(1992);Needham M,Egerton M,Millest A,Evans S,Popplewell M,Cerillo G,Mcpheat J,Monk A,Jack A,Johnstone D and Hollis M.Protein ExpRpurif 6,124-131(1995))。
然而,虽然LCR的组织特异性在某些情况下有用,但也是许多应用的主要限制,例如需要在LCR未知的组织中表达的情况,或需要LCR在许多或所有组织中表达的情况。
在美国专利6,689,606及其共同在审专利申请WO 00/0539(纳入本文参考文献中),描述了一些元件,这些元件在其自然染色体背景下,负责建立跨越基因座的开放的染色质结构,该基因座只由在各处都可表达的持家基因组成。这些元件并非来自LCR,其包括延长的无甲基化的CpG岛。
在哺乳类动物DNA中,二核苷酸CPG可由DNA甲基转移酶识别,该酶可将胞嘧啶甲基化转化为5-甲基胞嘧啶。然而,5-甲基胞嘧啶不稳定,可转化为胸腺嘧啶。因此,相比较于人们所预期的偶然发生,CPG二核苷酸的发生频率要小得多。然而,在基因组DNA的一些片段中,CPG的发生频率接近于预期,这些序列被称为“CpG岛”。本文所用的“CpG岛”,是指具有至少200bp的基因序列,其GC含量至少50%,观察/预期的CPG含量的比值最少为0.6(即CPG二核苷酸含量为预期含量的至少60%)(Gardiner-Green M and Frommer M.J Moi Biol 196,261-282(1987);Rice P,Longden I and Bleasby A Trends Genet 16,276-277(2000))。
在现有技术中,无甲基化CPG是公知的(Bird et al(1985)Cell 40:91-99,Tazi and Bird(1990)Cell 60:909-920),其可定义为CpG岛,在CpG岛中,相当比例的胞嘧啶残基未被甲基化,且CpG岛通常延长超过两个间隔很近(0.1-3kb)的背驰转录的基因的5’端。据报道,DNA的这些区域在所有组织的发育过程中,仍然保持低甲基化(Wise andPravtcheva(1999)Genomics 60:258-271)。他们往往与普遍表达的基因的5’端相关,且大约40%的基因呈现出组织限制性表达图谱(Antequera,F.&Bird,A.Proc.Natl.Acad.Sci.USA 90,1195-11999(1993);Cross,S.H.&Bird,A.P.Cum Opin,Genet.Dev.5,309-314(1995)),并且已知其是活性染色质的定位区域。
“延伸”的无甲基化CpG岛,其延伸跨越包含一个以上的转录起始位点的区域和/或延伸多于300bp,优选多个500bp。延伸的无甲基化CpG岛,其边界是通过在功能上对该区域结合限制性内切酶进行PCR来确定的,这些限制性内切酶在其识别序列上消化(切割)DNA的能力,易受任何一个存在的CPG残基的甲基化状态影响。其中一个这样的酶是HpaII,其可识别并消化CpG岛中常见的CCGG位点,但此过程只有在中间的CG残基未被甲基化的时候发生。因此,如果DNA未被甲基化,在使用HpaII消化DNA,对包含HpaII位点的区域进行PCR时,由于HpaII消化不会得到扩增产物。如果DNA被甲基化,PCR只会给出扩增产物。因此,除无甲基化区域,HpaII不消化DNA,会发现PCR扩增产物,由此确定“延伸的无甲基化CpG岛”的边界。
WO00/05393已显示,跨越无甲基化CpG岛的区域包含两个背驰转录启动子,分别来自人类TATA结合蛋白(TBP)/蛋白组分-B1(PSMBI)和异质性细胞核核蛋白A2/B1(hnRNPA2)/异染色质蛋白1Hsγ(HP1Hsγ)基因位点,这些区域可进行重复性好,在生理水平上的基因表达,它们能够防止杂色表达模式和基因沉默,这通常在着丝粒异染色质内,与转基因整合一起出现。
众所周知,与活性转录启动子相关的无甲基化CpG岛,具有重塑染色质的能力,并因此被认为是在持家基因位点建立并维持开放域的主要决定因素(WO00/05393),并由此认为这些元件可增加生产性基因传递事件的比例,并改进转基因表达水平和稳定性。
核糖体是大RNA和蛋白质的复合体,其负责将mRNA翻译成多肽。每个核糖体含有4个核糖体RNA(rRNA)分子和大量核糖体蛋白(目前在哺乳动物细胞中,被认为79个)。核糖体蛋白质的功能包括帮助rRNA折叠,防止细胞核糖核酸酶,并协调蛋白质合成。一些核糖体蛋白质具有额外的核糖体外功能(WOOL,1996,TIBS 21:164-165)。由于不同物种的核糖体在结构和功能上相似,核糖体蛋白的氨基酸序列的保守程度很高,这并不奇怪,在哺乳动物中,大部分核糖体蛋白的序列几乎相同(WOOL etal,1995,BIOCHEM CELL BIOL 73:933-947)。
两个核糖体蛋白反常出现,因为它们是以前肽(PROPEPTIDES,羧基延伸蛋白)与泛素融合的形式表达的。泛素是一种高度保守的具有76个残基的多肽,其参与了各种细胞功能,包括调节细胞内蛋白分解,调控细胞周期及应激反应(HERSHKO&CIECHANOVER,1992,ANNU REV BIOCHEM 61:761-807;COUX ET A/,1996,ANNU REVBIOCHEM 65:801-847)。
泛素由两个不同类别的基因编码。一个是聚泛素基因,其编码泛素重复单元的线性聚合物。另外一个包括编码自然融合蛋白的基因,在此融合蛋白中,单一的泛素分子连接到核糖体蛋白rps27A或rpL40上(Finley et al,1989,Nature 338:394-401;Chan et al,1995,BiochemBiophys Res Commun 215:682-690;Redman&Burris,1996,Biochem J315:315-321)。
PERRY(2005,BMC Evolutionary Biology 5:15)讨论了核糖体蛋白启动子的共同的结构特点。这些启动子可按照TATA盒基序的本质、转录因子结合位点和AUG启动密码子的数量和类型进行分类。然而,这样的分类似乎并不能预测启动子的强度,证据表明,通过测量连接的报告基因的表达,被测的这样的启动子具有等效的转录活性(Hariharan et al,1989,Genes Dev 3:1789-800)。
美国专利6,063,598公开了仓鼠-泛素/S27A启动子,及其促使重组蛋白质高水平生产的用途。但是,并没有暗示它可用于加强主要从其它启动子转录的基因的表达(即一个除仓鼠-泛素/S27A启动子以外的启动子)。
美国专利申请US 2004/0148647公开了一种使用包含仓鼠-泛素/S27A启动子的表达载体的报告基因分析,该启动子功能性连接至目的产物的基因和荧光蛋白报告基因。再次,该申请只公开了构建体,其中目的基因的转录是从仓鼠-泛素/S27A启动子本身开始的。
获得更高、更可靠的表达水平依然是重组基因表达领域的一个目标,尤其是对于体内与离体的治疗应用和体外生产重组蛋白。
发明内容
在本发明的整个说明书和权利要求书中,“包括”与“含有”以及变化的形式,例如“包括”,是指“包括但不限于”,而不是为了(也没有)排除其他部分、添加剂、部件、整数或步骤。
在本发明的整个说明书和权利要求书中,除非上下文另有要求,单数包含复数。尤其是,使用不定冠词时,除非上下文另有规定,在本说明书可以理解为复数也可以理解为单数。
除非与本文不符,本发明某一方面、实施方案或举例所描述的特点、整数、特征、化合物、化学部分或基团,可理解为适用于本文的任何其他方面、实施方案或举例。
定义
本文所用的启动区,定义为基因组的核苷酸序列,其组成为启动子和转录起始位点,连同上游转录起始位点5kb的5’端序列和下游第一外显子远端的500bp的3’端序列。
5’端非翻译区是指基因组或cDNA序列中编码的翻译起始位点的5’端区域。它包括所有上游调控元件。5’上游序列是指基因组序列中编码转录起始位点的5’端序列。
本文所用的“可转录核酸”,是指一种核酸,当其可操作地连接到功能性启动子和其他调节序列时,能被转录为功能性RNA分子,如mRNA。这些序列可以包括编码可翻译多肽序列的开放阅读框。另外,功能性RNA可能有另一种功能,如核糖RNA,核酶或反义RNA。
“基因”通常指可转录核酸的编码区域,转录开始的启动子,以及其他调控序列,如增强子和3’多腺苷酸信号的结合体。基因组DNA基因中也含有内含子。“转录单元”有时被用来描述功能性的结合,包括至少一个启动子和带有可转录核算的最小调控序列,其往往来源于内含子被剪接掉的cDNA。“顺反子”指的是一种编码单一多肽带有功能性起始和终止信号的核酸。“转基因”意味着基因已被从一个基因组中转移到另一个基因组中,虽然这个术语可以更宽松地适用于包含于重组DNA构建体,如载体中的任何基因或甚至可转录核酸。
启动子和增强子是本领域众所周知的术语,其包括以下特点,仅供举例说明,但不局限于此。启动子为5’顺式作用的调控序列,其与转录起始直接相连。启动子元件包括所谓的TATA盒和RNA聚合酶起始选择(RIS)序列,该序列的功能为选择转录起始站点。这些序列还结合多肽,这些多肽尤其方便RNA聚合酶进行转录起始选择。
简单来说,启动子为定向元件,其作用是起始转录位于下游的少于100个(通常小于50个)核苷酸碱基对(bp)的序列。他们包含许多短共有核苷酸序列,这些核苷酸序列可以作为参与转录起始及多亚基复合物(称为预启动复合物)装配的各种蛋白质的结合位点(Mcknightand Tjian,1987,Cell 46:795-805)。在大多数基因中,这种情况发生在一个非常宽的保守序列(称为TATA盒,TATAAA)中,其与TATA盒结合蛋白(TBP,通用转录因子TFIID的亚基)结合。然后连接由十个以上其他转录因子组成的有序组件,最终形成POL II全酶复合体。RNA转录实际上起始于下游一个约25-30碱基的起始位点(Breathnach andChambon,1981,Annu Rev Biochem 50:349-393),该位点也与TBP结合。
大部分功能性启动子包含其他上游启动子元件(UPES),其中最高度保守的是位于上游约70-200bp的CAAT盒(CCAAT,转录因子CBF、C/EBP和NF-1的结合位点)和位于上游类似位置的GC盒(GGGCGG,通用转录因子Sp-1的结合位点)。虽然基准水平的转录仅从TATA盒开始,但对大多数启动子,至少CAAT和GC盒,需要最优水平的转录。
增强子是一种序列,其可非定向地增加位于局部的,但不一定紧靠的(达几kb远)启动子转录(KADONAGA(2004)CELL 116:247-257)。增强子包含有短(8-12BP)共有序列,该序列代表广泛的转录激活蛋白的结合位点(ONDEK ET AL,1988,SCIENCE 236:1237-1244),其中包括,如NF-1和SP-1,这些转录激活蛋白也与启动子元件相关。这些序列往往串联重复或反向重复。
在一些天然转录单元中,包括许多DNA病毒,如巨细胞病毒非常活跃的立即/早期基因转录单元,增强子和启动子元件在功能上,可结合到一个可有效延伸的上游元件中。
启动子可被调节,响应细胞类型、温度、金属离子或其他因素;或组成型,使转录与这些因素无反应。在许多用途中,一个强大的组成型启动子,可在许多类型的细胞中达到一致的高水平的转录,就算不是全部类型的细胞,也是非常有利的。多年来,用于驱动人巨细胞病毒中的立即/早期基因表达的增强子/启动子元件,已非常广泛用于驱动外源基因在真核表达载体中的表达(FOECKING&HOFFSTETTER,1986,GENE 45:101-105)。
假设核糖体蛋白基因启动区在增强和稳定相连转基因的表达方面可能具有有用的活性,并假设,高表达基因的调控区域可能更容易含有一些元件,这些元件对维持染色质的可转录活性构型是非常有效的。这些元件与异源启动子连接后可产生更开放的围绕该启动子的染色质环境,导致表达增加。本领域技术人员都了解,核糖体蛋白基因启动子可与核糖体启动子区分开来,这种核糖体启动子为RNA聚合酶I型依赖性启动子,从中rRNA被转录。
为验证该假设,从指数性生长的CHO-K1和NS0细胞系中获得RNA,并对13443小鼠基因进行微阵列分析。我们把分析限于具有高CpG岛含量和双向启动子可能性的元件。以从hnRNPA2调控区域获得的最小有效序列为标准,将选自这些基因的大约3kb的DNA,以NS0基因组DNA为模板,通过PCR扩增。这些序列接下来被克隆到EGFP表达载体内,并与同一载体的hnRNPA2对照一起转染CHO-K1细胞。
结果发现来自两个核糖体蛋白启动区的序列使实验中所用的异源报告基因序列获得一致地高水平表达。在每一种情况下,启动区包含富含GC的序列,该序列从实际启动子元件上游的5’区域一直延伸到第一外显子,而事实上,延伸到了第一内含子。该富含GC序列符合成为延伸的CpG岛的标准,因为本文定义延伸的CpG岛为延伸超过300BP。
因此,本发明提供了一种分离的多核苷酸,其包含
A)包含来自核糖体蛋白基因启动区的至少500个连续的核苷酸的元件,
B)异源启动子,以及
C)与所述异种启动子相邻的可转录核酸序列
其中可转录核酸序列由所述异源启动子转录,所述元件可增强其转录水平。优选地,所述元件包括来自于多核糖体蛋白基因的大于1kb,更优选地,大于3kb的5’端非编码序列。
连续核苷酸选自启动子区,其从转录起始位点的上游5kb位点(有义链5’端)延伸至第一外显子远端(3’端)下游500bp位点(有义链3’端)。
优选地,所述核糖体蛋白基因选自:RPSA,RPS2,RPS3,RPS3A,RPS4,RPS5,RPS6,RPS7,RPS8,RPS9,RPS10,RPS11,RPS12,RPS13,RPS14,RPS15,RPS15A,RPS16,RPS17,RPS18,RPS19,RPS20,RPS21,RPS23,RPS24,RPS25,RPS26,RPS27,RPS27A,RPS28,RPS29,RPS30,RPL3,RPL4,RPL5,RPL6,RPL7,RPL7A,RPL8,RPL9,RPL10,RPL10A,RPL11,RPL12,RPL13,RPL13A,RPL14,RPL15,RPL17,RPL18,RPL18A,RPL19,RPL21,RPL22,RPL23,RPL23A,RPL24,RPL26,RPL27,RPL28,RPL29,RPL30,RPL31,RPL32,RPL34,RPL35,RPL35A,RPL36,RPL36A,RPL37,RPL37A,RPL38,RPL39,RPL41,RPLP0,RPLP1,RPLP2及其直系同源基因(orthologue)。更优选地,所述核糖体蛋白基因为RPS3或RPS11。
在一个优选实施例中,该元件包含CpG岛,优选为延伸的CpG岛,其具有至少300bp,更优选地,其具有500bp。优选地,CpG岛未被甲基化。优选地,所述元件包含启动子,该启动子来自核糖体蛋白基因,核糖体蛋白基因的转录是从该启动子自然启动的。这种启动子往往被称为内源性启动子。在一个优选实施例中,该元件进一步包含所述核糖体蛋白基因一个或多个外显子。
优选地,核糖体蛋白基因为一种哺乳动物的基因,尽管这些基因及其启动子和5’端上游序列在不同的物种中高度保守,并可能替代为昆虫基因、线虫基因或酵母基因。不过,优选地,该核糖体蛋白基因为人或啮齿动物基因,更优选地,为小鼠基因。
在一个更优选的实施例中,本发明中的分离的多核苷酸包括序列表中SEQ ID NO:1所示的小鼠rps3核苷酸序列的第38-3154位的核苷酸。可替选地,该多核苷酸包括序列表中SEQ ID NO:2所示的小鼠rps11核苷酸序列的第12-3032位的核苷酸。
在一个方面,除所描述的元件外,该多核苷酸还包括启动子,该启动子本质上不与来自核糖体蛋白基因的所述元件相关。在本实施方案中,异源启动子(有别于可能会或可能不会存在于第一元件中的内源启动子),位于该元件下游相邻的可操作连接的位置,该元件包含源自核糖体蛋白基因的5’端序列。在此安排下,该核糖体蛋白基因元件可增强由异源启动子指导的表达。
在一个实施方案中,所述启动子为组成型启动子,更优选地,其选自:巨细胞病毒早期/立即启动子、SV40、EF-1α、鲁斯氏肉瘤病毒(RSV)LTR或HIV2LTR或由此衍生的序列的组合。更优选地,该启动子为巨细胞病毒(CMV)立即/早期启动子。最优选地,该启动子为小鼠或豚鼠CMV立即/早期启动子。
可替选地,所述启动子可以是一个组织特异性启动子,其指导在组织有限范围内的表达。这些启动子是本领域众所周知的,其包括那些来自β-球蛋白、κ和λ免疫球蛋白轻链、免疫球蛋白重链、肌间线蛋白、酪氨酸酶、CD2、白细胞介素3(IL-3)、肌球蛋白轻链、人黑素瘤抑制活性基因启动子及角蛋白的启动子。在一个特别优选的实施方案中,该启动子为肿瘤选择性启动子,其优先指导一个或多个肿瘤类型的表达。这些启动子的例子包括基于癌胚抗原(CEA)、前列腺特异性抗原(PSA)、环氧合酶-2(COX-2)、α-甲胎蛋白(AFP)、酪氨酸酶和T细胞因子1-4(TCF)的启动子。
该可转录核酸可编码任何用于体外表达的有用的多肽,优选地,其可选自抗体、抗体的功能性表位结合片段、生长因子、细胞因子、蛋白激酶、可溶性受体、膜结合受体或凝血因子。可替选地,该可转录核酸可编码用于体内或离体基因治疗的治疗性基因。这种治疗性核酸可以通过取代或补充致病缺陷基因的功能而起作用,所引起的疾病如囊性纤维化、地中海贫血症、镰刀性贫血症、范可尼贫血、血友病、重症联合免疫缺陷病(SCID)、苯丙酮尿症(PKU)、α-1型抗胰蛋白酶缺乏症,裘馨氏肌肉萎缩症、鸟氨酸氨甲酰基转移酶缺乏症或成骨不全症。可替选地,该可转录核酸可编码选择性地在靶细胞,如恶性癌细胞中表达以杀死该细胞的细胞毒性剂或前药转换酶。这些应用以及很多其他应用,是本领域技术人员众所周知的,本发明在提高治疗性核酸表达的相关内容对熟练的技术人员来讲是显而易见的。
在另一个方面,本发明提供了一种载体,其包括本发明上述的多核苷酸。优选地,所述载体为一种适应真核基因表达的表达载体。
典型地,所述适应包括(仅作举例,但不局限于此),提供转录控制序列(启动子序列),调控细胞/组织特异性表达。适应还包括提供可选择的标记和自主复制序列,皆有助于所述载体在真核细胞或原核宿主中维持。可自主维持的载体称为附加型载体。附加型载体是理想的,因为他们可自我复制,所以不需要整合即可坚持。WO98/07876中描述了这种附加型载体。
这种适应有助于编码基因载体的表达,其包括提供转录终止/多腺苷酸化序列。其还包括提供内部核糖体进入位点(IRES),该位点可最大化编码基因载体的表达,这些基因排列在双或多顺反子表达盒中。
这些适应是本领域众所周知的。关于表达载体的构建和通用重组DNA技术,有大量出版文献。请参阅,Sambrook et al(1989)MolecularCloning:A Laboratory Manual,Cold Spring Harbour Laboratory,ColdSpring Harbour,NY and References Therein;Marston,F(1987)DNACloning Techniques:A Practical Approach Vol III IRL Press,Oxford Uk;DNA Cloning:F M Ausubel et al,Current Protocols In Molecular Biology,John Wiley&Sons,Inc.(1994).
该载体可以是附加型载体或整合型载体。优选地,该载体为质粒。可替选地,该载体可以是病毒,如腺病毒、腺相关病毒、疱疹病毒、牛痘病毒、慢病毒或其他反转录病毒。
可替选地,该载体可包含
A)包含来自核糖体蛋白基因启动区的至少500个连续核苷酸的元件;
B)异源启动子;以及
C)多克隆位点,
其中插入到所述多克隆站点的可转录核酸序列能够由所述异源启动子转录,所述元件可增强其转录水平。
本发明的另一个方面,提供了宿主细胞,其包含本文所描述的分离的多核苷酸或载体。优选地,所述宿主细胞为哺乳动物细胞,更优选地,其选自CHO,NS0,BHK,Hela,HepG2。
本发明还提供了一种多肽表达方法,其包括将含有本发明多核苷酸的表达载体插入到本文所描述的适当的宿主细胞中,在合适的条件下,培养所述宿主细胞,使之表达。优选地,所述多肽是一种对治疗有用的多肽。
本发明的另一个方面,提供了一药学制剂,其含有本文所描述的多核苷酸、载体或宿主细胞,和药学上所接受的载体、赋形剂、缓冲剂或介质。
附图简述
图1所示为载体rps3-1005-EGFP的质粒图谱(见实施例1)。
图2所示为载体rps11-1005-EGFP的质粒图谱(见实施例2)。
图3所示为转染后八天,EGFP报告基因被各种rps3构建体在CHO-K1细胞中表达经流式细胞仪分析的结果。图A所示为平均荧光,图B表示表达报告基因到可探测水平的细胞百分比(%阳性细胞)。见实施例1。
图4所示为转染后七天,报告基因被rps11构建体在CHO-K1细胞中表达(流式细胞仪分析)。A和C为总计数,B到E为基于种群中正在表达的细胞的结果。图A所示为在稳定选定的池中细胞的平均荧光,图B所示为阳性细胞百分比(%)。见实施例2。
图5所示为报告基因在稳定转染的NS0细胞中的表达水平,其是受hCMV启动子所驱动,不存在额外的元件,或将8kb的hnRNPA2或3kb的RPS3元件放置到紧邻hCMV启动子的5’端。图A所示为在28天时,稳定池的平均荧光强度,图B所示为阳性细胞百分比(%)。
图6所示为rps11构建体,与图5类似的数据。图A所示为稳定池的平均荧光强度值,由HCMV驱动的构建体,或紧邻启动子的5’端带有8kb的hnRNPA2或3kb的RPS3元件的相同的构建体5’。图B所示为在表达报告基因的池中,细胞的百分比(阳性细胞百分比(%))。
具体实施方式
材料和方法
微阵列分析
按照生产商的操作规程,从约80%汇合的CHO-K1细胞中,用RNeasy RNA提取试剂盒(Qiagen,Crawley,英国),提取总RNA。使用代表13443已知转录本的小鼠70聚体寡核苷酸文库(Operon V.1),对总RNA(2μg/μl)进行微阵列表达分析。辛辛那提大学,基因组学及微阵列实验室,根据参照的操作规程(http://microarray.uc.edu),承担了微阵列分析。
根据增加的荧光,对基因转录本序列进行排列。在先前的研究中,我们详细介绍了HNRPA2B1/CBX3位点作为染色质-重塑元件,使hCMV受益,HNRPA2转录本被确定为基线表达水平。不过,用现有的微阵列分析,HNRPA2转录本几乎检测不到。由于HNRPA2转录本的表达水平为最小的,使用HNRPA2作为我们的参考,已确定3829个序列用于潜在分析。因此,从排序的表达的转录本的最高2%(76个序列)中,根据包含CpG岛和一个或多个假定/已知转录起始位点的标准,确定了7个序列(见表1)。CpG岛的位置、大小和GC∶CG比,使用GrailEXP进行了验证(http://compbio.ornl.gov)。假定/已知转录起始位点从NIX blast分析(http://www.hqmp.mrc.ac.uk)和Ensembl数据库(http://www.ensembl.org)确定。
含有CpG岛的片段的PCR扩增
设计PCR寡核苷酸,根据已知或预计的编码序列结构(见表2),扩增约3kb片段,该片段包含嵌入启动区的完整的CpG岛,同时包括约500bp的编码序列。
PCR反应含有特异于每个基因组片段的寡核苷酸组(每种引物2pmol;表2)。使用FailsafeTM PCR premixes A-F(Cambio,UK),1单位的Taq DNA聚合酶(Promega,UK)和200ng模板DNA进行PCR扩增。最初变性为96℃,2分钟,进行35个PCR扩增循环(94℃,1分钟,55-60℃,1分钟,72℃,5分钟)。最后延伸步骤(72℃,10分钟)。
按照制造商提供的操作规程,使用GFX DNA纯化柱(Amersham公司,UK)对PCR产物进行凝胶纯化,并按照制造商提供的操作规程(TOPO;Invitrogen,UK)进行TOPOTA克隆
Figure A20068001730900201
。为克隆到TOPO载体(Invitrogen,UK)中,包含CpG岛的每个片段获得正义和反义方向。
表达载体构建
将从pEGFP-N1中获得的hCMVI EGFPI sv40pA(Nhe//Age/缺失的多克隆位点)插入到CET 900,然后将该载体的Asc盒插入到CET1005的Asc位点,可构建为对照表达载体(命名为CET1005EGFP,SEQID NO:20)。
除非另有说明,从TOPO2.1(Invitrogen,UK)中的所有CpG岛片段去除。将Terf2ip Acc651/EcoRV片段插入到1005的Acc65I/SwaI中。将GAPDH的SpeI/SnaBI位点插入到1005的PmeI/XbaI中。将RPS3XbaI//SpeI片段插入到1005的XbaI。将TOPO4.0和TOPO2.1(Invitrogen,UK)中的RPS11和TUBA1EcoRI的平头片段分别去除,并插入到10005的PmeI。最后,将A430106P18Rik(EcoRV)和2510006D16Rik(BstXI)片段也插入1005的PmeI。所有含有CpG岛的片段均以正义和反义方向紧邻hCMV启动子上游插入。
细胞系和转染
将CHO-K1细胞在HAMS F12(Invitrogen,Paisley,UK)加上4500mg/l L-丙氨酰-L-谷氨酰胺,10μg/ml青霉素、10μg/ml链霉素和10%(v/v)热灭活胎牛血清(FCS;Invitrogen,Paisley,UK)的培养基中培养。通过电穿孔进行转染,用来自80%汇合培养物的大约107个细胞和BioRad Gene Pulser IITM装置递送单一脉冲975μF,250V。转染使用2μg线性CET1005EGFP质粒和等效摩尔数量的不同大小的表达载体。选择稳定的转染细胞,并在含有12.5μg/ml硫酸嘌呤霉素(Sigma,UK)的生长培养基中维持。
转基因表达定量
用Becton-Dickinson FACScan分析转染有EGFP报告基因构建体的细胞,采用亲本CHO-K1细胞系作为背景自身荧光对照。
表1序列分析
a.基因库登陆号
b.Enseml描述(http://www.enseml.org/)
c.Gailexp(http://compbio.orni.org/gailexp)
d.Gapd-来自人序列
表2PCR寡核苷酸和扩增子大小
 位点   正义链   反义链   扩增子
Terf2ip   gtagtttctgacttggaaatgt(SEQ ID NO:3)   aactgacctgccatgccattc(SEQ ID NO:4) 2995bp
Gapd   gagcagtccggtgtcacta(SED ID NO:5)   gcagagaagcagacagttatg(SEQ ID NO:6) 3096bp
RPS3   cagagcatcaagtacctgtga(SEQ ID NO:7)   taaccactaagccatctctcc(SEQ ID NO:8) 3056bp
TUBA1   caagaacaaggaagctggcc(SEQ ID NO:9)   taaaacccacagcactgtaggg(SEQ ID NO:10) 3049bp
RPS11   aagactgtttgcctcatgcc(SEQ ID NO:11)   ggatgacaatggtcctctgc(SEQ ID NO:12) 3020bp
A430106P18Rik   atggttgtaggttcacgtcc(SEQ ID NO:13)   atccctcacattgccaagcc(SEQ ID NO:14) 3128bp
2510006D16Rik   acttaagacctgatgcctcc(SEQ ID NO:15)   gctagcttacataggcagcc(SEQ ID NO:16) 2997bp
实施例1rps3元件驱动的表达
SEQ ID NO:1示出了RPS2克隆序列(第38-3154位核苷酸);SEQID NO:17示出了完整的pRPS3-1005-EGFP质粒的序列;SEQ ID NO:18示出了完整的pCET1015-EGFP质粒序列。
研究EGFP在CHO-K1池中,转染八天后的表达水平,该CHO-K1池只含有hCMV(对照构建体;pCET1005-EGFP质粒;在转染前用Pmel线形化),以及含有构建体,所述构建体含有8kb的RNPA2片段(pCET1015-EGFP质粒,在转染前用Pmel线形化)和Rps3(pRPS3-1005-EGFP质粒,在转染前用Pmel线形化)。
以含有Rps3的构建体生成的池中,相比较于对照构建体,EGFP表达水平显着增加。添加hCMV启动子上游的Rps3序列,相对于对照或含有hnRNPA2元件的构建体,平均荧光强度分别增加了5.5倍或1.5倍(图3A)。
研究构建体在NS0细胞中的活性。相比较于仅是hCMV启动子,当包含RPS3元件或hnRNPA2元件时,在稳定池中平均荧光强度分别增加了28倍或18倍(图5A)。
在CHO-K1细胞和NS0细胞中,含有hnRNPA2元件时,阳性细胞的比例显著增加,但含有RPS3元件时,这种增幅更大(图3B和5B)。
实施例2rps11元件驱动的表达
SEQ ID NO:2示出了RPS11克隆序列(第12-3032位核苷酸);SEQ ID NO:19示出了pRPS11-1005-EGFP的完整序列。
将含有Rps11的载体和对照载体(PmeI线性化)转染到CHO-K1和NS0细胞系中,经嘌呤霉素选择后获得稳定的池。通过FACscan分析评估EGFP平均表达水平。
hCMV上游Rps11元件的加入,使得EGFP在CHO-K1细胞池中的平均表达水平,相比较于含有上述RNPA2片段的构建体,增加了1.2倍(图4A)。
以含有Rps11的构建体稳定转染的NS0细胞系,其平均EGFP表达水平,相比较于hCMV和RNPA2构建体,(分别)增加了1.8倍和1.5倍。
相比较于RNPA2构建体,以Rps11构建体转染的CHO-K1细胞系,其阳性细胞比例增加(图4B)。此外,相比较于hCMV和RNPA2构建体,以Rps11构建体转染的NS0细胞池,其阳性细胞比例增加(图6B)。
序列表
<110>密理博公司(Millipore Corporation)
<120>改进的表达元件(Improved expression elements)
<130>SCT075082-47
<160>20
<170>PatentIn version 3.2
<210>1
<211>3145
<212>DNA
<213>Mus musculus rps3
<400>1
ctagtaacgg ccgccagtgt gctggaattc gcccttataa ccactgagcc atctctccag     60
ccctgagtca tgattttagt gtgagaggca tcattgaatt ttctgagcac ggccatcagg    120
gtagctggca caggtcttca gatacaagga gatagttata agaaggcagc catggctgtg    180
gtgcactaga aatggagaaa cagcttcatc aggtgacaga ccagtctgac tctgtcccat    240
gattagaagc catcttgtta caaggtcaaa ataagttcat tcctgttttc tgtaacactt    300
gggtttgatc ctgtcgtcaa cccattttct ggaatttgac atgttccata ctccattata    360
ccctgacttc caccctgata agatgttctg ccaagttcct gtgtagccaa cattcccctg    420
gaaatctctc ttcccttgga aaccacctag tcttagaaat tttgagttat ataaattcca    480
cttctatgtt tgatgctatt ctttaaaact ccactttagg gagatagccc tgtctgatag    540
aaaataaaac ttgcttaatt tgtctaaaag agtttaagta atagttttta cttttgttcc    600
gtgggattaa tacagggtga aacagactcc cgtgtttcca gtgtgaagtg agccacacac    660
tgcagtacaa gttatatcag caggttctgc ctctgggcaa tgaacttttg cttgtgtgga    720
catcagggtc tgtgtgaagg gaaggtccta tggcctagat ttatactatt caacagtctg    780
tccccgaagc cctggtgctt tattattttg acaagcccct gctgctggta ttccaccctg     840
ctgcgagtca aaaaagttcc tgtctcggaa aaacaaaaca aaacaaaaca accaaaaaat     900
aaaatttttt tttcccacag gttctagtgg aggtgctcac taccagaaat cctacaaata     960
agcccatctc atggatcagg gtttaccttt gtaataatat taaatctgtg tgcatgtgcg    1020
cacgcatgtg ttttatgctt gcatatatgt atacgcagcc atggttttct actgtcccac    1080
tcactctgta acttactgag ccatccagct ggtcctctaa atacatttca atgaaagttt    1140
tcattagcgt gaacgtgaag gtggtaaaat ctgttagtgt gtgcttatgc ctgtggtttg    1200
cacctctagt ctgaaggttg ctcttttcaa attttttatt tatttacgtt tttacttttg    1260
agtcagaaac tcataaaggc caagctggcc tcgaattcgc tatgtagtca atgatgacct    1320
taaacttgtg accctctact tcgttagtgc tggaacccca agcttgctga gtacagagca    1380
ctttcagacc ggaactagat gtctacttcc tgttccgcct acattacagg ttgctaggtt    1440
acaccccccc tacgccgttt tagacgcaaa acttcatttc ccatgcaaaa cttcatttcc    1500
catgaacact tgcaagggtc gccgcgctgc gcggcgtcat tgctcccgcc ctatatacct    1560
acttccgccc gcgagccact tcctttcctt tcagcggcgc gcggctgcaa gatggcggtg    1620
cagatttcca agaagaggaa ggtaagcgtc tgggcccggt tcgggagtcc gccgcgggtt    1680
ctacaagtgc cagggaggcc tgtggctccg tgatcagtcc tgtggagcgt ctggggccgc    1740
ctgccgtctc ttcgagcctc ggatggccgt agattgtgta ttgggccgga gccgggcgag    1800
tgctgtgtgc ctgggcaagg gagggacaaa ctcctcgagt tctggaccga ctcgaacacc    1860
gggcgcctcc agttccggac tagacacctt tgagcgtttc ttggtctcca taatagtaat    1920
cctgtggcac agttagaggg cgtgtgccat cagatctagt ccagtttctt tagtaagtga    1980
agtttagcag tcccttctct tagtcgcgtg atcctgcaag tggccatagt tgaaagccta    2040
cttactgact gctgccgtgt tcactcggga cccggagctg cagcgtccct gtggttatca    2100
tttcatgggg gaaaagtgtg caggttgcca ggtttagaaa tagatggtct gtcgtttgtg    2160
cttatgcaca cagatgataa acctgttttg agtcaggatt cctctcctat ccgaggtaca    2220
acttacagtc ccagctgtac atgtgctact tggagacaga tttttctttg tctcttgggt    2280
gtagattatg ccgtagagcc cttcgatgaa gaggtgatga cgagtctgag taggaagtgt    2340
tgtctttgtc caagatgcct cactatgctg cgttctgtgg cacagctgaa agcactgtgg    2400
tcaaaagaaa cttcctaaag atgaccaaga ggcatttgtc tgagaagggt tgctgctttt    2460
ctgtagggcc attgggcttg ctctgactaa ccctgtcttc acctcagagg taacttgttt    2520
cctttggttc agtttgtagc tgatggcatc ttcaaagctg agctgaatga atttctcact    2580
cgggagctgg ctgaagatgg ctactctgga gttgaagtcc gagttacacc aaccaggaca    2640
gaaatcatta ttttagccac caggtagaaa taccattgat tgtcacctgt aaatactgtg    2700
tgtactgaga tgctgtgtaa acttgggcca accaagcagt aaatctggcc tcagtgggtg    2760
taactgcttt gttagaactg catttgggaa gaacttacct tccatttaac gtgtgtgctg    2820
gcgttgtggt gggcggcagg tgggatcttg agtaaatggt tgcgcttccc ctctacagga    2880
cacagaatgt tcttggggag aagggtcgtc ggatcagaga gttgaccgca gttgtccaga    2940
agcgctttgg cttccctgaa ggcagcgtag aggtgagttc ctctgcttta tctcccgggg    3000
gttttagact gagttgggat gtggcttctg ctatagaatt gtacttctga aaacctgaca    3060
tggccagtga cagtcacagg tacttgatgc tctgagggcg aattctgcag atatccatca    3120
cactggcggc cgctcgagca tgcat                                          3145
<210>2
<211>3039
<212>DNA
<213>Mus musculus rps11
<400>2
aattcgccct taagactgtt tgcctcatgc ctgcctggcc tgcccttcct ccgccgccaa    60
ctagggaagt ggggaccaaa ggttccttag gcactgctcc tgtgggtaga ggggacatta     120
gagagctgac agcgcaccac ctgcatgagt ttttattaaa gtgcaaacca tgggatgaat     180
cagttgagct tcagtgttga aaatgagtag cagggctgcc ccacccacct gaccaagtac     240
cctattctgc agctatgaaa atgagatctg cacatgagct ggggttcaca agtgcacact     300
tggagcactg ccttgctcct tcccagcaga ccacaaagca gtatttttct ggaggatttt     360
atgtgctaat aaattatttg acttaagtgt gtacgatgtg tgctgtgcag agaggggcag     420
agggcaccag caggtcatct gcatgggggg cccctttggg tgaatccttg ctcacgggat     480
aggctttgtt gctcaaaagt tgcagatata catcttgggt cctgtcctag atggtgttac     540
tgtaagtcag caccaagata caagagctgg tacctggact gtaggaggtc aggccatgac     600
acaaaggctg ggactaaagg catttaccac gcctgagtct tctggttctt taaacatcaa     660
atccttccgg gggctggcga gatggctcag tggttaagag cacagactgc tcttacgaag     720
gatccgagtt caaatcccag caaccaaatg gtgcctaaca actatccata atgaaatctg     780
atgccctctt ctggagtatc tgagaacagc tacagtgtac ttacatataa tcttaaaaat     840
gcttcccatg ttaaccacca ctagagtttt tattacagct agctgacctg gaagccaagt     900
ccttatgcct ccgtgagtgc tggggttaaa aagatccagc accactcaaa atgtcaatct     960
attttgaaaa tatgctttat actgttctag cccatctgtg cagggctaga acggtgaata    1020
cgagaaactg acacaagctt ttgccacctg gctaaatggt tcctctatta cctggggtgg    1080
tcacctaagg ttagacactc atccacgagt agtcaggaca taaacccatc aaagtgtggg    1140
tagacgcgca gcctgagata ctgtcaacaa aggacatgcg accttggtga cgtcggcctt    1200
taataaaagg aagaaaggtt gactattcgg tcgacgctgg ctgctcctga catcgtatgg    1260
cagatactct gctgtaaagc ggttcacccc tttcttgaga cccgctctgc acggccgctt    1320
ctctctggaa actgaatccc agcacgtgtt tcccaacccg tacggcacgc cttctccgcc    1380
ctaagcctcg ccgtaccaca tgatgcacgt ttcctccaca tcgtgctcct gaaatctcgc    1440
gagatgatag gatcttcccg ccccttagtc ctcccccgtc atggcggcgt acggacagtc    1500
ccaggaacgc gggctctcgc cggaagtacc tcccacctcc gtgaggataa ccccgcgtca    1560
cttccgcccc gacctcgcgt ggtgaataag gaagccggga gcggccctgc ctctcccttt    1620
ctccggcggc cgggaagatg gcggacattc aggttcgagc gtttagttgc tttcccccga    1680
cgcttcggtg tggagcgtat cccttggcgt cctcgttgtc ttacgcatta gctgaagcga    1740
ggatgcctgc gaatgccttc gtctcaggcg gctcggaaat ccgggctcta cgcagtaatg    1800
gggtccctgg cgcttcggga gttggttctt aaagctcaga gcttaacggg tgagggattg    1860
tggcgggagg agggcatcct gcggcgcggg agtcctgcgg cggcagagcc ggggacactg    1920
ggtaaagcag gttttttccc cttgatggag actgaggccc ggacctcgtg cgctctacgg    1980
cagggctgcg gtcccgacct cgctgtagtt ttcagtgtga gcgcagctct ggcctcgatg    2040
agcttaggct tgtcttaaac ttgccatcct gcctcaacct caaccgggat gacagatccg    2100
gcccaccagg ctcggctacg tggacataag cttgaatccc gaatgagtgg atttgtatgt    2160
tttggaggtc cagtctggct gaaaagctct ttttgatctc agccgtgagt tctgcaggct    2220
gtggaggtgt tagatgggac gcagtgtgtg agctaaacta gacttggggt ggttggagag    2280
ccctgaccag ccggttttgg cgattggggc aaataaggtt gaaggtagga aggaagaaat    2340
attgtctctg atttccttga actttacctg caacctcacc aaattctcat ccctacagac    2400
ggagcgtgct taccaaaagc agcctacgat ctttcaaaac aagaagcggg ttctgctggg    2460
agaaaccggc aaggaaaaac tccctcggta ctacaagaat atcggtctag gcttcaagac    2520
gcctaaagag gtacaggacc ctccagcaga tgagatccct gctgccctgc acgtgtggga    2580
gcacagccac cccgccccct tcacagtggc ttcccatggg cccctgggaa ttgtagtatg    2640
ggccctgagg cgtcatcctt ggttctgttt aggaagtggt aatctaaacc ccactttctt    2700
aactttgcag gctattgagg gtacctacat agacaagaaa tgccccttca ctggtaacgt    2760
ctccatccga ggtcggatcc tgtctggtga gtgggatgtt ggaagggtgg ttctaggttc    2820
ctgcgtccag gggcgctggc aagtgatgtc tgttctcacg atggtcttca gatgtcctct    2880
agggcactgc tgagacagcc agttgacaaa gctgatgcca taaatggagc ttcttgggag    2940
ccccgttcaa ctgactccta cctgctaaca cctttctgtt actctcccag gtgtcgtgac    3000
gaagatgaag atgcagagga ccattgtcat ccaagggcg                           3039
<210>3
<211>22
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>3
gtagtttctg acttggaaat gt    22
<210>4
<211>21
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>4
aactgacctg ccatgccatt c    21
<210>5
<211>19
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>5
gagcagtccg gtgtcacta      19
<210>6
<211>21
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>6
gcagagaagc agacagttat g    21
<210>7
<211>21
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>7
cagagcatca agtacctgtg a    21
<210>8
<211>21
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>8
taaccactaa gccatctctc c    21
<210>9
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>9
caagaacaag gaagctggcc       20
<210>10
<211>22
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>10
taaaacccac agcactgtag gg    22
<210>11
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>11
aagactgttt  gcctcatgcc      20
<210>12
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>12
ggatgacaat  ggtcctctgc     20
<210>13
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>13
gtggttgtag gttcacgtcc    20
<210>14
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>14
atccctcaca ttgccaagcc    20
<210>15
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>15
acttaagacc tgatgcctcc    20
<210>16
<211>20
<212>DNA
<213>Artificial
<220>
<223>Synthetic PCR oligonucleotide
<400>16
gctagcttac ataggcagcc    20
<210>17
<211>8691
<212>DNA
<213>Artificial
<220>
<223>Vector pRPS3 1005 EGFP
<400>17
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc     60
gggccccccc tcgaagttta aacatttaaa tctagtaacg gccgccagtg tgctggaatt    120
cgcccttata accactgagc catctctcca gccctgagtc atgattttag tgtgagaggc    180
atcattgaat tttctgagca cggccatcag ggtagctggc acaggtcttc agatacaagg    240
agatagttat aagaaggcag ccatggctgt ggtgcactag aaatggagaa acagcttcat    300
caggtgacag accagtctga ctctgtccca tgattagaag ccatcttgtt acaaggtcaa    360
aataagttca ttcctgtttt ctgtaacact tgggtttgat cctgtcgtca acccattttc    420
tggaatttga catgttccat actccattat accctgactt ccaccctgat aagatgttct    480
gccaagttcc tgtgtagcca acattcccct ggaaatctct cttcccttgg aaaccaccta    540
gtcttagaaa ttttgagtta tataaattcc acttctatgt ttgatgctat tctttaaaac    600
tccactttag ggagatagcc ctgtctgata gaaaataaaa cttgcttaat ttgtctaaaa    660
gagtttaagt aatagttttt acttttgttc cgtgggatta atacagggtg aaacagactc    720
ccgtgtttcc agtgtgaagt gagccacaca ctgcagtaca agttatatca gcaggttctg    780
cctctgggca atgaactttt gcttgtgtgg acatcagggt ctgtgtgaag ggaaggtcct    840
atggcctaga tttatactat tcaacagtct gtccccgaag ccctggtgct ttattatttt    900
gacaagcccc tgctgctggt attccaccct gctgcgagtc aaaaaagttc ctgtctcgga    960
aaaacaaaac aaaacaaaac aaccaaaaaa taaaattttt ttttcccaca ggttctagtg    1020
gaggtgctca ctaccagaaa tcctacaaat aagcccatct catggatcag ggtttacctt    1080
tgtaataata ttaaatctgt gtgcatgtgc gcacgcatgt gttttatgct tgcatatatg    1140
tatacgcagc catggttttc tactgtccca ctcactctgt aacttactga gccatccagc    1200
tggtcctcta aatacatttc aatgaaagtt ttcattagcg tgaacgtgaa ggtggtaaaa    1260
tctgttagtg tgtgcttatg cctgtggttt gcacctctag tctgaaggtt gctcttttca    1320
aattttttat ttatttacgt ttttactttt gagtcagaaa ctcataaagg ccaagctggc    1380
ctcgaattcg ctatgtagtc aatgatgacc ttaaacttgt gaccctctac ttcgttagtg    1440
ctggaacccc aagcttgctg agtacagagc actttcagac cggaactaga tgtctacttc    1500
ctgttccgcc tacattacag gttgctaggt tacacccccc ctacgccgtt ttagacgcaa    1560
aacttcattt cccatgcaaa acttcatttc ccatgaacac ttgcaagggt cgccgcgctg    1620
cgcggcgtca ttgctcccgc cctatatacc tacttccgcc cgcgagccac ttcctttcct    1680
ttcagcggcg cgcggctgca agatggcggt gcagatttcc aagaagagga aggtaagcgt    1740
ctgggcccgg ttcgggagtc cgccgcgggt tctacaagtg ccagggaggc ctgtggctcc    1800
gtgatcagtc ctgtggagcg tctggggccg cctgccgtct cttcgagcct cggatggccg    1860
tagattgtgt attgggccgg agccgggcga gtgctgtgtg cctgggcaag ggagggacaa    1920
actcctcgag ttctggaccg actcgaacac cgggcgcctc cagttccgga ctagacacct    1980
ttgagcgttt cttggtctcc ataatagtaa tcctgtggca cagttagagg gcgtgtgcca    2040
tcagatctag tccagtttct ttagtaagtg aagtttagca gtcccttctc ttagtcgcgt    2100
gatcctgcaa gtggccatag ttgaaagcct acttactgac tgctgccgtg ttcactcggg    2160
acccggagct gcagcgtccc tgtggttatc atttcatggg ggaaaagtgt gcaggttgcc    2220
aggtttagaa atagatggtc tgtcgtttgt gcttatgcac acagatgata aacctgtttt    2280
gagtcaggat tcctctccta tccgaggtac aacttacagt cccagctgta catgtgctac    2340
ttggagacag atttttcttt gtctcttggg tgtagattat gccgtagagc ccttcgatga    2400
agaggtgatg acgagtctga gtaggaagtg ttgtctttgt ccaagatgcc tcactatgct    2460
gcgttctgtg gcacagctga aagcactgtg gtcaaaagaa acttcctaaa gatgaccaag    2520
aggcatttgt ctgagaaggg ttgctgcttt tctgtagggc cattgggctt gctctgacta    2580
accctgtctt cacctcagag gtaacttgtt tcctttggtt cagtttgtag ctgatggcat    2640
cttcaaagct gagctgaatg aatttctcac tcgggagctg gctgaagatg gctactctgg    2700
agttgaagtc cgagttacac caaccaggac agaaatcatt attttagcca ccaggtagaa    2760
ataccattga ttgtcacctg taaatactgt gtgtactgag atgctgtgta aacttgggcc    2820
aaccaagcag taaatctggc ctcagtgggt gtaactgctt tgttagaact gcatttggga    2880
agaacttacc ttccatttaa cgtgtgtgct ggcgttgtgg tgggcggcag gtgggatctt    2940
gagtaaatgg ttgcgcttcc cctctacagg acacagaatg ttcttgggga gaagggtcgt    3000
cggatcagag agttgaccgc agttgtccag aagcgctttg gcttccctga aggcagcgta    3060
gaggtgagtt cctctgcttt atctcccggg ggttttagac tgagttggga tgtggcttct    3120
gctatagaat tgtacttctg aaaacctgac atggccagtg acagtcacag gtacttgatg    3180
ctctgagggc gaattctgca gatatccatc acactggcgg ccgctcgagc atgcatctag    3240
aagcttatcg ataccggtgg cgcgccaatt gaattaagat ctggcccaat gggccgtacg    3300
aattcgagct cggtacccgg ggatcctgat ctaatagtaa tcaattacgg ggtcattagt    3360
tcatagccca tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg    3420
accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc    3480
aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc    3540
agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg    3600
gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat    3660
ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg    3720
tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag    3780
tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt    3840
gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctggtttagt    3900
gaaccgtcag atccgtcgcc accatggtga gcaagggcga ggagctgttc accggggtgg    3960
tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg    4020
agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gttcatctgc accaccggca    4080
agctgcccgt gccctggccc accctcgtga ccaccctgac ctacggcgtg cagtgcttca    4140
gccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct    4200
acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg    4260
tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg    4320
aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata    4380
tcatggccga caagcagaag aacggcatca aggtgaactt caagatccgc cacaacatcg    4440
aggacggcag cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc    4500
ccgtgctgct gcccgacaac cactacctga gcacccagtc cgccctgagc aaagacccca    4560
acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg    4620
gcatggacga gctgtacaag taaagcggcc gcgactctag atcataatca gccataccac    4680
atttgtagag gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca    4740
taaaatgaat gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata    4800
aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg    4860
tttgtccaaa ctcatcaatg tatcttaact agagtcgacc tgcaggcatg caagcttacc    4920
ggtggcgcgc gcgccaattg ttaattaaga tctggcccaa tgggccgtac gaattcctta    4980
ggctaccggg taggggaggc gcttttccca aggcagtctg gagcatgcgc tttagcagcc    5040
ccgctgggca cttggcgcta cacaagtggc ctctggcctc gcacacattc cacatccacc    5100
ggccggtagg cgccaaccgg ctccgttctt tggtggcccc ttcgcgccac cttctactcc    5160
tcccctagtc aggaagttcc cccccgcccc gcagctcgcg tcgtgcagga cgtgacaaat    5220
ggaagtagca cgtctcacta gtctcgtgca gatggacagc accgctgagc aatggaagcg    5280
ggtaggcctt tggggcagcg gccaatagca gctttgctcc ttcgctttct gggctcagag    5340
gctgggaagg ggtgggtccg ggggcgggct caggggcggg ctcaggggcg gggcgggcgc    5400
ccgaaggtcc tccggaggcc cggcattctg cacgcttcaa aagcgcacgt ctgccgcgct    5460
gttctcctct tcctcatctc cgggcctttc gaccagctta ccatgaccga gtacaagccc    5520
acggtgcgcc tcgccacccg cgacgacgtc cccagggccg tacgcaccct cgccgccgcg    5580
ttcgccgact accccgccac gcgccacacc gtcgatccgg accgccacat cgagcgggtc    5640
accgagctgc aagaactctt cctcacgcgc gtcgggctcg acatcggcaa ggtgtgggtc    5700
gcggacgacg gcgccgcggt ggcggtctgg accacgccgg agagcgtcga agcgggggcg    5760
gtgttcgccg agatcggccc gcgcatggcc gagttgagcg gttcccggct ggccgcgcag    5820
caacagatgg aaggcctcct ggcgccgcac cggcccaagg agcccgcgtg gttcctggcc    5880
accgtcggcg tctcgcccga ccaccagggc aagggtctgg gcagcgccgt cgtgctcccc    5940
ggagtggagg cggccgagcg cgccggggtg cccgccttcc tggagacctc cgcgccccgc    6000
aacctcccct tctacgagcg gctcggcttc accgtcaccg ccgacgtcga ggtgcccgaa    6060
ggaccgcgca cctggtgcat gacccgcaag cccggtgcct gacgcccgcc ccacgacccg    6120
cagcgcccga ccgaaaggag cgcacgaccc catgcatcgt agacgaaatg accgaccaag    6180
cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg    6240
gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc    6300
tggagttctt cgcccaccct agggggaggc taactgaaac acggaaggag acaataccgg    6360
aaggaacccg cgctatgacg gcaataaaaa gacagaataa aacgcacggt gttgggtcgt    6420
ttgttcataa acgcggggtt cggtcccagg gctggcactc tgtcgatacc ccaccgagac    6480
cccattgggg ccaatacgcc cgcgtttctt ccttttcccc accccacccc ccaagttcgg    6540
gtgaaggccc agggctcgca gccaacgtcg gggcggcagg cccccagctt ttgttccctt    6600
tagtgagggt taatttcgag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat    6660
tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg    6720
ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag    6780
tcgggaaacc tgtcgtgcca gcatcgcgag cacttttcgg ggaaatgtgc gcggaacccc    6840
tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg    6900
ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc    6960
ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt    7020
gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct    7080
caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac    7140
ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact    7200
cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa    7260
gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga    7320
taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt    7380
tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga    7440
agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg    7500
caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat    7560
ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat    7620
tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc    7680
agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga    7740
tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc    7800
agactcgcga cactgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt    7860
gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga    7920
gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca    7980
ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg    8040
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt    8100
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc    8160
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct    8220
tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc    8280
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta    8340
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca    8400
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag    8460
tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag    8520
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt    8580
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa    8640
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc a             8691
<210>18
<211>13827
<212>DNA
<213>Artificial
<220>
<223>Vector pCET 1015 EGFP
<400>18
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc     60
gggccccccc tcgaagttta aacatttaaa tctagaagct tcaatgtttt tagcaccctc    120
tgtgtggagg aaaataatgc agattattct aattagtgta atatctaacc acattaaaat    180
atattacata gtaaactaca ctccataatt ttataaattt gactccccag ggtaataaac    240
tagtctctag tctgctcacc ttcaactgta caataaagtc ttggttcttt tgaaatagac    300
ctcaaatgag acacctaaaa ttcaaagtgt ctttacattt aaagacacct acaggaaagc    360
aggtaaaaga gccaggttaa aaacaaattc taaaaccact tagctgcagt taaacatata    420
gtaaagatgc actaaagttt cttactctgt aaatcccttc cacttcagga aatattccac    480
tttcccattc actacacgtc gatctagtac tttttccacg acaaattctt caggctctgc    540
ctcttcaact tttttactct ttccattctg tttttttccc attttttgct aaaataaaac    600
aaaagagaaa ttaagaaata ttcctcttga attttgagca cattttcaag gctcaattgc    660
ttatattatt atcacattcg acataaattt ttacttctat atcccagggc agacaccttc    720
tggaaagatt aaaagtcaac agacaataaa ataaaagaat gctttatctt gttcatttag    780
ttcaaactta caacccacca ccaaaataat acaataaaaa aacactatct ggaaacagtt    840
atttttttcc agtctttttt tttgagacag ggtctcacac tcttgtcgcc caggctggag    900
tgcagtggcg tgatctcagc tcactgcaac ctccgcctcc ccaggttcaa gcagttctca    960
tgcctcagcc tccagagtag ctgggattat aggcggatgc caccatgccg ggctaatttt   1020
ttttgtgttt ttattagaaa cagggtttca ccatgttgac caggctggtc tcaaactcct   1080
gacctgaagt gattcaccag cctgggcctc ccaaagtgct ggcattacag gcgtgagcca   1140
ctgcgcccgg ccctgtagtc ttaaaagacc aagtttacta attttcactc attttaacaa    1200
cactgcaaca aacaactatg caggaagtac ctaaagggtg atccagagaa gcaagtagta    1260
gtgacaggtc ttaggtgaac ctatgacaga ccttgtatcc acccccagat ggtaaaagcc    1320
ccagccccct tctcaattca aatattaatg tcaaaagcat caatgataca gagaaaagat    1380
aaatgcagaa tgaaaacatg gttcaaaatc ctgataccaa ctgcagggtc aactatagag    1440
accactagga ggttcaatta aaggacaaga ttatttttcc ataatctctg tagataatat    1500
ttcctaccac ttagaacaaa actataaagc tatcacttca agagaccaac attacaaatt    1560
tattttaatt ccctaaggtg aaaaaaatcc ttccttcctg gtttctcaag agaaagtcta    1620
tactggtaac caaattcact ttaaacaggc attttctttg gtatgacact atttaagaga    1680
agcaggaaac caacgtgaac cagctctttc caatggctca agatttccta tgagaggact    1740
aaaaatgggg aaaattttta tgagaggatt aaaaatgggg gaaaaaaaac cctgaaatgg    1800
ttaatcagaa gatcctatgg gctgagaagg aatccatctt aacatttcat cttaaagcaa    1860
atgctattgc cgggggcagt ggctcatgcc tgtaatccca gcactttggg aggccgaggt    1920
gggcagatca tctgaggtca ggagtttgag accagcctga ccaacatgga gaaaccccgt    1980
ttctactaaa aatacaaaat tagccaggca tagtggtgca tgcctgtaat cccagctact    2040
tgggaggctg aggcaggaga actgcttgaa cccaggaggc ttaagttgcg gtgagccaag    2100
atcacgccat tgcactctag cctggacaac aagagaaaaa ctctgtctca aaaaaacaca    2160
aaaacaaaaa acccaaatac tatttaaaaa agataaacct taattgctca atcattaaag    2220
ccatcccaca agtaaagcag caagcagaaa aaagttaaga acacctcaag gctacagaag    2280
gacatttcaa gctatgcagg catatgaagt gtgcagacag atatgtaaga aaggcctcaa    2340
gactgcaaaa gggcatttca agctatgcaa gcatataggt aacacataca cacacacaaa    2400
ataaaatccc ctgaaataca aaaacatgca gcaaacacct gacgtttttg gataccattt    2460
ctaagtcagg tgttatgatt ctcattagtc aagatacttg agtactgggc ccaaacagct    2520
ttctgccact gtacagtaca agaaggtagg aataatggtg ggaggagcaa agacaaactg    2580
taatagacag aagtgtatca gatacctata ctacatgaaa aacaaaacag ctactgccac    2640
aaagggagaa ggctaacaaa ataaagtcaa caataaatac agaaaatgaa aaggatacac    2700
actaaggttt acaaaaaaaa aaaggcagac aaaatgccat acagtattca ttcactacta    2760
tggcattcat aagctagttt caaatgctca ctattttctt ttatagtata tatttgcctt    2820
aacccagcac ttttttccaa aagtggatga gtcaaaataa atttcccatt atttaagtga    2880
aattaacagc acacatatct cacaacacta atgaattttt aaaatggaaa gttaagaact    2940
tttaaagtgg ccaacctgtg atccttcaca aaataaacta aatacaataa cagaccccaa    3000
aggctatcaa ttgcgtgcaa aaacaacttc tgttttccag ggtaaacaga atctaatgca    3060
gaatctaatg cagggtaaac agacttaatg cagaatctaa tgatggcaca aattaaaaat    3120
cactaacgtg ccctttttag tgtgaaaccc agagagagca catacaagcc aaaaacaaat    3180
gctttatttt acctaggaga cattaacatt cacctttacg tgtttaagat taatgcaatg    3240
ttaaatattg tgaaaactgt aactttgaat ttcatgattt ttatgtgaat attccagggt    3300
ttaaaaaaac ttgtaacatg acatggctga ataagataaa aaaaaaatct agccttttct    3360
cccttctggc tcatatttgc gatttcgatc attttgttta aaaaacaaaa cactgcaatg    3420
aattaaactt aatattcttc tatgttttag agtaagttaa aacaagataa agtgaccaaa    3480
gtaatttgaa agattcaatg acttttgctc caacctaggt gcacaaggta ccttgttctt    3540
taaattgggc tttaatgaaa atacttctcc agaattctgg ggatttaaga aaaattatgc    3600
caaccaacaa gggctttacc attttatgta acatttttca acgctgcaaa aatgtgtgta    3660
tttctatttg aagataaaaa tcctcagcaa aatccacatt gcactgtcct tcaaagatta    3720
gccttctttg aactagttaa gacactatta agccaagcca gtatctccct gtaatgaatt    3780
cgtttttctc ttaattttcc cctgtaattt acactgggag agctgggaaa tatgtggatg    3840
taaatttctc agccacagag atgcaaagtt atactgtggg gaaaaaaaac ttgagttaaa    3900
tccttacata ttttaggttt tcattaactt accaatgtag ttttgttgga ggccattttt    3960
tttattgcag acttgaagag ctattactag aaaaatgcat gacagttaag gtaagtttgc    4020
atgacacaaa aaaggtaact aaatacaaat tctgtttgga ttccaacccc caagtagaga    4080
gcgcacactt tcaaacgtga atacaaatcc agagtagatc tgcgctccta cctacattgc    4140
ttatgatgta cttaagtacg tgtcctaacc atgtgagtct agaaagactt tactggggat    4200
cctggtacct aaaacagctt cacatggctt aaaatagggg accaatgtct tttccaatct    4260
aagtcccatt tataataaag tccatgttcc atttttaaag gacaatcctt tcggtttaaa    4320
accaggcacg attacccaaa caactcacaa cggtaaagca ctgtgaatct tctctgttct    4380
gcaatcccaa cttggtttct gctcagaaac cctccctctt tccaatcggt aattaaataa    4440
caaaaggaaa aaacttaaga tgcttcaacc ccgtttcgtg acactttgaa aaaagaatca    4500
cctcttgcaa acacccgctc ccgacccccg ccgctgaagc ccggcgtcca gaggcctaag    4560
cgcgggtgcc cgcccccacc cgggagcgcg ggcctcgtgg tcagcgcatc cgcggggaga    4620
aacaaaggcc gcggcacggg ggctcaaggg cactgcgcca caccgcacgc gcctaccccc    4680
gcgcggccac gttaactggc ggtcgccgca gcctcgggac agccggccgc gcgccgccag    4740
gctcgcggac gcgggaccac gcgccgccct ccgggaggcc caagtctcga cccagccccg    4800
cgtggcgctg ggggaggggg cgcctccgcc ggaacgcggg tgggggaggg gagggggaaa    4860
tgcgctttgt ctcgaaatgg ggcaaccgtc gccacagctc cctaccccct cgagggcaga    4920
gcagtccccc cactaactac cgggctggcc gcgcgccagg ccagccgcga ggccaccgcc    4980
cgaccctcca ctccttcccg cagctcccgg cgcggggtcc ggcgagaagg ggaggggagg    5040
ggagcggaga accgggcccc cgggacgcgt gtggcatctg aagcaccacc agcgagcgag    5100
agctagagag aaggaaagcc accgacttca ccgcctccga gctgctccgg gtcgcgggtc    5160
tgcagcgtct ccggccctcc gcgcctacag ctcaagccac atccgaaggg ggagggagcc    5220
gggagctgcg cgcggggccg ccggggggag gggtggcacc gcccacgccg ggcggccacg    5280
aagggcgggg cagcgggcgc gcgcgcggcg gggggagggg ccggcgccgc gcccgctggg    5340
aattggggcc ctagggggag ggcggaggcg ccgacgaccg cggcacttac cgttcgcggc    5400
gtggcgcccg gtggtcccca aggggaggga agggggaggc ggggcgagga cagtgaccgg    5460
agtctcctca gcggtggctt ttctgcttgg cagcctcagc ggctggcgcc aaaaccggac    5520
tccgcccact tcctcgcccg ccggtgcgag ggtgtggaat cctccagacg ctgggggagg    5580
gggagttggg agcttaaaaa ctagtacccc tttgggacca ctttcagcag cgaactctcc    5640
tgtacaccag gggtcagttc cacagacgcg ggccaggggt gggtcattgc ggcgtgaaca    5700
ataatttgac tagaagttga ttcgggtgtt tccggaaggg gccgagtcaa tccgccgagt    5760
tggggcacgg aaaacaaaaa gggaaggcta ctaagatttt tctggcgggg gttatcattg    5820
gcgtaactgc agggaccacc tcccgggttg agggggctgg atctccaggc tgcggattaa    5880
gcccctcccg tcggcgttaa tttcaaactg cgcgacgttt ctcacctgcc ttcgccaagg    5940
caggggccgg gaccctattc caagaggtag taactagcag gactctagcc ttccgcaatt    6000
cattgagcgc atttacggaa gtaacgtcgg gtactgtctc tggccgcaag ggtgggagga    6060
gtacgcattt ggcgtaaggt ggggcgtaga gccttcccgc cattggcggc ggatagggcg    6120
tttacgcgac ggcctgacgt agcggaagac gcgttagtgg gggggaaggt tctagaaaag    6180
cggcggcagc ggctctagcg gcagtagcag cagcgccggg tcccgtgcgg aggtgctcct    6240
cgcagagttg tttctcgagc agcggcagtt ctcactacag cgccaggacg agtccggttc    6300
gtgttcgtcc gcggagatct ctctcatctc gctcggctgc gggaaatcgg gctgaagcga    6360
ctgagtccgc gatggaggta acgggtttga aatcaatgag ttattgaaaa gggcatggcg    6420
aggccgttgg cgcctcagtg gaagtcggcc agccgcctcc gtgggagaga ggcaggaaat    6480
cggaccaatt cagtagcagt ggggcttaag gtttatgaac ggggtcttga gcggaggcct    6540
gagcgtacaa acagcttccc caccctcagc ctcccggcgc catttccctt cactgggggt    6600
gggggatggg gagctttcac atggcggacg ctgccccgct ggggtgaaag tggggcgcgg    6660
aggcgggaat tcttattccc tttctaaagc acgctgcttc gggggccacg gcgtctcctc    6720
ggcgagcgtt tcggcgggca gcaggtcctc gtgagcgagg ctgcggagct tcccctcccc    6780
ctctctcccg ggaaccgatt tggcggccgc cattttcatg gctcgccttc ctctcagcgt    6840
tttccttata actcttttat tttcttagtg tgctttctct atcaagaagt agaagtggtt    6900
aactattttt tttttcttct cgggctgttt tcatatcgtt tcgaggtgga tttggagtgt    6960
tttgtgagc ttggatcttta gagtcctgcg cacctcatta aaggcgctca gccttcccct    7020
cgatgaaatg gcgccattgc gttcggaagc cacaccgaag agcggggagg gggggtgctc    7080
cgggtttgcg ggcccggttt cagagaagat atcaccaccc agggcgtcgg gccgggttca    7140
atgcgagccg taggacaaag aaaccatttt atgtttttcc tgtctttttt ttcctttgag    7200
taacggtttt atctgggtct gcagtcagta aaacgacaga tgaaccgcgg caaaataaac    7260
ataaattgga agccatcggc cacgaggggc agggacgaag gtggttttct gggcggggga    7320
gggatattcg cgtcagaatc ctttactgtt cttaaggatt ccgtttaagt tgtagagctg    7380
actcatttta agtaatgttg ttactgagaa gtttaaccct tacgggacag atccatggac    7440
ctttatagat gattacgagg aaagtgaaat aacgattttg tccttagtta tacttcgatt    7500
aaaacatggc ttcagaggct ccttcctgta atgcgtatgg attgatgtgc aaaactgttt    7560
tgggcctggg ccgctctgta tttgaacttt gttacttttc tcattttgtt tgcaatcttg    7620
gttgaacatt acattgataa gcataaggtc tcaagcgaag ggggtctacc tggttatttt    7680
tctttgaccc taagcacgtt tataaaataa cattgtttaa aatcgatagt ggacatcggg    7740
taagtttgga taaattgtga ggtaagtaat gagtttttgc tttttgttag tgatttgtaa    7800
aacttgttat aaatgtacat tatccgtaat ttcagtttag agataaccta tgtgctgacg    7860
acaattaaga ataaaaacta gctgaaaaaa tgaaaataac tatcgtgaca agtaaccatt    7920
tcaaaagact gctttgtgtc tcataggagc tagtttgatc atttcagtta attttttctt    7980
taatttttac gagtcatgaa aactacagga aaaaaaatct gaactgggtt ttaccactac    8040
tttttaggag ttgggagcat gcgaatggag ggagagctcc gtagaactgg gatgagagca    8100
gcaattaatg ctgcttgcta ggaacaaaaa ataattgatt gaaaattacg tgtgactttt    8160
tagtttgcat tatgcgtttg tagcagttgg tcctggatat cactttctct cgtttgaggt    8220
tttttaacct agttaacttt taagacaggt ttccttaaca ttcataagtg cccagaatac    8280
agctgtgtag tacagcatat aaagatttca gctctgaggt ttttcctatt gacttggaaa    8340
attgttttgt gcctgtcgct tgccacatgg ccaatcaagt aagcttatcg ataccggtgg    8400
cgcgccaatt gaattaagat ctggcccaat gggccgtacg aattcgagct cggtacccgg    8460
ggatcctgat ctaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt    8520
tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc    8580
cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac    8640
gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata    8700
tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc    8760
agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta    8820
ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac    8880
ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc    8940
aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc    9000
gtgtacggtg ggaggtctat ataagcagag ctggtttagt gaaccgtcag atccgtcgcc    9060
accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct ggtcgagctg    9120
gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg cgatgccacc    9180
tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt gccctggccc    9240
accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc cgaccacatg    9300
aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga gcgcaccatc    9360
ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga gggcgacacc    9420
ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa catcctgggg    9480
cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga caagcagaag    9540
aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag cgtgcagctc    9600
gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct gcccgacaac    9660
cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg cgatcacatg    9720
gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga gctgtacaag    9780
taaagcggcc gcgactctag atcataatca gccataccac atttgtagag gttttacttg    9840
ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg    9900
ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt    9960
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg   10020
tatcttaact agagtcgacc tgcaggcatg caagcttacc ggtggcgcgc caattgttaa   10080
ttaagatctg gcccaatggg ccgtacgaat tccttaggct accgggtagg ggaggcgctt   10140
ttcccaaggc agtctggagc atgcgcttta gcagccccgc tgggcacttg gcgctacaca   10200
agtggcctct ggcctcgcac acattccaca tccaccggcc ggtaggcgcc aaccggctcc   10260
gttctttggt ggccccttcg cgccaccttc tactcctccc ctagtcagga agttcccccc   10320
cgccccgcag ctcgcgtcgt gcaggacgtg acaaatggaa gtagcacgtc tcactagtct   10380
cgtgcagatg gacagcaccg ctgagcaatg gaagcgggta ggcctttggg gcagcggcca  10440
atagcagctt tgctccttcg ctttctgggc tcagaggctg ggaaggggtg ggtccggggg  10500
cgggctcagg ggcgggctca ggggcggggc gggcgcccga aggtcctccg gaggcccggc  10560
attctgcacg cttcaaaagc gcacgtctgc cgcgctgttc tcctcttcct catctccggg  10620
cctttcgacc agcttaccat gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac  10680
gacgtcccca gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc  10740
cacaccgtcg atccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc  10800
acgcgcgtcg ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg  10860
gtctggacca cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc  10920
atggccgagt tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg  10980
ccgcaccggc ccaaggagcc cgcgtggttc ctggccaccg tcggcgtctc gcccgaccac  11040
cagggcaagg gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc  11100
ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc  11160
ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc  11220
cgcaagcccg gtgcctgacg cccgccccac gacccgcagc gcccgaccga aaggagcgca  11280
cgaccccatg catcgtagac gaaatgaccg accaagcgac gcccaacctg ccatcacgag  11340
atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg  11400
ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccctaggg  11460
ggaggctaac tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa  11520
taaaaagaca gaataaaacg cacggtgttg ggtcgtttgt tcataaacgc ggggttcggt  11580
cccagggctg gcactctgtc gataccccac cgagacccca ttggggccaa tacgcccgcg  11640
tttcttcctt ttccccaccc caccccccaa gttcgggtga aggcccaggg ctcgcagcca  11700
acgtcggggc ggcaggcccc cagcttttgt tccctttagt gagggttaat ttcgagcttg    11760
gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac    11820
aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc    11880
acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagcat    11940
cgcgagcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca    12000
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa    12060
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt    12120
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca    12180
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag    12240
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc    12300
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca    12360
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt    12420
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct    12480
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt    12540
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga    12600
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact    12660
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc    12720
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga    12780
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt    12840
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga    12900
gataggtgcc tcactgatta agcattggta actgtcagac tcgcgacact gcattaatga    12960
atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc    13020
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg    13080
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc    13140
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc    13200
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga    13260
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc    13320
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat    13380
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg    13440
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc    13500
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga    13560
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact    13620
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt    13680
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag    13740
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg    13800
tctgacgctc agtggaacga aaactca                                        13827
<210>19
<211>8585
<212>DNA
<213>Artificial
<220>
<223>Vector pRPS11 1005 EGFP
<400>19
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc     60
gggccccccc tcgaagttta attcgccctt aagactgttt gcctcatgcc tgcctggcct    120
gcccttcctc cgccgccaac tagggaagtg gggaccaaag gttccttagg cactgctcct    180
gtgggtagag gggacattag agagctgaca gcgcaccacc tgcatgagtt tttattaaag    240
tgcaaaccat gggatgaatc agttgagctt cagtgttgaa aatgagtagc agggctgccc    300
cacccacctg accaagtacc ctattctgca gctatgaaaa tgagatctgc acatgagctg    360
gggttcacaa gtgcacactt ggagcactgc cttgctcctt cccagcagac cacaaagcag    420
tatttttctg gaggatttta tgtgctaata aattatttga cttaagtgtg tacgatgtgt    480
gctgtgcaga gaggggcaga gggcaccagc aggtcatctg catggggggc ccctttgggt    540
gaatccttgc tcacgggata ggctttgttg ctcaaaagtt gcagatatac atcttgggtc    600
ctgtcctaga tggtgttact gtaagtcagc accaagatac aagagctggt acctggactg    660
taggaggtca ggccatgaca caaaggctgg gactaaaggc atttaccacg cctgagtctt    720
ctggttcttt aaacatcaaa tccttccggg ggctggcgag atggctcagt ggttaagagc    780
acagactgct cttacgaagg atccgagttc aaatcccagc aaccaaatgg tgcctaacaa    840
ctatccataa tgaaatctga tgccctcttc tggagtatct gagaacagct acagtgtact    900
tacatataat cttaaaaatg cttcccatgt taaccaccac tagagttttt attacagcta    960
gctgacctgg aagccaagtc cttatgcctc cgtgagtgct ggggttaaaa agatccagca   1020
ccactcaaaa tgtcaatcta ttttgaaaat atgctttata ctgttctagc ccatctgtgc   1080
agggctagaa cggtgaatac gagaaactga cacaagcttt tgccacctgg ctaaatggtt   1140
cctctattac ctggggtggt cacctaaggt tagacactca tccacgagta gtcaggacat   1200
aaacccatca aagtgtgggt agacgcgcag cctgagatac tgtcaacaaa ggacatgcga   1260
ccttggtgac gtcggccttt aataaaagga agaaaggttg actattcggt cgacgctggc   1320
tgctcctgac atcgtatggc agatactctg ctgtaaagcg gttcacccct ttcttgagac   1380
ccgctctgca cggccgcttc tctctggaaa ctgaatccca gcacgtgttt cccaacccgt   1440
acggcacgcc ttctccgccc taagcctcgc cgtaccacat gatgcacgtt tcctccacat   1500
cgtgctcctg aaatctcgcg agatgatagg atcttcccgc cccttagtcc tcccccgtca    1560
tggcggcgta cggacagtcc caggaacgcg ggctctcgcc ggaagtacct cccacctccg    1620
tgaggataac cccgcgtcac ttccgccccg acctcgcgtg gtgaataagg aagccgggag    1680
cggccctgcc tctccctttc tccggcggcc gggaagatgg cggacattca ggttcgagcg    1740
tttagttgct ttcccccgac gcttcggtgt ggagcgtatc ccttggcgtc ctcgttgtct    1800
tacgcattag ctgaagcgag gatgcctgcg aatgccttcg tctcaggcgg ctcggaaatc    1860
cgggctctac gcagtaatgg ggtccctggc gcttcgggag ttggttctta aagctcagag    1920
cttaacgggt gagggattgt ggcgggagga gggcatcctg cggcgcggga gtcctgcggc    1980
ggcagagccg gggacactgg gtaaagcagg ttttttcccc ttgatggaga ctgaggcccg    2040
gacctcgtgc gctctacggc agggctgcgg tcccgacctc gctgtagttt tcagtgtgag    2100
cgcagctctg gcctcgatga gcttaggctt gtcttaaact tgccatcctg cctcaacctc    2160
aaccgggatg acagatccgg cccaccaggc tcggctacgt ggacataagc ttgaatcccg    2220
aatgagtgga tttgtatgtt ttggaggtcc agtctggctg aaaagctctt tttgatctca    2280
gccgtgagtt ctgcaggctg tggaggtgtt agatgggacg cagtgtgtga gctaaactag    2340
acttggggtg gttggagagc cctgaccagc cggttttggc gattggggca aataaggttg    2400
aaggtaggaa ggaagaaata ttgtctctga tttccttgaa ctttacctgc aacctcacca    2460
aattctcatc cctacagacg gagcgtgctt accaaaagca gcctacgatc tttcaaaaca    2520
agaagcgggt tctgctggga gaaaccggca aggaaaaact ccctcggtac tacaagaata    2580
tcggtctagg cttcaagacg cctaaagagg tacaggaccc tccagcagat gagatccctg    2640
ctgccctgca cgtgtgggag cacagccacc ccgccccctt cacagtggct tcccatgggc    2700
ccctgggaat tgtagtatgg gccctgaggc gtcatccttg gttctgttta ggaagtggta    2760
atctaaaccc cactttctta actttgcagg ctattgaggg tacctacata gacaagaaat    2820
gccccttcac tggtaacgtc tccatccgag gtcggatcct gtctggtgag tgggatgttg    2880
gaagggtggt tctaggttcc tgcgtccagg ggcgctggca agtgatgtct gttctcacga    2940
tggtcttcag atgtcctcta gggcactgct gagacagcca gttgacaaag ctgatgccat    3000
aaatggagct tcttgggagc cccgttcaac tgactcctac ctgctaacac ctttctgtta    3060
ctctcccagg tgtcgtgacg aagatgaaga tgcagaggac cattgtcatc caagggcgaa    3120
acatttaaat ctagaagctt atcgataccg gtggcgcgcc aattgaatta agatctggcc    3180
caatgggccg tacgaattcg agctcggtac ccggggatcc tgatctaata gtaatcaatt    3240
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat    3300
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt    3360
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa    3420
actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc    3480
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct    3540
acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag    3600
tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt    3660
gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac    3720
aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataagc    3780
agagctggtt tagtgaaccg tcagatccgt cgccaccatg gtgagcaagg gcgaggagct    3840
gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt    3900
cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat    3960
ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg    4020
cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc    4080
catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa    4140
gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg    4200
catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag    4260
ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat    4320
ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc    4380
catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct    4440
gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc    4500
cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccgcgact ctagatcata    4560
atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc    4620
ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat    4680
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg    4740
cattctagtt gtggtttgtc caaactcatc aatgtatctt aactagagtc gacctgcagg    4800
catgcaagct taccggtggc gcgcgcgcca attgttaatt aagatctggc ccaatgggcc    4860
gtacgaattc cttaggctac cgggtagggg aggcgctttt cccaaggcag tctggagcat    4920
gcgctttagc agccccgctg ggcacttggc gctacacaag tggcctctgg cctcgcacac    4980
attccacatc caccggccgg taggcgccaa ccggctccgt tctttggtgg ccccttcgcg    5040
ccaccttcta ctcctcccct agtcaggaag ttcccccccg ccccgcagct cgcgtcgtgc    5100
aggacgtgac aaatggaagt agcacgtctc actagtctcg tgcagatgga cagcaccgct    5160
gagcaatgga agcgggtagg cctttggggc agcggccaat agcagctttg ctccttcgct    5220
ttctgggctc agaggctggg aaggggtggg tccgggggcg ggctcagggg cgggctcagg    5280
ggcggggcgg gcgcccgaag gtcctccgga ggcccggcat tctgcacgct tcaaaagcgc    5340
acgtctgccg cgctgttctc ctcttcctca tctccgggcc tttcgaccag cttaccatga    5400
ccgagtacaa gcccacggtg cgcctcgcca cccgcgacga cgtccccagg gccgtacgca    5460
ccctcgccgc cgcgttcgcc gactaccccg ccacgcgcca caccgtcgat ccggaccgcc    5520
acatcgagcg ggtcaccgag ctgcaagaac tcttcctcac gcgcgtcggg ctcgacatcg    5580
gcaaggtgtg ggtcgcggac gacggcgccg cggtggcggt ctggaccacg ccggagagcg    5640
tcgaagcggg ggcggtgttc gccgagatcg gcccgcgcat ggccgagttg agcggttccc    5700
ggctggccgc gcagcaacag atggaaggcc tcctggcgcc gcaccggccc aaggagcccg    5760
cgtggttcct ggccaccgtc ggcgtctcgc ccgaccacca gggcaagggt ctgggcagcg    5820
ccgtcgtgct ccccggagtg gaggcggccg agcgcgccgg ggtgcccgcc ttcctggaga    5880
cctccgcgcc ccgcaacctc cccttctacg agcggctcgg cttcaccgtc accgccgacg    5940
tcgaggtgcc cgaaggaccg cgcacctggt gcatgacccg caagcccggt gcctgacgcc    6000
cgccccacga cccgcagcgc ccgaccgaaa ggagcgcacg accccatgca tcgtagacga    6060
aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca ccgccgcctt    6120
ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga tcctccagcg    6180
cggggatctc atgctggagt tcttcgccca ccctaggggg aggctaactg aaacacggaa    6240
ggagacaata ccggaaggaa cccgcgctat gacggcaata aaaagacaga ataaaacgca    6300
cggtgttggg tcgtttgttc ataaacgcgg ggttcggtcc cagggctggc actctgtcga    6360
taccccaccg agaccccatt ggggccaata cgcccgcgtt tcttcctttt ccccacccca    6420
ccccccaagt tcgggtgaag gcccagggct cgcagccaac gtcggggcgg caggccccca    6480
gcttttgttc cctttagtga gggttaattt cgagcttggc gtaatcatgg tcatagctgt    6540
ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa    6600
agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac    6660
tgcccgcttt ccagtcggga aacctgtcgt gccagcatcg cgagcacttt tcggggaaat    6720
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg    6780
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa    6840
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac    6900
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac    6960
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt    7020
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc    7080
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca    7140
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc    7200
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag    7260
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa    7320
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg    7380
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa    7440
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg    7500
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt    7560
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt    7620
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag    7680
cattggtaac tgtcagactc gcgacactgc attaatgaat cggccaacgc gcggggagag    7740
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg    7800
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat    7860
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta    7920
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa    7980
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc    8040
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt    8100
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca    8160
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg    8220
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat    8280
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta    8340
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct    8400
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac    8460
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa    8520
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa    8580
actca                                                                8585
<210>20
<211>5546
<212>DNA
<213>Artificial
<220>
<223>Vector pCET 1005 EGFP
<400>20
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac  tatagggcga attgggtacc    60
gggccccccc tcgaagttta aacatttaaa tctagaagct tatcgatacc ggtggcgcgc    120
caattgaatt aagatctggc ccaatgggcc gtacgaattc gagctcggta cccggggatc    180
ctgatctaat agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc    240
gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg    300
acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa    360
tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca    420
agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac    480
atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc     540
atggtgatgc ggttttggca gtacatcaat gggcgtggat agcggtttga ctcacgggga     600
tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg     660
gactttccaa aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg taggcgtgta     720
cggtgggagg tctatataag cagagctggt ttagtgaacc gtcagatccg tcgccaccat     780
ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg     840
cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg     900
caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct     960
cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca    1020
gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt    1080
caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt    1140
gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa    1200
gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg    1260
catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga    1320
ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta    1380
cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct    1440
gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaaag    1500
cggccgcgac tctagatcat aatcagccat accacatttg tagaggtttt acttgcttta    1560
aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt    1620
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca    1680
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct    1740
taactagagt cgacctgcag gcatgcaagc ttaccggtgg cgcgcgcgcc aattgttaat    1800
taagatctgg cccaatgggc cgtacgaatt ccttaggcta ccgggtaggg gaggcgcttt    1860
tcccaaggca gtctggagca tgcgctttag cagccccgct gggcacttgg cgctacacaa    1920
gtggcctctg gcctcgcaca cattccacat ccaccggccg gtaggcgcca accggctccg    1980
ttctttggtg gccccttcgc gccaccttct actcctcccc tagtcaggaa gttccccccc    2040
gccccgcagc tcgcgtcgtg caggacgtga caaatggaag tagcacgtct cactagtctc    2100
gtgcagatgg acagcaccgc tgagcaatgg aagcgggtag gcctttgggg cagcggccaa    2160
tagcagcttt gctccttcgc tttctgggct cagaggctgg gaaggggtgg gtccgggggc    2220
gggctcaggg gcgggctcag gggcggggcg ggcgcccgaa ggtcctccgg aggcccggca    2280
ttctgcacgc ttcaaaagcg cacgtctgcc gcgctgttct cctcttcctc atctccgggc    2340
ctttcgacca gcttaccatg accgagtaca agcccacggt gcgcctcgcc acccgcgacg    2400
acgtccccag ggccgtacgc accctcgccg ccgcgttcgc cgactacccc gccacgcgcc    2460
acaccgtcga tccggaccgc cacatcgagc gggtcaccga gctgcaagaa ctcttcctca    2520
cgcgcgtcgg gctcgacatc ggcaaggtgt gggtcgcgga cgacggcgcc gcggtggcgg    2580
tctggaccac gccggagagc gtcgaagcgg gggcggtgtt cgccgagatc ggcccgcgca    2640
tggccgagtt gagcggttcc cggctggccg cgcagcaaca gatggaaggc ctcctggcgc    2700
cgcaccggcc caaggagccc gcgtggttcc tggccaccgt cggcgtctcg cccgaccacc    2760
agggcaaggg tctgggcagc gccgtcgtgc tccccggagt ggaggcggcc gagcgcgccg    2820
gggtgcccgc cttcctggag acctccgcgc cccgcaacct ccccttctac gagcggctcg    2880
gcttcaccgt caccgccgac gtcgaggtgc ccgaaggacc gcgcacctgg tgcatgaccc    2940
gcaagcccgg tgcctgacgc ccgccccacg acccgcagcg cccgaccgaa aggagcgcac    3000
gaccccatgc atcgtagacg aaatgaccga ccaagcgacg cccaacctgc catcacgaga    3060
tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt tccgggacgc    3120
cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc accctagggg    3180
gaggctaact gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat    3240
aaaaagacag aataaaacgc acggtgttgg gtcgtttgtt cataaacgcg gggttcggtc    3300
ccagggctgg cactctgtcg ataccccacc gagaccccat tggggccaat acgcccgcgt    3360
ttcttccttt tccccacccc accccccaag ttcgggtgaa ggcccagggc tcgcagccaa    3420
cgtcggggcg gcaggccccc agcttttgtt ccctttagtg agggttaatt tcgagcttgg    3480
cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca    3540
acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca    3600
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagcatc    3660
gcgagcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat    3720
tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa    3780
aggaagagta tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt    3840
tgccttcctg tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag    3900
ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt    3960
tttcgccccg aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg    4020
gtattatccc gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag    4080
aatgacttgg ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta    4140
agagaattat gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg    4200
acaacgatcg gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta    4260
actcgccttg atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac    4320
accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt    4380
actctagctt cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca    4440
cttctgcgct cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag    4500
cgtgggtctc gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta    4560
gttatctaca cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag    4620
ataggtgcct cactgattaa gcattggtaa ctgtcagact cgcgacactg cattaatgaa    4680
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca    4740
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg    4800
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc    4860
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc    4920
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac    4980
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc    5040
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata    5100
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc    5160
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca    5220
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag    5280
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta    5340
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg    5400
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc    5460
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt    5520
ctgacgctca gtggaacgaa aactca                                         5546

Claims (27)

1.一种分离的多核苷酸,其包括
a)包含来自核糖体蛋白基因启动区的至少500个连续的核苷酸的元件,
b)异源启动子,以及
c)与所述异源启动子相邻的可转录核酸序列,其中可转录核酸序列由所述异源启动子转录,以及所述元件增强其转录水平。
2.根据权利要求1所述的多核苷酸,其中所述的核糖体蛋白基因选自RPSA,RPS2,RPS3,RPS3A,RPS4,RPS5,RPS6,RPS7,RPS8,RPS9,RPS10,RPS11,RPS12,RPS13,RPS14,RPS15,RPS15A,RPS16,RPS17,RPS18,RPS19,RPS20,RPS21,RPS23,RPS24,RPS25,RPS26,RPS27,RPS28,RPS29,RPS30,RPL3,RPL4,RPL5,RPL6,RPL7,RPL7A,RPL8,RPL9,RPL10,RPL10A,RPL11,RPL12,RPL13,RPL13A,RPL14,RPL15,RPL17,RPL18,RPL18A,RPL19,RPL21,RPL22,RPL23,RPL23A,RPL24,RPL26,RPL27,RPL27A,RPL28,RPL29,RPL30,RPL31,RPL32,RPL34,RPL35,RPL35A,RPL36,RPL36A,RPL37,RPL37A,RPL38,RPL39,RPL41,RPLP0,RPLP1,RPLP2。
3.根据权利要求1或2所述的多核苷酸,其中所述的核糖体蛋白基因是RPS3或RPS11。
4.根据权利要求1至3所述的多核苷酸,其中所述元件包含来自核糖体蛋白基因启动区的至少1000个连续的核苷酸。
5.根据以上任一权利要求所述的多核苷酸,其中所述元件包括所述核糖体蛋白基因的一个或多个外显子。
6.前述权利要求中任一项所述的多核苷酸,其中所述元件包括CpG岛。
7.根据权利要求5所述的多核苷酸,其中所述元件包括延伸的CpG岛。
8.根据权利要求6所述的多核苷酸,其中所述元件包括延伸的无甲基化的CpG岛。
9.前述权利要求中任一项所述的多核苷酸,其中核糖体蛋白基因是哺乳动物的基因。
10.根据权利要求9所述的多核苷酸,其中核糖体蛋白基因是鼠类基因。
11.根据权利要求10所述的多核苷酸,其包括SEQ ID NO:1的核苷酸序列。
12.根据权利要求10所述的多核苷酸,其包括SEQ ID NO:2的核苷酸序列。
13.根据权利要求9所述的多核苷酸,其中核糖体蛋白基因是人类基因。
14.前述权利要求中任一项所述的多核苷酸,其中所述异源启动子为组成型启动子。
15.根据权利要求14所述的多核苷酸,其中所述组成型启动子选自:巨细胞病毒早期/立即启动子、SV40、EF-1α、鲁斯氏肉瘤病毒(RSV)LTR和HIV2LTR。
16.根据权利要求1-13任一项所述的多核苷酸,其中所述异源启动子为组织特异性启动子。
17.根据权利要求16所述的多核苷酸,其中异源启动子为肿瘤选择性启动子。
18.根据权利要求17所述的多核苷酸,其中所述启动子选自:基于癌胚抗原(CEA)、前列腺特异性抗原(PSA)、环氧合酶-2(COX-2)、α-甲胎蛋白(AFP)、酪氨酸酶和T细胞因子1-4(TCF)的启动子。
19.前述权利要求中任一项所述的多核苷酸,其中所述可转录核酸编码一种多肽,所述多肽选自:抗体、抗体的功能性表位结合片段、生长因子、细胞因子、蛋白激酶、可溶性受体、膜结合受体、凝血因子等。
20.一种载体,其包含前述权利要求中任一项所述的多核苷酸。
21.根据权利要求20的真核表达载体。
22.一种真核表达载体,其包括:
a)包含来自核糖体蛋白基因启动区的至少500个连续核苷酸的元件;
b)异源启动子;以及
c)多克隆位点,
其中插入到所述多克隆位点的可转录核酸序列能够由所述异源启动子转录,以及所述元件增强其转录水平。
23.一种宿主细胞,其包含根据权利要求1-19任一项所述的分离的多核苷酸,或权利要求20-22任一项所述的载体。
24.根据权利要求23所述的宿主细胞,其中该细胞选自:CHO、NS0、BHK、HeLa、HepG2。
25.一种多肽的表达方法,其包括将根据权利要求21或22所述的表达载体插入到合适的宿主细胞中,并将该宿主细胞在合适条件下培养,使其表达。
26.根据权利要求25所述的方法,其中所述多肽是一种治疗用的多肽。
27.一种药物制剂,其包含根据权利要求1-19任一项所述的多核苷酸,根据权利要求20-22任一项所述的载体,或根据权利要求23或24所述的宿主细胞,和药学上可接受的载体、赋形剂、缓冲剂或介质。
CN2006800173095A 2005-05-17 2006-05-09 改进的表达元件 Active CN101208435B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB0509965.0 2005-05-17
GBGB0509965.0A GB0509965D0 (en) 2005-05-17 2005-05-17 Improved expression elements
US68227705P 2005-05-18 2005-05-18
US60/682,277 2005-05-18
PCT/GB2006/001656 WO2006123097A2 (en) 2005-05-17 2006-05-09 Improved expression elements

Publications (2)

Publication Number Publication Date
CN101208435A true CN101208435A (zh) 2008-06-25
CN101208435B CN101208435B (zh) 2012-05-23

Family

ID=34708242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800173095A Active CN101208435B (zh) 2005-05-17 2006-05-09 改进的表达元件

Country Status (9)

Country Link
US (2) US7632661B2 (zh)
EP (2) EP1891223B1 (zh)
JP (1) JP5080452B2 (zh)
CN (1) CN101208435B (zh)
AT (1) ATE494381T1 (zh)
DE (1) DE602006019422D1 (zh)
ES (1) ES2358680T3 (zh)
GB (1) GB0509965D0 (zh)
WO (1) WO2006123097A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108135151A (zh) * 2015-09-02 2018-06-08 瑞泽恩制药公司 前列腺癌的啮齿动物模型
CN111249457A (zh) * 2020-04-13 2020-06-09 吉林大学 核糖体蛋白sa抗体在免疫调节中的医用用途
CN111304231A (zh) * 2013-12-30 2020-06-19 库瑞瓦格股份公司 人工核酸分子

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2332972T3 (en) 2003-06-24 2018-04-23 Genzyme Corp Hitherto UNKNOWN BETA-ACTIN AND RPS21 PROMOTORS AND APPLICATIONS
US8105575B2 (en) * 2006-10-10 2012-01-31 Viromed Co., Ltd. Expression vectors with improved safety
CN101627123A (zh) * 2007-01-08 2010-01-13 米利波尔公司 消除基因扩增的高表达细胞系
WO2009155950A1 (en) 2008-06-27 2009-12-30 King Faisal Specialist Hospital And Research Centre Cloning-free method of generating transcriptionally and post-transcriptionally controllable expression active linear reporter constructs
US20110190156A1 (en) * 2008-07-15 2011-08-04 Trustees Of Dartmouth College Molecular signatures for diagnosing scleroderma
EP2411007A4 (en) * 2009-03-27 2012-12-05 Uab Research Foundation MODULATION OF IRES-MEDIATED TRANSLATION
WO2010147464A1 (en) 2009-06-15 2010-12-23 Cellagenics B.V. Use of a cysteine synthesizing enzyme as selectable marker
WO2012030218A1 (en) 2010-09-01 2012-03-08 Cellagenics B.V. Nucleic acid fragments from a ribosomal protein promoter for enhancing gene expression
TW201632625A (zh) 2011-11-28 2016-09-16 第一三共股份有限公司 源自人類基因的啟動子
WO2013163404A1 (en) * 2012-04-27 2013-10-31 The Uab Research Foundation TREATING VIRAL INFECTIONS HAVING VIRAL RNAs TRANSLATED BY A NON-IRES MEDIATED MECHANISM
US11254951B2 (en) 2014-12-30 2022-02-22 Curevac Ag Artificial nucleic acid molecules
EP3495486B1 (en) * 2013-12-30 2020-12-16 CureVac AG Artificial nucleic acid molecules
AU2015332577B2 (en) * 2014-10-15 2021-12-23 Amgen Inc. Promoter and regulatory elements for improved expression of heterologous genes in host cells
EP3589329B1 (en) 2017-05-11 2022-10-12 Zentrum für Forschungsförderung in der Pädiatrie GmbH Concept for the treatment of monogenetic disorders
US20210317498A1 (en) 2018-08-09 2021-10-14 Daiichi Sankyo Company, Limited PROMOTER of Hspa8 GENE

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583009A (en) 1992-12-08 1996-12-10 University Of Washington Method of preparing recombinant proteins in transgenic animals containing metallothionein gene elements that bestow tissue-independent copy number-dependent, position-indepedent gene expression
US5610053A (en) * 1993-04-07 1997-03-11 The United States Of America As Represented By The Department Of Health And Human Services DNA sequence which acts as a chromatin insulator element to protect expressed genes from cis-acting regulatory sequences in mammalian cells
US6110666A (en) 1994-06-09 2000-08-29 Medical Research Council Locus control subregions conferring integration-site independent transgene expression abstract of the disclosure
DE19539493A1 (de) * 1995-10-24 1997-04-30 Thomae Gmbh Dr K Starker homologer Promotor aus Hamster
WO1998007876A2 (en) 1996-08-16 1998-02-26 Medical Research Council Self-replicating episomal expression vectors conferring tissue-specific gene expression
JP4220673B2 (ja) * 1998-07-21 2009-02-04 ミリポア・コーポレイション 遍在性クロマチンオープニングエレメント(ucoe)を含むポリヌクレオチド
ATE539161T1 (de) * 1998-07-21 2012-01-15 Millipore Corp Ein ein allgegenwärtiges chromatin-öffnendes element (ucoe) enthaltendes polynucleotid
GB0022995D0 (en) * 2000-09-20 2000-11-01 Cobra Therapeutics Ltd Polynucleotide
KR100996016B1 (ko) 2000-09-20 2010-11-22 밀리포어 코포레이션 폴리뉴클레오티드
ATE460493T1 (de) * 2001-04-05 2010-03-15 Millipore Corp Gesteigerte genexpression
US7812148B2 (en) 2001-04-05 2010-10-12 Millipore Corporation Vectors comprising CpG islands without position effect varigation and having increased expression
AU2002310321A1 (en) * 2001-06-04 2002-12-16 Corixa Corporation Compositions and methods for high-level, large-scale production of recombinant proteins
KR20040044433A (ko) 2001-07-10 2004-05-28 아이덱 파마슈티칼즈 코포레이션 세포자멸사 과정의 저해 및 세포 기능의 개선
US7384744B2 (en) * 2002-11-29 2008-06-10 Boehringer Ingelheim Pharma Gmbh & Co., Kg Expression vector, methods for the production of heterologous gene products and for the selection of recombinant cells producing high levels of such products

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111304231A (zh) * 2013-12-30 2020-06-19 库瑞瓦格股份公司 人工核酸分子
CN108135151A (zh) * 2015-09-02 2018-06-08 瑞泽恩制药公司 前列腺癌的啮齿动物模型
CN111249457A (zh) * 2020-04-13 2020-06-09 吉林大学 核糖体蛋白sa抗体在免疫调节中的医用用途
WO2021208749A1 (zh) * 2020-04-13 2021-10-21 吉林大学 核糖体蛋白sa抗体在免疫调节中的医用用途

Also Published As

Publication number Publication date
EP1891223A2 (en) 2008-02-27
GB0509965D0 (en) 2005-06-22
ES2358680T3 (es) 2011-05-12
ATE494381T1 (de) 2011-01-15
CN101208435B (zh) 2012-05-23
DE602006019422D1 (de) 2011-02-17
US7632661B2 (en) 2009-12-15
EP1891223B1 (en) 2011-01-05
JP2008539781A (ja) 2008-11-20
WO2006123097A3 (en) 2007-01-11
EP2295589A1 (en) 2011-03-16
WO2006123097A2 (en) 2006-11-23
JP5080452B2 (ja) 2012-11-21
US20080097088A1 (en) 2008-04-24
US20100015107A1 (en) 2010-01-21

Similar Documents

Publication Publication Date Title
CN101208435A (zh) 改进的表达元件
AU2020260491B2 (en) Gene therapies for lysosomal disorders
ES2805045T3 (es) Vectores lentivirales
KR102006527B1 (ko) 전립선-연관 항원의 발현을 위한 벡터
KR20190065251A (ko) 모듈러 AAV 전달 시스템을 통한 CRISPR-Cas 게놈 가공
US20030119104A1 (en) Chromosome-based platforms
CN101233238A (zh) 人细胞系中重组人蛋白质的无血清稳定转染和生产
CN1533432A (zh) 高水平、大规模生产重组蛋白的组合体和方法
JP2003534775A (ja) タンパク質を不安定化する方法とその使用
KR20210150486A (ko) 리소좀 장애에 대한 유전자 요법
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
KR20230019063A (ko) C9orf72 연관 질환의 치료를 위한 삼중 기능 아데노-연관 바이러스 (aav) 벡터
KR20210118402A (ko) 위스콧-알드리치(Wiskott-Aldrich) 증후군에 대한 조혈 줄기 세포-유전자 치료요법
KR20240037192A (ko) 게놈 통합을 위한 방법 및 조성물
US20030166890A1 (en) Gene expression
US20240082327A1 (en) Retroviral vectors
CN114645066B (zh) 一种用于艾滋病基因治疗的核酸构建体
DK2921048T3 (en) SUS SCROFA V2G: SAFE HARBOR PLACE FOR LONG-TERM EXPRESSION AND HIGH INTEGRATION OF TRANSGENERS IN A PIG
TW202246508A (zh) 反轉錄病毒載體
KR100955756B1 (ko) 개량된 유전자 발현
TW202424202A (zh) 逆轉錄病毒載體
CA2522166C (en) Lambda integrase mutein for use in recombination
WO2024062259A1 (en) Retroviral vector comprising rre inserted within an intron
KR20210150487A (ko) 리소좀 장애를 위한 유전자 요법
US20030053991A1 (en) Retinoic acid receptor beta-2, its agonists, and gene theraphy vectors for the treatment of neurological disorders

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: EMD MILLIPORE CORPORATION

Free format text: FORMER NAME: MILLIPORE CORP.

CP01 Change in the name or title of a patent holder

Address after: Massachusetts, USA

Patentee after: Millipore Corp.

Address before: Massachusetts, USA

Patentee before: Millipore Corp.