CN101395177A - 来自浮萍科的表达控制元件 - Google Patents

来自浮萍科的表达控制元件 Download PDF

Info

Publication number
CN101395177A
CN101395177A CNA2007800075839A CN200780007583A CN101395177A CN 101395177 A CN101395177 A CN 101395177A CN A2007800075839 A CNA2007800075839 A CN A2007800075839A CN 200780007583 A CN200780007583 A CN 200780007583A CN 101395177 A CN101395177 A CN 101395177A
Authority
CN
China
Prior art keywords
sequence
seq
nucleotide sequence
duckweed
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800075839A
Other languages
English (en)
Inventor
L·F·迪凯
K·M·寇克斯
C·G·皮勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Synthon BV
Original Assignee
Biolex Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biolex Inc filed Critical Biolex Inc
Publication of CN101395177A publication Critical patent/CN101395177A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了用于调节所关注的核苷酸序列在植物中的表达的组合物和方法。所述组合物包括新的核酸分子及其变体和片段,如分离自浮萍科(Lemnaceae)的泛素、r-组蛋白和几丁质酶(chinatase)基因的表达控制元件。另外提供了利用本文所公开的表达控制元件在植物中表达所关注的核苷酸序列的方法。还提供了新的浮萍科信号肽编码序列和由其编码的信号肽。在本发明的表达构建体设计用于表达所关注的多肽之处,可以将该新的信号肽-编码序列包含于本发明的表达构建体中,以提供编码的所关注的多肽的细胞外分泌。

Description

来自浮萍科的表达控制元件
发明领域
本发明涉及用于增强基因在植物中的表达的组合物和方法。
发明背景
浮萍是单子叶浮萍科(Lemnaceae)唯一的成员。5个属和38个物种都是小的、自由浮动的淡水植物,它的地理分布范围遍及全球(Landolt(1986)Biosystematic Investigation on the Family ofDuckweeds:The Family of Lemnaceae—A Monograph Study(Geobatanischen Institut ETH,Stiftung Rubel,Zurich))。尽管已知浮萍为在形态学上最简化的植物,但大多数浮萍种具有大很多的植物所具有的所有组织和器官,包括根、茎、花、种子和叶。已经对浮萍物种进行了广泛的研究并且存在大量文献对它们的生态学、系统学、生活周期、代谢、疾病和虫害易感性、它们的生殖生物学、遗传结构和细胞生物学进行了详细的描述(Hillman(1961)Bot.Review27:221;Landolt(1986)Biosystematic Investigation on theFamily of Duckweeds:The Family of Lemnaceae—A MonographStudy(Geobatanischen Institut ETH,Stiftung Rubel,Zurich))。
浮萍的生长习性对于微生物培养方法来说是理想的。该植物通过新叶的营养性出芽,以类似于酵母的无性繁殖的宏观方式迅速增殖。这种增殖通过分生细胞的营养性出芽完成。分生组织区很小并且发现是在叶状体的腹侧表面上。分生细胞位于两个囊中,叶的中脉的每一侧上各有一个。该小的中脉区也是根起源和茎产生的位点,其将每一叶与其母叶连接。分生组织的囊通过组织瓣保护。叶从这些囊交替地出芽。倍增时间因种而不同并且短至20-24个小时(Landolt(1957)Ber.Schweiz.Bot.Ges.67:271;Chang等,(1977)Bull.Inst.Chem.Acad.Sin.24:19;Datko和Mudd(1970)Plant Physiol.65:16;Venkataraman等,(1970)Z Pflanzenphysiol.62:316)。
浮萍的集约培养导致每单位时间最高速率的生物量积累(Landolt和Kandeler(1987)The Family of Lemnaceae—AMonographic Study Vol.2:Phytochemistry,Physiology,Application,Bibliography(Veroffentlichungen desGeobotanischen Institutes ETH,Stiftung Rubel,Zurich)),干物质积累量的范围是鲜重的6-15%(Tillberg等,(1979)Physiol.Plant.46:5;Landolt(1957)Ber.Schweiz.Bot.Ges.67:271;Stomp,数据未公开)。据报道,在不同条件下生长的许多浮萍物种的蛋白质含量的范围是干重的15-45%(Chang等,(1977)Bull.Inst.Chem.Acad.Sin.24:19;Chang和Chui(1978)Z.Pflanzenphysiol.89:91;Porath等,(1979)Aquatic Botany 7:272、Appenroth等,(1982)Biochem.Physiol.Pflanz.177:251)。利用这些值,在浮萍中每升培养基的蛋白质生产水平在与酵母基因表达系统相同的数量级上。
浮萍植物或浮萍结节培养物(nodule culture)可以用含有所关注的核苷酸序列的表达盒,通过多种方法的任意一种进行有效地转化,所述方法包括农杆菌介导的基因转移、基因枪轰击(ballisticbombardment)或电穿孔。稳定的浮萍转化体可以通过这样分离:用所关注的核苷酸序列和赋予对选择试剂抗性的基因两者转化浮萍细胞,之后在含有该选择试剂的培养基中培养转化的细胞。参见Stomp等的美国专利No.6,040,498。
浮萍基因表达系统提供了应该可用于许多研究和商业应用的关键技术。总的来说,对于植物分子生物学研究,可以以酵母的实验室便利性进行操作的分化植物系统提供了在其中分析分离的基因的发育和生理学作用的非常快速的系统。对于有价值的多肽的商业生产,基于浮萍的系统具有许多优于现存的微生物培养系统或细胞培养系统的优点。植物显示了类似于哺乳动物细胞的翻译后加工,克服了一个与生物学上活性哺乳动物多肽在微生物细胞中生产相关的主要问题,并且已经通过其它研究显示,植物系统具有在微生物系统中常常缺乏的组装多亚基蛋白质的能力(Hiatt(1990)Nature 334:469)。增大浮萍生物量至商业化生产重组蛋白质所需的水平比类似增大哺乳动物细胞更快且成本更划算,并且与其它提出的植物生产系统(例如大豆和烟草)不同,浮萍可以在完全装满和可控的生物量生产容器中生长,使得将该系统整合进现存的蛋白质生产工业基础结构更容易。
因此,仍然需要用于在浮萍中表达所关注的蛋白质的最优化的组合物和方法。
发明简述
提供了用于在植物中调节基因表达的组合物和方法。组合物包含新的表达控制元件(如启动子和内含子)的核苷酸序列,该表达控制元件分离自浮萍科的泛素、置换型(r)-组蛋白和几丁质酶基因。本发明的表达控制元件在植物中起始有效连接的异源核苷酸序列的转录。更具体来讲,本发明组合物包含在SEQ ID NO:1-3、NO:13和NO:14中示出的表达控制元件及其变体和片段。组合物还包含这些浮萍科表达控制元件内的新的内含子序列,尤其是在SEQ ID NO:7-9中示出的内含子序列及其变体和片段。这些内含子序列可以有效连接至所关注的启动子以增强有效连接的异源核苷酸序列在植物中的表达。
还提供了在SEQ ID NO:16中示出的新的浮萍科几丁质酶信号肽及其变体和片段,该信号肽由SEQ ID NO:15中示出的序列编码。该信号肽编码序列可以有效连接至所关注的多肽的编码序列以引导编码的多肽的细胞外分泌。
本发明提供了表达构建体(如表达盒和载体),其包含有效连接至所关注的异源核苷酸序列的本发明的表达控制元件和/或内含子和/或信号肽-编码序列。还提供了具有本发明的表达构建体的稳定转化的植物、植物细胞和结节。
本发明的组合物可用于引导所关注的核苷酸序列在植物或植物细胞或结节中表达的方法。本发明的方法包括将表达构建体引入植物或植物细胞或结节中,该表达构建体具有有效连接至所关注的核苷酸序列的浮萍科泛素、r-组蛋白或几丁质酶表达控制元件(例如,如在SEQ ID NO:1-3、NO:13和NO:14中示出的)或其变体或片段。本发明的方法还包含将表达构建体引入植物或植物细胞或结节中,该表达构建体包含分离自膨胀浮萍(Lemna gibba)核酮糖-1,5-二磷酸羧化酶小亚基基因(RbcS;例如,如SEQ ID NO:10-12中示出的)的表达控制元件。在其它实施方案中,本发明的方法包括将表达构建体引入植物或植物细胞或结节中,该表达构建体具有有效连接至所关注的多肽的编码序列的浮萍科几丁质酶信号肽-编码序列(例如,如在SEQ ID NO:15中示出的)或其变体或片段。
在一些实施方案中,本发明的方法涉及由所关注的核苷酸序列编码的多肽在植物表达系统(如,浮萍表达系统)中的产生。本发明的植物表达系统经优化而产生了高水平的所关注的多肽序列。因而,本发明包括用于在植物中表达所关注的核苷酸序列的方法,该植物用表达所关注的核苷酸序列的表达构建体转化,其中这些核苷酸序列经过修饰而增强了它们在植物中的表达。
本发明的这些和其它方面在下面给出的“发明详述”中得到了更详细的公开。
发明详述
本发明提供了涉及新的植物表达控制元件的核酸的组合物和方法,该植物表达控制元件调节异源核苷酸序列在植物中的转录。具体而言,本发明的组合物包含分离自浮萍科的泛素、r-组蛋白和几丁质酶基因的表达控制元件,包括在SEQ ID NO:1-3、NO:13和NO:14中示出的表达控制元件及其变体和片段,如本文在下面所定义的。在这些表达控制元件内的各个启动子序列(SEQ ID NO:4-6、NO:13和NO:14)和内含子序列(SEQ ID NO:7-9)也可用于调节植物中的转录。本发明还提供了新的浮萍(L.minor)几丁质酶信号肽(SEQ ID NO:16)和对应的编码序列(SEQ ID NO:15),及其变体和片段。
如本文所用的,“核酸”包括单链或双链形式的脱氧核糖核酸或核糖核酸聚合物,并且除非另作限制,否则涵盖已知的具有天然核苷酸的基本特性的类似物(如肽核酸),因为它们以类似于天然存在的核苷酸的方式与单链核酸杂交。
本发明涵盖了分离的或基本纯化的核酸组合物。“分离的”或“纯化的”核酸分子大体上或基本上不含这样的组分,所述的组分如在它们天然存在的环境中所发现的,通常伴随所述核酸分子或蛋白质或者与其相互作用。因而,“分离的”或“纯化的”核酸分子在通过重组技术生成时基本上无其它细胞物质或培养基,或者在化学合成时基本上无化学前体或其它的化学试剂。优选地,“分离的”核酸不含在该核酸源自的生物体的基因组DNA中,天然位于该核酸旁侧的序列(即,位于核酸的5′末端和3′末端的序列)(优选为蛋白质编码序列)。例如,在多个实施方案中,分离的核酸分子可含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在该核酸源自的细胞的基因组DNA中天然位于该核酸分子旁侧的核苷酸序列。
本发明的组合物包含分离的核酸分子,该核酸分子包含SEQ ID NO:1-3、NO:13和NO:14中示出的表达控制元件的核苷酸序列及其变体和片段,如本文在下面所描述的。“表达控制元件”意指DNA的调控区,其通常包含能够引导RNA聚合酶II在特定编码序列的合适转录起始位点起始RNA合成的TATA盒。表达控制元件可另外包含通常位于TATA盒的上游或5′端的其它识别序列,其影响(如增强)转录起始速率。此外,表达控制元件可另外包含通常位于TATA盒的下游或3′端的序列,其影响(如增强)转录起始速率。
应当认识到,一旦已经确定了本文所公开的表达控制元件区域的核苷酸序列,则分离和确定本文所确定的具体表达控制元件区域上游的5′非翻译区(UTR)中的其它调控元件是在现有技术的范围内。因而,(例如)本文所公开的表达控制元件区域还可包含另外的调控元件,例如负责编码序列的组织表达和时间表达的那些调控元件、增强子等。具体参见澳大利亚专利No.AU-A-77751/94和美国专利No.5,466,785及No.5,635,618(将这两者均以引用方式并入本文)。
本发明的表达控制元件分离自浮萍科数个成员的泛素、r-组蛋白和几丁质酶基因,并因而称为“浮萍科表达控制元件”。SEQ ID NO:1示出了全长的浮萍(Lemna minor)泛素表达控制元件,其包括启动子加5′UTR(核苷酸1-1625)和内含子(核苷酸1626-2160)两者。SEQ ID NO:2示出了全长的紫萍(Spirodella polyrrhiza)泛素表达控制元件,其包括启动子加5′UTR(核苷酸1-1041)和内含子(核苷酸1042-2021)两者。SEQ ID NO:3示出了全长的稀脉萍(Lemna aequinoctialis)泛素表达控制元件,其包括启动子加5′UTR(核苷酸1-964)和内含子(核苷酸965-2068)。SEQ ID NO:4示出了浮萍泛素表达控制元件的启动子加5′UTR部分。SEQ ID NO:5示出了紫萍泛素表达控制元件的启动子加5′UTR部分。SEQ ID NO:6示出了稀脉萍泛素表达控制元件的启动子加5′UTR部分。SEQ ID NO:7示出了浮萍泛素表达控制元件的内含子部分。SEQ ID NO:8示出了紫萍泛素表达控制元件的内含子部分。SEQ ID NO:9示出了稀脉萍泛素表达控制元件的内含子部分。
SEQ ID NO:13示出了全长的浮萍r-组蛋白表达控制元件,其包括启动子加5′UTR。SEQ ID NO:14示出了全长的浮萍几丁质酶表达控制元件,其包括启动子加5′UTR。SEQ ID NO:15示出了浮萍几丁质酶的信号肽-编码序列。SEQ ID NO:16示出了浮萍几丁质酶的信号肽。
应当认识到,在SEQ ID NO:4-6、NO:13和NO:14中示出的单独的启动子加5′UTR序列,及其生物学上的活性变体和片段可用于调节有效连接的所关注的核苷酸序列在植物中的转录。类似地,在SEQ IDNO:7-9中示出的一个或多个内含子序列及其生物学上的活性片段或变体可有效地连接至所关注的启动子(包括在SEQ ID NO:4、5、6、13或14中示出的启动子),以便增强有效连接至该启动子的核苷酸序列的表达。
所公开的表达控制元件、信号肽-编码序列以及编码的信号肽的片段和变体也由本发明所涵盖。本文中表达控制元件的“片段”意指全长表达控制元件的一部分,例如在SEQ ID NO:1-3、NO:13和NO:14中示出的任意一个表达控制元件的一部分。表达控制元件的片段保留了生物学活性并因而包括能起始或增强有效连接的核苷酸序列的表达的片段。因而,(例如)短于本文所公开的全长表达控制元件的片段可用来驱动连接的所关注的核苷酸序列(例如编码异源蛋白质的核苷酸序列)的表达。表达控制元件的这种片段的具体的非限制性实例包括:(i)在SEQ ID NO:4-9任意之一中示出的核苷酸序列(如上文中所述的);(ii)浮萍泛素表达控制元件(SEQ ID NO:1)的5′截短形式,例如SEQ ID NO:1的核苷酸1288-2160(截短的LmUbq的启动子No.1,如下文所述的Egs22构建体中存在的)和SEQ ID NO:1的核苷酸1132-2160(截短的LmUbq的启动子No.2,如下文所述的Egs23构建体中存在的);(iii)浮萍r-组蛋白表达控制元件(SEQ ID NO:13)的5′截短形式,例如SEQ ID NO:13的核苷酸461-1808(LmHIS(461-1808),如下文所述的Egs19构建体中存在的)和SEQ ID NO:13的核苷酸805-1808(LmHIS(805-1808),如下文所述的Egs20构建体中存在的);以及(iv)浮萍几丁质酶表达控制元件(SEQ ID NO:14)的5′截短形式,例如SEQ ID NO:14的核苷酸51-1338(LmCHT(51-1338),如下文所述的Egs24和Egs25构建体中存在的)。
如本文所用的,对于指定的核苷酸序列,“全长序列”表示具有天然序列的全部核酸序列。“天然序列”意指内源序列,即在生物体基因组中发现的非工程序列。
因而,浮萍科表达控制元件的片段可用作表达控制元件的生物学上的活性部分。表达控制元件的生物学上的活性部分可以通过这样制备:分离本发明的表达控制元件之一的一部分并评估该表达控制元件的该部分的活性(如起始或增强转录的能力)。作为表达控制元件的片段的核酸分子包含至少15、20、25、30、35、40、45、50、75、100、325、350、375、400、425、450、500、550、600、650、700、800、900、1200、1500、1800或2000个连续的核苷酸,或直至本文所公开的全长表达控制元件中存在的核苷酸数(即,对于SEQ ID NO:1为2160个核苷酸,对于SEQ ID NO:2为2021个核苷酸,对于SEQ ID NO:3为2068个核苷酸,对于SEQ ID NO:13为1808个核苷酸,而对于SEQID NO:14为1338个核苷酸)。
这样的片段的核苷酸将通常包含特定表达控制元件的TATA识别序列。这样的片段可以通过利用限制性内切酶切割本文所公开的天然存在的表达控制元件获得;可以通过合成表达控制元件DNA序列的天然存在的序列的核苷酸序列获得;或者可以通过利用聚合酶链式反应(PCR)技术获得。具体参见Mullis等,(1987)MethodsEnzymol.155:335-350,以及Erlich等,(1989)PCRTechnology(Stockton Press,New York)。这些表达控制元件片段的变体(例如通过定点诱变产生的那些变体)也包含在本发明的组合物中。
本文中信号肽编码序列和编码的信号肽的“片段”旨在表示编码序列的一部分或由其编码的信号肽的一部分。对于编码序列,核苷酸序列的片段可编码保留了天然多肽(在该情况下,为天然的浮萍几丁质酶信号肽)的生物学活性的多肽片段。因而,浮萍几丁质酶信号肽的功能性片段可引导所关注的成熟蛋白质通过植物细胞的分泌途径移出。核苷酸编码序列的片段的范围是至少约20个核苷酸、约25个核苷酸、约50个核苷酸、约75个核苷酸,并且直至编码浮萍几丁质酶信号肽的整个核苷酸序列(即,直至SEQ ID NO:15的84个核苷酸)。
“变体”意指与本文所公开的表达控制元件(如SEQ ID NO:1-3、NO:13和NO:14)或其片段(如在SEQ ID NO:4-9中示出的序列),或与信号肽-编码序列(如SEQ ID NO:15)或信号肽(如SEQ ID NO:16)或其片段具有基本相似性的序列。对于核苷酸序列,天然存在的变体(例如上述这些)可以用熟知的分子生物学技术,例如用如下文概述的PCR和杂交技术鉴定。核苷酸序列变体还包括通过合成衍生的核苷酸序列,例如那些如通过利用定点诱变产生的序列。一般而言,本发明的具体核苷酸序列的变体(包括SEQ ID NO:1-9和13-15任意一个的变体)应该与该核苷酸序列具有至少40%、50%、60%、65%、70%,通常至少75%、80%、85%,优选约90%、91%、92%、93%、94%至95%、96%、97%,并且更优选98%、99%或更大的序列同一性,序列同一性通过下文所描述的序列比对程序采用默认参数测定。生物学上的活性变体也由本发明所涵盖。生物学上的活性变体包括(例如)具有一个或多个核苷酸取代、缺失或插入的本发明的天然表达控制元件或天然信号肽-编码序列。
如本文所用的,两个核酸序列或两个多肽序列的“序列同一性”或“同一性”涉及在这两个序列中当在特定比较窗口上以最大的对应性比对时其中相同的残基。“比较窗口”意指连续且确定的多核苷酸/多肽序列的片段,其中比较窗口中的多核苷酸/多肽序列与用于这两个序列的最佳比对的参考序列(其不包含添加或缺失)比较可包含添加或缺失(即空位)。通常,比较窗口的长度为至少20个连续的核苷酸/氨基酸,并且可任选为30、40、50、100个核苷酸/氨基酸或更长。
用于比较的序列的比对方法是本领域熟知的。因而,任意两个序列之间的百分比序列同一性的测定可用数学算法完成。这种数学算法的非限制性实例是Myers和Miller的算法((1988)CABIOS 4:11-17);Smith等的局部比对算法((1981)Adv.Appl.Math.2:482)、Needleman和Wunsch的全局比对算法((1970)J.Mol.Biol.48:443-453);Pearson和Lipman的搜索-局部比对法(search-for-localalignment method)((1988)Proc.Natl.Acad.Sci.85:2444-2448);Karlin和Altschul的算法((1990)Proc.Natl.Acad.Sci.USA 87:2264),其在Karlin和Altschul(1993)Proc.Natl.Acad.Sci USA 90:5873-5877中得到改进。
这些数学算法的计算机实现可用于进行序列比较以测定序列同一性。这些实现包括但不限于:PC/Gene程序中的CLUSTAL(可从Intelligenetics,Mountain View,California获得);ALIGN程序(2.0版)和GCGWisconsin Genetics软件包(10版)中的GAP、BESTFIT、BLAST、FASTA和TFASTA(可从Accelrys公司,9685 Scranton Road,San Diego,California,USA获得)。用这些程序进行比对可采用默认参数进行。
CLUSTAL程序由Higgins等,(1988)Gene 73:237-244(1988);Higgins等,(1989)CABIOS 5:151-153;Corpet等,(1988)NucleicAcids Res.16:10881-90;Huang等,(1992)CABIOS 8:155-65;以及Pearson等,(1994)Meth.Mol.Biol.24:307-331进行了充分的描述。ALIGN程序是基于Myers和Miller的算法(1988)CABIOS4:11-17。当比较氨基酸序列时,用ALIGN程序可采用下列参数:PAM120残基权重表、空位长度罚分=12以及空位罚分=4。Altschul等的BLAST程序((1990)J.Mol.Biol.215:403)是基于Karlin和Altschul的算法((1990)Proc.Natl.Acad.Sci.USA 87:2264)。BLAST核苷酸搜索可用BLASTN程序(得分=100,字串长度=12)进行,以获得与本发明的核苷酸序列同源的核苷酸序列。BLAST蛋白质搜索可用BLASTX程序(得分=50,字串长度=3)进行,以获得与本发明的蛋白质或多肽同源的氨基酸序列。对于为了比较目的而获得带空位的比对,可以如在Altschul等,(1997)Nucleic Acids Res.25:3389中所描述的利用Gapped BLAST(在BLAST 2.0中)。可选择地,PSI-BLAST(在BLAST 2.0中)可用于进行检测分子之间的亲缘关系的迭代搜索。参见Altschul等,(1997)Nucleic Acids Res.25:3389。当使用BLAST、Gapped BLAST、PSI-BLAST时,可以采用各自程序的默认参数(如,对于核苷酸序列用BLASTN而对于蛋白质用BLASTX)。
GAP采用了Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453),用以得到两个完整序列的匹配数最大而空位数最小的比对。GAP考虑所有可能的比对和空位位置并且产生具有最大数量的匹配碱基和最少空位的比对。它允许提供匹配的碱基单位中的空位产生罚分和空位延伸罚分。GAP必须考虑它插入的每个空位的匹配的空位产生罚分数。如果选择大于0的空位延伸罚分,对于插入的每个空位,GAP必须另外算上空位的长度与空位延伸罚分的积。GCG WisconsinGenetics软件包版本10中的默认的用于蛋白质序列的空位产生罚分值和空位延伸罚分值分别为8和2。对于核苷酸序列,默认的空位产生罚分是50,而默认的空位延伸罚分为3。空位产生罚分和空位延伸罚分可以表示为选自0至200的整数。因而,(例如)空位产生罚分和空位延伸罚分可以是0、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65或更大。
GAP代表了多种最佳比对方法的其中一种。这类最佳比对方法可能有许多,但是其它成员不具有更好的性质。GAP显示了用于比对的四个准则:质量、比率、同一性和相似性。质量指为了比对序列而最大化了的尺度。比率指质量除以短片段中的碱基数。百分比同一性指实际匹配符号的百分比。百分比相似性指相似符号的百分比。在空位对面的符号忽略不计。当一对符号的打分矩阵值大于或等于0.50(相似性阀值)时,相似性被打分。在GCG Wisconsin Genetics软件包版本10中使用的打分矩阵是BLOSUM62(参见Henikoff and Henikoff(1992)Proc.Natl.Acad.Sci.USA 89:10915)。比对也可以通过目测手动进行。
两个核酸分子是密切相关的的替代指示是这两个分子可以在严格条件下互相杂交。严格条件是序列依赖性的并且在不同的环境参数下不同。通常,在确定的离子强度和pH下,选择严格条件为比特定序列的热解链温度(Tm)约低5-20℃。Tm是50%的靶序列杂交至完全匹配的探针时的温度(在确定的离子强度和pH下)。核酸杂交的条件和严格性的计算可以在(例如)Sambrook等,(2001)Molecular Cloning:A Laboratory Manual(Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY)和Tijssen(1993)Hybridization With NucleicAcid Probes,Part I:Theory and Nucleic Acid Preparation(Laboratory Techniques in Biochemistry and Molecular Biology,Elsevier Science Ltd.,NY,NY)中找到。
对于本发明而言,“严格条件”包括如果杂交分子和靶序列之间存在低于25%的错配杂交在其下才会发生的条件。“严格条件”可分成具体的严格水平以便更精确的定义。因而,如本文所用的,“适度严格性”条件指具有多于25%序列错配的分子不会在其下杂交的那些条件;“中度严格性”条件指具有多于15%错配的分子不会在其下杂交的那些条件;而“高严格性”条件指具有多于10%错配的序列不会在其下杂交的那些条件。“非常高的严格性”条件指具有多于6%错配的序列不会在其下杂交的那些条件。
任何浮萍科表达控制元件或其片段或变体的表达控制元件活性可用多种本领域技术人员所熟知的技术测定,所述的技术包括(例如)RNA印迹分析、遭受转录融合的报告子活性测量等。参见(例如)Sambrook等(2001)Molecular Cloning:A Laboratory Manual(ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY)。可选择地,表达控制元件的测定可以基于对在表达控制元件或其片段或变体的控制下产生的报告基因(例如β-葡萄糖醛酸酶(GUS)、绿色荧光蛋白(GFP)等)的水平来测量。参见,例如,美国专利No.6,072,050,将其以引用方式并入本文。浮萍几丁质酶信号肽或其片段或变体的活性同样可以用多种本领域技术人员所熟知的技术测定,包括检测几丁质酶信号肽或其片段或变体引导所关注多肽的细胞外分泌的能力的那些技术。
用于诱变和核苷酸序列变更的方法是本领域所熟知的。参见,例如Kunkel(1985)Proc.Natl.Acad.Scl.USA 82:488-492、Kunkel等,(1987)Methods in Enzymol.154:367-382;美国专利No.4,873,192(将其以引用方式并入本文);Walker和Gaastra,eds.(1983)Techniques in Molecular Biology(MacMillanPublishing Company,NY)以及其中所引用的参考文献。
本发明的浮萍科表达控制元件及其变体或片段在组装于核苷酸构建体内使得该表达控制元件有效连接至所关注的核苷酸序列时,使得能在植物或植物细胞或结节(如,(例如)来自紫萍(Spirodela)属、芜萍(Wolffia)属、Wolfiella属、Landoltia属或浮萍(Lemna)属的浮萍植物或浮萍植物细胞或结节)中表达所有效连接的核苷酸序列。“有效连接”意指所关注的核苷酸序列的转录或翻译是在表达控制元件的影响下。以这种方式,本发明表达控制元件的核苷酸序列与用于在植物或植物细胞或结节中表达的所关注的核苷酸序列(通常为异源核苷酸序列)一起在表达盒或载体中提供。“异源核苷酸序列”意指不是天然与表达控制元件有效连接的序列。虽然该核苷酸序列对所述表达控制元件来说是异源的,但对植物宿主来说它可以是同源的、或天然的、或异源的、或外来的。
应当认识到,本发明的表达控制元件或其变体或片段可用于驱动各自天然编码序列的表达。这种构建体可改变天然的多肽在植物或植物细胞中的表达水平。因而,可以改变植物或植物细胞的表型。
如本文所用的,“载体”指用于将核苷酸构建体(例如表达盒)引入宿主细胞中的DNA分子例如质粒、粘粒或噬菌体。克隆载体通常含有一个或少量的限制性核酸内切酶识别位点以及如本文在下面所描述的标记基因,在该识别位点外源DNA序列可以以可测定的方式插入而不会丧失载体的基本生物学功能,该标记基因适合用于鉴定和选择用克隆载体转化的细胞。
如本文所用的,术语“植物”包括整株植物、植物器官(如,叶、茎、根等)、种子、植物细胞和植物的后代。转基因植物的部分在本发明的范围内应该理解为包括(例如)植物细胞、原生质体、组织、愈伤组织、胚以及花、胚珠、茎、果实、叶、根、根尖等,其源自预先用本发明的DNA分子转化的转基因植物或它们的后代并因而由至少一部分转基因细胞组成。如本文所用,术语“植物细胞”包括而不限于种子、胚、分生组织区、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子的细胞。可用于本发明方法的植物类型大致与可用于转化技术的高等植物的类型一样广泛,包括单子叶植物和双子叶植物两者。这样的植物包括(例如)浮萍。
术语“浮萍”指浮萍科的成员。该科通常分成如下5个属和38个浮萍种:浮萍属(稀脉萍、L.disperma、L.ecuadoriensis、膨胀浮萍、L.japonica、浮萍、L.miniscula、L.obscura、稀脉浮萍(L.perpusilla)、L.tenera、品藻(L.trisulca)、L.turionifera、L.valdiviana);紫萍属(Spirodela)(S.intermedia、紫萍(S.polyrrhiza)、S.punctata);芜萍属(Wolffia)(Wa.angusta、芜萍(Wa.arrhiza)、Wa.australina、Wa.borealis、Wa.brasiliensis、Wa.columbiana、Wa.elongata、微萍(Wa.globosa)、Wa.microscopica、Wa.neglecta);Wolfiella属(Wl.caudata、Wl.denticulata、Wl.gladiata、Wl.hyalina、Wl.lingulata、Wl.repunda、Wl.rotunda和Wl.neotropica)和Landoltia属(L.punctata)。浮萍科的任何其它属或种(如果它们存在的话)也是本发明的方面。浮萍属物种可以用Landolt(1986)BiosystematicInvestigation on the Family of Duckweeds:The family ofLemnaceae—A Monograph Study(Geobatanischen Institut ETH,Stiftung Rubel,Zurich)所描述的分类学方法进行分类。
如本文所用的,术语“浮萍结节”指包含的浮萍细胞中至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的细胞是分化细胞的浮萍组织。如本文所用的,“分化细胞”是具有至少一种表型特征(如截然不同的细胞形态学或标记核酸或蛋白质的表达)的细胞,该表型特征可将该细胞与未分化细胞或存在于其它组织类型中的细胞区分开来。本文所述的浮萍结节培养物的分化细胞形成了在它们邻近的细胞壁处与结节融合的互连细胞的平整光滑表面,其中结节已经开始构成散布于整个组织的叶原基。结节培养物的组织的表面具有通过胞间连丝(Plasmadesmata)相互连接的表皮细胞。
在一些实施方案中,提供了包含有效连接至所关注的核苷酸序列的浮萍科表达控制元件或其变体或片段的表达盒或载体,用于在植物或植物细胞或结节中表达由所关注的核苷酸序列编码的多肽。有效连接的所关注的核苷酸序列可以是其在植物或植物细胞或结节中的表达是期望的任何序列。所关注的核苷酸序列将通常是如本文中定义的异源核苷酸序列。示例性的所关注的异源核苷酸序列包括(但不限于)编码例如下列哺乳动物多肽的序列:胰岛素、生长激素、α-干扰素、β-干扰素、β-葡糖脑苷脂酶、β-葡萄糖醛酸酶、视网膜母细胞瘤蛋白、p53蛋白质、制管张素、瘦素、促红细胞生成素、粒细胞巨噬细胞集落刺激因子、纤维蛋白溶酶原、单克隆抗体、Fab片段、单链抗体、细胞因子、受体、人疫苗、动物疫苗、肽和血清白蛋白。
术语“多肽”、“肽”和“蛋白质”在本文中可交换地使用来指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是对应的天然存在的氨基酸的人造化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。如本文所用的,术语“编码”或“编码的”在用于具体核酸时表示该核酸包含必需的信息来引导核苷酸序列翻译成特定蛋白质。编码蛋白质的信息通过利用密码子确定。编码蛋白质的核酸可以包含非翻译序列(如内含子)于核酸的翻译区中或者可以缺少这种插入的非翻译序列(例如,如在cDNA中)。
在一个具体的非限制性实例中,转化的浮萍通过用表达盒转化获得,该表达盒包含有效连接至所关注的异源核苷酸序列的浮萍科泛素表达控制元件(例如,如在SEQ ID NO:1-3中示出的)、它的片段(例如,如在SEQ ID NO:4-9中示出的)、浮萍科r-组蛋白表达控制元件(例如,如在SEQ ID NO:13中示出的)、浮萍科几丁质酶表达控制元件(例如,如在SEQ ID NO:14中示出的),或这些序列的变体。转化的浮萍还可以通过用含有有效连接至所关注的异源核苷酸序列的下列元件的表达盒转化获得:膨胀浮萍RbcS表达控制元件(例如,如在SEQ IDNO:10-12中示出的;参见GenBank登记号S45165(SSU13;核苷酸694-757)、S45166(SSU5A;核苷酸698-755)和S45167(SSU5B;核苷酸690-751)),或其变体或片段。与没有该元件的表达比较,在SEQ IDNO:10-12中示出的表达控制元件有利地增强了有效连接的异源核苷酸序列在转化的浮萍中的表达。
本发明的表达盒提供有多个限制性酶切位点,其用于插入将在表达控制元件的转录调节下的编码所关注的蛋白质的核苷酸序列。表达盒可以编码单个所关注的基因。可选择地,表达盒可编码两个或多个所关注的基因。
本文所述的表达盒在5′-3′的转录方向上包括在植物中起作用的转录和翻译起始区(如本发明的表达控制元件或其生物学上的活性变体或片段)、所关注的核苷酸序列以及转录和翻译终止区。本领域已知的任何合适的终止序列都可以根据本发明使用。终止区可以是天然与转录起始区一起的,可以是天然与所关注的核苷酸序列一起的,或者可以源自另外的来源。实用的终止区可从根癌农杆菌的Ti-质粒获得,例如章鱼碱合成酶和胭脂碱合成酶终止区。还可以参见Guerineau等,(1991)Mol.Gen.Genet.262:141;Proudfoot(1991)Cell 64:671;Sanfacon等,(1991)Genes Dev.5:141;Mogen等,(1990)PlantCell 2:1261;Munroe等,(1990)Gene 91:151;Ballas等,(1989)Nucleic Acids Res.17:7891以及Joshi等(1987)Nucleic Acids Res.15:9627。另外的示例性终止序列是豌豆RubP羧化酶小亚基终止序列、花椰菜花叶病毒35S终止序列,以及来自许多植物物种的泛素终止子。其它合适的终止序列对本领域技术人员来说将是显而易见的。
通常,表达盒将包含用于选择转化的细胞或组织的选择标记基因。选择标记基因包括编码抗生素抗性的基因,例如编码新霉素磷酸转移酶II(NEO)、新霉素磷酸转移酶III和潮霉素磷酸转移酶(HPT)的那些基因,以及赋予除草化合物抗性的基因。除草剂抗性基因通常编码对除草剂不敏感的经修饰的靶蛋白质或者编码在除草剂可作用之前将其在植物中的降解或去毒的酶。参见,DeBlock等,(1987)EMBO J.6:2513;DeBlock等,(1989)Plant Physiol.91:691、Fromm等,(1990)BioTechnology 8:833;Gordon-Kamm等,(1990)Plant Cell2:603和Frisch等,(1995)Plant Mol.Biol.27:405-9。例如,草甘膦除草剂抗性或碘酰脲类除草剂抗性已经用编码突变的靶标酶:5-烯醇丙酮酰莽草酸-3-磷酸合成酶(EPSPS)和乙酰乳酸合成酶(ALS)的基因获得。对草铵膦、溴草腈(boromoxynil)和2,4-二氯苯氧乙酸(2,4-D)的抗性已经通过用编码使相应的除草剂去毒的膦丝菌素乙酰转移酶、腈水解酶或2,4-二氯苯氧乙酸单氧化酶的细菌基因获得。
对于本发明而言,选择标记基因包括(但不限于)编码新霉素磷酸转移酶II(Fraley等,(1986)CRC Critical Reviews in植物Science 4:1)的基因;编码新霉素磷酸转移酶III(Frisch等,(1995)植物Mol.Biol.27:405-9)的基因;编码氰酰胺水合酶(Maier-Greiner等,(1991)Proc.Natl.Acad.Sci.USA 88:4250)的基因;编码天冬氨酸激酶、二氢吡啶二羧酸合成酶(Perl等,(1993)BioTechnology 11:715)的基因;bar基因(Toki等,(1992)PlantPhysiol.100:1503;Meagher等,(1996)Crop Sci.36:1367);编码色氨酸脱羧酶(Goddijn等,(1993)Plant Mol.Biol.22:907)的基因;编码新霉素磷酸转移酶(NEO;Southern等,(1982)J.Mol.Appl.Gen.1:327)的基因;编码潮霉素磷酸转移酶(HPT或HYG;Shimizu等,(1986)Mol.Cell.Biol.6:1074)的基因;编码二氢叶酸还原酶(DHFR;Kwok等,(1986)Proc.Natl.Acad.Sci.USA 83:4552)的基因;编码膦丝菌素乙酰转移酶(DeBlock等,(1987)EMBO J.6:2513)的基因;编码2,2-二氯丙酸脱卤素酶(Buchanan-Wollatron等,(1989)J.Cell.Biochem.13D:330)基因;编码乙酰羟酸合成酶(Ander son等的美国专利No.4,761,373、Haughn等,(1988)Mol.Gen.Genet.221:266)的基因;编码5-烯醇丙酮酰莽草酸-磷酸合成酶(aroA;Comai等,(1985)Nature 317:741)基因;编码卤代芳基腈水解酶(haloarylnitrilase)(Stalker等的WO 87/04181)的基因;编码乙酰辅酶A羧化酶(Parker等,(1990)Plant Physiol.92:1220)的基因;编码二氢蝶酸合成酶(sulI;Guerineau等,(1990)Plant Mol.Biol.15:127)和32kDa光系统II多肽(psbA;Hirschberg等,(1983)Science 222:1346(1983)的基因。
还包括编码下列抗性的基因:庆大霉素抗性(例如aacC1,Wohlleben等,(1989)Mol.Gen.Genet.217:202-208)、氯霉素抗性(Herrera-Estrella等,(1983)EMBO J.2:987)、甲氨蝶呤抗性(Herrera-Estrella等,(1983)Nature 303:209;Meijer等,(1991)Plant Mol.Biol.16:807)、潮霉素抗性(Waldron等,(1985)PlantMol.Biol.5:103;Zhijian等,(1995)Plant Science 108:219;Meijer等,(1991)Plant Mol.Bio.16:807)、链霉素抗性(Jones等,(1987)Mol.Gen.Genet.210:86)、大观霉素抗性(Bretagne-Sagnard等,(1996)Transgenic Res.5:131)、博来霉素抗性(Hille等,(1986)Plant Mol.Biol.7:171)、磺胺药物抗性(Guerineau等,(1990)Plant Mol.Bio.15:127)、溴草腈抗性(Stalker等,(1988)Science 242:419)、2,4-D(Streber等,(1989)BioTechnology 7:811)、膦丝菌素抗性(DeBlock等,(1987)EMBO J.6:2513)、大观霉素抗性(Bretagne-Sagnard和Chupeau,TransgenicResearch 5:131)。
Bar基因赋予了对草铵膦类杀虫剂例如膦丝菌素(PPT)或双丙氨膦等等的抗性。可用于表达构建体的其它选择标记包括(但不限于)还负责双丙氨膦抗性和膦丝菌素抗性的PAT基因、负责咪唑啉酮抗性的ALS基因、负责潮霉素抗性的HPH或HYG基因、负责草甘膦抗性的EPSP合成酶基因、负责Hc-毒素抗性的Hml基因,以及其它常规使用的且本领域技术人员已知的选择剂。参见Yarranton(1992)Curr.Opin.Biotech.3:506、Chistopherson等,(1992)Proc.Natl.Acad.Sci.USA 89:6314、Yao等,(1992)Cell 71:63、Reznikoff(1992)Mol.Microbiol.6:2419、Barkley等,(1980)The Operon 177-220、Hu等,(1987)Cell 48:555、Brown等,(1987)Cell 49:603、Figge等,(1988)Cell 52:713、Deuschle等,(1989)Proc.Natl.Acad.Sci.USA 86:5400、Fuerst等,(1989)Proc.Natl.Acad.Sci.USA86:2549、Deuschle等,(1990)Science 248:480、Labow等,(1990)Mol.Cell.Biol.10:3343、Zambretti等,(1992)Proc.Natl.Acad.Sci.USA 89:3952、Baim等,(1991)Proc.Natl.Acad.Sci.USA88:5072、Wyborski等,(1991)Nuc.AcidsRes.19:4647、Hillenand-Wissman(1989)Topics in Mol.And Struc.Biol.10:143、Degenkolb等,(1991)Antimicrob.Agents Chemother.35:1591、Kleinschnidt等,(1988)Biochemistry 27:1094、Gatz等,(1992)Plant J.2:397、Gossen等,(1992)Proc.Natl.Acad.Sci.USA89:5547、Oliva等,(1992)Antimicrob.AgentsChemother.36:913、Hlavka等,(1985)Handbook of Experimental Pharmacology 78和Gill等,(1988)Nature 334:721。将这些公开以引用方式并入本文。
上面列出的选择标记基因不意味着作为限制。任何致命性或非致命性的选择标记基因都可用于本发明。
在一些实施方案中,本发明提供了对所关注的表达的核苷酸序列的修饰以便增强它在所关注的植物中的表达。用于合成具有植物优选的密码子的核苷酸序列的方法是本领域中可获得的。参见,例如,美国专利No.5,380,831和No.5,436,391(它们两者以引用方式并入本文)、Perlak等,(1991)Proc.Natl.Acad.Sci.USA 15:3324、Iannacome等,(1997)Plant Mol.Biol.34:485和Murray等,(1989)Nucleic Acids.Res.17:477。
例如,如果所关注的植物是浮萍,则一种这样的修饰是用浮萍-优选的密码子合成所关注的核苷酸序列。优选的密码子可以从浮萍中表达的蛋白质中最高频率的密码子确定。因而,浮萍中具体密码子的使用频率可以通过分析一组浮萍编码序列中的密码子使用情况来测定。许多浮萍编码序列是本领域技术人员已知的;参见(例如)
Figure A200780007583D00281
数据库中所包括的序列,其可以通过位于马里兰州的贝塞斯达(Bethesda,Maryland)的美国国家生物技术信息中心(NationalCenter for Biotechnology Information)(美国国家医学图书馆(National Library of Nedicine)的一部分)的网站评估。基于包含于最新版本中的序列,示出了密码子使用频率的表可以在日本千叶的网站Kazusa DNA Research Institute上找到。该数据库在Nakamura等,(2000)Nucleic Acids Res.28:292中有描述。
应当认识到,可以将对于在浮萍和其它单子叶植物或双子叶植物中表达来说已经最优化的基因用于本发明的方法。参见,例如EP 0 359472、EP 0 385 962、WO 91/16432、Perlak等,(1991)Proc.Natl.Acad.Sci.USA 88:3324、Iannacome等,(1997)Plant Mol.Biol.34:485、Murray等,(1989)Nucleic Acids Res.17:477等。还应当认识到,基因序列的全部或任何部分可以是优化的或合成的。换而言之,也可以使用完全优化的或部分优化的序列。例如,40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的密码子可以是植物优选的密码子(例如浮萍优选的密码子)。因而,在一些实施方案中,编码所关注的多肽的核苷酸序列包含50-100%之间的浮萍优选的密码子或70-100%之间的浮萍优选的密码子。在一个实施方案中,90%和96%之间的密码子是浮萍优选的密码子。所关注的核苷酸序列的编码序列可以包含在浮萍中使用频率为至少17%的密码子。膨胀浮萍中的密码子使用情况(表1)和浮萍中的密码子使用情况(表2)在下面示出。在一些实施方案中,表1或表2用于选择浮萍优选的密码子。
表1:来自
Figure A200780007583D00291
第139版*的膨胀浮萍密码子使用情况
氨基酸        密码子        数量       /1000      分数
Gly            GGG          57.00      28.89      0.35
Gly            GGA          8.00       4.05       0.05
Gly            GGT          3.00       1.52       0.02
Gly            GGC          93.00      47.14      0.58
Glu            GAG          123.00     62.34      0.95
Glu            GAA          6.00       3.04       0.05
Asp            GAT          6.00       3.04       0.08
Asp            GAC          72.00      36.49      0.92
Val            GTG          62.00      31.42      0.47
Val            GTA          0.00       0.00       0.00
Val            GTT          18.00      9.12       0.14
Val            GTC          51.00      25.85      0.39
Ala            GCG          44.00      22.30      0.21
Ala            GCA          14.00      7.10       0.07
Ala            GCT          14.00      7.10       0.07
Ala            GCC          139.00     70.45      0.66
Arg            AGG          16.00      8.11       0.15
Arg            AGA          11.00      5.58       0.10
Ser            AGT          1.00       0.51       0.01
Ser            AGC          44.00      22.30      0.31
Lys            AAG          116.00     58.79      1.00
Lys        AAA        0.00         0.00          0.00
Asn        AAT        2.00         1.01          0.03
Asn        AAC        70.00        35.48         0.97
Met        ATG        67.00        33.96         1.00
Ile        ATA        4.00         2.03          0.06
Ile        ATT        0.00         0.00          0.00
Ile        ATC        63.00        31.93         0.94
Thr        ACG        19.00        9.63          0.25
Thr        ACA        1.00         0.51          0.01
Thr        ACT        6.00         3.04          0.08
Thr        ACC        50.00        25.34         0.66
Trp        TGG        45.00        22.81         1.00
End        TGA        4.00         2.03          0.36
Cys        TGT        0.00         0.00          0.00
Cys        TGC        34.00        17.23         1.00
End        TAG        0.00         0.00          0.00
End        TAA        7.00         3.55          0.64
Tyr        TAT        4.00         2.03          0.05
Tyr        TAC        76.00        38.52         0.95
Leu        TTG        5.00         2.53          0.04
Leu        TTA        0.00         0.00          0.00
Phe        TTT        4.00         2.03          0.04
Phe        TTC        92.00        46.63         0.96
Ser        TCG        34.00        17.23         0.24
Ser        TCA        2.00         1.01          0.01
Ser        TCT        1.00         0.51          0.01
Ser        TCC        59.00        29.90         0.42
Arg        CGG        23.00        11.66         0.22
Arg        CGA        3.00         1.52          0.03
Arg           CGT        2.00        1.01           0.02
Arg           CGC        50.00       25.34          0.48
Gln           CAG        59.00       29.90          0.86
Gln           CAA        10.00       5.07           0.14
His           CAT        5.00        2.53           0.26
His           CAC        14.00       7.10           0.74
Leu           CTG        43.00       21.79          0.35
Leu           CTA        2.00        1.01           0.02
Leu           CTT        1.00        0.51           0.01
Leu           CTC        71.00       35.99          0.58
Pro           CCG        44.00       22.30          0.31
Pro           CCA        6.00        3.04           0.04
Pro           CCT        13.00       6.59           0.09
Pro           CCC        80.00       40.55          0.56
表2:得自第139版*的浮萍的密码子使用情况
氨基酸    密码子      数量         /1000     分数
Gly       GGG         8.00         17.39      0.22
Gly       GGA         11.00        23.91     0.31
Gly       GGT         1.00         2.17      0.03
Gly       GGC         16.00        34.78     0.44
Glu       GAG         25.00        54.35     0.78
Glu       GAA         7.00         15.22     0.22
Asp       GAT         8.00         17.39     0.33
Asp       GAC         16.00        34.78     0.67
Val       GTG         21.00        45.65     0.53
Val       GTA         3.00         6.52      0.07
Val       GTT         6.00         13.04     0.15
Val       GTC         10.00        21.74     0.25
Ala       GCG         13.00        28.26     0.32
Ala          GCA         8.00        17.39            0.20
Ala          GCT         6.00        13.04            0.15
Ala          GCC         14.00       30.43            0.34
Arg          AGG         9.00        19.57            0.24
Arg          AGA         11.00       23.91            0.30
Ser          AGT         2.00        4.35             0.05
Ser          AGC         11.00       23.91            0.26
Lys          AAG         13.00       28.26            0.68
Lys          AAA         6.00        13.04            0.32
Asn          AAT         0.00        0.00             0.00
Asn          AAC         12.00       26.09            1.00
Met          ATG         9.00        19.57            1.00
Ile          ATA         1.00        2.17             0.08
Ile          ATT         2.00        4.35             0.15
Ile          ATC         10.00       21.74            0.77
Thr          ACG         5.00        10.87            0.28
Thr          ACA         2.00        4.35             0.11
Thr          ACT         2.00        4.35             0.11
Thr          ACC         9.00        19.57            0.50
Trp          TGG         8.00        17.39            1.00
End          TGA         1.00        2.17             1.00
Cys          TGT         1.00        2.17             0.12
Cys          TGC         7.00        15.22            0.88
End          TAG         0.00        0.00             0.00
End          TAA         0.00        0.00             0.00
Tyr          TAT         1.00        2.17             0.12
Tyr          TAC         7.00        15.22            0.88
Leu          TTG         3.00        6.52             0.08
Leu          TTA         1.00        2.17             0.03
Phe            TTT           6.00           13.04            0.25
Phe            TTC           18.00          39.13            0.75
Ser            TCG           11.00          23.91            0.26
Ser            TCA           4.00           8.70             0.09
Ser            TCT           6.00           13.04            0.14
Ser            TCC           9.00           19.57            0.21
Arg            CGG           4.00           8.70             0.11
Arg            CGA           4.00           8.70             0.11
Arg            CGT           0.00           0.00             0.00
Arg            CGC           9.00           19.57            0.24
Gln            CAG           11.00          23.91            0.73
Gln            CAA           4.00           8.70             0.27
His            CAT           0.00           0.00             0.00
His            CAC           6.00           13.04            1.00
Leu            CTG           9.00           19.57            0.24
Leu            CTA           4.00           8.70             0.11
Leu            CTT           4.00           8.70             0.11
Leu            CTC           17.00          36.96            0.45
Pro            CCG           8.00           17.39            0.29
Pro            CCA           7.00           15.22            0.25
Pro            CCT           5.00           10.87            0.18
Pro            CCC           8.00           17.39            0.29
还可以对所关   注的核苷酸序列进行其它修饰来优化其在植物中的表达。这些修饰包括(但不限于)删除编码假多腺苷酸化信号、外显子-内含子剪接位点信号的序列、类似转座子的重复,以及其它像这样详细表征了的可能对基因表达有害的序列。可以将序列的G-C含量调节至所给定细胞宿主的平均水平,这通过参考在宿主细胞中表达的已知基因来计算。如果可能,可以修饰序列来避免预测的mRNA发卡二级结构。
动物和植物中翻译起始密码子的最佳翻译起始区核苷酸序列之间存在已知的差异,并且这些翻译起始区核苷酸序列的组成可以影响翻译起始的效率。参见,例如Lukaszewicz等,(2000)Plant Science154:89-98和Joshi等,(1997)Plant Mol.Biol.35:993-1001。在本发明的一些实施方案中,可以修饰所关注的核苷酸序列的翻译起始密码子的翻译起始区核苷酸序列来增强在浮萍中的表达。在一个实施方案中,修饰核苷酸序列使得所关注的核苷酸序列的翻译起始密码子正上游的三个核苷酸为“ACC”。在另一个实施方案中,这些核苷酸是“ACA”。
除了本文所述的用于起始或增强异源核苷酸序列在植物中的表达的表达控制元件,所关注的核苷酸序列的表达还可以通过任选使用多种调控元件来增强。如本文所用的“调控元件”指通常在结构基因的编码序列上游(5′)的核苷酸序列(DNA或RNA),包括转录控制序列例如前导序列、启动子、翻译和转录增强子或抑制子,以及mRNA稳定性和不稳定性决定子(determinant)。存在于内含子中的序列也可以调节所关注的编码区的表达。调控元件也可以存在于3′端至转录起始位点之间,或存在于转录区内。可以将多种调控元件有效地连接至其它的调控元件。如本文所用的“前导序列”指位于mRNA的5′端处的核酸的部分,其从5′CAP位点延伸到AUG蛋白质翻译起始密码子。前导序列在翻译起始和基因表达调控中很重要。
例如,一个或多个前导序列可以另外组合使用来增强靶标核苷酸序列的表达。翻译前导序列是本领域已知的并且包括(但不限于)小RNA病毒前导序列,如EMCV前导序列(脑心肌炎病毒5′非编码区;Elroy-Stein等,(1989)Proc.Natl.Acad.Sci USA 86:6126)、马铃薯Y病毒前导序列,如TEV前导序列(烟草蚀刻病毒;Gallie等,(1995)Gene 165:233)、人免疫球蛋白重链结合蛋白(BiP;Macajak和Sarnow(1991)Nature 353:90)、来自苜蓿花叶病毒外壳蛋白的mRNA的非翻译前导序列(AMV RNA 4;Jobling和Gehrke(1987)Nature325:622)、烟草花叶病毒前导序列(TMV;Gallie(1989)MolecularBiology of RNA,23:56)、马铃薯蚀刻病毒前导序列(Tomashevskaya等,(1993)J.Gen.Virol.74:2717-2724)、Fed-15′非翻译区(Dickey(1992)EMBO J.11:2311-2317)、RbcS 5′非翻译区(Silverthorne等,(1990)J.Plant.Mol.Biol.15:49-58)和玉米褪绿斑驳病毒前导序列(MCMV;Lommel等,(1991)Virology 81:382)。还可以参见Della-Cioppa等,(1987)Plant Physiology 84:965。包含植物内含子序列的前导序列也已经显示增强植物中的翻译效率,所述植物内含子序列包括来自玉米脱氢酶1基因、蓖麻过氧化氢酶基因或拟南芥色氨酸途径基因PAT1的内含子序列(Callis等,(1987)GenesDev.1:1183-1200、Mascarenhas等,(1990)Plant Mol.Biol.15:913-920)。
如本文在上面所述的浮萍科泛素内含子(即,如在SEQ ID NO:7-9中示出的)可以与不同于它们相应的泛素启动子的启动子一起使用,以便增强有效连接的所关注的核苷酸序列的表达。与泛素内含子一起使用的启动子可以是任何适用于所关注的植物的启动子,包括分别在SEQ ID NO:13和NO:14中公开的新的浮萍科r-组蛋白启动子和几丁质酶启动子。其它合适的启动子可以从多种来源获得,例如从植物或植物DNA病毒获得。可用的启动子包括分离自花椰菜花叶病毒组的那些,例如花椰菜花叶病毒19S和35S(CaMV19S和CaMV35S)的转录启动子。其它可用的启动子包括如Kat等,(1987)Science 236:1299-1302描述的增强的CaMV35S启动子(eCaMV35S)和核酮糖1,5-二磷酸羧化酶加氧酶(RUBISCO)的小亚基启动子。其它合适的启动子的实例是水稻肌动蛋白启动子、亲环素(cyclophilin)启动子、ADH1启动子(Callis等,(1987)Gene Dev.1:1183-1200)、I类patatin启动子(Bevan等,(1986)Nucl.AcidsRes.14:4675-4638)、ADP葡萄糖焦磷酸化酶启动子、β-伴大豆球蛋白启动子(Tiemey等,(1987)Planta172:356-363)、E8启动子(Deikman等,(1988)Embo J.7:3315-3320)、2AII启动子(Pear等,(1989)Plant Mol.Biol.13:639-651)和酸性几丁质酶启动子(Samac等,(1990)Plant Physiol.93:907-914)。
应当认识到,上述任何增强表达的核苷酸序列修饰都可用于本发明,包括任意的单一修饰或修饰的任何可能的组合。
在一些实施方案中,将本发明的组合物和方法用于植物表达系统(例如浮萍表达系统),并且所关注的异源核苷酸序列是分泌性蛋白。分泌性蛋白通常从包含“信号肽”的前体多肽转变而来,该信号肽与内质网(ER)膜上的受体蛋白相互作用而引导生长的多肽链转位跨过膜并进入内质网中以从细胞分泌。这种信号肽通常从前体多肽切除以产生不含信号肽的“成熟”多肽。以这种方式,生物学上的活性多肽得以在植物(例如浮萍)中从表达构建体表达,该表达构建体具有有效连接至所关注的核苷酸序列的本发明表达控制元件或其生物学上的活性变体或片段,所关注的核苷酸序列还与编码引导多肽分泌进培养基中的信号肽的核苷酸序列有效连接。“生物学上的活性多肽”指具有执行一种或多种生物学功能的能力或具有在生物学背景中通常归因于该多肽的一组活性的多肽。靶向蛋白质转移至内质网(以便向细胞外分泌)的植物信号肽是本领域已知的。参见例如,美国专利No.6,020,169,将其以引用方式并入本文。
在一个实施方案中,信号肽是在SEQ ID NO:16中示出的新的浮萍几丁质酶信号肽,或其变体或片段,并且表达构建体包含有效连接至所关注的核苷酸序列的编码该信号肽的核苷酸序列。在一些实施方案中,该信号肽编码序列是在SEQ ID NO:15中示出的序列。
应当认识到,本发明的浮萍几丁质酶信号肽,或其变体或片段可用于引导任何所关注的编码的多肽的细胞外分泌。以这种方式,可以将SEQ ID NO:15的信号肽编码序列或其变体或片段整合进任何表达构建体中,使得它能在正确的阅读框架中有效地连接至所关注的启动子和所关注的编码多肽的核苷酸序列。可以将这种表达构建体引入植物或植物细胞或结节中用于提供所关注的编码的多肽的表达和细胞外分泌。
可选择地,可将哺乳动物信号肽用于靶向在遗传工程化植物(例如浮萍)中表达的重组多肽以便分泌。已经证实植物细胞识别靶向内质网的哺乳动物信号肽,而且这些信号肽不仅可以引导多肽通过质膜分泌而且还可以引导多肽通过植物细胞壁分泌。参见,例如美国专利No.5,202,422和No.5,639,947,将它们两者以引用方式并入本文。
分泌的多肽可以通过本领域已知的常规手段从培养基收获并且可以通过色谱、电泳、透析、溶剂-溶剂萃取等纯化。
本发明的方法涉及将表达构建体引入植物或植物细胞或结节中。“引入”旨在表示以使构建体得以进入植物细胞内的方式将表达构建体给予植物。本发明的方法不依赖于将表达构建体引入植物中的具体方法,仅仅是为了使表达构建体获得进入至少一个植物细胞的内部。用于将表达构建体引入植物中的方法是本领域已知的,包括(但不限于)稳定转化方法、瞬时转化方法以及病毒介导的方法。
“稳定转化”意指引入植物中的核苷酸序列整合进植物的基因组中,并能够遗传给它的后代。“瞬时转化”意指引入植物中的核苷酸序列(如,包含于表达构建体中的核苷酸序列)没有整合进植物的基因组中。
本发明的核苷酸序列可以通过将植物或植物细胞或结节与病毒或病毒核酸接触而被引入植物或植物细胞或结节中。一般而言,这种方法涉及将本发明的核苷酸序列整合进病毒DNA或RNA分子中。用于将核苷酸序列引入植物或植物细胞或结节中并在其中表达编码的蛋白质的方法(涉及病毒DNA或RNA分子)是本领域已知的。参见例如美国专利No.5,889,191、No.5,889,190、No.5,866,785、No.5,589,367和No.5,316,931,将这几个专利以引用方式并入本文。
转化方法以及用于将核苷酸序列引入植物中的方法可以不同,这取决于作为转化目标的植物或植物细胞或结节的类型,即单子叶植物或双子叶植物。将核苷酸序列引入植物或植物细胞或结节中的合适方法包括显微注射(Crossway等,(1986)Biotechniques 4:320-334)、电穿孔(Riggs等,(1986)Proc.Natl.Acad.Sci.USA83:5602-5606)、农杆菌介导的转化(美国专利No.5,563,055和No.5,981,840,这两个专利以引用方式并入本文)、直接基因转移(Paszkowski等,(1984)EMBO J.3:2717-2722),以及基因枪粒子加速(ballistic particle acceleration)(参见例如美国专利No.4,945,050、No.5,879,918、No.5,886,244和5,932,782(将每个专利以引用方式并入本文),以及Tomes等,(1995)"Direct DNATransfer into Intact Plant Cells via MicroprojectileBombardment,"in Plant Cell,Tissue,and Organ Culture:Fundamental Methods,ed.Gamborg and Phillips(Springer-Verlag,Berlin)、McCabe等,(1988)Biotechnology 6:923-926)。根据常规的方法,可使已转化的细胞成长为植株。参见,例如McCormick等,(1986)Plant Cell Reports 5:81-84。
在一些实施方案中,稳定转化的浮萍植物或浮萍植物细胞或结节表达了由于费用或逻辑限制或这两种原因而不能通过现有基因表达系统进行有效商业化生产的生物学上的活性多肽。例如,一些蛋白质不能在哺乳动物系统中表达,因为该蛋白质干扰细胞生存力、细胞增殖、细胞分化,或哺乳动物细胞中的蛋白质组装。这样的蛋白质包括(但不限于)视网膜母细胞瘤蛋白、p53、制管张素和瘦素。本发明可有利地用于产生哺乳动物调节蛋白;考虑到高等植物和哺乳动物之间的大的进化距离,这些蛋白质干扰浮萍中的调节过程是不可能的。转基因浮萍还可用于产生大量的蛋白质例如血清白蛋白(特别是人血清白蛋白)、血红蛋白和胶原,这挑战了现存的表达系统的生产能力。
另外,可以工程化高等植物系统来比哺乳动物系统更容易地产生生物学上的活性多聚体蛋白质(如,单克隆抗体、血红蛋白、P450氧化酶和胶原等)。用于在浮萍中产生生物学上的活性多聚体蛋白质的一个示例性方法利用了含有编码所有多肽亚基的基因的表达构建体。参见,例如During等,(1990)Plant Mol.Biol.15:281和van Engelen等,(1994)Plant Mol.Biol.26:1701。然后将该构建体用任何已知的转化方法(例如基因枪轰击或农杆菌介导的转化)引入浮萍细胞中。该方法产生了克隆细胞系,该细胞系表达组装该多聚体蛋白质所需的所有多肽。对该方法的改变形式是:制备单基因构建体,将这些构建体的DNA混合在一起,然后用基因枪轰击或农杆菌介导的转化将该DNA混合物递送进植物细胞中。作为另外的变型,一些或所有构建体可以编码多聚体蛋白质的多于一个的亚基(即,以便待杂交的浮萍克隆比多聚体蛋白质中的亚基数少)。可选择地,每个浮萍克隆表达多聚体蛋白质的至少一个亚基,并且将分泌每个亚基的浮萍克隆一起培养并且多聚体蛋白质在培养基中从多个分泌的亚基组装。在一些情况下,可能期望在转化的浮萍植物或浮萍结节中产生少于多聚体蛋白质的全部的亚基,或者甚至产生单个蛋白质亚基,例如用于工业或化工工艺或者为了诊断、治疗或疫苗接种目的。
下面的实施例是以举例说明的目的而不是以限定的方式提供。
实验
实施例1:表达载体
在下面描述的实施例中使用的表达载体包括Egs05、Egs07、Egs11、Egs22、Egs23、Egs46、Egs50、Egs51、Egs19、Egs20、Egs24、Egs25、IFN53和IFN54。Egs05和Egs07是含有有效连接至大肠杆菌β-葡萄糖醛酸酶(GUS)的编码序列的控制启动子的未经修饰的表达载体,它们各自具有不同的选择标记基因。Egs11包含有效连接至GUS编码序列的全长的浮萍泛素表达控制元件(SEQ ID NO:1),具有选择标记基因。Egs22和Egs23是类似的构建体,但使用了截短形式的浮萍泛素表达控制元件。在Egs22中,SEQ ID NO:1的核苷酸1288-2160驱动有效连接的GUS编码序列的表达。在Egs23中,SEQ ID NO:1的核苷酸1132-2160驱动该GUS编码序列的表达。Egs46类似于Egs11,但包含不同的选择标记基因。
Egs50包含有效连接至GUS编码序列的全长的紫萍泛素表达控制元件(SEQ ID NO:2),具有选择标记基因。类似地,Egs51包含有效连接至GUS编码序列的全长的稀脉萍泛素表达控制元件(SEQ ID NO:3),具有选择标记基因。
Egs19包含有效连接至GUS编码序列的浮萍r-组蛋白表达控制元件(SEQ ID NO:13)的核苷酸461-1808,具有选择标记基因。在Egs20中,SEQ ID NO:13的核苷酸805-1808驱动GUS编码序列的表达。
Egs24包含有效连接至GUS编码序列的浮萍几丁质酶表达控制元件(SEQ ID NO:14)的核苷酸51-1338,具有选择标记基因。Egs25包含有效连接至玉米ADH1内含子和GUS编码序列的浮萍几丁质酶表达控制元件(SEQ ID NO:14)的核苷酸51-1338,具有选择标记基因。
IFN53和IFN54表达载体每个均含有有效连接至密码子优化的干扰素α-2b基因的AmasPmas超强启动子、膨胀浮萍RbcS SSU5B表达控制元件(SEQ ID NO:12)以及玉米ADH1内含子,并且或者具有密码子优化的α淀粉酶信号序列(IFN53)或者具有浮萍几丁质酶信号序列(SEQ ID NO:15;IFN54)。
实施例2:浮萍的转化
采用农杆菌介导的转化方法,将浮萍叶或浮萍结节培养物(在这些实例中源自浮萍株8627)用上述表达构建体转化。在这些实例中,将根癌农杆菌(Agrobacterium tumefaciens)株C582707,一种去攻击的广宿主范围的C58株(Hepburn等,(1985)J.Gen.Microbiol.131:2961-2969)用于转化。将上述表达构建体通过电穿孔或通过利用具有诱动质粒(Mobilizing plasmid)pRK2013的大肠杆菌MM294的三亲杂交方法诱动转移进根癌农杆菌中(Hoekema等,(1983)Nature 303:179-180、Ditta等,(1980)Proc.Natl.Acad.Sci.USA77:7347-7350)。将含有上述表达构建体的C58Z707株在含500mg/L链霉素、50mg/L大观霉素和50mg/L硫酸卡那霉素的AB基本培养基上(Chilton等,(1974)Proc.Nat.Acad.Sci.USA 71:3672-3676)或者YEB或LB培养基(1g/L酵母提取物、5g/L牛肉提取物、5g/L蛋白胨、5g/L蔗糖、0.5g/LMgSO4)中划线接种并让其在28℃下生长过夜。
如下制备用于转化的浮萍结节培养物。将浮萍叶分离,用无菌解剖刀将根切除,并将叶腹侧朝下放置在pH 5.6的MS培养基(Murashigeand Skoog medium)(产品目录号M-5519;Sigma Chemical公司,St.Louis,MO)上,该培养基补充有5μM2,4-二氯苯氧乙酸、0.5μM1-苯基-3(1,2,3-噻二唑-5-基)脲噻二唑苯基脲(Sigma P6186)、3%蔗糖、0.4 Difco Bacto-琼脂(Fisher Scientific)和0.15%Gelrite(Sigma)。让叶生长5-6周。此时,出现了结节(小的淡黄色细胞群),通常出现在腹侧中心部分。将该结节组织与母叶分离并培养于补充有3%蔗糖、0.4% Difco Bacto-琼脂、0.15% Gelrite、1μM 2,4-二氯苯氧乙酸和2μM苄腺嘌呤的MS培养基中。
如下转化浮萍结节培养物。让合适的根癌农杆菌株在具有50mg/L卡那霉素和100μM乙酰丁香酮的马玲薯右旋醣琼脂或YEB或LB琼脂上生长,并让其再悬浮于补充有0.6M甘露醇和100μM乙酰丁香酮的MS培养基中。将结节培养物组织通过浸没在再悬浮的细菌溶液中1-2分钟接种,吸干除去过量的液体,并将其涂布于由MS培养基组成的共培养培养基上,该MS培养基补充有经优化用于促进结节生长的植物生长素和细胞分裂素以及100μM的乙酰丁香酮。参见,Yamamoto等,(2001)In Vitro Cell Dev.Biol.Plant 37:349-353。
为了选择,将结节培养物组织转移至再生培养基(补充有1%蔗糖、0.4%Difco Bacto-琼脂、0.15%Gelrite、500mg/L头孢噻肟和6mg/L遗传霉素的0.5 X Schenk and Hildebrandt培养基),并在持续光照(20-40μM/m2(秒)下培养大约6-8周。将结节组织每7天转移至新鲜的培养基中。当结节组织显示在选择试剂上健壮生长时,选择完成。
实施例3:大肠杆菌GUS在浮萍中的瞬时表达
在用Egs05、Egs07、Egs11、Egs22、Egs23、Egs46、Egs50、Egs51、Egs19、Egs20、Egs24和Egs25构建体转化的浮萍结节培养物中评估GUS的瞬时表达。所有构建体都能够驱动强的GUS表达,这通过24小时染色测定(表3)。
另外,在用Egs07、Egs46、Egs50和Egs51构建体转化的浮萍结节培养物上进行GUS酶测定法。36个Egs07转基因系的平均值是1.345%的GUS,29个Egs46转基因系的平均值是2.320%的GUS,4个Egs50转基因系的平均值是4.008%的GUS,并且8个Egs51转基因系的平均值是6.682%的GUS。
表3:愈伤组织中的GUS瞬时表达
试验载体         启动子                   染色
Egs05           对照                      ++++
Egs07           对照                      ++++
Egs11           LmUBQ                     ++++
Egs22           LmUBQ(截短形式#1)         +++
Egs23           LmUBQ(截短形式#2)         ++++
Egs46           LmUBQ                     ++++
Egs50           SpUBQ                     ++++
Egs51           LaUBQ                     +++
Egs19           LmHIS(461-1808)           ++
Egs20           LmHIS(805-1808)           +
Egs25           LmCHT(51-1338)+ADH1内含子 ++
24小时染色;按1至4评定等级。
实施例4:干扰素在浮萍中的表达
用IFN53和IFN54构建体制备数百个转基因浮萍品系,随后通过ELISA根据干扰素表达对它们进行筛选。观察到这两种构建体具有相似水平的干扰素表达。IFN53:最高表达者为1735.66ng/mi;平均表达为362.04ng/ml。IFN54:最高表达者为1173.81ng/mi;平均表达为347.40ng/ml。
在本说明书中提及的所有出版物和专利申请表现了本发明所属领域的技术人员的水平。所有出版物和专利申请均以相同程度以引用方式并入本文,就如同每一出版物或专利申请被明确且单独地表明将其以引用的方式并入本文一样。
尽管为了理解的清楚,已经通过说明和实施例的方式相当详细地描述了上述发明,但是显然可以实践某些改变和修饰而不脱离附带的权利要求的范围。
序列表
<110>Dickey,Lynn F.
     Cox,Kevin M.
     Peele,Charles G.
<120>来自浮萍科的表达空制元件
<130>040989/322154
<150>US 60/848,961
<151>2006-10-03
<150>US 60/759,308
<151>2006-01-17
<160>16
<170>PatentIn version 3.3
<210>1
<211>2160
<212>DNA
<213>浮萍(Lemna minor)
<400>1
Figure A200780007583Q00431
Figure A200780007583Q00441
Figure A200780007583Q00451
<210>2
<211>2021
<212>DNA
<213>紫萍(Spirodela polyrrhiza)
<400>2
Figure A200780007583Q00461
<210>3
<211>2068
<212>DNA
<213>稀脉萍(Lemna aequinoctialis)
<400>3
Figure A200780007583Q00471
Figure A200780007583Q00481
<210>4
<211>1625
<212>DNA
<213>浮萍(Lemna minor)
<400>4
Figure A200780007583Q00482
Figure A200780007583Q00491
Figure A200780007583Q00501
<210>5
<211>1041
<212>DNA
<213>紫萍(Spirodela polyrrhiza)
<400>5
Figure A200780007583Q00502
Figure A200780007583Q00511
<210>6
<211>964
<212>DNA
<213>稀脉萍(Lemna aequinoctialis)
<400>6
Figure A200780007583Q00512
<210>7
<211>535
<212>DNA
<213>浮萍(Lemna minor)
<400>7
Figure A200780007583Q00521
<210>8
<211>980
<212>DNA
<213>紫萍(Spirodela polyrrhiza)
<400>8
Figure A200780007583Q00522
<210>9
<211>1104
<212>DNA
<213>稀脉萍(Lemna aequinoctialis)
<400>9
<210>10
<211>64
<212>DNA
<213>膨胀浮萍(Lemna gibba)
<400>10
Figure A200780007583Q00542
<210>11
<211>58
<212>DNA
<213>膨胀浮萍(Lemna gibba)
<400>11
Figure A200780007583Q00543
<210>12
<211>62
<212>DNA
<213>膨胀浮萍(Lemna gibba)
<400>12
Figure A200780007583Q00551
<210>13
<211>1808
<212>DNA
<213>浮萍(Lemna minor)
<220>
<221>misc_feature
<222>(598)..(598)
<223>n is a,c,g,or t
<400>13
Figure A200780007583Q00561
<210>14
<211>1338
<212>DNA
<213>浮萍(Lemna minor)
<400>14
Figure A200780007583Q00571
Figure A200780007583Q00581
<210>15
<211>84
<212>DNA
<213>浮萍(Lemna minor)
<400>15
<210>16
<211>28
<212>PRT
<213>浮萍(Lemna minor)
<400>16

Claims (52)

1.一种分离的核酸分子,包含选自下面的核苷酸序列:
a)包含在SEQ ID NO:1、2、3、4、5、6、13或14中示出的序列的核苷酸序列;
b)包含在SEQ ID N0:1、2、3、4、5、6、13或14中示出的序列的至少50个连续核苷酸的核苷酸序列,其中所述核苷酸序列起始在植物细胞中的转录;
c)包含在SEQ ID NO:1、2、3、4、5、6、13或14中示出的序列的功能性片段的核苷酸序列,其中所述片段起始在植物细胞中的转录;
d)包含与在SEQ ID NO:1、2、3、4、5、6、13或14中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所述核苷酸序列起始在植物细胞中的转录;和
e)在严格条件下与a)的核苷酸序列的互补序列杂交的核苷酸序列,其中所述核苷酸序列起始在植物细胞中的转录。
2.一种表达构建体,包含根据权利要求1所述的核酸分子。
3.根据权利要求2所述的表达构建体,还包含有效连接的所关注的异源核苷酸序列。
4.根据权利要求3所述的表达构建体,还包含有效连接的信号肽的编码序列,所述信号肽引导由所述所关注的异源核苷酸序列编码的多肽分泌进培养基中。
5.根据权利要求4所述的表达构建体,其中所述信号肽包含选自下面的氨基酸序列:
a)SEQ ID NO:16中示出的序列;
b)与SEQ ID NO:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引导所述多肽分泌进培养基中;和
c)SEQ ID NO:16中示出的序列的功能性片段,其中所述序列引导所述多肽分泌进培养基中。
6.根据权利要求5所述的表达构建体,其中所述信号肽的所述编码序列包含选自下面的核苷酸序列:
a)SEQ ID NO:15中示出的序列;
b)与SEQ ID NO:15中示出的序列具有至少90%的序列同一性的序列;和
c)SEQ ID NO:15中示出的序列的片段;
7.根据权利要求3至6中任意一项所述的表达构建体,其中所述所关注的异源核苷酸序列编码哺乳动物多肽。
8.根据权利要求7所述的表达构建体,其中所述哺乳动物多肽选自胰岛素、生长激素、α-干扰素、β-干扰素、β-葡糖脑苷脂酶、β-葡萄糖醛酸酶、视网膜母细胞瘤蛋白、p53蛋白质、制管张素、瘦素、促红细胞生成素、粒细胞巨噬细胞集落刺激因子、纤维蛋白溶酶原、单克隆抗体、Fab片段、单链抗体、细胞因子、受体、人疫苗、动物疫苗、肽、血清白蛋白及其组合。
9.一种转化的植物或植物细胞或结节,含有根据权利要求2所述的表达构建体。
10.根据权利要求9所述的转化的植物或植物细胞或结节,其中所述植物或植物细胞或结节是单子叶植物。
11.根据权利要求10所述的转化的植物或植物细胞或结节,其中所述单子叶植物来自选自下列属的属:紫萍(Spirodela)属、芜萍(Wolffia)属、Wolfiella属、Landoltia属和浮萍(Lemna)属。
12.根据权利要求所述10的转化的植物或植物细胞或结节,其中所述单子叶植物是选自下面物种的成员:浮萍(Lemna minor)、Lemnaminiscula、稀脉萍(Lemna aequinoctialis)和膨胀浮萍(Lemna gibba)。
13.根据权利要求9所述的转化的植物或植物细胞或结节,其中所述植物或植物细胞或结节是双子叶植物。
14.一种分离的核酸分子,包含选自下面的核苷酸序列:
a)包含在SEQ ID NO:7、8或9中示出的序列的核苷酸序列;和
b)包含在SEQ ID NO:7、8或9中示出的序列的功能性片段的核苷酸序列,其中所述片段增强在植物细胞中的转录;
15.一种表达构建体,包含根据权利要求14所述的核酸分子。
16.根据权利要求15所述的表达构建体,还包含有效连接的所关注的启动子。
17.根据权利要求16所述的表达构建体,其中所述的所关注的启动子选自含有在SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:13和SEQ ID NO:14中示出的序列的核苷酸序列。
18.一种分离的核酸分子,包含选自下面的核苷酸序列:
a)包含在SEQ ID NO:15中示出的序列的核苷酸序列;
b)包含在SEQ ID NO:15中示出的序列的至少25个连续核苷酸的核苷酸序列,其中所述核苷酸序列编码信号肽;
c)包含在SEQ ID NO:15中示出的序列的功能性片段的核苷酸序列,其中所述核苷酸序列编码信号肽;和
d)包含与在SEQ ID NO:15中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所述核苷酸序列编码信号肽。
19.一种表达构建体,包含有效连接至所关注的异源核苷酸序列的根据权利要求18所述的核酸分子。
20.根据权利要求19所述的表达构建体,还包含有效连接的所关注的启动子。
21.根据权利要求20所述的表达构建体,其中所述的所关注的启动子选自含有在SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:13和SEQ ID NO:14中示出的序列的核苷酸序列。
22.根据权利要求19至21中任意一项所述的表达构建体,其中所述的所关注的异源核苷酸序列编码哺乳动物多肽。
23.根据权利要求22所述的表达构建体,其中所述哺乳动物多肽选自胰岛素、生长激素、α-干扰素、β-干扰素、β-葡糖脑苷脂酶、β-葡萄糖醛酸酶、视网膜母细胞瘤蛋白、p53蛋白质、制管张素、瘦素、促红细胞生成素、粒细胞巨噬细胞集落刺激因子、纤维蛋白溶酶原、单克隆抗体、Fab片段、单链抗体、细胞因子、受体、人疫苗、动物疫苗、肽、血清白蛋白及其组合。
24.一种用于在植物或植物细胞或结节中表达核苷酸序列的方法,所述方法包括将表达构建体引入所述植物或植物细胞或结节中,所述表达构建体包含有效连接至所关注的异源核苷酸序列的表达控制元件,其中所述表达控制元件包含选自下面的核苷酸序列:
a)包含在SEQ ID NO:1、2、3、13或14中示出的序列的核苷酸序列;
b)包含在SEQ ID NO:1、2、3、13或14中示出的序列的至少50个连续核苷酸的核苷酸序列,其中所述核苷酸序列起始在植物细胞中的转录;
c)包含在SEQ ID NO:1、2、3、13或14中示出的序列的功能性片段的核苷酸序列,其中所述片段起始在植物细胞中的转录;
d)包含与在SEQ ID NO:1、2、3、13或14中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所述核苷酸序列起始在植物细胞中的转录;和
e)在严格条件下与a)的核苷酸序列的互补序列杂交的核苷酸序列,其中所述核苷酸序列起始在植物细胞中的转录。
25.根据权利要求24所述的方法,其中所述植物或植物细胞或结节是单子叶植物。
26.根据权利要求25所述的方法,其中所述单子叶植物来自选自下列属的属:紫萍属、芜萍属、Wolfiella属、Landoltia属和浮萍属。
27.根据权利要求25所述的方法,其中所述单子叶植物是选自下面物种的成员:浮萍、Lemna miniscula、稀脉萍和膨胀浮萍。
28.根据权利要求24所述的方法,其中所述植物或植物细胞或结节是双子叶植物。
29.根据权利要求24所述的方法,其中所述表达构建体还包含有效连接的信号肽的编码序列,所述信号肽引导由所述所关注的异源核苷酸序列编码的多肽分泌进培养基中。
30.根据权利要求29所述的方法,其中所述信号肽包含选自下面的氨基酸序列:
a)在SEQ ID NO:16中示出的序列;
b)与在SEQ ID NO:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引导所述多肽分泌进培养基中;和
c)在SEQ ID NO:16中示出的序列的功能性片段,其中所述序列引导所述多肽分泌进培养基中。
31.根据权利要求30所述的方法,其中所述的所述信号肽的编码序列包含选自下面的核苷酸序列:
a)在SEQ ID NO:15中示出的序列;
b)与在SEQ ID NO:15中示出的序列具有至少90%的序列同一性的序列;和
c)在SEQ ID NO:15中示出的序列的片段。
32.根据权利要求24至31中任意一项所述的方法,其中所述的所关注的异源核苷酸序列编码哺乳动物多肽。
33.根据权利要求32所述的方法,其中所述哺乳动物多肽选自胰岛素、生长激素、α-干扰素、β-干扰素、β-葡糖脑苷脂酶、β-葡萄糖醛酸酶、视网膜母细胞瘤蛋白、p53蛋白质、制管张素、瘦素、促红细胞生成素、粒细胞巨噬细胞集落刺激因子、纤维蛋白溶酶原、单克隆抗体、Fab片段、单链抗体、细胞因子、受体、人疫苗、动物疫苗、肽、血清白蛋白及其组合。
34.根据权利要求27所述的方法,其中所述所关注的异源核苷酸序列在所述所关注的异源核苷酸序列的编码序列中包含浮萍优选的密码子。
35.根据权利要求34所述的方法,其中所述所关注的异源核苷酸序列包含在70-100%之间的浮萍优选的密码子。
36.一种用于在植物或植物细胞或结节中表达核苷酸序列的方法,所述方法包括将表达构建体引入所述植物或植物细胞或结节中,所述表达构建体包含有效连接至所关注的异源核苷酸序列的表达控制元件,其中所述表达控制元件包含选自下面的核苷酸序列:
a)包含在SEQ ID NO:10、11或12中示出的序列的核苷酸序列;
b)包含与在SEQ ID NO:10、11或12中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所述核苷酸序列增强在植物细胞中的基因表达;和
c)在严格条件下与a)的核苷酸序列的互补序列杂交的核苷酸序列,其中所述核苷酸序列增强在植物细胞中的基因表达。
37.根据权利要求36所述的方法,其中所述植物或植物细胞或结节是单子叶植物。
38.根据权利要求37所述的方法,其中所述单子叶植物来自选自下列属的属:紫萍属、芜萍属、Wolfiella属、Landoltia属和浮萍属。
39.根据权利要求37所述的方法,其中所述单子叶植物是选自下面物种的成员:浮萍、Lemna miniscula、稀脉萍和膨胀浮萍。
40.根据权利要求36所述的方法,其中所述植物或植物细胞或结节是双子叶植物。
41.根据权利要求36所述的方法,其中所述表达构建体还包含有效连接的信号肽的编码序列,所述信号肽引导由所述所关注的异源核苷酸序列编码的多肽分泌进培养基中。
42.根据权利要求41所述的方法,其中所述信号肽包含选自下面的氨基酸序列:
a)在SEQ ID NO:16中示出的序列;
b)与在SEQ ID NO:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引导所述多肽分泌进培养基中;和
c)在SEQ ID NO:16中示出的序列的功能性片段,其中所述序列引导所述多肽分泌进培养基中。
43.根据权利要求42所述的方法,其中所述的所述信号肽的编码序列包含选自下面的核苷酸序列:
a)在SEQ ID NO:15中示出的序列;
b)与在SEQ ID NO:15中示出的序列具有至少90%的序列同一性的序列;和
c)在SEQ ID NO:15中示出的序列的片段;
44.根据权利要求36至43中任意一项所述的方法,其中所述的所关注的异源核苷酸序列编码哺乳动物多肽。
45.根据权利要求44所述的方法,其中所述哺乳动物多肽选自胰岛素、生长激素、α-干扰素、β-干扰素、β-葡糖脑苷脂酶、β-葡萄糖醛酸酶、视网膜母细胞瘤蛋白、p53蛋白质、制管张素、瘦素、促红细胞生成素、粒细胞巨噬细胞集落刺激因子、纤维蛋白溶酶原、单克隆抗体、Fab片段、单链抗体、细胞因子、受体、人疫苗、动物疫苗、肽、血清白蛋白及其组合。
46.根据权利要求39所述的方法,其中所述所关注的异源核苷酸序列在所述所关注的异源核苷酸序列的编码序列中包含浮萍优选的密码子。
47.根据权利要求46所述的方法,其中所述所关注的异源核苷酸序列包含在70-100%之间的浮萍优选的密码子。
48.一种用于在植物或植物细胞或结节中表达和分泌异源多肽的方法,所述方法包括将表达构建体引入植物或植物细胞或结节中,所述表达构建体包含有效连接至核苷酸序列的表达控制元件,所述核苷酸序列包含所述异源多肽的编码序列和有效连接的引导所述异源多肽的细胞外分泌的信号肽的编码序列,其中所述信号多肽选自:
a)在SEQ ID NO:16中示出的序列;
b)与在SEQ ID NO:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引导所述多肽的细胞外分泌;和
c)在SEQ ID NO:16中示出的序列的功能性片段,其中所述序列引导所述多肽的细胞外分泌。
49.根据权利要求48所述的方法,其中所述的所述信号肽的编码序列包含选自下面的核苷酸序列:
a)在SEQ ID NO:15中示出的序列;
b)与在SEQ ID NO:15中示出的序列具有至少90%的序列同一性的序列;和
c)在SEQ ID NO:15中示出的序列的片段。
50.根据权利要求48或49中任意一项所述的方法,其中所述所关注的异源核苷酸序列编码哺乳动物多肽。
51.根据权利要求50所述的方法,其中所述哺乳动物多肽选自胰岛素、生长激素、α-干扰素、β-干扰素、β-葡糖脑苷脂酶、β-葡萄糖醛酸酶、视网膜母细胞瘤蛋白、p53蛋白质、制管张素、瘦素、促红细胞生成素、粒细胞巨噬细胞集落刺激因子、纤维蛋白溶酶原、单克隆抗体、Fab片段、单链抗体、细胞因子、受体、人疫苗、动物疫苗、肽、血清白蛋白及其组合。
52.根据权利要求48至51中任意一项所述的方法,其中所述表达控制元件选自含有在SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:13和SEQ ID NO:14中示出的序列的核苷酸序列。
CNA2007800075839A 2006-01-17 2007-01-17 来自浮萍科的表达控制元件 Pending CN101395177A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US75930806P 2006-01-17 2006-01-17
US60/759,308 2006-01-17
US60/848,961 2006-10-03

Publications (1)

Publication Number Publication Date
CN101395177A true CN101395177A (zh) 2009-03-25

Family

ID=40494803

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800075839A Pending CN101395177A (zh) 2006-01-17 2007-01-17 来自浮萍科的表达控制元件

Country Status (1)

Country Link
CN (1) CN101395177A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106459921A (zh) * 2013-08-21 2017-02-22 冷泉港实验室 浮萍的转化及其用途

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106459921A (zh) * 2013-08-21 2017-02-22 冷泉港实验室 浮萍的转化及其用途

Similar Documents

Publication Publication Date Title
EP1305437B1 (en) Expression of biologically active polypeptides in duckweed
AU2001288226A1 (en) Expression of biologically active polypeptides in duckweed
US20080115243A1 (en) Transgenic Plants Expressing Intein Modified Proteins and Associated Processes for Bio-Pharmaceutical Production
AU2004280228B2 (en) Expression of biologically active polypeptides in duckweed
CN1938427A (zh) 纤溶酶原和微纤溶酶原在浮萍中的表达
US8034916B2 (en) Expression control elements from the Lemnaceae family
SG184434A1 (en) A polynucleotide encoding nf-yb derived from jatropha and use thereof
US20060195946A1 (en) Expression of biologically active polypeptides in duckweed
CN105820220B (zh) 抗逆相关蛋白及其编码基因在调控植物耐碱性中的应用
CN101395177A (zh) 来自浮萍科的表达控制元件
CN105713079A (zh) 蛋白质及其相关生物材料在提高植物产量中的应用
CN105669847B (zh) 大豆蛋白GmVPS9a1在调控植物贮藏蛋白分选中的应用
CN105693834B (zh) 大豆蛋白GmVPS9a2在调控植物贮藏蛋白分选中的应用
US20130117890A1 (en) Processes for accelerating plant growth and increasing cellulose yield
ES2351314T3 (es) Expresión de polipéptidos biológicamente activos en lenteja de agua.
AU2007231691A1 (en) Expression of biologically active polypeptides in duckweed

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SISUOEN BIOPHARMING CO.,LTD.

Free format text: FORMER OWNER: BIOLEX THERAPEUTICS INC.

Effective date: 20130117

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20130117

Address after: Nijmegen

Applicant after: SYNTHON BV

Address before: North Carolina

Applicant before: Biolex Inc.

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20090325