一种新型质体定向核酸序列,一种新型β-淀粉酶 序列,一种刺激响应型启动子及其用途
本申请是1999年8月13日提交的PCT/GB99/02697号发明专利申请的分案申请,原申请于2001年4月18日进入中国国家阶段,并获得中国专利申请号99812300.5。
虽然分离并鉴定了被推测与淀粉在植物中合成和降解相关的多种酶,但该过程的确切机制尚不明了。
在白天,淀粉在叶片的叶绿体中积累,而在夜间被用于满足植物能量和生物合成的需要。对这种被称为瞬时淀粉转运的模式尚不完全了解,但必然与合成或降解酶活性的协同调控作用相关。在叶片组织中,主要的降解途径被认为与磷酸分解和水解活性,特别是α-葡糖醛酸酶(E.C.3.2.1.3)相关(Nielson和Stitt,1997)。
淀粉还在诸如种子、果实和块茎的储存器官的造粉体中积累。在这种情况下,淀粉能储存较长时间,并且淀粉的转运伴随着储存器官组织的降解和淀粉分解和磷酸分解活性的加强。不过,有证据表明,淀粉的转化也发生于储存器官的造粉体中(Sweetlove等,1996)。这一过程同样需要合成和降解酶活性的协同调控作用。
叶绿体和造粉体都源于前质体,因此,除了分别是叶片和储存器官中淀粉合成的部位外,还具有很多共同的特征。叶绿体还可以转化成造粉体和其他类型的质体(Thomson和Whatley,1980)。
淀粉是两种多糖的混合物,直链淀粉是通过α-1,4-糖苷键连接在一起的糖基单位的线性链;而支链淀粉是由许多α-1,4-葡聚糖的线性链组成,这些线性链通过α-1,6-糖苷键连接在一起。
参与淀粉合成的酶有ADPG焦磷酸化酶(E.C.2.7.7.21),淀粉合成酶(E.C.2.4.1.21)以及分支酶(E.C.2.4.1.18)。ADPG焦磷酸化酶负责提供底物ADPG,该分子起着葡萄糖单体供体的作用,这些单体通过淀粉合成酶(α-1,4键)和分支酶(α-1,6键)的转化作用连接在一起。
人们认为,淀粉粒的不溶性的晶体结构是通过伸长的螺旋型、分支的支链淀粉分子的紧密堆积而形成的,由线性直链淀粉分子填充所有空间。
业已报导了多种淀粉降解酶活性,包括α-淀粉酶(E.C.3.2.1.1),异淀粉酶(E.C.3.2.1.68),β-淀粉酶(E.C.3.2.1.2),α-葡糖酸苷酶(E.C.3.2.1.3),淀粉磷酸化酶(E.C.2.4.1.1)和歧化酶(E.C.2.4.1.25)。所述酶的多种活性以多种形式存在于植物中,并且某些形式被认为与淀粉的合成相关。所有的酶都可能在某种程度上参与淀粉的转运过程,不过,其确切的作用和可能的相互作用尚未确定。通过其中两种酶的活性,可以最好地说明确定不同酶的作用的难度,这两种酶被认为在淀粉降解过程中起主要作用:淀粉磷酸化酶和淀粉酶。
淀粉磷酸化酶能催化α-1,4-葡聚糖可逆地释放葡萄糖-1-磷酸。在植物组织中存在两种形式的淀粉磷酸化酶:Pho1或L-型,位于质体的里面,并对麦芽糖糊精具有高的亲和力;Pho2或H-型,存在于胞质中,并对诸如糖原的大的,高度分支的葡聚糖具有高的亲和力。尽管质体Pho1酶有可能是参与淀粉转运的一种酶,但对叶片酶活性的反义抑制,在转基因马铃薯的叶片中对淀粉积累没有影响(Sonnewald等,1995)。在另一项研究中,对胞质Pho2的反义抑制,能对转基因马铃薯块茎的发芽行为产生影响,但对淀粉积累和降解没有影响(Duwenig等,1997)。
有两种主要类型的淀粉酶都能水解直链淀粉和支链淀粉中的α-1,4-葡糖苷键:α-淀粉酶随机地作用于非末端键,而β-淀粉酶从葡聚糖链的非还原端开始起作用释放麦芽糖单元。α-淀粉酶在植物细胞的质外体间隙中的亚细胞定位,被认为反映了这种酶正常分泌的事实。不过,在诸如水稻(Chen等,1994)和甜菜(Li等,1992)的多种植物中,所述酶还定位于叶绿体和造粉体内部,尽管有关位于多种α-淀粉酶蛋白氨基末端的信号序列的发现是蛋白通过ER膜而不是质体膜转运的特征(Chen等,1994)。在一项研究中,将水稻α-淀粉酶基因的启动子和信号序列与细菌GUS基因融合,并用农杆菌属介导的转化导入水稻、烟草和马铃薯(Chan等,1994)。业已证实,所表达的GUS融合蛋白首先被转运到内质网中,然后外泌到由转基因细胞组成的悬浮培养物的培养基中。业已在多项研究中证实,α-淀粉酶能降解天然淀粉分子。
相反,体外研究业已证实,在不事先用其他酶消化淀粉粒的情况下,β-淀粉酶不能降解天然淀粉粒。缺乏活性β-淀粉酶或仅含有微量活性的黑麦(Daussant等,1981)和大豆(Hildebrand和Hymowitz,1981)突变体分别明显地表现出正常的生长和发育。另外,在β-淀粉酶的含量业已大大降低的转基因拟南芥属植物中,未表现出严重的生长缺陷(Mita等,1997)。确定β-淀粉酶在植物中的确切生理学作用的努力由于尚无有关亚细胞定位的确定资料而受到妨碍。尽管有一项研究报导在豌豆叶绿体中存在两种β-淀粉酶(Kakefuda,1986),但涉及诸如蚕豆、大麦、小麦、大豆、甘薯和豌豆等物种的大部分研究得出的结论是,大部分(如果不是全部的话)β-淀粉酶活性存在于叶绿体外(Nakamura等,1991)。这一观点得到了以下事实的支持:即迄今所克隆的所有β-淀粉酶基因都编码缺乏氨基末端叶绿体转运肽序列的蛋白。
在谷类作物中,业已披露了三种类型的β-淀粉酶:一种在颖果成熟期间积累的胚乳特异形式;一种在发芽期间在水稻和玉米的糊粉细胞中从头合成的形式(Wang等,1996);以及一种普遍存在于营养器官中的β-淀粉酶。在拟南芥属中,所述普遍存在的形式占莲座叶的总淀粉降解活性的大约80%。与迄今为止业已克隆的所有其他β-淀粉酶基因相同,编码所述遍在拟南芥属β-淀粉酶的基因不能编码具有亚细胞定向信号的蛋白,因此,这种酶有可能定位于细胞质中。
在多项研究中的发现是惊人的:即消除所述降解活性对植物的生活力没有不利影响,并且淀粉降解酶的亚细胞定位位于质体外面。即预期的β-淀粉酶活性的主要最终产物,即麦芽糖是在分离的叶绿体中做为淀粉降解产物被鉴定的(Peavey等,1977),这一事实使明显缺乏质体定位的β-淀粉酶活性更加令人惊异。最近,业已证实葡萄糖和麦芽糖是在淀粉转运过程中从分离的花椰菜花芽造粉体中分泌出来的(Neuhaus等,1995)。
利用叶片或储存器官的质体生产大量淀粉的能力,对利用植物淀粉的多种工业方法来说具有很高价值,例如,为了提高马铃薯块茎中的淀粉含量,以前业已证实当大肠杆菌ADPG PPase glgC16在转基因马铃薯块茎中超量表达时,流向淀粉的碳流通量增加,但淀粉的净积累量只有很少的增加(Sweetlove等,1997)。分析超量表达品系中的酶活性证实,除了ADPG PPase的改变之外,淀粉酶,特别是β-淀粉酶的活性也有所改变。这一结果表明,在超量表达glgC16蛋白的块茎中,淀粉的积累受到新合成淀粉降解的抑制,即淀粉得到转化。
在另一个例子中,在麦芽糖化过程中淀粉的可利用性与植物中,特别是储存器官中降解酶活性的类型和数量密切相关。作物的所述降解能力的增强,将使得谷物的麦芽糖化或来自块茎或其他储存器官的淀粉向醇的转化更加有效和产量更高。
存在于储存器官中的淀粉的类型取决于存在的ADPG焦磷酸化酶、淀粉合成酶、分支酶和降解酶的活性和形式。各种酶之间的相互作用也很重要。
在植物中产生新型淀粉具有重要价值,因为这可以降低在被用于诸如食品、纸张、药品、胶体、油类和织物的多种行业之前对淀粉进行加工和改性的成本。下面的例子证实了淀粉水解活性在体内改变淀粉结构方面的重要性。
业已在玉米种子中证实,sugaryl突变能导致脱支酶的缺乏,这种酶能水解淀粉的α-1,6-糖基键(James等,1995)。该突变会导致支链淀粉的浓度降低和高度分支的葡聚多糖、植物糖原的积累。
业已在豌豆中证实,由麦芽糖开始连续添加葡萄糖单位直到形成麦芽七糖的短的寡聚糖分子能特异性刺激颗粒结合淀粉合成酶I(GBSSI)的活性(Denyer等,1996)。这种酶被普遍认为是淀粉合成的主要酶(例如,van der Leij等,1991;Hylton等,1995;Ainsworth等,1993)。通过控制麦芽糖-寡聚糖的供应控制GBSSI活性,是一份新专利(WO97/16554)的主题,并且该专利提示,通过导入降解酶,即α-淀粉酶、β-淀粉酶、歧化酶、脱支酶和淀粉磷酸化酶,可以导致麦芽糖-寡聚糖浓度的提高,并因此提高淀粉中直链淀粉和支链淀粉的比例。专利WO97/16554还声称已经克隆了编码所述酶的质体异构型基因。不过,如上文所述,迄今为止所分离的β-淀粉酶基因没有一个能编码具有蛋白定向序列的β-淀粉酶,另外,α-淀粉酶最初是否是导向质体还存在疑问(Chen等,1994;Chan等,1994)。在WO97/16554的随后的内容中,提到了对合适的β-淀粉酶cDNA序列进行工程操作,以便添加质体定向序列。
除了储存器官中淀粉的工业利用之外,叶片中淀粉的含量对作物的农艺学具有重要价值。淀粉是白天在叶片中由在光合作用期间固定的碳合成的。淀粉被储存在叶绿体中,并且在夜间降解,成为植物新陈代谢的能源和中介物。目前,尚不了解控制所述源-库关系的机制,不过,已经清楚,控制叶片质体中淀粉的含量和可利用度对植物产量(生物量和产量)具有明显影响。
对于以叶片作为主要农产品的作物来说,例如烟草,叶片中的淀粉含量也很重要。已知淀粉含量对于吸烟时最终的烟草味道具有影响。提供控制烟草叶片中淀粉含量的方法对于烟草行业具有重要价值。
在本发明中我们首次披露了编码新型β-淀粉酶的cDNA的分离,这种酶通过一种新型定向序列导向质体(因此被称为叶绿体定向(ct)β-淀粉酶)。这种完整编码序列的分离是令人吃惊的,因为一般认为,一旦较小的葡聚糖片段通过转运或通过膜的降解从质体释放到细胞质中,β-淀粉酶仅参与淀粉的水解。所述酶在质体中的定位产生了不可预见的可能性,即ctβ-淀粉酶参与叶绿体中瞬时淀粉的降解和造粉体中淀粉的储存。
叶绿体和造粉体之间特征的相似性(Thomson和Whatley,1980)与本发明相关,因为业已证实,来自叶绿体定向多肽的转运肽可能将异源多肽输入造粉体,反之亦然。例如,来自玉米颗粒结合淀粉合成酶的转运肽在与大肠杆菌β-葡糖醛酸酶(GUS)蛋白融合之后,不仅能将GUS蛋白输入造粉体,而且能输入叶绿体(Klosgen和Weil,1991)。
另外,我们证实ct-Bmy基因在拟南芥属中的表达以及ct-Bmy启动子:GUS融合体在转基因烟草中的表达可以通过光照和蔗糖分别进行调控。考虑到拟南芥属的ATβ-Amy的光照和糖诱导的密切相关性,这一发现是惊人的(Mita等,1995)。
本发明提供了在本文中被称为序列1的核酸序列,它含有1-294个核苷酸,并具有一个能将另一种编码序列定向至植物质体的序列,或者是与所披露的序列1的序列具有至少65%或更高同源性并具有相同的导向能力的序列。
所述核酸序列优选编码大约94,更优选大约85个氨基酸残基。
本发明还提供了一种在本文中被称作序列2的核酸序列,它含有1-1662个核苷酸,并具有一个能编码β-淀粉酶的序列,或者是与序列2中所披露的序列具有至少65%或更高同源性并具有相同的编码能力的序列。
本发明还提供了一种在本文中被称作序列3的核酸序列,它含有1-1953个核苷酸,并具有一个能编码叶绿体定向β-淀粉酶的序列,或者是与序列3中所披露的序列具有至少65%或更高同源性并具有相同的编码能力的序列。
同源序列还包括在中等严格条件(在65℃下,在2×SSC中洗涤)下能与序列1、序列2或序列3杂交的序列。
所述核酸序列优选是mRNA或cDNA序列,不过,它也可以是基因组DNA。
本发明还提供了一种提高或降低植物中淀粉生物合成或降解途径上的一种酶的活性的方法,该方法包括以下步骤:将包括编码质体定向序列的核酸序列和淀粉生物合成或降解途径中一种酶的编码序列的嵌合基因稳定地整合到植物基因组中,以及再生具有改变了的基因组的植物。
本发明还提供了一种将蛋白或酶引导到植物质体中的方法,该方法包括以下步骤:将包括编码质体定向序列的核酸序列和一种蛋白或酶的编码序列的嵌合基因稳定地整合到植物基因组中,以及再生具有改变了的基因组的植物,所述蛋白或酶可以是下列一组途径中的一种或多种:脂类合成,光合作用,氨基酸代谢,固氮,固碳或碳水化合物聚合物的合成;或者能够赋予所述植物一种特征,该特征选自下列一组中的一种或多种:除草剂抗性和抗虫性,例如,包括真菌、细菌或病毒抗性。
本发明还提供了一种具有嵌合基因的植物,该嵌合基因包括一个启动子、一个编码质体定向序列的核酸编码序列,该序列能够将淀粉生物合成或降解途径上的一种酶的编码序列引导到植物质体中,以及一个终止子。
本发明还提供了一种能够指导由可操作地与它相连的编码序列编码的产物表达的核酸序列,所述核酸序列在本文中被称作序列8,或者与序列8具有至少65%的同源性并具有大体上与它相同的功能,并且所述核酸序列对刺激可产生反应,所述产物的表达水平根据作用于所述核酸序列上的刺激而变化。
本发明还提供了一种改变由一种编码序列编码的产物的表达水平的方法,该编码序列可操作地连接于能在植物中指导所述产物表达的核酸序列上,所述方法包括以下步骤:将一种嵌合基因稳定地整合到植物基因组上,该嵌合基因包括能够指导由可操作地与它相连的编码序列编码的产物表达水平的核酸序列,所述核酸序列具有大体上与序列8相同的序列或者与该序列具有至少65%的同源性并具有大体上与它相同的功能,并且对刺激有反应。
所述刺激优选是光照的存在或缺乏和/或糖含量水平的改变。另外,所述刺激是通过发育控制的刺激。
理想的糖是蔗糖或葡萄糖中的一种或多种。
优选的糖是蔗糖。
理想的是,所述诱导型启动子或能够在植物中指导所述产物表达的核酸序列是在遮光但有糖的条件下或者是在无糖但有光的条件下能够操纵的。所述遮光但有糖的植物组织可以是地下器官或储存器官。例如,地下器官可以是块茎、根茎或根,而其他储存器官可以是幼叶或种子。
所述无糖但有光的植物组织可以是较老的叶片(其中没有被转运的糖)、花部分或发芽的种子。
具有上述DNA结构特征的结构和嵌合基因也是本发明的方面。
含有包括编码上述质体定向序列的核酸序列和淀粉生物合成或降解途径上的一种酶的核酸编码序列的嵌合基因,或包括能够指导另一种编码序列表达的核酸序列的嵌合基因,或包括上述对刺激有反应的核酸序列或一种编码序列的嵌合基因(所述编码序列的表达水平可以根据作用于所述核酸序列上的刺激而改变)的植物细胞也是本发明的一个方面,含有本发明的一种或多种嵌合基因的转化植物的种子也是本发明的一个方面。
优选地,所述质体定向序列是序列1。
在本发明的第一方面,上述方法可用于改变叶片的代谢,以便淀粉在叶片中积累或者从叶片中转运出去,这一过程能够从总体上改变植物内的源-库关系。这一目的可以通过将所述定向序列和淀粉生物合成或降解途径上的一种酶的核酸编码序列置于合适的启动子指导之下而实现。合适启动子的选择,会导致得到叶片中淀粉含量升高或降低的植物,这种植物可用于诸如烟草行业中;或者通过改变植物的源-库关系,导致在各种其他植物组织中淀粉产量的改变,所述组织如块茎、果实和根。
在本发明的该实施方案中,一种合适的启动子可以在整个植株中指导所述质体定向序列和所述淀粉生物合成或降解途径上的一种酶的编码序列的表达,即所谓的组成型表达,或者特限于叶片中表达。这种改变具有重要影响,使得植物的淀粉含量和/或器官产量得到明显的改变。
一种能够在所有植物组织中指导表达的优选的启动子是来自花椰菜花叶病毒35S基因的启动子。对于叶片表达来说,优选的启动子可来自编码核酮糖二磷酸羧化酶小亚基的基因或豌豆质体兰素基因。本领域技术人员会认可用于组成型表达和叶片特异表达的其他合适的启动子,如分别是胭脂氨酸合酶启动子和叶绿素a/b结合蛋白启动子。
所述淀粉生物合成或降解途径上的酶的编码序列或其部分可以沿正常阅读框方向,即有义方向排列,或者沿反阅读框方向,即反义方向排列。通过有义、反义或共抑制技术(后者是由DNAP在其欧洲专利申请号0465572和0647715中披露的)实现的所述酶在植物中活性的上调或下调,可用于实现植物淀粉的改变。
在本发明的第二方面,本发明的方法还可用于改变储存器官中淀粉的代谢,以便提高淀粉的含量和/或根据特定工业方法的目的以合适的形式提供淀粉。所述方法包括造纸;制药,织物、染料和建筑制品;提供烘烤、乳制品和点心类食品;生产罐装、干燥或即食食品;谷物的麦芽糖化和生产糖浆和醇。
在本发明的第一或第二方面,被选择用于所述方法中的嵌合基因可以是来自淀粉降解途径的酶,即淀粉降解酶。优选地,所述嵌合基因包括叶绿体定向的β-淀粉酶(以下称之为ctβ-淀粉酶),更优选地包括源于拟南芥的ctβ-淀粉酶(以下称之为At ctβ-淀粉酶),参见序列3。还可以使用可能源于诸如马铃薯、烟草、小麦、玉米和大麦的其他植物来源的与At ctβ-淀粉酶同源的序列。通过杂交或聚合酶链式反应(PCR)技术进行的标准克隆方法,可用于从所述生物中分离序列:例如,分子克隆技术,如由Sambrook等(1989)披露的技术和由Innes等(1990)披露的PCR技术。适用于所述质体定向序列的其他淀粉降解酶、一种或多种所述酶的编码序列包括α-淀粉酶、歧化酶、脱支酶、淀粉磷酸化酶、α-葡糖苷酶和非质体β-淀粉酶。
在本发明的方法的第二方面,可以选择在植物的储存器官中指导表达的优选启动子,例如,源于下列基因的启动子:编码小麦胚乳的高分子量麦谷蛋白的基因;编码小麦胚乳的α-,β-麦醇溶蛋白的基因;编码大麦胚乳的大麦醇溶蛋白的基因;或编码马铃薯块茎的patatin的基因。其他合适的启动子为本领域技术人员所熟知。
在本发明任一方面,组织代谢的改变或淀粉类型或特征的改变可以通过刺激反应产生,也就是可诱导,即利用本文所披露的诱导型启动子诱导(序列8)。例如,所述诱导型启动子的光诱导性特征可用于通过诱导诸如芽孢杆菌RNA酶的基因(如在专利WO98/10081中所述),通过影响花粉发育或影响在诸如果实成熟或种子发芽的其他光依赖性过程中的非光反应基因控制结实。所述光诱导型启动子还可用于启动影响在叶片中产生刺激代谢产物,例如产生生物碱的基因。光诱导型启动子还可用于在叶片或其他光合组织中控制淀粉生物合成酶基因,或者在从诸如暗处的储存点取出块茎后启动基因。所述诱导型启动子的糖诱导性特征可用于调控诸如发育中的块茎或其他非光合组织中的基因,如抗虫害基因和/或能够影响作物收获后品质的基因。对于马铃薯来说,枯萎病、黑胫病和干腐病抗性基因是特别有利的,并且最好是克隆到与糖诱导型启动子的重组基因上。另外,所述诱导型启动子的糖诱导性特征可用于在组织培养过程中启动选择标记的基因的表达。
本领域技术人员通过使用众所周知的技术,如缺失研究,可以很方便地从序列8中找出糖诱导型效应因子和/或光诱导型效应因子。Pwee和Gray(1993)用一种标记基因在豌豆质体兰素基因上进行了这样的缺失研究,以便确定其操纵区。
本文所披露的方法或者在诸如由Sambrook等(1989)和Gelvin和Stanton(1995)在实验室手册中所披露的用于克隆基因序列并将其插入合适的载体(载体或质粒等)的方法,是将所述概念付诸实施的本领域技术人员众所周知的技术。嵌合基因或上述基因可以单独导入,或者与一种或多种其他嵌合基因一起导入,如一种或多种上述的其他基因。在使用编码淀粉降解途径的一种酶的第一种嵌合基因的上述实施方案中,所述第二种嵌合基因可以包括(举例来说)一个编码来自淀粉生物合成途径的酶的核酸序列,该序列同样受合适的启动子和合适的终止子的指导。第二种嵌合基因的启动子和/或终止子可以与第一种嵌合基因的启动子和/或终止子相同或不同。编码淀粉生物合成途径中的酶的合适的序列,是编码蔗糖合成酶、ADPG焦磷酸化酶、淀粉合成酶的核酸序列,并可以包括编码分支酶、α-淀粉酶、异淀粉酶、非质体β-淀粉酶、α-葡糖苷酶、淀粉磷酸化酶和歧化酶的核酸序列。
业已披露了用于将一种以上的嵌合基因导入植物中的方法,该方法包括构建一种二元载体,将所述嵌合基因连接在一个核酸分子上;用两种或两种以上不同的农杆菌属细胞,例如,用含有不同嵌合基因的不同的二元载体进行共转化;或者用第二种不同的嵌合基因转化已经具有一种嵌合基因的植物,即再转化。在后一种情况下,在导入第二种嵌合基因之后,筛选转基因植物的方法必须与用于导入第一种嵌合基因的筛选方法不同。合适的选择标记包括潮霉素、卡那霉素、氨磺酰和Basta抗性。还可以使用诸如让各自含有一种嵌合基因的两种植物杂交的生物学方法。
还可将两种嵌合基因结构用于改变已经转化过的植物的淀粉含量,这种植物表现出第一种酶活性的明显增强,以及在淀粉合成方面的后续改变。
因此,本发明还提供了一种用于改变一种转基因植物中另一种酶的方法,所述转基因植物已经表现出由于遗传转化而导致的一种酶活性的提高或降低,以便上调或下调所述另一种酶,并因此增加或减少由所述再转化植物产生的淀粉的数量。
有利的是,所述第一种转化植物具有较强的淀粉生物合成途径中的酶活性。试图提高植物淀粉含量的一个例子是用编码ADPG-PPase的基因,例如glgC16转化过的转基因马铃薯(例如,参见WO91/19806)。在这种植物中淀粉含量的提高比较小。所述第一种转化植物优选用编码淀粉降解酶的嵌合基因进行再次转化。该嵌合基因优选包括诸如At ctβ-淀粉酶。glgC16蛋白是在第一种转化的块茎中表达的,并导致ADPG-PPase活性的提高,以及流向淀粉的碳流量的增加。理想的是,所述嵌合的At ctβ-淀粉酶基因或其部分在再转化块茎中的表达,会导致ctβ-淀粉酶活性的下调,即共抑制或反义技术,由此导致淀粉积累的增加。
优选的是,所述第二种酶的表达是定向于块茎的。指导At ctβ-淀粉酶嵌合基因在块茎中表达的合适的启动子,是来自编码patatin基因的启动子。
表达glg16的第一种转化马铃薯植物具卡那霉素抗性,因此,At ctβ-淀粉酶嵌合基因的二元载体结构携带一种不同的抗性基因,例如,优选氨磺酰抗性基因。增加马铃薯块茎中淀粉的产量将是有利的,例如,对于薯片生产商来说,马铃薯干物质每增加1%,会导致增产4%。
薯片生产还被用于说明本发明的另一个优点。当马铃薯在低于8℃的温度下储存时,会积累由淀粉降解所产生的还原糖、葡萄糖和果糖。在将马铃薯炸成薯片时,所述还原糖在Maillard反应中与氨基酸反应产生褐色,并破坏产品的口味。将能终止淀粉降解,并因此终止还原糖积累的嵌合基因导入马铃薯植物,对于食品工业来说将是有利的。所述嵌合基因优选在一种共抑制或反义结构中包括编码ctβ-淀粉酶的编码序列或该序列的一部分,该序列是由一种合适的启动子和终止子驱动的。合适的启动子来自马铃薯块茎中编码patatin的基因。理想的是,上面提到的任一种其他淀粉降解酶都可用于取代ctβ-淀粉酶。
如果需要在发育的叶片和发育的块茎中进行协同表达的话,序列8的诱导型启动子也可用于所述结构中,因为patatin启动子也是蔗糖诱导型的(Rocha-Sosa等,1989)。类似地,序列1所示的编码叶绿体定向多肽的序列还可与其他基因一起使用,所述其他基因缺乏其本身的定向序列,并且必须向质体导向。
上述例子可用来说明使用本发明的可能的优点。本领域技术人员可以理解的是,将基因和可以采用本发明的植物进行组合具有重要意义。
基因组合优选包括ctβ-淀粉酶与编码蔗糖合成酶、ADPG焦磷酸化酶、淀粉合成酶、分支酶、α-淀粉酶、异淀粉酶、非质体β-淀粉酶、α-葡糖苷酶、淀粉磷酸化酶和歧化酶的一种或多种基因的组合,所述基因的序列为本领域技术人员所熟知。另外,来自ctβ-淀粉酶的定向序列可用于上述一种或多种基因。
可以转化的植物优选包括马铃薯、小麦、玉米、大麦、番茄、水稻、豌豆、大豆、花生、木薯、大薯、香蕉和烟草。
下面将结合用于从拟南芥中分离编码ctβ-淀粉酶的cDNA并将该cDNA整合到烟草和马铃薯植物中的实施方案,通过举例形式对本发明进行说明。还给出了刺激响应启动子及其在转基因植物中的活性的例子。
为了便于实施本发明,下面将通过举例形式对下面的示意图进行说明,其中:
图1表示通过荧光显像所获得的SDS-PAGE凝胶上的体外输入翻译产物的放射标记结果。图例:分子量标记(泳道M);翻译产物(泳道Tr);在输入培养之后再分离的和嗜热菌蛋白酶处理过的叶绿体(泳道C);基质级份(泳道S);洗涤的类囊体(泳道T);嗜热菌蛋白酶处理过的类囊体(泳道tT);内包膜级份(泳道I);外包膜级份(泳道O)。β-淀粉酶的推测前体(P),中间体(I)和成熟(M)形式。千道尔顿(K);
图2表示光照与光照和糖对ctβ-淀粉酶转录物在拟南芥幼苗中表达的影响。图2a表示生长在土壤中的5周龄拟南芥属植物总RNA的Northern印迹分析,对所述植物进行以下处理:2天连续光照(L),2天连续遮光(D),2之后进行3天连续光照(LL)或2天遮光之后接着进行3天光照(DL)。图2b表示体外生长的5周龄拟南芥属植物总RNA的Northern印迹分析,将所述植物转移到水中,并进行3天连续光照(WL);或转移到5%的蔗糖中并进行3天遮光(SD)或3天连续光照(SL);或转移到5%葡萄糖溶液中并进行3天遮光(GD)或3天连续光照(GL)。Northern印迹与放射性标记的ct-Bmy cDNA插入片段杂交,并进行放射自显影(上图)。在下面图中示出了相应的溴化乙锭染色的甲醛琼脂糖凝胶。
图3表示在下面的例3中构建的嵌合的ctβ-淀粉酶启动子-GUS基因的T-DNA的示意图,其中,NosP表示胭脂氨酸合成酶启动子;NosT表示胭脂氨酸合成酶终止子;BR是pBI101的T-DNA的右臂反向重复序列,BL是左臂反向重复序列;NPTII表示新霉素磷酸转移酶II编码序列;GUS表示β-葡糖醛酸酶编码序列。ctβ-淀粉酶启动子片段通过划斜线的矩形表示;PCR扩增的Xho I-Bam HI连接片段用黑色的矩形表示。
图4表示光照和蔗糖对由ct Bmy启动子-GUS嵌合基因在烟草幼苗中表达的GUS活性的影响;
图5表示供体载体pDV35S(SK)V的质粒图谱;
图6表示供体载体pDV02000的质粒图谱;
图7表示二元质粒pBNP10431的质粒图谱,其中,35Sp表示CaMV 35S启动子,ct bamy表示完整长度的ctβ-淀粉酶cDNA,35St表示CaMV35S终止子,RB表示二元载体pBinPlus的右臂,colEori表示colEl的细菌复制起点,Rkori表示RK2质粒的oriV复制起点,nptIII表示编码细菌卡那霉素抗性的新霉素磷酸转移酶基因,LB表示所述二元载体的左臂序列,而kan表示植物对卡那霉素的抗性所需要的新霉素磷酸转移酶重组基因;
图8表示二元质粒pBNP10432的质粒图谱,其中的缩略语含义与图7相同;
图9表示二元质粒pBNP02431的质粒图谱,其中的缩略语含义与图7相同,所不同的是,patp表示源于图6中载体pDV02000的patatin I型启动子,而nost表示胭脂氨酸合成酶终止子;和
图10表示二元质粒pBNP02432的质粒图谱,其中的缩略语含义与图9相同。
在序列表中:
序列1是能够将一种编码序列定向到植物质体,特别是叶绿体的核酸;
序列2是编码β-淀粉酶的核酸;
序列3是叶绿体定向(ct)β-淀粉酶的完整序列;
序列4和5是用于例3的扩增方法中的引物;
序列6和7是用于例4的扩增方法中的引物;和
序列8是对刺激有反应,特别是对光照和/或糖有反应的核酸。
例1
分离并鉴定拟南芥叶绿体定向的β-淀粉酶
测定pBmy81中cDNA插入片段的序列
对粘粒G16599(Bevan等,1998)上的37kb拟南芥属染色体IV DNA片段的核苷酸进行BLASTN数据库检索,发现了与拟南芥属、大麦、玉米、水稻、大豆和水稻的叶绿体外β-淀粉酶具有明显同源性的基因。该检索还证实了若干3’末端EST序列,其中的一个序列EST81E10T7(Newman等,1995),以下称为pBmy81,在大约300个核苷酸上相同。克隆EST 81E10T7是由拟南芥属生物资源中心(ABRC)DNA资源中心(俄亥俄大学,美国)提供的。将跨越pBmy81上的cDNA插入片段的Bal31的嵌套缺失亚克隆用作双链PCR循环测序反应的DNA模板,该反应使用荧光染料标记的通用引物。在应用生物系统373A型自动测序仪上分析测序反应物。pBmy81上的cDNA插入核苷酸序列在序列3中示出。由先进技术(剑桥)有限公司(剑桥科学园210号,英国剑桥CB4 4WA)根据国际承认用于专利程序的微生物保藏布达佩斯条约的规定,将结构pBmy81保藏在国立工业和海洋细菌保藏有限公司(NCIMB),圣,马卡大街23号,亚伯丁,苏格兰,保藏日为1998年8月4日,保藏号为NCIMB40964。
鉴定推测的叶绿体定向信号
pBmy81 cDNA插入片段包括位于5’末端的36个非翻译核苷酸,一个编码具有548个氨基酸的蛋白的开放读框(ORF),以及一个232bp的3’末端非翻译区(UTR)。由pBmy81 cDNA插入片段编码的蛋白具有61kDa的预测分子量,并与源于玉米、水稻、大麦、大豆和甘薯的植物叶绿体外β-淀粉酶有高度的氨基酸相似性。不过,由pBmy81编码的蛋白与迄今为止所报导的所有其他β-淀粉酶的不同之处在于,它含有叶绿体定向信号所特有的独特的N-末端延伸加工,即高含量的丝氨酸(16%),苏氨酸(10%)和带正电荷的氨基酸残基(15%)(Baier和Dietz,1997)。在该信号序列上鉴定了作为叶绿体定向信号的区别特征的3个结构域(Schatz和Dobberstein,1996):一个不带电荷的氨基末端域;一个富含羟化氨基酸的中央域;以及一个具有形成两亲性β-链的潜力的羧基末端域。
pBmy81上的cDNA插入片段编码一种叶绿体定向β-淀粉酶
用Percoll分级梯度从50-60克豌豆芽(Pisum sativum L.varFeltham First)中分离完整的叶绿体。按照Mould和Gray的方法(1997a)生长植物材料并分离叶绿体。
通过用NotI进行限制性消化将pBmy81质粒线性化,并用T7 RNA聚合酶进行体外转录。在小麦胚乳翻译系统中合成放射性标记过的前体蛋白。该系统包括来自pBmy81 cDNA的转录物的35S-甲硫氨酸和35S-半胱氨酸,所用方法大体如Mould和Gray所述(1997b)。
按照Mould和Gray的方法(1997b)输入放射性标记过的体外翻译产物。在输入培养之后,用嗜热菌蛋白酶(在输入缓冲液中的最终浓度为0.2mg/ml)在冰上处理完整的叶绿体30分钟,然后通过添加EDTA使其在输入缓冲液中的浓度达到50mM,终止所述蛋白酶反应。通过用输入缓冲液制备的40%的Percoll缓冲液层再次分离叶绿体,然后在输入缓冲液中洗涤(Mould和Gray,1997b)。取1等份(1/10)的嗜热菌蛋白酶处理过的叶绿体样品,进行分析,其余的样品大体上按Schnell和Blobel所述方法(1993)进行分离。通过SDS-PAGE对嗜热菌蛋白酶处理过的叶绿体样品、基质级份、类囊体和嗜热菌蛋白酶处理过的类囊体进行定量,然后进行考马斯兰染色,并对染色的蛋白带进行扫描密度测定(用核酮糖二磷酸羧化酶和集光复合蛋白的亚基作为标准物)。通过在有SDS的条件下在10%聚丙烯酰胺凝胶上电泳然后进行荧光显像分析等量的所述级份(大体上相当于从Percoll梯度中回收的叶绿体的2%),和回收的505内部和外部包膜级份。结果(图1)表明,主要的翻译产物(泳道Tr)大约为58kDa。当分离的完整豌豆叶绿体与放射标记过的蛋白一起在有ATP的条件下培养时,产生了大约50kDa和48kDa的多肽(泳道C)。所述多肽对外源添加的嗜热菌蛋白酶的降解作用的抗性表明,它们是放射性标记蛋白输入的产物。将完整的嗜热菌蛋白酶处理过的叶绿体分解为基质、洗涤过的类囊体、嗜热菌蛋白酶处理过的类囊体、内部包膜和外部包膜,证实以上两种放射性标记多肽存在于基质级份中。
例2
拟南芥ctβ-淀粉酶基因的蔗糖和光诱导
为了证实光照对ctβ-淀粉酶的诱导,将拟南芥Landsberg生态型植物种植在温室中,采用18小时的光照和6小时的遮光方案,温度为18℃。5周以后,将两盆幼苗转移到完全遮光中,并让两盆幼苗在连续光照下生长。两天以后,将一盆遮光驯化的幼苗和一盆光照生长的幼苗用于分离总RNA,并将每一种处理的另一盆进行3天连续光照。
为了进行组合的蔗糖-光照-遮光处理,对Landsberg生态型的种子进行表面消毒,放置在含有1%蔗糖的MS琼脂培养基上,并在培养室中生长,采用18小时光照和6小时遮光的方案。将5周龄幼苗转移到消毒蒸馏水或5%蔗糖或葡萄糖的水溶液中。将所述幼苗在连续光照或遮光中保持3天。用每一种试验的幼苗制备总RNA,并通过Eggermont等所述方法(1996)进行Northern印迹分析。用凝胶纯化的pBmy81上的cDNA插入片段检测Northern印迹,然后按照Feinberg和Vogelstein所述方法(1983)用32P-dCTP进行随机标记。
图2A中所示结果表明,ctβ-淀粉酶基因转录物受光照的诱导。
图2B所示结果表明,ctβ-淀粉酶基因转录物在遮光中受到5%蔗糖的诱导,受5%葡萄糖诱导的程度较低。在光照条件下,在有糖的情况下这种诱导得到进一步加强。以上结果表明,光照和糖的作用是相互独立的。
例3
构建ctβ-淀粉酶启动子-GUS融合体
通过限制酶消化从位于粘粒G16599(Bevan等,1998)上的ctβ-淀粉酶基因上分离启动子片段。该启动子上的常见限制位点是位于-1662bp核苷酸位点上的Hind III(始于序列8负链上的19179bp),位于-1127bp的Sal I和位于-371bp的Pst I,以及位于ctβ-淀粉酶起始甲硫氨酸下游+21bp位置上的Xho I,将这些位点用于分离三种不同长度的启动子和转录物肽序列(翻译起始甲硫氨酸ATG中的A的编码号是+1)。
用以下寡核苷酸引物扩增位于粘粒G16599(Bevan等,1998)上的ctβ-淀粉酶基因的294bp(序列1)片段:
序列4
P1:(5’-AAT TC
C TCG AGT TCT CTT ATC-3’)和
序列5
P2:(5’-cgg gAT CCC TGA CAT TGT TAC-3’)。
在引物P1中,在下面划线的碱基表示位于+21bp位置上的Xho I位点;在引物P2中,小写碱基表示为了产生Bam HI位点而添加的核苷酸。
嵌合的ctβ-淀粉酶启动子-GUS基因是通过所述启动子片段、用Xho I和Bam HI消化过的PCR连接片段、和用Hind III-Bam HI、SalI-Bam HI或Pst I-Bam HI消化过的GUS载体pBI101(Jefferson等,1987)三重连接产生的(图3)。所得到的结构分别被称为HβGUS、SβGUS和PβGUS。
通过三亲交配(Bevan,1984)将所述嵌合基因结构转入根癌农杆菌LBA4404中,并通过叶片转化方法(Horsch等,1985)将其导入烟草Samsun品种。
例3A
烟草幼苗中嵌合的拟南芥ct β-淀粉酶启动子-GUS基因的蔗糖和
光照诱导
将表达高水平GUS活性的含有HβGUS和PβGUS结构的植物和该品系的F1幼苗后代用于研究所述嵌合基因的光照和蔗糖诱导表达。对F1烟草种子进行表面消毒,放在含有1%蔗糖的MS琼脂培养基上,并在培养室中生长,采用18小时光照、6小时遮光的方案。将2-3周龄幼苗转移到5%蔗糖溶液或转移到蒸馏水中,并在连续光照或遮光条件下保持3天。用Jefferson等(1987)所述的方法使用生荧光底物4-甲基伞形基-葡糖醛酸苷(4-MUG)分析来自10-14个幼苗的总蛋白提取物的GUS活性。对于这两种结构来说,在缺乏蔗糖的条件下接受连续光照的幼苗中GUS活性的水平与在缺乏光照的条件下接受蔗糖处理的幼苗中的GUS活性水平相似(图4)。不过,让幼苗同时接受连续光照和蔗糖处理能将GUS活性提高大约2-3倍。以上结果总体上与用ctβ-淀粉酶基因本身进行试验所获得的结果吻合,该试验显示光诱导和蔗糖诱导是独立的过程。
GUS的组织化学染色表明,该活性是在2周龄幼苗的子叶中检测到的,而在第一真叶和茎和根中的活性很少或没有。在4周龄幼苗中,在第一真叶和茎中都检测到额外的GUS活性。GUS染色特别与位于木射线之间和位于木质部和构成茎的内部韧皮部的韧皮束之间的富含叶绿体的薄壁组织(绿色组织)细胞相关。
例4
构建用于转化烟草和马铃薯叶片的ctβ-淀粉酶质粒
通过定向诱变将位于pBmy81质粒的2302bp位置上的Kpn I位点转化成Bam HI位点。设计寡核苷酸引物:
序列6
P3:(5’-GCT GGT ACG CCT GCA GGA TCC GGT CCG GAA TTC CC-3’)和
序列7
P4:(5’-GGG AAT TCC GGA CCG GAT CCT GCA GGC GTA CCA GC-3’)
并与快速改变定向诱变试剂盒(Promega)一起使用。方法如生产商所述。
通过用Bam HI裂解突变的pBmy81质粒将完整长度的ctβ-淀粉酶编码序列切除,然后用GeneClean(BIO101)纯化。将所述Bam HI片段连接到供体载体pDV35S(SK)V(参见图5)和pDV02000(参见图6)的Bam HI位点上。pDV35S(SK)V由携带35S CaMV启动子-35S终止子的pBluescript(Stratagene)组成,类似的结构在本领域中是公知的(例如,Odell等,1985)。pDV02000由具有1.4kbp patatin启动子-胭脂氨酸合成酶终止子的pBluescript组成。本领域技术人员可以用已知序列制备类似的结构(例如,Liu等,1990)。分离具有相对所述启动子为有义方向和反义方向的编码序列的质粒,并将来自所述供体载体的ctβ-淀粉酶嵌合基因亚克隆到二元载体pBinPlus上(vanEngelen等,1995)。质粒的图谱如图7-10所示。
例5
植物的转化或再转化
用大体上如Horsch所述的叶片共培养方法(1985)转化马铃薯植物。通过电穿孔方法将上述二元载体转入根癌农杆菌LBA4404中,并将所述农杆菌的培养物用于转化,以便再生携带所述嵌合基因的植物,如例4中所述。
可以通过叶片共培养方法用所述patatin启动子-ctβ-淀粉酶-胭脂氨酸合成酶终止子嵌合基因二元质粒转化已经携带编码大肠杆菌ADPG-Ppase glgC16的嵌合基因的马铃薯植物。
例6
构建具有AT ctβ-淀粉酶定向肽的质粒
AT ctβ-淀粉酶的质体定向序列包括在相当于序列1的294bp片段上。可以通过PCR扩增或限制酶消化从例3所述的质粒中分离DNA片段,即该片段将包括35S CaMV启动子+质体定向序列或patatin启动子+质体定向序列。可以通过连接作为翻译融合体的蛋白或酶与转运肽序列的编码序列构建嵌合基因。翻译的蛋白将被转运到质体中,以便提供新的活性或影响代谢途径。
参考文献:
Ainsworth,C.,Clark,J.和Balsdon,J.(1993).植物分子生物学,22,67-82.
Baier,M.和Dietz,K.J.,(1997)植物杂志12,179-190
Bevan,M.W.(1984) 核酸研究,12,8711-8721
Bevan,M.W.等(1998).自然,391,485-488.
Chan,MT.,Chao,YC.和Yu,SM.(1994).生物化学杂志269,17635-17641.
Chen,MH.,Liu,LF.,Chen,YR.,Wu,HK.和Yu,SM.(1994).植物杂志,6,625-636.
Daussant,J.,Zbaszyniak,B.,Sadowski,J.和Wiatroszak,I.(1981).植物,151,176-179.
Denyer,K.,Clarke,B.,Hylton,C.,Tatge,H.和Smith,A.M.(1996).植物杂志,10,1135-1143.
Duwenig,E.,Steup,M.,Willmitzer,L.和Kossmann,J.(1997).植物杂志,12,323-333.
Eggermont,K.,Goderis,I.J.和 Broekaert,W.F.(1996).植物分子生物学报道14,273-279.
Feinberg,A.P.和Vogelstein,B.(1983).分析生物化学132,6-13。
Gelvin,S.B.和Schilperoort,R.A.(1995).植物分子生物学手册,第2版。
Kluwer学术出版社,荷兰。
Hildebrand,D.F.和Hymowitz,T.(1981).植物生理学,53,429-434。
Horsch,R.B.,Fry,J.E.,Hoffman,N.L.,Eichholtz,D.,Rogers,S.G.和Swaley,R.T.(1985)科学,227.1229-1231。
Hylton,C.M.,Denyer,K.,Keeling,P.L.,Chang,MT.和Smith,A.M.(1995).植物,198,230-237。
Innes,M.A.,Gelfand,D.H.,Sninsky,J.J.和White,T.J.(1990).PCR方法。出版者:学术出版社。
James,M.G.,Robertson,D.S.and Myers,A.M.(1995).植物细胞,7,417-429。
Jefferson,R.A.,Kavanagh,T.A.和Bevan,M.W.(1987)EMBO,J.6.3901-3907.
Kakefuda,G.,Duke,S.H.和Hostak,M.H.(1986).植物,168,175-182。
Klosgen,R.B.和Weil,J.H.(1991)分子基因遗传学,225,297-304
Li,B.,Servaites,J.C.和 Geiger,D.R.(1992).植物生理学。98,1277-1284。
Liu,X.J.,Prat,S.,Willmitzer,L.和Frommer,W.B.(1990)分子基因遗传学,223,401-406.
Mita,S.,Suzuki-Fujii,K.和Nakamura,K.(1995)植物生理学。107,895-904.
Mita,S.,Murano,N.,Akaike,M.和Nakamura,K.(1997).植物杂志,11,841-851。
Mould,R.M.和Gray,J.C.(1997a).见细胞生物学:A实验室手册,第2版,第2卷(细胞,J.E.著).纽约:学术出版社,pp.81-86.
Mould,R.M.和Gray,J.C.(1997b).见细胞生物学:A实验室手册,第2版,第2卷(细胞,J.E.著)。纽约:学术出版社,pp.286-292.
Nakamura,K.,Ohto,M.,Yoshida,N.和Nakamura,K.(1991).植物生理学,96,902-909.
Neuhaus,H.E.,Henrichs,G.和Schiebe,R.(1995).植物,194,454-460。
Newman,T.et al.(1994).植物生理学,106,1241-1255.Nielson,T.H.,Deiting,U.和Stitt,M.(1997).植物生理学,113,503-510。
Odell,J.T.Nagy,F.和Chua,N.H.(1985)自然,313,810-812。
Peavey,D.G.,Steup,M.和Gibbs,M.(1977).植物生理学,60,305-308。
Pwee,K-H.和Gray,J.C.(1993)植物杂志3,437-449。Rocha-Sosa,M.,Sonnewald,U.,Frommer,W.,Stratmann,M.,Schell,J.和Willmitzer,L.(1989)EMBO,8,23-29。
Sambrook,J.,Fritsch,E.F.和Maniatis,T.(1989)。分子克隆。出版者:冷泉港。
Schatz,G.和Dobberstein,B.(1996). 科学,271,1519-1526.
Schnell,D.J.和 Blobel,G.(1993).细胞生物学杂志,120,103-115。
Sonnewald,U.,Basner,A.,Greve,B.和Steup,M.(1995).植物分子生物学,27,567-576
Sweetlove,L.J.,Burrell,M.M.和ap Rees,T.(1996).生物化学杂志,320,493-498。
Thomson,W.W.和Whatley,J.M.(1980)植物生理学年度综述。31,375-394.
van Engelen,F.A.,Molthoff,J.W.,Conner,A.J.,Nap,J-P.,Pereira,A.和Stiekema,W.J.(1995).转基因研究4,288-290。
van der Leij,F.R.,Visser,R.G.F.,Ponstein,A.S.,Jacobsen,E.和Feenstra,W.J.(1991).分子基因遗传学,228,240-248.
Wang,SM.,Lue,WL.和Chen,J.(1996).植物分子生物学,31,975-982.
Wang,SM.,Lue,WL.,Huang,HW.和Chen,J.(1997).植物生理学,113,403-409。
序列表
(1)一般资料:
(i)申请人:
(A)名称:先进技术(剑桥)有限公司
(B)街道:Globe House,1 Water Street
(C)城市:伦敦
(E)国家:英格兰
(F)邮编:WC2R 3LA
(ii)发明名称:一种新型质体定向核酸序列,一种新型β-淀粉酶序列,一种刺激响应型启动子及其用途
(iii)序列数:8
(iv)联系地址:
(A)收件人:英美烟草(投资)有限公司
(B)街道:Regents Park Road
(C)城市:Southampton
(D)州:Hampshire
(E)国家:英格兰
(F)邮编:S015 8TL
(v)计算机可读形式:
(A)媒体类型:3.50寸盘
(B)计算机:Viglen P5/75
(C)操作系统:MS-DOS视窗95
(D)软件:微软Word97
(vi)当前申请数据:
(A)申请号:未知
(C)分类号:未知
(viii)律师/代理人资料:
(A)姓名:M.R.Walford女士/K.J.H.MacLean先生
(C)文件号:RD-ATC-18
(ix)通讯资料:
(A)电话:01703 777155
(B)传真:01703 779856
(2)序列1资料:
(i)序列特征:
(A)长度:294个碱基对
(B)类型:核苷酸
(C)链型:双
(D)拓扑结构:线形
(ii)分子类型:从cDNA到mRNA
(vi)来源:
(A)生物:拟南芥
(B)品系:哥伦比亚生态型
(C)组织类型:叶
(vii)直接来源;
(A)文库:ABRC DNA资源中心
(B)克隆:EST 81E10T7
(viii)在基因组中的位置:
(A)染色体/片段:4号染色体
(ix)特征
(A)名称:转运肽
(B)位置:37-291bp
(xi)序列描述:序列1:
1 TCATTTCTCATCATAACAAAGAGAGAGAAAAAAACTATGGAATTGACACTGAATTCCTCG
M E L T L N S S 8
61 AGTTCTCTTATCAAACGTAAAGATGCCAAGAGTTCTAGAAACCAAGAAAGTTCCTCCAAC
S S L I K R K D A K S S R N Q E S S S N 28
121 AACATGACCTTTGCGAAGATGAAGCCGCCAACATATCAGTTCCAAGCAAAGAACTCGGTT
N M T F A K M K P P T Y Q F Q A K N S V 48
181 AAGGAAATGAAGTTCACTCACGAGAAGACCTTCACGCCAGAAGGTGAAACCCTTGAGAAA
K E M K F T H E K T F T P E G E T L E K 68
241 TGGGAGAAGCTCCACGTTCTCTCATACCCACACTCCAAGAACGACGCTAGCGTT
W E K L H V L S Y P H S K N D A S V 85
(2)序列2资料:
(i)序列特征:
(A)长度:1642
(B)类型:核苷酸
(C)链型:双
(D)拓扑结构:线形
(ii)分子类型:从cDNA到mRNA
(vi)来源:
(A)生物:拟南芥
(B)品系:哥伦比亚生态型
(C)组织类型:叶
(vii)直接来源;
(A)文库:ABRC DNA资源中心
(B)克隆:EST 81E10T7
(viii)在基因组中的位置:
(A)染色体/片段:4号染色体
(ix)特征
(A)名称:编码序列
(B)位置:1-1393bps
(D)其他信息:成熟肽
(xi)序列描述:序列2:
1 GTTCCGGTGTTCGTCATGTTACCGCTCGACACAGTAACAATGTCAGGGCATTTGAACAAA
V P V F V M L P L D T V T M S G H L N K 20
61 CCACGAGCCATGAACGCTAGTTTGATGGCTCTGAAAGGAGCTGGTGTGGAAGGTGTGATG
P R A M N A S L M A L K G A G V E G V M 40
121 GTGGATGCTTGGTGGGGATTGGTGGAGAAAGATGGACCTATGAATTATAACTGGGAAGGC
V D A W W G L V F R D G P M N Y N W F G 60
181 TATGCCGAGCTTATACAGATGGTTCAAAAGCACGGTCTCAAACTCCAGGTCGTTATGTCA
Y A E L I Q N V Q K H G L K L Q V V M S 80
241 TTCCATCAATGTGGAGGAAACGTAGGAGACTCTTGCAGTATCCCCTTGCCTCCATGGGTG
P H Q C G G N V G D S C S I P L P P W V 100
301 CTTGAAGAGATCAGCAAGAACCCTGATCTTGTCTACACAGACAAATCTGGGAGAAGGAAC
L E E I S K N P D L V Y T D K S G R R N 120
361 CCTGAATATATCTCCTTGGGATGTGATTCTGTGCCTGTCCTAAGAGGAAGAACACCTATC
P E Y I S L G C D S V P V L R G R T P I 140
421 CAGGTCTACTCAGATTTCATGAGGAGCTTCCGTGAACGATTTGAAGGCTACATAGGAGGA
Q V Y S D F M R S F R E R F E G Y I G G 160
481 GTTATTGCGGAAATTCAAGTAGGAATGGGACCTTGTGGAGAATTGAGATACCCATCATAC
V I A E I Q V G M G P C G E L R Y P S Y 180
541 CCTGAAAGCAACGGGACCTGGAGATTCCCCGGAATTGGAGAGTTCCAGTGCTACGACAAG
P E S N G T W R F P G I G E F Q C Y D K 200
601 TATATGAAATCGTCACTTCAGGCATATGCTGAATCAATTGGGAAAACTAACTGGGGAACA
Y M K S S L Q A Y A E S I G K T N W G T 220
661 AGCGGACCTCATGATGCCGGCGAGTACAAGAACCTCCCAGAAGATACTGAATTTTTCAGG
S G P H D A G E Y K N L P E D T E F F R 240
721 AGAGACGGAACATGGAATAGCGAGTATGGAAAGTTTTTCATGGAATGGTACTCCGGGAAG
R D G T W N S E Y G K F F M E W Y S G K 260
781 CTGCTAGAACATGGAGACCAACTCCTATCTTCAGCGAAAGGTATCTTTCAAGGAAGCGGA
L L E H G D Q L L S S A K G I F Q G S G 280
841 GCAAAGCTATCAGGAAAGGTAGCTGGAATTCACTGGCACTACAACACCAGGTCACACGCA
A K L S G K V A G I H W H Y N T R S H A 300
901 GCTGAGCTAACCGCTGGATATTACAACACAAGAAACCATGACGGGTATCTGCCAATAGCT
A E L T A G Y Y N T R N H D G Y L P I A 320
961 AAGATGTTCAACAAACATGGAGTTGTGCTCAACTTCACCTGCATGGAGATGAAAGACGGG
K M F N K H G V V L N F T C M E M K D G 360
1021 GAGCAACCTGAGCACGCGAATTGCTCACCAGAAGGTCTGGTCAAGCAAGTACAGAACGCG
E Q P E H A N C S P E G L V K Q V Q N A 380
1081 ACAAGGCAGGCCGGAACCGAACTAGCAGGGGAGAACGCGCTAGAACGATATGACTCGAGC
T R Q A G T E L A G E N A L E R Y D S S 400
1141 GCATTCGGACAAGTGGTAGCAACAAATAGGTCAGATTCTGGAAATGGGTTAACCGCATTT
A F G Q V V A T N R S D S G N G L T A F 420
1201 ACTTACCTAAGAATGAACAAGCGGTTATTTGAGGGTCAAAATTGGCAGCAGTTAGTGGAG
T Y L R M N K R L F E G Q N W Q Q L V E 440
1261 TTTGTTAAGAACATGAAGGAAGGTGGTCATGGGAGGAGACTCTCAAAAGAAGACACAACT
F V K N M K E G G H G R R L S K E D T T 460
1321 GGAAGTGACCTTTATGTTGGATTTGTCAAAGGCAAGATCGCTGAGAATGTGGAGGAGGCT
G S D L Y V G F V K G K I A E N V E E A 480
1381 GCTTTAGTGTAATTTCCCACATAGGTACATACATATAGTGTGGTGTTTATTGTATTCCTG
A L V - 483
1441 TCTGATAAATAACTAGAGAGATCAAACCAGTAAGAGTGTTAAAGCTATAGATTTGCACAA
1501 TTCTGGGTCAGAGTCAGAGCAAAGAGAAGCAAAATCAAGATGATGTACACTTAGATGTAT
1561 CCTATGAGTTTTCCTTGTACATCATCTTCATACTCTTAATCTCAAATACTATGCATTTTT
1621 CTCCAAAAAAAAAAAAAAAAGGGCGGCCGCTCTAGAGGATCC
(2)序列3资料:
(i)序列特征:
(A)长度:1953
(B)类型:核苷酸
(C)链型:双
(D)拓扑结构:线形
(ii)分子类型:从cDNA到mRNA
(vi)来源:
(A)生物:拟南芥
(B)品系:哥伦比亚生态型
(C)组织类型:叶
(vii)直接来源;
(A)文库:ABRC DNA资源中心
(B)克隆:EST 81E10T7
(viii)在基因组中的位置:
(A)染色体/片段:4号染色体
(i x)特征
(A)名称:CDS
(B)位置:37-1683bp
(C)其他信息:叶绿体定向
(xi)序列描述:序列3:
1 TCATTTCTCATCATAACAAAGAGAGAGAAAAAAACTATGGAATTGACACTGAATTCCTCG
M E L T L N S S 8
61 AGTTCTCTTATCAAACGTAAAGATGCCAAGAGTTCTAGAAACCAAGAAAGTTCCTCCAAC
S S L I K R K D A K S S R N Q E S S S N 28
121 AACATGACCTTTGCGAAGATGAAGCCGCCAACATATCAGTTCCAAGCAAAGAACTCGGTT
N M T F A K M K P P T Y Q F Q A K N S V 48
181 AAGGAAATGAAGTTCACTCACGAGAAGACCTTCACGCCAGAAGGTGAAACCCTTGAGAAA
K E M K F T H E K T F T P E G E T L E K 68
241 TGGGAGAAGCTCCACGTTCTCTCATACCCACACTCCAAGAACGACGCTAGCGTTCCGGTG
W E K L H V L S Y P H S K N D A S V P V 88
301 TTCGTCATGTTACCGCTCGACACAGTAACAATGTCAGGGCATTTGAACAAACCACGAGCC
F V M L P L D T V T M S G H L N K P R A 108
361 ATGAACGCTAGTTTGATGGCTCTGAAAGGAGCTGGTGTGGAAGGTGTGATGGTGGATGCT
M N A S L M A L K G A G V E G V M V D A 128
421 TGGTGGGGATTGGTGGAGAAAGATGGACCTATGAATTATAACTGGGAAGGCTATGCCGAG
W W G L V E K D G P M N Y N W E G Y A E 148
481 CTTATACAGATGGTTCAAAAGCACGGTCTCAAACTCCAGGTCGTTATGTCATTCCATCAA
L I Q M V Q K H G L K L Q V V M S F H Q 168
541 TGTGGAGGAAACGTAGGAGACTCTTGCAGTATCCCCTTGCCTCCATGGGTGCTTGAAGAG
C G G N V G D S C S I P L P P W V L E E 188
601 ATCAGCAAGAACCCTGATCTTGTCTACACAGACAAATCTGGGAGAAGGAACCCTGAATAT
I S K N P D L V Y T D K S G R R N P E Y 208
661 ATCTCCTTGGGATGTGATTCTGTGCCTGTCCTAAGAGGAAGAACACCTATCCAGGTCTAC
I S L G C D S V P V L R G R T P I Q V Y 228
721 TCAGATTTCATGAGGAGCTTCCGTGAACGATTTGAAGGCTACATAGGAGGAGTTATTGCG
S D F M R S F R E R F E G Y I G G V I A 248
781 GAAATTCAAGTAGGAATGGGACCTTGTGGAGAATTGAGATACCCATCATACCCTGAAAGC
E I Q V G M G P C G E L R Y P S Y P E S 268
841 AACGGGACCTGGAGATTCCCCGGAATTGGAGAGTTCCAGTGCTACGACAAGTATATGAAA
N G T W R F P G I G E F Q C Y D K Y M K 288
901 TCGTCACTTCAGGCATATGCTGAATCAATTGGGAAAACTAACTGGGGAACAAGCGGACCT
S S L Q A Y A E S I G K T N W G T S G P 308
961 CATGATGCCGGCGAGTACAAGAACCTCCCAGAAGATACTGAATTTTTCAGGAGAGACGGA
H D A G E Y K N L P E D T E F F R R D G 328
1021 ACATGGAATAGCGAGTATGGAAAGTTTTTCATGGAATGGTACTCCGGGAAGCTGCTAGAA
T W N S E Y G K F F M E W Y S G K L L E 348
1081 CATGGAGACCAACTCCTATCTTCAGCGAAAGGTATCTTTCAAGGAAGCGGAGCAAAGCTA
H G D Q L L S S A K G I F Q G S G A K L 368
1141 TCAGGAAAGGTAGCTGGAATTCACTGGCACTACAACACCAGGTCACACGCAGCTGAGCTA
S G K V A G I H W H y N T R S H A A E L 388
1201 ACCGCTGGATATTACAACACAAGAAACCATGACGGGTATCTGCCAATAGCTAAGATGTTC
T A G Y Y N T R N H D G Y L P I A K M F 408
1261 AACAAACATGGAGTTGTGCTCAACTTCACCTGCATGGAGATGAAAGACGGGGAGCAACCT
N K H G V V L N F T C M E M K D G E Q P 428
1321 GAGCACGCGAATTGCTCACCAGAAGGTCTGGTCAAGCAAGTACAGAACGCGACAAGGCAG
E H A N C S P E G L V K Q V Q N A T R Q 448
1381 GCCGGAACCGAACTAGCAGGGGAGAACGCGCTAGAACGATATGACTCGAGCGCATTCGGA
A G T E L A G E N A L E R Y D S S A F G 468
1441 CAAGTGGTAGCAACAAATAGGTCAGATTCTGGAAATGGGTTAACCGCATTTACTTACCTA
Q V V A T N R S D S G N G L T A F T Y L 488
1501 AGAATGAACAAGCGGTTATTTGAGGGTCAAAATTGGCAGCAGTTAGTGGAGTTTGTTAAG
R M N K R L F E G Q N W Q Q L V E F V K 508
1561 AACATGAAGGAAGGTGGTCATGGGAGGAGACTCTCAAAAGAAGACACAACTGGAAGTGAC
N M K E G G H G R R L S K E D T T G S D 528
1621 CTTTATGTTGGATTTGTCAAAGGCAAGATCGCTGAGAATGTGGAGGAGGCTGCTTTAGTG
L Y V G F V K G K I A E N V E E A A L V 548
1681 TAATTTCCCACATAGGTACATACATATAGTGTGGTGTTTATTGTATTCCTGTCTGATAAA
1741 TAACTAGAGAGATCAAACCAGTAAGAGTGTTAAAGCTATAGATTTGCACAATTCTGGGTC
1801 AGAGTCAGAGCAAAGAGAAGCAAAATCAAGATGATGTACACTTAGATGTATCCTATGAGT
1861 TTTCCTTGTACATCATCTTCATACTCTTAATCTCAAATACTATGCATTTTTCTCCAAAAA
1921 AAAAAAAAAAAAGGGCGGCCGCTCTAGAGGATCC
(2)序列4资料:
(i)序列特征:
(A)长度:21个碱基对
(B)类型:核苷酸
(C)链型:单链
(D)拓扑结构:线形
(xi)序列描述:序列4:
AATTCCTCGA GTTCTCTTATC 21
(2)序列5资料:
(i)序列特征:
(A)长度:21个碱基对
(B)类型:核苷酸
(C)链型:单链
(D)拓扑结构:线形
(xi)序列描述:序列5
CGGGATCCCT GACATTGTTA C 21
(2)序列6资料:
(i)序列特征:
(A)长度:35个碱基对
(B)类型:核苷酸
(C)链型:单链
(D)拓扑结构:线形
(xi)序列描述:序列6
GCTGGTACGC CTGCAGGATC CGGTCCGGAA TTCCC 35
(2)序列7资料:
(i)序列特征:
(A)长度:35个碱基对
(B)类型:核苷酸
(C)链型:单链
(D)拓扑结构:线形
(xi)序列描述:序列7:
GGGAATTCCG GACCGGATCC TGCAGGCGTA CCAGC 35
(2)序列8资料:
(i)序列特征:
(A)长度:1652个碱基对
(B)类型:核苷酸
(C)链型:双链
(D)拓扑结构:线形
(ii)分子类型:基因组DNA
(vi)来源:
(A)生物:拟南芥
(B)品系:哥伦比亚生态型
(C)组织类型:叶
(vii)直接来源;
(A)文库:欧洲拟南芥基因组工程
(B)克隆:粘粒G16599
(viii)在基因组中的位置:
(A)染色体:4号染色体
(ix)特征
(A)名称:启动子
(B)位置:G16599互补链的17534-19185bp
(xi)序列描述:序列8:
1 AAGCTTGTGT CTATTTCAAA TTCTTGACCG TAGATGTCAC AACATGCATA
51 TATCATTGAA AACAGAGCAA CACAGGAAAC CAAGCATATG TATCTAGATA
101 TACTTAGCAA GACATAACTA TAGTCTTTGA ATCAACATAG GGATTAATGA
151 TAGAGAATGA GGAAGCTCAA GATTTTATAC TCAGTTTCTT ACAAAACAAA
201 TTTCTCTCTA ACTGCAAAAA CACCAATTAG GATTTGAAGA GCGTACCTGT
251 TTGAGTCAAT GTCCAATGTC GTCCCCCCGC CTTCTACATT TCTTAGCCTG
301 CTGAATAAAA GCACAAGCCA AAATGAGAAG GTGCCAAAGG CGATAAGGAT
351 CAATTTCTAC CATTCAAAAA ACTAATGGTG AGAATTAGAA ACGAGAGAAA
401 ACTACTTGTT GAGGAAATAG CCAAAAGCGC AATCTTCGTC ACCTGAATAA
451 AGACCAAACC GTCACTTTCA ATGAGTCAGC AAGAAAAAGA GAGAGAGAGA
501 GAGAGAGATT CTCTATAACA TTTGAGTCGA CATGGATTCT AATGCATCAA
551 AAGTCATCTC CAATAAACAA ACACTTGAAA CTCACATGGC TAATAGAACA
601 AGATCAAAGC CTTAAGTATT AAGCATTACA GACACTACTG GCTAACTTTT
651 GACACATGTT CTTAAGTAAC ATAGTATCAA TATCCGTGAA TCACATCGAA
701 CACACACAAC AAGGGCTTAA TGCATCAAAG TCCTGTTATT TCCATATAAC
751 AACATATTTC ATTTACAAAC AGAATGCAGC ATTCAGGCAG TCCAAATGGA
801 AAGGTTGACA AAAAAATATA ATCTTGTAAC TCTACATATA TGGCAGAATG
851 TAATAACCAG GCAAGAAAAA AACAGAATAA ACAGATCAAT GAGTATGATA
901 TAAAAAAAAG TCACAAAGAA TGTGCCACAG TGAACAAGAG GGCCATGAGA
951 AGAAATTTTC AAAGAAAATA TTAGCATTGT TAGAATTTTT TGGGTCAATG
1001 GATCTGTCAG CTGCTTAGTT GGAAAACACA AATCTTACAG GAAGGAAAGT
1051 CCAAGAAAAA GAAAATAAGC AAAGTTAATA GCCACCACAA GAAATTTCAT
1101 ACAGAAATAA TTAAATCGTT GCACTTATCT TCTTATTCAA ACTAAAATCA
1151 AGAGAACTTA ATAATTTTCA GCCACACGAA CCATGTGTTC AAAGCCAAAG
1201 GTGAGAAGCC AAAATTATCA GCTTATCTCC ATTAACAAGG GAAAAGCAAG
1251 ACTAGATTTA AGAGTTCTCT GTAACTAAAA ACTGCAGGAG TGAGTAAGTA
1301 AATAATTCAC CAACAGGAAA ACAAAACTCA ATTATCTATA GCTGAATACA
1351 CATGTAAATG AGAATTTATT AACTAAAACA TCTTCCTTTG TAACTGATGT
1401 GACATTTACA ATTTTTCATT TTGAGGTGTA AGAACCGTGT GACAAGTGAA
1451 AAGGTTAAAA TAAGCAACCT TTGTGATATT TTCTCTCCAC TTTTTGAAAT
1501 TGGGTCTCCA AACCACAGCC AATCAATATT CTTTATAAAT ACAAACACAC
1551 AAACAGCATC TTTCTCTCAA ACACAAACAT ATCTTCTATC AAACACCAAC
1601 AGCTCTATTC TCTACCTCAT TTCTCATCAT AACAAAGAGA GAGAAAAAAA
1651 CT