棉花中的种子特异性启动子
本申请披露了一种(分离的)核酸序列,其包含选自以下的核苷酸序列:(a)SEQ ID NO:1或其片段,其中所述片段包含SEQ ID NO:1的至少400个连续核苷酸并且具有种子特异性启动子活性,(b)与(a)的核苷酸序列具有至少80%序列同一性并具有种子特异性启动子活性的核苷酸序列;(c)在严格条件下与(a)或(b)的核苷酸序列杂交的核苷酸序列;以及(d)与(a)至(c)中任一项的核苷酸序列互补的核苷酸序列。本文中进一步公开一种嵌合基因,其包含本文所述的与编码感兴趣表达产物的核酸可操作地连接的(分离)核酸和任选地转录终止及多聚腺苷化序列。本文中还公开了如权利要求书中表征的一种载体、转基因植物细胞、转基因植物和种子。本文所公开的方法涉及产生转基因植物、培育棉花、产生种子、实现产物在棉花中的种子特异性表达和实现在棉花植物中改变纤维特性的种子特异性表达,如权利要求书中所表征。
在本说明书中,引用多份文献,包括专利申请和生产商的手册。这些文献的公开内容,尽管不认为与本发明可专利性相关,通过引用的方式完整结合在此。更具体地,参考的全部文献通过引用的方式以相同的程度结合,如同专门且个别地指出通过引用的方式结合每份单独的文献。
毛状体是在大部分陆地植物的地上器官的表面上存在的特化表皮附属物。存在几种类型的毛状体:单细胞或多细胞的、分支或不分支的和腺状或非腺状。毛状体有助于植物适应于生物胁迫和非生物胁迫的多个方面,如挡开草食昆虫、调节表面温度、减少水经蒸腾丢失,增加冰冻耐受性、辅助种子散布和保护植物组织免遭UV影响(Eisner等人,1998;Werker,2000;Wagner等人,2004)。腺状分泌性毛状体(GST)经常分泌植物次级代谢物以构成基于天然产物的草食动物和病原体抵抗力(Werker,2000;Ranger和Hower,2001;Wagner等人,2004;Medeiros和Tingey,2006)。
不同的植物种可以具有不同类型的毛状体,并且一种植物可以形成多于一个类型的毛状体。一年生杂草拟南芥(Arabidopsis thaliana)产生单细胞非腺状毛状体,它们可以是分支或不分支的(Szymanski等人,2000)。烟草植物通常含有多细胞毛状体,包括高的腺状分泌性毛状体(GST)和简单的非腺状毛状体(Wagner等人,2004)。棉纤维是单细胞的和充分伸长的种子毛状体(Kim和Triplett,2001)。
棉纤维是世界范围内唯一最重要的纺织原料。全球每年收获约八千万英亩棉花。按英亩土地面积生产量而言,棉花是美国第五大作物,在2006年至2008年平均种植一千零三十万英亩。全球种植的棉花中大约90%是陆地棉(Gossypium hirsutum),而海岛棉(Gossypium barbadense)占大约8%。因此,育种中的主要努力是通过经典方法或通过遗传改变棉花植物的基因组来调节棉纤维特征以更好地适应工业及消费者的需要。待实现的目的包括增加的棉绒(lint)纤维长度、强度、可染性、减少的棉短绒产生、纤维成熟度比率、未成熟纤维含量、纤维整齐度和马克隆尼值。
棉纤维发育是一个受众多基因调节的多阶段过程,多个所述基因在形成纤维细胞时上调或高表达(Li,C.H.等人,2002;Ruan等人,2003;Wang,S.等人,2004;Li等人,2005;Luo等人,2007)。
已经描述了驱动棉籽中基因表达的不同启动子。来自棉花的种子特异性或毛状体特异性启动子是熟知的,异源启动子也用来控制棉花中的种子特异性、种衣特异性或毛状体特异性表达。
E6是第一个鉴定的棉纤维基因,并且E6启动子已经用于对棉纤维品质进行工程化(John和Keller,1996)。GhRDL1,一种在棉纤维细胞中在伸长阶段高度表达的基因,编码含有的BURP结构域的蛋白质(Li,C.H.等人,2002),并且GaRDL1启动子在转基因拟南芥植物中显示毛状体特异性活性(Wang,S.等人,2004)。GhTUB1转录物优先地在纤维中以高水平积累,因而pGhTUB1::GUS融合基因在纤维中以高水平表达,但在其他组织中以低得多的水平表达(Li,X.B.等人,2002)。三种棉花脂质转移蛋白基因LTP3、LTP6和FSltp4的启动子能够在转基因烟草植物中指导GUS基因在叶和茎GST中的表达(Hsu等人,1999;Liu等人,2003;Delaney等人,2007),然而,它们不展示出表现清晰的组织特异性。例如,在pFSltp4::GUS转基因烟草植物中,可以在全部类型的毛状体中检测到强烈的GUS活性;此外,GUS表达也在叶缘、维管组织、胚珠和根尖处可见(Delaney等人,2007)。
棉花R2R3MYB转录因子GaMYB2已经显示是拟南芥GLABRA1(GL1)(拟南芥毛状体形成的关键调节物)的功能同源物。GaMYB2在处于发育早期阶段的棉纤维细胞中表达(Wang,S.等人,2004)。它的启动子还驱动拟南芥中的毛状体特异性表达和烟草中的GST头部特异性表达(Shangguan等人,2008)。
美国专利7,626,081披露了存在于α球蛋白基因中的棉籽特异性启动子。启动子Gh-sp源自种子蛋白基因并且仅在正在成熟的棉籽中有活性(Song等人,2000)。
来自碧冬茄(Petunia)的FBP7启动子控制MADS-框转录因子并且已知具有种子特异性。已经显示,用由FBP7启动子驱动的报道基因构建体转化的棉花植物在种衣中特异性表达所述报道基因(Pei等人,2008)。
尽管迄今存在许多已知在棉花植物中驱动种子特异性、种衣特异性或毛状体特异性表达的启动子,但期望的是拥有可用于棉花中种子特异性表达的其他种子特异性、种衣特异性或毛状体特异性启动子。
因此,在一个方面,本申请公开了一种(分离的)核酸序列,其包含选自以下的核苷酸序列:(a)SEQ ID NO:1或其片段,其中所述片段包含SEQ ID NO:1的至少400个连续核苷酸并且具有种子特异性启动子活性,(b)与(a)的核苷酸序列具有至少80%序列同一性(包括与SEQ ID NO:1或其所述片段具有80%序列同一性)并具有种子特异性启动子活性的核苷酸序列;(c)在严格条件下与(a)或(b)的核苷酸序列杂交的核苷酸序列;以及(d)与(a)至(c)中任一项的核苷酸序列互补的核苷酸序列。
这个方面的(分离的)核酸序列在下文也称作“启动子序列”。
除非另外指明,否则下文对本文所公开的启动子序列描述的实例也适用于本文所公开的其他方面的相应实施例。
如本文所用,术语“包含”应解释为特指存在如所提到的特征、整数、步骤或组分,但是不排除存在或附加一种或多种特征、整数、步骤或组分或它们的群组。因此,例如,包含一种核苷酸序列的核酸可以包含比实际所引述更多的核苷酸,即,被包含于更大的核酸中。如将在下文进一步描述的嵌合基因(该嵌合基因包含以功能方式或结构方式定义的核酸)可以包含另外的DNA区域等。然而,在本披露的上下文中,术语“包含”也包括“由……组成”。
换句话说,如本文自始至终所用,涉及一种“包含”某核苷酸序列的核酸或一种包含某氨基酸序列的蛋白质的术语指包括或包含至少所述序列的核酸或蛋白质,从而可以在5'(或N端)和/或3'(或C末端)处包括其他核苷酸序列或氨基酸序列,例如选择标记蛋白(的核苷酸序列)、转运肽(的核苷酸序列)和/或5'前导序列或3'尾随序列。
核酸可以是单链或双链DNA或RNA。核酸可以化学地合成或通过体内或体外生物表达产生。
核酸可以使用适当保护的核糖核苷亚磷酰胺和常规DNA/RNA合成仪化学地合成。RNA合成试剂的供应商是Proligo公司(汉堡,德国)、Dharmacon Research公司(Lafayette,CO,USA)、Pierce Chemical公司(Perbio Science分部,Rockford,IL,USA)、Glen Research公司(Sterling,VA,USA)、ChemGenes公司(Ashland,MA,USA)和Cruachem公司(Glasgow,UK)。
与本披露的嵌合基因相关,DNA包括cDNA和基因组DNA。
如本申请中所用,“分离的核酸”或“分离的核酸序列”指如上文定义的核酸,它不是天然存在的(例如具有与天然存在核酸不同的核苷酸序列的人工或合成核酸或比天然存在核酸更短的核酸)或不再处于最初提供其的天然环境中的核酸,例如,嵌合基因中与异源调节元件相关连的核酸编码序列(例如与可植物表达的启动子可操作地连接的细菌编码序列)或被转移至另一种宿主细胞如转基因植物细胞中的核酸。
将如此选择如本文中披露的SEQ ID NO:1的片段的长度及其在SEQ ID NO:1内部的位置,从而它足够长,例如包含必需和足够的全部元件,并且被如此布置,从而它能够诱导种子特异性、种衣特异性或毛状体特异性表达。
评价如上文所述的核酸序列(其在本申请中代表启动子序列)是否能够诱导编码序列或包含该编码序列的嵌合基因,或尤其是与该编码序列可操作地连接的核酸序列以种子特异性、种衣特异性或毛状体特异性方式表达的方法是技术人员已知的。
例如可以进行报道基因研究以评价核酸序列的诱导功能。一个实例包括将所述第一核酸序列可操作地连接于报道基因如GUS,在植物或植物细胞中如在棉花植物中导入所产生的核酸构建体,并且评价所述报道基因在所述植物的不同组织中表达的诱导,如还将在下文进一步更详细地描述。
在某些实例中本文所述并且具有种子特异性、种衣特异性或毛状体/纤维特异性启动子活性的所述核酸序列片段可以因此包含SEQ ID NO:1的至少400、至少450、至少500、至少550、至少600、至少650、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300或至少1400个连续核苷酸。在另一个实例中,所述片段包含SEQ IDNO:1的位置1至位置748的核苷酸序列,其中存在位置-1。在另一个实例中,所述片段包含SEQ ID NO:1的核苷酸序列。在又另一个实例中,所述核酸序列由SEQ ID NO:1组成。
然而,将显而易见的是,本发明核苷酸序列的变体,包括其插入、缺失和置换变体也可以用于相同的效果。总体上,这类变体与SEQ IDNO:1具有至少80%、至少90%、至少95%或甚至至少98%序列同一性并且保留它们的种子特异性、种衣特异性或毛状体或纤维特异性启动子活性。
如本文所用,术语“启动子”指下述的任何核酸序列(如DNA序列):这种序列在转录起始期间被DNA依赖性RNA聚合酶识别并(直接或间接)结合,导致生成与转录的DNA互补的RNA分子;这种区域也可以称作“5'调节区”。启动子通常位于在待转录的编码序列前方存在的5'非翻译区(UTR)的上游并且具有多个区域,这些区域充当RNA聚合酶II和其他蛋白质如转录因子的结合位点以引发可操作地连接的基因的转录。启动子本身可以含有调节可操作地连接的基因的转录的子元件(即启动子基序)如顺式元件或增强子结构域。该启动子和连接的5'UTR也称作“启动子区”。
在本发明的上下文中“种子特异性”启动子意指受启动子控制的核酸序列转录在种子细胞中比在任何其他植物组织的细胞中高至少5倍、高至少10倍、高至少20倍或高至少50倍。
在一个实例中,种子特异性意指种衣特异性,即在种子的配子体衍生组织中没有转录发生。在另一个实例中,种子特异性或种衣特异性意指毛状体特异性,即在种子或种衣的非毛状体的部分中没有转录发生。毛状体包括例如棉花植物的纤维。因而,术语“种衣特异性”或“毛状体”意指如此实现受启动子控制的核酸序列的转录,从而所述核酸在种子、种衣,毛状体或纤维中的转录分别比在任何其他植物组织、优选地在种子发育期间(如在种子毛状体发育期间)存在的植物组织的细胞中高至少5倍、高至少10倍、高至少20倍或高至少50倍。
对于本发明,启动子也可以是种子优先的。在本发明的上下文中,“种子优先”表达(或等同的“转录”)意指一种核酸序列借助转录调节元件(如启动子)以如此方式转录,从而所述核酸序列在种子中的转录贡献了在整株植物中其任意发育阶段期间从所述核酸序列所转录的全部RNA量的多于50%、优选地多于60%、更优选地多于70%、甚至更优选地多于80%。
启动子序列或功能启动子片段的启动子活性的证实可以由本领域技术人确定,例如使用启动子-报道子构建体,其包含与易评定标记可操作地连接的启动子序列,如本文进一步解释。可以通过以下方式方便地测试本文所述的启动子的经鉴定或生成的片段或变体的种子特异性、种衣特异性或毛状体特异性表达能力:将这类核酸序列与编码易评定标记(例如,β-葡糖醛酸糖苷酶基因)的核苷酸序列可操作地连接,将这种嵌合基因导入植物,并且与该标记在植物的其他部分中的表达模式相比,分析该标记在种子、种衣或毛状体中的表达模式。与上述GUS不同的标记(或报道基因)的候选物是氯霉素乙酰基转移酶(CAT)、β-半乳糖苷酶(β-GAL)和具有荧光或磷光特性的蛋白质,如来自维多利亚管水母州的绿色荧光蛋白(GFP)或荧光素酶。为了定义最小启动子,通过本领域熟知的重组DNA技术,将代表该启动子的核酸序列与标记(报道)基因的编码序列可操作地连接。该报道基因在启动子下游可操作地连接,从而在启动子处起始的转录物贯穿报道基因进行。可以通过本领域熟知并且在本申请中其他地方描述的转化技术,将含有处在该启动子控制下的报道基因的表达盒导入正确细胞类型中。为了分析报道蛋白,制备细胞裂解物并且进行本领域熟知用于该报道蛋白的适宜分析。例如,如果CAT是选择的报道基因,来自细胞的裂解物与同位素标记的氯霉素和乙酰-辅酶A(乙酰-CoA)混合,其中这些细胞用含有处于研究的启动子控制下的CAT的构建体转染。CAT酶将乙酰基从乙酰-CoA转移至氯霉素的2-或3-位置。反应通过薄层层析法监测,该薄层层析法将乙酰化氯霉素与未反应的物质分开。反应产物随后通过放射自显影可视化。酶活性水平对应于产生的酶的量,该量转而反映启动子或其片段或变体的表达水平和种子特异性、种衣特异性或毛状体特异性功能。这种表达水平也可以与其他启动子比较以确定处于研究的启动子的相对强度。一旦证实活性和功能,则可以使用另外的突变和/或插入和/或缺失分析以便确定例如为引发转录所需要的最小区域和/或序列。因此,可以在启动子区的5'末端和/或在启动子区的3'末端或在启动子序列内部缺失序列和/或可以导入核苷酸置换。随后将这些构建体再次导入细胞中并且确定它们的活性和/或功能。
作为测量报道酶活性的替代,可以通过测量从与启动子或其片段可操作地连接的编码序列产生的RNA的水平确定转录启动子活性(和功能)。这种RNA(如mRNA)水平可以在单个时间点或在多个时间点测量,并且因而增加倍数可以是平均增加倍数或从实验测量值推导的外推值。由于它是水平的比较,因此可以使用测量mRNA水平的任何方法。在一个实例中,比较的组织或器官是种子或种子组织连同叶或叶组织。在另一个实例中,比较多种组织或器官。多重比较的一个实例是种子或种子组织与2、3、4或更多种组织或器官比较,这些组织或器官选自下组,该组由以下各项组成:叶组织、叶端、花粉、叶、胚、苗、叶原基、苗端、根、根尖、维管组织和子叶。如本文所用,植物器官的实例是是种子、叶、根等并且组织的实例是叶原基、苗端、维管组织等。一个启动子的活性或强度可以相对于mRNA或蛋白质的总量,就该启动子特异性引起的mRNA或蛋白质积聚的量而言进行测量。启动子例如以包含该启动子的细胞的总mRNA的大于约0.1%、约0.2%、大于约0.5%、0.6%、0.7%、0.8%或约0.9%、大于约1%、2%、3%、4%、5%、6%、7%、8%或约9%、或大于约10%的水平表达可操作地连接的核酸序列。可替代地,启动子的活性或强度可以相对于充分表征的启动子(先前评定过其转录活性)进行表述,或特定组织中的强度可以相对于在另一种组织中的强度表述。
在另一方面,提供种子特异性,种衣特异性或毛状体特异启动子,它们包含与如上文定义的SEQ ID NO:1或其片段具有至少80%、至少90%、至少95%或至少98%序列同一性的核苷酸序列。可以使用熟知的分子生物学技术鉴定本文所披露的启动子的天然存在变体,例如采用如前文概述的聚合酶链反应(PCR)和杂交技术。这类核酸序列也包括以合成方式衍生的核酸序列,如通过使用SEQ ID NO:1或其片段的位点定向诱变法产生的那些。通常,本发明的核苷酸序列变体将与SEQ IDNO:1的核酸序列具有至少80%、例如81%至84%、至少85%、例如,86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、至98%和99%序列同一性。本文所披露的并具有所需序列同一性的核酸序列的衍生物可以包括但不限于序列缺失、单个或多个点突变、特定限制性酶识别位点处的改变、功能性元件的添加,或可以提高或改变启动子表达的其他分子修饰手段。用于获得这类衍生物的技术是本领域熟知的(见例如,J.F.Sambrook,D.W.Russell和N.Irwin(2000)Molecular Cloning:A Laboratory Manual)。例如,本领域的普通技术人员可以界定本文所披露的启动子内部的功能性元件并删除任何非必需元件。功能性元件可以被修改或合并以增加本发明序列对于任何特定应用的实用性或表达。本领域的技术人员熟悉以下的标准来源材料:它们描述用于构建、操纵及分离大分子(例如,DNA分子、质粒等)以及生成重组生物和筛选并分离DNA分子的具体条件和程序。
可以例如改变SEQ ID NO:1和其功能性片段和变体的启动子序列以含有例如“增强子DNA”以便辅助增加基因表达。如本领域熟知,某些DNA元件可以用来增强DNA的转录。这些增强子经常在真核细胞内发挥作用的启动子中的转录起点5'存在,但是可以经常插入编码序列的上游(5)或下游(3')。在一些情况下,这些增强子DNA元件是内含子。在用作增强子DNA有用的内含子当中存在来自稻肌动蛋白1基因(见US5641876)、稻肌动蛋白2基因、玉米醇脱氢酶基因、玉米热休克蛋白70基因(见US5593874)、玉米皱缩1基因、马铃薯光敏1基因和矮牵牛(Petunia hybrida)热休克蛋白70基因(见US5659122)的5'内含子。因此,如本文中构思,启动子或启动子区包括通过插入或缺失调节区、使启动子经历随机或位点定向诱变等而衍生的启动子变型形式。一个启动子的活性或强度可以相对于此前已经评估过其转录活性的启动子,就该启动子产生的RNA的量或细胞或组织中的蛋白质积累量而言进行测量。
如本文所用,术语“序列同一性百分数”指在最佳比对的DNA的窗口的两个片段之间相同核苷酸的百分比。用于比对比较窗口的最佳序列比对是本领域技术人员熟知的并且可以通过多种工具如Smith和Waterman的局部同源性算法(Waterman,M.S.,Chapman和Hall.London,1995)、Needleman和Wunsch的同源性比对算法(1970)、Pearson和Lipman的相似性搜索方法(1988)并且优选地通过这些算法的计算机化执行如作为GCG(注册商标)、Wisconsin Package(来自加利福尼亚州圣迭戈市Accelrys Inc.的注册商标)的部分可获得的GAP、BESTFIT、FASTA和TFASTA来实施。测试序列和参考序列的已比对区段的“同一性分数”是由两个已比对序列所共有的相同组分的数目除以参考序列区段(即完整的参考序列或参考序列的更小定义的部分)中组分的总数目。序列同一性百分数表述为同一性分数乘以100。一个或多个DNA序列的比较可以是相对于全长DNA序列或其部分,或相对于较长的DNA序列。
仅是具有上述程度的序列同一性的具有种子特异性、种衣特异性或毛状体特异性启动子活性的核苷酸序列由本发明涵盖。
术语“杂交”指当两条核酸链具有足够序列同一性时核酸的第一链经氢键碱基配对作用与第二链接合的能力。当两个核酸分子在适宜条件下彼此复性时,杂交发生。核酸杂交是DNA操作领域的技术人员熟知的技术。一对给定核酸的杂交特性是其相似性或同一性的指标。两个核酸序列大体上相同的另一个指标是这两个分子在严格条件下彼此杂交。在核酸杂交实验如DNA印迹和RNA印迹杂交的背景下,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下不同。高严格性洗涤条件的实例是在65℃时0.1X SSC、5X Denhardt溶液、0.5%SDS例如约15分钟。本发明的适宜洗涤条件的实例是在65℃时2X SSC;0.1%SDS洗涤例如约15分钟。经常,高严格性洗涤之前是低严格性洗涤以除去背景探针信号。也可以通过添加去稳定剂如甲酰胺实现严格性条件。通常,2X(或高于)特定杂交测定法中对不相关探针所观察的信噪比表示检测到特异性杂交。将非常严格的条件选择等于特定探针的Tm。
在本发明的过程中,已经在陆地棉(Gossypium hirsutum)中鉴定到种子特异性启动子,连同后续5'UTR(一起也称作“启动子区”)。所述启动子,也称作pMADS6或GhpMADS6,在其天然背景下,控制棉花中的MADS框基因MADS6。
陆地棉是因两个祖先二倍体物种在1-1.2百万年前融合而产生的异源四倍体并且基因组可以含有每个基因的达至4个等位基因。考虑到至少100个MADS-框基因存在于拟南芥基因组中(Parenicová等人,2003),同时在白杨(Leseberg等人,2006)、碧冬茄(Immink等人,2003)和稻(Nam等人,2004)中存在相似数目,因此棉花中的MADS-框基因家族在可能庞大且复杂,具有高水平的同源性和/或功能冗余性。
启动子pMADS6与碧冬茄FBP7启动子具有非常低的序列同一性-46%,并且在胚珠、纤维中和在花组织中高度表达。已经显示表达在早期纤维发育期间特别强烈;达至24DPA检测到基因产物的表达(Lightfoot等人,2008)。
预期本发明的启动子适合于棉花中转基因的种子特异性、种衣特异性或毛状体或纤维特异性表达或至少在形成纤维的早期阶段期间的表达。本发明的启动子可以用来表达调节棉纤维特性的基因或否则参与棉纤维形成的基因,如参与植物生长激素合成的基因。本发明的启动子还可以是更易控制的,因为它源自意在再导入该启动子的植物。可替代地或除此之外,可以通过在棉花中使用本发明的启动子避免异源启动子的潜在未知或不想要的副作用。
除非另外指明,否则可以将与一个方面联系的本申请中所披露的某些实例的具体定义或具体特征引入本文所披露的任何其他方面中。
在本文所披露的启动子序列上鉴定到多个推定性反应元件。检索限于毛状体特异性元件并限于与L1框和MYB结合基序相对应的基序。后两者已经被描述为潜在性地赋予毛状体特异性表达的基序(Wang和Chen,2004)。检索揭示出两个基序潜在性地赋予种子特异性、种衣特异性或毛状体特异性表达。第一基序是T/G框,其与始于SEQ ID NO:1中位置298(与位置-451相对应)存在的毛状体基序RPSP01178相对应。T/G框基序的确切序列是AACGTG。已经在棉纤维MYB基因的启动子中鉴定到所述结合基序(Shangguan等人,2008),其中缺失降低该启动子在拟南芥和烟草中的活性。
另一个结合基序对应于MYB结合基序并且发现始于SEQ ID NO:1中的位置846并且具有序列cagtta。有趣地,所述MYB结合基序也存在于天然受本发明启动子调节的MADS6基因的编码序列内部。它已经由Wang和Chen(2004)鉴定并且至少存在于在拟南芥中赋予毛状体特异性的RDL1启动子中以及GL1(控制拟南芥中的myb基因)启动子和GaMyb2(控制棉花中的MYB基因)启动子中。已经较早显示破坏MYB结合基序导致毛状体产生减少。
本文所述的启动子的变体包括包含已鉴定的元件,但已经另外经过修改以除去序列内部下述核苷酸片段的那些变体,其中所述核苷酸片段不是该启动子以种子特异性、种衣特异性或甚至毛状体特异性或纤维特异性方式发挥必需的。例如,可以至少部分地缺失位于鉴定的两个基序之间和/或该转录起点与该第一基序之间的任何核苷酸片段以产生比SEQ ID NO:1中所示的约1.5Kb序列短的核苷酸序列。
如上文定义的本发明启动子及其片段和变体的核苷酸序列预期产生种子特异性、种衣特异性或甚至毛状体特异性或纤维特异性启动子活性。
在一个实例中,种子特异性启动子活性是位于棉花中。该启动子、其片段和变体可以发挥作用的其他实例包括产生其他毛状体或纤维的植物如,大麻、黄麻、亚麻和木本植物,包括但不限于松属某些物种(Pinusspp.)、杨属某些物种(Populus spp.)、云杉属某些物种(Picea spp.)、桉属某些物种(Eucalyptus spp.)等。
在本文所披露的核酸序列的一个实例中,种子特异性启动子活性是毛状体特异性或纤维特异性。
在另一方面,本申请披露一种嵌合基因,其包含本文所述的与编码感兴趣表达产物的核酸可操作地连接的(分离)核酸和任选地在植物细胞中有功能的转录终止及多聚腺苷化序列。
嵌合基因是通过可操作地连接不相关基因或其他核酸序列的片段所构建的人工基因。换句话说,“嵌合基因”指正常情况下植物种中不存在的基因或指任何基因,其中该基因的启动子、该启动子的接合部分或该基因的一个或多个其他调节区在自然界中并不与部分或全部的与之可操作地连接的转录核酸关联,即相对于该转录核酸是异源的。更具体地,嵌合基因是一种通过以下方式产生的人工(即非天然存在)的基因:将本发明核酸序列例如SEQ ID NO:1的核酸、其片段或与之具有80%序列同一性的核酸序列(均能够指导如上文所述的感兴趣表达产物的种子特异性、种衣特异性或毛状体特异性表达)与编码所述感兴趣表达产物的第二核酸序列可操作地连接,其中该第二核酸序列不天然地与所述核酸序列可操作地连接。天然地与所述核酸序列可操作地连接的这类核酸序列是棉花MADS6基因的编码序列。
术语“异源”指衍生自不同来源的两个或更多个核酸序列或蛋白质序列之间的关系。例如,启动子相对于可操作地连接的核酸序列(如编码序列)是异源,如果这种组合正常情况下不存在于自然界中。此外,特定序列可以相对于插入该序列的细胞或生物是“异源”的(即不天然存在于这种特定细胞或生物中)。例如,本文所披露的嵌合基因是异源核酸。
术语“可操作地连接的”指两个或更多个核酸区域或核酸序列的功能性空间排列。例如,启动子区可以相对于编码感兴趣表达产物的核酸序列如此安置,从而所述核酸序列的转录由该启动子区指导。因此,启动子区“与该核酸序列可操作地连接”。
如上文所述的启动子、其片段或变体可以与相对于该启动子为异源的编码感兴趣表达产物的核酸序列可操作地连接。核酸序列可以总体上是希望改变其转录水平如增加水平的任何核酸序列。该核酸序列可以例如编码能够在棉花中调节纤维特性或参与植物生长激素生物合成的多肽。
植物生长激素是在协调植物生活周期中多种生长和行为过程时发挥主要作用的一类植物激素。在分子水平,植物生长激素具有芳环和羧酸基(Taiz和Zeiger,1998)。植物生长激素家族的最重要成员是吲哚-3-乙酸(IAA)。它在完好植株中产生大部分的植物生长激素作用并且是最强有力的天然植物生长激素。
用于调节棉纤维特性的其他适合异源核酸序列包括而不限于在WO02/45485中披露的借以通过调节这类植物中蔗糖合酶活性和/或表达而调节产纤维植物(如棉花)中纤维品质的那些,如WO2005/017157中披露的通过调节胼胝质沉积介导纤维细胞伸长期改变的核酸,尤其编码β-1,3葡聚糖合酶蛋白的基因,或在WO2006/136351中披露的那些。
“表达产物”指因编码这类产物的核酸(如DNA或RNA)的转录和任选地翻译而产生的中间产物或终产物。在转录过程期间,在调节区、特别是本文所披露的启动子序列的控制下的DNA序列转录成RNA分子。RNA分子可以本身形成表达产物并随后例如能够与另一种核酸或蛋白质相互作用。可替代地,当RNA分子能够被翻译成肽或蛋白质时,这种RNA分子可以是中间产物。当一种RNA作为基因表达的终产物能够与另一种核酸或蛋白质相互作用时,将基因称作编码该RNA分子作为表达产物。RNA表达产物的实例包括抑制性RNA,例如正义RNA、反义RNA、发夹RNA、核酶、miRNA或siRNA、mRNA、rRNA和tRNA。当基因表达的终产物是蛋白质或肽时,将该基因称作编码蛋白质或肽作为表达产物。
其他示例性目的表达产物包括参与细胞壁合成和纤维形成的蛋白质,如WO2005/017157中披露,尤其是编码β-1,3葡聚糖合酶蛋白的基因,或在WO2006/136351、PCT/EP2011/004929或WO2011/089021中披露,尤其是可以被靶向高尔基体膜的N-乙酰葡糖胺转移酶,如NODC型N-乙酰葡糖胺转移酶或壳多糖合酶。
处于本披露的范围内,也可以利用与上述嵌合基因组合的其他调节序列,这些序列位于包含启动子的所述核酸序列和包含表达产物的编码序列的所述核酸序列之间。如果作为启动子使用的核苷酸序列是来自SEQ ID NO:1的位置1至位置748的对应于无5'UTR的启动子的一种序列,则情况尤其如此。这类调节序列的非限制性实例包括翻译激活子(“增强子”),例如专利申请WO87/07644中描述的烟草花叶病毒(TMV)翻译激活子或Carrington和Freed1990,J.Virol.64:1590-1597描述的烟草蚀纹病毒(TEV)翻译激活子,或内含子如拟南芥histon3内含子(Chaubet等人,1992)。
其他适合的调节序列包括5'UTR。如本文所用,5'UTR,也称作前导序列,是信使RNA(mRNA)的一个特定区域,其位于转录起始位点和编码区的起始密码子之间。它参与mRNA稳定性和翻译效率。例如,35S转录起始位点下游的碧冬茄叶绿素a/b结合蛋白基因(cab22L)的5'非翻译前导序列可以用来增进稳态水平的报道基因表达(Harpster等人,1988,Mol Gen Genet.212(1):182-90)。WO95/006742描述了衍生自基因编码热休克蛋白的5'非翻译前导序列序列增加转基因表达的用途。
嵌合基因还可以包含在植物细胞,尤其棉花植物细胞中可操作的转录终止或多聚腺苷化序列。作为转录终止或多聚腺苷化序列,可以利用细菌来源的任何对应序列,如例如根癌农杆菌(Agrobacteriumtumefaciens)nos终止子;病毒来源的任何对应序列,如例如CaMV35S终止子,或植物来源的任何对应序列,如例如在公布的专利申请EP0,633,317A1中所述的组蛋白终止子。
在本文所述的嵌合基因的一个实例中,所述感兴趣表达产物是蛋白质、肽或RNA分子,所述RNA分子能够调节相对所述植物为内源的基因表达。在一个实例中,所述蛋白质、肽或RNA分子能够调节纤维特性。在另一个实例中,所述蛋白质,肽或RNA分子参与植物生长激素生物合成。
如本文所用的术语“蛋白质”描述一组由多于30个氨基酸组成的分子,而术语“肽”描述由至多到30个氨基酸组成的分子。蛋白质和肽还可以进一步形成二聚体,三聚物和高级低聚物,即由不止一个(多)肽分子组成。形成这类二聚体、三聚物等的蛋白质或肽分子可以是相同或不相同的。相应的更高阶结构物因此称作同型二聚体或异二聚体、同型三聚体或异三聚体等。术语“蛋白质”和“肽”也指天然修改的蛋白质或肽,其中例如通过糖基化、乙酰化、磷酸化等实现该修饰。这类修饰是本领域熟知的。
适合作为表达产物的示例蛋白质包括参与调节纤维特性的蛋白质,如介导纤维长度增加、纤维强度改变或细胞壁特性改变(例如导致所述细胞壁电荷改变)、可染性改变、棉短绒产生减少、纤维成熟度比率改变、不成熟纤维含量降低或纤维整齐度和马克隆尼值增加的那些。
所述感兴趣表达产物也可以是能够调节相对所述棉花植物为内源的基因表达的RNA分子。
在这种联系下适于RNA表达产物的靶基因的实例包括参与调节纤维特性的那些,如介导纤维长度增加、纤维强度改变或细胞壁特性改变(例如导致所述细胞壁电荷改变)、可染性改变、棉短绒产生减少、纤维成熟度比率改变、不成熟纤维含量降低或纤维整齐度和马克隆尼值增加的那些。
对于RNA分子而言,将显而易见的是每当通过提及相应DNA分子的核苷酸序列来定义RNA分子的核苷酸序列时,该核苷酸序列中的胸腺嘧啶(T)应当由尿嘧啶(U)替换。是否指称DNA分子或RNA分子将从本申请的上下文显而易见。
术语“能够调节基因的表达”涉及RNA分子(例如,如本文所述的抑制性RNA分子)以不同方式影响靶基因表达水平的作用。这可以例如通过以下方式实现:通过直接与驱动靶基因表达的组分如基因本身或转录的mRNA相互作用而抑制所述表达,这导致表达的减少,或者通过抑制参与激活靶基因表达从而取消所述激活作用的另一种基因,或者抑制参与抑制靶基因的另一种基因表达,这导致表达的增加。相反,使用抑制性RNA抑制参与抑制靶基因表达的基因可以导致激活所述靶基因的表达。
抑制性RNA分子降低其靶蛋白的可用于翻译成所述靶蛋白的mRNA的水平。以这种方式,可以抑制参与不利应答于胁迫条件的蛋白质的表达。这可以通过已充分建立的技术实现,这些技术包括共抑制(正义RNA抑制)、反义RNA、双链RNA(dsRNA)、siRNA或微RNA(miRNA)。
如本文中披露的作为表达产物的RNA分子包含编码靶蛋白的核苷酸序列或同源序列的一部分以下调所述靶蛋白的表达。作为表达产物用于下调表达的RNA分子的另一个实例是反义RNA分子,其包含与编码感兴趣蛋白的核苷酸序列或同源序列的至少一部分互补的核苷酸序列。这里,可以例如通过导入这种反义RNA或编码这类RNA分子的嵌合DNA实现下调。在又另一个实例中,通过导入以下双链RNA分子下调感兴趣蛋白的表达,其中该双链RNA分子包含与编码所述感兴趣蛋白的基因序列的至少部分相对应并且分别与之互补的正义RNA区和反义RNA区,该正义RNA区和反义RNA区能够彼此形成双链RNA区。这类双链RNA分子可以由如上文所述的正义和反义分子编码和由经加工以形成siRNA或miRNA的单链分子编码。
在一个实例中,可以通过导入嵌合DNA构建体下调靶蛋白的表达,该嵌合DNA构建体产生能够通过共抑制作用下调表达的正义RNA分子。转录的DNA区域将在转录时产生能够以转录方式或转录后方式在靶植物或植物细胞中减少编码靶蛋白的基因表达的所谓正义RNA分子。转录的DNA区域(和所产生的RNA分子)包含至少20个连续核苷酸,这些连续核苷酸与编码植物细胞或植物中存在的靶蛋白的核苷酸序列的相应部分具有至少95%序列同一性。
可替代地,用于下调靶蛋白表达的表达产物是反义RNA分子。下调或减少感兴趣蛋白在靶棉花植物或植物细胞中的表达再次以转录方式或转录后方式实现。转录的DNA区域(和所产生的RNA分子)包含至少20个连续核苷酸,这些连续核苷酸与编码植物细胞或植物中存在的所述靶蛋白的核酸序列的相应部分的互补物具有至少95%序列同一性。
然而,编码靶蛋白的核酸序列的约20nt的反义或正义RNA区域的最短核苷酸序列可以被包含于一个较大RNA分子内部,该较大RNA分子在大小上从20nt变动至等于靶基因大小的长度。提到的反义或正义核苷酸区域可以因此长从约21nt至约5000nt、如长度21nt、40nt、50nt、100nt、200nt、300nt、500nt、1000nt、2000nt或甚至约5000nt或更长。而且,出于本发明的目的,并不要求所用的抑制性RNA分子或转基因编码区的核苷酸序列与编码靶蛋白的内源基因完全相同或互补,其中在植物细胞中以减少所述内源基因的表达为目标。序列越长,对整体序列同一性的要求的严格性越低。因此,正义或反义区可以与内源基因或其互补物的核苷酸序列具有约40%或50%或60%或70%或80%或90%或100%的整体序列同一性。然而,如所提到的,反义或正义区应当包含与编码靶基因的内源基因的核苷酸序列具有约95%至约100%序列同一性的20个连续核苷酸的核苷酸序列。具有约95%至约100%序列同一性的片段可以是约50个、75个或100nt。
可以通过添加DNA元件进一步增强上文所提到的用于反义RNA或正义RNA介导的基因表达水平下调的嵌合基因,其中这些DNA元件导致异常的未聚腺苷酸化的抑制性RNA分子表达。适合该目的的一种这样的DNA元件是编码自剪接核酶的DNA区域。也可以通过提供生成的具有细胞核定位或停留信号的RNA分子增强这种效率。
此外,如本文所述的表达产物可以是产生双链RNA分子的核酸序列,该双链RNA分子能够下调编码靶蛋白的基因的表达。一旦转录该DNA区域,则RNA能够借助正义区和反义区之间的常规碱基配对作用形成dsRNA分子,藉此正义区和反义区是如前文所述的核苷酸序列。作为根据本发明的dsRNA表达产物可以进一步包含内含子,例如异源内含子,根据WO99/53050的披露内容,该内含子位于例如正义RNA区和反义RNA区之间的间隔序列中。为实现这种转基因的构建,可以利用WO02/059294A1中所述的载体。
在一个实例中,所述RNA分子包含第一和第二RNA区域,其中1.所述第一RNA区域包含与所述内源基因的核苷酸序列具有至少约94%序列同一性的至少19个连续核苷酸的核苷酸序列;2.所述第二RNA区域包含与所述第一RNA区域的所述19个连续核苷酸互补的核苷酸序列;3.所述第一和第二RNA区域能够碱基配对以便在所述第一区域和第二区域的所述至少19个连续核苷酸之间形成双链RNA分子。在其他实例中,如上文所述,相同的考虑事项适用于正义和反义RNA。
另一个示例性表达产物是微RNA分子(mirRNA,其可以从前微RNA分子加工而来),该微RNA分子能够指导从编码靶蛋白的DNA转录而来的待翻译成所述靶蛋白的mRNA的裂解。可以将miRNA分子借助表达从如本文所述的嵌合基因便利地导入植物细胞中,其中所述嵌合基因包含了编码这类miRNA、前miRNA或初级miRNA转录物作为感兴趣表达产物的(第二)核酸序列。
miRNA是在植物中、还在其他真核生物中调节基因表达的内源性小RNA。如本文所用,“miRNA”是长度约20至30个核苷酸的RNA分子(Siomi和Siomi,2009),其可以被加载至RISC复合物中并其指导靶RNA分子的切割,其中该靶RNA分子包含与该miRNA分子的核苷酸序列基本上互补的核苷酸序列。在示例性miRNA中,以下一个或多个错配可以在基本互补于靶RNA的miRNA中出现:
-所述miRNA5'末端的核苷酸与靶RNA分子中的相应核苷酸序列之间的一个错配;
-所述miRNA第1位置至第9位置内的核苷酸中任一个与靶RNA分子中的相应核苷酸序列之间的一个错配;
-所述miRNA的第12位置至第21位置内的核苷酸中任一个与靶RNA分子中的相应核苷酸序列之间的三个错配,但不超过两处连续错配;
-在该miRNA第10位置和第11位置处不允许错配(全部miRNA位置均从该miRNA分子的5'端开始标识)。
能够下调靶蛋白表达的表达产物的又一个实例由产生前miRNARNA分子的核酸序列编码,其中该前miRNA RNA分子被加工成能够指导编码所述靶蛋白的mRNA裂解的miRNA。在植物中,miRNA通过DICERLIKE1(DCL1)的切割活性而从长的内源性前miRNA的茎-环区加工而来。植物miRNA与保守的靶mRNA高度互补并且指导其靶的裂解。miRNA似乎是调节本身参与发育的复杂通道网络的基因表达的关键组分。
如本文所用,“前miRNA”分子是具有约100至约200个核苷酸,优选地约100至约130个核苷酸的RNA分子,该RNA分子可采用下述二级结构,该二级结构包含dsRNA茎和单链RNA环,并且进一步包含在双链RNA茎中的miRNA的核苷酸序列及其miRNA*的互补序列。优选地,该miRNA及其互补物位于距离该miRNA dsRNA茎的游离末端约10个至约20个核苷酸处。单链环区域的序列和长度并非关键并且可以大幅度变动,例如,长度在30至50nt之间。优选地,未配对和配对的RNA结构之间的自由能差异在-20与-60kcal/摩尔之间,例如在-40kcal/摩尔左右。该miRNA与miRNA*之间的互补性不必是完美的并且可以容忍约1个至3个凸起的未配对核苷酸。RNA分子所采用的二级结构可以由本领域常规的计算机算法如mFold、UNAFold和RNAFold来预测。来自前miRNA中的dsRNA茎的特定链由5'端处的互补性程度决定,其中该特定链由DCL活性被释放并加载到RISC复合体上,因而在其5'端处最少参与已切割的dsRNA茎的不同链的核苷酸之间成氢键作用的链被加载到RISC复合体上并且将确定靶RNA分子降解的序列特异性。但是,如果经验上来自特定合成性前miRNA分子的miRNA分子因为“错误”链被加载到RISC复合物上而不是有功能性,则会立刻显而易见的是,可以通过交换miRNA分子及其互补物在前miRNA分子的dsRNA茎的相应链上的位置解决这个问题。如本领域已知,涉及两个氢键的A和U之间的结合作用或涉及两个氢键的G和U之间的结合作用不如涉及三个氢键的G和C之间的结合作用强。
miRNA分子可以被包含于其天然存在的前-miRNA分子中,但是也可以通过将正常情况下从这种现存的前miRNA分子加工而来的miRNA分子的核苷酸序列交换成另一个感兴趣miRNA的核苷酸序列,将它们引入现存的前-miRNA分子支架中。前miRNA的支架也可以是完全合成的。类似地,合成的miRNA分子可以被包含于现存的前-miRNA分子支架或合成性前miRNA支架中或从其加工而来。
示例性表达产物也可以是催化自身裂解或其他RNA裂解的核酶。
在本文所披露的嵌合基因的一个实例中,调节表达是增加表达,并且所述编码感兴趣表达产物的核酸序列编码一种RNA,当转录时,1.所述RNA产生一种RNA分子,该RNA分子能够增加对所述棉花植物为内源的基因表达。这类基因可以与纤维长度,纤维强度或细胞壁特性的所希望改变正相关,这些改变导致例如所述细胞壁的电荷改变、可染性改变、棉短绒产生减少、纤维成熟度比率改变、不成熟纤维含量降低或纤维整齐度和马克隆尼值增加,或2.产生一种RNA分子,该RNA分子能够减少对所述棉花植物为内源的基因表达,其中所述基因可以与纤维长度、纤维强度或细胞壁特性的所希望改变负相关,这些改变导致例如所述细胞壁的电荷改变、可染性改变、棉短绒产生减少、纤维成熟度比率改变、不成熟纤维含量降低或纤维整齐度和马克隆尼值增加。
基于RNA的示例表达产物包括抑制性RNA如miRNA、siRNA、反义RNA、正义RNA、发夹RNA或靶以下对象的核酶:葡聚糖酶、编码肌动蛋白解聚因子的ADF、编码羊蜡酸的CPC、或编码triptychon的TRY,连同其它。
在本文所述的嵌合基因的另一个实例中,所述表达产物是如本申请中其他地方描述的报道基因或纤维特异性基因。
在本文所述的嵌合基因的一个实例中,所述RNA分子包含第一和第二RNA区域,其中1.所述第一RNA区域包含与所述内源基因的核苷酸序列具有至少约94%序列同一性的至少19个连续核苷酸的核苷酸序列;2.所述第二RNA区域包含与所述第一RNA区域的所述19个连续核苷酸互补的核苷酸序列;以及3.所述第一和第二RNA区域能够碱基配对以便在所述第一区域和第二区域的所述至少19个连续核苷酸之间形成双链RNA分子。
本申请还披露一种包含本文所述的嵌合基因的载体。
“载体”指它能够携带并转移遗传信息的任何基于核酸的介质,如质粒、粘粒、病毒、自主复制型序列、噬菌体或线性单链、环状单链、线性双链或环状双链DNA或RNA核苷酸序列。重组载体可以衍生自任何来源并且能够进行基因组整合或自主复制。因此,上文描述的嵌合基因可以在重组载体中提供。重组载体典型地以5'至3'方向包含:指导核酸序列转录的启动子和待转录的核酸序列。这些元件对应于本文所披露的待导入的嵌合基因。根据希望的,重组载体还可以进一步包含3'转录终止子、3'多聚腺苷化信号、其他非翻译核酸序列、转运和靶向核酸序列、选择标记、增强子和操纵基因。词“5'UTR”指基因编码区的上游或5'的非翻译DNA区,并且“3'UTR”指基因编码区的下游或3'的非翻译DNA区。用于制备重组载体的手段是本领域熟知的。用于制备特别适合于植物转化的重组载体的方法在US4971908、US4940835、US4769061和US4757011中描述。本文所述的载体可以是表达载体。有用于高等植物中表达核酸的典型载体是本领域熟知的并且包括衍生自根癌农杆菌的肿瘤诱导(Ti)质粒的载体。
在另一方面,本申请披露了一种转基因植物细胞,其包含本文所披露的嵌合基因或本文所披露的载体。
本发明还涉及转基因植物细胞和转基因植物,它们包含与编码感兴趣表达产物的异源核酸序列可操作地连接的如上文所述的核酸序列,即本文所披露的启动子序列。可替代地,所述转基因植物细胞或植物包含本文所披露的嵌合基因。上文描述了优选的启动子序列和感兴趣表达产物及其他调节元件。
可以通过将如上文所述的核酸序列导入植物或植物细胞中产生转基因植物。与本申请相关的“导入”涉及通过人工手段将遗传信息安置在植物细胞或植物中。这可以通过本领域已知的将RNA或DNA导入植物细胞、原生质体、愈伤组织、根、块茎、种子、杆、叶、籽苗、胚、花粉和小孢子、其他植物组织或完整植株中的任何方法来实现。更具体地,“导入”意指稳定整合至植物基因组中。
含有转化的核酸序列的植物称作“转基因植物”。转基因和重组指已经向其中导入异源核酸分子(例如,如本文所述的核酸序列、嵌合基因或载体)的宿主生物如植物。该核酸可以稳定整合至植物的基因组中。与本文所披露的方法相结合地描述了用于导入的具体方法。
植物细胞可以衍生自产生毛状体的任何植物,如棉属(Gossypium)(棉花)、烟草属(Nicotiana)、拟南芥属以及上文描述的产纤维植物。在一个实例中,植物细胞衍生自棉属植物。
如本文所用的“棉花”或“棉花植物”可以是有用于培育棉花的任何品种。最常使用的棉花品种是海岛棉(Gossypium barbadense)、陆地棉(G.hirsutum)、树棉(G.arboreum)和草棉(G.herbaceum)。其他品种包括非洲棉(G.africanum)和雷蒙德氏棉(G.raimondii)。还包括的是来自前述任一者种与其他物种杂交或这类物种之间杂交的子代。
棉花植物细胞可以是基本上包含对定义棉花植物为必要的遗传学信息的任何细胞,其中除本文所披露的嵌合基因之外,该细胞可以由一个或多个其他转基因补充。细胞可以衍生自形成棉花植物的不同器官和/或组织,包括但不限于果实、种子、胚、繁殖组织、分生组织区、愈伤组织、叶、根、苗、花、维管组织、配子体、孢子体、花粉和小孢子。
本申请还披露一种转基因植物,其由本文所述的转基因棉花植物细胞组成或包括本文所述的稳定整合于植物基因组内的嵌合基因或载体。这可以通过本申请中其他地方描述的转化方案实现。
在另一个实施例中,本发明涉及从本文所述的转基因植物产生的种子,其中所述种子包含本文所述的嵌合基因。
种子由随储存养分一起被种衣封闭的胚植物体形成。它是裸子植物和被子植物(棉花属于被子植物)的成熟胚珠的产物,该产物在受精后发生并且在母体植物内部生长至某种程度。
本文还披露了从本文所公开的植物可获得或获得的棉纤维和棉籽油。可以通过采用WO2010/015423中披露的检测方法以及检查纤维中(a)的核酸或(b)的嵌合基因的存在,将本文所公开的棉纤维与其他纤维区分。因而,(a)的核酸也可以用于追踪本发明的细胞壁、尤其棉纤维。
另外本文还披露了由本文所披露的纤维制成的纱线和纺织物以及包含本文所披露的棉籽油或由其制成的食品和饲料。还披露了获得棉籽油的方法,该方法包括从本文所披露的棉花植物收获棉籽并从所述种子提取所述油。另外,还披露了产生棉纤维的方法,该方法包括培育所披露的棉花植物并且从所述棉花植物收获棉花。
本发明还涉及产生转基因植物的方法,其包括(a)提供本文所述的嵌合基因或本文所述的载体;以及(b)将所述嵌合基因或载体导入植物中。
多种方法可用于将DNA通过转化或基因掺入引入植物细胞或植物中。农杆菌介导的棉花转化已经例如在美国专利5,004,863或美国专利6,483,013和WO2000/71733中描述。
植物也可以通过粒子轰击法转化:将金或钨粒子用DNA包衣并且随后射向幼龄植物细胞或植物胚。这种方法也允许转化植物质体。例如在WO92/15675中报道了通过粒子轰击法转化棉花。
根椐病毒基因组的性质,病毒转化(转导)法可以用于基因的瞬时或稳定表达。将所希望的遗传物质包装成适合的植物病毒并且允许修饰的病毒感染植物。感染植物的子代不含病毒并且也不含插入的基因。用于病毒转化的合适方法例如在WO90/12107、WO03/052108或WO2005/098004中描述或进一步详述。
“基因渗入”意指通过天然手段,即通过将包含本文所述的嵌合基因的植物与不包含所述嵌合基因的植物杂交,将基因整合于植物基因组内。可以选择包含嵌合基因的后代。
其他转化和基因渗入操作方案还可以在美国专利7,172,881中找到。
在又一个方面,本申请披露了一种培育棉花的方法,该方法包括(a1)提供本文所述或通过本文所述方法产生的转基因植物;或(a2)将本文所述的嵌合基因或本文所述的载体导入植物中;(b)培育(a1)或(a2)的植物;以及(c)收获由所述植物产生的棉花。
“培育”涉及为植物创造生长、繁殖和/或成熟的环境。特定植物的合适培育条件是本领域熟知的。
在另一方面,本申请披露了一种产生包含本文所披露的嵌合基因的种子的方法,该方法包括(a)培育包含本文所述的嵌合基因或本文所述的载体的转基因植物、本文所述的转基因植物或者通过本文所述方法获得的转基因植物,其中所述转基因植物产生所述种子并且所述嵌合基因包含于所述种子中,并且(b)从所述转基因植物中分离所述种子。
在产生转基因植物的方法或产生种子的方法的一个实例中,该植物是如本申请中其他地方所描述的棉花植物。
在另一方面,本申请披露一种在棉花中实现产物的种子特异性表达的方法,该方法包括将本文所披露的嵌合基因或本文所披露的载体导入棉花植物的基因组;或提供本文所披露的转基因植物。在一个实例中,种子特异性表达可以是种衣特异性表达、毛状体特异性表达或纤维特异性表达。
在又一方面,本申请披露一种改变棉花植物中纤维特性的方法,该方法包括将本文所披露的嵌合基因或本文所披露的载体导入棉花植物的基因组;或提供本文所披露的转基因植物。
在一个实例中,该方法进一步包括培育所述植物直至种子生成。
在另一个实例中,基于上述其他步骤,该方法用于增加来自棉花植物的棉花产量并且进一步包括收获由所述棉花植物产生的棉花。换句话讲,本申请披露一种增加来自棉花植物的棉花产量的方法,该方法包括将本文所披露的嵌合基因或本文所披露的载体导入棉花植物的基因组;或提供本文所披露的转基因植物;并且收获由所述棉花植物产生的棉花。
与本申请相联系的术语“增加产量”涉及棉纤维产出的增加,这可以例如通过增加棉籽上产生的纤维的数目、纤维长度或纤维强度来实现。上文已经描述了参与赋予这些特性的基因及其表达产物。
在另一方面,本申请披露了本文所披露的嵌合基因、本文所披露的载体或本文所披露的转基因植物或植物细胞的用途,用于一种产物在棉中的种子特异性表达、用于改变棉花中的纤维特性或用于增加棉花产量。上文就本文所披露的其他方面所描述的定义和其他实例等同等地适用于这个方面。
除了上文描述的嵌合基因之外,本文所披露的或通过本文所述方法获得的转化的棉花植物细胞和棉花植物可以含有至少一个包含编码感兴趣表达产物的核酸的其他嵌合基因。这类表达产物的实例包括RNA分子或蛋白质,如例如针对除草剂抗性的酶。
其他感兴趣表达产物向棉花植物赋予昆虫抵抗力,即针对某些靶昆虫侵袭的抵抗力,或非生物胁迫耐受性。
本文所述的转化植物细胞和植物,如通过本文所述方法获得的那些,还可以用于本领域熟知的育种程序中,如杂交、自交和回交。育种程序可以涉及杂交以产生F1代(第一子代),随后是几个自交世代(产生F2、F3等)。该育种程序也可以涉及回交(BC)步骤,因而该后代与亲本系之一(称作回归亲本)回交。
因此,本文还披露了一种用于产生包含本文所披露的嵌合基因的植物的方法,该方法包括以下步骤:将本文所披露的棉花植物与另一个植物或与本身杂交并选择包含所述嵌合基因的后代。
通过本文所披露的方法获得的转基因植物细胞和植物也可以进一步用于后续的转化程序中,例如用来引入其他嵌合基因。
这些图显示:
图1:琼脂糖凝胶显示扩增4种MADS基因的DNA序列的PCR反应的结果。
图2:反向PCR方法的方案。
图3:收回MADS6启动子(PMADS6)的克隆步骤,如实例1中所述。3a/3b基因组序列收回和反向PCR方案的概述;3c.从反向PCR收回的片段;3d至f:产生包含完整MADS6启动子的载体。缩写:bla:氨苄青霉素抗性基因;ORI ColE1:来自pMB1的质粒复制起点;lacZ:编码来自大肠杆菌(Escherichia coli)的β-半乳糖苷酶α肽的编码序列;MCS:多克隆位点;5'UTR:5'非翻译区;Plac:大肠杆菌lac操纵子的启动子;Pmads6:MADS6启动子;Phis:包含拟南芥组蛋白H4基因的启动子区和拟南芥组蛋白H3.III变体的基因II的第一内含子的序列;2mepsps:编码玉蜀黍(玉米)双突变5-烯醇式-丙酮莽草酸-3-磷酸合酶基因的序列(Lebrun等人,1997);TPotp C:优化的转运肽的编码序列,其含有玉蜀黍(玉米)和向日葵(向日葵)的核酮糖二磷酸羧化酶-加氧酶(RuBisCO)小亚基基因的序列;aadA:链霉素和壮观霉素抗性;大肠杆菌转座子Tn7的氨基糖甙腺苷酰转移酶基因的编码序列(aadA)(Fling等人,1985);bar:吸水链霉菌(Streptomyces hygroscopicus)膦丝菌素乙酰转移酶基因的编码序列(=bialaphos抗性基因)(Thompson等人,1987);3'nos:来自pTiT37的T-DNA的胭脂碱合酶基因3'非翻译末端并且包含植物多聚腺苷化信号的片段;ori pVS1:来自pVS1的用于农杆菌中维持稳定的质粒复制起点;P35S3:来自花椰菜花叶病毒35S转录物的启动子区的片段;GUS:大肠杆菌β-葡糖醛酸糖苷酶基因的编码序列,包含马铃薯(马铃薯)ST-LS1基因的第二内含子。
图4:制备包含推定性MADS6启动子、GUS编码序列和bar选择标记的棉花转化载体pTTS108。
图5:6dap时用PMADS6控制的GUS报道基因(图5a)和PFBP7控制的GUS报道基因(图5b)转化的胚珠。圆圈指示胚珠上存在的对应于GUS表达的蓝点。
这些实例说明本发明。
材料
除非另外说明,实例中的化学品和试剂从西格玛化学公司(SigmaChemical Company)获得,限制性核酸内切酶来自Fermentas公司或Roche-Boehringer公司,关于生物化学和分子生物测定法的其他修饰酶或试剂盒来自凯杰公司(Qiagen)、英杰公司(Invitrogen)和Q-BIOgene公司。细菌菌株来自英杰公司。所实施的克隆步骤例如限制性切割、琼脂糖凝胶电泳、纯化DNA片段、连接DNA片段、转化大肠杆菌细胞、培育细菌、增殖噬菌体和重组DNA的序列分析,如Sambrook(1989)所述实施。使用ABI激光荧光DNA序列仪,按照Sanger方法实施重组DNA分子的测序。
实例1:棉花中MADS6启动子的追踪
已知碧冬茄FBP7启动子毛状体特异性表达。在本发明的过程中,在棉花中鉴定到具有相似特性的启动子。
在TrEMBL数据库中采用受FBP7启动子控制的FBP7蛋白的序列实施BLAST检索以鉴定棉花中的潜在同源物。
该检索找到陆地棉中的两个命中,二者均是MADS-框蛋白,称作GhMADS6和GhMADS7。
在植物中,MADS-框基因编码具有至少100个成员的一个庞大转录因子家族(综述见DeBodt等人,2003;Kofuji等人,2003;Parenicová等人,2003;Nam等人,2004)。
除另外两者GhMADS4和GhMADS5之外,GhMADS6和GhMADS7已经由Lightfoot等人,(2007)发现是FBP7的同源物。这个研究组证明MADS5和MADS6在胚珠、花和纤维组织中高度表达。此外,两种蛋白质均在早期纤维发育(0至6DPA)时表达。在叶和茎中未检测到表达。MADS5显示在根中低表达。
为了找到对纤维特异的启动子,选择编码MADS6的基因用于进一步研究。
blastn检索用来鉴定编码MADS6蛋白的DNA。检索到的信息揭示出一个具有1040碱基对的cDNA片段。然而,在基因组数据库中对这段序列的检索没有产生任何信息。因而,不能确定MADS6编码序列5'的核苷酸序列。
在这种情况下,鉴定的MADS基因表现出非常高的序列同一性水平。这使得追踪特定MADS基因(在这种情况下是MADS6基因)成为一项困难任务。对于基于反向PCR的方案,需要找到对选择的MADS基因特异的引物,考虑到该家族成员间的高度序列同一性,这是相当费事的。
使用以下引物,通过PCR追踪基因序列。
MADS4
TSOL454_正向:5'-tcgaggccatacattctcag-3'(SEQ ID NO:2)
TSOL455_反向:5'-gtcttacacactctacacatc-3'(SEQ ID NO:3)
MADS5
TSOL456_正向:5'-agaggaactcccactccctac-3'(SEQ ID NO:4)
TSOL457_反向:5'-atgtagagtacatatggttga-3'(SEQ ID NO:5)
MADS6
TSOL458_正向:5'-catccatctgcttactcccat-3'(SEQ ID NO:6)
TSOL459_反向:5'-tacatcatacgaacttcaca-3'(SEQ ID NO:7)
MADS7
TSOL460_正向:5'-caaaccagctgatgcaagcagc-3'(SEQ ID NO:8)
TSOL461_反向:5'-caacaactaggctttcaactgt-3'(SEQ ID NO:9)
PCR反应在Cocker野生型基因组DNA上进行。
对于全部4个基因,扩增出一个基于cDNA序列大于预期片段的单一片段(参见图1)。这表示全部4个基因均含有在扩增的编码区内部的内含子。
在-20℃保存对MADS4、MADS5和MADS7所获得的PCR片段。将获得的MADS6的PCR片段克隆至克隆载体中。
为了比较,使用在Lightfoot等人,(2007)中报道的引物,在基因组DNA上对MADS6进行又一个PCR反应。再次,所获得的片段(1040bp)大于对应的cDNA片段(394bp)。将获得的片段克隆并测序并且与采用对MADS6的3'末端特异的引物所获得的基因组片段、与MADS6的cDNA序列、与采用对MADS6的3'末端特异的引物从cDNA所获得的片段进行比对。
可以证实编码序列内部的内含子。
获得的与MADS6基因的3'部分相对应的1040碱基对片段随后用作扩增包含该启动子的5'基因组序列的基础。
尝试反向PCR方法。图2中描述了待进行的步骤的简介。
酶A的良好候选物可以定义为Nhe I。采用这种酶的试验产生与大于5kb的基因组片段杂交的片段。
随后,设计反向PCT的巢式引物,这些引物靶向MADS6编码序列的3'末端,其中发现该3'末端在陆地棉中鉴定的全部4个MADS基因之间同一性最低。
PCR反应用这些引物和酶A的某些候选物建立。
使用特异性靶向该基因的3'-区域内的MADS6的上述引物,仅可以获得多个非特异性条带,并且不能确定MADS6基因的5'-上游序列。
用MADS6基因的特异性较低的5'序列进行另一个尝试。首先,分别使用与5'非翻译区域(UTR)结合的正向引物TSOL472(5'-GGTACAAGTGATCAAAGAG-3';SEQ ID NO:10)和TSOL473(5'-ATTGGCCGGAACTCTTACCA-3';SEQ ID NO:11)以及具有序列5'-GGACCTGATCCTAGTAATTCC-3'(SEQ ID NO:12)并且与MADS6cDNA结合的反向引物TSOL465,扩增MADS6的5'-基因序列。虽然在cDNA序列的5'UTR中TSOL472和TSOL473之间的距离仅是30bp,但是扩增的片段(2500bp与3250bp)在长度上相差750bp;这表明一个750bp内含子序列位于MADS6基因的5'UTR中。对这两个片段的克隆和测序证实了这种假设。
3251碱基对的较长片段用作扩增包含该启动子的5'序列的基础(参见图3a)。
在又一个反向PCR方案中,酶B的良好候选物由消化的基因组Coker DNA与MADS65'UTR探针(540bp片段,通过PCR扩增用引物TSOL473(SEQ ID NO:11)和TSOL512(5'-AGCCATTCCTATTCCCATAC-3';SEQ ID NO:13)获得)的杂交作用定义。
对于测试的全部限制性酶,获得至少2个杂交片段,这表明与至少一个其他MADS-家族成员的交叉杂交。
从全部酶中,认为Bcl I、Nde I和Hind III最有前景。全部的这些酶均产生2条在3.5kb和0.8kb之间的杂交条带。
接下来,将Coker基因组DNA在三个反应小瓶中用Bcl I、Nde I和Hind III消化。使10μg消化的基因组DNA(通过沉淀清洁并重悬于85μl TE缓冲液中)自我连接(在100μL反应容积中)以获得适于巢式PCR分析的环状片段(图3b)。
使用第一PCR反应的引物TSOL502(5'-CTGTTCTATCTTTCCCTTCTTG-3',SEQ ID NO:14)和TSOL503(5'-AGAAAGAAAGCATGCATTTAGG-3';SEQ ID NO:15)以及第二PCR反应的引物TSOL500(5'-ATACATGATGGGTTCTCTTC-3';SEQ ID NO:16)和TSOL501(5'-AAGCATGCATTTAGGTAAAG-3';SEQ ID NO:17),进行巢式PCR。巢式PCR导致扩增出一个条带,它具有与三种测试的酶中两种酶的杂交条带相对应的大小:分别在经HindIII与NdeI消化并再连接的基因组DNA中扩增出850bp片段与1.7kb片段。将扩增的1.7kb条带克隆至克隆载体中并测序。该重组载体命名为pTS478(图3b)。
如下连接获得和克隆的两个片段,它们对应于5'-UTR和推定性启动子区(图3c)。
作为第一步骤,PCR扩增两个片段,添加适宜克隆位点用于进一步克隆。
A/大部分上游部分的扩增:使用正向引物TSOL558(含有Kpn I和EcoR I限制性位点的5'-GCGCGGTACCGAATTCCATATGTATATTATATATT-3';SEQ IDNO:18)和反向引物TSOL559(含有SpeI限制性位点的5'-TATAACTAGTAGTGTGCTGGAATTCGC-3';SEQ ID NO:19),在pTS478模板DNA上进行PCR扩增。将该片段作为中间载体(pTS412)克隆并测序(图3d)。
B/5'UTR的更多3'部分的扩增:使用正向引物TSOL473(5'-ATTGGCCGGAACTCTTACCA-3')和反向引物TSOL560(在翻译起点处含有NcoI限制性位点的5'-GCATCCATGGTCTCTTTGATCACTTGTA-3';SEQ ID NO:20),在pTS469模板DNA上进行PCR扩增。在SphI限制性消化后,将片段连接至通过SphI限制性消化而线性化的pTS412中。因此,这两个片段可以在载体pTS413中连接;借此,重构出完整的(1.5kb)5'上游序列(包括750bp内含子的启动子+5'UTR)(图3e)。通过测序证实完整pTS413插入物的序列(1.5kb)。
为了易于在不同的植物转化载体之间克隆和交换,将1.5kb MADS6上游片段作为KpnI/NcoI片段克隆在质粒中。
所产生的载体pTS414含有包含来自陆地棉的MADS6基因5'上游序列的1.5kb片段,该5'上游序列包含推定性启动子序列。
实例2:构建包含pMADS6启动子和编码感兴趣表达产物的序列的表达盒
用适宜限制性酶消化包含在实例1中获得的1.5kb片段的载体pTS414和包含感兴趣表达产物的编码序列的载体。将编码感兴趣表达产物的序列的片段连接至包含所述1.5kb片段的载体中。
随后用适宜限制性酶消化所产生的载体,将包含与推定性MADS6启动子连接的编码感兴趣表达产物的序列的表达盒纯化并克隆至两个载体中,一个载体包含bar选择标记并且一个载体包含epsps选择。
实例3:构建包含pMADS6启动子和GUS报道基因的表达盒
用限制性酶EcoRI和NcoI消化包含在实例1中获得的1.5kb片段的载体pTS414和包含GUS编码序列(SEQ ID NO:21)的载体。将GUS序列的片段连接至pTS414中以获得pTS415(参见图4)。通过克隆与GUS报道子连接的FBP7启动子,产生对照构建体。
随后用EcoRI和PstI消化pTS415,将包含与推定性MADS6启动子连接的GUS编码序列的表达盒纯化并克隆至包含bar选择标的载体中,产生载体pTTS108(图4)。将这种载体用于棉花稳定转化。
实例4:包含均与GUS报道基因连接的pMADS6和pFBP7的报道子构建体的表达分析
使用Bio-RAD型号PDS-1000/He生物射弹基因枪通过粒子轰击法转化棉花胚珠。将平均直径0.3μm至3μm的60mg金粒子用70%乙醇洗涤1次并随后用蒸馏水洗涤3次。将粒子重悬于1ml蒸馏水中。向50μl悬浮液中添加5μg DNA,50μl CaCl2和20μl亚精胺,将所产生的混合物在室温温和振摇10分钟并随后留在室温另外5分钟。所产生的沉淀物用100%乙醇洗涤3次并随后重悬于55μl100%乙醇中。
将6μl悬液划线于巨载体(Bio-RAD)上并使其干燥。使用900、1100、1350psi的破裂盘(Bio-RAD),实施粒子轰击法。
在授粉6日后(dap),分析受PMADS6(构建体pTS417)或PFBP7控制的GUS报道基因的表达。
图5显示授粉后6日用PMADS6控制的GUS报道基因(图5a)和PFBP7控制的GUS报道基因(图5b)转化的胚珠。圆圈指示胚珠上存在的对应于GUS表达的蓝点。从这些结果中,显而易见PMADS6驱动胚珠中的表达。
实例5:针对种子特异性和毛状体特异性结合基序分析pMADS6
使用公共可用的数据库如PLACE(http://www.dna.affrc.go.jp/PLACE/)、RegSite(http://linux1.softberry.com/berry.phtml?topic=regsitelist)、PlantCare(Lescot等人,2002;在http://bioinformatics.psb.ugent.be/webtools/plantcare/html/可获得)和AtcisDB(Davuluri等人,2003)实施启动子分析。
检索限于毛状体特异性元件以及限于与L1框和MYB结合基序相对应的基序。后两者已经被描述为潜在性地赋予毛状体特异性表达的基序(Wang和Chen,2004)。
检索揭示出两个基序潜在性地赋予种子特异性或种衣特异性或毛状体特异性表达。第一基序是T/G框,其与始于位置-1224(与SEQ ID NO:1的位置298相对应)存在的毛状体基序RPSP01178相对应。T/G框基序的确切序列是AACGTG。已经在棉纤维MYB基因的启动子中鉴定了所述结合基序(Shangguan等人,2008),其中缺失降低该启动子在拟南芥和烟草中的活性。
另一个结合基序对应于MYB结合基序并且在位置-676(与SEQ IDNO:1的位置846相对应)处存在。。有趣地,所述MYB结合基序也存在于天然受本发明启动子调节的MADS6基因的编码序列内。它已经由Wang和Chen(2004)鉴定并且至少存在于在拟南芥中赋予毛状体特异性的RDL1启动子中,以及GL1(控制拟南芥中的myb基因)启动子和GaMyb2(控制棉花中的MYB基因)启动子中。已经较早显示破坏MYB结合基序导致毛状体产生减少。
实例6:pMADS6在棉纤维和其他棉花植物组织中的表达分析
根据本领域熟知的操作方案,用根据实例3的构建体,通过本领域熟知的农杆菌介导转化法转化棉花,并且在温室中培育转化的植物。针对GUS表达对植物进行分析。
可以在1DPA于正在发育的纤维中检测到GUS表达,在5DPA、8DPA、10DPA、13DPA和30DPA检测到高表达。可以在花药中检测到低GUS表达。在萼片,茎、叶轴和根中未检测到表达。
参考文献
Braasch和Corey(2001),Locked nucleic acid(LNA):fine-tuningthe recognition of DNA and RNA(锁核酸(LNA):对DNA和RNA的微调识别),Chem Biol8(1),第1-7页。
Carrington和Freed1990,Cap-independent enhancement oftranslation by a plant potyvirus5'nontranslated region(借助植物马铃薯Y病毒5'非翻译区的帽依赖性翻译增强作用),J.Virol.64,第1590-1597页。
Chaubet等人,(1992),Genes encoding a histone H3.3-like variantin Arabidopsis contain intervening sequences(拟南芥中编码组蛋白H3.3样变体的基因含有间插序列),J Mol Biol.225(2):569-74。
Davuluri等人,(2003),AGRIS:Arabidopsis gene regulatoryinformation server,an information resource of Arabidopsiscis-regulatory elements and transcription factors(AGRIS:拟南芥基因调节信息服务器,拟南芥顺式调节元件和转录因子的信息资源),BMCBioinformatics4(1):25。
De Bodt,S.等人,(2003),Genomewide structural annotation andevolutionary analysis of the type I MADS-box genes in plants(植物中I型MADS-框基因的基因组级别结构注释和进化分析),J Mol Evol56,第573-586页。
Delaney等人,(2007),The fiber specificity of the cotton FSltp4genepromoter is regulated by an AT-rich promoter region and the AT-hooktranscription factor GhAT1(棉花FSltp4基因启动子的纤维特异性受AT丰富启动子区和AT-钩转录因子GhAT1调节),Plant and CellPhysiology48,1426-1437。
Eisner,T.等人,(1998),When defence backfires:detrimental effectof a plant's protective trichomes on an insect beneficial to the plant(当防御适得其反时:植物的保护性毛状体对有益于植物的昆虫的有害影响),Proc Natl Acad Sci USA95,第4410-4414页。
Hsu等人,(1999),Analysis of promoter activity of cotton lipidtransfer protein gene LTP6in transgenic tobacco plants(分析棉花脂质转移蛋白基因LTP6在转基因烟草植物中的启动子活性),Plant Science143,第63-70页。
Immink,R.等人,(2003),Analysis of the petunia MADS-boxtranscription factor family(碧冬茄MADS-框转录因子家族的分析),Mol Gen Genomics268,第598-606页。
John和Keller(1996),Metabolic pathway engineering in cotton:biosynthesis of polyhydroxybutyrate in fiber cell(棉花中的代谢途径工程化:在纤维细胞中生物合成聚羟丁酸酯),Proceeding of the NationalAcademy of Sciences,USA93,12678-12773。
Kim和Triplett,8(2001)Cotton fiber growth in planta and in vitro.Models for plant cell elongation and cell wall biogenesis(在植物中和在体外的棉纤维生长:植物细胞伸长和细胞壁生物生成的模型),PlantPhysiology127,第1361-1366页。
Kofuji,R.等人,(2003),Evolution and divergence of teh MADS-boxgene family base don genome-wide expression analysis(基于基因组表达分析的MADS-框基因家族的进化和趋异性),Mol Biol Evol20,第1963.77页。
Lescot等人,(2002),Plant CARE,a database of plant cis-actingregulatory elements and a portal to tools for in silico analysis ofpromoter sequences(PlantCARE,植物顺式作用调节元件的数据库和算机分析启动子序列的工具端口),Nucleic Acids Res.200230(1):325-327。
Leseberg,C.等人,(2006),Genome-wide analysis of the MADS-boxgene family in Populus trichocarpa(毛果杨(Populus trichocarpa)中MADS-框基因家族的基因组级别的分析),Gene378,第84-94页。
Li等人,(2005),The cotton ACTIN1gene is functionally expressedin fibers and participates in fiber elongation(棉花肌动蛋白基因1在纤维中功能地表达并参与纤维伸长),The Plant Cell17,第859-875页。
Li,C.H.等人,(2002),Isolation of genes preferentially expressedin cotton fibers by cDNA filter array and RT-PCR(通过cDNA过滤芯片和RT-PCR分离棉纤维中优先表达的基因),Plant Science163,第1113-1120页。
Li,X.B.等人,(2002),Molecular characterization of the cottonGhTUB1gene that is preferentially expressed in fiber(在纤维中优先地表达的棉花GhTUB1基因的分子表征),Plant Physiology130,第666-674页。
Lightfoot等人,(2008),Evidence for alternative splicing ofMADS-box transcripts in developing cotton fiber cells(MADS-框转录物在正在发育的棉纤维细胞中可变剪接的证据),Mol Genet Genomics279:75-85。
Liu等人,(2000),Cloning and promoter analysis of the cotton lipidtransfer protein gene Ltp3Cloning and promoter analysis of the cottonlipid transfer protein gene Ltp3(棉花脂质转移蛋白基因Ltp3的克隆和启动子分析),Biochimica et Biophysica Acta1487,第106-111页。
Luo等人,(2007),GhDET2,a steroid5a-reductase,plays animportant role in cotton fiber cell initiation and elongation(GhDET2,一种类固醇5a还原酶,在棉纤维细胞引发和伸长中发挥重要作用),The Plant Journal51,第419-430页。
Medeiros和Tingey,(2006).Glandular trichomes of Solanumberthaultii and its hybrids with Solanum tuberosum affect nymphalemergence,development,and survival of Empoasca fabae(Homoptera:Cicadellidae)(Solanum tuberosum及其杂交体的腺状毛状体影响蚕豆微叶蝉(同翅目:叶蝉科)的若虫出现、发育和存活),Journal of EconomicEntomology99,第1483-1489页。
Nam,J.等人,(2004),Type I MADS-box genes have experiencedfaster birth-and death-evolution than type II MADS-box genes inangiosperms(I型MADS-框基因已经在被子植物中经历比II型MADS-框基因更快的出生和死亡演化),PNAS101,第1919-15页。
Needleman和Wunsch(1970).A general method applicable to thesearch for similarities in the amino acid sequence of two proteins(适用于搜索两种蛋白质的氨基酸序列的相似性的通用方法),J.MoI.Biol.,48,第443-453页。
Parenicová,L.等人,(2003),Molecular and phylogenetic analysesof the complete MADS-box transctiption factor family in Arabidopsis:new openings to the MADS world(拟南芥中完整MADS-框转录因子家族的分子分析和进化系统分析:MADS世界的新序幕),Plant Cell15,第1538-51页。
Pearson和Lipman(1988).Improved tools for biological sequencecomparison(用于生物序列比较的改进工具),Proc.Natl.Acad.Sci85,第2444-48页。
Pei等人,(2008),Improvements of Fiber Yield and Fiber Finenessby Expressing the iaaM Gene in Cotton Seed Coat(通过在棉种衣中表达iaaM基因改善纤维产量和纤维细度),Cotton Science20,Supplement,第44页。
Ranger和Hower,2001.Role of the glandular trichomes inresistance of perennial alfalfa to the potato leafhopper(Homoptera:Cicadellidae)(腺状毛状体在多年生苜蓿对马铃薯叶蝉(同翅目:叶蝉科)抵抗力中的作用),Journal of Economic Entomology94,第950-957页。
Ruan等人,(2003),Suppression of sucrose synthase gene expressionrepresses cotton fiber cell initiation,elongation,and seed development(抑制蔗糖合酶基因表达阻抑棉纤维细胞引发、伸长和种子发育),ThePlant Cell15,第952-964页。
Sambrook,J.F.,Russell,D.W.和Irwin,N.(2000).MolecularCloning:A Laboratory Manual,第3版,第1、2和3卷,Cold SpringHarbor Laboratory Press。
Shangguan等人,(2008),Promoter of a cotton fiber MYB genefunctional in trichomes of Arabidopsis and glandular trichomes oftobacco(在拟南芥毛状体中和烟草腺状毛状体中有功能的棉纤维MYB基因启动子)Journal of Experimental Botany59(13),第3533-3542页。
Siomi,H.和Siomi,M.(2009).On the road to reading theRNA-interference code(通向读懂RNA干扰代码的道路)Nature457,396-404。
Song等人,(2000),Expression of Two Tissue-Specific Promotersin Transgenic Cotton Plants(转基因棉花植物中两种组织特异性启动子的表达),Journal of Cotton Science4,第217-223页。
Szymanski等人,(2000),Progress in the molecular genetic analysisof trichome initiation and morphogenesis in Arabidopsis(拟南芥中毛状体引发和形态发生的分子遗传分析进展),Trends in Plant Science5,第214-219页。
Wagner等人,(2004),New approaches for studying and exploitingan old protuberance,the plant trichome(研究和探索一种老的突起物-植物毛状体的新方法),Annals of Botany93,第3-11页。
Wang,S.等人,(2004),Control of plant trichome development bya cotton fiber MYB gene(通过棉纤维MYB基因控制植物毛状体发育),The Plant Cell16,第2323-2334页。
Waterman,M.S.(1995).Introduction to Computational Biology:Maps,sequences and genomes(计算生物学导论:作图、序列和基因组)。Chapman和Hall.London。
Werker,E.(2000).Trichome diversity and development(毛状体多样性和发育),Advances in Botanical Research31,第1-35页。