植物花药特异表达启动子pTaASG042的鉴定和应用
技术领域
本发明属于植物生物技术领域,具体而言,本发明涉及分离的DNA,其能够指导可操作地连接在其下游的核酸在植物花药中特异转录和/或表达。另外,本发明还涉及包含该DNA的表达盒和植物等,并涉及该DNA的应用。
背景技术
植物基因调控主要是在转录水平上进行的,受多种顺式作用元件和反式作用因子的相互协调。启动子是重要的顺式作用元件,它是位于结构基因5′端上游区域调控基因转录的一段DNA序列,能活化RNA聚合酶,使之与模板DNA准确地结合,确保转录精确而有效地起始,在转录调控中起关键作用。根据其驱动基因表达的不同特点,启动子分为组成型启动子和特异性启动子。组成型启动子能在所有细胞或组织中,不分时间和空间地启动转录;特异性启动子又可分为组织特异性启动子和诱导型启动子,其中诱导型启动子平时不启动转录或转录活性很低,但在某些特定的逆境信号的刺激下,转录活性能够显著地提高。
外源DNA序列通过连接到特定的启动子从而启动在植物宿主中的表达,启动子类型的选择决定基因的表达时间和部位。目前在农业生物技术领域广泛应用的主要是一些组成型的强启动子,比如CaMV 35S启动子和玉米Ubiquitin-1启动子,然而在利用这些启动子诱导目的基因转化水稻等作物以期改良作物的品质时,往往会由于目的基因表达的时间(发育阶段特异性)或空间(组织器官特异性)不能很好地控制而导致改良效果不明显,或者由于这些组成型启动子诱导基因表达量太高而对植物的生长发育造成影响,这些都是目前利用组成型强启动子结合功能基因来改良作物品质时遇到的障碍。
此外,在研究某些代谢过程或调节途径时,常常需要将同一途径上的两个以上的基因转化到同一个株系中去,采用转化其中一个基因得到转基因植株后再转化另外一个基因,或者两个基因分别转化完成后再进行杂交,都需要等待较长的时间,为了提高效率缩短多个基因转化的时间,最近有报道可以利用新的载体同时进行多个基因的转化,但是在多基因转化时如果重复使用同一个启动子,也会由于启动子序列的高同源性可能导致基因沉默。
近年来,通过基因工程调控植物花粉育性、创造植物雄性不育系及其恢复系已在一些作物上获得成功,为作物杂种优势的利用开创了新的前景。目前利用基因工程创造雄性不育的策略主要是利用花粉发育的特异启动子与外源基因嵌合,构建表达载体,转化植物来阻断花粉发育的过程从而达到雄性不育的目的。Mariani等利用烟草花药绒毡层特异启动子TA29与RNase T1或Barnase连接构建成嵌合基因,通过农杆菌介导转入烟草和油菜,获得了稳定的雄性不育的转化株(Mariani C等,Induction of male sterility in plants by a chimaeric ribonucleasegene,Nature,1990,347:737-741)。随后,他们又用TA29驱动Barstar基因,创建了上述雄性不育系的恢复系(Mariani C等,A chimaeric ribonuclease-inhibitorgene restores fertility to male sterile plants,Nature,1992,357:384-387)。此外,其他研究小组利用花药特异启动子启动反义苯基苯乙烯酮合成酶基因、反义肌动蛋白基因、β-1、3-葡聚糖酶基因等在花药中特异表达也分别成功地获得了雄性不育植物(Meer等,Promoter analysis of the chalcone synthase gene of petunia hybrid:a 67bp promoter region directs flower-specific expression,Plant Biol.,1990,15:95-109;李艳红等,将新的任红雄性不育基因导入小麦栽培品种的研究初报,农业生物技术学报,1999,7:255-258;Curtis等,Genomic male sterility in lettuce,a base line for the production of F1hybrid,Plant Sci.,1996,113:113-119)。
植物花粉或花药启动子的驱动活性和特异性决定了通过基因工程手段调控花粉育性、创造植物不育系及恢复系的成败。目前已知的驱动活性高且特异性良好的植物花粉或花药特异启动子还相对较少,而小麦因其基因组较大且结构复杂等原因,在花粉或花药发育分子机制方面的研究更加匮乏,因此,对小麦花粉特异表达启动子的克隆和功能分析对于在小麦中利用基因工程调控花粉育性、创造植物雄性不育系,从而为小麦杂种优势资源在小麦育种中的充分利用打下基础。
发明内容
本发明的目的是提供一种植物花粉发育晚期花药特异表达的启动子序列及克隆并应用该启动子的方法。
本发明取花粉处于减数分裂期、单核期、双核期和三核期的小麦花药,用Trizol(Invitrogen)提取总RNA,并进行DNaseI(Promega)处理,进而纯化mRNA(Ambion)。将纯化的mRNA进行反转录(Invitrogen)、超声打断(Fisher)、制备文库(illumina)并扩增(illumina),最后在illumina机器上进行测序反应。
小麦转录组高通量测序的结果首先通过Trinity软件进行序列拼接,得到的拼接序列进一步去除冗余以及相似性聚类。对于拼接得到的转录本contig的表达变化分析,各样品中高通量测序的序列首先通过TopHat(http://tophat.cbcb.umd.edu/)软件与转录本拼接的结果进行比对。而后Cufflink软件能够计算比对上的转录本contigs的均一化表达量,用“外显子每百万比对片段的千碱基数(fragments per kilobase of exon model per million mapped fragments,FPKM)”表示。
通过对不同发育时期小麦花药的全基因组表达谱分析,找到花粉处于减数分离期的花药中不表达而在花粉处于单核、双核和三核期的花药中表达的转录本contig 7187个。如图1所示,comp177540_c2_seq11(序列如SEQ ID NO:1所示)花粉处于减数分离期的花药中不表达而在花粉处于单核、双核和三核期的花药中表达。将comp177540_c2_seq11所对应的基因命名为TaASG042(Anther SpecificGene 042)。
从comp177540_c2_seq11的序列(如SEQ ID NO:1所示)出发,利用CerealsDB和IWGSC(International Wheat Genome Sequencing Consortium)公布的普通小麦的测序信息,以及2013年Nature上发表的小麦祖先乌拉尔图小麦(Triticum urartu,A基因组供体)和粗山羊草(Aegilops tauschii,D基因组供体)的测序信息进行电子克隆,获得了TaASG042基因的CDS序列,如SEQ ID NO:2所示。设计特异性引物,利用RT-PCR方法,对该基因在小麦根、茎、叶、不同发育时期的花药及除花药以外的其他花器官等多种组织材料中进行表达特异性分析,结果如图2所示,TaASG042基因只在花粉处于单核期、双核期和三核期的花药中特异性表达,在同时期的其他花器官和根、茎、叶和减数分裂期的穗子等组织器官中都不表达,说明TaASG042基因是花药特异表达、且只在花粉发育晚期的花药中特异表达的基因。
本发明还提供了一个花药特异表达的启动子,所述启动子通过以下方法获得:从TaASG042基因的CDS序列出发,利用CerealsDB和IWGSC(InternationalWheat Genome Sequencing Consortium)公布的普通小麦的测序信息,以及2013年Nature上发表的小麦祖先乌拉尔图小麦(Triticum urartu,A基因组供体)和粗山羊草(Aegilops tauschii,D基因组供体)的测序信息进行电子克隆,获得了TaASG042基因的启动子,命名为TaASG027启动子,在本发明中所述启动子也可称为pTaASG042,其长度为2000bp,所述启动子的核苷酸序列如SEQ ID NO:3所示。
利用PlantCARE数据库和PLACE数据库,对TaASG042启动子进行顺式元件分析。如图3所示,翻译起始位点ATG用粗体下划线表示,以翻译起始位点ATG的A定义为“+1”,AGAAA基序用阴影表示,GTGA基序用方框表示,AGGTCA基序用下划曲线表示。TaASG042基因启动子中有2个AGAAA基序、5个GTGA基序和1个AGGTCA基序。AGAAA基序、GTGA基序和AGGTCA基序是与花粉/花药特异表达相关的顺式调控元件,TaASG042基因的启动子中多个AGAAA基序、GTGA基序和AGGTCA基序的存在表明该启动子可能是与花粉/花药特异表达有关的启动子。
为了进一步验证该启动子的功能,将SEQ ID NO:3与报告基因GUS相连,转化植物,在转基因水稻的根、茎和叶等营养器官中都检测不到GUS基因的表达,在花粉处于减数分裂期的穗子和花粉处于单核期、双核期和三核期的除花药以外的其它花器官中也检测不到GUS基因的表达,TaASG042启动子只能启动GUS基因在花粉处于单核期、双核期和三核期的花药中表达,说明本发明所提供的启动子是一个花粉发育晚期花药特异表达的启动子。
本发明所提供的植物花药特异表达启动子,含有序列表中SEQ ID NO:3所示的核苷酸序列,或包含与SEQ ID NO:3所列核苷酸序列具有90%以上相似性的核苷酸序列,或包含来源于SEQ ID NO:3序列上的100个及100以上连续的核苷酸片段,并且可以驱动与该启动子操作性连接的核苷酸序列在植物花药中的表达。含有上述序列的表达载体、转基因细胞系以及宿主菌等均属于本发明的保护范围。扩增本发明所公开的SEQ ID NO:3启动子的任一核苷酸片段的引物对也在本发明的保护范围之内。
本发明所提供的启动子核苷酸序列还可用于从小麦以外的其它植物中分离相应序列,尤其是从其他单子叶植物中进行同源克隆。根据这些相应序列与本文所列启动子序列间的序列同源性,或与本启动子基因的同源性,使用如PCR、杂交等技术来鉴别分离这些相应序列。因此,根据它们与本发明所列的SEQ IDNO:3启动子序列(或其片段)间的序列相似性而分离的相应片段,也包括在实施方案中。
本发明所述的“启动子”是指一种DNA调控区域,其通常包含能指导RNA聚合酶II在特定编码序列的合适转录起始位点起始RNA合成的TATA盒。启动子还可包含其它识别序列,这些识别序列通常位于TATA盒的上游或5’端,通常被称为上游启动子元件,起调控转录效率的作用。本领域技术人员应该知晓,虽然已经鉴定了针对本发明公开的启动子区域的核苷酸序列,但是分离和鉴定处于本发明鉴定的特定启动子区域的TATA盒上游区域的其它调控元件也在本发明的范围内。因此,本文公开的启动子区域通常被进一步界定为包含上游调控元件,例如用于调控编码序列的组织表达性和时间表达功能的那些元件、增强子等。以相同的方式,可以鉴定、分离出使得能在目标组织(例如雄性组织)中进行表达的启动子元件,将其与其它核心启动子一起使用,以验证雄性组织优先的表达。核心启动子指起始转录所需的最小限度的序列,例如被称为TATA盒的序列,这是编码蛋白质的基因的启动子通常都具有的。因此,可选地,本发明所述的SEQ IDNO:3启动子可与其自身的或来自其它来源的核心启动子关联使用。
核心启动子可以是任何一种已知的核心启动子,例如花椰菜花叶病毒35S或19S启动子(美国专利No.5,352,605)、泛素启动子(美国专利No.5,510,474)、IN2核心启动子(美国专利No.5,364,780)或玄参花叶病毒启动子。
所述基因启动子的功能可以通过以下方法进行分析:将启动子序列与报告基因可操作性连接,形成可转化的构建体,再将该构建体转入植株中,在获得转基因后代中,通过观察报告基因在植物各个组织器官中的表达情况来确认其表达特性;或者将上述构建体亚克隆进用于瞬时表达实验的表达载体,通过瞬时表达实验来检测启动子或其调控区的功能
用来测试启动子或调控区域功能的适当表达载体的选择将取决于宿主和将该表达载体引入宿主的方法,这类方法是本领域普通技术人员所熟知的。对于真核生物,在载体中的区域包括控制转录起始和控制加工的区域。这些区域被可操作地连接到报告基因,所述报告基因包括YFP、UidA、GUS基因或荧光素酶。包含位于基因组片段中的推定调控区的表达载体可以被引入完整的组织,例如阶段性花药,或引入愈伤组织,以进行功能验证。
启动子的活性和强度可以根据其驱动的报告基因的mRNA或蛋白质的表达量来测定。报告基因(reporter gene)是一种编码可被检测的蛋白质或酶的基因,也就是说,是一个其表达产物非常容易被鉴定的基因。把它的编码序列和基因表达调节序列相融合形成嵌合基因,或与其它目的基因相融合,在调控序列控制下进行表达,从而利用它的表达产物来确定目的基因的表达调控特性。常用的报告基因有β-葡萄糖苷酸酶基因GUS,和绿色荧光蛋白基因GFP。
本发明通过GUS报告基因来检测启动子的活性和表达特性。根据GUS基因检测所用的底物不同,有三种检测方法:组织化学法、分光光度法和荧光法(灵敏度为分光光度检测法最高),其中最为常用的是组织化学法。组织化学法检测以5-溴-4-氯-3-吲哚-β-葡萄糖苷酸(X-Gluc)作为反应底物。将被检材料用含有底物的缓冲液浸泡,若组织细胞转入了GUS基因,并表达出了GUS酶蛋白,在适宜的条件下,该酶就可将X-Gluc水解生成蓝色产物,这是由其初始产物经氧化二聚作用形成的靛蓝染料,它使各组织细胞中有GUS表达活性的部位或位点呈现蓝色,用肉眼或在显微镜下可看到,且在一定程度下根据染色深浅可反映出GUS活性的强弱。因此利用该方法可观察到外源基因在特定器官、组织,甚至单个细胞内的表达情况。
此外,本发明的启动子可与并非TaASG042基因的核苷酸序列相连,以表达其它异源核苷酸序列。本发明的启动子核苷酸序列及其片段和变体可与异源核苷酸序列一起组装在一个表达盒中,用于在目的植株中表达,更具体地,在该植株的雄性器官中表达。所述表达盒有合适的限制性酶切位点,用于插入所述启动子和异源核苷酸序列。这些表达盒可用于对任何植株进行遗传操作,以获得想要的相应表型。
本发明所公开的TaASG042启动子,可用于驱动下列异源核苷酸序列的表达,以使转化的植株获得雄性不育的表型。所述异源核苷酸序列可编码促使碳水化合物降解的酶或修饰酶、淀粉酶、脱支酶和果胶酶,更具体的如a淀粉酶基因、生长素(auxin),rot B、细胞毒素基因、白喉毒素、DAM甲基化酶、亲和素,或者可选自原核调控系统,还可以是显性的雄性不育基因。
在某些实施方式中,本发明中所提到的可操作地连接在本发明启动子下游的核酸,其中所述的“核酸”可以是操作性连接于本文所公开的启动子之上的结构基因、调节基因、结构基因的反义基因、调节基因的反义基因或者能够干扰内源基因表达的小RNA。
本发明所提供的启动子序列可分离自任何植物,包括但不限于芸苔属、玉米、小麦、高粱、两节荠属、白芥、蓖麻子、芝麻、棉籽、亚麻子、大豆、拟南芥属、菜豆属、花生、苜蓿、燕麦、油菜籽、大麦、燕麦、黑麦(Rye)、粟、蜀黍、小黑麦、单粒小麦、斯佩尔特小麦(Spelt)、双粒小麦、亚麻、格兰马草(Grammagrass)、摩擦禾、假蜀黍、羊茅、多年生麦草、甘蔗、红莓苔子、番木瓜、香蕉、红花、油棕、香瓜、苹果、黄瓜、石斛、剑兰、菊花、百合科、棉花、桉、向日葵、芸苔、甜菜、咖啡、观赏植物和松类等。优选地,植物包括玉米、大豆、红花、芥菜、小麦、大麦、黑麦、稻、棉花和高粱。
本发明还包括含有TaASG042启动子的构建体,所述构建体包括通常所说的载体或表达盒。上述构建体中还可包括其它组分,这主要取决于载体构建的目的和用途,例如可进一步包括选择标记基因、靶向或调控序列、稳定序列或引导序列、内含子等。表达盒还将在目标异源核苷酸序列的3’端包括在植物中具有功能的转录和翻译终止子。终止子可以是本发明所提供基因的终止子,也可以是来自外源的终止子。更具体地,上述终止子可以是胭脂氨酸合酶或章鱼碱合酶终止区域。
在希望将异源核苷酸序列的表达产物引向特定细胞器,例如质体、造粉体,或者引向内质网,或在细胞表面或细胞外分泌的情况下,表达盒还可包含用于编码转运肽的核苷酸序列。此类转运肽是本领域所公知的,其包括但不限于Rubisco的小亚基、植物EPSP合酶、玉米Brittle-1叶绿体转运肽等。
在制备表达盒的过程中,可对多种DNA片段加以操作,以提供处于合适方向,或是处于正确读码框中的DNA序列。为达到此目的,可使用衔接子或接头,将DNA片段连起来,或者进一步包括其它操作,以提供方便的限制性酶切位点等。
进一步地,本发明所提供的构建体中还可包括选择标记基因,用于选择经转化的细胞或组织。所述选择标记基因包括赋予抗生素抗性或对除草剂抗性的基因。合适的选择标记基因包括但不限于:氯霉素抗性基因,潮霉素抗性基因,链霉素抗性基因,奇霉素抗性基因,磺胺类抗性基因,草甘磷抗性基因,草丁嶙抗性基因。所述选择标记基因还可以是红色荧光基因、青色荧光蛋白基因、黄色荧光蛋白基因、荧光素酶基因、绿色荧光蛋白基因、花青甙p1等基因。
本发明所提供的表达盒或载体可被插入质粒、粘粒、酵母人工染色体、细菌人工染色体或其他适合转化进宿主细胞中的任何载体中。优选的宿主细胞是细菌细胞,尤其是用于克隆或储存多核苷酸、或用于转化植物细胞的细菌细胞,例如大肠杆菌、根瘤土壤杆菌和毛根土壤杆菌。当宿主细胞是植物细胞时,表达盒或载体可被插入被转化的植物细胞的基因组中。插入可以是定位的或随机的插入。优选地,插入通过诸如同源重组来实现。另外,表达盒或载体可保持在染色体外。本发明的表达盒或载体可存在于植物细胞的核、叶绿体、线粒体和/或质体中。优选地,本发明的表达盒或载体被插入植物细胞核的染色体DNA中。
本发明还包括所公开的TaASG042启动子的应用,在某些应用的实施方式中,可以应用本发明所提供的TaASG042启动子来实现一些育性相关基因突变所获得的雄性不育系的繁殖和保持,所述育性相关基因包括但不限于Ms26、Ms45、MSCA1等。
本发明的所提供的花药特异表达启动子可用于外源基因在花药中的特异性表达,从而避免该外源基因在植物其他组织中持续表达所带来的不利影响,还可以用于植物花药生长发育相关基因的功能分析和鉴定;可用于雄性不育系和恢复系的创建;并可应用于花粉败育实验中,从而避免由植物转基因漂移或花粉逃逸所带来的生物安全问题,对植物雄性不育系和恢复系的创造具有重要意义。
本发明的转基因植物使用植物生物技术领域技术人员已知的转化方法制备。任何方法可被用于将重组表达载体转化进植物细胞中,以产生本发明的转基因植物。转化方法可包括直接和间接的转化方法。合适的直接方法包括聚乙二醇诱导的DNA摄入、脂质体介导的转化、使用基因枪导入、电穿孔、以及显微注射,等。在本发明的具体实施方式中,本发明使用了基于土壤杆菌的转化技术(可参见Horsch RB等(1985)Science 225:1229;White FF,Vectors forGene Transfer in Higher Plants,Transgenic Plants,第1卷,Engineeringand Utilization,Academic Press,1993,pp.15-38;Jenes B等.Techniques for Gene Transfer,Transgenic Plants,第1卷,Engineering and Utilization,Academic Press,1993,pp.128-143,等)。土壤杆菌菌株(例如根瘤土壤杆菌或毛根土壤杆菌)包含质粒(Ti或Ri质粒)和T-DNA元件,所述质粒和元件在用土壤杆菌转染后被转移至植物,而T-DNA被整合进植物细胞的基因组中。T-DNA可位于Ri-质粒或Ti-质粒上,或独立地包含在所谓的双元载体中。土壤杆菌介导的转化方法描述于例如中。土壤杆菌介导的转化最适合双子叶植物,但是也适合单子叶植物。土壤杆菌对植物的转化描述于例如中。转化可导致瞬时或稳定的转化和表达。尽管本发明的核苷酸序列可被插入落入这些广泛种类中的任何植物和植物细胞中,但是其尤其适用于作物植物细胞。
下面通过具体实施方式,结合附图对本发明做进一步详细描述,但不以任何方式限制本发明的范围。
附图说明
图1是comp177540_c2_seq11在花粉处于减数分裂期(WT-0)、单核期(WT-1)、双核期(WT-2)和三核期(WT-3)的花药中的表达水平分析,横坐标是花粉不同发育时期,纵坐标是FPKM,反应基因的表达水平。
图2是TaASG042基因在小麦不同组织器官和不同发育时期的花药中的RT-PCR分析。1表示根,2表示茎,3表示叶片,4表示花粉处于减数分裂期的穗子,5表示花粉处于单核期的花药,6表示花粉处于双核期的花药,7表示花粉处于三核期的花药,8表示花粉处于单核期的花中除花药以外其它的花器官,9表示花粉处于双核期的花中除花药以外其它的花器官,10表示花粉处于三核期的花中除花药以外其它的花器官。
图3表示TaASG042启动子序列。翻译起始位点ATG用粗体下划线表示,翻译起始位点ATG的A定义为“+1”,AGAAA基序用阴影表示,GTGA基序用方框表示,AGGTCA基序用下划曲线表示。AGAAA、GTGA和AGGTCA表示三个与花粉/花药特异表达启动子相关的保守基序。
图4是表达载体p233的T-DNA区图谱。LB和RB分别为T-DNA的左边界和右边界;NPTII表示新霉素磷酸转移酶II基因;P35S表示CaMV35S基因的启动子;T35S表示CaMV35S基因的终止子;GUS表示β-葡萄糖苷酸酶基因;Tnos表示胭脂碱合成酶(nos)基因的终止子;HindIII、PstI、XbaI、SacI和EcoRI分别表示限制性内切酶的酶切位点;TaASG042启动子就是本发明所分离的小麦花药特异表达的启动子。
图5是p233转基因小麦的组织器官GUS染色。A为根;B茎;C叶;D为花粉处于减数分裂期的花;E为花粉处于单核期的花;F为花粉处于双核期的花;G为花粉处于三核期的花;H为花粉处于单核期的花药;I为单核期的花粉,右上角是DAPI染色的花粉;J为双核期的花粉,右上角是DAPI染色的花粉;K为三核期的花粉,右上角是DAPI染色的花粉。
具体实施方式
下述实施例中所用方法如无特别说明均为常规方法,所用引物均由上海英骏生物技术公司合成,测序由北京三博远志生物技术有限责任公司完成,PCR试剂盒、构建过程中的核酸内切酶购自宝生物工程有限公司,TransStart FastPfuDNA Polymerase、pEASY-T3购自北京全式金生物技术公司,T4DNA连接酶购自NEB公司,方法均参照试剂盒提供的方法进行。
实施例1.不同发育时期小麦花药的全基因组表达谱分析和花粉发育后期花药表达contig的获得
本发明取花粉处于减数分裂期、单核期、双核期和三核期的小麦花药,用Trizol(Invitrogen)提取总RNA,并进行DNaseI(Promega)处理,进而纯化mRNA(Ambion)。将纯化的mRNA进行反转录(Invitrogen)、超声打断(Fisher)、制备文库(illumina)并扩增(illumina),最后在illumina机器上进行测序反应。
小麦转录组高通量测序的结果首先通过Trinity软件进行序列拼接,得到的拼接序列进一步去除冗余以及相似性聚类。对于拼接得到的转录本contig的表达变化分析,各样品中高通量测序的序列首先通过TopHat(http://tophat.cbcb.umd.edu/)软件与转录本拼接的结果进行比对。而后Cufflink软件能够计算比对上的转录本contigs的均一化表达量,用“外显子每百万比对片段的千碱基数(fragments per kilobase of exon model per million mapped fragments,FPKM)”表示。
通过对不同发育时期小麦花药的全基因组表达谱分析,找到花粉处于减数分离期的花药中不表达而在花粉处于单核、双核和三核期的花药中表达的转录本contig 7187个。如图1所示,comp177540_c2_seq11(序列如SEQ ID NO:1所示)花粉处于减数分离期的花药中不表达而在花粉处于单核、双核和三核期的花药中表达。将comp177540_c2_seq11所对应的基因命名为TaASG042(Anther SpecificGene 042)。
实施例2.RT-PCR验证TaASG042基因的组织表达特异性
从comp177540_c2_seq11的序列(如SEQ ID NO:1所示)出发,利用CerealsDB和IWGSC(international wheat genome sequencing consortium)公布的普通小麦的测序信息,以及2013年Nature上发表的小麦祖先乌拉尔图小麦(Triticum urartu,A基因组供体)和粗山羊草(Aegilops tauschii,D基因组供体)的测序信息进行电子克隆,获得了TaASG042基因的CDS序列,如SEQ ID NO:2所示。设计特异性引物,利用RT-PCR方法,对该基因在在小麦根、茎、叶、不同发育时期的花药及除花药以外的其他花器官等多种组织材料中进行表达特异性分析,结果如图2所示,TaASG042基因只在花粉处于单核期、双核期和三核期的花药中特异性表达,在同时期的其他花器官和根、茎、叶和减数分裂期的穗子等组织器官中都不表达,说明TaASG042基因是花药特异表达、且只在花粉发育晚期的花药中特异表达的基因。
TaASG042基因的RT-PCR引物为:
引物1:5'-CGATGATGGTGCAGCAGCCT-3'(SEQ ID NO:4)
引物2:5'-CCTTATCATCGTCGTCGTCCTTG-3'(SEQ ID NO:5)
实施例3.TaASG042启动子序列的获得和顺式元件分析
从TaASG042基因的CDS序列出发,利用CerealsDB和IWGSC(internationalwheat genome sequencing consortium)公布的普通小麦的测序信息,以及2013年Nature上发表的小麦祖先乌拉尔图小麦(Triticum urartu,A基因组供体)和粗山羊草(Aegilops tauschii,D基因组供体)的测序信息进行电子克隆,获得了TaASG042基因的启动子,命名为TaASG042启动子,其长度为2000bp,启动子及部分编码区序列如SEQ ID NO:3所示。
利用PlantCARE数据库和PLACE数据库,对TaASG042启动子进行顺式元件分析。如图3所示,翻译起始位点ATG用粗体下划线表示,以翻译起始位点ATG的A定义为“+1”,AGAAA基序用阴影表示,GTGA基序用方框表示,AGGTCA基序用下划曲线表示。TaASG042基因启动子中有2个AGAAA基序、5个GTGA基序和1个AGGTCA基序。AGAAA基序、GTGA基序和AGGTCA基序是与花粉/花药特异表达相关的顺式调控元件,TaASG042基因的启动子中多个AGAAA基序、GTGA基序和AGGTCA基序的存在表明该启动子可能是与花粉/花药特异表达有关的启动子。
实施例4.TaASG042启动子的克隆和植物表达载体的构建
将植物表达载体pBI121用限制性内切酶HindIII和EcoRI双酶切,得到的35S:GUS片段用T4DNA ligase连入同样用HindIII和EcoRI双酶切的CAMBIA公司的pCAMBIA2300载体,新的载体被命名为p230035S:GUS。
从TaASG042启动子的5’端和ATG上游设计引物:
引物3:5’-ctgcag CGCTCTGTAGTACCCCCGAGGAC-3’(SEQ ID NO:6)
引物4:5’-tctaga GGAAACCATGCTTCTCCGATG-3’(SEQ ID NO:7)
引物3中序列ctgcag是PstI的酶切位点,引物4中序列tctaga是XbaI的酶切位点。
以小麦的基因组DNA为模板,用引物3和引物4进行扩增,反应条件是:94℃预变性5分钟;94℃变性30秒;60℃退火30秒;72℃延伸2分30秒;35个循环;72℃延伸10分钟。反应结束后,PCR产物经1%琼脂糖凝胶电泳检测回收,产物连入pEASY-T3载体中,筛选阳性克隆并进行测序验证,序列如SEQID NO:3所示,该质粒称为p230。
用限制性内切酶PstI和XbaI双酶切p230,得到的TaASG042启动子用T4DNA ligase连入同样用PstI和XbaI双酶切的p230035S:GUS载体,得到植物表达载体p233,该质粒的结构如图4所示。
实施例5.农杆菌介导的水稻遗传转化及转基因植株的分子鉴定
利用热激法将植物表达载体p233转入农杆菌AGL0菌株。
用农杆菌侵染水稻胚性愈伤,暗中共培养2-3天,然后经过两步抗性筛选、预分化、分化和生根培养等步骤,最终获得具有卡那霉素抗性的、转p233水稻T0代植株。
设计引物对转基因水稻植株进行PCR鉴定。
引物5:5’-TTCTGGTAGTGCTGCACGTCTC-3’(SEQ ID NO:8)
引物6:5’-GCCGTCGAGTTTTTTGATTTCAC-3’(SEQ ID NO:9)
反应条件为:94℃预变性5分钟;94℃变性30秒;55℃退火30秒;72℃延伸1分40秒;30个循环;72℃延伸10分钟。扩增的是TaASG042启动子和GUS的部分片段,长度为1400bp。鉴定结果表明,利用农杆菌介导的水稻转化获得的抗性再生植株是转p233基因的阳性植株。
实施例6.转基因水稻植株不同组织器官GUS基因表达的组织化学检测
X-Gluc母液:100mg X-Gluc溶于5ml DMF。
X-Gluc基液:50mM PBS pH7.0,10mM EDTA·2Na,0.1%Triton X-100,5mM铁氢化钾,0.5mM亚铁氢化钾。
X-Gluc使用液:50μl母液+950μl基液。
选择合适大小的带有GUS报告基因的转基因幼苗或特定组织浸入GUS染液中,37℃染色过夜,吸去反应液,乙醇梯度脱色,显微镜观察照相。
对p233转基因水稻植株各组织器官的GUS染色结果如图5,在转基因水稻的根、茎和叶等营养器官中都检测不到GUS基因的表达(图5A-C),在花粉处于减数分裂期的花和花粉处于单核期、双核期和三核期的除花药以外的其它花器官中也检测不到GUS基因的表达,TaASG042启动子只能启动GUS基因在花粉处于单核期、双核期和三核期的花药中表达(图5D-G),说明TaASG042启动子是一个花粉发育晚期花药特异表达的启动子。进一步,花粉处于单核期的花药壁中检测不到GUS的表达(图5H),而单核期、双核期和三核期的花粉中能够检测到GUS的表达(图5I-K),因此,TaASG042启动子是一个小麦花粉发育晚期特异表达的启动子。
SEQUENCE LISTING
<110> 未名兴旺系统作物设计前沿实验室(北京)有限公司
兴旺投资有限公司
河北博农农业技术开发有限公司
<120> 植物花药特异表达启动子pTaASG042的鉴定和应用
<130>
<150> 201410145275.4
<151> 2014-04-12
<160> 9
<170> PatentIn version 3.3
<210> 1
<211> 608
<212> DNA
<213> 小麦(Triticum aestivum L.)
<400> 1
acaccatcga tctccatctc cacacatttc atcggagaag catggtttcc atggcggcgg 60
ccaggatcgc cgtcctcctg gccgtggcag cgctcttcac cgcggcgggg gcagcggatc 120
cccaacccgc aaagggagca cattgctggc ggtgctactc ttcctgcatg cacaagtgcg 180
acggccaccg tgatgccgcc gcccgctctg ccagccgtac tcagcccgca gtccacacaa 240
ccgtcgatga tggtgcagca gcctcctcca tccccgtcaa ctctaccaat ggcactgcag 300
cagtcgtacg ctccaccgat ggcactccag ccaccgatca tgcagtcggc cacatcggtg 360
atgccaacga cgacgataac aaggactacg acaaagatga cgacaaggac gacggcgatg 420
ataaggacga caataaggac gacaaggacg acgacgatga taaggacgac aaggacgatg 480
atgataagga tgatgatgac gacgacgatg atgatgatga tgatgatgat gatgatgatg 540
atgatgatga tgatgatgat gatgatgatg atgatgatga tgatgatgat gatgatgatg 600
atgatgat 608
<210> 2
<211> 1434
<212> DNA
<213> 小麦(Triticum aestivum L.)
<400> 2
atggcggcgg ccaggatcgc cgtcctcctg gccgtggcag cgctcttcac cgcggcgggg 60
gcagcggatc cccaacgcgc aaagggagca cattgctggc ggtgctactc ttcctgcatg 120
cacaagtgcg acggccaccg tgatgccgcc gcccgctctg ccagccgtac tcagcccgca 180
gtccacacaa ccgtcgatga tggtgcagca gcctcctcca tccccgtcaa ctctaccaat 240
ggcactgcag cagtcgtaca ctccaccgat ggcactctag ccactgttga caaaaccgat 300
ccagcagtcg gccacatcgg tgatgccaac gacgacgata acaaggacta cgacaaagat 360
gacgacaagg acgacggcga tgataaggac gacaataagg acgacaagga cgacgacgat 420
gataaggacg acaaggacga tgatgataag gatgatgatg acgacgacga tgatgatgat 480
gatgatgatg atgacgacga cgacgacgac gatgacaacg gcggcagcga ctgggcgaag 540
tacttcaagt gcaagaagaa aagagaggcg gagcgggtga aggtcgccgc ggtgctctgt 600
ctccaatccg ccaaggggtg cggggtgaag gtcgccggcg acgctgcgtt tccgcatcaa 660
caatgtctga gacaagcaaa aaaaagtgac ggtcaggtcg cacaagcaac ccaacagggt 720
gtagatgaaa tagaggtacg cccaccacag caacaaaaca cgccggtaat tgtctacaag 780
tgtatgcgca ctaaagagat catctatcgt gggaagcgcc catcagacat agatagtaat 840
accagtgcac cagatgctga tttagaaggc aaggatatca tgcaagagga ggaatcgaag 900
ccaaaacggc ggaggacagg cgaaaacgag aaactaatgg atggatcaag caaaaagggc 960
attcaagaag atcatcatgc agttaatcgt gatgctgatc cctcgcatgc gattgaatat 1020
catcaagaga gacgcacacc ctttattggg taccagcatc ggggaagaaa ggagattgct 1080
tcccgtggca aacgtccgct agacatcaac aacaatccga gtgtttccac agatggtgat 1140
ggaaatgttg agaaagacac tgctgtggaa caaccaccaa aagcaaaacg tcaaaagacc 1200
ggatctaacg agcttttttt acattcattt ctttcttgct taatcatgac atccttatac 1260
atatcatgcg gaaagagaaa gggaggcttg tgttcttcag taacccaggg gacagggatg 1320
aaagggaggc ttgtgttctt cagtaaccca ggggacaggg atgaaagaag cacacaacca 1380
tgggggaaag tgaaagctaa atctgacctt tttctgtgct tcttctaccc ttag 1434
<210> 3
<211> 2000
<212> DNA
<213> 小麦(Triticum aestivum L.)
<400> 3
cgctctgtag tacccccgag gactcgaacc acaccttctt ctcccgcgtg tctgctcagt 60
ttgtctggag ctgttttaga gaggctgtgg gtggtgattg gtgccacacc aacttccccg 120
acctcttcgc cgaactccag acctcccccc tgcccactcg ccacattagg tggcttgaga 180
ttggtgctct cgcgtggacc ctctggacga ttcgcaataa gcttgtgatt caacgcacta 240
tgcttcgacg ggctactgac gctctcttca aattgtctgg ttacttgcag ctttggcggt 300
cgcttagccg ccctcgagac cgggacgcca tgtccgcctt catcgccgac cttcgatcga 360
tggccgtccg cctgtcgccg ccgcctccac cgcctcctcc agagcctgat tagatgattg 420
gcgtgctccc cggccccggc cccggccgtg cctcttttat gttgtttttt gggcttgttg 480
agctgtgccc tcagcagaac ctttggactt cttgttgtat gtcttgggtg tgtgtgttct 540
gaactagttc atgtatgtat gctctggacg gttgctttat ttataaagcg gggcgaaagt 600
cttttttggt aaacaattcg ctggttgccg attactttct ggattctggg cttctggtag 660
tgctgcacgt ctcgaaccaa gctagcctat ggagtagatt gttggtcatt gaagcacaca 720
ctcatacaca ggaggttgac ctcgtgcatg gcagggctgc atgcagccgg catccgttag 780
cacacgctga ttaatccggt cgtgttgcta ggtgtagctg agttagcact gctgattgat 840
ttggccatgt agtaaagtta tcagtaaaaa agctgcagca aaacaatagc agccaaacac 900
tgcggcggac ttgtcaaaac tgagaaaaac tacgtttttt agaaaccaga gtatttgttg 960
cccacccatc agaatactgt ggttttagaa tactttggtt ttcccgaaac tatactgcca 1020
aactaagcct tattgtgtgg gcaaccgatt gaggaaacta tagatcctat gatattcaaa 1080
tgccaattca gtacagactg ctagttgaag ccgggcattc tttgactaca aacgttttaa 1140
attatgttgt tacgtataga agtaattata agtacatttg aatatatttc atgaaaattt 1200
tagtgatatc aaatcgagtc gttgttggtg tttttttttg gtataatgat gacaaaatgt 1260
aaatatatgg ctaacagaac tctaaatggc gcccaatatc aattagagga actctaaacg 1320
aatcatcgtt tgctaaaaaa tgcaagtcag ccgaacttag gccgcgttcg ttttctctcc 1380
gcccctggaa ctccgctccg ggagcggacc atactttacc tgaatttgat ggagctggca 1440
aaacccaact ccccaactct gcggagcggg gaagttccga atagggcttt agtttataac 1500
aaaaaggttg gccatacaat ggaaaagggt gcgaagtctt gagtggacaa aatggattat 1560
tgcaatacag acgccaaaca caatttaatt atcctgtgga aatttaatag gtcatttctc 1620
tataatcatg tggttaatgc aatcaaaccc cggttgctgg agctaagggg tgaaaggaaa 1680
agagcacagt ttaggggtgg tggagctgtg caaaacgtgt gactgatgcc tagctaggaa 1740
attactgcaa aactaagttg gcggtcgaac aaattaacca aatgcattca tgcgcgacgc 1800
atgagaagct ggggcgagca aattaagcat ggaggtgcgt agttgccgga cgcgtgctgc 1860
atctccaggc agcgcgccaa ctgattcagt ttgtatgtcc ggtgcactcg atctgcccat 1920
atataccacc tttcttctgc aaagccagcc acaccatcga tctccatctc cacacatttc 1980
atcggagaag catggtttcc 2000
<210> 4
<211> 20
<212> DNA
<213> 人工合成
<400> 4
cgatgatggt gcagcagcct 20
<210> 5
<211> 23
<212> DNA
<213> 人工合成
<400> 5
ccttatcatc gtcgtcgtcc ttg 23
<210> 6
<211> 29
<212> DNA
<213> 人工合成
<400> 6
ctgcagcgct ctgtagtacc cccgaggac 29
<210> 7
<211> 27
<212> DNA
<213> 人工合成
<400> 7
tctagaggaa accatgcttc tccgatg 27
<210> 8
<211> 22
<212> DNA
<213> 人工合成
<400> 8
ttctggtagt gctgcacgtc tc 22
<210> 9
<211> 23
<212> DNA
<213> 人工合成
<400> 9
gccgtcgagt tttttgattt cac 23