植物花药特异表达启动子的鉴定和应用
技术领域
本发明属于植物生物技术领域,具体而言,本发明涉及分离的DNA,其能够指导可操作地连接在其下游的核酸在植物花药中特异转录和/或表达。另外,本发明还涉及包含该DNA的表达盒和植物等,并涉及该DNA的应用。
背景技术
植物基因调控主要是在转录水平上进行的,受多种顺式作用元件和反式作用因子的相互协调。启动子是重要的顺式作用元件,它是位于结构基因5′端上游区域调控基因转录的一段DNA序列,能活化RNA聚合酶,使之与模板DNA准确地结合,确保转录精确而有效地起始,在转录调控中起关键作用。根据其驱动基因表达的不同特点,启动子分为组成型启动子和特异性启动子。组成型启动子能在所有细胞或组织中,不分时间和空间地启动转录;特异性启动子又可分为组织特异性启动子和诱导型启动子,其中诱导型启动子平时不启动转录或转录活性很低,但在某些特定的逆境信号的刺激下,转录活性能够显著地提高。
外源DNA序列通过连接到特定的启动子从而启动在植物宿主中的表达,启动子类型的选择决定基因的表达时间和部位。目前在农业生物技术领域广泛应用的主要是一些组成型的强启动子,比如CaMV 35S启动子和玉米Ubiquitin-1启动子,然而在利用这些启动子诱导目的基因转化水稻等作物以期改良作物的品质时,往往会由于目的基因表达的时间(发育阶段特异性)或空间(组织器官特异性)不能很好地控制而导致改良效果不明显,或者由于这些组成型启动子诱导基因表达量太高而对植物的生长发育造成影响,这些都是目前利用组成型强启动子结合功能基因来改良作物品质时遇到的障碍。
此外,在研究某些代谢过程或调节途径时,常常需要将同一途径上的两个以上的基因转化到同一个株系中去,采用转化其中一个基因得到转基因植株后再转化另外一个基因,或者两个基因分别转化完成后再进行杂交,都需要等待较长的时间,为了提高效率缩短多个基因转化的时间,最近有报道可以利用新的载体同时进行多个基因的转化,但是在多基因转化时如果重复使用同一个启动子,也会由于启动子序列的高同源性可能导致基因沉默。
近年来,通过基因工程调控植物花粉育性、创造植物雄性不育系及其恢复系已在一些作物上获得成功,为作物杂种优势的利用开创了新的前景。目前利用基因工程创造雄性不育的策略主要是利用花粉发育的特异启动子与外源基因嵌合,构建表达载体,转化植物来阻断花粉发育的过程从而达到雄性不育的目的。Mariani等利用烟草花药绒毡层特异启动子TA29与RNase T1或Barnase连接构建成嵌合基因,通过农杆菌介导转入烟草和油菜,获得了稳定的雄性不育的转化株(Mariani C等,Induction of male sterility inplants by a chimaeric ribonuclease gene,Nature,1990,347:737-741)。随后,他们又用TA29驱动Barstar基因,创建了上述雄性不育系的恢复系(Mariani C等,A chimaericribonuclease-inhibitor gene restores fertility to male sterile plants,Nature,1992,357:384-387)。此外,其他研究小组利用花药特异启动子启动反义苯基苯乙烯酮合成酶基因、反义肌动蛋白基因、β-1、3-葡聚糖酶基因等在花药中特异表达也分别成功地获得了雄性不育植物(Meer等,Promoter analysis of the chalcone synthase gene ofpetunia hybrid:a 67bp promoter region directs flower-specific expression,Plant Biol.,1990,15:95-109;李艳红等,将新的任红雄性不育基因导入小麦栽培品种的研究初报,农业生物技术学报,1999,7:255-258;Curtis等,Genomic male sterility inlettuce,a base line for the production of F1 hybrid,Plant Sci.,1996,113:113-119)。
植物花粉或花药启动子的驱动活性和特异性决定了通过基因工程手段调控花粉育性、创造植物不育系及恢复系的成败。目前已知的驱动活性高且特异性良好的植物花粉或花药特异启动子还相对较少,而小麦因其基因组较大且结构复杂等原因,在花粉或花药发育分子机制方面的研究更加匮乏,因此,对小麦花粉特异表达启动子的克隆和功能分析对于在小麦中利用基因工程调控花粉育性、创造植物雄性不育系,从而为小麦杂种优势资源在小麦育种中的充分利用打下基础。
发明内容
本发明的目的是提供一种植物花粉发育晚期花药特异表达的启动子序列及克隆并应用该启动子的方法。
本发明取花粉处于减数分裂期、单核期、双核期和三核期的小麦花药,用Trizol(Invitrogen)提取总RNA,并进行DNaseI(Promega)处理,进而纯化mRNA(Ambion)。将纯化的mRNA进行反转录(Invitrogen)、超声打断(Fisher)、制备文库(illumina)并扩增(illumina),最后在illumina机器上进行测序反应。
小麦转录组高通量测序的结果首先通过Trinity软件进行序列拼接,得到的拼接序列进一步去除冗余以及相似性聚类。对于拼接得到的转录本contig的表达变化分析,各样品中高通量测序的序列首先通过TopHat(http://tophat.cbcb.umd.edu/)软件与转录本拼接的结果进行比对。而后Cufflink软件能够计算比对上的转录本contigs的均一化表达量,用“外显子每百万比对片段的千碱基数(fragments per kilobase of exon model permillion mapped fragments,FPKM)”表示。
通过对不同发育时期小麦花药的全基因组表达谱分析,找到花粉处于减数分离期的花药中不表达而在花粉处于单核、双核和三核期的花药中表达的转录本contig 7187个。如图1所示,comp178993_c2_seq1(序列如SEQ ID NO:1所示)花粉处于减数分离期的花药中不表达而在花粉处于单核、双核和三核期的花药中表达。将comp178993_c2_seq1所对应的基因命名为TaASG046(Anther Specific Gene 046)。
由于小麦是由A、B、D三套基因组组成的异源六倍体,基因的平均拷贝数为2.8个,其中接近一半的基因(46%)有3-4个拷贝,12%的基因有1-2个拷贝,42%的基因拷贝数≥5个。从comp178993_c2_seq1的序列(如SEQ ID NO:1所示)出发,利用CerealsDB和IWGSC(International Wheat Genome Sequencing Consortium)公布的普通小麦的测序信息,以及2013年Nature上发表的小麦祖先乌拉尔图小麦(Triticum urartu,A基因组供体)和粗山羊草(Aegilops tauschii,D基因组供体)的测序信息进行电子克隆,获得了3个TaASG046基因,分别命名为TaASG046-1,TaASG046-2和TaASG046-3,其中comp178993_c2_seq1对应于TaASG046-1。3个TaASG046基因的cDNA序列分别如SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4所示,三者之间的同源性约为95%。分别设计针对TaASG046-1,TaASG046-2和TaASG046-3cDNA的特异性引物,利用RT-PCR方法,对这三个基因在在小麦根、茎、叶、不同发育时期的花药及除花药以外的其他花器官等多种组织材料中进行表达特异性分析,结果如图2所示,TaASG046-3基因不表达,TaASG046-1和TaASG046-2两个基因均只在花粉处于单核期、双核期和三核期的花药中特异性表达,在同时期的其他花器官和根、茎、叶和减数分裂期的穗子等组织器官中都不表达,说明TaASG046-1和TaASG046-2两个基因是花药特异表达、且只在花粉发育晚期的花药中特异表达的基因。
本发明还提供了两个花药特异表达的启动子,所述启动子通过以下方法获得:从TaASG046-1和TaASG046-2基因的cDNA序列出发,利用CerealsDB和IWGSC(InternationalWheat Genome Sequencing Consortium)公布的普通小麦的测序信息,以及2013年Nature上发表的小麦祖先乌拉尔图小麦(Triticum urartu,A基因组供体)和粗山羊草(Aegilopstauschii,D基因组供体)的测序信息进行电子克隆,获得了TaASG046-1和TaASG046-2基因的启动子,分别命名为TaASG046-1启动子和TaASG046-2启动子,其长度分别为2210bp和2078bp,其核苷酸序列分别如SEQ ID NO:5和SEQ ID NO:6所示。
利用PlantCARE数据库和PLACE数据库,对TaASG046-1启动子和TaASG046-2启动子进行顺式元件分析。如图3所示,翻译起始位点ATG用粗体下划线表示,以翻译起始位点ATG的A定义为“+1”,AGAAA基序用阴影表示,GTGA基序用方框表示,AGGTCA基序用下划曲线表示。TaASG046-1基因启动子中有7个AGAAA基序和4个GTGA基序,TaASG046-2基因启动子中有8个AGAAA基序、6个GTGA基序和1个AGGTCA基序。AGAAA基序、GTGA基序和AGGTCA基序是与花粉/花药特异表达相关的顺式调控元件,TaASG046-1和TaASG046-2基因的启动子中多个AGAAA基序、GTGA基序和AGGTCA基序的存在表明该启动子可能是与花粉/花药特异表达有关的启动子。
为了进一步验证这两个启动子的功能,将其中一个启动子SEQ ID NO:5与报告基因GUS相连,转化植物,在转基因水稻的根、茎和叶等营养器官中都检测不到GUS基因的表达,在花粉处于减数分裂期的穗子和花粉处于单核期、双核期和三核期的除花药以外的其它花器官中也检测不到GUS基因的表达,TaASG046-1启动子只能启动GUS基因在花粉处于单核期、双核期和三核期的花药中表达,说明本发明所提供的启动子是一个花粉发育晚期花药特异表达的启动子。
本发明所提供的植物花药特异表达启动子,含有序列表中SEQ ID NO:5或6所示的核苷酸序列,或包含与SEQ ID NO:5或6所列核苷酸序列具有90%以上相似性的核苷酸序列,或包含来源于SEQ ID NO:5或6序列上的100个及100以上连续的核苷酸片段,并且可以驱动与该启动子操作性连接的核苷酸序列在植物花药中的表达。含有上述序列的表达载体、转基因细胞系以及宿主菌等均属于本发明的保护范围。扩增本发明所公开的SEQ IDNO:5或6启动子的任一核苷酸片段的引物对也在本发明的保护范围之内。
本发明所提供的启动子核苷酸序列还可用于从小麦以外的其它植物中分离相应序列,尤其是从其他单子叶植物中进行同源克隆。根据这些相应序列与本文所列启动子序列间的序列同源性,或与本启动子基因的同源性,使用如PCR、杂交等技术来鉴别分离这些相应序列。因此,根据它们与本发明所列的SEQ ID NO:5或6启动子序列(或其片段)间的序列相似性而分离的相应片段,也包括在实施方案中。
本发明所述的“启动子”是指一种DNA调控区域,其通常包含能指导RNA聚合酶II在特定编码序列的合适转录起始位点起始RNA合成的TATA盒。启动子还可包含其它识别序列,这些识别序列通常位于TATA盒的上游或5’端,通常被称为上游启动子元件,起调控转录效率的作用。本领域技术人员应该知晓,虽然已经鉴定了针对本发明公开的启动子区域的核苷酸序列,但是分离和鉴定处于本发明鉴定的特定启动子区域的TATA盒上游区域的其它调控元件也在本发明的范围内。因此,本文公开的启动子区域通常被进一步界定为包含上游调控元件,例如用于调控编码序列的组织表达性和时间表达功能的那些元件、增强子等。以相同的方式,可以鉴定、分离出使得能在目标组织(例如雄性组织)中进行表达的启动子元件,将其与其它核心启动子一起使用,以验证雄性组织优先的表达。核心启动子指起始转录所需的最小限度的序列,例如被称为TATA盒的序列,这是编码蛋白质的基因的启动子通常都具有的。因此,可选地,本发明所述的SEQ ID NO:5或6启动子可与其自身的或来自其它来源的核心启动子关联使用。
核心启动子可以是任何一种已知的核心启动子,例如花椰菜花叶病毒35S或19S启动子(美国专利No.5,352,605)、泛素启动子(美国专利No.5,510,474)、IN2核心启动子(美国专利No.5,364,780)或玄参花叶病毒启动子。
所述基因启动子的功能可以通过以下方法进行分析:将启动子序列与报告基因可操作性连接,形成可转化的构建体,再将该构建体转入植株中,在获得转基因后代中,通过观察报告基因在植物各个组织器官中的表达情况来确认其表达特性;或者将上述构建体亚克隆进用于瞬时表达实验的表达载体,通过瞬时表达实验来检测启动子或其调控区的功能
用来测试启动子或调控区域功能的适当表达载体的选择将取决于宿主和将该表达载体引入宿主的方法,这类方法是本领域普通技术人员所熟知的。对于真核生物,在载体中的区域包括控制转录起始和控制加工的区域。这些区域被可操作地连接到报告基因,所述报告基因包括YFP、UidA、GUS基因或荧光素酶。包含位于基因组片段中的推定调控区的表达载体可以被引入完整的组织,例如阶段性花药,或引入愈伤组织,以进行功能验证。
启动子的活性和强度可以根据其驱动的报告基因的mRNA或蛋白质的表达量来测定。报告基因(reporter gene)是一种编码可被检测的蛋白质或酶的基因,也就是说,是一个其表达产物非常容易被鉴定的基因。把它的编码序列和基因表达调节序列相融合形成嵌合基因,或与其它目的基因相融合,在调控序列控制下进行表达,从而利用它的表达产物来确定目的基因的表达调控特性。常用的报告基因有β-葡萄糖苷酸酶基因GUS,和绿色荧光蛋白基因GFP。
本发明通过GUS报告基因来检测启动子的活性和表达特性。根据GUS基因检测所用的底物不同,有三种检测方法:组织化学法、分光光度法和荧光法(灵敏度为分光光度检测法最高),其中最为常用的是组织化学法。组织化学法检测以5-溴-4-氯-3-吲哚-β-葡萄糖苷酸(X-Gluc)作为反应底物。将被检材料用含有底物的缓冲液浸泡,若组织细胞转入了GUS基因,并表达出了GUS酶蛋白,在适宜的条件下,该酶就可将X-Gluc水解生成蓝色产物,这是由其初始产物经氧化二聚作用形成的靛蓝染料,它使各组织细胞中有GUS表达活性的部位或位点呈现蓝色,用肉眼或在显微镜下可看到,且在一定程度下根据染色深浅可反映出GUS活性的强弱。因此利用该方法可观察到外源基因在特定器官、组织,甚至单个细胞内的表达情况。
此外,本发明的启动子可与并非TaASG046-1或TaASG046-2基因的核苷酸序列相连,以表达其它异源核苷酸序列。本发明的启动子核苷酸序列及其片段和变体可与异源核苷酸序列一起组装在一个表达盒中,用于在目的植株中表达,更具体地,在该植株的雄性器官中表达。所述表达盒有合适的限制性酶切位点,用于插入所述启动子和异源核苷酸序列。这些表达盒可用于对任何植株进行遗传操作,以获得想要的相应表型。
本发明所公开的TaASG046-1启动子和TaASG046-2启动子,可用于驱动下列异源核苷酸序列的表达,以使转化的植株获得雄性不育的表型。所述异源核苷酸序列可编码促使碳水化合物降解的酶或修饰酶、淀粉酶、脱支酶和果胶酶,更具体的如a淀粉酶基因、生长素(auxin),rot B、细胞毒素基因、白喉毒素、DAM甲基化酶、亲和素,或者可选自原核调控系统,还可以是显性的雄性不育基因。
在某些实施方式中,本发明中所提到的可操作地连接在本发明启动子下游的核酸,其中所述的“核酸”可以是操作性连接于本文所公开的启动子之上的结构基因、调节基因、结构基因的反义基因、调节基因的反义基因或者能够干扰内源基因表达的小RNA。
本发明所提供的启动子序列可分离自任何植物,包括但不限于芸苔属、玉米、小麦、高粱、两节荠属、白芥、蓖麻子、芝麻、棉籽、亚麻子、大豆、拟南芥属、菜豆属、花生、苜蓿、燕麦、油菜籽、大麦、燕麦、黑麦(Rye)、粟、蜀黍、小黑麦、单粒小麦、斯佩尔特小麦(Spelt)、双粒小麦、亚麻、格兰马草(Gramma grass)、摩擦禾、假蜀黍、羊茅、多年生麦草、甘蔗、红莓苔子、番木瓜、香蕉、红花、油棕、香瓜、苹果、黄瓜、石斛、剑兰、菊花、百合科、棉花、桉、向日葵、芸苔、甜菜、咖啡、观赏植物和松类等。优选地,植物包括玉米、大豆、红花、芥菜、小麦、大麦、黑麦、稻、棉花和高粱。
本发明还包括含有TaASG046-1启动子或TaASG046-2启动子的构建体,所述构建体包括通常所说的载体或表达盒。上述构建体中还可包括其它组分,这主要取决于载体构建的目的和用途,例如可进一步包括选择标记基因、靶向或调控序列、稳定序列或引导序列、内含子等。表达盒还将在目标异源核苷酸序列的3’端包括在植物中具有功能的转录和翻译终止子。终止子可以是本发明所提供基因的终止子,也可以是来自外源的终止子。更具体地,上述终止子可以是胭脂氨酸合酶或章鱼碱合酶终止区域。
在希望将异源核苷酸序列的表达产物引向特定细胞器,例如质体、造粉体,或者引向内质网,或在细胞表面或细胞外分泌的情况下,表达盒还可包含用于编码转运肽的核苷酸序列。此类转运肽是本领域所公知的,其包括但不限于Rubisco的小亚基、植物EPSP合酶、玉米Brittle-1叶绿体转运肽等。
在制备表达盒的过程中,可对多种DNA片段加以操作,以提供处于合适方向,或是处于正确读码框中的DNA序列。为达到此目的,可使用衔接子或接头,将DNA片段连起来,或者进一步包括其它操作,以提供方便的限制性酶切位点等。
进一步地,本发明所提供的构建体中还可包括选择标记基因,用于选择经转化的细胞或组织。所述选择标记基因包括赋予抗生素抗性或对除草剂抗性的基因。合适的选择标记基因包括但不限于:氯霉素抗性基因,潮霉素抗性基因,链霉素抗性基因,奇霉素抗性基因,磺胺类抗性基因,草甘磷抗性基因,草丁嶙抗性基因。所述选择标记基因还可以是红色荧光基因、青色荧光蛋白基因、黄色荧光蛋白基因、荧光素酶基因、绿色荧光蛋白基因、花青甙p1等基因。
本发明所提供的表达盒或载体可被插入质粒、粘粒、酵母人工染色体、细菌人工染色体或其他适合转化进宿主细胞中的任何载体中。优选的宿主细胞是细菌细胞,尤其是用于克隆或储存多核苷酸、或用于转化植物细胞的细菌细胞,例如大肠杆菌、根瘤土壤杆菌和毛根土壤杆菌。当宿主细胞是植物细胞时,表达盒或载体可被插入被转化的植物细胞的基因组中。插入可以是定位的或随机的插入。优选地,插入通过诸如同源重组来实现。另外,表达盒或载体可保持在染色体外。本发明的表达盒或载体可存在于植物细胞的核、叶绿体、线粒体和/或质体中。优选地,本发明的表达盒或载体被插入植物细胞核的染色体DNA中。
本发明还包括所公开的TaASG046-1启动子和/或TaASG046-2启动子的应用,在某些应用的实施方式中,可以应用本发明所提供的TaASG046-1启动子和/或TaASG046-2启动子来实现一些育性相关基因突变所获得的雄性不育系的繁殖和保持,所述育性相关基因包括但不限于Ms26、Ms45、MSCA1等。
本发明的所提供的花药特异表达启动子可用于外源基因在花药中的特异性表达,从而避免该外源基因在植物其他组织中持续表达所带来的不利影响,还可以用于植物花药生长发育相关基因的功能分析和鉴定;可用于雄性不育系和恢复系的创建;并可应用于花粉败育实验中,从而避免由植物转基因漂移或花粉逃逸所带来的生物安全问题,对植物雄性不育系和恢复系的创造具有重要意义。
本发明的转基因植物使用植物生物技术领域技术人员已知的转化方法制备。任何方法可被用于将重组表达载体转化进植物细胞中,以产生本发明的转基因植物。转化方法可包括直接和间接的转化方法。合适的直接方法包括聚乙二醇诱导的DNA摄入、脂质体介导的转化、使用基因枪导入、电穿孔、以及显微注射,等。在本发明的具体实施方式中,本发明使用了基于土壤杆菌的转化技术(可参见Horsch RB等(1985)Science 225:1229;WhiteFF,Vectors for Gene Transfer in Higher Plants,Transgenic Plants,第1卷,Engineering and Utilization,Academic Press,1993,pp.15-38;Jenes B等.Techniquesfor Gene Transfer,Transgenic Plants,第1卷,Engineering and Utilization,Academic Press,1993,pp.128-143,等)。土壤杆菌菌株(例如根瘤土壤杆菌或毛根土壤杆菌)包含质粒(Ti或Ri质粒)和T-DNA元件,所述质粒和元件在用土壤杆菌转染后被转移至植物,而T-DNA被整合进植物细胞的基因组中。T-DNA可位于Ri-质粒或Ti-质粒上,或独立地包含在所谓的双元载体中。土壤杆菌介导的转化方法描述于例如中。土壤杆菌介导的转化最适合双子叶植物,但是也适合单子叶植物。土壤杆菌对植物的转化描述于例如中。转化可导致瞬时或稳定的转化和表达。尽管本发明的核苷酸序列可被插入落入这些广泛种类中的任何植物和植物细胞中,但是其尤其适用于作物植物细胞。
下面通过具体实施方式,结合附图对本发明做进一步详细描述,但不以任何方式限制本发明的范围。
附图说明
图1是comp178993_c2_seq1在花粉处于减数分裂期(WT-0)、单核期(WT-1)、双核期(WT-2)和三核期(WT-3)的花药中的表达水平分析,横坐标是花粉不同发育时期,纵坐标是FPKM,反应基因的表达水平。
图2是TaASG046的3个同源基因在小麦不同组织器官和不同发育时期的花药中的RT-PCR分析。1表示根,2表示茎,3表示叶片,4表示花粉处于减数分裂期的穗子,5表示花粉处于单核期的花药,6表示花粉处于双核期的花药,7表示花粉处于三核期的花药,8表示花粉处于单核期的花中除花药以外其它的花器官,9表示花粉处于双核期的花中除花药以外其它的花器官,10表示花粉处于三核期的花中除花药以外其它的花器官。
图3表示TaASG046-1启动子序列(A)和TaASG046-2启动子序列(B)。翻译起始位点ATG用粗体下划线表示,翻译起始位点ATG的A定义为“+1”,AGAAA基序用阴影表示,GTGA基序用方框表示,AGGTCA基序用下划曲线表示。AGAAA、GTGA和AGGTCA表示三个与花粉/花药特异表达启动子相关的保守基序。
图4是表达载体p234的T-DNA区图谱。LB和RB分别为T-DNA的左边界和右边界;NPTII表示新霉素磷酸转移酶II基因;P35S表示CaMV35S基因的启动子;T35S表示CaMV35S基因的终止子;GUS表示β-葡萄糖苷酸酶基因;Tnos表示胭脂碱合成酶(nos)基因的终止子;HindIII、PstI、XbaI、BamHI、SacI和EcoRI分别表示限制性内切酶的酶切位点;TaASG046-1启动子就是本发明所分离的小麦花药特异表达的启动子。
图5是p234转基因小麦的组织器官GUS染色。A为根;B叶;C茎;D为花粉处于减数分裂期的花;E为花粉处于单核期的花;F为花粉处于双核期的花;G为花粉处于三核期的花;H为花粉处于双核期的花药;I为双核期的花粉,右上角是DAPI染色的花粉。
具体实施方式
下述实施例中所用方法如无特别说明均为常规方法,所用引物均由上海英骏生物技术公司合成,测序由北京三博远志生物技术有限责任公司完成,PCR试剂盒、载体构建过程中的核酸内切酶购自宝生物工程有限公司,pEASY-T1-simple连接试剂盒和TransStartFastPfu DNA Polymerase购自北京全式金生物技术公司,T4DNA连接酶购自NEB公司,方法均参照试剂盒提供的方法进行。
实施例1.不同发育时期小麦花药的全基因组表达谱分析和花粉发育后期花药表达contig的获得
取花粉处于减数分裂期、单核期、双核期和三核期的小麦花药,用Trizol(Invitrogen)提取总RNA,并进行DNaseI(Promega)处理,进而纯化mRNA(Ambion)。将纯化的mRNA进行反转录(Invitrogen)、超声打断(Fisher)、制备文库(illumina)并扩增(illumina),最后在illumina机器上进行测序反应。
小麦转录组高通量测序的结果首先通过Trinity软件进行序列拼接,得到的拼接序列进一步去除冗余以及相似性聚类。对于拼接得到的转录本contig的表达变化分析,各样品中高通量测序的序列首先通过TopHat(http://tophat.cbcb.umd.edu/)软件与转录本拼接的结果进行比对。而后Cufflink软件能够计算比对上的转录本contigs的均一化表达量,用“外显子每百万比对片段的千碱基数(fragments per kilobase of exon model permillion mapped fragments,FPKM)”表示。
通过对不同发育时期小麦花药的全基因组表达谱分析,找到花粉处于减数分离期的花药中不表达而在花粉处于单核、双核和三核期的花药中表达的转录本contig 7187个。如图1所示,comp178993_c2_seq1(序列如SEQ ID NO:1所示)花粉处于减数分离期的花药中不表达而在花粉处于单核、双核和三核期的花药中表达。将comp178993_c2_seq1所对应的基因命名为TaASG046(Anther Specific Gene 046)。
实施例2.RT-PCR验证TaASG046基因的组织表达特异性
小麦是由A、B、D三套基因组组成的异源六倍体,基因的平均拷贝数为2.8个,其中接近一半的基因(46%)有3-4个拷贝,12%的基因有1-2个拷贝,42%的基因拷贝数≥5个。从comp178993_c2_seq1的序列(如SEQ ID NO:1所示)出发,利用CerealsDB和IWGSC(International Wheat Genome Sequencing Consortium)公布的普通小麦的测序信息,以及2013年Nature上发表的小麦祖先乌拉尔图小麦(Triticum urartu,A基因组供体)和粗山羊草(Aegilops tauschii,D基因组供体)的测序信息进行电子克隆,获得了3个TaASG046基因,分别命名为TaASG046-1,TaASG046-2和TaASG046-3,其中comp178993_c2_seq1对应于TaASG046-1。3个TaASG046基因的cDNA序列分别如SEQ ID NO:2,SEQID NO:3和SEQ ID NO:4所示,三者之间的同源性约为95%。分别设计针对TaASG046-1,TaASG046-2和TaASG046-3cDNA的特异性引物,利用RT-PCR方法,对这三个基因在在小麦根、茎、叶、不同发育时期的花药及除花药以外的其他花器官等多种组织材料中进行表达特异性分析,结果如图2所示,TaASG046-3基因不表达,TaASG046-1和TaASG046-2两个基因均只在花粉处于单核期、双核期和三核期的花药中特异性表达,在同时期的其他花器官和根、茎、叶和减数分裂期的穗子等组织器官中都不表达,说明TaASG046-1和TaASG046-2两个基因是花药特异表达、且只在花粉发育晚期的花药中特异表达的基因。
TaASG046-1基因的RT-PCR引物为:
引物1:5'-CGGCGACCAGTCGTAGTAGG-3'(SEQ ID NO:7)
引物2:5'-ATCTTTCTCCTCGCCCACGT-3'(SEQ ID NO:8)
TaASG046-2基因的RT-PCR引物为:
引物3:5'-CCGGCGACCAGTCGTAGTA-3'(SEQ ID NO:9)
引物4:5'-GTCCACTTCCTCCATCCCAT-3'(SEQ ID NO:10)
TaASG046-3基因的RT-PCR引物为:
引物5:5'-GCCTTGGCGGGCTTCTTGT-3'(SEQ ID NO:11)
引物6:5'-TAAATATGGACCATTCCGCATCC-3'(SEQ ID NO:12)
实施例3.TaASG046-1和TaASG046-2基因启动子序列的获得和顺式元件分析
从TaASG046-1和TaASG046-2基因的cDNA序列出发,利用CerealsDB和IWGSC(International Wheat Genome Sequencing Consortium)公布的普通小麦的测序信息,以及2013年Nature上发表的小麦祖先乌拉尔图小麦(Triticum urartu,A基因组供体)和粗山羊草(Aegilops tauschii,D基因组供体)的测序信息进行电子克隆,获得了TaASG046-1和TaASG046-2基因的启动子,长度分别为2210bp和2078bp,序列分别如SEQ ID NO:5和SEQ IDNO:6所示。
利用PlantCARE数据库和PLACE数据库,对TaASG046-1和TaASG046-2基因的启动子进行顺式元件分析。如图3所示,翻译起始位点ATG用粗体下划线表示,以翻译起始位点ATG的A定义为“+1”,AGAAA基序用阴影表示,GTGA基序用方框表示,AGAAA基序用下划曲线表示。TaASG046-1基因启动子中有7个AGAAA基序和4个GTGA基序,TaASG046-2基因启动子中有8个AGAAA基序、6个GTGA基序和1个AGGTCA基序。AGAAA基序、GTGA基序和AGGTCA基序是与花粉/花药特异表达相关的顺式调控元件,TaASG046-1和TaASG046-2基因的启动子中多个AGAAA基序、GTGA基序和AGGTCA基序的存在表明该启动子可能是与花粉/花药特异表达有关的启动子。
实施例4.TaASG046-1启动子的克隆和植物表达载体的构建
将植物表达载体pBI121用限制性内切酶HindIII和EcoRI双酶切,得到的35S:GUS片段用T4DNA ligase连入同样用HindIII和EcoRI双酶切的CAMBIA公司的pCAMBIA2300载体,新的载体被命名为p230035S:GUS。
从TaASG046-1启动子的5’端和ATG上游设计引物:
引物7:5’-ctgcag TATGGATCTGTTAGGTGCTGCG-3’(SEQ ID NO:13)
引物8:5’-tctaga GGTTGTCAAGATGAGATTGTACTACGTG-3’(SEQ ID NO:14)
引物7中序列ctgcag是PstI的酶切位点,引物8中序列tctaga是XbaI的酶切位点。
以小麦的基因组DNA为模板,用引物7和引物8进行扩增,反应条件是:94℃预变性5分钟;94℃变性30秒;60℃退火30秒;72℃延伸2分30秒;35个循环;72℃延伸10分钟。反应结束后,PCR产物经1%琼脂糖凝胶电泳检测回收,产物连入pEASY-T1-simple载体中,筛选阳性克隆并进行测序验证,序列如SEQ ID NO:5所示,该质粒称为p229。
用限制性内切酶PstI和XbaI双酶切p229,得到的TaASG046-1启动子用T4DNAligase连入同样用PstI和XbaI双酶切的p230035S:GUS载体,得到植物表达载体p234,该质粒的结构如图4所示。
实施例5.农杆菌介导的水稻遗传转化及转基因植株的分子鉴定
利用热激法将植物表达载体p234转入农杆菌AGL0菌株。
用农杆菌侵染水稻胚性愈伤,暗中共培养2-3天,然后经过两步抗性筛选、预分化、分化和生根培养等步骤,最终获得具有卡那霉素抗性的、转p234水稻T0代植株。
设计引物对转基因水稻植株进行PCR鉴定。
引物9:5’-CGGTATGAATATTGCAAAGCCAG-3’(SEQ ID NO:15)
引物10:5’-GCCGTCGAGTTTTTTGATTTCAC-3’(SEQ ID NO:16)
反应条件为:94℃预变性5分钟;94℃变性30秒;55℃退火30秒;72℃延伸1分40秒;30个循环;72℃延伸10分钟。扩增的是TaASG046-1启动子和GUS的部分片段,长度为1590bp。鉴定结果表明,利用农杆菌介导的水稻转化获得的抗性再生植株是转p234基因的阳性植株。
实施例6.转基因水稻植株不同组织器官GUS基因表达的组织化学检测
X-Gluc母液:100mg X-Gluc溶于5ml DMF。
X-Gluc基液:50mM PBS pH7.0,10mM EDTA·2Na,0.1%Triton X-100,5mM铁氢化钾,0.5mM亚铁氢化钾。
X-Gluc使用液:50μl母液+950μl基液。
选择合适大小的带有GUS报告基因的转基因幼苗或特定组织浸入GUS染液中,37℃染色过夜,吸去反应液,乙醇梯度脱色,显微镜观察照相。
对p234转基因水稻植株各组织器官的GUS染色结果如图5,在转基因水稻的根、茎和叶等营养器官中都检测不到GUS基因的表达(图5A-C),在花粉处于减数分裂期、单核期和三核期的花以及花粉处于双核期的除花药以外的其它花器官中也检测不到GUS基因的表达,TaASG046-1启动子只能启动GUS基因在花粉处于双核期的花药中表达(图5D-G),说明TaASG046-1启动子是一个花粉发育晚期花药特异表达的启动子。进一步,花粉处于双核期的花药壁中检测不到GUS的表达(图5H),而双核期的花粉中能够检测到GUS的表达(图5H,5I),因此,TaASG046启动子是一个小麦花粉发育晚期特异表达的启动子。
SEQUENCE LISTING
<110> 未名兴旺系统作物设计前沿实验室(北京)有限公司
兴旺投资有限公司
<120> 植物花药特异表达启动子的鉴定和应用
<130>
<150> 201410133515.9
<151> 2014-04-03
<160> 16
<170> PatentIn version 3.3
<210> 1
<211> 509
<212> DNA
<213> 小麦(Triticum aestivum L.)
<400> 1
agcgattatc tatctaaccc gcagctataa atatgcacca tccgcatcca cttcctccat 60
cccattcaca tcgatctttc tcctcgccca cgtagtacaa tctcatcttg acaaccatgg 120
tgcagcgcac ttccaacgcc gaggtcatgt cgatggacct gtcgcccaag aagcccgcca 180
aggcctacgg cagcgacggc ggcgcctact acgactggtc gccggccgac ctgcccatgc 240
tcggcgcggc ctccatcggc gccgccaagc tgcacctctc cgccggcggc ctcgcgctcc 300
ccagctactc cgactcggcc aagatcgcct acgtgctcca gggcgccggc gcctgcggcc 360
tcgtcctccc cgaggcggcc agcgagaagg tgatccccgt caaggagggc gacaccctgg 420
cgctcccctt cggcgccgtc acctggtggc acaacgctga gggcgcctcc gcggagatgg 480
tcgtgctctt cctcggtgac acctccaag 509
<210> 2
<211> 1223
<212> DNA
<213> 小麦(Triticum aestivum L.)
<400> 2
agcgattatc tatctaaccc gcagctataa atatgcacca tccgcatcca cttcctccat 60
cccattcaca tcgatctttc tcctcgccca cgtagtacaa tctcatcttg acaaccatgg 120
tgcagcgcac ttccaacgcc gaggtcatgt cgatggacct gtcgcccaag aagcccgcca 180
aggcctacgg cagcgacggc ggcgcctact acgactggtc gccggccgac ctgcccatgc 240
tcggcgcggc ctccatcggc gccgccaagc tgcacctctc cgccggcggc ctcgcgctcc 300
ccagctactc cgactcggcc aagatcgcct acgtgctcca gggcgccggc gcctgcggcc 360
tcgtcctccc cgaggcggcc agcgagaagg tgatccccgt caaggagggc gacaccctgg 420
cgctcccctt cggcgccgtc acctggtggc acaacgccga gggcgcctcc gcggagctgg 480
tggtgctctt cctcggcgac acctccaagg gccacactcc cggccgcttc accaacttcc 540
agctcaccgg cgccaccggc atcttcacgg gcttctccac cgagttcgtc gcgcgcgcct 600
gggacctcga ccaggacgcc gccgccaaga tcgtctccac ccagcctggc tccggcatcg 660
tcaagatcgc cgcggggcac cggatgccgg agcctcgcgc cgaggaccgc cagggcgtcg 720
tgctcaactg cctcgaggcg ccgctggacg tggacatccc gggcggcggc cgcgtggtgg 780
tgctcaacac ggccaacctg ccgccggtga aggatgttgg gctgggctct gacctggtta 840
ggatcgatgg taagtccatg tgctcgccgg gattctcctg cgactcggcc taccaggtca 900
cctacatagt gcgcggcggc ggccgcgtcc aggtcgtcgg gatcgatggc acccgtgtgc 960
tggagacccg cgccgaggcg ggctgcctct tcatcgtgcc caggttcttc gtcgtctcca 1020
agatcgccga cgacaccggc atggagtggt tctccatcat caccacgcca aacccgatct 1080
ttagccactt ggctggtagg acgtcggtgt ggaaggcgat atcgccggat gtgctagaga 1140
cggccttcaa caccacgcca gagatggaaa agatgttccg ctccaagagg cttgactccg 1200
agatcttctt tgctcccaac tag 1223
<210> 3
<211> 1237
<212> DNA
<213> 小麦(Triticum aestivum L.)
<400> 3
tctaacaact attcattatc tatcttctaa cccgcagcta taaatatgga ccattcggcg 60
tccacttcct ccatcccatc catatcgatc ttcctcctcc tctcccacgt acaatctcat 120
cttgaaaacg atggtgcagc gcacttccaa cgccgaggtc atgtccatgg acctgtcgcc 180
caagaagccc gccaaggcct acgccagcga cggcggcgcc tactacgact ggtcgccggc 240
cgacctgccc atgctcggcg cggcctccat tggcgccgcc aagctgcacc tctccgccgg 300
cggcctcgcg ctccccagct actccgactc ggccaagatc gcctacgtgc tccagggcgc 360
cggcgcctgc ggcctcgtcc tccccgaggc ggccaaggaa aaggtgatcc ccgtcaagga 420
gggcgacacc ctggcgctcc ccttcggcgc cgtcacctgg tggcacaacg ccgagggcgc 480
ctccgcggag ctggtcgtgc tcttcctcgg cgacacctcc acgggccacg tccccggccg 540
cttcaccaac ttccagctca ccggcgccgc cggcatcttc acgggcttct ccaccgagtt 600
cgtcgcgcgc gcctgggacc tcgaccacga cgccgccgcc aagatcgtct ccacccagcc 660
tggctcaggc atcgtcaaga tcgccgcggg gcaccggatg ccggagcctc gcgcagagga 720
ccgccagggc gtggtgctca actgcctcga ggcgccgctc gacgtggaca tcccgggcgg 780
cggccgcgtc gtggtgctca acacggccaa cctgccgccg gtgaaggacg ttggtctggg 840
ctctgacctg gtgaggatcg acggcaagtc catgtgctcg ccgggattct cctgcgactc 900
cgcctaccag gtcacctaca tagtgcgcgg cggcggccgc gtccaggtcg ttggcatcga 960
cggcacccgt gtgctggaga cccgcgccga ggcgggctgc ctcttcatcg tgcccaggtt 1020
cttcgtcgtc tccaagatcg ccgacgacac cggcatggag tggttctcca tcatcaccac 1080
cccaaacccg atctttagcc acttggctgg taggacgtca gtttgtaagg cgatatcgcc 1140
ggaggtgcta gagacggcct tcaacaccac tccagagatg gaaaagatgt tccgctccaa 1200
gaggcttgac tctgagatct tctttgctcc caactag 1237
<210> 4
<211> 1267
<212> DNA
<213> 小麦(Triticum aestivum L.)
<400> 4
aggatcgatc gatcagttat ctctaacaac taggattcat tatctatctt ctaaacccgc 60
aactataaat atggaccatt ccgcatccac ttcctccatc ccattcaaat cgatcttcct 120
cctcctctcc cacgtacaat ctcatcttga caacgaaacg atggtgcagc gcacttccaa 180
cgccgaggtc atgtccatgg acctgtcgca caagaagccc gccaaggcct acggcagcga 240
cggcggcgcc tactacgact ggtcgccggc cgacctgccc atgctcggca ccgcctccat 300
cggcgcagcc aagctgcacc tctccgccgg cggcctcgcg ctccccagct actccgactc 360
ggccaagatc gcctacgtgc tccagggcgc cggcgcctgc ggcctcgtcc tccccgaggc 420
ggccagcgag aaggtgatcc ccgtcaagga gggcgacacc ctggcgctcc ccttcggcgc 480
cgtcacctgg tggcacaacg ccgagggcgc ctccgcggag ctggtggtgc tcttcctcgg 540
cgacacctcc aagggccaca ctcccggccg cttcaccaac ttccagctca ccggcgccac 600
cggcatcttc acgggcttct ccaccgagtt cgtcgcgcgc gcctgggacc tcgaccagga 660
cgccgccgcc aagatcgtct ccacccagcc tggctccagc atcgtcaaga tcgccgcggg 720
gcaccggatg ccggagcctc gcgccgagga ccgccagagc gtggtgctca actgcctcga 780
ggcgccgctc gacgtggaca tcccgggcgg cggccgcgtg gtggtgctca acacggccaa 840
cctgccaccg gtgaaggacg ttgggctggg ctctgacctc gtgaggatcg acggtcgctc 900
catgtgctcg ccgggattct cttgcgactc ggcctaccag gtcacctaca tagtgcgagg 960
cggcggccgc gtccaggtcg tcggcatcga cggcacccgt gtgctggaga cccgcgccga 1020
ggcgggctgc ctcttcatcg tgcccaggtt cttcgtcgtc tccaagatcg ccgacgacac 1080
cggcatggag tggttctcca tcatcaccac gccaaacccg atctttagcc acttggctgg 1140
taggacgtcg gtgtggaagg cgatatcgcc cgaggtgcta gagacggcct tcaacaccac 1200
gccagagatg gaaaagatgt tccgctccaa gaggctcgac tctgagatct tcttcgctcc 1260
caactag 1267
<210> 5
<211> 2210
<212> DNA
<213> 小麦(Triticum aestivum L.)
<400> 5
tatggatctg ttaggtgctg cgggaactac tcacacatca tcatggaagc agcaaggttg 60
atgaagattt cctttccaat ggtttacccc tccccccccc ctcccgatct ggtggagtac 120
cagaaaatgc ctcctgatgg gattgcttcg gaacagaggc ttgcagcggg aaaataattg 180
tttcgggtct catttcgggg gtttcagaat atacaggaat ttataggcca agaattatgg 240
caaacggagt cacgaggagc ccacaagcca gggtggcgcg ccctatcccc cagggcacgc 300
cgctgccttg tggccacctc gtgggtcttc tggtcctctc ccgaaatttt cagggtccct 360
ttttgtcaac aaaaaagtca aacatttcgt cgtgtttgga cttttgtagg tatggacttc 420
ctgaaaaaaa catgcagaaa acaggaactg gcactgcgca ctaaggttag tccataaaaa 480
taatataaaa tgacatataa agcatacaaa agtgataatg taatagcatg aaacaatcaa 540
aaattataac gttggagacg tatcagcatc cctaagctta attcatgctc gtccttgagt 600
aggtaaataa taaaagtaga atttttgatg tgaaatgcta tccaacatgt tattaatcat 660
gtaatcattt gcggtatgaa tattgcaaag ccagtggttt aaggcattag tctattagtt 720
tgatatcaaa acgataatat gcaagaatgc tagaaaacaa tcactgcctt tcaaaataga 780
aaatgctacc taaacactta attgtgtaag catggcatag ctcggtcttc ttgacataaa 840
gtatctatca tgaacacccc ggcgccaaac caagctcttt tttacttttt tttttaaatt 900
ttactgctga tcatgaagca tttcagctcg gagcagatac tccgcgtccc ttagttatac 960
aatagtgctc ctagattaga gctaaaccat gctaaaacta ctgatcatcg aatgagaggt 1020
tgatgaatgc tgccttgcgg agcccggcgc ctcatggtcg tgggttgcct tcgaatccac 1080
gggtgttcaa aacattgcag tagtgttttt ggctcatcaa tgatgttttt tattgagatg 1140
ttttgtactt ctgatgaact tttatattat aaaagttcat cagaaataca aaacatctca 1200
accataataa taaaaattac cgagatttcg agtccaccga acaagcacta ttgccgccaa 1260
aatgggccgc cgacgcacca ctgtcgccac acccctaccg gagccgtctt tgactttctg 1320
ggtgaaaact tggaaatctt cgtgcacatg cccctaagga ccagcgccct ggagccgcag 1380
tggtcttctt tagacttttg catagatctg aagtagctga caccaaatct cgccacacga 1440
cgagaaatcc taacctcacc gcccaaagga gatggcatga atctatgccg gagctccatc 1500
gactatgccc aaatggaaga acggagttgc atcgactgtg tccaaactaa cgaactcaat 1560
gaggatcaaa gcccagaaga caaactcaaa gaagaagcat ttgtacccgc gaggactaaa 1620
aaaactctaa cctaaactac taaccggggc agaggcgcgg gattctcctc cccgtcaccg 1680
accaccagag ccgcatgcag aggggaggcg ggcccacaga ctctccggtg aagtctggag 1740
gggaaatttt gccctagccg tgttagcgtc tttagagttt tttcccctac gttttttctt 1800
gagctactct tttatggtgc gcctgaattt ctcttttctc gtttttcgta ctaaattaat 1860
gaattgactt tcagtggtgc aacgtgcatg ctcaggcaca ttaatgccac cggccgatcg 1920
tttgtcaaaa aataaaataa aagaagaatg ccacgggccg atctgcaaaa tgaaaacaaa 1980
agtagataat tcgtccatcg tccgtatgat ccgttcctgc atgcttgcat atccaacccg 2040
caagaaactc atcgttatcc atcaggatcg atcgatcagt tagctctaac aactagcgat 2100
tatctatcta acccgcagct ataaatatgc accatccgca tccacttcct ccatcccatt 2160
cacatcgatc tttctcctcg cccacgtagt acaatctcat cttgacaacc 2210
<210> 6
<211> 2078
<212> DNA
<213> 小麦(Triticum aestivum L.)
<400> 6
ggaactggcg ttgcactcta aatttatagg ttagtccatc aaaataatat aaaatggcat 60
atggagcatg caacaaaagt gataatataa tagcatgaaa taatcaaaaa gtatagatac 120
attggagatg tatcagcatc cccacgctaa ttcatgctcg tcctcgagta tttaaatgat 180
aaaaacaaat tatttgatgt gaaatgttac ctaatatgtt cttaattatg taatcatttg 240
tgatatgtat atagggaagc gactgatcca aggcactagt ctattagttt gatatcaaaa 300
tgataatatt caagaatgct agaaaacaat cactgccttt gaaaaataga aaatgctaaa 360
gaacattatg cctaaacact taatcttgta agcatggcat agatcggtct tcctaacata 420
aagtatcaat catgaacatc ctggtgccaa accaagcttt tttttacttt attttatttt 480
actgctcatc atagagcatt tcagctcgga gcagatactc cacatccctt agtcatacaa 540
tactgctcct agattagagc taaatcatgc taaaactact cctcatcgaa tgagaggctg 600
atgaatgctg ccttaccgga gcctgatgcc tcatggtcgt gggttaccct tcgaatccac 660
gggtgtttaa aacactgtga tggtgttttt ggctattgag tgatggcttg gtgtatagtt 720
gtaaggtcaa caaattcctc atctttccag gggaggacac atcgaaagag aggataagta 780
ggaccacaat gcagcatgta ggagcgtttg attgttggat cacagagaaa accaatggta 840
accattggat catacagaaa atcaatggtc ttttttcagg gaacaaaatc aatggccagt 900
gaatctttta tttctgtttg ttgccgaaag aatcagatct attataaaag ttcatcggag 960
gtagaaaaca tgacaaccat aataaaaaat tatcgagatt ccgacaccac aaaacgacaa 1020
gaattaccgc caaaatgagc caccgacgca tcactgtctc cactcccata ccggagccgg 1080
ctttcaattt taaatgaaaa ctgggaaacc ttcatgcaca tgcccctatg aaccagcgcc 1140
ctggagcccc atagatctga agtagctggc gccaaatctc accacacaac gagaaaccct 1200
aacctcaccg tcccaaggag atggcatgaa tctacgttgg agcttcgttg actacatcca 1260
aacgggcgaa ctcaaggagg gtcaaagccc agaagacaaa ttcgaagaag aagtgcagca 1320
cctacgaggg ctaaaaaaac tctaacctaa gctactaacc agggcagagg cgccatgatt 1380
ttcctccccg tcaccgacca ccggagaggc agacggaggg aggcgagtcc acagactcgc 1440
cgatgaagtc tggaggggaa attttgccct agccgcgttg agggagaaaa cgagaggacg 1500
tccagtgatg ttaatctttt atttttctcg aaataaggaa gtggtcagtg aatctagtac 1560
tccaagtatc ttaaaattta tctactcttt cttcttgagc atctttagct ttttttcccc 1620
tgcgatttgt tttcttgagc tactcgttta cggtgcgccc gaatttctct tttctctttc 1680
tctctaacca aagtaattaa ttgacttttt tagtgtaaat taattgactt tcagtggtgc 1740
aatgtgcgtg ctcaggcaca ttaatgccat cggccgatcg tttgtcaaac aaaaaaaaaa 1800
gaagaatgcc accggccgat ctgcaaaatg aaaaccaaag tagataattc gtccatcatc 1860
cttatgatcc gttcctgcat gcttgcatat ccaacccgca agaaaagctc atcgttatcc 1920
atcaggatcg atcgatcgat cagttatctc taacaactat tcattatcta tcttctaacc 1980
cgcagctata aatatggacc attcggcgtc cacttcctcc atcccatcca tatcgatctt 2040
cctcctcctc tcccacgtac aatctcatct tgaaaacg 2078
<210> 7
<211> 20
<212> DNA
<213> 人工合成
<400> 7
cggcgaccag tcgtagtagg 20
<210> 8
<211> 20
<212> DNA
<213> 人工合成
<400> 8
atctttctcc tcgcccacgt 20
<210> 9
<211> 19
<212> DNA
<213> 人工合成
<400> 9
ccggcgacca gtcgtagta 19
<210> 10
<211> 20
<212> DNA
<213> 人工合成
<400> 10
gtccacttcc tccatcccat 20
<210> 11
<211> 19
<212> DNA
<213> 人工合成
<400> 11
gccttggcgg gcttcttgt 19
<210> 12
<211> 23
<212> DNA
<213> 人工合成
<400> 12
taaatatgga ccattccgca tcc 23
<210> 13
<211> 28
<212> DNA
<213> 人工合成
<400> 13
ctgcagtatg gatctgttag gtgctgcg 28
<210> 14
<211> 34
<212> DNA
<213> 人工合成
<400> 14
tctagaggtt gtcaagatga gattgtacta cgtg 34
<210> 15
<211> 23
<212> DNA
<213> 人工合成
<400> 15
cggtatgaat attgcaaagc cag 23
<210> 16
<211> 23
<212> DNA
<213> 人工合成
<400> 16
gccgtcgagt tttttgattt cac 23