发明内容
本发明的第一目的在于提供调控陆地棉株高的基因,本发明利用355份陆地棉自然群体,基于SLAF-seq简化基因组测序技术,开发覆盖棉花全基因组的较大数目SNPs,通过对株高性状的3年2点的表型鉴定,采用GWAS的方法解析株高的遗传基因,筛选得到调控陆地棉株高的基因,其CDS全长基因序列如SEQ ID NO.1所示,其特异性序列如SEQ ID NO.2所示。
本发明的第二目的在于提供所述的调控陆地棉株高的基因在调控陆地棉株高方面的应用,即可以通过促进或者抑制该基因的表达来实现陆地棉株高的调控。
为了实现本发明的上述目的,特采用以下技术方案:
调控陆地棉株高的基因,碱基序列如SEQ ID NO.1所示。
本发明还提供了一段调控陆地棉株高的特异性基因片段,碱基序列如SEQ IDNO.2所示。
本发明利用355份陆地棉自然群体,基于SLAF-seq简化基因组测序技术,开发覆盖棉花全基因组的较大数目SNPs,通过对株高性状的3年2点的表型鉴定,采用GWAS的方法解析株高的遗传基础,挖掘目标性状的优异单倍型及候选基因,筛选得到调控陆地棉株高的基因GhAP1-D3,其序列如SEQ ID NO.1所示,特异性序列如SEQ ID NO.2所示,该基因为开展陆地棉分子育种奠定基础。
本发明还提供了用于扩增SEQ ID NO.1所示的序列的引物对,其上下游引物如SEQID NO.3和SEQ ID NO.4所示。
本发明还提供了用于检测SEQ ID NO.1所示的序列基因的表达情况的引物对,其上下游引物如SEQ ID NO.5和SEQ ID NO.6所示。
本发明还提供了扩增如SEQ ID NO.2所示的特异性基因片段的引物,其上下游引物如SEQ ID NO.7和SEQ ID NO.8所示。
该引物特异性强,扩增杂带少。
进一步地,本发明还提供了所述的调控陆地棉株高的基因在调控陆地棉株高方面的应用。
进一步地,所述调控为增加株高的调控或降低株高的调控。
本发明筛选得到的调控陆地棉株高的基因GhAP1-D3是一种抑制株高的基因,可通过调控GhAP1-D3基因的活性以及表达来控制株高。具体地,增加株高:降低目的植物中GhAP1-D3的活性、降低目的植物中GhAP1-D3的含量、抑制目的植物中GhAP1-D3的编码基因的表达或敲除目的植物中GhAP1-D3的编码基因,得到转基因植物;得到的转基因植物的株高高于未转录的植株。
降低株高:增加目的植物中GhAP1-D3的活性或增加目的植物中GhAP1-D3的含量或促进GhAP1-D3的编码基因的表达,得到转基因植物;得到的转基因植物株高低于未转录的植株。
因此,可通过该基因的过表达或沉默可调控株高的高矮。
进一步地,所述调控为增加株高的调控,通过抑制所述调控陆地棉株高的基因的表达实现。
进一步地,所述抑制为:将所述调控陆地棉株高的基因沉默。
进一步地,所述调控陆地棉株高的基因沉默采用病毒诱导基因沉默(virus-induced gene silencing,VIGS)技术实现。
进一步地,所述病毒诱导基因沉默技术步骤如下:
所述调控陆地棉株高的基因插入病毒载体,然后转入农杆菌;
携带有病毒载体的农杆菌侵染陆地棉幼苗子叶,培育,得到所述调控陆地棉株高的基因沉默的陆地棉。
进一步地,所述病毒载体为pCLCrVA,所述pCLCrVA与辅助载体pCLCrVB分别转入农杆菌;
所述调控陆地棉株高的基因插入病毒载体通过以下步骤得到:
Spe I和Asc I分别对所述的调控陆地棉株高的基因以及pCLCrVA进行双酶切,然后再进行连接。
进一步地,所述调控为降低株高的调控,通过促进所述调控陆地棉株高的基因的表达实现。
促进所述调控陆地棉株高的基因的表达可采用现有的过表达方法进行。
进一步地,本发明还提供了一种载体,含有如SEQ ID NO.2所示的调控陆地棉株高的基因。
即载体中含有的SEQ ID NO.2所示的调控陆地棉株高的基因可以为SEQ ID NO.2所示的调控陆地棉株高的基因的酶切产物片段或对该序列扩增时添加酶切位点后的片段。
如若载体为病毒载体pCLCrVA,则如SEQ ID NO.2所示的调控陆地棉株高的基因采用Spe I和Asc I进行双酶切,同样地,对病毒载体pCLCrVA采用同样的酶进行双酶切,然后将两者的酶切产物连接,得到含有目的基因酶切产物的载体;
也可以在对SEQ ID NO.2所示的片段进行扩增时,加上酶切位点,这样扩增产物可直接与酶切后的载体进行连接。
与现有技术相比,本发明的有益效果为:
(1)本发明利用355份陆地棉自然群体,基于SLAF-seq简化基因组测序技术,开发覆盖棉花全基因组的较大数目SNPs,通过对株高性状的3年2点的表型鉴定,采用GWAS的方法解析株高的遗传基因,筛选得到调控陆地棉株高的基因,其CDS全长基因序列如SEQ IDNO.1所示,其特异性基因序列如SEQ ID NO.2所示。
(2)本发明还提供了扩增调控陆地棉株高的CDS序列的引物对、扩增CDS序列中的特异性序列的引物对,这两个引物对的特异性强,未见扩增杂带。
(3)本发明还提供了所述的调控陆地棉株高的基因在调控陆地棉株高方面的应用,即可以通过促进或者抑制该基因的表达来实现陆地棉株高的调控。
具体实施方式
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
实施例1
1.1试验材料
本实验构建的自然群体包括有代表性的355份陆地棉种质资源,其中185份资源来源于中国农业科学院棉花研究所早熟课题组多年收集品种系资源,170份来源自于我国棉花种质低温种质资源库(河南安阳)。355份种质资源中,331个品种系来自中国的各个棉花种植生态区域,24个品种系是从国外(主要是美国)引进种质资源。根据不同生态区来源将355份种质资源可分成五组:(1)黄河流域品种组(YR,162份);(2)长江流域品种组(YZR,51份);(3)西北内陆品种组(NW,98份);(4)辽宁品种组或北部特早熟品种组(LN,20份)和(5)美国品种组(其中USA,20份)。所有种质材料经选择典型单株并自交纯化3代以上。355个陆地棉品种(系)的详细信息见参考文献(宿俊吉,博士论文,陆地棉早熟与产量纤维品质性状的全基因组关联分析及候选基因筛选)。
1.2基因组DNA的提取
DNA提取采用CTAB法(Paterson et al.1993)。
1.3株高性状调查
355个陆地棉种质资源材料于2014-2016年播种于河南安阳中国农业科学院棉花研究所试验田(36° 08'N,114° 48'E)和新疆石河子新疆农垦科学院棉花研究所石河子试验站试验田(44° 31'N,86° 01'E),田间试验均采用了随机区组试验设计,3次重复。河南安阳试验点:每个材料在是单行种植,行长5.00m,行距0.80m,株距0.20m,每个材料有18~23个单株;新疆石河子试验点:每个材料是两行种植,行长2.00m,行距0.45m,株距0.10m,每个材料有30~40个单株。每个试验点均以当地常规方法进行田间管理。棉花株高进行调查,2014-2016年每年8月中下旬对自然群体的株高进行调查。每个材料调查10株。
1.4全进组关联分析
利用GAPIT软件的混合线性模型(MLM)方法,以主成份分析群体结构(PCs)和亲缘关系(K)作为协变量对93,250SNPs和每个环境的株高及其BLUPs进行全基因关联分析,显著性P的选择阈值-log10(p)>4.96(P=1/n,其中n为使用的标记数量;-log10(1/93250)=4.96)。使用R语言软件包“Cmplot”绘制曼哈顿图。在R语言程序中使用t测验检验了显著关联标记的等位位点所对应表型性状的显著性差异。
通过SNP标记和株高的关联分析,结果如图1所示。可见,在D03染色体上检测到了5个SNP与目标性状显著关联,其中SNP位点D03_31584163,D03_31972871,D03_32037225和D03_32132408极显著关联,-log10(P)均大于9.00,分布范围为9.29~13.23,并且对性状具有较大的表型贡献率(10.68-12.86%)。
1.5关联位点的单倍型分析
为了鉴定控制PH主效QTL的优异单倍型,分析了分布在D03染色体上4个关联的SNP位点各种单倍型类型。4个等位变异分别是A/G、C/T、A/G和A/G。对这极显著关联四个SNP位点(D03_31584163,D03_31972871,D03_32037225和D03_32132408)进行了连锁不平衡分析(LD),发现四个SNP位点之间存在紧密的连锁关系,因此自然群体有五种单倍型类型出现,分别是Hap1(ACAA),Hap2(ATAA),Hap3(GCGG),Hap4(GTAA)和Hap5(GTGG)。具体如图2所示。
在GWAS获得显著关联位点的基础上,对上述显著关联的SNP位点,按照三种不同的等位变异类型,对355份陆地棉进行分类,将供试材料分成三个不同的小组,进一步分析发现,58个Hap2品种的平均株高(54.36cm)显著低于Hap3(68.20cm)、Hap5(61.25cm)和Hap1(61.90cm)的平均株高。因此,我们认为Hap2是选择较低植株的优异单倍型类型。
前期棉花研究中SNP与基因连锁的基因组区域是200kb,参照该方法,我们在四个SNP位点LD block两侧位点的各截取了200kb大小的基因组序列,确定株高候选基因区域为D03:31.38-32.33Mb。在该0.95Mb的基因组范围内共注释到21个基因,具体如图3所示。
1.6候选基因的筛选
在显著关联的SNP位点左右各截取200kb,挑选出0.95Mb基因区域内的所有SNPs,利用R语言包绘制LD block图,挑选含显著关联标记的LD block区域,参照陆地棉参考基因组确定区段内的注释基因,通过RT-PCR、转录组数据、同源比较等方法确定目标性状的候选基因。
以植株矮的品种(“中棉所50,株高49.90cm”和“中棉所74,株高49.50cm”)和植株高的品种(“中棉所41,株高65.50cm”和“鲁棉研28,株高64.50cm”)为材料,取顶芽(含幼叶)提取RNA,反转录为cDNA,利用候选基因的特异引物如SEQ ID NO.5和SEQ ID NO.6所示,GhAP1-D3-F:GGAGAAAACTAATGTGGAGCAGG,GhAP1-D3-R:TCAAGGTGGTGGCGAATCAT进行荧光定量PCR,通过Applied Biosystems7500荧光定量PCR仪中,按照两步法进行PCR反应,PCR程序如下:预变性:95℃2min,PCR反应程序:95℃,5sec;60℃,34sec,35个循环。在退火阶段收集荧光信号(60℃,34sec)。完成反应后,将数据导出,基因的表达量以
计算。
对21个注释基因进行qRT-PCR分析了2~4叶期顶芽表达量,其他20个基因有的未见明显区别,有的不同时期表达不同,体现不出与株高的特定关系。而仅有Gh_D03G0922基因在两个植株矮品种中的表达量显著高于植株高的品种。结果说明Gh_D03G0922基因与陆地棉的株高紧密相关。具体结果如图4所示。图4中,(a)、(b)和(c)分别表示2叶期、3叶期和4叶期不同的棉花品种株高情况;(d)、(e)和(f)分别表示2叶期、3叶期和4叶期不同的棉花品种中Gh_D03G0922基因的表达情况。
分析Gh_D03G0922基因发现,该基因属于MADS-box家族基因,与拟南芥AP1/AGL8同源,我们命名为GhAP1-D3。
实施例2
对实施例1筛选得到的GhAP1-D3进行VIGS验证功能。
pCLCrVA-pCLCrVB VIGS体系的载体构建:
设计特异引物的序列如SEQ ID NO.7和SEQ ID NO.8所示,具体地,GhAP1-D3V-F:AGGACAAAGCACTGCAAGAACA;
GhAP1-D3V-R:TCAAGGTGGTGGCGAATCAT。
以该引物扩增GhAP1-D3基因的217bp基因沉默的特异片段,“AGGACAAAGCACTGCAAGAACAGAATAACATACTTGCAAAGAAGGAAAAGGAGAAAACTAATGTGGAGCAGGCACATTGGCAGCTGAACAACAATTGCCAAGATTCATCCTCCATGCTTCTGCCCCTTAACATCAGCTCCAATGGAAGGGAGAAGGAAGATAATGAAACCACCAACAGTGGCGTCTTGCTGCCATGGATGATTCGCCACCACCTTGA”,扩增产物如图5所示。从图5可以看出,该引物的特异性强,扩增无其他杂带。
通过Spe I(ACTAGT)和Asc I(GGCGCGCC)酶切位点,用GhAP1-D3-217的C-端序列替换掉pCLCrVA载体上2个酶切位点之间的序列,得到pCLCrVA-GhAP1-D3-217。将pCLCrVA-GhAP1-D3-217同配套载体pCLCrVA-PDS(指示载体);pCLCrVA(病毒空载体)和pCLCrVB(辅助载体)转入分别转入农杆菌LBA4404。通过LB固体筛选培养基(50mg/L链霉素+25mg/L利福平+50mg/L卡那霉素),筛选得到正常生长的单克隆,通过菌液PCR再次确定阳性单克隆。
各类菌液扩摇:分别取农杆菌LBA4404-pCLCrVA-GhAP1-D3-217、LBA4404-pCLCrVA、LBA4404-pCLCrVB和LBA4404pCLCrVA-pYL156-PDS于50mL包含三抗(50mg/L链霉素+25mg/L利福平+50mg/L卡那霉素)的LB液体培养基中,28℃,180rpm培养至OD600在1.5-2.0之间,5000rpm,10min,离心收菌,用渗透液将各类菌体沉淀重新悬浮,使OD600=1.5。(渗透液配方:10mM氯化镁(Magnesium Chloride,MgCl2),10mM 2-吗啉乙磺酸(2-(4-Morpholino)Ethanesulfonic Acid,MES)和200μM乙酰丁香酮(Acetosyringone,AS))。
VIGS侵染棉花幼苗
渗透菌液在室温,避光条件下静置至少3小时,随后分别将LBA4404-pCLCrVA-GhAP1-D3-217、LBA4404-pCLCrVA和LBA4404pCLCrVA-pYL156-PDS与LBA4404-pCLCrVB等体积混匀。取掉注射器的针头,用针头在幼苗子叶背部的不同部位轻轻戳破表皮,用无针头的注射器吸取混合菌液,轻轻注射到子叶中,最终使子叶背部充满混合菌液所有棉花幼苗在黑暗条件下放置12-16小时后,转移至棉花培养室中(22℃,16h光照/8h黑暗,低湿条件)培养,等到pCLCrVA-PDS棉花幼苗的叶片出现失绿表型后,提取所有棉株的RNA,通过荧光定量PCR检测目标基因的表达水平,鉴定得到pCLCrVA-GhAP1-D3-217棉株,观察所有棉株的表型。结果如图6所示。
从图6可以看出,不同生长时期的pCLCrVA-GhAP1-D3-217(VG)的阳性植株的株高显著pCLCrVA(CK)的阳性植株。说明GhAP1-D3-217基因的沉默能增加陆地棉的株高,进而也说明GhAP1-D3-217基因对株高有明显的调控作用。
图7为不同生长时期的CK与VG组的棉株的生长对比图。可见,VG组的棉株明显高于CK组的棉株。
另外,采用SEQ ID NO.3和SEQ ID NO.4所示的上下游引物对基因组进行PCR扩增,得到的产物进行电泳,结果如图8所示。
可见,本申请提供的扩增SEQ ID NO.1所示的序列具有很好的特异性。
尽管已用具体实施例来说明和描述了本发明,然而应意识到,在不背离本发明的精神和范围的情况下可以作出许多其它的更改和修改。因此,这意味着在所附权利要求中包括属于本发明范围内的所有这些变化和修改。
SEQUENCE LISTING
<110> 中国农业科学研究院棉花研究所
<120> 调控陆地棉株高的基因及其应用
<130> 2010
<160> 8
<170> PatentIn version 3.3
<210> 1
<211> 690
<212> DNA
<213> 陆地棉
<400> 1
atgggaaggg gtagggttca actgaagaga atagagaata agatcaacag gcaagtgacg 60
ttttcgaaac gaaggtcggg cttgttgaag aaagcccatg aaatctctgt gctttgtgat 120
gctcaagtcg ctttgatggt cttctcttcg aaaggcaaac tctttgaata cgcgactgag 180
tcttgcatgg aaaggatcct tgaacgatat gaaagaaact cgtatactga gatccaatgt 240
gctacagatg aaattcaaca aaatggaaac tggacctggg aacatgcaaa acttaaagct 300
agaatggaga ctttacaaag aaacctgagg cattacgaag gagaagatgt ccagaatttg 360
agtcttagag agcttcaaaa tttggagcaa caacttgatt ctgcccttaa acgcataaga 420
tccagaaaga atcaacttat gcttgaatcg atttctgagc ttcagaaaaa ggacaaagca 480
ctgcaagaac agaataacat acttgcaaag aaggaaaagg agaaaactaa tgtggagcag 540
gcacattggc agctgaacaa caattgccaa gattcatcct ccatgcttct gccccttaac 600
atcagctcca atggaaggga gaaggaagat aatgaaacca ccaacagtgg cgtcttgctg 660
ccatggatga ttcgccacca ccttgaataa 690
<210> 2
<211> 217
<212> DNA
<213> 陆地棉
<400> 2
aggacaaagc actgcaagaa cagaataaca tacttgcaaa gaaggaaaag gagaaaacta 60
atgtggagca ggcacattgg cagctgaaca acaattgcca agattcatcc tccatgcttc 120
tgccccttaa catcagctcc aatggaaggg agaaggaaga taatgaaacc accaacagtg 180
gcgtcttgct gccatggatg attcgccacc accttga 217
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<400> 3
atgggaaggg gtagggttca 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<400> 4
ttattcaagg tggtggcgaa 20
<210> 5
<211> 23
<212> DNA
<213> 人工序列
<400> 5
ggagaaaact aatgtggagc agg 23
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<400> 6
tcaaggtggt ggcgaatcat 20
<210> 7
<211> 22
<212> DNA
<213> 人工序列
<400> 7
aggacaaagc actgcaagaa ca 22
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<400> 8
tcaaggtggt ggcgaatcat 20