CN108396031B

CN108396031B - 调控陆地棉株高的基因及其应用

Info

Publication number: CN108396031B
Application number: CN201810140403.4A
Authority: CN
Inventors: 宿俊吉; 喻树迅; 马麒; 魏恒玲; 王寒涛; 李吉莲; 马亮; 王聪聪
Original assignee: Institute of Cotton Research of Chinese Academy of Agricultural Sciences; Gansu Agricultural University
Current assignee: Institute of Cotton Research of Chinese Academy of Agricultural Sciences; Gansu Agricultural University
Priority date: 2018-02-11
Filing date: 2018-02-11
Publication date: 2021-05-25
Anticipated expiration: 2038-02-11
Also published as: CN108396031A

Abstract

本发明涉及植株株高基因领域，具体而言，涉及调控陆地棉株高的基因及其应用。调控陆地棉株高的基因，其CDS的碱基序列如SEQ ID NO.1所示，该基因的一段特异碱基序列如SEQ ID NO.2所示。本发明利用355份陆地棉自然群体，基于SLAF‑seq简化基因组测序技术，开发覆盖棉花全基因组的较大数目SNPs，通过对株高性状的3年2点的表型鉴定，采用GWAS的方法解析株高的遗传基因，筛选得到调控陆地棉株高的基因。本发明还利用病毒诱导基因沉默技术对该基因的功能进行了验证，说明可通过调控该基因的表达情况控制株高，为开展陆地棉分子育种奠定基础。

Description

调控陆地棉株高的基因及其应用

技术领域

本发明涉及植株株高基因领域，具体而言，涉及调控陆地棉株高的基因及其应用。

背景技术

棉花(Gossypium spp.)是世界上最重要的纤维作物，也是我国最主要的经济作物之一。我国是主要的产棉大国和棉纺织品出口大国，因此，棉花在我国国民经济中占有十分重要的地位。陆地棉(Gossypium hirsutum L.)是种植面积最大的栽培种，具有高产、适应性强、纤维品质中等优异性状，在世界70多个国家和地区有种植，其种植面积占棉花总面积的95％以上。棉花株高与产量、品质等存在相关关系,是重要的农艺性状之一。重要的是，棉花获得高产要以合理密植为中心，建立合理的群体结构，其中一个很重要的指标就是株高。

随着分子技术的发展和遗传连锁图谱的构建，人们对棉花株高QTL进行了更为深入的研究。Shappley等利用陆地棉种内杂交F2群体定位到2个株高QTL，分别位于第6和第23连锁群上；宋宪亮等利用TM-1和海岛棉7124构建的BC1S1群体，定位到了3个控制株高的QTL,解释9.56％～22.05％的表型变异。于霁雯利用中棉所36和海7124构建的F 2:3家系群体，检测到2个株高QTL，分别位于染色体A2和A11上，解释的表型变异分别为9.18％和9.48％。这些研究所用的群体遗传背景复杂，QTL之间存在互作，QTL的定位不精确。

而染色体片段代换系(CSSLs)遗传背景与轮回亲本相似，基因组中只含有一个或几个小的供体亲本的染色体片段。利用该类群体检测QTL,可有效减少遗传背景干扰,提高QTL定位的准确性。兰孟焦等利用中棉所45和海岛棉海1构建陆海染色体片段代换系(BC4F2、BC4F3)获得7个株高QTL。梁燕通过中棉所36和海岛棉海1构建的三个代换系群体(BC5F3,BC5F3:4和BC5F3:5)群体检测到1个株高QTL,与标记MUSS563紧密连锁的qPH-15-19解释7.90％的表型变异。

但现有的关于株高的标记基因仍不如人意。

有鉴于此，特提出本发明。

发明内容

本发明的第一目的在于提供调控陆地棉株高的基因，本发明利用355份陆地棉自然群体，基于SLAF-seq简化基因组测序技术，开发覆盖棉花全基因组的较大数目SNPs，通过对株高性状的3年2点的表型鉴定，采用GWAS的方法解析株高的遗传基因，筛选得到调控陆地棉株高的基因，其CDS全长基因序列如SEQ ID NO.1所示，其特异性序列如SEQ ID NO.2所示。

本发明的第二目的在于提供所述的调控陆地棉株高的基因在调控陆地棉株高方面的应用，即可以通过促进或者抑制该基因的表达来实现陆地棉株高的调控。

为了实现本发明的上述目的，特采用以下技术方案：

调控陆地棉株高的基因，碱基序列如SEQ ID NO.1所示。

本发明还提供了一段调控陆地棉株高的特异性基因片段，碱基序列如SEQ IDNO.2所示。

本发明利用355份陆地棉自然群体，基于SLAF-seq简化基因组测序技术，开发覆盖棉花全基因组的较大数目SNPs，通过对株高性状的3年2点的表型鉴定，采用GWAS的方法解析株高的遗传基础，挖掘目标性状的优异单倍型及候选基因，筛选得到调控陆地棉株高的基因GhAP1-D3，其序列如SEQ ID NO.1所示，特异性序列如SEQ ID NO.2所示，该基因为开展陆地棉分子育种奠定基础。

本发明还提供了用于扩增SEQ ID NO.1所示的序列的引物对，其上下游引物如SEQID NO.3和SEQ ID NO.4所示。

本发明还提供了用于检测SEQ ID NO.1所示的序列基因的表达情况的引物对，其上下游引物如SEQ ID NO.5和SEQ ID NO.6所示。

本发明还提供了扩增如SEQ ID NO.2所示的特异性基因片段的引物，其上下游引物如SEQ ID NO.7和SEQ ID NO.8所示。

该引物特异性强，扩增杂带少。

进一步地，本发明还提供了所述的调控陆地棉株高的基因在调控陆地棉株高方面的应用。

进一步地，所述调控为增加株高的调控或降低株高的调控。

本发明筛选得到的调控陆地棉株高的基因GhAP1-D3是一种抑制株高的基因，可通过调控GhAP1-D3基因的活性以及表达来控制株高。具体地，增加株高：降低目的植物中GhAP1-D3的活性、降低目的植物中GhAP1-D3的含量、抑制目的植物中GhAP1-D3的编码基因的表达或敲除目的植物中GhAP1-D3的编码基因，得到转基因植物；得到的转基因植物的株高高于未转录的植株。

降低株高：增加目的植物中GhAP1-D3的活性或增加目的植物中GhAP1-D3的含量或促进GhAP1-D3的编码基因的表达，得到转基因植物；得到的转基因植物株高低于未转录的植株。

因此，可通过该基因的过表达或沉默可调控株高的高矮。

进一步地，所述调控为增加株高的调控，通过抑制所述调控陆地棉株高的基因的表达实现。

进一步地，所述抑制为：将所述调控陆地棉株高的基因沉默。

进一步地，所述调控陆地棉株高的基因沉默采用病毒诱导基因沉默(virus-induced gene silencing,VIGS)技术实现。

进一步地，所述病毒诱导基因沉默技术步骤如下：

所述调控陆地棉株高的基因插入病毒载体，然后转入农杆菌；

携带有病毒载体的农杆菌侵染陆地棉幼苗子叶，培育，得到所述调控陆地棉株高的基因沉默的陆地棉。

进一步地，所述病毒载体为pCLCrVA，所述pCLCrVA与辅助载体pCLCrVB分别转入农杆菌；

所述调控陆地棉株高的基因插入病毒载体通过以下步骤得到：

Spe I和Asc I分别对所述的调控陆地棉株高的基因以及pCLCrVA进行双酶切，然后再进行连接。

进一步地，所述调控为降低株高的调控，通过促进所述调控陆地棉株高的基因的表达实现。

促进所述调控陆地棉株高的基因的表达可采用现有的过表达方法进行。

进一步地，本发明还提供了一种载体，含有如SEQ ID NO.2所示的调控陆地棉株高的基因。

即载体中含有的SEQ ID NO.2所示的调控陆地棉株高的基因可以为SEQ ID NO.2所示的调控陆地棉株高的基因的酶切产物片段或对该序列扩增时添加酶切位点后的片段。

如若载体为病毒载体pCLCrVA，则如SEQ ID NO.2所示的调控陆地棉株高的基因采用Spe I和Asc I进行双酶切，同样地，对病毒载体pCLCrVA采用同样的酶进行双酶切，然后将两者的酶切产物连接，得到含有目的基因酶切产物的载体；

也可以在对SEQ ID NO.2所示的片段进行扩增时，加上酶切位点，这样扩增产物可直接与酶切后的载体进行连接。

与现有技术相比，本发明的有益效果为：

(1)本发明利用355份陆地棉自然群体，基于SLAF-seq简化基因组测序技术，开发覆盖棉花全基因组的较大数目SNPs，通过对株高性状的3年2点的表型鉴定，采用GWAS的方法解析株高的遗传基因，筛选得到调控陆地棉株高的基因，其CDS全长基因序列如SEQ IDNO.1所示，其特异性基因序列如SEQ ID NO.2所示。

(2)本发明还提供了扩增调控陆地棉株高的CDS序列的引物对、扩增CDS序列中的特异性序列的引物对，这两个引物对的特异性强，未见扩增杂带。

(3)本发明还提供了所述的调控陆地棉株高的基因在调控陆地棉株高方面的应用，即可以通过促进或者抑制该基因的表达来实现陆地棉株高的调控。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，以下将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例1中SNP标记和株高的关联分析图；

图2为本发明实施例1中关联位点的单倍型分析图；

图3为本发明实施例1中株高候选基因区域分析图；

图4为本发明实施例1中GhAP1-D3基因在不同棉花品种中不同幼叶时期的表达情况柱形图；

图5为本发明实施例2中引物扩增CDS中用于沉默的一段特异序列的电泳图；

图6为本发明实施例2中不同棉株转染后不同天数的株高生长情况曲线图；

图7为本发明实施例2中不同棉株转染后不同天数的株高生长情况图；

图8为本发明实施例2中引物扩增GhAP1-D3基因的CDS全长的电泳图。

具体实施方式

下面将结合实施例对本发明的实施方案进行详细描述，但是本领域技术人员将会理解，下列实施例仅用于说明本发明，而不应视为限制本发明的范围。实施例中未注明具体条件者，按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者，均为可以通过市售购买获得的常规产品。

实施例1

1.1试验材料

本实验构建的自然群体包括有代表性的355份陆地棉种质资源，其中185份资源来源于中国农业科学院棉花研究所早熟课题组多年收集品种系资源，170份来源自于我国棉花种质低温种质资源库(河南安阳)。355份种质资源中，331个品种系来自中国的各个棉花种植生态区域，24个品种系是从国外(主要是美国)引进种质资源。根据不同生态区来源将355份种质资源可分成五组：(1)黄河流域品种组(YR，162份)；(2)长江流域品种组(YZR，51份)；(3)西北内陆品种组(NW，98份)；(4)辽宁品种组或北部特早熟品种组(LN，20份)和(5)美国品种组(其中USA，20份)。所有种质材料经选择典型单株并自交纯化3代以上。355个陆地棉品种(系)的详细信息见参考文献(宿俊吉，博士论文，陆地棉早熟与产量纤维品质性状的全基因组关联分析及候选基因筛选)。

1.2基因组DNA的提取

DNA提取采用CTAB法(Paterson et al.1993)。

1.3株高性状调查

355个陆地棉种质资源材料于2014-2016年播种于河南安阳中国农业科学院棉花研究所试验田(36° 08'N,114° 48'E)和新疆石河子新疆农垦科学院棉花研究所石河子试验站试验田(44° 31'N,86° 01'E)，田间试验均采用了随机区组试验设计，3次重复。河南安阳试验点：每个材料在是单行种植，行长5.00m，行距0.80m，株距0.20m，每个材料有18～23个单株；新疆石河子试验点：每个材料是两行种植，行长2.00m，行距0.45m，株距0.10m，每个材料有30～40个单株。每个试验点均以当地常规方法进行田间管理。棉花株高进行调查，2014-2016年每年8月中下旬对自然群体的株高进行调查。每个材料调查10株。

1.4全进组关联分析

利用GAPIT软件的混合线性模型(MLM)方法，以主成份分析群体结构(PCs)和亲缘关系(K)作为协变量对93,250SNPs和每个环境的株高及其BLUPs进行全基因关联分析，显著性P的选择阈值-log₁₀(p)>4.96(P＝1/n，其中n为使用的标记数量；-log₁₀(1/93250)＝4.96)。使用R语言软件包“Cmplot”绘制曼哈顿图。在R语言程序中使用t测验检验了显著关联标记的等位位点所对应表型性状的显著性差异。

通过SNP标记和株高的关联分析，结果如图1所示。可见，在D03染色体上检测到了5个SNP与目标性状显著关联，其中SNP位点D03_31584163,D03_31972871,D03_32037225和D03_32132408极显著关联，-log10(P)均大于9.00，分布范围为9.29～13.23，并且对性状具有较大的表型贡献率(10.68-12.86％)。

1.5关联位点的单倍型分析

为了鉴定控制PH主效QTL的优异单倍型，分析了分布在D03染色体上4个关联的SNP位点各种单倍型类型。4个等位变异分别是A/G、C/T、A/G和A/G。对这极显著关联四个SNP位点(D03_31584163,D03_31972871,D03_32037225和D03_32132408)进行了连锁不平衡分析(LD)，发现四个SNP位点之间存在紧密的连锁关系，因此自然群体有五种单倍型类型出现，分别是Hap1(ACAA)，Hap2(ATAA)，Hap3(GCGG)，Hap4(GTAA)和Hap5(GTGG)。具体如图2所示。

在GWAS获得显著关联位点的基础上，对上述显著关联的SNP位点，按照三种不同的等位变异类型，对355份陆地棉进行分类，将供试材料分成三个不同的小组，进一步分析发现，58个Hap2品种的平均株高(54.36cm)显著低于Hap3(68.20cm)、Hap5(61.25cm)和Hap1(61.90cm)的平均株高。因此，我们认为Hap2是选择较低植株的优异单倍型类型。

前期棉花研究中SNP与基因连锁的基因组区域是200kb，参照该方法，我们在四个SNP位点LD block两侧位点的各截取了200kb大小的基因组序列，确定株高候选基因区域为D03：31.38-32.33Mb。在该0.95Mb的基因组范围内共注释到21个基因，具体如图3所示。

1.6候选基因的筛选

在显著关联的SNP位点左右各截取200kb，挑选出0.95Mb基因区域内的所有SNPs，利用R语言包绘制LD block图，挑选含显著关联标记的LD block区域，参照陆地棉参考基因组确定区段内的注释基因，通过RT-PCR、转录组数据、同源比较等方法确定目标性状的候选基因。

以植株矮的品种(“中棉所50，株高49.90cm”和“中棉所74，株高49.50cm”)和植株高的品种(“中棉所41，株高65.50cm”和“鲁棉研28，株高64.50cm”)为材料，取顶芽(含幼叶)提取RNA，反转录为cDNA，利用候选基因的特异引物如SEQ ID NO.5和SEQ ID NO.6所示，GhAP1-D3-F：GGAGAAAACTAATGTGGAGCAGG，GhAP1-D3-R：TCAAGGTGGTGGCGAATCAT进行荧光定量PCR，通过Applied Biosystems7500荧光定量PCR仪中，按照两步法进行PCR反应，PCR程序如下：预变性：95℃2min，PCR反应程序：95℃，5sec；60℃，34sec，35个循环。在退火阶段收集荧光信号(60℃，34sec)。完成反应后，将数据导出，基因的表达量以

计算。

对21个注释基因进行qRT-PCR分析了2～4叶期顶芽表达量，其他20个基因有的未见明显区别，有的不同时期表达不同，体现不出与株高的特定关系。而仅有Gh_D03G0922基因在两个植株矮品种中的表达量显著高于植株高的品种。结果说明Gh_D03G0922基因与陆地棉的株高紧密相关。具体结果如图4所示。图4中，(a)、(b)和(c)分别表示2叶期、3叶期和4叶期不同的棉花品种株高情况；(d)、(e)和(f)分别表示2叶期、3叶期和4叶期不同的棉花品种中Gh_D03G0922基因的表达情况。

分析Gh_D03G0922基因发现，该基因属于MADS-box家族基因，与拟南芥AP1/AGL8同源，我们命名为GhAP1-D3。

实施例2

对实施例1筛选得到的GhAP1-D3进行VIGS验证功能。

pCLCrVA-pCLCrVB VIGS体系的载体构建:

设计特异引物的序列如SEQ ID NO.7和SEQ ID NO.8所示，具体地，GhAP1-D3V-F:AGGACAAAGCACTGCAAGAACA；

GhAP1-D3V-R:TCAAGGTGGTGGCGAATCAT。

以该引物扩增GhAP1-D3基因的217bp基因沉默的特异片段，“AGGACAAAGCACTGCAAGAACAGAATAACATACTTGCAAAGAAGGAAAAGGAGAAAACTAATGTGGAGCAGGCACATTGGCAGCTGAACAACAATTGCCAAGATTCATCCTCCATGCTTCTGCCCCTTAACATCAGCTCCAATGGAAGGGAGAAGGAAGATAATGAAACCACCAACAGTGGCGTCTTGCTGCCATGGATGATTCGCCACCACCTTGA”，扩增产物如图5所示。从图5可以看出，该引物的特异性强，扩增无其他杂带。

通过Spe I(ACTAGT)和Asc I(GGCGCGCC)酶切位点，用GhAP1-D3-217的C-端序列替换掉pCLCrVA载体上2个酶切位点之间的序列，得到pCLCrVA-GhAP1-D3-217。将pCLCrVA-GhAP1-D3-217同配套载体pCLCrVA-PDS(指示载体)；pCLCrVA(病毒空载体)和pCLCrVB(辅助载体)转入分别转入农杆菌LBA4404。通过LB固体筛选培养基(50mg/L链霉素+25mg/L利福平+50mg/L卡那霉素)，筛选得到正常生长的单克隆，通过菌液PCR再次确定阳性单克隆。

各类菌液扩摇：分别取农杆菌LBA4404-pCLCrVA-GhAP1-D3-217、LBA4404-pCLCrVA、LBA4404-pCLCrVB和LBA4404pCLCrVA-pYL156-PDS于50mL包含三抗(50mg/L链霉素+25mg/L利福平+50mg/L卡那霉素)的LB液体培养基中，28℃，180rpm培养至OD600在1.5-2.0之间，5000rpm，10min，离心收菌，用渗透液将各类菌体沉淀重新悬浮，使OD600＝1.5。(渗透液配方：10mM氯化镁(Magnesium Chloride，MgCl2)，10mM 2-吗啉乙磺酸(2-(4-Morpholino)Ethanesulfonic Acid，MES)和200μM乙酰丁香酮(Acetosyringone，AS))。

VIGS侵染棉花幼苗

渗透菌液在室温，避光条件下静置至少3小时，随后分别将LBA4404-pCLCrVA-GhAP1-D3-217、LBA4404-pCLCrVA和LBA4404pCLCrVA-pYL156-PDS与LBA4404-pCLCrVB等体积混匀。取掉注射器的针头，用针头在幼苗子叶背部的不同部位轻轻戳破表皮，用无针头的注射器吸取混合菌液，轻轻注射到子叶中，最终使子叶背部充满混合菌液所有棉花幼苗在黑暗条件下放置12-16小时后，转移至棉花培养室中(22℃，16h光照/8h黑暗，低湿条件)培养，等到pCLCrVA-PDS棉花幼苗的叶片出现失绿表型后，提取所有棉株的RNA，通过荧光定量PCR检测目标基因的表达水平，鉴定得到pCLCrVA-GhAP1-D3-217棉株，观察所有棉株的表型。结果如图6所示。

从图6可以看出，不同生长时期的pCLCrVA-GhAP1-D3-217(VG)的阳性植株的株高显著pCLCrVA(CK)的阳性植株。说明GhAP1-D3-217基因的沉默能增加陆地棉的株高，进而也说明GhAP1-D3-217基因对株高有明显的调控作用。

图7为不同生长时期的CK与VG组的棉株的生长对比图。可见，VG组的棉株明显高于CK组的棉株。

另外，采用SEQ ID NO.3和SEQ ID NO.4所示的上下游引物对基因组进行PCR扩增，得到的产物进行电泳，结果如图8所示。

可见，本申请提供的扩增SEQ ID NO.1所示的序列具有很好的特异性。

尽管已用具体实施例来说明和描述了本发明，然而应意识到，在不背离本发明的精神和范围的情况下可以作出许多其它的更改和修改。因此，这意味着在所附权利要求中包括属于本发明范围内的所有这些变化和修改。

SEQUENCE LISTING

<110> 中国农业科学研究院棉花研究所

<120> 调控陆地棉株高的基因及其应用

<130> 2010

<160> 8

<170> PatentIn version 3.3

<210> 1

<211> 690

<212> DNA

<213> 陆地棉

<400> 1

atgggaaggg gtagggttca actgaagaga atagagaata agatcaacag gcaagtgacg 60

ttttcgaaac gaaggtcggg cttgttgaag aaagcccatg aaatctctgt gctttgtgat 120

gctcaagtcg ctttgatggt cttctcttcg aaaggcaaac tctttgaata cgcgactgag 180

tcttgcatgg aaaggatcct tgaacgatat gaaagaaact cgtatactga gatccaatgt 240

gctacagatg aaattcaaca aaatggaaac tggacctggg aacatgcaaa acttaaagct 300

agaatggaga ctttacaaag aaacctgagg cattacgaag gagaagatgt ccagaatttg 360

agtcttagag agcttcaaaa tttggagcaa caacttgatt ctgcccttaa acgcataaga 420

tccagaaaga atcaacttat gcttgaatcg atttctgagc ttcagaaaaa ggacaaagca 480

ctgcaagaac agaataacat acttgcaaag aaggaaaagg agaaaactaa tgtggagcag 540

gcacattggc agctgaacaa caattgccaa gattcatcct ccatgcttct gccccttaac 600

atcagctcca atggaaggga gaaggaagat aatgaaacca ccaacagtgg cgtcttgctg 660

ccatggatga ttcgccacca ccttgaataa 690

<210> 2

<211> 217

<212> DNA

<213> 陆地棉

<400> 2

aggacaaagc actgcaagaa cagaataaca tacttgcaaa gaaggaaaag gagaaaacta 60

atgtggagca ggcacattgg cagctgaaca acaattgcca agattcatcc tccatgcttc 120

tgccccttaa catcagctcc aatggaaggg agaaggaaga taatgaaacc accaacagtg 180

gcgtcttgct gccatggatg attcgccacc accttga 217

<210> 3

<211> 20

<212> DNA

<213> 人工序列

<400> 3

atgggaaggg gtagggttca 20

<210> 4

<211> 20

<212> DNA

<213> 人工序列

<400> 4

ttattcaagg tggtggcgaa 20

<210> 5

<211> 23

<212> DNA

<213> 人工序列

<400> 5

ggagaaaact aatgtggagc agg 23

<210> 6

<211> 20

<212> DNA

<213> 人工序列

<400> 6

tcaaggtggt ggcgaatcat 20

<210> 7

<211> 22

<212> DNA

<213> 人工序列

<400> 7

aggacaaagc actgcaagaa ca 22

<210> 8

<211> 20

<212> DNA

<213> 人工序列

<400> 8

tcaaggtggt ggcgaatcat 20

Claims

1.调控陆地棉株高的基因，其特征在于，碱基序列如SEQ ID NO.1所示。

2.调控陆地棉株高的基因，其特征在于，碱基序列如SEQ ID NO.2所示。

3.权利要求1-2任一项所述的调控陆地棉株高的基因在调控陆地棉株高方面的应用。

4.根据权利要求3所述的应用，其特征在于，所述调控为增加株高的调控或降低株高的调控。

5.根据权利要求3所述的应用，其特征在于，所述调控为增加株高的调控，通过抑制所述调控陆地棉株高的基因的表达实现。

6.根据权利要求5所述的应用，其特征在于，所述抑制为：将所述调控陆地棉株高的基因沉默。

7.根据权利要求6所述的应用，其特征在于，所述调控陆地棉株高的基因沉默采用病毒诱导基因沉默技术实现；所述病毒诱导基因沉默技术步骤如下：

8.根据权利要求7所述的应用，其特征在于，所述病毒载体为pCLCrVA，所述pCLCrVA与辅助载体pCLCrVB分别转入农杆菌；

Spe I和Asc I分别对权利要求2所述的调控陆地棉株高的基因以及pCLCrVA进行双酶切，然后再进行连接。

9.根据权利要求3所述的应用，其特征在于，所述调控为降低株高的调控，通过促进所述调控陆地棉株高的基因的表达实现。

10.一种载体，其特征在于，含有权利要求2所述的调控陆地棉株高的基因。