大豆抗炸荚主效QTLqPD05及其定位方法和应用
技术领域
本发明属于QTL定位领域,具体涉及大豆抗炸荚主效QTLqPD05及其定位方法和应用。
背景技术
炸荚对于具有荚果的野生植物的种子传播是必不可少的,对野生植物来说,种子传播是野生植物生存繁衍的一个必须过程,它为后代提供了充足的生长空间和在不同环境条件下存活的机会(Fuller2007)。然而,在栽培作物中,炸荚将导致严重减产,因为种子炸荚不能进行收获。在农民种植和收获期间,希望在收获前保留荚,抗炸荚是与作物产量相关的无意识选择的一个性状(Hancock and Hancock 2003;Harlan et al.1973)。因此在作物驯化过程中,抗炸荚是一个重要的驯化性状(Hideyuki et al.2012)。尽管在作物驯化期间,我们严格筛选,避免炸荚,但在收获前炸荚仍是育种中需要亟待解决的问题(Christiansen et al.2002)。尽管作物抗炸荚在遗传育种中取得了很大进展,但是关于作物抗炸荚的基因知之甚少(Funatsuki et al.2014)。
在过去的20年中,已经确定了一系列与大豆炸荚相关的QTL位点。迄今为止,大量研究使用RFLP(Bailey et al.1997)和SSR标记(Funatsuki et al.2006)等方法,利用重组自交系定位大豆炸荚相关QTLs,表明大豆炸荚是由主效QTL和一些微效QTLs控制的。由于群体的遗传背景不同,不同的基因控制炸荚,抗炸荚特性体现为单个隐性主效基因或者多个基因控制(Kang et al.2005)。Bailey等人利用重组自交系(RILS)首次发现了存在于16号染色体上的一个主效QTL,并且发现了一些微效QTLs,分别位于2号,15号,19号染色体上(Bailey et al.1997),经过精细定位,候选基因Glyma16g25580控制炸荚,并命名为Pdh1(Pod dehiscence 1)(Funatsuki et al.2014)。同时,研究发现了大豆中的一个主效NAC基因Glyma.16g019400,命名为SHAT1-5,也调控大豆炸荚(Dong et al.2014)。Kang等人通过两组RILs,使用SSR标记,重新定位到了三个新的微效QTLs,分别位于5号,10号和14号染色体上(Kang et al.2009)。
发明内容
有鉴于此,本发明的目的在于提供一种新的大豆抗炸荚主效QTLqPD05及其定位方法和应用,使所述抗炸荚主效QTL具有好的稳定性。
为了实现上述发明目的,本发明提供以下技术方案:
本发明提供了大豆抗炸荚主效QTLqPD05,所述主效QTL被定位在大豆第5号染色体上,物理位置为40448596-40703417之间;
所述40448596-40703417的遗传距离为29.653~30.04cM。
本发明提供了所述的大豆抗炸荚主效QTLqPD05的定位方法,包括以下步骤:
(1)以炸荚大豆和抗炸荚大豆为亲本构建第五代和第六代重组自交系,将炸荚大豆、抗炸荚大豆与第五代重组自交系同时播种,将炸荚大豆、抗炸荚大豆与第六代重组自交系同时播种,得到两年的炸荚大豆、抗炸荚大豆和重组自交系大豆样本;
(2)分别提取两年的炸荚大豆、抗炸荚大豆和重组自交系大豆样本的DNA,得到炸荚大豆和抗炸荚大豆和重组自交系大豆的基因组DNA;
(3)利用所述炸荚大豆和抗炸荚大豆和重组自交系大豆的基因组DNA分别构建SLAF文库,将构建的SLAF文库单独测序,得到原始测序数据;
(4)对所述原始测序数据进行过滤,选择每个reads中间4~103bp作为分析数据;
(5)将所述分析数据比对到参考基因组,每个reads的双端比对到同一个位置的reads为同一个SLAF标签,然后根据等位基因数和基因序列之间的差异对所述SLAF标签进行多态性分析,得到多态性SLAF标签;
(6)将所述多态性SLAF标签进行过滤,得到筛选后的多态性SLAF标签;
所述过滤是删除具有以下情况的多态性SLAF标签:
a.所述亲本测序深度10X以下的多态性SLAF标签;
b.含大于5个SNP位点的多态性SLAF标签;
c.不足以覆盖所有子代70%的基因型个体的多态性SLAF标签;
(7)将所述筛选后的多态性SLAF标签与参考基因组比对定位,所述筛选后的多态性SLAF标签定位到20条染色体,以每个染色体作为连锁群,计算每个连锁群上相邻的多态性SLAF标签间的遗传距离,得到高密度遗传图谱;
(8)根据高密度遗传图谱采用完备区间作图法,对两年的大豆炸荚表型与炸荚性状相关性进行QTL定位,得到大豆抗炸荚主效QTL区间。
优选的,所述步骤(2)中重组自交系大豆样本的数量为200~300个。
优选的,所述步骤(1)中炸荚大豆作为父本;所述抗炸荚大豆作为母本。
优选的,所述炸荚大豆的品种为黑河18号;所述抗炸荚大豆的品种为黑河43号。
优选的,步骤(3)中单独测序时,炸荚大豆测序的SLAF文库的测序深度为39.74X;抗炸荚大豆SLAF文库的测序深度为34.87X;重组自交系大豆SLAF文库的测序深度为12.35X。
优选的,所述步骤(4)中过滤的标准如下:过滤掉含有接头序列的reads;过滤掉N含量超过该条read长度比例10%的reads。
优选的,所述步骤(7)中在遗传距离计算前优选还包括对所述多态性SALF标签进行第二过滤;所述第二过滤的标准是通过计算两两多态性SLAF标签之间的MLOD值,过滤掉MLOD值均低于5的多态性SLAF标签。
本发明提供了所述大豆抗炸荚主效QTL或所述定位方法得到的大豆抗炸荚主效QTL在研究抗炸荚性状的遗传机制、基因精细定位和图位克隆、分子标记开发或基因聚合选择中的应用。
优选的,所述分子标记为CAPs分子标记;所述CAPs分子标记的扩增引物包括正向引物和反向引物;所述正向引物具有如序列表中SEQ ID NO.1所示的核苷酸序列;所述反向引物具有如序列表中SEQ ID NO.2所示的核苷酸序列。
本发明提供了大豆抗炸荚主效QTLqPD05,所述qPD05被定位在大豆第5号染色体上,物理位置为40448596-40703417之间;所述40448596-40703417的遗传距离为29.653~30.04cM。由于大豆的产量与抗炸荚率呈正相关,因此通过检测大豆抗炸荚主效QTL进而筛选具有抗炸荚主效QTL的品种,可明显提高抗炸荚率。因此,通过定位所述主效QTL为近一步检测大豆的抗炸荚性状从而提高大豆产量和提高大豆优异品种的选育进程。
本发明提供了所述的大豆抗炸荚主效QTLqPD05的定位方法,本发明利用SLAF-seq测序技术,在大豆全基因组水平上筛选SLAF标记,发掘本群体中与炸荚相关的QTLs。利用炸荚大豆和抗炸荚大豆为亲本的RIL7群体为材料,构建覆盖大豆全基因组的高密度遗传连锁图谱,对该群体的抗炸荚性状进行QTL定位,获得和抗炸荚相关的QTLs,除此之外,高密度遗传图谱的构建以及确定该群体特有的炸荚相关的新的QTLs,为大豆有效的QTL定位提供了参考。
附图说明
图1为RIL群体炸荚率表型分布图,其中图1-E1为2015年在黑龙江省黑河260个RILs和两亲本的炸荚率,图1-E2为2016年在黑龙江省黑河260个RILs和两亲本的炸荚率;
图2为SLAF标签和多态性性SLAF标签在染色体上的分布;其中图2-A为SLAF标签的分布图,图2-B为多态性SLAF标签的分布图;
图3为RIL群体高密度遗传图谱;
图4为遗传图和基因组共线性分析;
图5为5号染色体的QTLs定位。
具体实施方式
本发明提供了大豆抗炸荚主效QTLqPD05,所述qPD05被定位在大豆第5号染色体上,物理位置在40448596-40703417之间;
所述40448596-40703417的遗传距离为29.653~30.04cM。
在本发明中,所述大豆抗炸荚主效QTL的对数概率得分(LOD)为7.171;累加效应值(ADD)为-5.995,表型变异率(PVE)为15.138%。所述大豆抗炸荚主效QTL在2015年和2016年被同时检测到,可认为是稳定的QTLs。
本发明提供了所述的大豆抗炸荚主效QTL的定位方法,包括以下步骤:
(1)以炸荚大豆和抗炸荚大豆为亲本构建第五代和第六代重组自交系,将炸荚大豆、抗炸荚大豆与第五代重组自交系同时播种,将炸荚大豆、抗炸荚大豆与第六代重组自交系同时播种,得到两年的炸荚大豆、抗炸荚大豆和重组自交系大豆样本;
(2)分别提取两年的炸荚大豆、抗炸荚大豆和重组自交系大豆样本的DNA,得到炸荚大豆和抗炸荚大豆和重组自交系大豆的基因组DNA;
(3)利用所述炸荚大豆和抗炸荚大豆和重组自交系大豆的基因组DNA分别构建SLAF文库,将构建的SLAF文库单独测序,得到原始测序数据;
(4)对所述原始测序数据进行过滤,选择每个reads中间4~103bp作为分析数据;
(5)将所述分析数据比对到参考基因组,每个reads的双端比对到同一个位置的reads为同一个SLAF标签,然后根据等位基因数和基因序列之间的差异对所述SLAF标签进行多态性分析,得到多态性SLAF标签;
(6)将所述多态性SLAF标签进行过滤,得到筛选后的多态性SLAF标签;
所述过滤是删除具有以下情况的多态性SLAF标签:
a.所述亲本测序深度10X以下的多态性SLAF标签;
b.含大于5个SNP位点的多态性SLAF标签;
c.不足以覆盖所有子代70%的基因型个体的多态性SLAF标签;
(7)将所述筛选后的多态性SLAF标签与参考基因组比对定位,所述筛选后的多态性SLAF标签定位到20条染色体,以每个染色体作为连锁群,计算每个连锁群上相邻的多态性SLAF标签间的遗传距离,得到高密度遗传图谱;
(8)根据高密度遗传图谱采用完备区间作图法,对两年的大豆炸荚表型与炸荚性状相关性进行QTL定位,得到大豆抗炸荚主效QTL区间。
本发明以炸荚大豆和抗炸荚大豆为亲本构建第五代和第六代重组自交系(RIL),将炸荚大豆、抗炸荚大豆与第五代重组自交系同时播种,将炸荚大豆、抗炸荚大豆与第六代重组自交系同时播种,得到两年的炸荚大豆、抗炸荚大豆和重组自交系大豆样本。
在本发明中,所述炸荚大豆优选作为父本;所述抗炸荚大豆优选作为母本。所述抗炸荚大豆的品种优选为黑河43号;所述炸荚大豆的品种优选为黑河18号。本发明对所述炸荚大豆和所述抗炸荚大豆进行表型鉴定。大豆炸荚表型鉴定的主要评判指标为炸荚率。所述炸荚率=(已炸荚数/总荚数)×100%(黄淮流域大豆炸荚性初步分析,彭玉华,大豆科学,1991.)。亚洲蔬菜研究与发展中心(AVRDC)依据炸荚率对大豆炸荚表型进行了分级,将炸荚率为0%定为1级(高抗炸荚),炸荚率在0-10%之间定为2级(抗炸荚),炸荚率在11-25%之间定为3级(中抗炸荚),炸荚率在26-50%之间定为4级(中度炸荚),炸荚率在50%以上定为5级(重度炸荚)。
本发明优选采用室内干燥法来测定炸荚率。为保证数据可靠性,采摘样品时,避免碰触豆荚,以尽量保持试验材料检测前的一致性。室内干燥法包括以下步骤:将温度设置为80℃,烘干时间设置5h为最佳鉴定炸荚率的检测条件。人工检测黑河18号与黑河43号的炸荚率差异极显著。按照AVRDC的评价标准,黑河43号炸荚为2级(中抗炸荚),黑河18号属于炸荚为4级(中度炸荚),与自然炸荚情况基本一致。
本发明对所述构建第五代和第六代重组自交系的方法没有特殊限制,采用本领域所熟知的构建重组自交系的方法即可。
在本发明中,所述炸荚大豆、抗炸荚大豆和第五代重组自交系大豆样本在2015年的黑龙江地理环境中种植,所述炸荚大豆、抗炸荚大豆和第五代重组自交系大豆样本在2016年的黑龙江地理环境中种植,分别得到两年期间内炸荚大豆、抗炸荚大豆和重组自交系大豆样本。所述黑龙江地理环境相同。
得到两年的炸荚大豆、抗炸荚大豆和重组自交系大豆样本后,本发明分别提取两年的炸荚大豆、抗炸荚大豆和重组自交系大豆每个样本的基因组DNA,得到炸荚大豆和抗炸荚大豆和重组自交系大豆的基因组DNA。
在本发明中,所述炸荚大豆、抗炸荚大豆和重组自交系大豆样本在同样的环境中种植两年,分别得到两年期间内炸荚大豆、抗炸荚大豆和重组自交系大豆样本。本发明优选对两年期间内炸荚大豆、抗炸荚大豆和重组自交系大豆样本的炸荚表型分别进行统计,以便后期QTL定位。
在本发明中,DNA的提取原料优选为大豆样本叶片。所述DNA的提取方法没有特殊限制,采用本领域所熟知的提取方法即可。在本发明中,所述重组自交系大豆样本的数量优选为200~300个,更优选为260个。提取得到的DNA优选进行质量检检测。所述质量检检包括DNA完整性和DNA提取浓度的测定。所述DNA完整性测定采用凝胶电泳检测即可。所述DNA提取浓度的测定优选采用核酸蛋白定量检测仪进行测定。
得到提取的DNA后,本发明利用所述炸荚大豆、抗炸荚大豆和重组自交系大豆的每个样本的基因组DNA分别构建SLAF文库,将构建的SLAF文库单独测序,得到原始测序数据。
在本发明中,所述构建SLAF文库的方法没有特殊限制,采用本领域所熟知的构建SLAF文库的方案即可。所述构建SLAF文库时为了保证准确性,优选采用大豆Williams 82v2.1基因组(https://phytozome.jgi.doe.gov)作为参考基因组进行酶切。所述酶切用酶的种类优选为RsaI和HaeIII酶切组合。本发明构建SALF文库优选对每个样品的基因组DNA进行酶切,分别建库。酶切片段长度在364~414bp的序列定义为SLAF标签,每个文库中预测可得到132,516个SLAF标签。
构建得到SLAF文库后,本发明优选用Illumina HiSeq对双末端(125bp)进行测序。在本发明中,炸荚大豆SLAF文库的测序深度优选为39.74X;抗炸荚大豆SLAF文库的测序深度优选为34.87X;重组自交系大豆SLAF文库的测序深度优选为12.35X。
为评估建库实验的准确性,本发明优选用日本晴水稻(Oryza sativa Ljaponica)作为对照,进行相同处理,参与建库和测序。通过对照数据比对效率,评估酶切效率,判断原始测序数据的准确性和有效性。
得到原始测序数据后,本发明对所述原始测序数据进行过滤,选择每个reads中间4~103bp作为分析数据。
在本发明中,所述过滤的标准优选如下:过滤掉含有接头序列的reads;过滤掉N含量超过该条read长度比例10%的reads。
得到分析数据后,本发明将所述分析数据比对到参考基因组,每个reads的双端比对到同一个位置的reads为同一个SLAF标签,然后根据等位基因数和基因序列之间的差异对所述SLAF标签进行多态性分析,得到多态性SLAF标签。
在本发明中,所述分析数据比对到参考基因组上用软件优选为BWA软件。所述多态性分析的方法优选为采用BWA软件进行。
在本发明中,为了便于后续的遗传学分析,本发明对所述多态性SLAF标签进行基因型编码。所述基因型编码的方法优选按照遗传学通用的二等位编码规则,多态性标签分为八种分离模型(ab×cd,ef×eg,hk×hk,lm×ll,nn×np,aa×bb,ab×cc,cc×ab)。其中,RIL表明适用于aa×bb型。
得到多态性SLAF标签后,本发明将所述多态性SLAF标签进行过滤,得到筛选后的多态性SLAF标签;
对所述多态性SLAF标签过滤是删除具有以下情况的多态性SLAF标签:
a.所述亲本测序深度10X以下的多态性SLAF标签;
b.含大于5个SNP位点的多态性SLAF标签;
c.不足以覆盖所有子代70%的基因型个体的多态性SLAF标签。
在本发明中,所述过滤有利于保证提高构建的遗传图谱的质量。
得到筛选后的多态性SLAF标签后,本发明将所述筛选后的多态性SLAF标签与参考基因组比对定位,所述筛选后的多态性SLAF标签定位到20条染色体,以每个染色体作为连锁群,计算每个连锁群上相邻的多态性SLAF标签间的遗传距离,得到高密度遗传图谱。
在本发明中,所述在遗传距离计算前还优选包括对所述多态性SLAF标签进行第二过滤;所述第二过滤的标准是通过计算两两多态性SLAF标签之间的MLOD值,过滤掉MLOD值均低于5的多态性SLAF标签。所述第二过滤有利于得到上图标记,从而绘制高密度遗传连锁图谱。
本发明采用完备区间作图法,根据两年的大豆炸荚表型与炸荚性状相关性进行QTL定位,得到大豆抗炸荚主效QTL区间。
在本发明中,所述完备区间作图法用软件优选为R/qtl软件。所述完备区间作图法用排列检验1000次进行阈值设定,首先考虑0.99置信度对应的LOD阈值,若没有定位区间,则考虑0.95置信度下对应的LOD阈值;若没有定位区间,则考虑0.90置信度的阈值。若仍没有结果,则没有考虑排列检验的结果,手动降低阈值到3.0;若3.0没有区间,则降到2.5。最终,选择LOD阈值为2.5,确定染色体上的QTL与炸荚性状是否相关。本发明得到的QTL是在LOD阈值为2.5时得到。
本发明提供了所述大豆抗炸荚主效QTL或所述定位方法得到的大豆抗炸荚主效QTL在研究抗炸荚性状的遗传机制、基因精细定位和图位克隆、分子标记开发或基因聚合选择中的应用。在本发明中,所述分子标记为CAPs类型分子标记。针对QTL区间内两亲本的差异位点,针对SNP位点开发了CAPs(CleavedAmplified Polymorphic Sequence,CAPS)分子标记,并利用开发的分子标记对RILs基因型进行检测。利用在线软件dCAPS Finder 2.0(http://helix.wustl.edu/dcaps/dcaps.html)确认SNP位点酶切信息,其中qPD05存在限制性酶切位点,开发CAPS标记。所述CAPS分子标记的扩增引物包括正向引物和反向引物;所述正向引物具有如序列表中SEQ ID NO.1所示的核苷酸序列;所述反向引物具有如序列表中SEQ ID NO.2所示的核苷酸序列。所述CAPS分子标记的扩增引物的反应体系20μL,包括50ng基因组DNA、10×PCRbuffer,2mmol L-1dNTPs,2mmol L-1引物和1 U Taq聚合酶。所述CAPS分子标记的扩增引物的扩增程序为:94℃预变性4min,94℃变性30s,58℃退火40s,72℃延伸1min,34个循环,最后72℃延伸10min,于4℃保存。
下面结合实施例对本发明提供的大豆抗炸荚主效QTLqPD05及其定位方法和应用进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。
实施例1
植株材料和炸荚表型鉴定
含有260株RIL7的定位群体是由黑河43号为母本,黑河18号为父本杂交配置而成的。得到的第五代和第六代260株RIL7分别在2015和2016年与两亲本同时种植于黑龙江省农科院黑河分院大豆试验田,两年种植的环境,分别命名为E1和E2。亲本3次重复,4行区,后代群体材料进行小区随机排列,行长4m,垄距66.7cm,株距5cm,采取人工点播。母本黑河43号,为目前黑龙江省早熟地区种植面积最大的品种,该品种高抗炸荚,是以黑河18号为母本,黑河23号为父本,系谱法杂交选育而成。父本黑河18号,该品种为炸荚敏感类型。尽管黑河18号和黑河43号在多个农艺性状上差异并不显著,但黑河18号的炸荚现象却极为明显(韩德志et al.2015)。
炸荚率是大豆炸荚表型鉴定的主要评判指标,炸荚率=(已炸荚数/总荚数)×100%(彭玉华et al.1991)。亚洲蔬菜研究与发展中心(AVRDC)依据炸荚率对大豆炸荚表型进行了分级,将炸荚率为0%定为1级(高抗炸荚),炸荚率在0-10%之间定为2级(抗炸荚),炸荚率在11-25%之间定为3级(中抗炸荚),炸荚率在26-50%之间定为4级(中度炸荚),炸荚率在50%以上定为5级(重度炸荚)。
本实施例采用室内干燥法来测定炸荚率。用剪刀剪下大豆完熟期(R8)的豆荚,采用自封袋封样(防止水分蒸发)冷藏于4℃冰箱。为保证数据可靠性,采摘样品时,避免碰触豆荚,以尽量保持试验材料检测前的一致性。我们将烘箱温度设置80℃,烘干时间设置5h为最佳鉴定炸荚率的检测条件。为保证试验安全性,采用耐高温广口玻璃杯盛放实验材料进行烘干实验。试验开始前,提前将烘箱预热到处理温度,调查时迅速取出材料,同时迅速关好烘箱门(韩德志et al.2015)。人工检测黑河18号与黑河43号的炸荚率差异极显著。按照AVRDC的评价标准,黑河43号炸荚为2级(中抗炸荚),黑河18号属于炸荚为4级(中度炸荚),与自然炸荚情况基本一致(韩德志et al.2015)。
结果
鉴定了260个RILs和两亲本在黑龙江省黑河2015年(E1)和2016年(E2)的炸荚率(图1)。在两年间,黑河18号比黑河43号都表现出更高的炸荚率,分别为37%和3%,47.03%和11.36%。两年间,RILs的炸荚率分布呈现出连续的分布,但不符合正态分布,而是表现为偏向母本黑河43号的偏态分布(图1),表明母本黑河43号携带的等位基因起到了抗炸荚的作用。后代中没有表现出明显的超亲遗传。图1为箭头分别表示了两年中母本黑河43号和父本黑河18号的炸荚率。E1表示在2015年黑河种植的环境,E2表示2016年黑河种植的环境;图1-E1为2015年在黑龙江省黑河260个RILs和两亲本的炸荚率,图1-E2为2016年在黑龙江省黑河260个RILs和两亲本的炸荚率。
实施例2
DNA提取
选取适量的大豆嫩叶片(约0.1克)放入2.0mL离心管中,加入钢珠,在液氮中冷却后,利用打样机对叶片进行研磨处理,然后于-80℃储存备用。采用改良的CTAB法提取大豆叶片DNA(Saghaimaroof et al.1984)。提取的DNA用0.8%琼脂糖凝胶电泳和紫外分光光度计对提取的DNA进行质量检测。
实施例3
SLAF(Specific-locus amplified fragments)文库构建和测序
对260个RILs以及两个亲本进行SLAF文库构建和测序。选取大豆Williams 82v2.1基因组(https://phytozome.jgi.doe.gov)作为参考基因组进行酶切预测,选择RsaI和HaeIII酶切组合,对每个样品的基因组DNA进行酶切。酶切片段长度在364-414bp的序列定义为SLAF标签,预测可得到132,516个SLAF标签。对得到的酶切片段(SLAF标签)进行3′端加A处理、连接Dual-index测序接头、PCR扩增、纯化、混样、切胶选取目的片段,构建测序文库,文库质检合格后用Illumina HiSeq对双末端(125bp)进行测序。为评估建库实验的准确性,选用日本晴水稻(Oryza sativa Ljaponica)作为对照(Control),进行相同处理,参与建库和测序。通过Control数据比对效率,评估酶切效率,判断准确性和有效性。通过reads聚类,在亲本和子代中开发SLAF标签,筛选多态性SLAF标签。
实施例4
SLAF-seq多态性分析和基因分型
样品的SLAF-seq数据分组和基因分型按照以下程序进行。SLAF-seq文库的原始测序读长为末端125bp。为保证信息分析质量,对原始测序的数据进行过滤,原始数据过滤标准如下:过滤含有接头序列的reads;过滤N含量超过该条read长度比例10%的reads;由于测序reads中前几bp为酶切片断遗留的残基,末端测序质量较低,因此选择reads中间4~103bp来分析数据。利用BWA软件,将过滤后测序的reads比对到参考基因组上,双端比对到同一个位置的reads为同一个SLAF标签。根据等位基因数和基因序列之间的差异进行多态性分析,并对SLAF标签进行分类。将SLAF标签定位到参考基因组上,统计不同染色体上的SLAF标签和多态性SLAF标签,根据SLAF标签在染色体上的分布,绘制SLAF标签和多态性SLAF标签在染色体上的分布图。
为了便于后续的遗传学分析,本实施例对多态性标签进行基因型编码,按照遗传学通用的二等位编码规则,多态性标签分为八种分离模型(ab×cd,ef×eg,hk×hk,lm×ll,nn×np,aa×bb,ab×cc,cc×ab)。其中,aa×bb型适用于近交群体(如F2,RIL,DH),其余标记适用于杂交群体。本发明所用的群体为RIL,亲本基因型为aa(父本)和bb(母本),子代基因型为ab,表示该样品在这个标记的编码类型为杂合,其中一个基因型来自于父本,另一个基因型来自于母本。为保证遗传图谱质量,将多态性SLAF标签按照以下规则进行过滤:1)过滤父母本测序深度10X以下。2)SNP数目大于5。由于SNP标签测序长度为200bp,出现过多的SNP认为是测序高频变异区。3)完整度过滤。筛选至少覆盖所有子代70%以上基因型个体的标记。基于亲本基因型的检测结果,过滤亲本信息缺失的位点,最后将获得的多态性SLAF标签用于构建高密度遗传图谱。这部分内容委托百迈克生物科技有限公司完成。
利用SLAF-Seq对两亲本和RIL群体进行基因分型。酶切效率为89.82%,表明酶切效率正常。我们获得用于评估实验建库准确性的Control测序的reads为398,386,将Control的测序reads与参考基因组进行比对,比对效率为86.29%,比对效率基本正常。测序平均Q30为80.40%,平均GC含量为38.12%。我们一共获得了364,461个SLAF标签。两亲本黑河43号和黑河18号SLAF标签的测序深度分别为39.74X和34.87X,SLAF标签数量分别为195,279和205,644。子代SLAF标签的平均测序深度为12.35X。根据等位基因数和基因序列之间的差异,对获得的SLAF标签进行多态性分析,共得到3种类型的SLAF标签:多态型,非多态型,重复型的SLAF标签。SLAF技术开发出的标签类型主要是SNP和Indel标签。其中,多态性SLAF标签共有24,249个,多态性比例达到6.65%。对获得的24,249个多态性SLAF标签进行分型,有11,028个标签分型成功。本研究中所用材料为RIL7群体,筛选父母本基因型都纯合且亲本间具有多态性的位点,选择aaxbb类型的多态性标签作为符合本群体特征的有效标签,本研究构建遗传图谱的有效多态性为2.68%。在过滤和质量评估后,最终得到可用于高密度遗传图谱构建的的SLAF标签5,227个,SLAF标签类型都为aa×bb类型。根据SLAF标签在染色体上的分布,绘制所有SLAF标签和多态性SLAF标签的染色体分布图(图2)。图2中横坐标为染色体长度,每一个黄色条带代表一条染色体,按照1M的大小对基因组进行了划分,每个window内的SLAF标签数越多,颜色越深,SLAF标签数越少,颜色越浅;图中颜色越深的区域即SLAF标签集中分布的区域。图2-A为SLAF标签的分布图,图2-B为多态性SLAF标签的分布图。
实施例5
高密度遗传图谱构建
将获得的多态型SLAF标签,与参考基因组比对定位后,SLAF标签定位到20条染色体,通过计算两两标签之间的MLOD(the modified logarithm of odds)值,过滤掉与其他SLAF标签的MLOD值均低于5的标签,为上图标记。每条染色体为一个连锁群,以连锁群为单位,使用HighMap构图软件分析获得连锁群内Marker的线性排列,并估算相邻Marker间的遗传距离,最终得到高密度遗传图谱。
将筛选出的5,227个SLAF标签,通过与参考基因组的定位将SLAF标签分为20个连锁群,过滤掉与其他SLAF标签的MLOD值均低于5的标签,共上图4,593个,最终得到总图距为1,478.86cM的遗传图谱(图3)。染色体上标签的平均遗传距离为0.53cM。每条染色体的平均长度为73.94cM。标签数目最多的染色体为Gm03,有706个标签,总长度为101.35cM。标签数目最少的染色体为Gm12,有17个标签,总长度为17.27cM。此外,发现标记间间隔小于5cM的比例为95.72%(表1)。对上图标记在基因组上的位置和遗传图谱进行共线性分析,20条染色体上大部分标记的顺序与基因组保持一致,说明共线性较好,遗传重组率的计算准确度高(图4),在QTL区间内进行基因注释是可靠的。在图4中,横坐标是每个连锁群的遗传距离,纵坐表是每个连锁群的物理长度,其中以散点的形式表现Marker在基因组和遗传图谱的共线性关系。标记越呈现对角线的关系,表示遗传图与基因组的共线性越好。不同的颜色表示不同的染色体或连锁群。这部分内容委托百迈克生物科技有限公司完成。
偏分离现象普遍存在,本发明的上图标记中包含了4,394个偏分离标记,占标记总数的比例为95.67%,其中偏向父本黑河18的标签数目为1,611,偏向母本黑河43的数目为2,783。选择部分偏分离(卡方检验,P<0.01)的多态性标记进行图谱构建。
表1高密度遗传图谱信息
实施例6
大豆炸荚性状QTL定位
使用R/qtl软件包的完备区间作图法,根据两个环境下大豆炸荚表型,对炸荚相关性状进行QTL定位。用排列检验1000次进行阈值设定,首先考虑0.99置信度对应的LOD阈值,若没有定位区间,则考虑0.95置信度下对应的LOD阈值;若没有定位区间,则考虑0.90置信度的阈值。若仍没有结果,则没有考虑排列检验的结果,手动降低阈值到3.0;若3.0没有区间,则降到2.5。最终,选择LOD值为2.5,确定染色体上的QTL与炸荚性状是否相关。这部分内容委托百迈克生物科技有限公司完成。
利用R/qtl软件包的完备区间作图法,检测RILs在两个环境下与抗炸荚相关的QTLs。在本研究中,我们一共检测到4个相关的QTLs,分别位于1号,5号,8号染色体上(图5),解释的表型变异率变化范围为8.37%-24.443%(表2)。在这4个QTL中,3个QTL(qPD01,qPD05,qPD08-1)都解释了较高的表型变异率(>10%),其中位于5号和8号染色体上的QTL(qPD05,qPD08-1)可以在两年同时被检测到,在本研究的群体中,可认为是稳定的QTLs。而位于1号染色体上的QTL(qPD01)只能在2016年被检测到,解释了24.443%的表型变异率(表2)。这些QTL的加性效应都为负值,表明优异等位基因均来自于母本黑河43,其携带的等位基因起到了抗炸荚作用。
表2不同环境下的大豆炸荚QTL
aQTL的命名是大豆炸荚的组合;
b环境:E1表示2015年黑河种植,E2表示2016年黑河种植;
c染色体;
d两侧标记,QTL左右两侧的标记;
e区间,两个标记间的置信区间;
fLOD,概率对数值;
g加性效应;
h每个QTL解释的表型变异率。
实施例7
QTL区间内分子标记开发
本实施例针对QTL区间内两亲本的差异位点,针对SNP位点开发了CAPs(CleavedAmplified Polymorphic Sequence,CAPS)分子标记,并利用开发的分子标记对RILs基因型进行检测。利用在线软件dCAPS Finder 2.0(http://helix.wustl.edu/dcaps/dcaps.html)确认SNP位点酶切信息,其中qPD05存在限制性酶切位点,开发CAPS标记,选择内切酶HpaII作为候选标记所用酶。利用Primer3.0软件在候选CAPS标记两侧设计PCR引物(表3)。
以两亲本以及260份RILs基因组DNA为模板,PCR反应体系20μL,包括50ng基因组DNA、10×PCRbuffer,2mmol L-1dNTPs,2mmol L-1引物和1U Taq聚合酶(全式金生物技术有限公司)。PCR扩增程序为:94℃预变性4min,94℃变性30s,58℃退火40s,72℃延伸1min,34个循环,最后72℃延伸10min,于4℃保存。对PCR产物采用1.5%琼脂糖凝胶电泳检测。依照(NEW ENGLAND BioLabs)酶切方法,酶切体系10μL,包括PCR产物5μL,酶0.2μ10U/μL,1.5μLbuffer(NEB,www.neb.com/),ddH2O 3.3μL,于37℃恒温水浴中酶切40分钟。酶切产物经2%琼脂糖凝胶电泳检测。CAPS标记的酶切产物采用2%琼脂糖凝胶电泳检测。
表3引物序列信息
本实施例针对QTL区间内的差异位点,利用设计的引物(表3)对两亲本进行PCR扩增,均获得与目标片段长度大小相近的单一PCR产物。与Williams 82参考序列的比对分析显示,两亲本在目标SNP位置上存在差异,与预测一致。qPD05区间内的CAPS标记产生的PCR片段经HpaII酶切后理论上产生3个酶切产物,由于其中酶切后的两个片段长度相近,琼脂糖凝胶电泳图而无法分离两个条带,因此,只检测到2种酶切产物。未经酶切反应的DNA片段大小为540bp,等位变异为A;酶切反应的DNA片段为294bp和246bp,等位变异为G。已鉴定两亲本在4个SNP和Indel位点上的鉴定结果正确,表明开发的CAPS标记可用于260份RILs子代基因型鉴定。
实施例8
CAPS分子标记在杂交后代选择中的应用
利用分子标记检测分离群体后代,分析方法同实施例7。经鉴定,260份RILs群体中,有40份材料基因型为G,有220份材料基因型为A。与炸荚表型相比,鉴定效率为93.6%。
表明开发的Indel标记可用于260份RILs子代基因型鉴定。
实施例9
定位区间开发的CAPS分子标记在品种资源基因型鉴定中的应用
利用分子标记检测不同品种资源,鉴定36份栽培大豆和36份野生大豆基因型。引物序列为分子标记开发所用引物。扩增程序和扩增体系同实施例7。
经鉴定,36份栽培大豆中,有8份材料可以被酶切,基因型为G,有28份材料不能被酶切,基因型为A。36份野生大豆中,有18份材料可以被酶切,基因型为G,有18份材料不能被酶切,基因型为A。
由上述可知,利用开发的分子标记,鉴定18份鲜食大豆基因型。经鉴定,18份鲜食大豆中,有10份材料可以被酶切,基因型为G,有8份材料不能被酶切,基因型为A。
实施例10
定位区间开发的CAPS分子标记在基因聚合选择中的应用
利用5号染色体QTL以及其他2个QTL位点内4个分子标记同时分析,分析方法同实施例7(见表4),分子标记所用的引物序列见表5。Gm05-8939为此次开发得到的分子标记。
表4分子标记对抗炸荚的鉴定情况
表5分子标记引物序列
经鉴定分析,抗炸荚的鉴定效率达95%以上,表明开发的分子标记对抗炸荚的鉴定有效。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
序列表
<110> 中国农业科学院作物科学研究所
<120> 大豆抗炸荚主效QTLqPD05及其定位方法和应用
<160> 8
<170> SIPOSequenceListing 1.0
<210> 1
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
cctagctatt tcatcttcac ga 22
<210> 2
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
aatccttaca acgtacgtgt gt 22
<210> 3
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gattccagat ccacgttcat ctcct 25
<210> 4
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tccttccctt gtctcattac tcc 23
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aatatgacgt ggcagttggg 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
agcacatcaa gggagagaga 20
<210> 7
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
tgccataagc ataataaagt tac 23
<210> 8
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
acggagagcc atataaataa ctagt 25