CN117363774A

CN117363774A - 一种与大豆粒油分含量相关的分子标记及其应用

Info

Publication number: CN117363774A
Application number: CN202311332586.7A
Authority: CN
Inventors: 齐照明; 胡利民; 刘春燕; 冯学珍; 杨明亮; 陈庆山; 武小霞
Original assignee: Northeast Agricultural University
Current assignee: Northeast Agricultural University
Priority date: 2023-10-16
Filing date: 2023-10-16
Publication date: 2024-01-09

Abstract

本发明提供一种与大豆粒油分含量相关的分子标记及其应用。属于植物鉴定领域。为了快速和准确的筛选高油分优质大豆品种。本发明提供一种大豆粒油分含量相关的分子标记，所述分子标记的基因为Glyma.17G074400，且在2935位上的核苷酸位点为A或G，以及上述这些标记在制备检测大豆高油分含量的试剂盒中的应用和筛选方法。通过对标记的选择来实现对性状的选择，大幅度提高育种效率，实现定向改良大豆品种的作用即可以选择出高油分的大豆品种。

Description

一种与大豆粒油分含量相关的分子标记及其应用

技术领域

本发明属于植物鉴定领域，具体涉及一种与大豆粒油分含量相关的分子标记及其应用。

背景技术

大豆有着丰富的营养成分，油分在20％左右。人们可以通过食用大豆用以补充所需的营养物质，并且可以预防人体的心血管疾病，大豆同时是重要的油料作物，可以被加工为食用油，可以满足人们的饮食需求，同时主要由五种脂肪酸组成，而脂肪酸可以预防心脏病、癌症等。随着人们的生活水平日益提高，越来越多的人更多的注重于食用健康与食物的营养价值，因此对大豆的需求很大，但我国的大豆更多的是依赖于从其他国家进口，所以我国急需提高大豆油分含量及培育高油大豆品种，满足人们的日常所需。

大豆子粒的油分是品质相关性状，比较复杂的数量性状，受到多个基因控制，一直以来受到遗传特性和育种方法的限制，传统方法过于缓慢，随着科技的不断进步，分子辅助选择被提出，在传统杂交育种方法的基础上利用分子标记与决定目标性状的基因紧密连锁，通过对标记的选择来实现对性状的选择，大幅度提高育种效率，实现定向改良大豆品种的作用即可以选择出高油分的大豆品种。

发明内容

本发明的目的是为了快速和准确的筛选高油分优质大豆品种。

本发明提供一种大豆粒油分含量相关的分子标记，所述分子标记的基因为Glyma.17G074400，且在2935位上的核苷酸位点为A或G。

本发明提供一种扩增上述的分子标记的引物序列，正向引物序列为SEQ ID NO.2或SEQ ID NO.3所示；反向引物序列如SEQ ID NO.1所示。

本发明提供一种大豆粒油分含量相关的SNP位点，所述SNP位点位于大豆的17号染色体上的5831106位，所述位点的碱基为为A或G。

本发明提供一种扩增上述的SNP位点的引物序列，正向引物序列为SEQ ID NO.2或SEQ ID NO.3所示；反向引物序列如SEQ ID NO.1所示。

本发明提供一种上述的分子标记、上述的引物序列、上述的SNP位点或上述的引物序列在制备鉴定高油分含量的大豆或低油分含量的大豆的试剂盒中的应用。

本发明提供一种鉴定高油分含量的大豆或低蛋白含量的大豆的试剂盒，所述试剂盒包括上述的引物序列。

进一步地限定，所述试剂盒还包括Master Mix和水。

本发明提供一种鉴定大豆油分含量的方法，所述方法的具体步骤如下：

步骤1：提取待检测大豆的DNA；

步骤2：利用权利要求2所述的分子标记的引物序列或权利要求4所述的SNP位点的引物序列进行PCR反应，检测待检测品种的大豆为GG基因型则待检测品种的大豆为低油分含量的大豆，若为AA基因型则待检测品种的大豆为高油分含量的大豆。

进一步地限定，步骤2中的PCR反应的条件为：(1)热启动(Hot Start)：在95℃下保持30s，进行1个循环；(2)渐进降温(Touch down)：在95℃下保持60s，然后在63℃下保持20s，每个循环降温0.8℃，由63℃到55℃，共进行10个循环。(3)PCR扩增(PCR)：在95℃下保持60s，在55℃下保持20s，共进行30个循环。(4)平板读取(Plate Read)：在37℃下保持60s，进行1个循环。

进一步地限定，步骤2中的AA基因型为SNP位点的碱基为A，GG基因为SNP位点的碱基为G。

有益效果：本发明利用了来自5个资源杂交群体材料的1029份资源材料为实验群体。在相应亲本中序列比对初步筛选出发生突变的基因，针对突变位点设计引物选择有效的分子标记，采用SNP分子标记技术中的KASP技术在资源材料中进行验证，最后通过单倍型分析在重测序群体中再次验证并进行基因聚合。目的是确定有效的功能标记与重要候选基因，主要研究结果如下：

(1)得到并开发出与油分含量相关的SNP标记4个：Chr3：43490555、Chr12：1280727、Chr17：5830450、Chr17：5831106。

(2)得到与大豆油分含量相关SNP标记附近的重要候选基因为Glyma.03G219900、Glyma.12G018300、Glyma.17G074400。

附图说明

图1为与油分相关基因的序列比对结果图；

图2为与油分相关的SNP位点的候选基因的表达结果图；

图3为与油分相关SNP标记在亲本材料中的KASP基因分型结果图；

图4为不同群体材料蛋白、油分含量分布直方图；

图5为与油分相关SNP标记在资源材料中的KASP基因分型结果图；

图6为与油分相关SNP位点的高油分单倍型与低油分单倍型表型均值结果图；

图7为与油分相关有聚合效应的高油分与低油分表型均值结果图；

图8为重测序群体蛋白、油分含量分布直方图。

具体实施方式

实施例1.

1.利用了来自5个杂交群体资源材料的1029份材料。首先，选取绥农76、绥农69、绥农49、绥农35、绥农42、东生1号、绥无腥豆3号七个品种为亲本，进行杂交组合，品种特性如表1。杂交组合为绥农69×绥农76、绥农35×绥农76、东生1×绥农76、绥无腥3×绥农42、绥农49×绥农76。选取来自以上5个杂交组合F6代的1209份大豆种质资源作为实验群体，于2022年在黑龙江省农科院绥化分院试验田中种植，田间管理方法同大田管理。在营养生长阶段，采取植株顶端幼嫩的三出复叶用于提取DNA，进行KASP分型实验，待种子成熟后进行脱粒，用于测定蛋白质、油分含量。

其次，本研究利用来自大豆改良遗传实验室的643份已完成基因组重测序材料，进行单倍型分析与基因聚合。

表1杂交亲本品质特性

品种	品质性状
		绥农76	高蛋白品种，蛋白质含量46.78％，脂肪含量16.86％
绥农69	抗病品种，蛋白质含量40.57％，脂肪含量19.46％
		绥农49	特种品种(大粒品种)，蛋白质含量41.24％，脂肪含量21.57％
绥农35	高油大豆，蛋白含量42.17％，脂肪含量22.00％
		绥农42	高脂肪酸大豆品种，蛋白质含量40.68％，脂肪含量20.00％，
东生1号	蛋白质含量41.30％，脂肪含量19.97％
		绥无腥豆3号	无腥豆品种，蛋白质含量37.37％；脂肪含量21.81％

2.重要等位基因挖掘

重要等位基因挖掘是一种通过分析基因组数据与目标性状之间的相关性来筛选出与目标性状显著相关的位点，然后结合表型进一步判断等位基因对目标性状影响的方法。在本研究中，采用符合率来表示某一位点的效应。

为了初步筛选出与大豆油分蛋白相关的候选基因，首先，下载SoyBase(https://www.soybase.org/)数据平台中大豆基因序列作为模板，并在634份东北地区大豆核心种植测序资源中抽取出杂交组合亲本的基因序列，利用DNAMAN进行序列比对，筛选出位于CDS区并造成氨基酸改变的SNP位点，初步筛选出候选基因，并对其功能进行初步探究。其次，确定每对亲本所对应的SNP位点，针对位点设计特异性引物，采用SNP分子标记技术中的KASP技术在亲本材料中进行验证，筛选出能够区分等位基因的有效引物。最后，将有效引物在资源材料样本应在进行反应之前进行制备；KASP主混合物包括英国LGC公司的试剂盒，其中含有两种通用的淬灭荧光探针FAM和HEX，以及Taq酶等核心成分；而KASP分析混合物则包含两条正向引物和一条反向引物，其中两条正向引物是根据SNP位点前后序列特异性而设计的。这些引物与不同的等位基因相连，而在进行KASP程序时则会与FAM和HEX荧光探针相结合，产生不同的荧光结果。如果给定的SNP基因型为纯合，则会产生绿色或蓝色荧光信号；如果基因型为杂合，结果则显示为红色荧光信号。

根据上述原理，我们可在筛选得到的SNP位点上，选取对应的上下游50bp碱基序列，并利用Premier5.0软件设计KASP引物。引物共包括两条特异性正向引物(F1/F2)和一条公共反向引物(R)。正向引物不仅仅具备识别不同等位基因的特性，而且在一端还连有不同颜色的荧光标签FAM(GAAGGTGACCAAGTTCATGCT)和HEX(GAAGGTCGGAGTCAACGGATT)，以实现对PCR扩增产物的区分。各组分的具体配方参见表2-2。PCR反应以384孔板为载体，添加反应所需化学物质后，采用罗氏Light Cycler480Ⅱ实时荧光定量PCR仪进行反应。反应程序分为以下几个部分：(1)热启动(Hot Start)：在95℃下保持30s，进行1个循环；(2)渐进降温(Touch down)：在95℃下保持60s，然后在63℃下保持20s，每个循环降温0.8℃，由63℃到55℃，共进行10个循环。(3)PCR扩增(PCR)：在95℃下保持60s，在55℃下保持20s，共进行30个循环。(4)平板读取(Plate Read)：在37℃下保持60s，进行1个循环。PCR反应完成后，我们需要读取末端荧光信号。

表2KASP反应体系

表2引物序列

结果：为了初步确定与大豆油分含量相关的候选基因，本研究筛选了来自课题组所收集整理的与大豆子粒油分通路相关并结合MateQTL分析得到的重要基因，以及课题组已经发表的文章Meta-analysis and transcriptome profiling reveal hub genes forsoybean seed storage composition during seed development,大豆蛋白质、油分相关优异等位基因挖掘育种评价与筛选中所提及的重要基因。首先，利用SoyBase(https://www.soybase.org/)数据平台提取与大豆油分含量相关的重要基因的基因序列，并在634份东北地区大豆核心种质测序资源中抽取出杂交组合亲本绥农76、绥农69、绥农49、绥农35、绥农43的序列，另外根据已发表文章中与东生1号、绥无腥豆3号有关的基因序列，利用DNAMAN进行序列比对，筛选出位于CDS区并造成氨基酸改变的SNP位点，初步筛选出候选基因。

涉及大豆油分含量的109个基因的GO注释与生物过程详见附表A2。涉及脂肪酸合成、脂质代谢以及多种脂肪酸去饱和酶等功能。针对109重要基因，将在SoyBase平台下载的来源于美国品种Williams 82的大豆参考基因组与抽取的亲本序列在DNAMAN中比对，其中一个SNP位点比对结果如图1，绥农35×绥农76杂交组合中母本绥农35在基因由基因型T突变为A，且造成氨基酸的突变。

最终筛选出62个SNP位点，位于28个与油分相关的候选基因，其中基因Glyma.17G074400上有5个SNP位点，数量较多；其余位点在基因上分布较为均匀。对27个候选基因功能注释进行初步探究，例如Gprobable glycerol-3-phosphate acyltransferase是与膜相关的酶，在三酰甘油和磷脂的生成过程中发挥着关键作用；1-stearoyl-acylcarrier protein desaturase在不饱和脂肪酸生物合成中发挥着重要作用；omega-6脂肪酸脱饱和酶能够将omega-6脂肪酸的串联饱和，而3delta8-sphingolipid desaturase参与鞘脂酸代谢过程等。候选基因中包括Glyma.01G120400、Glyma.02G106300和Glyma.07G151300等多个基因与编码与脂质相关的酶和蛋白质相关，在细胞内脂质合成、分解和转运过程中发挥关键作用(如表3)。

表3与油分相关SNP标记附近的候选基因

使用SoyBase(https://www.soybase.org/)中RNA-seq数据集进行表达模式分析，将其结果用TBtool软件制成热图(图2)，图中所示橙色至绿色表示表达量由高到低。28个基因中有14个候选基因在子粒发育的各个时期均有表达，其中Glyma.02G106300、Glyma.09G195400、Glyma.12G027300等9个基因表达量较低；基因Glyma.12G018300表达量较高，尤其是在花中表达量最高；Glyma.07G030000、Glyma.08G212900、Glyma.14G095400、Glyma.18G120400等4个基因表达量差异最为显著。基因Glyma.07G030000在子粒发育期中Seed 14DAF表达量最低，Seed 28DAF达到峰值，为Seed 14DAF的2.5倍；基因Glyma.08G212900在其子粒发育期中Seed 25DAF表达量最低，Seed 21DAF达到峰值，为Seed21DAF的2.4倍；基因Glyma.14G09540在其子粒发育期中Seed 10DAF表达量最低，Seed42DAF达到峰值，为Seed 21DAF的8.8倍；基因Glyma.18G120400在其子粒发育期中Seed25DAF表达量最低，Seed 10DAF达到峰值，为Seed 25DAF的4.5倍。

为了初步确定与大豆油分含量相关的SNP位点，针对表1的28个与大豆油分相关的候选基因的62个SNP位点，提取位点上下游各50bp的碱基序列，利用Primer5.0软件(http：//www.premierbiosoft.com/index.html)设计KASP引物。将引物在杂交群体对应的亲本中进行验证，引物每对亲本至少进行三次重复试验，以提高结果的可信度。图3为众多结果中的一个，其中绿色和蓝色表示两种不同的纯合等位基因型，红色为杂合基因型。当引物在双亲中可以稳定的显示为不同的纯合基因型时，判断其具有较好的分型效果。根据KASP分型结果，最终筛选出17个具有较好分型效果的优异引物，如表4。

表4与油分相关的SNP分子标记位点

SNP编号	基因号	碱基	染色体	位置
					23	Glyma.02G106300	T/A	Chr2	10109326
54	Glyma.02G106300	G/A	Chr2	10109331
					30	Glyma.02G274900	T/A	Chr2	47624936
31	Glyma.02G274900	T/C	Chr2	47625857
					63	Glyma.03G219900	T/C	Chr3	43490555
39	Glyma.07G030000	T/G	Chr7	2392752
					40	Glyma.07G151300	G/T	Chr7	18219120
42	Glyma.08G212900	G/C	Chr8	17252809
					33	Glyma.09G250400	C/T	Chr9	47499468
29	Glyma.11G106300	G/A	Chr11	8085118
					16	Glyma.12G018300	C/A	Chr12	1280727
79	Glyma.14G119000	A/G	Chr14	33480275
					18	Glyma.14G119000	A/C	Chr14	33480631
19	Glyma.17G074400	T/C	Chr17	5830450
					50	Glyma.17G074400	T/C	Chr17	5831106
51	Glyma.17G074400	C/A	Chr17	5830396
					52	Glyma.17G074400	G/T	Chr17	5831106

这17个优异位点在大豆20条染色体上的具体分布数量为Chr02(4个)、Chr03(1个)、Chr07(2个)、Chr08(1个)、Chr09(1个)、Chr11(1个)、Chr12(1个)、Chr14(2个)、Chr17(4个)，可见Chr07染色体上分布的SNPs数量最多。不同杂交组合中的具体分布为绥农69×绥农76(6个)、东生1×绥农76(10个)、绥农35×绥农76(11个)、绥无腥3×绥农42(3个)、绥农49×绥农76(9个)，可见绥农35×绥农76杂交组合中聚合的SNPs较多。

3.KASP分型实验

将配好的KASP反应体系加入384小孔板中通过罗氏Light Cycler 480Ⅱ仪器得到实验结果，然后将结果导入Excel表格，结合表型数据处理分析，基本方法为：

(1)根据大豆子粒蛋白或油分表型将材料进行分类，并求出每组数据的平均值和标准差，然后根据平均值加减标准差的结果确定一个临界值；

(2)高于该值的材料称为高蛋白或高油分材料，低于该值的则称为低蛋白或低油分材料，使用该标准计算该基因位点符合率，即符合某表型特征的材料在总体中所占的比例。

(3)将KASP结果所得的样本数据按照高蛋白/油分材料和低蛋白/油分材料分别计数，并将两个数据相加得到总数，将符合的数量除以总数，得到符合率。然后，将高蛋白/油分材料和低蛋白/油分材料作为行，将含x等位基因与含y等位作为列，并最终构建出符合率的四格表(如表5)。根据四格表中的数据，分析检测方法的准确性和可靠性，以及可能的误判情况，并进行必要的改进。

(4)利用假设检验判断SNP位点是否与大豆蛋白油分含量相关：原假设H0表明含量大小与x/y等位基因相互独立，而HA则表明这两个变量存在相关性。借助计算，我们可以得到符合率P1和P2，并根据P1、P2以及设定的显著性水平α(60％)来判断是否需要拒绝H0假设，并接受HA假设。

表5符合率的四格表

	高蛋白/油分材料	低蛋白/油分材料
			含x等位基因	a	c
含y等位基因	b	d
			总数	M	N

注：x、y为SNP位点设计引物的KASP分型的基因型，a非测序高蛋白或高油分材料分型结果中有x等位基因数量，b为非测序低蛋白或低油分材料分型结果中有x等位基因数量，c为非测序高蛋白或高油分材料分型结果中有y等位基因数量，d为非测序低蛋白或低油分材料分型结果中有y等位基因数量，M为非测序高蛋白或高油分材料总数，N为非测序低蛋白或低油分材料的总数。

结果：

本研究针对来自5个杂交群体的F₅代材料，于2022年种植于绥化地区。其中，群体28为绥农69与绥农76杂交，父本为高蛋白品种，蛋白含量为46.78％，母本为抗病品种，共种植390株，收获并测量表型数据245株。群体122为绥农35与绥农76杂交，父本为高蛋白品种，蛋白含量为46.78，母本为高油品种，油分含量为22.00％，种植390株，收获并测量表型数据274株等。群体163为绥无腥豆3与绥农42杂交，父本为无腥豆品种，母本为高油酸品种，种植390株收获并测量205株等。其他杂交组合信息如表6，最终其后代共收获并测量1029株。

表6大豆资源材料信息

群体编号

母本

蛋白含量

油分含量

父本

蛋白含量

油分含量

材料数量

28

绥农69

40.57％

19.64％

绥农76

46.78％

16.86％

245

119

东生1

41.30％

19.97％

绥农76

46.78％

16.86％

212

122

绥农35

42.17％

22.00％

绥农76

46.78％

16.86％

274

163

绥无腥3

37.37％

21.81％

绥农42

40.68％

20.00％

205

167

绥农49

42.17％

19.97％

绥农76

46.78％

16.86％

272

通过Foss谷物分析仪测得其2022年的大豆子粒蛋白、油分表型数据，并利用SPSS软件进行了描述性统计分析。2022年材料蛋白含量最高为46.6％，最低为31.53％，平均值在36.5％～40.5％之间；油分含量最高为25.64％，最低为16.16％，平均值在18.46％～21.49％之间。表型数据分布较广且差异明显，符合数量性状遗传特点，通过分析峰度、偏度发现，该材料蛋白油分含量均为中等偏态分布，适合进行后续研究。

对不同杂交群体进行分析，由表7可知，五个群体中，绥农49×绥农76杂交组合蛋白含量最高，最大值为46.63％，平均值为40.49％；绥无腥3×绥农42杂交组合油分含量最高，最大值为25.64％，平均值为21.48％。蛋白含量标准差在1.24～2.40之间，变异系数在

3.39％～5.92％之间；油分含量标准差在0.72～1.37之间，变异系数在3.27％～6.84％之间，总体标准差较小，均无较大变幅。

表7不同群体蛋白、油分品质性状的描述性分析

将五个群体的蛋白油分表型数据利用GraphPad Prism 8软件绘制频率分布直方图，蛋白含量分布由30％～48％，组距为1；油分含量分布由16％～25％，组距为0.5。从图4中可以看出，测得各个群体的大豆子粒蛋白油分含量值均显示连续分布，而且正态分布趋势明显。其次从图中可以看出绥农49×绥农76杂交群体、绥农69×绥农76杂交群体总体蛋白含量较高，集中在40％以上，而其油分含量相对较低；绥无腥3×绥农42杂交群体油分含量较高集中在21％以上，其蛋白含量整体较低；绥农35×绥农76杂交群体蛋白含量集中在38％-41％，油分含量集中在19％-20.5％。

4.与油分相关SNP位点的验证

为了验证与油分相关优异等位基因，将筛选出的17个引物通过KASP平台进行分型验证，如果给定SNP的基因型是纯合的，荧光信号显示为绿色或蓝色，如果基因型是杂合，荧光信号结果显示为红色，图5为与油分相关SNP位点的KASP结果。

将KASP结果与油分表型结合分析：在Chr3:43490555处(图5中的(5))：高油分材料有21份TT基因型，符合率为53.85％，低油分材料有26份AA基因型，符合率为78.79％；在Chr12:1280727处(图5中的(12))：高油分材料有23份GG基因型，符合率为88.64％，低油分材料有16份AA基因型，符合率为55.14％；在Chr17:5830450处(图5中的(16))：高油分材料有45份TT基因型，符合率为55.56％，低油分材料有56份CC基因型，符合率为67.47％；在Chr17:5831106处(图5中的(17))：高油分材料有27份AA基因型，符合率为54.00％，低油分材料有30份GG基因型，符合率为88.83％。以上四个SNP标记，均能成功分型且在高低蛋白中表现不同的基因型，能较好的区分高低蛋白材料，如表8。

表8与大豆子粒油分相关的SNP标记的筛选结果

注：“*”表示为筛选效果较好的优异SNP位点

最终在资源材料中确定的与大豆油分含量相关的SNP位点有4个，位于3个重要候选基因：Glyma.03G219900(Chr3:43490555)、Glyma.12G018300(Chr12:1280727)、Glyma.17G074400(Chr17:5830450)、Glyma.17G074400(Chr17:5831106)如表9，其中杂交组合绥农69×绥农76含有SNP编号为51、52处的2个突变位点；杂交组合绥农35×绥农76含有SNP编号为51、52处的2个突变位点；杂交组合东生1×绥农76含有SNP编号为63、79处的2个突变位点；杂交组合绥无腥3×绥农42含有SNP编号为63、79、51、52处的4个突变位点；杂交组合绥农49×绥农76含有SNP编号为63、51处的2个突变位点。杂交组合绥无腥3×绥农42聚合有最多的油分相关SNP位点，且其油分量为5个群体中最高，油分含量较高集中在21％以上，最高值为25.64％，可见其表型与基因型相一致。

表9与大豆油分相关的SNP基因型

SNP编号	基因号	位置	母本基因型及表型	父本基因型及表型
					63	Glyma.03G219900	Chr3:43490555	T(高油分)	A(低油分)
79	Glyma.12G018300	Chr12:1280727	A(低油分)	G(高油分)
					51	Glyma.17G074400	Chr17:5830450	T(高油分)	C(低油分)
52	Glyma.17G074400	Chr17:5831106	A(高油分)	G(低油分)

5.单倍型分析

将挖掘到的候选基因在重测序群体中进行验证，利用软件对候选基因在643份重测序材料中进行单倍型分析，具体方法如下：

(1)利用SoyBase(https://www.soybase.org/)数据平台来提取大豆蛋白油分候选基因的基因组序列，并结合重测序群体的基因组信息，检索所有候选基因，并筛选出存在的SNP位点的重要候选基因。

(2)然后将相近的SNP位点分为一组进行单倍型分析，分析重要候选基因组序列信息中单倍型与表型的关系。

(3)使用GraphPad Prism 8软件绘制箱线图，并分析每个重要候选基因中不同单倍型与其表型之间的显著性差异。显著性分析使用单因素ANOVA模型中最小显著差数(LSD)方法，检测方差齐性并进行多重比较。

为了进行单倍型分析，利用本实验室提供的2018、2019两年的643重测序资源群体的表型数据，以及该群体重测序基因型数据进行后续研究。其蛋白油分含量两年的BIUP值如图8，其2个品质性状变异系数在4.7％～4.9％之间，较为稳定，均无较大变幅；其蛋白性状表现为中等偏态分布，油分性状为高偏态分布，适用于后续试验。

为了进一步确定重要候选基因与大豆子粒油分含量的关系，对3个重要候选基因的SNP位点进行单倍型分析，并将接近位点分成一组进行联合分析，每组产生不同的单倍型。分析643个测序材料中单倍型的比例，并计算不同单倍型的表型均值，进行方差分析。最终分析得到2组平均油分表型存在较大差异的高油分单倍型和低油分单倍型(如图6)。

在基因Glyma.17G074400处分析得到高油分优异单倍型Hap_4(TCAGTCCCG)和低油分单倍型Hap_5(TTAGTCCCG)，高油分优异单倍型占55.1％油分含量平均值为21.1％，低油分单倍型占10.1％，油分含量平均值为20.4％；在基因Glyma.12G018300处分析得到高油分优异单倍型Hap_1(TCGAGGGAGGTCAA)和低油分单倍型Hap_7(CCAAGGGAGGTCAC)，高油分优异单倍型占61.7％，油分含量平均值为21.1％，低油分单倍型占14.2％，油分含量平均值为20.4％。以上两个基因在油分含量方面均达到显著差异。在基因Glyma.03G219900上分析得到高油分优异单倍型Hap_2(CCGAGTTAGC)和低油分单倍型Hap_1(CCGAGTAAGC)，高油分优异单倍型占6.7％，油分含量平均值为21.1％，低油分单倍型占84.3％，油分含量平均值为20.8％。

为了进一步确定在高油分材料中的优异单倍型是否有协同作用，在643份重测序群体中对材料进行聚合分析(如表10)。选取130份油分含量高于21.5％的高油分材料，统计单倍型占比并分析其聚合效应：在基因Glyma.12G018300处分析得到，有110份材料含有高油分基因型Hap_1(TCGAGGGAGGTCAA)，占高油分材料的84.6％；在基因Glyma.17G074400处分析得到，有106份材料含有高油分基因型Hap_4(TCAGTCCCG)，占高油分材料的80.8％；在基因Glyma.03G219900处分析得到，有11份材料含有高油分基因型Hap_2(CCGAGTTAGC)，占高油分材料的7.1％。在130份材料中，有89份材料同时聚合了Glyma.12G018300Hap_1(TCGAGGGAGGTCAA)和Glyma.17G074400Hap_4(TCAGTCCCG)高油分基因型，占高油分材料的68.5％，判断其有较高的聚合效应。

选取180份油分含量低于20.5％的低油分材料，统计单倍型占比并分析其聚合效应：在基因Glyma.12G018300处分析得到，有38份材料含有低油分基因型Hap_7(CCAAGGGAGGTCAC)，占低油分材料的21.1％；在基因Glyma.17G074400处分析得到，有25份材料含有低油分基因型Hap_5(TTAGTCCCG)，占低油分材料的13.9％；在基因Glyma.03G219900处分析得到，有149份材料含有低油分基因型Hap_1(CCGAGTAAGC)，占低油分材料的82.8％。在180份材料中，有37份材料同时聚合了Glyma.12G018300Hap_7(CCAAGGGAGGTCAC)和Glyma.03G219900Hap_1(CCGAGTAAGC)低油分基因型，占低油分材料的20.6％，判断其有较高的聚合效应。

表10与油分相关参与聚合的优异单倍型

基因	高油分基因型	材料	低油分基因型	材料
					Glyma.12G018300	Hap_1(TCGAGGGAGGTCAA)	110	Hap_7(CCAAGGGAGGTCAC)	38
Glyma.17G074400	Hap_4(TCAGTCCCG)	106	Hap_5(TTAGTCCCG)	25
					Glyma.03G219900	Hap_2(CCGAGTTAGC)	11	Hap_1(CCGAGTAAGC)	149

最终聚合后的油分含量表型如图7，高油基因型中所聚合的89份材料中，油分含量最高为23.11％，最低为20.511％，平均值为21.88％；低油基因型中所聚合的37份材料中，油分含量最高为20.46％，最低为17.87％，平均值为19.73％。

实施例2.

一、一种筛选高油分大豆的试剂盒：

扩增分子标记的正向引物序列为SEQ ID NO.2或SEQ ID NO.3所示；反向引物序列如SEQ ID NO.1所示；扩增SNP1的下游引物的核苷酸序列如反向引物序列如SEQ ID NO.1所示；

二、筛选方法：

选择未知大豆油分含量的样品，利用步骤一所述的筛选高油分大豆的试剂盒，进行PCR扩增程序：(1)热启动(Hot Start)：在95℃下保持30s，进行1个循环；(2)渐进降温(Touch down)：在95℃下保持60s，然后在63℃下保持20s，每个循环降温0.8℃，由63℃到55℃，共进行10个循环。(3)PCR扩增(PCR)：在95℃下保持60s，在55℃下保持20s，共进行30个循环。(4)平板读取(Plate Read)：在37℃下保持60s，进行1个循环。经过KASP分析，步骤如下：

本发明还提供了一种鉴定高油分含量大豆的方法，所述方法的具体步骤为：

(1)提取待检测大豆的DNA；

(2)利用SEQ ID NO.2或SEQ ID NO.3和SEQ ID NO.1进行PCR反应，检测待检测品种的大豆为GG基因型则待检测品种的大豆为低油分含量的大豆，若为AA基因型则待检测品种的大豆为高油分含量的大豆。

结果：检测未知的大豆蛋白含量的样品中大豆油分含量，利用引物标记标记为AA基因型，大豆高油分的含量与标记检测得到的基因型是相符的。大豆低油分的含量与标记检测得到的基因型是相符的。

Claims

1.一种大豆粒油分含量相关的分子标记，其特征在于，所述分子标记的基因为Glyma.17G074400，且在2935位上的核苷酸位点为A或G。

2.扩增权利要求1所述的分子标记的引物序列，其特征在于，正向引物序列为SEQ IDNO.2或SEQ ID NO.3所示；反向引物序列如SEQ ID NO.1所示。

3.一种大豆粒油分含量相关的SNP位点，其特征在于，所述SNP位点位于大豆的17号染色体上的5831106位，所述位点的碱基为为A或G。

4.扩增权利要求3所述的SNP位点的引物序列，其特征在于，正向引物序列为SEQ IDNO.2或SEQ ID NO.3所示；反向引物序列如SEQ ID NO.1所示。

5.权利要求1所述的分子标记、权利要求2所述的引物序列、权利要求3所述的SNP位点或权利要求4所述的引物序列在制备鉴定高油分含量的大豆或低油分含量的大豆的试剂盒中的应用。

6.一种鉴定高油分含量的大豆或低蛋白含量的大豆的试剂盒，其特征在于，所述试剂盒包括权利要求2或权利要求4所述的引物序列。

7.根据权利要求6所述的得试剂盒，其特征在于，所述试剂盒还包括Master Mix和水。

8.一种鉴定大豆油分含量的方法，其特征在于，所述方法的具体步骤如下：

步骤1：提取待检测大豆的DNA；

9.根据权利要求8所述的方法，其特征在于，步骤2中的PCR反应的条件为：xx。

10.根据权利要求8所述的方法，其特征在于，步骤2中的AA基因型为SNP位点的碱基为A，GG基因为SNP位点的碱基为G。