CN117363774A - 一种与大豆粒油分含量相关的分子标记及其应用 - Google Patents
一种与大豆粒油分含量相关的分子标记及其应用 Download PDFInfo
- Publication number
- CN117363774A CN117363774A CN202311332586.7A CN202311332586A CN117363774A CN 117363774 A CN117363774 A CN 117363774A CN 202311332586 A CN202311332586 A CN 202311332586A CN 117363774 A CN117363774 A CN 117363774A
- Authority
- CN
- China
- Prior art keywords
- soybean
- oil
- oil content
- content
- glyma
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000012424 soybean oil Nutrition 0.000 title claims abstract description 28
- 239000003549 soybean oil Substances 0.000 title claims abstract description 27
- 239000003147 molecular marker Substances 0.000 title claims abstract description 19
- 239000003921 oil Substances 0.000 claims abstract description 141
- 235000019198 oils Nutrition 0.000 claims abstract description 126
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 89
- 235000010469 Glycine max Nutrition 0.000 claims abstract description 58
- 244000068988 Glycine max Species 0.000 claims abstract description 58
- 238000000034 method Methods 0.000 claims abstract description 14
- 239000002773 nucleotide Substances 0.000 claims abstract description 4
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 4
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 210000000349 chromosome Anatomy 0.000 claims description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 2
- 238000012216 screening Methods 0.000 abstract description 13
- 230000000694 effects Effects 0.000 abstract description 12
- 241000196324 Embryophyta Species 0.000 abstract description 9
- 238000009395 breeding Methods 0.000 abstract description 5
- 230000001488 breeding effect Effects 0.000 abstract description 3
- 239000000463 material Substances 0.000 description 70
- 102000054766 genetic haplotypes Human genes 0.000 description 31
- 238000004458 analytical method Methods 0.000 description 27
- 235000018102 proteins Nutrition 0.000 description 27
- 102000004169 proteins and genes Human genes 0.000 description 27
- 108700028369 Alleles Proteins 0.000 description 17
- 238000009396 hybridization Methods 0.000 description 15
- 238000012408 PCR amplification Methods 0.000 description 12
- 238000009826 distribution Methods 0.000 description 11
- 238000012163 sequencing technique Methods 0.000 description 11
- 238000006116 polymerization reaction Methods 0.000 description 9
- 230000035772 mutation Effects 0.000 description 8
- 101150036080 at gene Proteins 0.000 description 7
- 101150009243 HAP1 gene Proteins 0.000 description 6
- 244000046052 Phaseolus vulgaris Species 0.000 description 5
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 5
- 108010073771 Soybean Proteins Proteins 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 241000406588 Amblyseius Species 0.000 description 4
- 239000000306 component Substances 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 235000019710 soybean protein Nutrition 0.000 description 4
- 101100240528 Caenorhabditis elegans nhr-23 gene Proteins 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 3
- 238000001816 cooling Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 235000014113 dietary fatty acids Nutrition 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 229930195729 fatty acid Natural products 0.000 description 3
- 239000000194 fatty acid Substances 0.000 description 3
- 150000004665 fatty acids Chemical class 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 102000009114 Fatty acid desaturases Human genes 0.000 description 2
- 108010087894 Fatty acid desaturases Proteins 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 229940033080 omega-6 fatty acid Drugs 0.000 description 2
- 235000020665 omega-6 fatty acid Nutrition 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000008117 seed development Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 1
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 1
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 101710091951 Glycerol-3-phosphate acyltransferase Proteins 0.000 description 1
- 101000690100 Homo sapiens U1 small nuclear ribonucleoprotein 70 kDa Proteins 0.000 description 1
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 1
- 239000005642 Oleic acid Substances 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 101100495925 Schizosaccharomyces pombe (strain 972 / ATCC 24843) chr3 gene Proteins 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- 102100024121 U1 small nuclear ribonucleoprotein 70 kDa Human genes 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000020930 dietary requirements Nutrition 0.000 description 1
- 239000008157 edible vegetable oil Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 230000004136 fatty acid synthesis Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 208000024348 heart neoplasm Diseases 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 1
- 230000037356 lipid metabolism Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000010197 meta-analysis Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- 238000001543 one-way ANOVA Methods 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000009738 saturating Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 229940001941 soy protein Drugs 0.000 description 1
- 241000894007 species Species 0.000 description 1
- WWUZIQQURGPMPG-KRWOKUGFSA-N sphingosine Chemical compound CCCCCCCCCCCCC\C=C\[C@@H](O)[C@@H](N)CO WWUZIQQURGPMPG-KRWOKUGFSA-N 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 150000003626 triacylglycerols Chemical class 0.000 description 1
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 1
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 230000009105 vegetative growth Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P60/00—Technologies relating to agriculture, livestock or agroalimentary industries
- Y02P60/80—Food processing, e.g. use of renewable energies or variable speed drives in handling, conveying or stacking
- Y02P60/87—Re-use of by-products of food processing for fodder production
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种与大豆粒油分含量相关的分子标记及其应用。属于植物鉴定领域。为了快速和准确的筛选高油分优质大豆品种。本发明提供一种大豆粒油分含量相关的分子标记,所述分子标记的基因为Glyma.17G074400,且在2935位上的核苷酸位点为A或G,以及上述这些标记在制备检测大豆高油分含量的试剂盒中的应用和筛选方法。通过对标记的选择来实现对性状的选择,大幅度提高育种效率,实现定向改良大豆品种的作用即可以选择出高油分的大豆品种。
Description
技术领域
本发明属于植物鉴定领域,具体涉及一种与大豆粒油分含量相关的分子标记及其应用。
背景技术
大豆有着丰富的营养成分,油分在20%左右。人们可以通过食用大豆用以补充所需的营养物质,并且可以预防人体的心血管疾病,大豆同时是重要的油料作物,可以被加工为食用油,可以满足人们的饮食需求,同时主要由五种脂肪酸组成,而脂肪酸可以预防心脏病、癌症等。随着人们的生活水平日益提高,越来越多的人更多的注重于食用健康与食物的营养价值,因此对大豆的需求很大,但我国的大豆更多的是依赖于从其他国家进口,所以我国急需提高大豆油分含量及培育高油大豆品种,满足人们的日常所需。
大豆子粒的油分是品质相关性状,比较复杂的数量性状,受到多个基因控制,一直以来受到遗传特性和育种方法的限制,传统方法过于缓慢,随着科技的不断进步,分子辅助选择被提出,在传统杂交育种方法的基础上利用分子标记与决定目标性状的基因紧密连锁,通过对标记的选择来实现对性状的选择,大幅度提高育种效率,实现定向改良大豆品种的作用即可以选择出高油分的大豆品种。
发明内容
本发明的目的是为了快速和准确的筛选高油分优质大豆品种。
本发明提供一种大豆粒油分含量相关的分子标记,所述分子标记的基因为Glyma.17G074400,且在2935位上的核苷酸位点为A或G。
本发明提供一种扩增上述的分子标记的引物序列,正向引物序列为SEQ ID NO.2或SEQ ID NO.3所示;反向引物序列如SEQ ID NO.1所示。
本发明提供一种大豆粒油分含量相关的SNP位点,所述SNP位点位于大豆的17号染色体上的5831106位,所述位点的碱基为为A或G。
本发明提供一种扩增上述的SNP位点的引物序列,正向引物序列为SEQ ID NO.2或SEQ ID NO.3所示;反向引物序列如SEQ ID NO.1所示。
本发明提供一种上述的分子标记、上述的引物序列、上述的SNP位点或上述的引物序列在制备鉴定高油分含量的大豆或低油分含量的大豆的试剂盒中的应用。
本发明提供一种鉴定高油分含量的大豆或低蛋白含量的大豆的试剂盒,所述试剂盒包括上述的引物序列。
进一步地限定,所述试剂盒还包括Master Mix和水。
本发明提供一种鉴定大豆油分含量的方法,所述方法的具体步骤如下:
步骤1:提取待检测大豆的DNA;
步骤2:利用权利要求2所述的分子标记的引物序列或权利要求4所述的SNP位点的引物序列进行PCR反应,检测待检测品种的大豆为GG基因型则待检测品种的大豆为低油分含量的大豆,若为AA基因型则待检测品种的大豆为高油分含量的大豆。
进一步地限定,步骤2中的PCR反应的条件为:(1)热启动(Hot Start):在95℃下保持30s,进行1个循环;(2)渐进降温(Touch down):在95℃下保持60s,然后在63℃下保持20s,每个循环降温0.8℃,由63℃到55℃,共进行10个循环。(3)PCR扩增(PCR):在95℃下保持60s,在55℃下保持20s,共进行30个循环。(4)平板读取(Plate Read):在37℃下保持60s,进行1个循环。
进一步地限定,步骤2中的AA基因型为SNP位点的碱基为A,GG基因为SNP位点的碱基为G。
有益效果:本发明利用了来自5个资源杂交群体材料的1029份资源材料为实验群体。在相应亲本中序列比对初步筛选出发生突变的基因,针对突变位点设计引物选择有效的分子标记,采用SNP分子标记技术中的KASP技术在资源材料中进行验证,最后通过单倍型分析在重测序群体中再次验证并进行基因聚合。目的是确定有效的功能标记与重要候选基因,主要研究结果如下:
(1)得到并开发出与油分含量相关的SNP标记4个:Chr3:43490555、Chr12:1280727、Chr17:5830450、Chr17:5831106。
(2)得到与大豆油分含量相关SNP标记附近的重要候选基因为Glyma.03G219900、Glyma.12G018300、Glyma.17G074400。
附图说明
图1为与油分相关基因的序列比对结果图;
图2为与油分相关的SNP位点的候选基因的表达结果图;
图3为与油分相关SNP标记在亲本材料中的KASP基因分型结果图;
图4为不同群体材料蛋白、油分含量分布直方图;
图5为与油分相关SNP标记在资源材料中的KASP基因分型结果图;
图6为与油分相关SNP位点的高油分单倍型与低油分单倍型表型均值结果图;
图7为与油分相关有聚合效应的高油分与低油分表型均值结果图;
图8为重测序群体蛋白、油分含量分布直方图。
具体实施方式
实施例1.
1.利用了来自5个杂交群体资源材料的1029份材料。首先,选取绥农76、绥农69、绥农49、绥农35、绥农42、东生1号、绥无腥豆3号七个品种为亲本,进行杂交组合,品种特性如表1。杂交组合为绥农69×绥农76、绥农35×绥农76、东生1×绥农76、绥无腥3×绥农42、绥农49×绥农76。选取来自以上5个杂交组合F6代的1209份大豆种质资源作为实验群体,于2022年在黑龙江省农科院绥化分院试验田中种植,田间管理方法同大田管理。在营养生长阶段,采取植株顶端幼嫩的三出复叶用于提取DNA,进行KASP分型实验,待种子成熟后进行脱粒,用于测定蛋白质、油分含量。
其次,本研究利用来自大豆改良遗传实验室的643份已完成基因组重测序材料,进行单倍型分析与基因聚合。
表1杂交亲本品质特性
品种 | 品质性状 |
绥农76 | 高蛋白品种,蛋白质含量46.78%,脂肪含量16.86% |
绥农69 | 抗病品种,蛋白质含量40.57%,脂肪含量19.46% |
绥农49 | 特种品种(大粒品种),蛋白质含量41.24%,脂肪含量21.57% |
绥农35 | 高油大豆,蛋白含量42.17%,脂肪含量22.00% |
绥农42 | 高脂肪酸大豆品种,蛋白质含量40.68%,脂肪含量20.00%, |
东生1号 | 蛋白质含量41.30%,脂肪含量19.97% |
绥无腥豆3号 | 无腥豆品种,蛋白质含量37.37%;脂肪含量21.81% |
2.重要等位基因挖掘
重要等位基因挖掘是一种通过分析基因组数据与目标性状之间的相关性来筛选出与目标性状显著相关的位点,然后结合表型进一步判断等位基因对目标性状影响的方法。在本研究中,采用符合率来表示某一位点的效应。
为了初步筛选出与大豆油分蛋白相关的候选基因,首先,下载SoyBase(https://www.soybase.org/)数据平台中大豆基因序列作为模板,并在634份东北地区大豆核心种植测序资源中抽取出杂交组合亲本的基因序列,利用DNAMAN进行序列比对,筛选出位于CDS区并造成氨基酸改变的SNP位点,初步筛选出候选基因,并对其功能进行初步探究。其次,确定每对亲本所对应的SNP位点,针对位点设计特异性引物,采用SNP分子标记技术中的KASP技术在亲本材料中进行验证,筛选出能够区分等位基因的有效引物。最后,将有效引物在资源材料样本应在进行反应之前进行制备;KASP主混合物包括英国LGC公司的试剂盒,其中含有两种通用的淬灭荧光探针FAM和HEX,以及Taq酶等核心成分;而KASP分析混合物则包含两条正向引物和一条反向引物,其中两条正向引物是根据SNP位点前后序列特异性而设计的。这些引物与不同的等位基因相连,而在进行KASP程序时则会与FAM和HEX荧光探针相结合,产生不同的荧光结果。如果给定的SNP基因型为纯合,则会产生绿色或蓝色荧光信号;如果基因型为杂合,结果则显示为红色荧光信号。
根据上述原理,我们可在筛选得到的SNP位点上,选取对应的上下游50bp碱基序列,并利用Premier5.0软件设计KASP引物。引物共包括两条特异性正向引物(F1/F2)和一条公共反向引物(R)。正向引物不仅仅具备识别不同等位基因的特性,而且在一端还连有不同颜色的荧光标签FAM(GAAGGTGACCAAGTTCATGCT)和HEX(GAAGGTCGGAGTCAACGGATT),以实现对PCR扩增产物的区分。各组分的具体配方参见表2-2。PCR反应以384孔板为载体,添加反应所需化学物质后,采用罗氏Light Cycler480Ⅱ实时荧光定量PCR仪进行反应。反应程序分为以下几个部分:(1)热启动(Hot Start):在95℃下保持30s,进行1个循环;(2)渐进降温(Touch down):在95℃下保持60s,然后在63℃下保持20s,每个循环降温0.8℃,由63℃到55℃,共进行10个循环。(3)PCR扩增(PCR):在95℃下保持60s,在55℃下保持20s,共进行30个循环。(4)平板读取(Plate Read):在37℃下保持60s,进行1个循环。PCR反应完成后,我们需要读取末端荧光信号。
表2KASP反应体系
表2引物序列
结果:为了初步确定与大豆油分含量相关的候选基因,本研究筛选了来自课题组所收集整理的与大豆子粒油分通路相关并结合MateQTL分析得到的重要基因,以及课题组已经发表的文章Meta-analysis and transcriptome profiling reveal hub genes forsoybean seed storage composition during seed development,大豆蛋白质、油分相关优异等位基因挖掘育种评价与筛选中所提及的重要基因。首先,利用SoyBase(https://www.soybase.org/)数据平台提取与大豆油分含量相关的重要基因的基因序列,并在634份东北地区大豆核心种质测序资源中抽取出杂交组合亲本绥农76、绥农69、绥农49、绥农35、绥农43的序列,另外根据已发表文章中与东生1号、绥无腥豆3号有关的基因序列,利用DNAMAN进行序列比对,筛选出位于CDS区并造成氨基酸改变的SNP位点,初步筛选出候选基因。
涉及大豆油分含量的109个基因的GO注释与生物过程详见附表A2。涉及脂肪酸合成、脂质代谢以及多种脂肪酸去饱和酶等功能。针对109重要基因,将在SoyBase平台下载的来源于美国品种Williams 82的大豆参考基因组与抽取的亲本序列在DNAMAN中比对,其中一个SNP位点比对结果如图1,绥农35×绥农76杂交组合中母本绥农35在基因由基因型T突变为A,且造成氨基酸的突变。
最终筛选出62个SNP位点,位于28个与油分相关的候选基因,其中基因Glyma.17G074400上有5个SNP位点,数量较多;其余位点在基因上分布较为均匀。对27个候选基因功能注释进行初步探究,例如Gprobable glycerol-3-phosphate acyltransferase是与膜相关的酶,在三酰甘油和磷脂的生成过程中发挥着关键作用;1-stearoyl-acylcarrier protein desaturase在不饱和脂肪酸生物合成中发挥着重要作用;omega-6脂肪酸脱饱和酶能够将omega-6脂肪酸的串联饱和,而3delta8-sphingolipid desaturase参与鞘脂酸代谢过程等。候选基因中包括Glyma.01G120400、Glyma.02G106300和Glyma.07G151300等多个基因与编码与脂质相关的酶和蛋白质相关,在细胞内脂质合成、分解和转运过程中发挥关键作用(如表3)。
表3与油分相关SNP标记附近的候选基因
使用SoyBase(https://www.soybase.org/)中RNA-seq数据集进行表达模式分析,将其结果用TBtool软件制成热图(图2),图中所示橙色至绿色表示表达量由高到低。28个基因中有14个候选基因在子粒发育的各个时期均有表达,其中Glyma.02G106300、Glyma.09G195400、Glyma.12G027300等9个基因表达量较低;基因Glyma.12G018300表达量较高,尤其是在花中表达量最高;Glyma.07G030000、Glyma.08G212900、Glyma.14G095400、Glyma.18G120400等4个基因表达量差异最为显著。基因Glyma.07G030000在子粒发育期中Seed 14DAF表达量最低,Seed 28DAF达到峰值,为Seed 14DAF的2.5倍;基因Glyma.08G212900在其子粒发育期中Seed 25DAF表达量最低,Seed 21DAF达到峰值,为Seed21DAF的2.4倍;基因Glyma.14G09540在其子粒发育期中Seed 10DAF表达量最低,Seed42DAF达到峰值,为Seed 21DAF的8.8倍;基因Glyma.18G120400在其子粒发育期中Seed25DAF表达量最低,Seed 10DAF达到峰值,为Seed 25DAF的4.5倍。
为了初步确定与大豆油分含量相关的SNP位点,针对表1的28个与大豆油分相关的候选基因的62个SNP位点,提取位点上下游各50bp的碱基序列,利用Primer5.0软件(http://www.premierbiosoft.com/index.html)设计KASP引物。将引物在杂交群体对应的亲本中进行验证,引物每对亲本至少进行三次重复试验,以提高结果的可信度。图3为众多结果中的一个,其中绿色和蓝色表示两种不同的纯合等位基因型,红色为杂合基因型。当引物在双亲中可以稳定的显示为不同的纯合基因型时,判断其具有较好的分型效果。根据KASP分型结果,最终筛选出17个具有较好分型效果的优异引物,如表4。
表4与油分相关的SNP分子标记位点
SNP编号 | 基因号 | 碱基 | 染色体 | 位置 |
23 | Glyma.02G106300 | T/A | Chr2 | 10109326 |
54 | Glyma.02G106300 | G/A | Chr2 | 10109331 |
30 | Glyma.02G274900 | T/A | Chr2 | 47624936 |
31 | Glyma.02G274900 | T/C | Chr2 | 47625857 |
63 | Glyma.03G219900 | T/C | Chr3 | 43490555 |
39 | Glyma.07G030000 | T/G | Chr7 | 2392752 |
40 | Glyma.07G151300 | G/T | Chr7 | 18219120 |
42 | Glyma.08G212900 | G/C | Chr8 | 17252809 |
33 | Glyma.09G250400 | C/T | Chr9 | 47499468 |
29 | Glyma.11G106300 | G/A | Chr11 | 8085118 |
16 | Glyma.12G018300 | C/A | Chr12 | 1280727 |
79 | Glyma.14G119000 | A/G | Chr14 | 33480275 |
18 | Glyma.14G119000 | A/C | Chr14 | 33480631 |
19 | Glyma.17G074400 | T/C | Chr17 | 5830450 |
50 | Glyma.17G074400 | T/C | Chr17 | 5831106 |
51 | Glyma.17G074400 | C/A | Chr17 | 5830396 |
52 | Glyma.17G074400 | G/T | Chr17 | 5831106 |
这17个优异位点在大豆20条染色体上的具体分布数量为Chr02(4个)、Chr03(1个)、Chr07(2个)、Chr08(1个)、Chr09(1个)、Chr11(1个)、Chr12(1个)、Chr14(2个)、Chr17(4个),可见Chr07染色体上分布的SNPs数量最多。不同杂交组合中的具体分布为绥农69×绥农76(6个)、东生1×绥农76(10个)、绥农35×绥农76(11个)、绥无腥3×绥农42(3个)、绥农49×绥农76(9个),可见绥农35×绥农76杂交组合中聚合的SNPs较多。
3.KASP分型实验
将配好的KASP反应体系加入384小孔板中通过罗氏Light Cycler 480Ⅱ仪器得到实验结果,然后将结果导入Excel表格,结合表型数据处理分析,基本方法为:
(1)根据大豆子粒蛋白或油分表型将材料进行分类,并求出每组数据的平均值和标准差,然后根据平均值加减标准差的结果确定一个临界值;
(2)高于该值的材料称为高蛋白或高油分材料,低于该值的则称为低蛋白或低油分材料,使用该标准计算该基因位点符合率,即符合某表型特征的材料在总体中所占的比例。
(3)将KASP结果所得的样本数据按照高蛋白/油分材料和低蛋白/油分材料分别计数,并将两个数据相加得到总数,将符合的数量除以总数,得到符合率。然后,将高蛋白/油分材料和低蛋白/油分材料作为行,将含x等位基因与含y等位作为列,并最终构建出符合率的四格表(如表5)。根据四格表中的数据,分析检测方法的准确性和可靠性,以及可能的误判情况,并进行必要的改进。
(4)利用假设检验判断SNP位点是否与大豆蛋白油分含量相关:原假设H0表明含量大小与x/y等位基因相互独立,而HA则表明这两个变量存在相关性。借助计算,我们可以得到符合率P1和P2,并根据P1、P2以及设定的显著性水平α(60%)来判断是否需要拒绝H0假设,并接受HA假设。
表5符合率的四格表
高蛋白/油分材料 | 低蛋白/油分材料 | |
含x等位基因 | a | c |
含y等位基因 | b | d |
总数 | M | N |
注:x、y为SNP位点设计引物的KASP分型的基因型,a非测序高蛋白或高油分材料分型结果中有x等位基因数量,b为非测序低蛋白或低油分材料分型结果中有x等位基因数量,c为非测序高蛋白或高油分材料分型结果中有y等位基因数量,d为非测序低蛋白或低油分材料分型结果中有y等位基因数量,M为非测序高蛋白或高油分材料总数,N为非测序低蛋白或低油分材料的总数。
结果:
本研究针对来自5个杂交群体的F5代材料,于2022年种植于绥化地区。其中,群体28为绥农69与绥农76杂交,父本为高蛋白品种,蛋白含量为46.78%,母本为抗病品种,共种植390株,收获并测量表型数据245株。群体122为绥农35与绥农76杂交,父本为高蛋白品种,蛋白含量为46.78,母本为高油品种,油分含量为22.00%,种植390株,收获并测量表型数据274株等。群体163为绥无腥豆3与绥农42杂交,父本为无腥豆品种,母本为高油酸品种,种植390株收获并测量205株等。其他杂交组合信息如表6,最终其后代共收获并测量1029株。
表6大豆资源材料信息
群体编号 | 母本 | 蛋白含量 | 油分含量 | 父本 | 蛋白含量 | 油分含量 | 材料数量 |
28 | 绥农69 | 40.57% | 19.64% | 绥农76 | 46.78% | 16.86% | 245 |
119 | 东生1 | 41.30% | 19.97% | 绥农76 | 46.78% | 16.86% | 212 |
122 | 绥农35 | 42.17% | 22.00% | 绥农76 | 46.78% | 16.86% | 274 |
163 | 绥无腥3 | 37.37% | 21.81% | 绥农42 | 40.68% | 20.00% | 205 |
167 | 绥农49 | 42.17% | 19.97% | 绥农76 | 46.78% | 16.86% | 272 |
通过Foss谷物分析仪测得其2022年的大豆子粒蛋白、油分表型数据,并利用SPSS软件进行了描述性统计分析。2022年材料蛋白含量最高为46.6%,最低为31.53%,平均值在36.5%~40.5%之间;油分含量最高为25.64%,最低为16.16%,平均值在18.46%~21.49%之间。表型数据分布较广且差异明显,符合数量性状遗传特点,通过分析峰度、偏度发现,该材料蛋白油分含量均为中等偏态分布,适合进行后续研究。
对不同杂交群体进行分析,由表7可知,五个群体中,绥农49×绥农76杂交组合蛋白含量最高,最大值为46.63%,平均值为40.49%;绥无腥3×绥农42杂交组合油分含量最高,最大值为25.64%,平均值为21.48%。蛋白含量标准差在1.24~2.40之间,变异系数在
3.39%~5.92%之间;油分含量标准差在0.72~1.37之间,变异系数在3.27%~6.84%之间,总体标准差较小,均无较大变幅。
表7不同群体蛋白、油分品质性状的描述性分析
将五个群体的蛋白油分表型数据利用GraphPad Prism 8软件绘制频率分布直方图,蛋白含量分布由30%~48%,组距为1;油分含量分布由16%~25%,组距为0.5。从图4中可以看出,测得各个群体的大豆子粒蛋白油分含量值均显示连续分布,而且正态分布趋势明显。其次从图中可以看出绥农49×绥农76杂交群体、绥农69×绥农76杂交群体总体蛋白含量较高,集中在40%以上,而其油分含量相对较低;绥无腥3×绥农42杂交群体油分含量较高集中在21%以上,其蛋白含量整体较低;绥农35×绥农76杂交群体蛋白含量集中在38%-41%,油分含量集中在19%-20.5%。
4.与油分相关SNP位点的验证
为了验证与油分相关优异等位基因,将筛选出的17个引物通过KASP平台进行分型验证,如果给定SNP的基因型是纯合的,荧光信号显示为绿色或蓝色,如果基因型是杂合,荧光信号结果显示为红色,图5为与油分相关SNP位点的KASP结果。
将KASP结果与油分表型结合分析:在Chr3:43490555处(图5中的(5)):高油分材料有21份TT基因型,符合率为53.85%,低油分材料有26份AA基因型,符合率为78.79%;在Chr12:1280727处(图5中的(12)):高油分材料有23份GG基因型,符合率为88.64%,低油分材料有16份AA基因型,符合率为55.14%;在Chr17:5830450处(图5中的(16)):高油分材料有45份TT基因型,符合率为55.56%,低油分材料有56份CC基因型,符合率为67.47%;在Chr17:5831106处(图5中的(17)):高油分材料有27份AA基因型,符合率为54.00%,低油分材料有30份GG基因型,符合率为88.83%。以上四个SNP标记,均能成功分型且在高低蛋白中表现不同的基因型,能较好的区分高低蛋白材料,如表8。
表8与大豆子粒油分相关的SNP标记的筛选结果
注:“*”表示为筛选效果较好的优异SNP位点
最终在资源材料中确定的与大豆油分含量相关的SNP位点有4个,位于3个重要候选基因:Glyma.03G219900(Chr3:43490555)、Glyma.12G018300(Chr12:1280727)、Glyma.17G074400(Chr17:5830450)、Glyma.17G074400(Chr17:5831106)如表9,其中杂交组合绥农69×绥农76含有SNP编号为51、52处的2个突变位点;杂交组合绥农35×绥农76含有SNP编号为51、52处的2个突变位点;杂交组合东生1×绥农76含有SNP编号为63、79处的2个突变位点;杂交组合绥无腥3×绥农42含有SNP编号为63、79、51、52处的4个突变位点;杂交组合绥农49×绥农76含有SNP编号为63、51处的2个突变位点。杂交组合绥无腥3×绥农42聚合有最多的油分相关SNP位点,且其油分量为5个群体中最高,油分含量较高集中在21%以上,最高值为25.64%,可见其表型与基因型相一致。
表9与大豆油分相关的SNP基因型
SNP编号 | 基因号 | 位置 | 母本基因型及表型 | 父本基因型及表型 |
63 | Glyma.03G219900 | Chr3:43490555 | T(高油分) | A(低油分) |
79 | Glyma.12G018300 | Chr12:1280727 | A(低油分) | G(高油分) |
51 | Glyma.17G074400 | Chr17:5830450 | T(高油分) | C(低油分) |
52 | Glyma.17G074400 | Chr17:5831106 | A(高油分) | G(低油分) |
5.单倍型分析
将挖掘到的候选基因在重测序群体中进行验证,利用软件对候选基因在643份重测序材料中进行单倍型分析,具体方法如下:
(1)利用SoyBase(https://www.soybase.org/)数据平台来提取大豆蛋白油分候选基因的基因组序列,并结合重测序群体的基因组信息,检索所有候选基因,并筛选出存在的SNP位点的重要候选基因。
(2)然后将相近的SNP位点分为一组进行单倍型分析,分析重要候选基因组序列信息中单倍型与表型的关系。
(3)使用GraphPad Prism 8软件绘制箱线图,并分析每个重要候选基因中不同单倍型与其表型之间的显著性差异。显著性分析使用单因素ANOVA模型中最小显著差数(LSD)方法,检测方差齐性并进行多重比较。
为了进行单倍型分析,利用本实验室提供的2018、2019两年的643重测序资源群体的表型数据,以及该群体重测序基因型数据进行后续研究。其蛋白油分含量两年的BIUP值如图8,其2个品质性状变异系数在4.7%~4.9%之间,较为稳定,均无较大变幅;其蛋白性状表现为中等偏态分布,油分性状为高偏态分布,适用于后续试验。
为了进一步确定重要候选基因与大豆子粒油分含量的关系,对3个重要候选基因的SNP位点进行单倍型分析,并将接近位点分成一组进行联合分析,每组产生不同的单倍型。分析643个测序材料中单倍型的比例,并计算不同单倍型的表型均值,进行方差分析。最终分析得到2组平均油分表型存在较大差异的高油分单倍型和低油分单倍型(如图6)。
在基因Glyma.17G074400处分析得到高油分优异单倍型Hap_4(TCAGTCCCG)和低油分单倍型Hap_5(TTAGTCCCG),高油分优异单倍型占55.1%油分含量平均值为21.1%,低油分单倍型占10.1%,油分含量平均值为20.4%;在基因Glyma.12G018300处分析得到高油分优异单倍型Hap_1(TCGAGGGAGGTCAA)和低油分单倍型Hap_7(CCAAGGGAGGTCAC),高油分优异单倍型占61.7%,油分含量平均值为21.1%,低油分单倍型占14.2%,油分含量平均值为20.4%。以上两个基因在油分含量方面均达到显著差异。在基因Glyma.03G219900上分析得到高油分优异单倍型Hap_2(CCGAGTTAGC)和低油分单倍型Hap_1(CCGAGTAAGC),高油分优异单倍型占6.7%,油分含量平均值为21.1%,低油分单倍型占84.3%,油分含量平均值为20.8%。
为了进一步确定在高油分材料中的优异单倍型是否有协同作用,在643份重测序群体中对材料进行聚合分析(如表10)。选取130份油分含量高于21.5%的高油分材料,统计单倍型占比并分析其聚合效应:在基因Glyma.12G018300处分析得到,有110份材料含有高油分基因型Hap_1(TCGAGGGAGGTCAA),占高油分材料的84.6%;在基因Glyma.17G074400处分析得到,有106份材料含有高油分基因型Hap_4(TCAGTCCCG),占高油分材料的80.8%;在基因Glyma.03G219900处分析得到,有11份材料含有高油分基因型Hap_2(CCGAGTTAGC),占高油分材料的7.1%。在130份材料中,有89份材料同时聚合了Glyma.12G018300Hap_1(TCGAGGGAGGTCAA)和Glyma.17G074400Hap_4(TCAGTCCCG)高油分基因型,占高油分材料的68.5%,判断其有较高的聚合效应。
选取180份油分含量低于20.5%的低油分材料,统计单倍型占比并分析其聚合效应:在基因Glyma.12G018300处分析得到,有38份材料含有低油分基因型Hap_7(CCAAGGGAGGTCAC),占低油分材料的21.1%;在基因Glyma.17G074400处分析得到,有25份材料含有低油分基因型Hap_5(TTAGTCCCG),占低油分材料的13.9%;在基因Glyma.03G219900处分析得到,有149份材料含有低油分基因型Hap_1(CCGAGTAAGC),占低油分材料的82.8%。在180份材料中,有37份材料同时聚合了Glyma.12G018300Hap_7(CCAAGGGAGGTCAC)和Glyma.03G219900Hap_1(CCGAGTAAGC)低油分基因型,占低油分材料的20.6%,判断其有较高的聚合效应。
表10与油分相关参与聚合的优异单倍型
基因 | 高油分基因型 | 材料 | 低油分基因型 | 材料 |
Glyma.12G018300 | Hap_1(TCGAGGGAGGTCAA) | 110 | Hap_7(CCAAGGGAGGTCAC) | 38 |
Glyma.17G074400 | Hap_4(TCAGTCCCG) | 106 | Hap_5(TTAGTCCCG) | 25 |
Glyma.03G219900 | Hap_2(CCGAGTTAGC) | 11 | Hap_1(CCGAGTAAGC) | 149 |
最终聚合后的油分含量表型如图7,高油基因型中所聚合的89份材料中,油分含量最高为23.11%,最低为20.511%,平均值为21.88%;低油基因型中所聚合的37份材料中,油分含量最高为20.46%,最低为17.87%,平均值为19.73%。
实施例2.
一、一种筛选高油分大豆的试剂盒:
扩增分子标记的正向引物序列为SEQ ID NO.2或SEQ ID NO.3所示;反向引物序列如SEQ ID NO.1所示;扩增SNP1的下游引物的核苷酸序列如反向引物序列如SEQ ID NO.1所示;
二、筛选方法:
选择未知大豆油分含量的样品,利用步骤一所述的筛选高油分大豆的试剂盒,进行PCR扩增程序:(1)热启动(Hot Start):在95℃下保持30s,进行1个循环;(2)渐进降温(Touch down):在95℃下保持60s,然后在63℃下保持20s,每个循环降温0.8℃,由63℃到55℃,共进行10个循环。(3)PCR扩增(PCR):在95℃下保持60s,在55℃下保持20s,共进行30个循环。(4)平板读取(Plate Read):在37℃下保持60s,进行1个循环。经过KASP分析,步骤如下:
本发明还提供了一种鉴定高油分含量大豆的方法,所述方法的具体步骤为:
(1)提取待检测大豆的DNA;
(2)利用SEQ ID NO.2或SEQ ID NO.3和SEQ ID NO.1进行PCR反应,检测待检测品种的大豆为GG基因型则待检测品种的大豆为低油分含量的大豆,若为AA基因型则待检测品种的大豆为高油分含量的大豆。
结果:检测未知的大豆蛋白含量的样品中大豆油分含量,利用引物标记标记为AA基因型,大豆高油分的含量与标记检测得到的基因型是相符的。大豆低油分的含量与标记检测得到的基因型是相符的。
Claims (10)
1.一种大豆粒油分含量相关的分子标记,其特征在于,所述分子标记的基因为Glyma.17G074400,且在2935位上的核苷酸位点为A或G。
2.扩增权利要求1所述的分子标记的引物序列,其特征在于,正向引物序列为SEQ IDNO.2或SEQ ID NO.3所示;反向引物序列如SEQ ID NO.1所示。
3.一种大豆粒油分含量相关的SNP位点,其特征在于,所述SNP位点位于大豆的17号染色体上的5831106位,所述位点的碱基为为A或G。
4.扩增权利要求3所述的SNP位点的引物序列,其特征在于,正向引物序列为SEQ IDNO.2或SEQ ID NO.3所示;反向引物序列如SEQ ID NO.1所示。
5.权利要求1所述的分子标记、权利要求2所述的引物序列、权利要求3所述的SNP位点或权利要求4所述的引物序列在制备鉴定高油分含量的大豆或低油分含量的大豆的试剂盒中的应用。
6.一种鉴定高油分含量的大豆或低蛋白含量的大豆的试剂盒,其特征在于,所述试剂盒包括权利要求2或权利要求4所述的引物序列。
7.根据权利要求6所述的得试剂盒,其特征在于,所述试剂盒还包括Master Mix和水。
8.一种鉴定大豆油分含量的方法,其特征在于,所述方法的具体步骤如下:
步骤1:提取待检测大豆的DNA;
步骤2:利用权利要求2所述的分子标记的引物序列或权利要求4所述的SNP位点的引物序列进行PCR反应,检测待检测品种的大豆为GG基因型则待检测品种的大豆为低油分含量的大豆,若为AA基因型则待检测品种的大豆为高油分含量的大豆。
9.根据权利要求8所述的方法,其特征在于,步骤2中的PCR反应的条件为:xx。
10.根据权利要求8所述的方法,其特征在于,步骤2中的AA基因型为SNP位点的碱基为A,GG基因为SNP位点的碱基为G。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311332586.7A CN117363774A (zh) | 2023-10-16 | 2023-10-16 | 一种与大豆粒油分含量相关的分子标记及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311332586.7A CN117363774A (zh) | 2023-10-16 | 2023-10-16 | 一种与大豆粒油分含量相关的分子标记及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117363774A true CN117363774A (zh) | 2024-01-09 |
Family
ID=89392278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311332586.7A Pending CN117363774A (zh) | 2023-10-16 | 2023-10-16 | 一种与大豆粒油分含量相关的分子标记及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117363774A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117887885A (zh) * | 2024-01-12 | 2024-04-16 | 河北省农林科学院粮油作物研究所 | 大豆油分含量相关主效单核苷酸多态性位点及其应用 |
-
2023
- 2023-10-16 CN CN202311332586.7A patent/CN117363774A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117887885A (zh) * | 2024-01-12 | 2024-04-16 | 河北省农林科学院粮油作物研究所 | 大豆油分含量相关主效单核苷酸多态性位点及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113322339B (zh) | 一种大豆高蛋白含量相关的分子标记和鉴定高蛋白含量大豆的方法 | |
CN112280881B (zh) | 用于青花菜种质资源和品种鉴定的snp标记组合及应用 | |
CN117363774A (zh) | 一种与大豆粒油分含量相关的分子标记及其应用 | |
CN117363773A (zh) | 一种位于大豆17号染色体上的大豆粒油分含量相关的分子标记及其应用 | |
CN115852032B (zh) | 与豇豆豆荚颜色相关的基因、kasp标记及其应用 | |
CN110894542A (zh) | 一种鉴别水稻gs5基因和glw7基因类型的引物及其应用 | |
CN114231658B (zh) | 一种位于大豆1号染色体上与高油分相关的分子标记及其应用 | |
CN113186334B (zh) | 一种大豆高油分相关的分子标记和鉴定高油分大豆的方法 | |
CN116926229A (zh) | 一种与油菜种子高维生素E主效QTL位点qVE.C02紧密连锁的分子标记及应用 | |
CN109504798B (zh) | 一种基于高分辨率溶解曲线鉴定梨果核大小的snp标记及其应用 | |
CN114606339B (zh) | 与南瓜肌醇含量主效qtl连锁的kasp分子标记及其应用 | |
CN117587155A (zh) | 一种位于大豆3号染色体上的大豆粒油分含量相关的分子标记及其应用 | |
CN117604139A (zh) | 一种位于大豆12号染色体上的大豆粒油分含量相关的分子标记及其应用 | |
CN117230227A (zh) | 与豇豆花青素含量紧密连锁的snp位点、kasp标记及其应用 | |
CN114525360A (zh) | 与茄子绿果色Gv1基因紧密连锁的SNP标记与应用 | |
CN117418030A (zh) | 一种位于大豆7号染色体上的大豆粒蛋白含量相关的分子标记及其应用 | |
CN117467793A (zh) | 一种位于大豆17号染色体上的大豆粒蛋白含量相关的分子标记及其应用 | |
CN117305501A (zh) | 一种位于大豆14号染色体上的大豆粒蛋白含量相关的分子标记及其应用 | |
CN117344051A (zh) | 一种位于大豆3号染色体上的大豆粒蛋白含量相关的分子标记及其应用 | |
CN117418029A (zh) | 一种位于大豆2号染色体上的大豆粒蛋白含量相关的分子标记及其应用 | |
CN110257548B (zh) | 基于SSR标记及qPCR检测枇杷非整倍体分子核型的方法 | |
CN114990251B (zh) | 与油菜甲基硒代半胱氨酸含量性状qtl紧密连锁的分子标记及其应用 | |
Chepkoech et al. | Assessment of genetic variability of passion fruit using simple sequence repeat (SSR) markers | |
CN114854896B (zh) | 与油菜甲基硒代半胱氨酸含量性状QTL紧密连锁的分子标记BnMes-2C1及应用 | |
CN110317894B (zh) | 与三七总根重紧密连锁的snp分子标记及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |