CN116240307B - 一种用于花生高产育种鉴定的分子标记及应用 - Google Patents
一种用于花生高产育种鉴定的分子标记及应用 Download PDFInfo
- Publication number
- CN116240307B CN116240307B CN202310186984.6A CN202310186984A CN116240307B CN 116240307 B CN116240307 B CN 116240307B CN 202310186984 A CN202310186984 A CN 202310186984A CN 116240307 B CN116240307 B CN 116240307B
- Authority
- CN
- China
- Prior art keywords
- yield
- peanut
- molecular marker
- snp
- arahy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000020232 peanut Nutrition 0.000 title claims abstract description 62
- 239000003147 molecular marker Substances 0.000 title claims abstract description 21
- 238000009395 breeding Methods 0.000 title claims abstract description 13
- 230000001488 breeding effect Effects 0.000 title claims abstract description 13
- 241001553178 Arachis glabrata Species 0.000 title claims abstract 15
- 235000010777 Arachis hypogaea Nutrition 0.000 claims abstract description 49
- 235000017060 Arachis glabrata Nutrition 0.000 claims abstract description 48
- 235000018262 Arachis monticola Nutrition 0.000 claims abstract description 48
- 239000000463 material Substances 0.000 claims abstract description 42
- 210000000349 chromosome Anatomy 0.000 claims abstract description 18
- 238000000034 method Methods 0.000 claims description 8
- 238000001816 cooling Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 239000003153 chemical reaction reagent Substances 0.000 claims description 2
- 239000003550 marker Substances 0.000 claims description 2
- 238000012098 association analyses Methods 0.000 abstract description 10
- 238000010219 correlation analysis Methods 0.000 abstract description 4
- 244000105624 Arachis hypogaea Species 0.000 description 48
- 238000012360 testing method Methods 0.000 description 26
- 238000012163 sequencing technique Methods 0.000 description 19
- 235000013399 edible fruits Nutrition 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 8
- 238000003205 genotyping method Methods 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 239000008157 edible vegetable oil Substances 0.000 description 4
- 235000014571 nuts Nutrition 0.000 description 4
- 239000003921 oil Substances 0.000 description 4
- 235000019198 oils Nutrition 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000007844 allele-specific PCR Methods 0.000 description 3
- 230000002860 competitive effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 230000009418 agronomic effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 102000054766 genetic haplotypes Human genes 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 244000025352 Artocarpus heterophyllus Species 0.000 description 1
- 235000008725 Artocarpus heterophyllus Nutrition 0.000 description 1
- 101001018064 Homo sapiens Lysosomal-trafficking regulator Proteins 0.000 description 1
- 102100033472 Lysosomal-trafficking regulator Human genes 0.000 description 1
- 244000038561 Modiola caroliniana Species 0.000 description 1
- 235000010703 Modiola caroliniana Nutrition 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012214 genetic breeding Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000003234 polygenic effect Effects 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/6895—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/13—Plant traits
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Abstract
本发明提供一种用于花生高产育种鉴定的分子标记及应用。利用全基因组关联分析发现一个与产量相关的重要SNP位点,所述分子标记为SNP位点Arahy.16_142692237,位于花生16号染色体上,其前后各200bp的序列如SEQ ID NO.1所示。对花生进行10倍深度的重测序,鉴定出631,988个SNP,大大超过所需的SNP标记的数量,为关联分析位点的准确性提供了保证。利用本发明标记SNP位点Arahy.16_142692237,可直接用于花生后代材料早代鉴定,基因型为GG的为高产材料,基因型为AA的为低产材料。
Description
技术领域
本发明涉及一种用于花生高产育种鉴定的分子标记及应用,属于植物遗传育种领域。
背景技术
花生(Arachishypogaea L.)为豆目豆科花生属,是我国重要的经济作物和油料作物,2021年全国花生播种面积475.81万公顷,单产达3866.30kg/ha。花生籽仁中脂肪含量占约50%,是我国主要的食物植物油来源之一,尽管我国花生产量有逐年增加的趋势,但由于人口增加、消费层次的变化,我国食用植物油仍然非常短缺,自给率不到40%,大部分依赖进口。另外,国际贸易摩擦对我国食用植物油安全带来了严峻的挑战,所以培育高产花生新品种是我们当前的主要目标。
花生产量是由百果重、百仁重、荚果长和荚果宽等多个性状构成的多基因控制的数量性状。近年来有关花生产量性状位点的研究逐渐深入,Huang等在F2:3群体中定位到了2个与百果重相关的主效QTL,Chen、Luo、Wang均利用RIL群体在多个环境中检测到控制百果重和百仁重的相关QTL,Zhang等在A02和B06上检测到控制百仁重、籽仁长和籽仁宽的QTL位点。Gangurde等利用NUM群体,检测到控制百果重和百仁重的QTL位点位于A05、A06、B05和B06上。
随着测序技术的发展,全基因组关联分析在农业中的运用越来越广,它是基于连锁不平衡现象,分析表型数据和基因型数据,进而定位到决定目标性状位点的方法。利用全基因组关联分析能够有效获得控制花生主要农艺性状的显著性SNP(Single NucleotidePolymorphism)位点,发掘产量性状关键位点和基因,它需要准确的表型数据和有一定深度的基因型数据,对群体材料没有过多的限制。花生产量的研究需要发掘更多的、新的控制产量性状相关的位点,利用不同群体材料会更多可能的发掘新的产量位点。花生是产油效率最高的油料作物,发展花生生产有利于保障我国食用植物油供给安全、农业经济高质量发展,实现乡村振兴。
发明内容
针对现有技术的不足,本发明的目的是提供一种用于花生高产育种鉴定的分子标记及应用。本发明利用全基因组关联分析,获得控制产量相关重要SNP位点Arahy.16_142692237,并开发了分子标记,可直接用于花生高产育种材料分子鉴定,以提高育种效率。
为了实现上述目的,本发明所采用的技术方案是:
1、选择花生自然群体(大于100份)进行多年多点表型数据测定和处理。将花生自然群体在多年多点条件下种植,考察产量性状(百果重、百仁重、市斤果数、半斤仁数、荚果长和荚果宽),去除错误值、异常值,利用对照品种矫正肥力差异,采用混合线性模型对产量性状进行矫正计算BLUP值(最佳线性无偏预测值)。
2、对花生栽培种开选016进行从头测序、组装,对群体中的每份材料进行二代重测序(深度10×),以开选016位参考基因组并进行多态性变异位点检测,获得基因型数据。质控标准为:SNP位点在样品的缺失率Miss<=0.2、次等位基因频率Maf>=0.05。
3、结合表型数据和基因型数据开展全基因组关联分析,探索花生产量性状相关的显著性关联的SNP位点。
4、对显著性SNP开展汇总统计分析、表型变异率分析和连锁Block(区块)分析,锁定SNP位点Arahy.16_142692237。
5、提取群体中所有材料在该位点的基因型,对显著性位点进行箱线图分型分析,高产基因型为GG,低产基因型为AA。
6、利用KASP(竞争性等位基因特异性PCR)技术进行基因分型验证,开发产量分子标记。
7、利用分子标记对育种材料进行鉴定,进行低世代选择,快速筛选高产材料,提高育种效率。
本申请提供一种用于花生高产育种鉴定的分子标记,所述分子标记为SNP位点Arahy.16_142692237,位于花生16号染色体上;所述SNP位点Arahy.16_142692237前后各200bp的序列如SEQ ID NO.1所示。
用于检测所述分子标记的KASP引物组,所述引物组为:
primer_X:GAAGGTGACCAAGTTCATGCTATTTTTGTGAGAACTACTCCGAATGG;
primer_Y:GAAGGTCGGAGTCAACGGATTAAATTTTTGTGAGAACTACTCCGAATGA;
primer_C:ATCTCCACAGGAAAAATTTTCCACCATC。
所述KASP引物组的检测试剂或试剂盒。
所述分子标记的KASP引物组鉴定花生高产的方法,包括以下步骤:
(1)提取待鉴定花生材料的DNA,利用分子标记的KASP引物组进行PCR鉴定;
(2)若分子标记Arahy.16_142692237位点的基因型为GG,则待鉴定花生材料为高产;若分子标记Arahy.16_142692237位点的基因型为AA,则待鉴定花生材料为低产。
所述PCR的反应程序为:a)94℃、15min;b)94℃、20s,61℃、60s,以0.6℃/循环的速度降温,10次循环;c)94℃、20s,55℃、60s,26次循环;d)94℃、20s,57℃、60s,3次循环。
所述的分子标记在花生高产育种中的应用。
本发明有益效果:
1、本发明利用全基因组关联分析发现一个与产量相关的重要SNP位点,对花生进行10倍深度的重测序,鉴定出631,988个SNP,大大超过所需的SNP标记的数量,是迄今为止花生中最丰富的高质量SNP基因座,为关联分析位点的准确性提供了保证。
2、本发明199份材料均为花生栽培种开选016的衍生材料,对开选016进行从头测序、组装,并以其为参考基因组开展关联分析,更容易获得品质性状位点,结果也更为可靠。
3、本发明对P值(P value)较高、PVE(表型变异解释率)大于8%的显著性SNP位点进行了两方面的验证,挖掘出研究材料中独有的优异标记位点。一方面用极端表型材料的基因型探索基因型分布(箱线图),另一方面对有明显基因分型的显著性位点设计1对Kasp(竞争性等位基因特异性PCR)引物,用本研究中的199份材料进行基因型验证。
4、利用本发明标记SNP位点Arahy.16_142692237,可直接用于花生后代材料早代鉴定,基因型为GG的为高产材料,基因型为AA的为低产材料。
附图说明
图1.百果重、百仁重和市斤果数的表型正态分布图。
其中,横坐标HPW为百果重,HSW为百仁重,NP为市斤果数;纵坐标为表型值频率。E1为2019年开封试点;E2为2019年信阳试点;E3为2020年开封试点;E4为2021年开封试点。
图2.半斤仁数、荚果长和荚果宽的表型正态分布图。
其中,横坐标NS为半斤仁数,PL为荚果长,PW为荚果宽;纵坐标为表型值频率。E1为2019年开封试点;E2为2019年信阳试点;E3为2020年开封试点;E4为2021年开封试点。
图3.SNP在花生染色体上的密度分布。
其中,图示为1M窗口内SNP位点的分布;Chr1-20为花生20条染色体;右侧色阶为染色体上SNP的密度。
图4.百果重在4个环境中的曼哈顿图和QQ plot图。
其中,左侧为曼哈顿图,HPW为产量性状百果重;Chromosome为1-20号染色体;水平虚线为显著性阈值7.10;E1为2019年开封试点;E2为2019年信阳试点;E3为2020年开封试点;E4为2021年开封试点。
右侧为QQplot图,横坐标代表理论的P值,纵坐标代表实际的P值(下图3-8同)。
图5.百仁重在4个环境中的曼哈顿图和QQ plot图。
其中,HSW为产量性状百仁重。
图6.市斤果数在4个环境中的曼哈顿图和QQ plot图。
其中,NP为产量性状市斤果数。
图7.半斤仁数在4个环境中的曼哈顿图和QQ plot图。
其中,NS为产量性状半斤仁数。
图8.荚果长在4个环境中的曼哈顿图和QQ plot图。
其中,PL为产量性状荚果长。
图9.荚果宽在4个环境中的曼哈顿图和QQ plot图。
其中,PW为产量性状荚果宽。
图10.Arahy 16_139632313的区块连锁图。
其中,蓝色横条为16号染色体216.56kb区域,上面的绿色线条为SNP,紫红色圆点为Arahy16_139632313位点,它与其它26个SNP组成了1个较大的block,该block中的snp是紧密连锁遗传的;D'是标准化的连锁不平衡系数。
图11.Arahy.16_142692237处百果重、百仁重和市斤果数中两种碱基类型之间的表型差异。其中,HPW为百果重;HSW为百仁重;NP为市斤果数;横坐标GG/AA为Arahy.16_142692237处不同的基因型;纵坐标为田间表型观测值;E1为2019年开封试点;E2为2019年信阳试点;E3为2020年开封试点;E4为2021年开封试点。
图12.Arahy.16_142692237处半斤仁数、荚果长和荚果宽中两种碱基类型之间的表型差异。其中,NS为半斤仁数;PL为荚果长;PW为荚果宽;
横坐标GG/AA为Arahy.16_142692237处不同的基因型;纵坐标为田间表型观测值;E1为2019年开封试点;E2为2019年信阳试点;E3为2020年开封试点;E4为2021年开封试点。
图13.Arahy 16_142692237处SNP分型的KASP验证。
其中,左上圆形信号为AA基因型;右下圆形信号为GG基因型;其余为空白对照和未检测到信号的样品。
具体实施方式
以下结合实施例对本发明的具体实施方式作进一步详细说明。
本实验涉及的199份花生材料的信息如下表1,其中来源于开封的花生品种或品系均由开封市农林科学研究院选育,来源于石家庄的冀花系列花生品种均由河北省农林科学院提供,来源于武汉的中花系列花生品种均由中国农科院油料作物研究所提供,K198(AT1-1)从美国乔治亚洲引种而来。
表1 199份花生材料信息
实施例1表型数据处理
1.田间试验设计
将199份材料分别于2019年开封(E1)、2019年信阳(E2)、2020年开封(E3)和2021年开封(E4)的试验田进行种植。4组试验环境均采用随机区组排列试验设计,每个材料种植小区面积13.34m2(6.67m×2m),穴距20cm,行距40cm,3次重复。试验田肥力中等,排水灌溉方便,地势平坦,沙壤土。在花生生长期间,及时进行田间管理和收获。
2.农艺性状调查及品质测定
收获晒干后,考察199份材料的6个产量性状指标,包括百果重(hundred-podweight,HPW)、百仁重(hundred-seed weight,HSW)、市斤果数(No.of pod per 500g,NP)、半斤仁数(No.of seed per 250g,NS)、荚果长(pod length,PL)和荚果宽(pod width,PW),产量性状考察标准参考刘洪等著《花生新品种DUS测试原理与技术》。
3.表型数据处理
利用Microsoft Excel 2010整理、计算表型数据(HPW、HSW、NP、NS、PL、PW),删除错误值和异常值,确保表型数据符合正态分布(图1-2)。利用Genstat 18th Edition软件的混合线性模型计算各产量性状的blup值(最佳线性无偏预测,best linear unbiasedprediction)作为每个环境3个重复的矫正值。
实施例2基因型数据处理
利用植物基因组DNA试剂盒从苗期嫩叶中提取基因组DNA。用琼脂糖凝胶电泳、NanoDrop评估DNA完整性和质量,确保符合基因组测序建库质量要求。
一、参考基因组开选016的测序和组装
测序组装方法如下:
1、三代技术:利用PacBioSequel II平台进行三代测序,要求测序深度不低于100×。
2、二代Illumina数据:利用Illumina nova-seq PE150平台进行二代测序,要求测序深度不低于100×,Q20≥90%,Q30≥85%。
3、Hi-C数据:根据物种信息选择四碱基酶或者六碱基酶构建Hi-C文库,要求测序深度不低于100×,Q20≥85%,Q30≥80%。
测序组装结果如下:
1、开选016三代测序量297.92G,深度为109.77×,结合二代测序共549.80G测序数据。
2、采用kmer17软件进行survey分析:基因组大小为2,703.87Mbp,修正后为2,686.33Mbp,杂合率为0.13%,重复序列比例为84.15%。
3、对花生基因组进行测序denovo组装,组装结果如下:contig总长2.53Gbp,contig N50长度达到11.48Mbp;scaffold总长2.53Gbp,scaffold N50长度达到11.48Mbp。
4、利用Hi-C数据挂载染色体得到染色体水平基因组。
5、对组装质量进行一致性评估、序列完整性评估、EST序列评估、RNA序列评估、CEGMA评估和BUSCO评估。
全部小片段reads比对到基因组的比对率约为99.65%,覆盖率约为99.80%,说明reads和组装得到的基因组有很好的一致性;1614个直系同源单拷贝基因组装出来了99.2%的完整单拷贝基因,说明组装结果较完整;248个CEGs(Core Eukaryotic Genes)组装出来了241个基因,比例为97.18%,说明组装结果较完整。
二、199份花生材料的测序
采用Illumina二代测序平台对199份材料进行深度为10×的重测序,对测序数据进行质控,保留高质量SNP,质控标准为:SNP位点在样品的缺失率Miss<=0.2、次等位基因频率Maf>=0.05。以花生栽培种开选016为参考基因组进行call SNP,共得到631,988个SNPs,这些高质量SNP位点是目前花生关联分析中位点最多的,这与199份材料间的遗传多样性密切相关。
从图3可看出,3号染色体上的SNP位点最多为48,821个,其次是chr11(43,292SNPs),8号染色体上的SNP最少为13,143个,染色体上SNP的平均密度为251.71/M。
实施例3全基因组关联分析
1.显著性位点检测
全基因组关联分析使用GEMMA0.94.1版(全基因组高效混合模型关联)软件包进行关联分析,公式y=Xα+Sβ+Kμ+e。其中y对应于表型(实施例1所得表型数据),X对应于基因型(实施例2所得基因型数据),S对应于模型中的固定因子截距,K是根据SNP计算的亲缘关系矩阵。Xα和Sβ表示固定效应,Kμ和e表示随机效应。利用Bonferroni检验设置全基因组关联分析的阈值为-lg(0.05/631988)=7.10,获得产量性状曼哈顿图和QQplot图(图4-9)。从图中可知,6个性状在4组环境中的显著性信号均位于16号染色体上,说明控制产量性状的位点(基因)位于16号染色体上。
2.SNP位点汇总统计及表型变异解释率分析
对关联分析结果进行汇总统计,4个环境中分别检测到51,98,61和77个SNP位点。对于HPW,HSW,NP,NS,PL和PW,分别鉴定出12、14、37、84、23和32个非冗余关联位点,在不同环境中重复检测到3、4、9、15、2和13个SNP位点(表2)。
表2产量性状在四个环境中显著SNP的数量
对每个性状的位点进行统计分析(表3),有32个SNP位点贡献于2个及以上性状,所有位点都集中在16号染色体上,其中Arahy.16_142692237在百果重、百仁重、市斤果数、半斤仁数、荚果长和荚果宽6个产量性状的多个环境中均能检测到,属于一因多效功能位点。使用R语言对SNP进行表型变异解释率分析,该位点在不同环境下的最高表型变异解释率为17.64%。
表3检测到的与多个产量性状相关SNP
3.SNP位点Block分析
在Arahy.16_142692237上下游各115kb区域(群体材料半衰期为115kb)使用LDBlockShow 1.40软件对显著SNPs进行LD单倍型块图分析,寻找block。结果显示,在16号染色体的216.56kb区域存在6个block(黑色三角),其中Arahy.16_142692237(紫色圆点)处于右侧较大的block中,该block中共包含27个SNP,它们处于高度连锁不平衡状态,形成一个单倍型(图10),排除了显著性位点的假阳性,可靠性高。
所述SNP位点Arahy.16_142692237前后各200bp的序列如SEQ ID NO.1所示。
CCATTTCAACCAATTCTATTAATTAATAACTTTAAATTTACTCCTAAAAAAAAATTCTTATTTGATGACCATTGGAAGGATAATTGGTGGTCGCTATATATAAGTGATACGTTTTGTCCACCAAGAAGGGATTAATAGTCCTATGTAGGGGTGTCAAAAAATTTAAGAGGCAGAAATTTTTGTGAGAACTACTCCGAATGGAGTCTCGATGGTGGAAAATTTTTCCTGTGGAGATGAGAATAGGGAGCAAAATTCTTCCAAGACAGGCGCAAGGACCCAAGCGGGGATCTCCGTCTCATTTTCGATAATTTTCCGAATTTTAGAACTTACTTAAATATCCTTAATTTATTACTAATATAGGGGGTGTTTTAATAATTTTACCCATTAAAAAATTCTAACCC(SEQ ID NO.1,加下划线为该位点位置)。
实施例4关联位点验证
1.箱线图验证
利用R语言中的box plot包对P值较高、PVE大于8%的显著性位点进行箱线图验证。6个产量性状中,HPW、HSW、PL和PW与花生产量成正比,NP和NS与花生产量成反比。每个性状选择50个极端表型,以制作箱线图(标准:HPW≥220g,HPW≤160g;HSW≥80g,HSW≤65g;NP≥380,NP≤290;NS≥500,NS≤390;PL≥41cm;PL≤34cm;PW≥17cm;PW≤15cm)。结果表明,不同产量性状指标(纵坐标表型值)对应的基因型不同,在位点Arahy.16_142692237处,HPW、HSW、PL和PW中表型数值高对应的基因型为GG,表型数值低对应的基因型为AA;NP和NS则与之相反。可见,Arahy.16_142692237具有明显的基因分型,该位点的高产基因型为GG,低产基因型为AA(图11-12)。
2.基因型验证,开发分子标记
提取参考基因组中Arahy.16_142692237位点前后各100bp的序列,利用KASP(竞争性等位基因特异性PCR)技术,设计KASP标记,在199份材料群体中进行扩增、测序、检测。结果显示,GG高产基因型材料聚在一起,AA低产基因型材料聚在一起,Arahy.16_142692237具有独特的基因分型(图13),则进一步验证了该位点为控制花生产量性状的SNP位点,且设计的分子标记可直接用于花生材料产量鉴定。利用下列KASP引物对花生样品的DNA序列进行扩增、测序,若Arahy.16_142692237位点的基因型为GG则为高产材料,基因型若为AA则为低产材料。
其中,利用分子标记Arahy.16_142692237的KASP引物序列:
primer_X:GAAGGTGACCAAGTTCATGCTATTTTTGTGAGAACTACTCCGAATGG(SEQ IDNO.2);
primer_Y:GAAGGTCGGAGTCAACGGATTAAATTTTTGTGAGAACTACTCCGAATGA(SEQ IDNO.3);
primer_C:ATCTCCACAGGAAAAATTTTCCACCATC(SEQ ID NO.4)。
所述PCR的反应程序为:
a)94℃、15min;b)94℃、20s,61℃、60s,以0.6℃/循环的速度降温,10次循环;c)94℃、20s,55℃、60s,26次循环;d)94℃、20s,57℃、60s,3次循环。
反应体系:DNA(20~80ng/μL)5μL;2×KASP Master Mix 5μL;KASP引物混合物(50μmol/L)0.14μL,ddH2O 3μL。
其中,2×KASP Master Mix为LGC(Laboratory of the Government Chemist)公司通用试剂盒,适用于所有KASP试验,按照产品说明书进行操作。
Claims (5)
1.用于检测花生高产育种鉴定的分子标记的KASP引物组,其特征在于,所述引物组为:primer_X:GAAGGTGACCAAGTTCATGCTATTTTTGTGAGAACTACTCCGAATGG;
primer_Y:GAAGGTCGGAGTCAACGGATTAAATTTTTGTGAGAACTACTCCGAATGA;primer_C:ATCTCCACAGGAAAAATTTTCCACCATC;
所述分子标记为SNP位点Arahy.16_142692237,位于花生16号染色体上;所述SNP位点Arahy.16_142692237前后各200bp的序列如SEQ ID NO.1所示。
2.含有如权利要求1所述KASP引物组的检测试剂或试剂盒。
3.利用如权利要求1所述分子标记的KASP引物组鉴定花生高产的方法,其特征在于,包括以下步骤:
(1)提取待鉴定花生材料的DNA,利用分子标记的KASP引物组进行PCR鉴定;
(2)若分子标记Arahy.16_142692237位点的基因型为GG,则待鉴定花生材料为高产;若分子标记Arahy.16_142692237位点的基因型为AA,则待鉴定花生材料为低产。
4.根据权利要求3所述的方法,其特征在于,所述PCR的反应程序为:
a)94℃、15min;b)94℃、20s,61℃、60s,以0.6℃/循环的速度降温,10次循环;c)94℃、20s,55℃、60s,26次循环;d)94℃、20s,57℃、60s,3次循环。
5.如权利要求1所述的分子标记的KASP引物组在花生高产育种中的应用,其特征在于,检测待鉴定花生材料的SNP标记基因型,若分子标记位点的基因型为GG,则待鉴定花生材料为高产;若分子标记位点的基因型为AA,则待鉴定花生材料为低产。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310186984.6A CN116240307B (zh) | 2023-03-01 | 2023-03-01 | 一种用于花生高产育种鉴定的分子标记及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310186984.6A CN116240307B (zh) | 2023-03-01 | 2023-03-01 | 一种用于花生高产育种鉴定的分子标记及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116240307A CN116240307A (zh) | 2023-06-09 |
CN116240307B true CN116240307B (zh) | 2023-11-10 |
Family
ID=86629356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310186984.6A Active CN116240307B (zh) | 2023-03-01 | 2023-03-01 | 一种用于花生高产育种鉴定的分子标记及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116240307B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108374053A (zh) * | 2017-03-01 | 2018-08-07 | 中国农业科学院油料作物研究所 | 花生出仁率主效qtl位点的分子标记及其应用 |
CN112094937A (zh) * | 2020-09-27 | 2020-12-18 | 中国农业科学院油料作物研究所 | 花生a06染色体上与荚果和种子大小相关的snp分子标记及其应用 |
CN112626260A (zh) * | 2021-01-15 | 2021-04-09 | 中国农业科学院油料作物研究所 | 一种与花生百仁重主效qtl位点连锁的分子标记及其应用 |
CN113774161A (zh) * | 2021-09-29 | 2021-12-10 | 广东省农业科学院作物研究所 | 花生荚果和种仁大小主效qtl的kasp分子标记及应用 |
CN114525364A (zh) * | 2022-03-18 | 2022-05-24 | 山东省农业科学院 | 一种与花生白种皮紧密连锁的分子标记AhyWptc及其应用 |
CN115161329A (zh) * | 2021-04-02 | 2022-10-11 | 山东农业大学 | 控制花生荚果大小的主效基因AhP07及开发的分子标记与应用 |
-
2023
- 2023-03-01 CN CN202310186984.6A patent/CN116240307B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108374053A (zh) * | 2017-03-01 | 2018-08-07 | 中国农业科学院油料作物研究所 | 花生出仁率主效qtl位点的分子标记及其应用 |
CN112094937A (zh) * | 2020-09-27 | 2020-12-18 | 中国农业科学院油料作物研究所 | 花生a06染色体上与荚果和种子大小相关的snp分子标记及其应用 |
CN112626260A (zh) * | 2021-01-15 | 2021-04-09 | 中国农业科学院油料作物研究所 | 一种与花生百仁重主效qtl位点连锁的分子标记及其应用 |
CN115161329A (zh) * | 2021-04-02 | 2022-10-11 | 山东农业大学 | 控制花生荚果大小的主效基因AhP07及开发的分子标记与应用 |
CN113774161A (zh) * | 2021-09-29 | 2021-12-10 | 广东省农业科学院作物研究所 | 花生荚果和种仁大小主效qtl的kasp分子标记及应用 |
CN114525364A (zh) * | 2022-03-18 | 2022-05-24 | 山东省农业科学院 | 一种与花生白种皮紧密连锁的分子标记AhyWptc及其应用 |
Non-Patent Citations (3)
Title |
---|
QTL identification for seed weight and size based on a high-density SLAF-seq genetic map in peanut (Arachis hypogaea L.);Shengzhong Zhang et al.,;BMC Plant Biol.;第19卷(第1期);1-15 * |
优质花生新品种开农79品质性状及产量GGE分析;房元瑾 等;农业科技通讯(第7期);126-129 * |
高产高油花生新品种中花16及其亲本荚果相关性状的SSR标记鉴定;成良强等;中国油料作物学报;第36卷(第6期);735-740 * |
Also Published As
Publication number | Publication date |
---|---|
CN116240307A (zh) | 2023-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109735652B (zh) | 小麦抗条锈病基因QYr.nwafu-6BL.2的连锁KASP分子标记、引物及应用 | |
CN107043813B (zh) | 陆地棉25号染色体与纤维强度相关的snp分子标记 | |
CN110295251B (zh) | 与小麦有效分蘖数qtl连锁的snp分子标记及其应用 | |
CN109072299B (zh) | 同时合并基因分型的方法 | |
CN112593007B (zh) | 一种与小麦粒长qtl连锁的snp分子标记及应用 | |
Shiri | Identification of informative simple sequence repeat (SSR) markers for drought tolerance in maize | |
CN116287393B (zh) | 与花生产量性状相关的snp标记及其应用 | |
CN104789648B (zh) | 鉴定水稻CMS恢复基因Rf‑1区段单倍型的分子标记及其应用 | |
Hao et al. | Genetic diversity and linkage disequilibrium studies on a 3.1-Mb genomic region of chromosome 3B in European and Asian bread wheat (Triticum aestivum L.) populations | |
Park et al. | Development of genome-wide single nucleotide polymorphism markers for variety identification of F1 hybrids in cucumber (Cucumis sativus L.) | |
CN116240307B (zh) | 一种用于花生高产育种鉴定的分子标记及应用 | |
CN103834647B (zh) | 小麦矮杆基因RhtDC20紧密连锁的SSR标记Xgwm537及其用途 | |
CN111549172B (zh) | 西瓜叶片后绿基因连锁位点及caps标记 | |
CN111979346B (zh) | 一种基于kasp分子标记的良种桃选育方法 | |
CN111100946B (zh) | 一种油菜粒重性状主效基因位点的分子标记引物及应用 | |
CN116356065B (zh) | 一种用于花生蛋白质和脂肪含量育种鉴定的分子标记及应用 | |
CN116254364B (zh) | 与花生脂肪含量性状相关的snp标记及其应用 | |
CN108060247B (zh) | 一种与陆地棉8号染色体纤维强度相关的单体型 | |
Ongom et al. | A mid-density single-nucleotide polymorphism panel for molecular applications in cowpea (Vigna unguiculata (L.) Walp) | |
CN115948591B (zh) | 一种鉴定玉米苗期耐旱性相关的单体型ZmC10.HapDR及其应用 | |
CN115976263B (zh) | 小麦千粒重主效qtl的kasp分子标记及其应用 | |
CN111826461B (zh) | 高粱芒的有无分子标记的开发和应用 | |
CN111118196B (zh) | 一种油菜粒重性状主效基因位点的分子标记cnu288引物及应用 | |
Gong et al. | The genetic diversity and heterotic groups of 169 Chinese semi-winter rapeseed (Brassica napus) cultivars and inbred lines | |
CN108300797B (zh) | 陆地棉25号染色体与纤维强度相关的单体型 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |