CN117625828A - 一种基于全基因组重测序和kasp技术开发的灰树花标记及其应用 - Google Patents
一种基于全基因组重测序和kasp技术开发的灰树花标记及其应用 Download PDFInfo
- Publication number
- CN117625828A CN117625828A CN202311528223.0A CN202311528223A CN117625828A CN 117625828 A CN117625828 A CN 117625828A CN 202311528223 A CN202311528223 A CN 202311528223A CN 117625828 A CN117625828 A CN 117625828A
- Authority
- CN
- China
- Prior art keywords
- deoxynucleotide
- numbered
- snp
- grifola frondosa
- kasp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 240000001080 Grifola frondosa Species 0.000 title claims abstract description 80
- 235000007710 Grifola frondosa Nutrition 0.000 title claims abstract description 80
- 239000003550 marker Substances 0.000 title claims abstract description 32
- 238000005516 engineering process Methods 0.000 title abstract description 13
- 230000002068 genetic effect Effects 0.000 claims abstract description 29
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000003205 genotyping method Methods 0.000 claims abstract description 12
- 238000002474 experimental method Methods 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims description 19
- 239000000126 substance Substances 0.000 claims description 11
- 238000007476 Maximum Likelihood Methods 0.000 claims description 7
- 235000001674 Agaricus brunnescens Nutrition 0.000 claims description 3
- 238000007621 cluster analysis Methods 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 3
- 239000003068 molecular probe Substances 0.000 claims description 2
- 101000690100 Homo sapiens U1 small nuclear ribonucleoprotein 70 kDa Proteins 0.000 claims 1
- 101100029173 Phaeosphaeria nodorum (strain SN15 / ATCC MYA-4574 / FGSC 10173) SNP2 gene Proteins 0.000 claims 1
- 101100236128 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) LSM2 gene Proteins 0.000 claims 1
- 101100094821 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SMX2 gene Proteins 0.000 claims 1
- 102100024121 U1 small nuclear ribonucleoprotein 70 kDa Human genes 0.000 claims 1
- 238000010276 construction Methods 0.000 abstract description 11
- 238000013461 design Methods 0.000 abstract description 9
- 238000001514 detection method Methods 0.000 abstract description 9
- 238000012216 screening Methods 0.000 abstract description 7
- 238000012163 sequencing technique Methods 0.000 abstract description 7
- 238000011161 development Methods 0.000 abstract description 4
- 239000003147 molecular marker Substances 0.000 abstract description 4
- 235000017060 Arachis glabrata Nutrition 0.000 abstract description 2
- 244000105624 Arachis hypogaea Species 0.000 abstract description 2
- 235000010777 Arachis hypogaea Nutrition 0.000 abstract description 2
- 235000018262 Arachis monticola Nutrition 0.000 abstract description 2
- 238000009395 breeding Methods 0.000 abstract description 2
- 230000001488 breeding effect Effects 0.000 abstract description 2
- 238000013507 mapping Methods 0.000 abstract description 2
- 235000020232 peanut Nutrition 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 28
- 230000035772 mutation Effects 0.000 description 14
- 239000000523 sample Substances 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000003752 polymerase chain reaction Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 7
- 108700028369 Alleles Proteins 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 241000233866 Fungi Species 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 108091092878 Microsatellite Proteins 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 238000007844 allele-specific PCR Methods 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000001965 potato dextrose agar Substances 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 101150000810 BVES gene Proteins 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 101150025129 POP1 gene Proteins 0.000 description 1
- 241000222640 Polyporus Species 0.000 description 1
- 229930182558 Sterol Natural products 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011157 data evaluation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000012214 genetic breeding Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 235000003702 sterols Nutrition 0.000 description 1
- 238000007862 touchdown PCR Methods 0.000 description 1
- 150000003648 triterpenes Chemical class 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于全基因组重测序和KASP技术开发的灰树花标记及其应用。本发明对60株灰树花菌株进行全基因组重测序,获得原始SNP变异集合,筛选出1706个高质量位点,对SNP位点进行引物设计,其中1473个成功设计为KASP标记,利用基因分型实验,对分布在外显子区域的722个SNP标记筛选获得50个优质SNP标记集合,根据指纹图谱构建原则,进行鉴定效率作图,最终筛选获得12个核心SNP标记。本发明为灰树花生物学研究提供了一套可信、便于后期利用的SNP标记,可用于灰树花SNP检测试剂盒开发、遗传多样性分析、品种鉴定、DNA指纹图谱构建、种质资源和遗传群体基因分型及分子标记辅助选择育种等领域。
Description
技术领域
本发明涉及生物技术领域,具体涉及基于全基因组重测序和KASP技术开发的灰树花SNP标记及其应用。
背景技术
灰树花(Grifola frondosa),又名贝叶多孔菌、栗蘑,日本称之为舞茸(Maitake),是珍贵的食、药两用蕈菌。
灰树花肉质脆嫩,风味独特,味道鲜美,营养丰富,富含蛋白质、矿物质、多糖、甾醇和三萜等生物活性物质,具有抗肿瘤、抗氧化、调节免疫、降血糖和降血脂等多种功能。
由于同种食用菌不同品种间菌种外观差异小、菌种鉴定难度大,给食用菌品种权益保护带来较大的挑战,品种真实性鉴定技术需求迫切。因此,如何更有效地保存和开发利用现有灰树花种质资源,如何准确、高效地鉴定品种,特别是对特异种质材料进行有效地筛选和挖掘,选择具有代表性的优良亲本,是当前迫切需要解决的问题。越来越多的新兴技术也被应用其中,尤其是分子标记技术,为推动食药用菌的研究做出巨大贡献。
近年来,限制性片段长度多态性(RFLP)、随机扩增多态性DNA(RAPD)、扩增片段长度多态性(AFLP)、简单序列间重复(ISSR)、简单序列重复(SSR)等一系列DNA标记被开发出来并广泛应用于真菌遗传多样性、菌种鉴定的研究。但随着高通量测序技术的快速发展,单核苷酸多态性(single nucleotide polymorphism,SNP)标记因其稳定性、可重复性高,基因组分布广、数量多、易于检测等优点,逐渐成为最受欢迎的选择。目前常用的SNP检测与分型的方法主要有全基因组重测序、简化基因组重测序和基因芯片技术三种。通过这些方法开发的SNP经过变异检测、注释和筛选后,可以得到质量高、代表性强、材料区分度高、在基因组上分布均匀、特异性强的高质量SNP标记。
KASP(Kompetitive Allele-Specific PCR)是指竞争性等位基因特异性PCR,它基于touch-down PCR技术,利用通用荧光探针,可针对广泛的基因组DNA样品,包括复杂基因组DNA样品,对目标SNPs进行精准的双等位基因分型。相比于其他的SNP检测手段,KASP技术具有准确性高、位点适应性强、成本低、适合检测大量样本SNP位点等优势,在作物基因精细定位、遗传多样性分析、指纹图谱构建等方面具有很高的应用价值。
DNA指纹图谱技术(DNA-Fingerprinting)是由英国科学家Jeffreys于1986年开发,其原则是用尽量少的标记鉴别尽量多的品种,以达到简单、高效、经济的目的,具有快速、准确鉴定品种等优点,是鉴别不同品种的有力工具,已广泛应用于很多作物的品种资源多样性和纯度鉴定研究。相较于传统的分子标记,构建基于SNP标记技术的DNA指纹图谱对于品种特异性、真实性鉴别、遗传育种、种质资源精准鉴定与基因发掘工作十分重要。
发明内容
本发明的目的是提供一种基于全基因组重测序和KASP技术开发的灰树花SNP标记及其应用,从而解决现有技术中存在的问题。
本发明要求保护灰树花基因组中如下50个SNP位点中的全部或部分在以下任一中的应用:
(1)对灰树花种质资源和/或遗传群体进行亚谱系判断;
(2)构建灰树花种质资源品种DNA指纹图谱;
(3)鉴定灰树花品种及遗传多样性分析。
所述50个SNP位点的物理位置是基于灰树花参考基因组名称:Grifola FrondosaGCA_001683735.1ASM168373v1的全基因组序列对比确定的,所述50个SNP位点的位置及变异类型如表4。
本发明根据所述50个SNP位点的位置及变异类型,开发得到一套用于灰树花品种鉴定的50个优质KASP引物组合,优质SNP标记的KASP引物名称、位置、变异类型和序列见表5。
进一步地,本发明要求保护灰树花基因组中如下12个SNP位点中的全部或部分在以下任一中的应用:
(1)对灰树花种质资源和/或遗传群体进行亚谱系判断;
(2)构建灰树花种质资源品种DNA指纹图谱;
(3)鉴定灰树花品种及遗传多样性分析。
所述灰树花基因组中如下50个SNP位点中的全部或者部分优选为如下12个位点组合,所述12个SNP位点的引物名称、位置、变异类型和序列见表如表6。
本发明提供一套核心KASP引物用于灰树花品种的鉴定及指纹图谱构建。
其中,每个待测SNP位点对应的KASP引物均分别包括两条正向引物和一条反向引物;其中两条正向引物分别记作正向引物1和正向引物2;所述正向引物1的5'端连接一种荧光标签序列,所述正向引物2的5'端连接另一种荧光标签序列。
用于检测50个SNP位点的物质针对灰树花谱系,在如下任一种中的应用:
(1)对灰树花种质资源和/或遗传群体进行亚谱系判断;
(2)构建灰树花种质资源/品种DNA指纹图谱;
(3)鉴定灰树花品种及遗传多样性分析;
所述50个SNP位点为权利要求1中所述的50个SNP位点。
进一步地,用于检测12个SNP位点的物质针对灰树花谱系,在如下任一种中的应用:
(1)对灰树花种质资源和/或遗传群体进行亚谱系判断;
(2)构建灰树花种质资源/品种DNA指纹图谱;
(3)鉴定灰树花品种及遗传多样性分析;
所述12个SNP位点为权利要求1中所述的12个SNP位点。
进一步地,所述的物质包括PCR引物、芯片、生物传感器或分子探针。
一种对灰树花进行亚谱系判断和/或种质资源/品种DNA指纹图谱和/或灰树花品种及遗传多样性分析的试剂盒,包括检测50个SNP位点的物质,进一步地,包括用于检测12个SNP位点的物质。
一种对灰树花进行亚谱系判断和/或种质资源/品种DNA指纹图谱和/或灰树花品种及遗传多样性分析的方法,其特征在于,对所述的50个SNP位点进行检测,构建进化树进行分析;进一步地,对优选地的12个SNP位点进行检测,构建进化树进行分析。
本发明提供一种对灰树花种质资源进行聚类分析的方法,其特征在于,包含以下步骤:
(1)分别提取待测灰树花品种的基因组DNA;
(2)根据上述所述的的KASP组合引物,进行基因分型实验,确定SNP位点的基因型,根据所得基因型数据,基于极大似然法建树,将待测灰树花品种进行划分。
本发明提供一种对灰树花种质资源进行指纹图谱构建的方法,其特征在于,包含以下步骤
(1)分别提取待测灰树花品种的基因组DNA;
(2)根据上述所述的KASP组合引物,进行基因分型实验,确定SNP位点的基因型,根据所得基因型数据;
(3)利用perl脚本基于核心SNP标记进行指纹图谱的构建。突出了核心SNP标记基因型鉴别的效率和准确性。此外,SNP指纹图谱也提供了一种准确、快速、方便、高效鉴别灰树花种质资源的方法。
本发明提供一种基于全基因重测序数据进行高质量KASP引物筛选的方法,参数设置为:
(1)SNP位点在染色体上的DNA链上前后大于50bp的序列保守;
(2)保留以下标记,平均深度5X及以上,质量值大于30,最小完整度大于0.9,最小等位基因频率大于0.05,且SNP是双等位基因;
(3)截取SNP标记上下游各100bp序列,然后使用blast软件(版本:2.10.1+)把序列比对参考基因组,去除比对上多个位置的标记;
(4)保留多态信息含量(PIC)大于0.20的标记。
有益效果:
本发明对60株灰树花菌株进行全基因组重测序,从重测序数据获得的2125382个原始SNP变异集合中,筛选出1706个高质量位点,对SNP位点进行引物设计,其中1473个成功设计为KASP标记,利用基因分型实验,对分布在外显子区域的722个SNP标记筛选获得50个优质SNP标记集合,根据指纹图谱构建原则,进行鉴定效率作图,最终筛选获得12个核心SNP标记。本发明为灰树花生物学研究提供了一套可信、便于后期利用的SNP标记,这套SNP标记和检测引物,可用于灰树花SNP检测试剂盒开发、遗传多样性分析、品种鉴定、DNA指纹图谱构建、种质资源和遗传群体基因分型及分子标记辅助选择育种等领域。
附图说明
图1是SNP类型的变异数量统计图;
图2是SNP标记分布图;
图3是标记鉴定效饱和度曲线;
图4是基于最大似然法对60份灰树花种质构建系统发育树;
图5是基于12个核心SNP位点构建指纹图谱。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、SNP标记位点的获得
本研究中所采用的灰树花供试菌株均保藏于山东省应用真菌重点实验室,总共60个菌株,包含49个国内栽培菌株、3个野生菌株、8个航天搭载诱变菌株。
表1.灰树花供试菌株及来源
菌丝体在固体马铃薯葡萄糖琼脂(PDA)培养基中25℃培养至完全生长。采用CTAB法从菌丝中提取基因组DNA,使用Nanodrop和1.0%琼脂糖凝胶电泳来评估DNA溶液的浓度和完整性。样品基因组DNA检测合格后,用机械打断的方法(超声波)将DNA片段化,然后对片段化的DNA进行片段纯化、末端修复、3′端加A、连接测序接头,再用琼脂糖凝胶电泳进行片段大小选择,进行PCR扩增形成测序文库,建好的文库先进行文库质检,质检合格的文库用Illumina NovaSeq 6000平台进行测序。
对测序下机得到的原始reads,利用fastqc进行数据评估,并利用fastp对得到的各个样品原始reads进行数据质控,去除接头和低质量的序列,得到clean_reads,将质控后的clean_reads使用bwa mem比对到参考基因组上,参考基因组名称:Grifola FrondosaGCA_001683735.1ASM168373v1(https://ftp.ncbi.nlm.nih.gov/genomes/genbank/fungi/Grifola_frondosa/latest_assembly_versions/GCA_001683735.1_ASM168373v1/),统计各样品的测序深度、基因组覆盖度等信息,并进行变异的检测。本研究对60株灰树花进行全基因组重测序,为了保证后续生物信息分析数据的可靠性,对下机原始数据Raw Data质控后统计,共产生575,355,502个高质量reads,每个样本获得约1.4GbClean Data,Clean Data中GC含量为43.82%~47.94%,平均为45.78%,Q30平均达到91.29%以上,Q20平均达到96.53%,平均质量值为35.44(表2)。使用bwa软件将质控后的clean_reads比对到参灰树花考基因组Grifola Frondosa GCA_001683735.1ASM168373v1上,基因组大小为39.28Mb,其中90.64%的reads可比对到参考基因组上,双端比对上且插入片段大小较为合适的reads数达89.24%,基因组平均覆盖率为91.7%,所有样本的平均测序深度达到36X以上。
表2.全基因组测序菌株的基本信息
使用GATK(版本:v4.1.4.1)软件工具包根据Clean Reads在参考基因组的定位结果,使用Picard的Mark Duplicate工具去除重复,屏蔽PCR duplication的影响,使用GATK进行单核苷酸多态性(Single Nucleotide Polymorphism,SNP)的检测,使用GATKHaplotypeCaller生成原始变异(snp和InDels),参数设置为:QD<2.0,MQ<40.0,FS>60.0,SOR>6.0,MQRankSum<-12.5,ReadPosRankSum<-8.0,符合参数即过滤,得到原始的SNP位点集,进行SNP的统计,生成包含212万多个SNP的DNA变异数据集合。
实施例2、SNP标记位点的过滤
使用vcftools等软件进行群体SNP位点过滤,筛选原始SNP,参数设置:(1)SNP位点在染色体上的DNA链上前后大于50bp的序列保守;(2)保留以下标记,平均深度5X及以上,质量值大于30,最小完整度大于0.9,最小等位基因频率大于0.05,且SNP是双等位基因;(3)截取SNP标记上下游各100bp序列,然后使用blast软件(版本:2.10.1+)把序列比对参考基因组,去除比对上多个位置的标记;(4)保留多态信息含量(PIC)大于0.20的标记。
基于原始变异数据库,我们开发了包括SNP过滤、KASP标记设计、指纹图谱构建和群体遗传分析及核心种质筛选评价在内的标准流程,首先,我们提取SNP位点在染色体上的DNA链上前后大于50bp的序列保守,过滤得到16594个SNP位点;保留平均深度5X及以上,质量值大于30,最小完整度大于0.9,最小等位基因频率大于0.05,且SNP是双等位基因,过滤得到3477个SNP位点;截取SNP标记上下游各100bp序列,然后使用blast软件(版本:2.10.1+)把序列比对参考基因组,去除比对上多个位置的标记,过滤得到2916个SNP位点;保留多态信息含量(PIC)大于0.20的标记,最终,过滤得到1706个高质量的SNP位点。
利用prime3对SNP标记进行引物设计,转化为KASP标记,设计成功的有1473个标记,转化率为86.34%。对引物设计成功的SNP标记进行分布统计,我们发现这些标记在样本基因组的每个位置均有分布,其中有772个SNP标记分布在外显子区,占总KASP标记的52.4%,其中有260个SNP标记分布在内含子区,占总KASP标记的17.7%,有206个SNP位点分布在基因的上游和下游2kb的基因调控区,占总KASP标记的14%。
利用PLink软件对过滤后的不同SNP标记集合进行遗传多样性分析,计算缺失率,PIC,MAF,观测杂合度,以评估整个候选SNP集的效用。1473个引物设计成功的SNPs的位点缺失率平均为0.005,PIC、MAF和观测杂合度的平均值分别为0.335、0.344和0.584;分布于外显子区的772个SNPs的位点缺失率平均为0.003,PIC、MAF和观测杂合度的平均值分别,0.336、0.346和0.594,观测杂合度均高于期望杂合度,这些指标的结果表明,分布在外显子区的772个候选SNPs具有更高遗传多态性,因此,后续主要对772个外显子SNP位点进行基因分型实验,筛选候选核心SNP位点集合。
实施例3、KASP标记设计及基因分型
1、引物设计
使用引物设计软件primer3(版本:2.4.0)对SNP标记进行引物设计,转化为KASP标记,设计KASP引物时需要规避其它变异位点,只有引物设计成功的SNP位点才认为是合格的KASP标记,使用合格的KASP标记进行下游分析。引物设计参数设置如下:(1)GC含量<60%;(2)熔化温度(Tm)在55~61℃之间;(3)PCR产物大小不大于120bp。引物和FAM-或VIC-tail由上海生工生物技术有限公司合成。
2、KASP基因分型
在引物5’端添加通用荧光标签,F1(FAM):GAAGGTGACCAAGTTCATGCT,F2(VIC):GAAGGTCGGAG,新合成的引物用TE(pH 8.0)稀释至10μM,然后按照上游分型引物1:上游分型引物2:下游通用引物=1:1:3的比例混合后上机,每5μL反应体系加1.25uL引物混合物。DNA样本按最低浓度样本稀释至个位数的比例进行整批样品的稀释,每5ul反应体系中含有稀释后的DNA样本1.25ul。聚合酶链反应(PCR)在5μl的总体积中进行,其中模板DNA 1.25μl,2*KASP master mix2.5ul,primer mix 1.25ul。对96孔PCR反应板进行封膜,震荡,离心,保证反应体系混合均匀,离心后使用CFX ConnectTM Real-Time System,Bio-Rad,USA进行PCR反应。使用BMG POLARstar Omega扫描仪进行反应的荧光检测,并使用KlusterCaller3.4.1软件分析数据,用SNPviewer 2.0软件可视化检测数据。
表3.PCR反应条件
实施例4、核心SNP标记筛选、遗传多样性分析及指纹图谱构建
为了解国内灰树花菌株的基因组遗传多样性现状。利用PLINK v1.9软件通过计算期望杂合度(expected heterozygosity,He)、观察杂合度(observed heterozygosity,Ho)、最小等位基因频率(minor allele frequency,MAF)和多态信息含量(polymorphisminformation content,PIC),对灰树花种群体的遗传多样性进行评估。用软件FastTree(v2.1.9)中的极大似然法(Maximum likelihood,ML)基于SNP构建进化树,并使用Fig Tree v1.3.1软件进行可视化。利用perl脚本基于核心SNP标记进行指纹图谱的构建。
为了确定候选核心SNP,综合考虑灰树花基因型的物理位置、PIC、MAF、观察到的杂合性和缺失值,我们基于60份灰树花种质资源进行KASP分析,对分布在外显子序列的772个SNP标记进行KASP基因分型实验,筛选出50个高质量的SNP作为能够区分灰树花种群潜在的候选核心SNP标记集合,同时,根据DNA指纹图谱构建的原则:用尽量少的标记鉴别尽量多的品种,以达到简单、高效、经济的目的。根据标记鉴定效率饱和度曲线,从50个优质SNP标记中筛选出12个检出率高、多态性高、能区分本实验所有品种的的核心标记,12个核心SNP标记的PIC范围为0.269~0.375,平均值为0.337,12个核心标记中有10个PIC值大于0.3,从而表明,12个核心SNP标记具有充分的多态性。12个标记的平均MAF值为0.343,范围为0.2~0.492。其中,观察杂合度平均为0.563,83%的核心SNP标记的缺失值<0.10。12个核心SNP标记的详细信息(标记名称、位置、变异类型、引物序列)列于表6。同时,我们基于新开发的12个核心SNP标记的KASP基因分型数据对60份灰树花种质资源进行指纹图谱构建,突出了核心SNP标记基因型鉴别的效率和准确性。此外,SNP指纹图谱也提供了一种准确、快速、方便、高效鉴别灰树花种质资源的方法。
表4. 50个SNP位点在基因组中的位置及变异类型
/>
表5. 50个优质SNP标记的KASP引物名称、位置、变异类型和序列
/>
/>
/>
表6.12个核心SNP标记的KASP引物名称、位置、变异类型和序列
我们根据12个核心KASP标记的分型结果,利用极大似然法(Maximum likelihood,ML)对60份灰树花种质资源进行聚类分析,可以将其分为5个亚群,其中3个野生菌株Gf-29、Gf-30、Gf-40可以划分为同一亚群I,亲缘关系较近,聚类结果与地理位置分布一致。在自主选育的8个航天诱变菌株中,Gf-42和Gf-48两个航天诱变菌株可以单独划分到亚群Ⅱ和Ⅲ,与其他菌株遗传距离较远,可以作为选育优良菌株的参考,其他6个航天诱变菌株和出发菌株Gf-31聚为同一个群体pop1中,变异程度不显著。从日本引进的3个栽培菌株Gf-31、Gf-9、Gf-37可以聚为同一个亚群Ⅴ,说明来自同一个国家的菌株其亲缘关系较近,同时也表明我们聚类分析结果的可靠性。
Claims (9)
1.灰树花基因组中如下50个SNP位点中的全部或部分在如下任一中的应用:
(1)对灰树花种质资源和/或遗传群体进行亚谱系判断;
(2)构建灰树花种质资源/品种DNA指纹图谱;
(3)鉴定灰树花品种及遗传多样性分析;
所述50个SNP位点的物理位置是基于灰树花参考基因组名称:Grifola Frondosa GCA_001683735.1ASM168373v1的全基因组序列对比确定的,所述50个SNP位点的位置及变异类型如下:
编号为1的SNP1,位于LUGG01000001.1上的1828807位置,其脱氧核苷酸为C或T;
编号为2的SNP2,位于LUGG01000001.1上的1915715位置,其脱氧核苷酸为G或A;
编号为3的SNP3,位于LUGG01000001.1上的2275573位置,其脱氧核苷酸为A或G;
编号为4的SNP4,位于LUGG01000001.1上的3518062位置,其脱氧核苷酸为G或A;
编号为5的SNP5,位于LUGG01000002.1上的473513位置,其脱氧核苷酸为T或C;
编号为6的SNP6,位于LUGG01000002.1上的888692位置,其脱氧核苷酸为A或G;
编号为7的SNP7,位于LUGG01000002.1上的1316083位置,其脱氧核苷酸为C或T;
编号为8的SNP8,位于LUGG01000002.1上的1446577位置,其脱氧核苷酸为T或C;
编号为9的SNP9,位于LUGG01000002.1上的2057643位置,其脱氧核苷酸为T或C;
编号为10的SNP10,位于LUGG01000002.1上的2424138位置,其脱氧核苷酸为T或C;
编号为11的SNP11,位于LUGG01000002.1上的2833509位置,其脱氧核苷酸为T或C;
编号为12的SNP12,位于LUGG01000002.1上的2880791位置,其脱氧核苷酸为A或G;
编号为13的SNP13,位于LUGG01000003.1上的375249位置,其脱氧核苷酸为G或A;
编号为14的SNP14,位于LUGG01000003.1上的1053539位置,其脱氧核苷酸为T或C;
编号为15的SNP15,位于LUGG01000003.1上的1791892位置,其脱氧核苷酸为G或A;
编号为16的SNP16,位于LUGG01000003.1上的1987918位置,其脱氧核苷酸为G或A;
编号为17的SNP17,位于LUGG01000003.1上的2042709位置,其脱氧核苷酸为T或C;
编号为18的SNP18,位于LUGG01000003.1上的2639196位置,其脱氧核苷酸为T或G;
编号为19的SNP19,位于LUGG01000004.1上的299561位置,其脱氧核苷酸为T或C;
编号为20的SNP20,位于LUGG01000004.1上的346179位置,其脱氧核苷酸为C或T;
编号为21的SNP21,位于LUGG01000005.1上的731741位置,其脱氧核苷酸为T或C;
编号为22的SNP22,位于LUGG01000005.1上的822279位置,其脱氧核苷酸为G或A;
编号为23的SNP23,位于LUGG01000005.1上的939054位置,其脱氧核苷酸为C或T;
编号为24的SNP24,位于LUGG01000005.1上的2004185位置,其脱氧核苷酸为G或A;
编号为25的SNP25,位于LUGG01000005.1上的2008004位置,其脱氧核苷酸为G或A;
编号为26的SNP26,位于LUGG01000006.1上的76323位置,其脱氧核苷酸为C或T;
编号为27的SNP27,位于LUGG01000006.1上的713200位置,其脱氧核苷酸为G或A;
编号为28的SNP28,位于LUGG01000006.1上的718221位置,其脱氧核苷酸为A或G;
编号为29的SNP29,位于LUGG01000007.1上的1649570位置,其脱氧核苷酸为C或T;
编号为30的SNP30,位于LUGG01000009.1上的43988位置,其脱氧核苷酸为G或A;
编号为31的SNP31,位于LUGG01000009.1上的92923位置,其脱氧核苷酸为G或A;
编号为32的SNP32,位于LUGG01000009.1上的521970位置,其脱氧核苷酸为C或T;
编号为33的SNP33,位于LUGG01000010.1上的27076位置,其脱氧核苷酸为A或G;
编号为34的SNP34,位于LUGG01000013.1上的1509986位置,其脱氧核苷酸为G或A;
编号为35的SNP35,位于LUGG01000014.1上的1004987位置,其脱氧核苷酸为A或G;
编号为36的SNP36,位于LUGG01000014.1上的1011198位置,其脱氧核苷酸为G或T;
编号为37的SNP37,位于LUGG01000017.1上的156103位置,其脱氧核苷酸为T或C;
编号为38的SNP38,位于LUGG01000022.1上的499394位置,其脱氧核苷酸为C或A;
编号为39的SNP39,位于LUGG01000023.1上的401039位置,其脱氧核苷酸为G或A;
编号为40的SNP40,位于LUGG01000023.1上的410202位置,其脱氧核苷酸为T或C;
编号为41的SNP41,位于LUGG01000023.1上的1006640位置,其脱氧核苷酸为T或A;
编号为42的SNP42,位于LUGG01000024.1上的95557位置,其脱氧核苷酸为G或A;
编号为43的SNP43,位于LUGG01000024.1上的154748位置,其脱氧核苷酸为C或T;
编号为44的SNP44,位于LUGG01000027.1上的546806位置,其脱氧核苷酸为A或T;
编号为45的SNP45,位于LUGG01000031.1上的105791位置,其脱氧核苷酸为C或T;
编号为46的SNP46,位于LUGG01000031.1上的487009位置,其脱氧核苷酸为G或A;
编号为47的SNP47,位于LUGG01000033.1上的182680位置,其脱氧核苷酸为C或A;
编号为48的SNP48,位于LUGG01000038.1上的163771位置,其脱氧核苷酸为C或T;
编号为49的SNP49,位于LUGG01000044.1上的230451位置,其脱氧核苷酸为T或C;
编号为50的SNP50,位于LUGG01000056.1上的59623位置,其脱氧核苷酸为T或C;
进一步地,所述灰树花基因组中如下50个SNP位点中的全部或者部分优选为如下12个位点组合:SNP8、SNP12、SNP14、SNP16、SNP17、SNP 20、SNP 28、SNP 34、SNP 37、SNP 38、SNP39、SNP 47。
2.成套KASP引物,为用于检测权利要求1中所述50个SNP位点中的全部或部分的KASP引物;
进一步地,所述成套KASP引物优选为检测如下12个SNP位点的成套KASP引物;SNP8、SNP12、SNP14、SNP16、SNP17、SNP 20、SNP 28、SNP 34、SNP 37、SNP 38、SNP 39、SNP 47。
3.根据权利要求2所述的成套的KASP引物,其特征在于,每个待测SNP位点对应的KASP引物均分别包括两条正向引物和一条反向引物;其中两条正向引物分别记作正向引物1和正向引物2;所述正向引物1的5'端连接一种荧光标签序列,所述正向引物2的5'端连接另一种荧光标签序列;
4.用于检测50个SNP位点的物质针对灰树花谱系,在如下任一种中的应用:
(1)对灰树花种质资源和/或遗传群体进行亚谱系判断;
(2)构建灰树花种质资源/品种DNA指纹图谱;
(3)鉴定灰树花品种及遗传多样性分析;
所述50个SNP位点为权利要求1中所述的50个SNP位点。
5.根据权利要求4所述的应用,其特征在于,所述的物质包括PCR引物、芯片、生物传感器或分子探针。
6.一种对灰树花进行亚谱系判断和/或种质资源/品种DNA指纹图谱和/或灰树花品种及遗传多样性分析的试剂盒,其特征在于,包括权利要求2或3中所述的用于检测50个SNP位点的物质,进一步地,包括权利要求2或3中所述的用于检测12个SNP位点的物质。
7.一种对灰树花进行亚谱系判断和/或种质资源/品种DNA指纹图谱和/或灰树花品种及遗传多样性分析的方法,其特征在于,对权利要求1所述的50个SNP位点进行检测,构建进化树进行分析;进一步地,对权利要求1所述的12个SNP位点进行检测,构建进化树进行分析。
8.一种对灰树花种质资源进行聚类分析的方法,其特征在于,包含以下步骤:
(1)分别提取待测灰树花品种的基因组DNA;
(2)根据权利要求1中的KASP组合引物,进行基因分型实验,确定SNP位点的基因型,根据所得基因型数据,基于极大似然法建树,将待测灰树花品种进行划分。
9.一种对灰树花种质资源进行指纹图谱构建的方法,其特征在于,包含以下步骤:
(1)分别提取待测灰树花品种的基因组DNA;
(2)根据权利要求1中的KASP组合引物,进行基因分型实验,确定SNP位点的基因型,根据所得基因型数据;
(3)利用perl脚本基于核心SNP标记进行指纹图谱的构建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311528223.0A CN117625828A (zh) | 2023-11-16 | 2023-11-16 | 一种基于全基因组重测序和kasp技术开发的灰树花标记及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311528223.0A CN117625828A (zh) | 2023-11-16 | 2023-11-16 | 一种基于全基因组重测序和kasp技术开发的灰树花标记及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117625828A true CN117625828A (zh) | 2024-03-01 |
Family
ID=90022630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311528223.0A Pending CN117625828A (zh) | 2023-11-16 | 2023-11-16 | 一种基于全基因组重测序和kasp技术开发的灰树花标记及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117625828A (zh) |
-
2023
- 2023-11-16 CN CN202311528223.0A patent/CN117625828A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111088382B (zh) | 一种玉米全基因组snp芯片及其应用 | |
KR102032502B1 (ko) | 팽이버섯의 색깔 판별용 snp 마커 및 이의 용도 | |
CN110846429A (zh) | 一种玉米全基因组InDel芯片及其应用 | |
KR20180077873A (ko) | 수박 분자마커이용여교잡 선발용 snp 마커 | |
CN115094156A (zh) | 水稻耐高温基因tt1的kasp标记开发及其应用 | |
CN112831574B (zh) | 肉鸡腹脂率性状相关的分子标记APOA5 c.459及其应用 | |
CN107988385B (zh) | 一种检测肉牛PLAG1基因Indel标记的方法及其专用试剂盒 | |
CN115341035A (zh) | 用于选择母鸡产蛋蛋重的snp分子标记 | |
CN114606339B (zh) | 与南瓜肌醇含量主效qtl连锁的kasp分子标记及其应用 | |
CN106755422B (zh) | 一种与黄牛生长性状相关的meg3基因snp的检测方法及其应用 | |
CN107937493B (zh) | 一种用于等位基因pcr的发夹修饰引物 | |
CN113789407B (zh) | 一种用于油莎豆基因分型的snp分子标记组合及其应用 | |
CN112725468B (zh) | 肉鸡腹脂率分子标记APOB c.246及检测方法 | |
CN110305974B (zh) | 基于检测五个snp位点区分常见小鼠近交系的pcr分析引物及其分析方法 | |
CN117625828A (zh) | 一种基于全基因组重测序和kasp技术开发的灰树花标记及其应用 | |
CN114606335A (zh) | 玉米抗甘蔗花叶病毒病基因的kasp分子标记的开发及应用 | |
CN117587159B (zh) | 一种辣椒snp分子标记组合、snp芯片及其应用 | |
CN117305473B (zh) | 一种与鸡免疫性状相关基因pla2g7的snp分子标记及其应用 | |
CN112111579B (zh) | 滩羊源性成分的鉴别方法 | |
CN116103413B (zh) | 与地方鸡产蛋性状相关的snp标记及其检测方法和应用 | |
CN116200518B (zh) | 一种与马铃薯淀粉含量相关的kasp标记的开发及应用 | |
CN114525362B (zh) | 用于鉴定“安源1号”刺参群体的引物组合及其应用 | |
CN116751868B (zh) | 与地方鸡产蛋性状相关的snp标记及其检测方法与应用 | |
CN111850142B (zh) | 商业地熊蜂与野生地熊蜂的差异indel及其分子标记与应用 | |
CN118147359A (zh) | 与烟叶含梗率相关的kasp引物组、分子标记及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |