CN108427866B - 一种基于分子标记技术的农作物自交系类群的鉴定方法 - Google Patents

一种基于分子标记技术的农作物自交系类群的鉴定方法 Download PDF

Info

Publication number
CN108427866B
CN108427866B CN201810130418.2A CN201810130418A CN108427866B CN 108427866 B CN108427866 B CN 108427866B CN 201810130418 A CN201810130418 A CN 201810130418A CN 108427866 B CN108427866 B CN 108427866B
Authority
CN
China
Prior art keywords
inbred line
sample
control
molecular marker
fingerprint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810130418.2A
Other languages
English (en)
Other versions
CN108427866A (zh
Inventor
王凤格
杨扬
赵久然
田红丽
王蕊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Academy of Agriculture and Forestry Sciences
Original Assignee
Beijing Academy of Agriculture and Forestry Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Academy of Agriculture and Forestry Sciences filed Critical Beijing Academy of Agriculture and Forestry Sciences
Priority to CN201810130418.2A priority Critical patent/CN108427866B/zh
Publication of CN108427866A publication Critical patent/CN108427866A/zh
Application granted granted Critical
Publication of CN108427866B publication Critical patent/CN108427866B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及农业育种技术领域,具体公开了一种基于分子标记技术的农作物自交系类群的鉴定方法,该方法包括以下步骤:(1)建立对照自交系的指纹信息库;(2)划分对照自交系的类群;(3)获取待测自交系指纹信息;(4)计算待测自交系与对照自交系之间的遗传距离和对照样品所在类群的阈值,并判断遗传距离的最小值是否在该阈值范围内进而划分待测自交系的类群。本发明方法可以快速有效的鉴定农作物自交系的类群,进而有针对性的选择相应的杂优模式,有的放矢的选配杂交组合,从而大大提高育种的效率,节省时间、人力、物力和财力,为育种家提供决策依据,减少组配的盲目性,对育种家进行农作物育种提供借鉴和指导意义。

Description

一种基于分子标记技术的农作物自交系类群的鉴定方法
技术领域
本发明涉及作物育种技术领域,特别是涉及农作物品种生物信息学分析技术领域,具体地涉及一种基于分子标记技术的农作物自交系类群的鉴定方法。
背景技术
在国内外农作物育种中,自交系之间的亲缘关系是育种工作者进行自交系改良和选配杂交组合的重要依据,因此国内外育种工作者通过不同方法划分了农作物的自交系亲缘关系类群。常用的划分类群方法有:1)根据形态特征划分。但是该方法受环境影响较大,准确性较差;2)根据地域来源和系谱来源划分。该方法对来源不明或来源复杂的种质难以有效进行划分;3)根据自交系配合力进行聚类分析。该方法耗费大量人力、物力和时间;4)同工酶技术。该方法提供的遗传位点有限,区分材料有限;5)分子标记技术。分子标记,是以个体间遗传物质内核苷酸序列变异为基础的遗传标记,是DNA水平遗传多态性的直接反映。分子标记技术能克服上述方法的缺陷,提供较为丰富的多态性,样品用量少,不受环境条件和发育阶段影响,已成功应用于自交系的类群划分。
简单序列重复(Simple Sequence Repeats,以下简称SSR)标记、单核苷酸多态性(Single Nucleotide Polymorphisms,以下简称SNP)标记和插入缺失(InsertionDeletion,以下简称InDel)标记是目前农作物遗传育种中应用最为广泛的分子标记技术。SSR分子标记已广泛应用于主要农作物品种DNA指纹库构建工作之中,尤其是玉米和水稻,已完成两万多份和五千多份样品SSR指纹构建;并且SSR分子鉴定标准和指纹数据库被广泛应用于品种审定、登记、品种权保护、市场监测、司法鉴定等。SSR指纹技术扩增产物的检测方法主要包括琼脂糖凝胶电泳、聚丙烯酰胺凝胶电泳和荧光毛细管电泳等。根据文献资料发现,琼脂糖凝胶电泳的分辨率较低,其次是非变性聚丙烯酰胺凝胶电泳,两种方法均对较小的差异不易区分,因此在构建DNA指纹库中不推荐使用;变性聚丙烯酰胺凝胶电泳技术已经成熟,并且操作简单,成本低廉,是一种常见的检测方法;毛细管电泳结合多色荧光检测方法是近年来发展起来的一种快速、准确、高效率的SSR标记检测方法,它利用如ABI3730XL等遗传分析仪,以FAM、VIC、NED、PET、LIZ五种不同的荧光,其中LIZ作为分子量内标的颜色,其余4种荧光标记微卫星引物,将4种不同荧光标记的PCR产物和分子量内标在同一泳道中电泳,通过毛细管电泳、SSR Analyser软件进行数据的收集和分析,精确计算出各SSR等位基因扩增片段的大小。由于荧光毛细管电泳检测平台具有自动化程度高、高通量、省时省力等优势,因而被认为是主流检测平台。
随着现代分子生物学的不断发展,多种农作物全基因组测序的完成以及高通量DNA分型技术的兴起等,为SNP新型分子标记鉴定技术的研发带来了契机。现阶段,主要农作物例如玉米已经开发出了大量的SNP位点,并发布了多种高密度芯片,在农作物分子鉴定技术中已经逐步得到广泛应用。SNP基因分型检测平台较多,如SNPlex、SNaPshot、TaqMan、光纤微珠芯片平台等,综合比较,各个检测平台中Illumina公司推出的SNP芯片检测技术在农作物品种真实性鉴定方面有一定位点通量优势。
InDel标记是基于基因组中插入/缺失位点两侧的序列设计特异引物进行PCR扩增的标记,作为一种高通量遗传标记,目前已开始应用于动植物群体遗传分析、分子辅助育种中。目前大多是利用电泳平台进行分型,该分型平台快捷经济,不需要复杂的实验设备,可操作性强。电泳分型平台有琼脂糖凝胶电泳、变性或非变性聚丙烯酰胺凝胶电泳以及毛细管电泳。当InDel位于某种限制性内切酶的酶切位点上时,可转化为扩增片段酶切长度多态性(CAPS),先用该限制性内切酶酶切后再电泳分型。InDel长度变化较大,选择InDel位点时,应优先选择多态性差异3-20bp的InDel,这类InDel设计的成功率高,而且便于检测。
SSR、SNP和InDel标记各有优缺点。以PCR为基础的SSR标记具有多态性高、操作简单、重复性好等优点,但是难以实现位点的高通量;以序列为基础的SNP标记分布密度高、遗传稳定性好、易于实现高通量、自动化分析,但是单个位点多态性低、检测成本相对较高。InDel标记数量丰富、突变率低,并且在电泳、芯片、KASP等多个平台都能进行基因分型,从而避免复杂性和异质性而导致的后续分析的较模糊性,InDel标记的设计难度较高,且与SNP一样都是二态型标记,多态性比SSR低。在实际检测层面上,SSR更适用于样本量大、位点数少的检测;而SNP和InDel更加适用于样本量相对少、位点数多的检测,SSR、SNP和InDel三种标记技术将长期并存应用。
聚类分析是一种重要的多变量分析工具,在种质资源的研究中主要用到的是系统聚类法,根据类群间凝聚方法的不同又可分为最短距离法(Single linkage)、最长距离法(Complete linkage)、中间距离法(Median method)、重心法(Centroid method)、类平均法(Unweighted pair-group method using arithmetic averages,UPGMA)、加权配对算术平均法(Weighted pair-group average,WPGMA)、离差平方和法(Ward's method and threesampling strategies)等,有研究结果表明,不同的聚类方法可以显著的改变性状的方差和变异系数。在实际应用中,类平均法较为常见。
近年来利用分子标记技术对农作物自交系进行类群划分的报道很多,不同的方法划分的结果不尽相同(不稳定),更是缺少一套准确高效的处理方法,使得育种家在进行自交系类群划分时无所适从。而且,在类群划分过程中计算操作复杂,使得育种家不易接受。
发明内容
本发明的目的在于提供一种操作简单、成本低、准确率高、可信度高的农作物自交系类群的鉴定方法。
本发明提供了一种基于分子标记技术的农作物自交系类群的鉴定方法,包括以下步骤:
(1)建立农作物对照自交系的指纹信息库;
(2)划分对照自交系的类群;
(3)获取待测自交系指纹信息;
(4)计算待测自交系与对照自交系之间的遗传距离和对照样品所在类群的阈值,并判断遗传距离的最小值是否在该阈值范围内进而划分待测自交系的类群。
上述鉴定方法中,步骤(1)建立农作物对照自交系指纹信息库包括以下步骤:
S1、农作物对照自交系样品的选择:若样品的类群信息已知,则从已知自交系类群中选择5-10个样品组成对照自交系;或
若样品的类群信息未知,则:
1)样品代表性已知,选择公认的、种质资源官方的样品组成对照自交系,样品数不少于30个;或
2)样品代表性未知,选择和待测农作物自交系有亲缘关系的样品组成对照自交系,样品数不少于30个;
S2、根据不同的基础条件、需求和不同的数据特征选择不同的分子标记检测平台;当选择SSR分子标记检测平台时,可用的位点数不少于30个;当选择SNP分子标记检测平台时,可用的位点数不少于300个;当选择InDel分子标记检测平台时,可用的位点数不少于300个;
S3、对对照自交系样品的指纹数据质量进行控制,包括位点数据质量的控制和样品指纹质量的控制;
所述位点数据质量从四个方面进行控制,分别是等位基因频率、多态性信息量、位点的样品缺失率、位点的样品纯合率;
所述样品指纹质量从两个方面进行控制,分别是样品的位点缺失率和样品的位点纯合率。
步骤(1)的S3位点数据质量控制中,
等位基因频率的控制方面,
最小等位基因频率(Minor Allele Frequency,MiAF)是指一个突变位点的最小突变频率,在实际应用中数值越大则越有研究价值,通常认为一个位点的最小等位基因频率大于0.05才有研究的意义,否则说明这个位点的突变频率很低,很可能无法做出突变基因。以SNP标记数据为例,其计算公式为:
Figure GDA0003354809990000051
如果SAA<SBB,则MiAF=PA,如果SAA>SBB,则MiAF=PB
其中,SAA为该位点的基因型是AA的样品数目,SAB为该位点的基因型是AB的样品数目,SBB为该位点的基因型是BB的样品数目。
最大等位基因频率(Major Allele Frequency,MaAF)是指一个突变位点的最大突变频率。以SNP标记数据为例,其计算公式为:
Figure GDA0003354809990000052
如果SAA<SBB,则MaAF=PB,如果SAA>SBB,则MaAF=PA
其中,SAA为该位点的基因型是AA的样品数目,SAB为该位点的基因型是AB的样品数目,SBB为该位点的基因型是BB的样品数目。
本发明经过大量试验研究后认为若采用SSR分子标记检测平台,则对照自交系样品指纹数据最大等位基因频率小于0.80;若采用SNP或InDel分子标记检测平台,则对照自交系样品指纹数据最小等位基因频率大于0.15;
多态性信息量的控制方面,
多态性一般用多态性信息量(Polymorphism Information Content,PIC)来评估。PIC是指一个标记依靠其可检测的等位基因数和它们的分布频率,从而得到该标记在一个群体中检测的多态性大小值,其计算公式为:
Figure GDA0003354809990000053
其中,pi代表分析位点的第i个等位基因的频率,pj代表分析位点的第j个等位基因的频率,m代表分析位点的等位基因数量。
本发明经过大量试验研究后认为若采用SSR分子标记检测平台,则对照自交系样品指纹数据的多态性信息量的值大于0.40;若采用SNP或InDel分子标记检测平台,则对照自交系样品指纹数据的多态性信息量的值大于0.20;
位点的样品缺失率控制方面,
位点的样品缺失率(Locus of Samples Miss Rate,LSMR)是指当前位点在给定样品群体中数据缺失的比例,其计算公式为:LSMR=Sn/St,其中,Sn是该位点数据缺失的样品数目,St是给定群体的样品总数。
本发明经过大量试验研究后认为若采用SSR分子标记检测平台,则对照自交系样品的指纹数据的位点的样品缺失率小于0.20;若采用SNP或InDel分子标记检测平台,则对照自交系样品指纹数据的位点的样品缺失率小于0.10;
位点的样品纯合率控制方面,
位点的样品纯合率(Locus of Samples Homozygote Rate,LSHR)是指当前位点在给定样品群体中纯合样品数占所有不缺失数据样品的比例,其计算公式为:LSHR=Si/(St-Sn),Sh+Si=St-Sn,其中,Sh是该位点基因型为杂合类型的样品数目,Si是该位点基因型为纯合类型的样品数目,St是给定群体的样品总数,Sn是该位点数据缺失的样品数目。
纯合样品比例高可以保证位点集合符合孟德尔遗传定律。本发明经过大量试验研究后认为若采用SSR分子标记检测平台,则对照自交系样品的指纹数据的位点的样品纯合率的值大于0.75,若采用SNP或InDel分子标记检测平台,则对照自交系样品指纹数据的位点的样品纯合率的值大于0.90。
进一步地,本发明提供的农作物自交系类群鉴定方法的步骤(1)的S3样品指纹质量控制中,样品的位点缺失率(Sample of Loci Miss Rate,SLMR)是指当前样品在给定的位点集合中数据缺失的比例,其计算公式为:SLMR=Ln/Lt,其中,Ln代表数据缺失的位点数目,Lt代表给定集合的位点总数。
本发明为保证结果的准确性,结合已有的知识及操作经验,若采用SSR分子标记检测平台,则对照自交系指纹质量的样品的位点缺失率小于0.20;在若采用SNP或InDel分子标记检测平台,则对照自交系指纹质量的样品的位点缺失率小于0.10;
进一步地,本发明提供的农作物自交系类群鉴定方法的步骤(1)的S3样品指纹质量控制中,样品的位点纯合率(Sample of Loci Homozygote Rate,SLHR)是指当前样品的纯合位点占数据不缺失位点总数目的比例,其计算公式为:SLHR=Li/Lt-Ln,Lh+Li=Lt-Ln,其中,Lh代表杂合的位点数目,Li代表纯合的位点数目,Ln代表数据缺失的位点数目,Lt代表给定集合的位点总数。
本发明为保证结果的准确性,结合已有的知识及操作经验,若采用SSR分子标记检测平台,则对照自交系指纹质量的样品的位点纯合率大于0.70;在若采用SNP或InDel分子标记检测平台,则对照自交系指纹质量的样品的位点纯合率大于0.90。
上述步骤是本发明提供的农作物自交系类群的鉴定方法中,关于步骤(1)的建立农作物对照自交系指纹信息库的具体操作方法与要点。
进一步地,若对照自交系的类群信息未知,则本发明鉴定方法的步骤(2)的划分对照自交系的类群的方法步骤为:
A1、计算遗传距离:基于SSR分子平台计算遗传距离时选用Roger’s1972遗传距离计算方法;基于SNP或InDel分子平台计算遗传距离时优先选用Nei’s1973遗传距离计算公式;
A2、在遗传距离矩阵的基础上对未知类群的对照自交系进行聚类分析,根据聚类结果进行类群的划分;
A3、定义阈值:计算出类群内两两样品之间的遗传距离后,计算所有遗传距离的平均值
Figure GDA0003354809990000071
和标准差s,将
Figure GDA0003354809990000072
作为阈值的上限,下限不限,该阈值就是这个类群对应的阈值。
遗传距离的计算方式中,关于Nei’s(1973)遗传距离,Nei’s1973遗传距离(Nei’s1973 Minimum Genetic Distance,Nei1973_GD),也叫Nei’s1973最小遗传距离,其计算公式为:
Figure GDA0003354809990000081
Figure GDA0003354809990000082
Figure GDA0003354809990000083
Figure GDA0003354809990000084
其中,pij代表在X群体(或个体)内第j个位点的第i个等位基因的频率,qij代表在Y群体(或个体)内第j个位点的第i个等位基因的频率,aj代表第j个位点的等位基因数量,m代表进行比较的位点数量;JX代表在X群体两个随机选出的基因相同概率的平均数,JY代表在Y群体两个随机选出的基因相同概率的平均数,JXY代表从X、Y两个群体随机选出的两个基因相同概率的平均数。
关于Roger’s(1972)遗传距离,Roger’s遗传距离(Roger’s1972 Minimum GeneticDistance,Roger1972_GD)计算公式为:
Figure GDA0003354809990000085
其中,pij代表在X群体(或个体)内第j个位点的第i个等位基因的频率,qij代表在Y群体(或个体)内第j个位点的第i个等位基因的频率,aj代表第j个位点的等位基因数量,m代表进行比较的位点数量。
上述步骤A2中,
聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组的统计分析技术。具体划分方法为类平均法(Unweighted Pair Group Method with Arithmeticmean,UPGMA),UPGMA算法的执行过程如下:
(1)初始化:使每个物种自成一类,如果有n个物种,则开始时共有n个类,每个类的大小为1,分别用n个叶节点代表每个类;
(2)重复执行下列循环,直到仅剩一个类为止:
寻找具有最小距离Dij的两个类i、j;
建立一个新的聚类(ij);连接i和j形成新节点(ij),生长两个新的分支,将i和j连接到(ij),分支的长度为Dij/2;计算新分类到其它类的距离:
Figure GDA0003354809990000091
其中ni、nj、(ni+nj)分别为i类、j类、(ij)类的元素个数;
在距离矩阵中删除与类i和类j相应的行和列,为类(ij)加入新的行和列。根据聚类结果进行类群的划分。
另一方面,若对照自交系的类群信息已知,则本发明鉴定方法的步骤(2)的划分对照自交系的类群的方法步骤为:
B1、计算遗传距离:基于SSR分子平台计算遗传距离时选用Roger’s1972遗传距离计算方法;基于SNP或InDel分子平台计算遗传距离时优先选用Nei’s1973遗传距离计算公式;
B2、定义阈值:计算出类群内两两样品之间的遗传距离后,计算所有遗传距离的平均值
Figure GDA0003354809990000092
和标准差s,将
Figure GDA0003354809990000093
作为阈值的上限,下限不限,该阈值就是这个类群对应的阈值。
本发明提供的农作物自交系类群的鉴定方法中,步骤(3)的获取待测自交系指纹信息的方法与步骤(1)建立农作物对照自交系指纹信息库的方法一致,选择相同的位点和相同的分子检测平台进行检测,获取待测自交系指纹信息;然后对待测的自交系控制样品的指纹质量:在样品的位点缺失率控制方面,若采用SSR分子标记检测平台,则待测自交系指纹质量的样品的位点缺失率小于0.20;在若采用SNP或InDel分子标记检测平台,则待测自交系指纹质量的样品的位点缺失率小于0.10;
在样品的位点纯合率控制方面,若采用SSR分子标记检测平台,则待测自交系指纹质量的样品的位点纯合率大于0.70;在若采用SNP或InDel分子标记检测平台,则待测自交系指纹质量的样品的位点纯合率大于0.90。
更进一步地,本发明提供的农作物自交系类群的鉴定方法中,步骤(4)的方法为:计算待测自交系与对照自交系每个个体两两之间的遗传距离,筛选每个待测样品与对照自交系之间遗传距离的最小值,并找出最小值对应的对照自交系所在的类群,初步将该待测自交系划归该类群。例如:与待测样品A的遗传距离最小值对应的对照自交系为B,B所在的类群为Ⅰ,那么,该步骤则将待测样品A初步划归类群Ⅰ。
本发明鉴定方法中,步骤(4)还包括判断遗传距离最小值是否在计算的类群阈值范围内,若在,则正式将该待测自交系分为最小遗传距离对照自交系所在的类群,待测自交系快速划分类群结束;
若遗传距离最小值不在计算的类群阈值范围内,则将待测自交系加入到对照自交系样品中,通过重新进行混合聚类分析,得出分类的结果,再参照分类的结果进行推断,进而判断该待测自交系最可能的类群。
例如,与待测样品A遗传距离最小值的对照自交系为B,B对应的类群为Ⅰ类;若该遗传距离在Ⅰ类群阈值之内,则该待测样品也划归到Ⅰ类,分群结束;若该遗传距离的最小值超出类群Ⅰ的阈值范围,则将该样品A与所有的对照自交系混合进行聚类分析,分析方法为非加权分组平均法,聚类分析之后A所在的类群为Ⅱ,参考未加入A的聚类分析结果观察待测样品A所在的类群的特征。如果类群Ⅱ中大多数样品为未加入A时聚类分析的Ⅲ类,那么,就推断A最可能的类群就是Ⅲ,类群划分结束。如果聚类之后A所在的类群介于两个类群之间,则推断最可能的类群有两个,类群划分结束。
本发明提供了所述农作物自交系类群鉴定方法在农作物育种中的应用。
本发明还提供了所述农作物自交系类群鉴定方法在农作物品种保护中的应用。
本发明的有益效果在于,本发明基于分子标记技术构建对照样品指纹库并获取待测样品指纹信息获取,利用遗传距离判断两者之间的遗传关系,从而对农作物自交系进行快速、准确的类群划分的技术路线。本发明技术方案中,对照自交系指纹库的构建时充分考虑到了两种不同的情况,分别为已知类群的自交系和未知类群的自交系,并结合各种分子标记技术(SSR、SNP和InDel等)的应用,对指纹数据质量加以控制,进而构建对照指纹库。本发明通过遗传距离法确定待测自交系与对照自交系之间的遗传关系,根据对照自交系来划分类群;并提出类群阈值的概念,验证遗传距离是否在类群阈值范围之内,并采取相应的方法。本发明方法具有广泛的应用领域,不仅体现在可以用于玉米、水稻、小麦等各种农作物的类群划分,在物种上基本没有限制;而且在指纹数据的类型上基本没有限制,即可以利用各种分子标记所获得的数据进行分析。本发明方法可以快速有效的鉴定农作物自交系的类群,进而有针对性的选择相应的杂优模式,有的放矢的选配杂交组合,从而大大提高育种的效率,节省时间、人力、物力和财力,为育种家提供决策依据,减少组配的盲目性,对育种家进行农作物育种提供借鉴和指导意义。
附图说明
图1为本发明基于分子标记技术的农作物自交系类群的鉴定方法流程图。
具体实施方式
以下实施例进一步说明本发明的内容,但不应理解为对本发明的限制。在不背离本发明精神和实质的情况下,对本发明方法、步骤或条件所作的修改或替换,均属于本发明的范围。
若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段;实施例中所用的试剂为市售商品,所用的生物材料均为本领域技术人员通过常规方式能够获得的。
实施例1
本发明实例通过基于SSR分子标记的玉米自交系类群的鉴定的简单案例来说明其具体实施方式。本案例选取的实验对象为135个国内玉米自交系60个SSR的分子标记数据,数据来源于(FengGe Wang et al,Development and characterization of a core setof SSR markers for fingerprinting analysis of Chinese maize varieties,Maydica,2011,56-1693.以下简称论文1),从7个类群中随机选择105个自交系作为对照样品、30个自交系作为待测样品,对本发明所提出的基于分子标记技术的农作物自交系类群快速鉴定方法进行验证,具体实施过程如下:
1.建立对照样品的指纹信息库
135个国内玉米品种自交系,除去30个自交系作为待测样品,将其余的玉米自交系作为对照样品构建对照样品的指纹信息库。具体试验操作步骤参见论文1。分析对照样品的指纹数据质量,样品指纹质量参见表1,位点数据质量参见表2。
表1对照自交系的样品指纹质量
Figure GDA0003354809990000121
Figure GDA0003354809990000131
从表1看出,除极个别样品不符合要求外,绝大多数样品均在指纹质量控制范围之内,即样品的位点纯合率均大于0.700,样品的位点缺失率均小于0.200。
表2对照自交系的位点数据质量
Figure GDA0003354809990000141
从表2看出,几乎所有位点的最大等位基因频率(MaAF)均小于0.800;几乎所有位点的多态性信息量(PIC)均大于0.400;全部位点的样品缺失率均小于0.200;全部位点的样品纯合率全部大于0.750。总体而言,位点数据质量符合本发明预设的要求。位点G32虽然多态性较低,但其余两个指标都符合本发明预设的要求,为保证与文章分析结果的一致性,仍保留该位点进入后续分析。
2.划分对照自交系的类群
根据论文1对照自交系类群结果,通过计算类群内遗传距离的均值和标准差,计算每个类群的阈值。遗传距离计算公式采用Roger’s 1972。各个类群的阈值计算结果见表3:
表3对照自交系七个类群的阈值
Figure GDA0003354809990000151
3.获取待测自交系指纹信息
获取待测自交系指纹信息的步骤和方法同步骤1。
表4待测自交系的样品指纹质量
Figure GDA0003354809990000152
表4展示了待测自交系的样品指纹质量,除极个别样品不符合要求外,绝大多数样品均在指纹质量控制范围之内,即样品的位点纯合率大于0.700,样品的位点缺失率小于0.20。
4.分析待测自交系与对照自交系关系
按照本发明的步骤,采用Roger’s 1972遗传距离计算公式计算待测自交系与对照自交系之间的遗传距离,并找出该遗传距离的最小值对应的对照样品,初步判断待测自交系划归该对照样品所在的类群。根据本发明提出的类群阈值概念及算法,计算出对照样品所在类群的阈值,并判断遗传距离的最小值是否在该阈值范围内。具体结果见表5。
表5待测自交系的类群划分结果
Figure GDA0003354809990000153
Figure GDA0003354809990000161
表5的结果表明,该发明对待测自交系的分类结果与已知结果一致。验证了本发明的准确性和可行性。
实施例2
本发明实例通过基于SNP分子标记的水稻自交系类群的鉴定的简单案例来说明其具体实施方式。本案例数据来源于(Michael J.Thomson et al,High-throughput singlenucleotide polymorphism genotyping for breeding applications in rice usingthe BeadXpress platform,Mol Breeding(2012)29:875-886.以下简称论文2)选取的实验对象为50个水稻自交系样品的384个SNP分子标记数据,从5个类群中随机选择40个自交系作为对照样品、10个自交系作为待测样品,对本发明所提出的基于分子标记技术的农作物自交系类群快速鉴定方法进行验证,具体实施过程如下:
1.建立对照样品的指纹信息库。
50个水稻品种自交系,除去10个自交系作为待测样品,将其余的40个玉米自交系作为对照样品构建对照样品的指纹信息库。具体试验操作步骤参见论文2。分析对照样品的指纹数据质量,样品指纹质量参见表6,位点数据质量参见表7。
表6对照自交系的样品指纹质量
Figure GDA0003354809990000171
表6显示了对照自交系的样品指纹数据质量,所有样品均在指纹质量建议范围之内,即样品的位点纯合率大于0.900,样品的位点缺失率小于0.100。
表7对照自交系的位点数据质量
Figure GDA0003354809990000172
Figure GDA0003354809990000181
Figure GDA0003354809990000191
Figure GDA0003354809990000201
Figure GDA0003354809990000211
表7显示了对照自交系的374个SNP位点数据质量,343个SNP位点的最小等位基因频率大于0.150,345个SNP位点的多态性信息量的值大于0.200,355个SNP位点的样品缺失率小于0.10,374个SNP位点的样品纯合率的值大于0.90。总体而言,超过300个SNP位点数据质量基本符合本发明预设的要求,为直接使用论文2的分析结果验证本发明的准确性,本步骤保留所有位点进入下一步分析。
2.划分对照自交系的类群
根据论文2中对照自交系类群结果,通过计算类群内遗传距离的均值和标准差,计算每个类群的阈值。阈值的计算公式为
Figure GDA0003354809990000221
遗传距离计算公式采用Nei’s1973。各个类群的阈值计算结果见表8:
表8对照自交系五个类群的阈值
Figure GDA0003354809990000222
3.获取待测自交系指纹信息
获取待测自交系指纹信息的步骤和方法同本实施例步骤1。
表9待测自交系的样品指纹质量
Figure GDA0003354809990000223
Figure GDA0003354809990000231
表9显示了待测自交系的样品指纹质量,所有待测样品均符合本发明预设,即样品的位点纯合率大于0.900,样品的位点缺失率小于0.100。
4.分析待测自交系与对照自交系关系
按照本发明的步骤,采用Nei’s1973遗传距离计算公式计算待测自交系与对照自交系之间的遗传距离,并找出该遗传距离的最小值对应的对照样品,初步判断待测自交系划归该对照样品所在的类群。根据本发明提出的类群阈值概念及算法,计算出对照样品所在类群的阈值,并判断遗传距离的最小值是否在该阈值范围内。具体结果见表10。
表10待测自交系的类群划分结果
Figure GDA0003354809990000232
表10表明,所有样品遗传距离最小值均在阈值范围内,与已知分类结果一致;充分说明本发明的基于分子标记技术的农作物自交系类群的鉴定方法准确、可行。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (7)

1.一种基于分子标记技术的农作物自交系类群的鉴定方法,其特征在于,包括以下步骤:
(1)建立农作物对照自交系的指纹信息库;
(2)划分对照自交系的类群;
(3)获取待测自交系指纹信息;
(4)计算待测自交系与对照自交系之间的遗传距离和对照样品所在类群的阈值,并判断遗传距离的最小值是否在该阈值范围内进而划分待测自交系的类群;
其中,步骤(1)建立农作物对照自交系指纹信息库包括以下步骤:
S1、农作物对照自交系样品的选择:若样品的类群信息已知,则从每个已知类群中选择5-10个样品组成对照自交系;或
若样品的类群信息未知,则1)样品代表性已知,选择公认的、种质资源官方的样品组成对照自交系,样品数不少于30个;或2)样品代表性未知,选择和待测农作物自交系有亲缘关系的样品组成对照自交系,样品数不少于30个;
S2、根据不同的基础条件、需求和不同的数据特征选择不同的分子标记检测平台;当选择SSR分子标记检测平台时,可用的位点数不少于30个;当选择SNP分子标记检测平台时,可用的位点数不少于300个;当选择InDel分子标记检测平台时,可用的位点数不少于300个;
S3、对对照自交系样品的指纹数据质量进行控制,包括位点数据质量的控制和样品指纹质量的控制;
所述位点数据质量从四个方面进行控制,分别是等位基因频率、多态性信息量、位点的样品缺失率、位点的样品纯合率;
所述样品指纹质量从两个方面进行控制,分别是样品的位点缺失率和样品的位点纯合率;
其中,步骤(2)划分对照自交系的类群的过程如下:
若对照自交系的类群信息未知,则步骤(2)的划分对照自交系的类群的方法步骤为:
A1、计算遗传距离;
A2、在遗传距离矩阵的基础上对未知类群的对照自交系进行聚类分析,根据聚类结果进行类群的划分;
A3、定义阈值:计算出类群内两两样品之间的遗传距离后,计算所有遗传距离的平均值和标准差s,将作为阈值的上限,下限不限,该阈值就是这个类群对应的阈值;
反之,若对照自交系的类群信息已知,则步骤(2)的划分对照自交系的类群的方法步骤为:
B1、计算遗传距离;
B2、定义阈值:计算出类群内两两样品之间的遗传距离后,计算所有遗传距离的平均值和标准差s,将作为阈值的上限,下限不限,该阈值就是这个类群对应的阈值。
2.根据权利要求1所述的鉴定方法,其特征在于,步骤(1)的S3位点数据质量控制中,
等位基因频率的控制方面,若采用SSR分子标记检测平台,则对照自交系样品指纹数据最大等位基因频率小于0.80;若采用SNP或InDel分子标记检测平台,则对照自交系样品指纹数据最小等位基因频率大于0.15;
多态性信息量的控制方面,若采用SSR分子标记检测平台,则对照自交系样品指纹数据的多态性信息量的值大于0.40;若采用SNP或InDel分子标记检测平台,则对照自交系样品指纹数据的多态性信息量的值大于0.20;
位点的样品缺失率控制方面,其计算公式为:LSMR=Sn/St,其中,Sn是该位点数据缺失的样品数目,St是给定群体的样品总数;若采用SSR分子标记检测平台,则对照自交系样品的指纹数据的位点的样品缺失率小于0.20;若采用SNP或InDel分子标记检测平台,则对照自交系样品指纹数据的位点的样品缺失率小于0.10;
位点的样品纯合率控制方面,其计算公式为:LSHR=Si/(St-Sn),Sh+Si=St-Sn,其中,Sh是该位点基因型为杂合类型的样品数目,Si是该位点基因型为纯合类型的样品数目,St是给定群体的样品总数,Sn是该位点数据缺失的样品数目;若采用SSR分子标记检测平台,则对照自交系样品的指纹数据的位点的样品纯合率的值大于0.75,若采用SNP或InDel分子标记检测平台,则对照自交系样品指纹数据的位点的样品纯合率的值大于0.90。
3.根据权利要求1所述的鉴定方法,其特征在于,步骤(1)的S3样品指纹质量控制中,在样品的位点缺失率控制方面,其计算公式为:SLMR=Ln/Lt,其中,Ln代表数据缺失的位点数目,Lt代表给定集合的位点总数,若采用SSR分子标记检测平台,则对照自交系样品的指纹质量的位点缺失率小于0.20;在若采用SNP或InDel分子标记检测平台,则对照自交系样品的指纹质量的样品的位点缺失率小于0.10;
在样品的位点纯合率控制方面,其计算公式为:SLHR=Li/Lt-Ln,Lh+Li=Lt-Ln,其中,Lh代表杂合的位点数目,Li代表纯合的位点数目,Ln代表数据缺失的位点数目,Lt代表给定集合的位点总数;若采用SSR分子标记检测平台,则对照自交系样品的指纹质量的样品的位点纯合率大于0.70;在若采用SNP或InDel分子标记检测平台,则对照自交系样品的指纹质量的样品的位点纯合率大于0.90。
4.根据权利要求1-3任一所述的鉴定方法,其特征在于,步骤(3)的获取待测自交系指纹信息的方法与步骤(1)建立农作物对照自交系指纹信息库的方法一致,选择相同的位点和相同的分子检测平台进行检测,获取待测自交系指纹信息;然后对待测的自交系控制样品的指纹质量:在样品的位点缺失率控制方面,若采用SSR分子标记检测平台,则待测自交系样品的指纹质量的位点缺失率小于0.20;在若采用SNP或InDel分子标记检测平台,则待测自交系样品的指纹质量的样品的位点缺失率小于0.10;
在样品的位点纯合率控制方面,若采用SSR分子标记检测平台,则待测自交系样品的指纹质量的样品的位点纯合率大于0.70;在若采用SNP或InDel分子标记检测平台,则待测自交系样品的指纹质量的样品的位点纯合率大于0.90。
5.根据权利要求1-3任一所述的鉴定方法,其特征在于,步骤(4)的方法为:计算待测自交系与对照自交系每个个体两两之间的遗传距离,筛选每个待测样品与对照自交系之间遗传距离的最小值,并找出最小值对应的对照自交系所在的类群,初步将该待测自交系划归该类群。
6.根据权利要求 5所述的鉴定方法,其特征在于,步骤(4)还包括判断遗传距离最小值是否在计算的类群阈值范围内,若在,则正式将该待测自交系分为最小遗传距离对照自交系所在的类群,待测自交系快速划分类群结束;
若遗传距离最小值不在计算的类群阈值范围内,则将待测自交系加入到对照自交系样品中,通过重新进行混合聚类分析,得出分类的结果,再参照分类的结果进行推断,进而判断该待测自交系最可能的类群。
7.权利要求1-6任一所述的鉴定方法在农作物育种中的应用。
CN201810130418.2A 2018-02-08 2018-02-08 一种基于分子标记技术的农作物自交系类群的鉴定方法 Active CN108427866B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810130418.2A CN108427866B (zh) 2018-02-08 2018-02-08 一种基于分子标记技术的农作物自交系类群的鉴定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810130418.2A CN108427866B (zh) 2018-02-08 2018-02-08 一种基于分子标记技术的农作物自交系类群的鉴定方法

Publications (2)

Publication Number Publication Date
CN108427866A CN108427866A (zh) 2018-08-21
CN108427866B true CN108427866B (zh) 2022-03-01

Family

ID=63156625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810130418.2A Active CN108427866B (zh) 2018-02-08 2018-02-08 一种基于分子标记技术的农作物自交系类群的鉴定方法

Country Status (1)

Country Link
CN (1) CN108427866B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101545004A (zh) * 2008-03-28 2009-09-30 上海市农业科学院 糯玉米自交系申w22特异分子标记及在其后代品种鉴定中的应用
WO2013080045A3 (en) * 2011-11-28 2013-08-01 Anglo Netherlands Grain B.V. Method for differentiating fertile and sterile plant lines by detection of polymorphic markers in chloroplast dna
CN104532359A (zh) * 2014-12-10 2015-04-22 北京市农林科学院 玉米DNA指纹库构建及品种分子鉴定SNP核心位点组合-maizeSNP384
CN107535350A (zh) * 2017-08-28 2018-01-05 中国农业大学 一种基于ssr标记的玉米组配模式优选方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160355840A1 (en) * 2015-06-03 2016-12-08 E I Du Pont De Nemours And Company Methods of identifying and selecting maize plants with resistance to anthracnose stalk rot

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101545004A (zh) * 2008-03-28 2009-09-30 上海市农业科学院 糯玉米自交系申w22特异分子标记及在其后代品种鉴定中的应用
WO2013080045A3 (en) * 2011-11-28 2013-08-01 Anglo Netherlands Grain B.V. Method for differentiating fertile and sterile plant lines by detection of polymorphic markers in chloroplast dna
CN104532359A (zh) * 2014-12-10 2015-04-22 北京市农林科学院 玉米DNA指纹库构建及品种分子鉴定SNP核心位点组合-maizeSNP384
CN107535350A (zh) * 2017-08-28 2018-01-05 中国农业大学 一种基于ssr标记的玉米组配模式优选方法及系统

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
Exploring the Genetic Characteristics of Two Recombinant Inbred Line Populations via High-Density SNP Markers in Maize;Qingchun Pan et al.;《PLoS ONE》;20121227;第7卷(第12期);第1-9页 *
Genetic architecture of rind penetrometer resistance in two maize recombinant inbred line populations;Kun Li et al.;《BMC Plant Biology》;20140603;第1-11页 *
中国玉米审定品种标准 SSR 指纹库的构建;王凤格 等;《中国农业科学》;20170106;第50卷(第1期);引言、第1.4-1.5、2.1节 *
付少龙.玉米杂交组合设计方法研究与系统初步构建.《https://jz.docin.com/p-1733346757.html》.2016, *
利用SSR标记划分70份我国玉米自交系的杂种优势群;李新海 等;《中国农业科学》;20031231;第36卷(第6期);第622-627页 *
利用SSR标记划分玉米自交系杂种优势群的研究;郑淑云 等;《玉米科学 2006》;20061231;第14卷(第5期);第26-29页 *
利用SSR标记解析京科968等系列玉米品种的杂优模式;赵久然 等;《玉米科学》;20171231;第25卷(第5期);第1-8页 *
基于近红外光谱图像的玉米种子纯度鉴定方法研究;贾仕强;《中国优秀硕士学位论文全文数据库 农业科技辑》;20150715;第2章 *
玉米杂交组合设计方法研究与系统初步构建;付少龙;《https://jz.docin.com/p-1733346757.html》;20160912;摘要、第2章、第4章 *
玉米自交系籽粒的遗传距离与其近红外光谱距离和品种鉴别模型性能的关系研究;刘旭 等;《光谱学与光谱分析》;20150930;第35卷(第9期);第2510-2515页 *

Also Published As

Publication number Publication date
CN108427866A (zh) 2018-08-21

Similar Documents

Publication Publication Date Title
CN108998550B (zh) 用于水稻基因分型的snp分子标记及其应用
CN104532359A (zh) 玉米DNA指纹库构建及品种分子鉴定SNP核心位点组合-maizeSNP384
CN113278712B (zh) 分析绵羊毛色的基因芯片、分子探针组合、试剂盒及应用
WO2023001211A1 (zh) 一种分析绵羊毛用性状的基因芯片、分子探针组合、试剂盒及应用
CN111088382B (zh) 一种玉米全基因组snp芯片及其应用
CN115198023B (zh) 一种海南黄牛液相育种芯片及其应用
CN111778353B (zh) 用于鉴定普通小麦品种的snp分子标记以及snp分子标记检测方法
CN113278714B (zh) 分析绵羊是否有角的基因芯片、分子探针组合、试剂盒及应用
CN109762922A (zh) 用于菜豆种质资源鉴定的snp标记及其筛选方法
CN108416189B (zh) 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法
CN108179220A (zh) 小麦矮秆基因Rht12紧密连锁的KASP标记及其应用
CN117133354A (zh) 一种高效鉴定林木关键育种基因模块的方法
CN113293220B (zh) 分析绵羊耳部大小的基因芯片、分子探针组合、试剂盒及应用
CN108427866B (zh) 一种基于分子标记技术的农作物自交系类群的鉴定方法
CN112226433B (zh) 一种鉴定白皮松种质资源的snp位点引物组合及应用
CN117106936B (zh) 分析山羊毛色性状的分子标记组合及应用
CN117089635B (zh) 分析山羊繁殖性能的分子标记组合及应用
CN117089636B (zh) 分析山羊肉用性能的分子标记组合及应用
LU503449B1 (en) Two PARMS-SNP Molecular Markers for Identifying Resistant Gene VrTAF5 of Vigna radiata (Linn.) Wilczek Cercospora Leaf Spot Disease
CN117089634B (zh) 分析山羊奶用性能的分子标记组合及应用
CN117126948B (zh) 分析山羊耳性状的分子标记组合及其应用
CN117089633B (zh) 分析山羊绒毛有无的分子标记组合及应用
CN113278715A (zh) 分析绵羊乳头数的基因芯片、分子探针组合、试剂盒及应用
CN117106935A (zh) 分析山羊有无角性状的分子标记组合及应用
CN117625798A (zh) 用于肉牛基因分型检测的分子标记组合及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant