CN104805193A - 一种测试水稻品种实质性派生关系的方法 - Google Patents
一种测试水稻品种实质性派生关系的方法 Download PDFInfo
- Publication number
- CN104805193A CN104805193A CN201510150611.9A CN201510150611A CN104805193A CN 104805193 A CN104805193 A CN 104805193A CN 201510150611 A CN201510150611 A CN 201510150611A CN 104805193 A CN104805193 A CN 104805193A
- Authority
- CN
- China
- Prior art keywords
- rice varieties
- measured
- genotype
- test zone
- trn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种测试水稻品种实质性派生关系的方法。该方法包括:获得变异位点;确定测试区域;抽样提取并获得抽样样本的DNA;制备引物;利用所述引物分别对两个抽样样本的DNA进行扩增,分别得到两个待测水稻品种在测试区域的扩增产物用于构建两个待测水稻品种的高通量测序文库;对两个高通量测序文库分别进行高通量测序,分别得到两个所述待测水稻品种的测序片段组;分析两个测序片段组,分别获得两个待测水稻品种基因型;比较两个待测水稻品种基因型,获得待测水稻品种间差异基因型的比例;根据待测水稻品种间差异基因型的比例,判断两个待测水稻品种的实质性派生关系。该方法能够准确、快速且简单地判断待测水稻品种间的实质性派生关系。
Description
技术领域
本发明涉及生物技术领域,特别涉及一种测试水稻品种实质性派生关系的方法。
背景技术
UPOV(International Union for the Protection of New Varieties of Plants:国际植物新品种保护联盟)公约1991年文本对实质性派生品种做了原则性的规定,即实质性派生品种是指由A品种选育得到的B品种没有实质性的变化,B品种称为A品种的实质性派生品种,A品种与B品种间具有实质性派生关系。判断两个品种间是否具有实质性派生关系的方法是检测这两个品种间基因型的差异比例,当该差异比例超过一定值时,即可认为两个品种间不具有实质性派生关系,相反,则认为两个品种间具有实质性派生关系。
目前检测实质性派生性关系的方法还很少,仅有方法的大致流程为:通过SSR标记或SNP标记,扩增待测水稻品种的每个测试区域,再通过电泳或一代测序检测获得的每个测试区域的基因型,根据基因型,判断待测水稻品种间的实质性派生关系。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
实质性派生关系需要对待测水稻品种间大量的基因位点进行检测后,才能准确判断两个品种间是否具有实质性派生关系。在现有的检测实质性派生性关系的方法中,检测位点少导致实质性派生关系的判定结论不准确。同时,现有的SSR标记和SNP标记由于需要单独扩增和单独检测每个测试区域,因此,测试区域数目过多,必然会导致工作量极大增加,因此,现有的方法的测试区域数目都在300个以内,不能完整代表待测水稻品种的全部基因型,从而导致检测结果不准确,实质性派生关系的判定结论也不准确。
发明内容
为了解决现有技术中检测实质性派生关系不准确的问题,本发明实施例提供了一种测试水稻品种实质性派生关系的方法。所述技术方案如下:
本发明实施例提供了一种测试水稻品种实质性派生关系的方法,所述方法包括:
获得不同水稻品种间的变异位点;
通过所述变异位点确定测试区域;
分别对两个待测水稻品种进行抽样,提取并获得两个所述待测水稻品种的抽样样本的DNA;
制备扩增所述测试区域的引物;
利用所述引物分别对两个所述抽样样本的DNA进行扩增,分别得到两个所述待测水稻品种在所述测试区域的扩增产物,所述扩增产物分别用于构建两个所述待测水稻品种的高通量测序文库;
对两个所述待测水稻品种的所述高通量测序文库分别进行高通量测序,分别得到两个所述待测水稻品种的测序片段组;
分析两个所述待测水稻品种的测序片段组,分别获得两个待测水稻品种基因型,所述待测水稻品种基因型为所述测试区域内变异碱基的组合,且所述待测水稻品种基因型的频率≥30%;
比较两个所述待测水稻品种基因型,获得待测水稻品种间差异基因型的比例;
根据所述待测水稻品种间差异基因型的比例,判断两个所述待测水稻品种的实质性派生关系。
具体地,所述测试区域不包括扩增产生杂株基因型的区域;
所述杂株基因型指频率≥0.02%,且所述杂株基因型与所述待测水稻品种的所有基因型间的差异碱基的数量≥2个或所述差异碱基中有非连续碱基的插入或缺失。
具体地,所述测试区域的数目满足以下条件为:BINOMDIST(SD*TN,TN,0.80*SD,TRUE)≥95%,其中,TN为所述测试区域的数目,SD为判定阈值;所述测试区域的数目满足的条件含义为:当所述测试区域的数目为TN、所述判定阈值为SD且所述待测水稻品种间差异基因型的比例为0.80*SD时,判断所述待测水稻品种间差异基因型的比例小于所述判定阈值SD的概率保障大于等于95%。
具体地,分别对两个所述待测水稻品种进行抽样的方法为:对两个所述待测水稻品种分别随机选取100个以上的样本混合后获得两个所述待测水稻品种的抽样样本。
具体地,判断两个所述待测水稻品种的实质性派生关系的方法为:
当所述待测油菜品种间差异基因型的比例<SD时,两个所述待测水稻品种具有实质性派生关系;当所述待测油菜品种间差异基因型的比例≥SD时,两个所述待测水稻品种不具有实质性派生关系,其中,SD为判定阈值。
进一步地,若判断两个所述待测水稻品种具有实质性派生关系时,结论正确的概率≥BINOMDIST(SD*TRN,TRN,OD,TRUE);若判断两个所述待测水稻品种不具有实质性派生关系时,结论正确的概率≥BINOMDIST((1-SD)*TRN,TRN,1-OD,TRUE);其中,TRN为两个所述待测水稻品种的共有测试区域的数目,OD为所述待测水稻品种间差异基因型的比例,BINOMDIST为excel 2010函数,BINOMDIST(SD*TRN,TRN,OD,TRUE)的含义为:当所述共有测试区域的数目为TRN时,所述待测水稻品种间差异基因型的比例OD小于所述判定阈值SD的概率;BINOMDIST((1-SD)*TRN,TRN,1-OD,TRUE)含义为:当所述共有测试区域的数目为TRN时,所述待测水稻品种间差异基因型的比例OD大于所述判定阈值SD的概率。
具体地,通过所述变异位点确定所述测试区域的方法为:
通过区分度计算区分度的值,其中,a为变异窗口区域中被检测到的品种总数,bi为所述变异窗口区域中第i种基因型的品种数,且bi>1,k为包含大于1个品种的基因型的数目,所述变异窗口区域为以每个单核苷酸变异位点为中心,向所述单核苷酸变异位点的两侧各延伸测序列长度的1/2作为检测的窗口;
所述测试区域为细胞质基因组上区分度大的区域或细胞核基因组上所述区分度大且均匀分布的区域。
本发明实施例提供的技术方案带来的有益效果是:本发明实施例提供的方法通过多位点扩增和高通量测序,保证待测水稻品种的测试区域的大样本抽样,成功实现了准确判断待测水稻品种间实质性派生关系的目标,且测试简单、快速。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明实施方式作进一步地详细描述。
实施例.测定水稻品种“R7723”与“R8377”间的实质性派生关系
本发明实施例提供的待测水稻品种为水稻品种“R7723”和“R8377”,二者均为公开、公知的品种。水稻品种“R7723”的来源为水稻品种“R8377”与“IRBB23”杂交后,以“R8377”为轮回亲本,以抗白叶枯病性状为主要目标性状,按回交育种的方法培育而成。
一、获得不同水稻品种间的变异位点。
不同水稻品种间的变异位点可以从已公布的文献资料中获取,但该方法所获得的结果比较零星,在本实施例中,通过将不同水稻的基因组序列与参考水稻品种的基因组序列进行比对,获得了大量的不同水稻品种间的变异位点,其中参考水稻品种可以为“日本睛”水稻,该“日本睛”水稻可以替换为其他已知的参考水稻品种。
进一步地,获得不同水稻品种的基因组序列的方法如下:
本实施例的不同水稻品种的基因组序列有三种来源,第一种为韩斌对1082个水稻品种的基因组的高通量测序序列,相关文献信息如下:Huang XH et al.Amap of rice genome variation reveals the origin of cultivated rice.Nature.2012;7:497–503。该1082个水稻品种的基因组序列公布于EuropeanNucleotideArchive(http://www.ebi.ac.uk/ena/),接收号为ERP001143、ERP000729和ERP000106;第二种为徐讯对50个水稻品种的基因组的高通量测序序列,相关文献信息如下:Xun X et al.Resequencing 50accessions of cultivated and wildrice yields markers for identifying agronomically important genes.Nat Biotechnol.2011,30(1):105-11,该50个水稻品种的基因组序列公布于NCBI Short ReadArchive(http://www.ncbi.nlm.nih.gov/sra),接收号为SRA023116;第三种为按韩斌上述发表的文章中提供的方法对“R8377”、“金科1A”、“IRBB23”、杂交种“金科1A/R7723”和杂株种“D优527”进行了高通量测序。本实施例共获得了1137个水稻品种的基因组的高通量测序序列。
进一步地,利用不同品种的基因组序列获得变异位点。
具体地,由于这1137个水稻品种的测序深度都不高,仅能鉴定单核苷酸变异(SNP)位点,其它变异类型如重复数变异,由于可信度低,不进行鉴定。利用Frederick Sanger比对软件(版本号为0.4)将这1137个水稻品种的基因组的高通量测序序列比对到“日本睛”水稻细胞核参考基因组(版本为IRGSP 4.0,下载地址:http://www.ncbi.nlm.nih.gov)和细胞质参考基因组上,该细胞质参考基因组包括线粒体参考基因组与叶绿体参考基因组,其在NCBI(National Center forBiotechnology Information,美国国立生物技术信息中心)上的接收号分别为NC_011033和NC_001320。对比时,插入片段长度设为500bp,其他参数设定为默认值。采用的Ssaha Pileup软件包(版本号为0.5)鉴定每个品种的SNP位点。该SNP位点定义为差异确定的碱基对、单碱基的插入或单碱基的缺失。该差异确定的碱基对是指不包括差异不确定的碱基对,差异不确定的碱基对指是某些简并碱基间的碱基对,如R代表A或G,因此,A与R之间可能存在差异,也可能不存在差异,因此,A与R间差异不明确,互不为SNP。因此,本发明实施例中的SNP位点为不包括上述差异不确定的碱基对。按以上SNP位点的定义,本发明实施例在所有1137个水稻品种间共获得7236888个SNP位点,其中59503个SNP位点位于细胞质基因组上,其余的SNP位点位于细胞核基因组上。后文提及的基因型即是指测试区域内多个SNP位点的组合,核基因型指基因型位于细胞核基因组上,质基因型是指基因型位于细胞质基因组上。例如,表1中第8个测试区域位于细胞核基因组上,为核基因型,该测试区域共有9个SNP位点,该测试区域的基因型即为这9个SNP位点的组合。
二、通过变异位点确定测试区域,具体方法如下:
测试区域为细胞质基因组上区分度大的区域或细胞核基因组上区分度大且SNP位点均匀分布的区域,其中,区分度其中,a为变异窗口区域中被检测到的品种总数,bi为变异窗口区域中第i种基因型的品种数,且bi>1,k为包含大于1个品种的基因型的数目,变异窗口区域为以每个单核苷酸变异位点(SNP位点)为中心,向单核苷酸变异位点的两侧各延伸测序列长度的1/2作为检测的窗口;测试区域为细胞质基因组上区分度大的区域或细胞核基因组上区分度大且均匀分布的区域。区分度的计算原理如下:所有品种间的组合数为,其中,同一基因型内的不同品种间的组合是不可区分的,其数目为那么,不可被区分的品种组合的比例为可被区分的品种组合的比例即区分度由此可见,区分度越大,越能将不同品种区分开,区分度大的变异窗口区域对实质性派生关系的测试更有效。若细胞核基因组上的变异窗口区域分布不均匀,会导致某些区域相邻,从而连锁遗传,信息容易重叠,因此,细胞核基因组上选择测试区域的综合原则是:区分度大且SNP位点均匀分布。细胞质基因组无连锁遗传问题,所以,细胞质基因组上只需要选择区分度大的区域即可。
首先,以获得的每个SNP位点为中心,向左右各延伸99bp和100bp,构成200bp的变异窗口。根据获得的7236888个SNP位点,可以获得7236888个变异窗口,计算这些变异窗口区域的区分度例如,第1个变异窗口区域中,共检测到了a=520个品种,共有k=3种基因型ACCT、CGTT、ACCC,它们的品种数分别为b1=10个、b2=30个和b3=431个,因此,其含义是:通过第1个变异窗口区域,可以将520个品种中的31%的品种组合区分开,另外79%的品种组合无法区分开,需要更多的变异窗口才能区分开。按照同样的方法,计算获得全部7236888个变异窗口的区分度并从中选取位于细胞核基因组中区分度最大的6800个变异窗口和位于细胞质基因组中区分度最大的200个变异窗口。逐个检查位于细胞核基因组的6800个变异窗口中,每个变异窗口与下一个变异窗口间的距离,若距离超过100K(1K=1000个碱基),则放弃其中区分度较小的变异窗口之后再检查,直至相邻查变异窗口的距离均大于100K为止。选择100K的距离标准是因为水稻基因组大小约为500M(1M=100万个碱基),按最终入选2000个位于细胞核基因组的测试区域计,平均的测试区域间距离为250K,但由于一些特异区域如着丝粒等很少有变异位点,因此,平均距离应该小于250K。按以上方法,选出了4061个位于细胞核基因组的变异窗口,它们与获得的位于细胞质基因组中区分度最大的200个变异窗口一起共4261个变异窗口作为入选的测试区域。其中,选择区分度最大的200个变异窗口,为经验值,该数量可以根据具体情况进行修改。
三、分别对两个待测水稻品种进行抽样,提取并获得两个待测水稻品种的抽样样本的DNA,抽样样本的获得方法为:对两个待测水稻品种分别随机选取100个以上的样本混合后,获得两个待测水稻品种的抽样样本。
在本实施例中,选取了待测水稻品种“R7723”的50000粒种子发芽,随机选取30000个大小大致相等的芽混合后置于研钵中,向研钵中加入液氮后充分研磨成粉。采用北京天根生化科技有限公司生产的货号为DP305的植物基因组DNA提取试剂盒提取并获得待测水稻品种“R7723”混合样本的DNA,DNA提取方法按该试剂盒的操作手册进行。利用美国Invitrigen公司生产的dsDNAHS Assay Kit(货号为Q32852)及其说明书对获得的DNA进行定量,将定量后的待测水稻品种“R7723”的DNA稀释为10.00ng/μl。
按照同样的方法,对待测水稻品种“R8377”进行抽样并提取DNA,同样将定量后的待测水稻品种“R8377”的DNA稀释为10.00ng/μl。
四、制备扩增测试区域的引物,具体如下:
测试区域采用多重PCR(Polymerase Chain Reaction,聚合酶链式反应)技术进行检测,多重PCR技术是指在同一个PCR反应中加入多个PCR引物,同时扩增基因组上的多个位点。该技术的关键是设计并合成多重PCR引物,本实施例采用美国LifeTechnology公司提供的多重PCR技术,其能够设置多至12000重PCR引物。
引物获取过程如下:登录LifeTechnology公司多重PCR引物在线设计网页https://ampliseq.com/protected/help/pipelineDetails.action,按其要求提交相关信息即可。其中,本实施例中,“Application type”选项选择“DNA Hotspot designs(single-pool)”。若选择multi-pool,则多重PCR将分多管进行,成本会有所增加,而single-pool的引物只需要一次多重PCR即可,节省成本,缺点是某些通用测试区域引物设计可能失败,但基因组上的备选的通用测试区域较多,因此,放弃一些备选的通用测试区域并不影响结果。将待测水稻品种的细胞核参考基因组和细胞质参考基因组融合为一个文件,并在“Select the genome you wish to use”选项中选择“Custom”后,上传融合的文件作为设计多重PCR引物时的参考基因组。DNA Type选项选择“Standard DNA”,在Add Hotspot选项中,添加需要设计的通用测试区域内的SNP位点的位置信息即可,包括染色体信息、SNP的起始位点和SNP的结束位点,其部分实例见表1。最后点击“Submit targets”按钮提交并得到设计的多重PCR引物。本实施例中,从所有4261个测试区域中,设计并成功验证了2231对多重PCR引物,用于扩增相应的2231个测试区域。验证多重PCR引物的方法为按本发明提供的方法,提取同一株水稻上的叶片基因组DNA,并利用设计的多重PCR引物对获得的基因组DNA进行扩增、建库、高通量测序并分析测序片段组,去掉以下测试区域相应的引物:该测试区域的测序片段数不足1000或存在杂株基因型,保留下来的引物即为验证成功的多重PCR引物。所以,测试区域不包括扩增产生杂株基因型的区域,杂株基因型指频率≥0.02%,且杂株基因型与待测水稻品种的所有基因型间的差异碱基的数量≥2个或差异碱基中有非连续碱基的插入或缺失。由于基因组DNA来源于同一株水稻叶片,不可能存在杂株品种,因此,杂株基因型是由测试区域的特殊结构造成的PCR或测序偏好性错误,去掉这些测试区域避免了此类系统错误。规定测试区域为不包括扩增产生杂株基因型的测试区域的另一个目的是:保留下来的测试区域除了用作待测水稻品种间的实质性派生关系的测试外,还可以作杂株率的计算,实现了同一套测试引物的多重用处。验证成功的多重PCR引物也由该公司混合好后以液体的形式提供给客户使用。上述成功设计了多重PCR引物的2231个测试区域即为最终用于待测水稻品种检测的测试区域,其中,100个测试区域位于细胞质基因组上,剩余的2131个测试区域位于细胞核基因组上。已有的实质性派生品种判定都未采用细胞质基因组上的测试位点,而细胞质的不同,同样可以产生不同的品种性状表现,应该用于实质性派生品种关系的判定。
测试区域的数目满足以下条件:BINOMDIST(SD*TN,TN,0.80*SD,TRUE)≥95%,其中,TN为测试区域的数目,SD为判定阈值;BINOMDIST(SD*TN,TN,0.80*SD,TRUE的含义为:当测试区域的数目为TN、待测水稻品种间差异基因型的比例为0.80*SD且判定阈值为SD时,判断待测水稻品种间差异基因型的比例小于判定阈值SD的概率保障大于等于95%。该条件的含义是:当待测水稻品种间差异基因型的比例为判断阈值的80%时,由测试区域的数目决定的判断待测水稻品种具有实质性派生关系的正确率≥95%。实质性派生关系的判断阈值是根据各国的育种现状、标记方式、要求严格程度而人为确定的。在本实施例中,SD确定为3%。逐步加大测试区域的数目TN发现,当TN≥1934时,上述公式成立,因此,测试区域的数目应该≥1934。对已有的SSR和SNP测试来说,200个测试区域已算很多了,若待测水稻品种间差异基因型的比例为判断阈值的80%,其正确率仅为其正确率仅≥BINOMDIST(3%*200,200,0.80*3%,TRUE)=79%,因此,本实施提供的方法,可以获得更为准确的结论。
五、利用引物分别对两个抽样样本的DNA进行扩增,分别得到两个待测水稻品种在测试区域的扩增产物,扩增产物分别用于构建两个待测水稻品种的高通量测序文库,具体方法如下:
利用文库构建试剂盒2.0(由美国LifeTechnology公司生产,货号为4475345)多重PCR扩增测试区域后,利用扩增产物构建高通量测序文库。该试剂盒包括以下试剂:5×Ion AmpliSeqTMHiFi Mix、FuPa试剂、转换试剂、测序接头溶液和DNA连接酶。文库构建的方法按该试剂盒的操作手册《Ion AmpliSeqTMLibraryPreparation》(出版号:MAN0006735,版本:A.0)进行。通过多重PCR扩增2231个测试区域,多重PCR的扩增体系如下:5×Ion AmpliSeqTMHiFi Mix 4μl、制备的测试区域引物混合液4μl、待测水稻品种“R7723”的DNA 10ng和无酶水11μl。多重PCR的扩增程序如下:99℃,2分钟;(99℃,15秒;60℃,4分钟)×25个循环;10℃保温。利用FuPa试剂消化掉多重PCR扩增产物中多余的引物后,再进行磷酸化,具体方法为:向多重PCR的扩增产物中加入2μL FuPa试剂,混匀后,在PCR仪上按如下程序反应:50℃,10分钟;55℃,10分钟;60℃,10分钟;10℃保存,得到混合物a,混合物a为含有经过磷酸化的扩增产物溶液。将磷酸化的扩增产物连接上测序接头,具体方法为:向混合物a中加入转换试剂4μL、测序接头溶液2μL和DNA连接酶2μL,混匀后,在PCR仪上按如下程序反应:22℃,30分钟;72℃,10分钟;10℃保存,得到混合液b。利用标准的乙醇沉淀方法纯化混合液b后溶解于10μL无酶水中。利用美国Invitrigen公司生产的dsDNA HS Assay Kit(货号为Q32852)并按照其说明书进行测定,并获得混合液b的质量浓度后,将纯化后混合液b稀释至15ng/ml,得到浓度约100pM的测试区域的高通量测序文库。
按照同样的方法,对待测水稻品种“R8377”进行高通量测序文库的构建,同样得到浓度约100pM的测试区域的高通量测序文库。
六、对两个待测水稻品种的高通量测序文库分别进行高通量测序,分别得到两个待测水稻品种的测序片段组,具体方法如下:
确定高通量测序深度:高通量测序的深度≥5000倍,即平均覆盖测试区的片段数≥5000个片段,5000倍为一个经验值,可根据实际情况调整。之所以规定这个值,是因为5000倍的测序量成本并不高但足以准确计算30%的待测基因型频率,因此,规定5000倍作为高通量测序的深度。
利用高通量测序文库进行高通量测序
利用获得的所有测试区域的高通量测序文库和试剂盒Ion PI Template OT2200Kit v2(美国invirtrigen公司生产,货号为4485146)进行测序前的ePCR(Emulsion PCR,乳化聚合酶链反应)扩增,操作方法按该试剂盒的操作手册进行。利用ePCR产物和试剂盒Ion PI Sequencing 200Kit v2(美国invirtrigen公司生产,货号为4485149)在Proton二代高通量测序仪上进行高通量测序,操作方法按该试剂盒的操作手册进行。在本实施例中,高通量测序通量设置为平均覆盖测试区域30000倍。
对高量测序结果进行预处理
将高通量测序片段比对到所有2231个测试区域,去掉比对不成功和基因型检测不全的测序片段后,剩余的所有测序片段称为测序片段组。基因型检测不完全的测序片段是指没能将表1中“SNP在参考基因组上的位置”所示的所有SNP位点检测到的测序片段,基因型检测不全的原因是测序片段过短,比对不成功的原因是测序片段多为非特异扩增产物。
七、分析两个待测水稻品种的测序片段组,分别获得两个待测水稻品种基因型,待测水稻品种基因型为测试区域内变异碱基的组合,且待测水稻品种基因型的频率≥30%,具体方法如下:
将测序片段组比对到所有测试区域,并统计每个测试区域中的测序片段数,去掉测序片段数≤1000条的测试区域,剩余的测试区域为检测成功的测试区域。在本实施例中,共获得2029个检测成功的测试区域。比对到测试区域的片段称为该测试区域的测序片段,从测序片段中提取表1中“SNP在参考基因组上的位置”所示的位置的碱基组合称为该测序片段的基因型。基因型的频率是指测序片段组中,代表该基因型的测序片段数占该基因型所在测试区域的测序片段总数的比例。待测水稻品种基因型为测试区域内变异碱基的组合,且待测水稻品种基因型的频率≥30%。一般来说,所抽取的样本中,杂种子的量不高于10%,测序错误不超过1%,二者合计不超过11%,因此,对于纯合位点来说,待测水稻品种基因型只有一种,其频率应该大于89%,而对于杂合位点来说,待测水稻品种基因型有2种,其比例应该大于45.5%,因此,规定待测水稻品种基因型的频率≥30%,可以排除因测序错误和待测水稻品种中混杂有杂株而对待测水稻品种基因型的干扰。
例如,在测序片段组中,第1个测序区域的测序片段总数为29888条,有ACCC、CGTT、CCCC、GCCC……共41种基因型,代表这些基因型的测序片段数分别29603条、14条、2条、1条……,这些基因型的频率为29603/29888=99.05%、14/29888=0.05%、2/29888=0.007%、1/29888=0.003%……。按待测水稻品种基因型的定义,ACCC为第1个测试区域的待测水稻品种“R7723”基因型,其它基因型为测序错误或杂株引起的基因型。按相同的方法,判断并获得全部2029个检测成功的测试区域的待测水稻品种“R7723”基因型。
按与待测水稻品种“R7723”相同的方法,同样获得了待测水稻品种“R8377”的2029个检测成功的测试区域,以及待测水稻品种“R8377”在所有检测成功的测试区域的基因型,部分结果见表1。由于篇幅限制,本实施例没有完整列出全部待测水稻品种在所有测试区域基因型,只列出了部分实例。同样基于篇幅限制,本实施例中还有部分地方也仅列出部分相关实例,其余未列出的数据可根据本实施例的方法补全。
表1为待测水稻品种基因型及其相关信息
八、比较两个待测水稻品种基因型,获得待测水稻品种间差异基因型的比例,具体方法如下:
若在测试区域中,所有待测水稻品种基因型均无缺失,称该测试区域为待测水稻品种的共有测试区域。在共有测试区域中,若待测水稻品种间基因型不完全相同,则称该基因型为待测水稻品种间差异基因型,例如,若待测水稻品种A的基因型为AA、AA、AA、AA、AA/CC、AA/CC,待测水稻品种B对应的基因型为AA、CC、AA/CC、CC/TT、AA/CC、CC/TT,那么在这6个测试区域中待测水稻品种间的差异基因型判定如下:不是、是、是、是、不是和是。以上基因型中的“/”代表该测试区域为基因杂合位点,因此检测到了“/”前后两种基因型。待测水稻品种间差异基因型的比例=拥有差异基因型的测试区域的数目/共有测试区域的数目。
在本实施例中,待测水稻品种“R8377”与待测水稻品种“R7723”的共有测试区域为2029个,在第1个共有测试区域中,它们的基因型分别为ACCC和ACCC,它们完全相同,因此,不为待测水稻品种间的差异基因型。按此方法,逐个判断所有2029个共有测试区域中,是否存在差异基因型,结果为:所有共有测试区域中,存在差异基因型的测试区域数目为0个,所以,待测水稻品种间差异基因型的比例OD=0/2029=0%。
根据待测水稻品种间差异基因型的比例和判定阈值,判断两个待测水稻品种的实质性派生关系,判断两个待测水稻品种的实质性派生关系的方法为:当待测水稻品种间差异基因型的比例<SD时,两个待测水稻品种具有实质性派生关系;当待测水稻品种间差异基因型的比例≥SD时,两个待测水稻品种不具有实质性派生关系,其中,SD为判定阈值。
本实施例中,待测水稻品种间差异基因型的比例=0%<SD=3%,因此判断待测水稻品种“R8377”与待测水稻品种“R7723”间具有实质性派生关系。
若两个判断待测水稻品种具有实质性派生关系时,结论正确的概率≥BINOMDIST(SD*TRN,TRN,OD,TRUE);若判断两个待测水稻品种不具有实质性派生关系时,结论正确的概率≥BINOMDIST((1-SD)*TRN,TRN,1-OD,TRUE);其中,TRN为两个待测水稻品种的共有测试区域的数目,SD为判定阈值,OD为待测水稻品种间差异基因型的比例,BINOMDIST为excel 2010函数,BINOMDIST(SD*TRN,TRN,OD,TRUE)的含义为:当共有测试区域的数目为TRN时,待测水稻品种间差异基因型的比例OD小于判定阈值SD的概率;BINOMDIST((1-SD)*TRN,TRN,1-OD,TRUE)含义为:当共有测试区域的数目为TRN时,待测水稻品种间差异基因型的比例OD大于判定阈值SD的概率。
本实施例中,判断两个待测水稻品种具有实质性派生关系且共有测试区域的数目为2029个,因此,结论正确的概率≥BINOMDIST(SD*TRN,TRN,OD,TRUE)=BINOMDIST(3%*2029,2029,0%,TRUE)=100%,因此,本实施中,判断两个待测水稻品种具有实质性派生关系的结论是很准确的。
结果验证
目前,全世界还没有一个公认的品种间实质性派生关系认定的标准方法,但UPOV的1991年文本中有这样的描述:“实质性派生品种可以通过诸如天然或诱发的突变型、体细胞克隆变异型的选择,从原始品种植物中的变异株系的选择,以及回交或遗传工程转化获得”。本实施例中,待测水稻品种“R7723”是通过待测水稻品种“R8377”作为轮回亲本,回交选育而来的,所以,按UPOV文本的描述,这两个待测水稻品种间应该具有实质性派生关系,由此可见,本实施例的结论是正确的。
本发明实施例通过高通量测序和多位点扩增,实现了待测水稻品种内测试区域的大样本抽样,保证了实质性派生关系检测的准确性。同时,利用多位点扩增技术,多个测试区域的检测工作量实质上相当于传统SSR或SNP检测的一个测试区域的工作量,因此,本实施例不但准确,而方法简单、快速。例如,若同样检测2029个测试区域,利用传统的SSR或SNP检测方法,需要进行2029次PCR扩增和2029次的扩增产物的检测(SSR按电泳方法检测,SNP按一代测试的方法检测),其工作量、速度以及检测成本都是不可被接受的。除此之外,本发明中得到了测试区域内每个碱基的序列,分辨率已经达到极致,且信息量也是最大的,是其它检测方法都无法比拟,例如,SSR得到的是片段的长度信息,可能存在的问题是:片段长度相差过小,可能检测不到,即使是相同长度的片段,其内部的碱基组成也可能不一样,但SSR同样检测不到。一次SNP检测只能检测一对SNP位点,而本实施例中,可以检测测试区域所有SNP,还可以发现测试区域内SNP之外的变异,如重复数、缺失与插入等,这些都是单个SNP检测无法发现的。另外,除采用一代测序检测SNP外,也有采用杂交的方式检测SNP,这种情况下,得到的是杂交信号,噪音大且无法发现未知变异,且一个探针仅能检测一对SNP,分辨率与信息量也远小于本发明。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种测试水稻品种实质性派生关系的方法,其特征在于,所述方法包括:
获得不同水稻品种间的变异位点;
通过所述变异位点确定测试区域;
分别对两个待测水稻品种进行抽样,提取并获得两个所述待测水稻品种的抽样样本的DNA;
制备扩增所述测试区域的引物;
利用所述引物分别对两个所述抽样样本的DNA进行扩增,分别得到两个所述待测水稻品种在所述测试区域的扩增产物,所述扩增产物分别用于构建两个所述待测水稻品种的高通量测序文库;
对两个所述待测水稻品种的所述高通量测序文库分别进行高通量测序,分别得到两个所述待测水稻品种的测序片段组;
分析两个所述待测水稻品种的测序片段组,分别获得两个待测水稻品种基因型,所述待测水稻品种基因型为所述测试区域内变异碱基的组合,且所述待测水稻品种基因型的频率≥30%;
比较两个所述待测水稻品种基因型,获得待测水稻品种间差异基因型的比例;
根据所述待测水稻品种间差异基因型的比例,判断两个所述待测水稻品种的实质性派生关系。
2.根据权利要求1所述的方法,其特征在于,所述测试区域不包括扩增产生杂株基因型的区域;
所述杂株基因型指频率≥0.02%,且所述杂株基因型与所述待测水稻品种的所有基因型间的差异碱基的数量≥2个或所述差异碱基中有非连续碱基的插入或缺失。
3.根据权利要求1所述的方法,其特征在于,所述测试区域的数目满足以下条件为:BINOMDIST(SD*TN,TN,0.80*SD,TRUE)≥95%,其中,TN为所述测试区域的数目,SD为判定阈值;所述测试区域的数目满足的条件含义为:当所述测试区域的数目为TN、所述判定阈值为SD且所述待测水稻品种间差异基因型的比例为0.80*SD时,判断所述待测水稻品种间差异基因型的比例小于所述判定阈值SD的概率保障大于等于95%。
4.根据权利要求1所述的方法,其特征在于,分别对两个所述待测水稻品种进行抽样的方法为:对两个所述待测水稻品种分别随机选取100个以上的样本混合后获得两个所述待测水稻品种的抽样样本。
5.根据权利要求1所述的方法,其特征在于,判断两个所述待测水稻品种的实质性派生关系的方法为:
当所述待测油菜品种间差异基因型的比例<SD时,两个所述待测水稻品种具有实质性派生关系;当所述待测油菜品种间差异基因型的比例≥SD时,两个所述待测水稻品种不具有实质性派生关系,其中,SD为判定阈值。
6.根据权利要求5所述的方法,其特征在于,若判断两个所述待测水稻品种具有实质性派生关系时,结论正确的概率≥BINOMDIST(SD*TRN,TRN,OD,TRUE);若判断两个所述待测水稻品种不具有实质性派生关系时,结论正确的概率≥BINOMDIST((1-SD)*TRN,TRN,1-OD,TRUE);其中,TRN为两个所述待测水稻品种的共有测试区域的数目,OD为所述待测水稻品种间差异基因型的比例,BINOMDIST为excel 2010函数,BINOMDIST(SD*TRN,TRN,OD,TRUE)的含义为:当所述共有测试区域的数目为TRN时,所述待测水稻品种间差异基因型的比例OD小于所述判定阈值SD的概率;BINOMDIST((1-SD)*TRN,TRN,1-OD,TRUE)含义为:当所述共有测试区域的数目为TRN时,所述待测水稻品种间差异基因型的比例OD大于所述判定阈值SD的概率。
7.根据权利要求1所述的方法,其特征在于,通过所述变异位点确定所述测试区域的方法为:
通过区分度计算区分度的值,其中,a为变异窗口区域中被检测到的品种总数,bi为所述变异窗口区域中第i种基因型的品种数,且bi>1,k为包含大于1个品种的基因型的数目,所述变异窗口区域为以每个单核苷酸变异位点为中心,向所述单核苷酸变异位点的两侧各延伸测序列长度的1/2作为检测的窗口;
所述测试区域为细胞质基因组上区分度大的区域或细胞核基因组上所述区分度大且均匀分布的区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510150611.9A CN104805193A (zh) | 2015-03-31 | 2015-03-31 | 一种测试水稻品种实质性派生关系的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510150611.9A CN104805193A (zh) | 2015-03-31 | 2015-03-31 | 一种测试水稻品种实质性派生关系的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104805193A true CN104805193A (zh) | 2015-07-29 |
Family
ID=53690389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510150611.9A Pending CN104805193A (zh) | 2015-03-31 | 2015-03-31 | 一种测试水稻品种实质性派生关系的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104805193A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108866225A (zh) * | 2018-06-21 | 2018-11-23 | 江汉大学 | 一种遗传修饰水稻遗传背景的筛查方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103429073A (zh) * | 2011-03-18 | 2013-12-04 | 本田技研工业株式会社 | 新品种、植物品种的鉴别方法以及使水稻个体早熟的方法 |
CN104328507A (zh) * | 2014-10-11 | 2015-02-04 | 中国水稻研究所 | 一种用于水稻品种鉴定的snp芯片、制备方法及用途 |
-
2015
- 2015-03-31 CN CN201510150611.9A patent/CN104805193A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103429073A (zh) * | 2011-03-18 | 2013-12-04 | 本田技研工业株式会社 | 新品种、植物品种的鉴别方法以及使水稻个体早熟的方法 |
CN104328507A (zh) * | 2014-10-11 | 2015-02-04 | 中国水稻研究所 | 一种用于水稻品种鉴定的snp芯片、制备方法及用途 |
Non-Patent Citations (1)
Title |
---|
YVES ROUSSELLE, LIZ JONES, STEPHEN SMITH & BARRY NELSON ET AL.: "IDENTIFICATION OF SNP MARKERS TO AID ASSESSMENT OF ESSENTIAL DERIVATION IN MAIZE", 《WORKING GROUP ON BIOCHEMICAL AND MOLECULAR TECHNIQUES AND DNA-PROFILING IN PARTICULAR,FOURTEENTH SESSION》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108866225A (zh) * | 2018-06-21 | 2018-11-23 | 江汉大学 | 一种遗传修饰水稻遗传背景的筛查方法 |
CN108866225B (zh) * | 2018-06-21 | 2022-05-06 | 江汉大学 | 一种遗传修饰水稻遗传背景的筛查方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107937502B (zh) | 一种筛选微生物高多态性分子标记位点的方法 | |
CN104263848B (zh) | 一种耳聋易感基因突变检测试剂盒及其制备方法与应用 | |
CN106834507A (zh) | Dmd基因捕获探针及其在dmd基因突变检测中的应用 | |
CN104830975A (zh) | 一种玉米亲本来源真实性及其比例测试新方法 | |
CN104846076A (zh) | 一种测定杂交油菜新品种的特异性、一致性与稳定性的方法 | |
CN105603074A (zh) | 一种微生物定性与定量检测方法 | |
CN113564266A (zh) | Snp分型遗传标记组合、检测试剂盒及用途 | |
CN105603081B (zh) | 一种非诊断目的的肠道微生物定性与定量的检测方法 | |
CN104805193A (zh) | 一种测试水稻品种实质性派生关系的方法 | |
CN105603082A (zh) | 一种水稻微生物定性与定量的检测方法 | |
CN105603075A (zh) | 一种小麦微生物定性与定量的检测方法 | |
CN104805186B (zh) | 一种测试玉米品种实质性派生关系的方法 | |
CN114085926B (zh) | Abcb1基因c3435t的snp位点多态性的引物和探针、试剂盒及检测方法 | |
CN104805195A (zh) | 一种水稻亲本来源真实性及其比例测试新方法 | |
Liu et al. | Quality control of next-generation sequencing-based in vitro diagnostic test for onco-relevant mutations using multiplex reference materials in plasma | |
CN104805185B (zh) | 一种测试植物品种实质性派生关系的方法 | |
CN105603076A (zh) | 一种土壤微生物定性与定量的检测方法 | |
CN104805188B (zh) | 一种测试大豆品种实质性派生关系的方法 | |
CN111199776B (zh) | 评估肿瘤基因组测序数据分析质量的方法、装置及应用 | |
CN104805192A (zh) | 一种测试油菜品种实质性派生关系的方法 | |
CN104805189B (zh) | 一种测定杂交植物新品种的特异性、一致性与稳定性的方法 | |
CN105567831A (zh) | 一种食品微生物定性与定量的检测方法 | |
CN104805196A (zh) | 一种植物亲本来源真实性及其比例测试新方法 | |
CN104805182B (zh) | 一种测定杂交水稻新品种的特异性、一致性与稳定性的方法 | |
CN104805187B (zh) | 一种测试纯系大豆新品种的特异性、一致性与稳定性的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150729 |