CN117210580A - 一种snp分子标记组合在16个鲤品种鉴定中的应用 - Google Patents
一种snp分子标记组合在16个鲤品种鉴定中的应用 Download PDFInfo
- Publication number
- CN117210580A CN117210580A CN202311302944.XA CN202311302944A CN117210580A CN 117210580 A CN117210580 A CN 117210580A CN 202311302944 A CN202311302944 A CN 202311302944A CN 117210580 A CN117210580 A CN 117210580A
- Authority
- CN
- China
- Prior art keywords
- carp
- genotype
- locus
- carps
- snp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 241000252233 Cyprinus carpio Species 0.000 title claims abstract description 160
- 239000003147 molecular marker Substances 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 31
- 241000894007 species Species 0.000 claims abstract description 11
- 238000007637 random forest analysis Methods 0.000 claims abstract description 10
- 241000790704 Cyprinus carpio 'Songpu mirror carp' Species 0.000 claims abstract description 7
- 241001275016 Cyprinus carpio 'jian' Species 0.000 claims abstract description 7
- 241000316729 Tor douronensis Species 0.000 claims abstract description 7
- 241001036160 Cyprinus carpio 'red mirror carp' Species 0.000 claims abstract description 5
- 238000012216 screening Methods 0.000 claims abstract description 5
- 241000252210 Cyprinidae Species 0.000 claims description 14
- 239000011521 glass Substances 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000012098 association analyses Methods 0.000 claims description 5
- 238000003205 genotyping method Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 claims description 3
- 238000012070 whole genome sequencing analysis Methods 0.000 claims description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims 1
- 239000010931 gold Substances 0.000 claims 1
- 229910052737 gold Inorganic materials 0.000 claims 1
- 230000002068 genetic effect Effects 0.000 abstract description 5
- 238000011160 research Methods 0.000 abstract description 3
- 238000010353 genetic engineering Methods 0.000 abstract description 2
- 241001335287 Cyprinus carpio 'xingguonensis' Species 0.000 abstract 1
- 239000000463 material Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000009395 breeding Methods 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 2
- 230000001488 breeding effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000031700 light absorption Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- 238000007844 allele-specific PCR Methods 0.000 description 1
- 230000003602 anti-herpes Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000013505 freshwater Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种SNP分子标记组合在16个鲤品种鉴定中的应用,属于遗传工程技术领域。本发明面向常见的16种鲤品种:黄河鲤、超级鲤、福安鲤、玻璃红鲤、福瑞鲤、红白锦鲤、松浦镜鲤、兴国红鲤、乌克兰鳞鲤、州河鲤、红镜鲤、金背鲤、沅江鲤、荷包红鲤、瓯江彩鲤和建鲤,筛选出包含144个SNP位点的分子标记组合,基于该分子标记组合开发了一种鉴定16个鲤品种的方法,该方法基于样本在各个SNP位点的基因型,用随机森林方法计算预测值,以精准鉴定待测鲤的品种。本发明有望为鲤品种权认定、种质资源保护与利用、遗传进化研究等需求提供技术手段。
Description
技术领域
本发明涉及遗传工程技术领域,特别是涉及一种SNP分子标记组合在16个鲤品种鉴定中的应用。
背景技术
鲤(Cyprinus carpio)是我国主要的食用淡水鱼类之一,在全球多个国家和地区都有广泛的消费。我国具有丰富的鲤遗传资源,包括地理群体和选育群体。目前国内养殖超过20种鲤鱼品种,包括荷包红鲤、玻璃红鲤、兴国红鲤、瓯江彩鲤、德国镜鲤、松浦镜鲤、津新鲤、易捕鲤、松浦红镜鲤、乌克兰鳞鲤、黄河鲤、建鲤、福瑞鲤1号、福瑞鲤2号、金背鲤、大头鲤、沅江鲤、禾花鲤、文庆鲤、乳源鲤、金背鲤等。不同鲤品种的生长、食物转化率、抗病、抗逆、营养品质等性状都存在差异,为鲤新品种创制提供了丰富的育种材料。但是除了个别品种有典型的外观特征,如镜鲤、荷包红鲤、玻璃红鲤、兴国红鲤、瓯江彩鲤外,大部分鲤品种成鱼在外观上无法准确区分。如果没有准确的品种信息,鲤种质资源的鉴定和品种权认定无法开展,鲤新品种创制也会受到影响。此外,几乎所有鲤品种的鱼苗都是无法通过肉眼区分的,目前尚无可靠的通过形态学区分鲤鱼苗的方法。因此,开发鲤品种精准鉴定方法对苗种保护与利用尤为重要。
现已有数个专利公开了鲤种质资源鉴定的方法。专利号为201410276992.0的专利公开了:一种基于镜鲤特异缺失序列的PCR方法,用于快速鉴定镜鲤。专利号为201510315761.0的专利公开了:一种基于48个单核苷酸多态性(Single nucleotidepolymorphism,SNP)分子标记的种质鉴定方法,可判断待鉴定黄河鲤子代与已知候选亲本的亲缘关系。专利号为201610945256.9的专利公开了:一种基于鲤抗疱疹病毒相关SNP标记的种质鉴定方法,可以区分松浦镜鲤、松浦红镜鲤和易捕鲤。专利号为202210366030.0的专利公开了:一种基于13个SNP分子标记组合的种质鉴定方法,可用于快速鉴定建鲤2号。这些专利的共同特点是:(1)只能用于鉴定某个鲤品种,无法涵盖现有大部分的养殖鲤品种。(2)都是基于与1-3个鲤品种的差异开展品种鉴定,不能应用在与其他养殖鲤品种的区分上。因此,亟需开发一种能以高准确度鉴定更多鲤品种的新方法。
发明内容
本发明的目的是提供一种SNP分子标记组合在16个鲤品种鉴定中的应用,以解决上述现有技术存在的问题,通过筛选得到包含144个SNP位点的最优SNP分子标记组合,该最优SNP分子标记组合可以准确的区分16个鲤品种,有望为鲤品种权认定、种质资源保护与利用、遗传进化研究等需求提供技术手段。
为实现上述目的,本发明提供了如下方案:
本发明提供一种SNP分子标记组合在鉴定鲤品种的应用,所述SNP分子标记组合包括位于鲤基因组上的S1-S144 144个SNP位点,所述S1-S144的位点信息如下所示:
所述鲤基因组在NCBI数据库中的注册登录号为ASM1834038v1。
优选的是,所述鲤品种包括玻璃红鲤、超级鲤、福安鲤、福瑞鲤、荷包红鲤、锦鲤、黄河鲤、红镜鲤、建鲤、金背鲤、瓯江彩鲤、松浦镜鲤、乌克兰鳞鲤、兴国红鲤、沅江鲤和州河鲤。
本发明还提供一种对16个鲤品种进行精准鉴定的方法,包括以下步骤:
提取待测鲤的基因组DNA,开展全基因组测序;
对所述SNP分子标记组合的144个SNP位点进行基因分型,获取144个SNP位点的基因型;
将基因型的结果导入鲤品种预测模型中,根据预测值鉴定所述待测鲤的品种信息。
优选的是,所述鲤品种预测模型的构建方法包括以下步骤:
收集16个鲤品种信息,并将所述品种信息转换成连续的自然数;
对所述16个鲤品种的基因组重测序,并鉴定SNP位点的基因型,再对所述SNP位点的基因型进行编码,其中,与参考鲤基因组相同的纯合基因型的分类变量记为1,纯合突变基因型的分类变量记为-1,杂合基因型的分类变量记为0;
以品种信息转换的自然数作为因变量,SNP位点的基因型的编码作为自变量,用线性模型开展全基因组关联分析,以10E-40为阈值筛选品种特异的SNP分子标记;
基于随机森林回归方法,利用所述品种特异的SNP分子标记与所述品种信息转换的自然数构建机器学习模型;
利用贪心算法迭代去除所述品种特异的SNP分子标记并重新构建模型,直至预测准确度与模型中SNP分子标记个数的比值不再增大,以得到最优SNP分子标记组合的鲤品种预测模型。
优选的是,鉴定所述待测鲤的品种信息的方法为:
对所述待测鲤在所述SNP位点处的基因型进行检测并编码,其中,与参考鲤基因组相同的纯合基因型转换为1,纯合突变基因型转换为-1,杂合基因型转换为0;然后,从随机森林鲤品种预测模型的根节点开始,比较对应位点的分类变量的分类值与所述待测鲤的基因组DNA的SNP位点的基因型编码值的大小关系;若所述待测鲤的在分类变量对应SNP位点处的基因型编码值小于等于分类值时,用左侧子节点继续检索;若所述待测鲤在分类变量对应SNP位点处的基因型编码值大于分类值时,用右侧子节点继续检索;直至分类变量为NA时,直接读取对应节点的预测值;根据该预测值即可读出待测鲤的品种。
本发明公开了以下技术效果:
本发明面向黄河鲤、超级鲤、福安鲤、玻璃红鲤、福瑞鲤、红白锦鲤、松浦镜鲤、兴国红鲤、乌克兰鳞鲤、州河鲤、红镜鲤、金背鲤、沅江鲤、荷包红鲤、瓯江彩鲤、建鲤等常见的16种鲤主养品种,应用全基因组关联分析方法,开发了一种对多个鲤品种进行精准鉴定的SNP分子标记组合,并基于随机森林回归方法利用SNP分子标记组合构建了使用基因型预测鲤品种的方法。该方法能准确高效的鉴定16个鲤品种,准确性达到92.13%。本发明有望为鲤品种权认定、种质资源保护与利用、遗传进化研究等需求提供新的鲤品种鉴定技术手段。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为鲤品种信息转化不同数字的全基因组关联分析曼哈顿图;其中虚线为分子标记筛选阈值P<10E-40;
图2为品种预测模型的受试者工作特征曲线;其中,黑色和灰色分别代表随机森林回归模型和随机对照。
具体实施方式
现详细说明本发明的多种示例性实施方式,该详细说明不应认为是对本发明的限制,而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。
应理解本发明中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明。另外,对于本发明中的数值范围,应理解为还具体公开了该范围的上限和下限之间的每个中间值。在任何陈述值或陈述范围内的中间值,以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。
除非另有说明,否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料,但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入,用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时,以本说明书的内容为准。
在不背离本发明的范围或精神的情况下,可对本发明说明书的具体实施方式做多种改进和变化,这对本领域技术人员而言是显而易见的。由本发明的说明书得到的其他实施方式对技术人员而言是显而易见得的。本发明说明书和实施例仅是示例性的。
关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。
实施例1鲤品种精准鉴定的SNP分子标记组合的获得
本发明可用于鲤品种精准鉴定的SNP分子标记组合是通过以下方法获得的:
(1)结合自全国各地收集到的鲤样品,构建总共有1550份样品的群体。该群体包含黄河鲤、超级鲤、福安鲤、玻璃红鲤、福瑞鲤、红白锦鲤、松浦镜鲤、兴国红鲤、乌克兰鳞鲤、州河鲤、红镜鲤、金背鲤、沅江鲤、荷包红鲤、瓯江彩鲤、建鲤16种常见鲤品种。
(2)针对收集的鲤样品,用常规CTAB法提取基因组DNA,送华智生物技术有限公司经酶切打断后构建文库,用DNBSEQ-T7平台开展全基因组重测序。基因组DNA凝胶电泳主条带无明显降解现象,浓度应大于70纳克/微升,在OD260/280的光吸收比应在1.7~2.0范围内,在OD260/230的光吸收比应在1.8~2.2范围内。测序Reads经过滤低质量、含有N或接头的序列后,比对到鲤参考基因组(NCBI注册号为:ASM1834038v1)上,用GATK检测基因组变异并整合形成群体变异图谱。每个样品平均测序深度为10.39X,平均基因组覆盖度为98.90%,共获得128,126,119个高质量SNP,平均物理距离为11.95bp。过滤缺失率或杂合率大于10%的位点后,共有444,311个仅具有两种基因型的SNP分子标记用于后续关联分析,连锁不平衡衰减距离为0.6Kb。
(3)将各样本所属品种数字化转换为连续的自然数作为表型,以经质量过滤后的遗传位点为基因型,应用TASSEL的一般线性模型进行全基因组关联分析,结果见图1。用P<10E-40作为阈值,筛选与品种的数字化编码显著相关的SNP分子标记。
(4)将各样本在SNP分子标记处的基因型进行编码作为自变量,与鲤参考基因组相同的纯合基因型转换为1,纯合突变基因型转换为-1,杂合基因型转换为0。以鲤品种信息编码为因变量,构建多种机器学习模型,用十倍交叉检验法比较模型预测准确性(表1)。为减少模型中使用的标记个数,用贪心算法迭代去除SNP分子标记并重新构建模型,直至预测准确度与模型中标记个数的比值不再增大,以获得最优标记组合。最终发现基于144个SNP分子标记组合构建的随机森林回归模型(见表2)预测准确度最高,达到0.9213,标准差为0.0013。
表1以144个SNP为训练集不同模型的预测准确度比较(十倍交叉验证)
表2 144个SNP构建的随机森林回归模型
*:与参考基因组相同的纯合基因型记为1,纯合突变基因型记为-1,杂合基因型记为0。
#:模型使用方法:用待测鲤的基因型值与分类变量的分类值进行比较。当待测样本的基因型值小于等于分类值时,用左侧子节点继续检索,大于分类值时,用右侧叶子节点继续检索。当分类变量为NA时,直接读取对应节点的预测值,进而判断待测鲤的品种。
上述144个SNP分子标记组合的信息如下:
A1:2599837位点,基因型为T/G。A1:15944211位点,基因型为G/A。A2:5531971位点,基因型为C/G。A2:6472043位点,基因型为T/G。A2:7613106位点,基因型为C/G。A2:10745757位点,基因型为T/C。A2:15327852位点,基因型为G/A。A2:18630745位点,基因型为A/G。A2:23609058位点,基因型为A/G。A3:5404901位点,基因型为A/G。A3:15742129位点,基因型为C/T。A3:17661413位点,基因型为C/T。A3:20192079位点,基因型为T/C。A3:24961671位点,基因型为T/A。A4:11736120位点,基因型为T/G。A4:11890701位点,基因型为G/A。A5:13202026位点,基因型为C/G。A5:17707580位点,基因型为T/G。A5:18673783位点,基因型为A/G。A5:21043278位点,基因型为T/C。A5:33501748位点,基因型为G/T。A6:9338373位点,基因型为T/C。A7:11750727位点,基因型为T/C。A7:17951547位点,基因型为T/A。A7:18712372位点,基因型为A/G。A8:10248751位点,基因型为T/C。A8:10532405位点,基因型为T/C。A8:10849091位点,基因型为T/C。A8:15306434位点,基因型为C/G。A9:18714183位点,基因型为T/C。A9:25562297位点,基因型为C/T。A9:30164550位点,基因型为C/T。A10:9321247位点,基因型为G/A。A10:11000366位点,基因型为G/A。A10:12134892位点,基因型为G/C。A10:16765470位点,基因型为G/T。A13:1580547位点,基因型为T/C。A13:13657601位点,基因型为G/A。A13:26743455位点,基因型为T/G。A14:7729912位点,基因型为C/G。A14:9097756位点,基因型为C/A。A14:15509338位点,基因型为G/A。A14:18718756位点,基因型为T/C。A14:19266959位点,基因型为G/A。A14:23845033位点,基因型为T/C。A15:15358097位点,基因型为C/T。A16:6892063位点,基因型为C/T。A17:6804901位点,基因型为T/A。A17:10670446位点,基因型为G/A。A17:19828064位点,基因型为G/A。A18:24394968位点,基因型为G/C。A18:25938768位点,基因型为G/A。A19:2367586位点,基因型为A/T。A19:10950850位点,基因型为C/T。A19:23262952位点,基因型为T/A。A20:14862403位点,基因型为G/A。A20:16390320位点,基因型为A/G。A21:3201474位点,基因型为G/C。A21:10365369位点,基因型为A/C。A21:13794881位点,基因型为C/T。A21:14301266位点,基因型为G/C。A21:20422945位点,基因型为G/A。A22:4692756位点,基因型为T/A。A22:8329195位点,基因型为A/G。A23:5012946位点,基因型为C/T。A23:12622043位点,基因型为T/C。A24:9433424位点,基因型为C/G。A24:19953024位点,基因型为G/A。A24:22433320位点,基因型为T/A。A25:6503368位点,基因型为A/G。B2:10925292位点,基因型为G/C。B2:12626663位点,基因型为G/T。B2:17862116位点,基因型为T/C。B2:17908613位点,基因型为A/G。B2:26256223位点,基因型为C/T。B3:8269469位点,基因型为T/C。B3:10292412位点,基因型为C/T。B3:11150566位点,基因型为A/G。B3:11709077位点,基因型为A/T。B3:12458432位点,基因型为G/T。B3:19562314位点,基因型为G/C。B3:41456924位点,基因型为C/T。B5:2652862位点,基因型为T/A。B5:8092841位点,基因型为G/A。B5:9339304位点,基因型为T/C。B5:10494248位点,基因型为A/G。B5:13518905位点,基因型为T/A。B5:16078326位点,基因型为G/A。B5:16511322位点,基因型为G/A。B5:33167135位点,基因型为T/C。B6:8607139位点,基因型为T/C。B6:8928339位点,基因型为G/T。B6:10847716位点,基因型为A/T。B6:16654569位点,基因型为G/A。B7:8951923位点,基因型为C/A。B7:18559469位点,基因型为G/A。B7:29426892位点,基因型为G/T。B8:10274467位点,基因型为C/T。B8:22107896位点,基因型为A/G。B9:4669301位点,基因型为G/A。B9:5946045位点,基因型为A/C。B9:10594491位点,基因型为G/A。B9:12499430位点,基因型为G/A。B9:13053131位点,基因型为G/A。B9:16240997位点,基因型为T/C。B9:22092405位点,基因型为C/T。B9:23226045位点,基因型为T/C。B9:28488176位点,基因型为G/A。B10:2418728位点,基因型为G/A。B10:17849817位点,基因型为G/A。B10:18239634位点,基因型为T/G。B10:19146708位点,基因型为T/C。B11:11107188位点,基因型为C/A。B12:16371331位点,基因型为G/T。B13:5253681位点,基因型为C/T。B13:9319836位点,基因型为G/A。B13:17235824位点,基因型为G/A。B13:18046166位点,基因型为G/T。B13:29557217位点,基因型为T/A。B14:19839105位点,基因型为T/A。B14:20773831位点,基因型为A/C。B14:21130135位点,基因型为C/T。B15:20390224位点,基因型为C/G。B17:13421360位点,基因型为C/A。B17:14274975位点,基因型为C/T。B17:18853374位点,基因型为G/T。B17:19845940位点,基因型为A/C。B17:21034923位点,基因型为T/G。B18:4236286位点,基因型为T/A。B19:2806001位点,基因型为G/A。B19:9940357位点,基因型为G/A。B19:12818269位点,基因型为C/T。B19:13418515位点,基因型为A/G。B21:12298940位点,基因型为C/T。B22:24540480位点,基因型为T/C。B22:25815368位点,基因型为T/A。B22:26016955位点,基因型为T/C。B23:8285479位点,基因型为C/T。B23:12063750位点,基因型为C/A。B24:20188537位点,基因型为T/C。B24:23119586位点,基因型为C/T。B25:16627573位点,基因型为T/A。B25:17761373位点,基因型为T/A。B25:19534128位点,基因型为G/C。
上述A1、A2……B2、B3……B25表示鲤基因组的染色体编号。
实施例2SNP分子标记组合在鲤品种精准鉴定中的应用
发明人收集了30份鲤样品作为独立测试集。用常规CTAB法分别提取基因组DNA,送华智生物技术有限公司用DNBSEQ-T7平台开展全基因组重测序,每个样本的测序量至少10倍基因组覆盖度,并对实施例1中筛选的144个SNP分子标记进行基因分型检测。高分辨率溶解曲线或竞争性等位基因特异性PCR等其他可用于基因分型的检测方法也可使用。将各样品获得的基因型直接导入实施例1中已构建好的随机森林回归模型(表2)中,根据分类变量的分类值与样本基因型编码值的大小关系,计算预测值,鉴定测试样品的品种,根据样品品种记录和鉴定结果绘制受试者工作特征曲线(Receiver Operating CharacteristicCurve,ROC)。
如图2所示,模型分类性能良好,能够正确鉴定品种的样品共有28个,占比93.33%(见表3)。本实施例进一步证实144个SNP分子标记组合能够有效地区分鲤16个品种,这对鲤品种鉴定和种质资源利用具有重要意义。
表3 30个待鉴定样品检测结果
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (5)
1.一种SNP分子标记组合在16个鲤品种鉴定中的应用,其特征在于,所述SNP分子标记组合包括位于鲤基因组上的S1-S144 144个SNP位点,所述S1-S144的位点信息如下所示:
所述鲤基因组在NCBI数据库中的注册登录号为ASM1834038v1。
2.如权利要求1所述的应用,其特征在于,所述鲤品种包括玻璃红鲤、超级鲤、福安鲤、福瑞鲤、荷包红鲤、锦鲤、黄河鲤、红镜鲤、建鲤、金背鲤、瓯江彩鲤、松浦镜鲤、乌克兰鳞鲤、兴国红鲤、沅江鲤和州河鲤。
3.一种对16个鲤品种进行精准鉴定的方法,其特征在于,包括以下步骤:
提取待测鲤的基因组DNA,开展全基因组测序;
对权利要求1或2中所述SNP分子标记组合的144个SNP位点进行基因分型,获取144个SNP位点的基因型;
将基因型的结果导入鲤品种预测模型中,根据预测值鉴定所述待测鲤的品种信息。
4.如权利要求3所述的方法,其特征在于,所述鲤品种预测模型的构建方法包括以下步骤:
收集16个鲤品种信息,并将所述品种信息转换成连续的自然数;
对所述16个鲤品种的基因组重测序,并鉴定SNP位点的基因型,再对所述SNP位点的基因型进行编码,其中,与参考鲤基因组相同的纯合基因型的分类变量记为1,纯合突变基因型的分类变量记为-1,杂合基因型的分类变量记为0;
以品种信息转换的自然数作为因变量,SNP位点的基因型的编码作为自变量,用线性模型开展全基因组关联分析,以10E-40为阈值筛选品种特异的SNP分子标记;
基于随机森林回归方法,利用所述品种特异的SNP分子标记与所述品种信息转换的自然数构建机器学习模型;
利用贪心算法迭代去除所述品种特异的SNP分子标记并重新构建模型,直至预测准确度与模型中SNP分子标记个数的比值不再增大,以得到最优SNP分子标记组合的鲤品种预测模型。
5.如权利要求4所述的方法,其特征在于,鉴定所述待测鲤的品种信息的方法为:
对所述待测鲤的基因组DNA的SNP位点的基因型进行检测并编码,其中,与参考鲤基因组相同的纯合基因型转换为1,纯合突变基因型转换为-1,杂合基因型转换为0;然后,从随机森林鲤品种预测模型的根节点开始,比较对应位点的分类变量的分类值与所述待测鲤的基因组DNA的SNP位点的基因型编码值的大小关系;若所述待测鲤的在分类变量对应SNP位点处的基因型编码值小于等于分类值时,用左侧子节点继续检索;若所述待测鲤在分类变量对应SNP位点处的基因型编码值大于分类值时,用右侧子节点继续检索;直至分类变量为NA时,直接读取对应节点的预测值;根据该预测值即可读出待测鲤的品种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311302944.XA CN117210580B (zh) | 2023-10-10 | 2023-10-10 | 一种snp分子标记组合在16个鲤品种鉴定中的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311302944.XA CN117210580B (zh) | 2023-10-10 | 2023-10-10 | 一种snp分子标记组合在16个鲤品种鉴定中的应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117210580A true CN117210580A (zh) | 2023-12-12 |
CN117210580B CN117210580B (zh) | 2024-02-27 |
Family
ID=89044361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311302944.XA Active CN117210580B (zh) | 2023-10-10 | 2023-10-10 | 一种snp分子标记组合在16个鲤品种鉴定中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117210580B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101787392A (zh) * | 2009-10-20 | 2010-07-28 | 上海海洋大学 | 兴国红鲤与“全红”体色瓯江彩鲤的分子遗传鉴别方法 |
CN104894122A (zh) * | 2015-06-10 | 2015-09-09 | 许建 | 用于鲤鱼种质鉴定的snp标记组合、方法及用途 |
CN107862177A (zh) * | 2017-07-12 | 2018-03-30 | 中国水产科学研究院淡水渔业研究中心 | 一种区分鲤群体的单核苷酸多态性分子标记集的构建方法 |
CN114657263A (zh) * | 2022-04-08 | 2022-06-24 | 中国水产科学研究院淡水渔业研究中心 | 一种用于建鲤2号鉴定的分子标记、鉴定方法及应用 |
US20220411882A1 (en) * | 2021-06-21 | 2022-12-29 | Freshwater Fisheries Research Institute Of Jiangsu Province | Snp molecular marker for weight gain trait selection and genetic sex identification of ictalurus punctatus as well as screening method and application of snp molecular marker |
CN116516018A (zh) * | 2023-04-17 | 2023-08-01 | 上海海洋大学 | 一种与瓯江彩鲤体表体色相关的结构变异分子标记、特异引物及其应用 |
-
2023
- 2023-10-10 CN CN202311302944.XA patent/CN117210580B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101787392A (zh) * | 2009-10-20 | 2010-07-28 | 上海海洋大学 | 兴国红鲤与“全红”体色瓯江彩鲤的分子遗传鉴别方法 |
CN104894122A (zh) * | 2015-06-10 | 2015-09-09 | 许建 | 用于鲤鱼种质鉴定的snp标记组合、方法及用途 |
CN107862177A (zh) * | 2017-07-12 | 2018-03-30 | 中国水产科学研究院淡水渔业研究中心 | 一种区分鲤群体的单核苷酸多态性分子标记集的构建方法 |
US20220411882A1 (en) * | 2021-06-21 | 2022-12-29 | Freshwater Fisheries Research Institute Of Jiangsu Province | Snp molecular marker for weight gain trait selection and genetic sex identification of ictalurus punctatus as well as screening method and application of snp molecular marker |
CN114657263A (zh) * | 2022-04-08 | 2022-06-24 | 中国水产科学研究院淡水渔业研究中心 | 一种用于建鲤2号鉴定的分子标记、鉴定方法及应用 |
CN116516018A (zh) * | 2023-04-17 | 2023-08-01 | 上海海洋大学 | 一种与瓯江彩鲤体表体色相关的结构变异分子标记、特异引物及其应用 |
Non-Patent Citations (2)
Title |
---|
王彦云 等: "基于SNP标记的荷包红鲤与兴国红鲤鉴别研究", 中国食物与营养, vol. 27, no. 8, 28 August 2021 (2021-08-28) * |
王彦云 等: "基于SNP标记的黄河鲤鉴定研究", 水产学杂志, vol. 35, no. 3, 20 June 2022 (2022-06-20) * |
Also Published As
Publication number | Publication date |
---|---|
CN117210580B (zh) | 2024-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bianco et al. | Development and validation of a 20K single nucleotide polymorphism (SNP) whole genome genotyping array for apple (Malus× domestica Borkh) | |
Joly et al. | Polyploid and hybrid evolution in roses east of the Rocky Mountains | |
US6484105B2 (en) | Method for obtaining a plant with a genetic lesion in a gene sequence | |
Whiteley et al. | Population genomics of wild and laboratory zebrafish (Danio rerio) | |
Minder et al. | Genetic structure of hybrid zones between Silene latifolia and Silene dioica (Caryophyllaceae): evidence for introgressive hybridization | |
Caruana et al. | Validation of genotyping by sequencing using transcriptomics for diversity and application of genomic selection in tetraploid potato | |
CN109346130B (zh) | 一种直接从全基因组重测序数据中得到微单体型及其分型的方法 | |
CN112342302B (zh) | 鉴定水牛产奶性状候选基因标记的方法及应用 | |
CN109196123A (zh) | 用于水稻基因分型的snp分子标记组合及其应用 | |
CN115927647B (zh) | 与鸡蛋重曲线斜率相关的snp遗传标记及其应用 | |
CN112233722B (zh) | 品种鉴定的方法、其预测模型的构建方法和装置 | |
US20210269887A1 (en) | Method and application for rapid and accurate chromosomal location of economic traits in laver | |
Gemenet et al. | Development of diagnostic SNP markers for quality assurance and control in sweetpotato [Ipomoea batatas (L.) Lam.] breeding programs | |
Chaves et al. | Assessing the ability of chloroplast and nuclear DNA gene markers to verify the geographic origin of Jatoba (Hymenaea courbaril L.) timber | |
KR20210082127A (ko) | 문치가자미 친자 식별용 유전자 마커 및 이를 이용한 친자 확인방법 | |
CN113493843A (zh) | 一种影响鸡卵黄重的snp遗传标记及其应用 | |
CN114921572A (zh) | 一种用于鉴别泰和乌鸡品种的snp分子标记及其应用 | |
CN110512024A (zh) | 桃果实低酸或酸性状相关的snp分子标记及其应用 | |
Slonecki et al. | Genetic diversity, population structure, and selection of breeder germplasm subsets from the USDA sweetpotato (Ipomoea batatas) collection | |
CN117210580B (zh) | 一种snp分子标记组合在16个鲤品种鉴定中的应用 | |
Brock et al. | A nested association mapping panel in Arabidopsis thaliana for mapping and characterizing genetic architecture | |
Gaspar et al. | Genome-wide assessment of the population structure and genetic diversity of four Portuguese native sheep breeds | |
Boleckova et al. | Strategies for haplotype-based association mapping in complex pedigreed populations | |
Guo et al. | MultiplexSSR: A pipeline for developing multiplex SSR‐PCR assays from resequencing data | |
Vasiljevic et al. | Phylogeography and population genetic structure of the European roe deer in Switzerland following recent recolonization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |