CN115852007A - 同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状关联的snp分子标记及应用 - Google Patents

同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状关联的snp分子标记及应用 Download PDF

Info

Publication number
CN115852007A
CN115852007A CN202210787460.8A CN202210787460A CN115852007A CN 115852007 A CN115852007 A CN 115852007A CN 202210787460 A CN202210787460 A CN 202210787460A CN 115852007 A CN115852007 A CN 115852007A
Authority
CN
China
Prior art keywords
snp molecular
molecular marker
cotton
elongation
strength
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210787460.8A
Other languages
English (en)
Inventor
李付广
于霁雯
杨召恩
张志斌
高晨旭
葛晓阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Cotton Research of Chinese Academy of Agricultural Sciences
Original Assignee
Institute of Cotton Research of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Cotton Research of Chinese Academy of Agricultural Sciences filed Critical Institute of Cotton Research of Chinese Academy of Agricultural Sciences
Priority to CN202210787460.8A priority Critical patent/CN115852007A/zh
Publication of CN115852007A publication Critical patent/CN115852007A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状关联的SNP分子标记及应用,所述SNP分子标记为SEQ ID NO.1‑SEQ ID NO.91任一所示核苷酸序列。本发明提供的同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重关联的SNP分子标记可以用于棉花上述性状的早期预测和筛选。其直接以DNA的形式表现,在棉花的各个组织、各个发育阶段均可检测到,不受季节、环境限制、不存在表达与否等问题;表现为中性,不影响目标性状的表达;SNP适于快速、规模化筛查。基因组筛选中SNPs往往只需+/‑的分析,而不用分析片段的长度,利于发展自动化技术筛选或检测SNPs。

Description

同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状 关联的SNP分子标记及应用
技术领域
本发明涉及陆地棉D11号染色体上与纤维长度、伸长率、马克隆值、强度和铃重相关的SNP分子标记及应用,属于植物分子育种技术、生物信息学领域。
背景技术
陆地棉是一种纤维作物,其产量占世界棉花总产量的90%以上,在世界经济中有着重要地位。棉花产量和质量一直是棉花育种工作者改良的重要目标性状之一。传统的棉花育种手段主要是通过表型直接选择,育种效率低,难以满足高铃重棉花育种的需要。随着科技的发展,SNP分子标记凭借着在基因组中数量多、分布广的特点,成为目前最具发展潜力的分子标记,适合于大规模自动化检测。SNP分子标记技术能够达到直接选择数量性状的基因型的效果,为标记辅助育种奠定基础,目前已在医学和生物等领域得到广泛应用,但在棉花育种研究中相对还较少。全基因组关联分析(Genome-wide association study,GWAS)是一种对全基因组范围内的常见遗传变异(单核苷酸多态性和拷贝数)基因总体关联分析的方法,该方法以自然群体为研究对象,以长期重组后保留下来的基因(位点)间连锁不平衡(linkagedisequilibrium,LD)为基础,将目标性状表型的多样性与基因(或标记位点)的多态性结合起来分析,可直接鉴定出与表型变异密切相关且具有特定功能的基因位点或标记位点。在全基因组范围内进行整体研究,能够一次性对优良性状进行轮廓性概览,适用于挖掘优良性状等的研究。
随着陆地棉全基因组测序的完成和高通量DNA测序技术的突飞猛进,发明人成功完成了1812份棉花核心种质资源的重测序工作。通过测序数据比对,获得大量高质量的SNPs,这些SNPs可用于遗传图谱、关联性图谱、指纹图谱的构建,为分子育种、系统进化、种质资源鉴定提供重要保障。本发明利用全基因组关联分析发掘了一批与陆地棉质量指标(纤维长度、伸长率、马克隆值、强度)和产量指标(棉铃重)关联的SNP分子标记,为以后的标记辅助选择及聚合育种改良棉花产量和品质奠定了基础。
发明内容
针对现有技术的不足,本发明的目的是提供同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状关联的SNP分子标记及应用,将这些SNP分子标记应用于棉花纤维产量和品质的辅助选择,可以尽快提高我国高产、优质棉花品种的水平。
为了实现上述目的,本发明的技术方案是:
同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状关联的SNP分子标记,所述SNP分子标记为SEQ ID NO.1-SEQ ID NO.91任一所示核苷酸序列。
进一步,所述SNP分子标记为两个及以上SNP分子标记的组合。
所述SNP分子位点于序列第51bp处发生突变,所述SNP分子标记的突变形式如下所示:
Figure BDA0003729281970000021
/>
Figure BDA0003729281970000031
一种检测所述SNP分子标记的引物或试剂。
一种检测所述SNP分子标记的试剂盒。
一种所述SNP分子标记、引物或试剂、试剂盒在鉴定棉花纤维长度、伸长率、马克隆值、强度和铃重性状中的应用。具体包括以下步骤:
(1)提取待测样品的基因组DNA;
(2)以提取的DNA为模板,根据SNP分子标记设计引物,分别进行PCR扩增;
(3)根据PCR扩增产物,分析棉花纤维长度、伸长率、马克隆值、强度和铃重。
一种所述SNP分子标记、引物或试剂、试剂盒在棉花辅助育种中的应用。
一种所述SNP分子标记、引物或试剂、试剂盒在棉花种质资源改良中的应用。
本发明的有益效果:
本发明通过对1812份棉花材料进行了2年、5个地点、一共10个自然环境的种植,对每个自然环境下的每个棉花材料按要求进行棉铃重、纤维长度、伸长率、马克隆值和强度的表现值测量。通过IlluminaHiseq测序平台对这1812份棉花品种进行基因组重测序,获得高质量的clean data,数据量为20.47Tb,亲本平均测序深度35X,子代平均测序深度4X以上。通过GWAS分析累计21个计算值(2年5个试验点共计10个环境,所有10个环境的育种值记为1个;5个试验点每年的育种值共计10个,2年共20个;上述总计为21个计算值),获得至少在一个及以上环境中稳定出现的与陆地棉纤维长度、伸长率、马克隆值、强度和铃重关联的SNP分子标记91个。
本发明提供的同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重关联的SNP分子标记可以用于棉花上述性状的早期预测和筛选。其直接以DNA的形式表现,在棉花的各个组织、各个发育阶段均可检测到,不受季节、环境限制、不存在表达与否等问题;表现为中性,不影响目标性状的表达;SNP适于快速、规模化筛查。基因组筛选中SNPs往往只需+/-的分析,而不用分析片段的长度,利于发展自动化技术筛选或检测SNPs。
具体实施方式
以下结合实施例对本发明的具体实施方式作进一步详细说明。
实施例1、SNP分子标记的获得
(1)纤维长度、伸长率、马克隆值和强度的测定:
群体于2017、2018年进行5点2重复(部分地点为1重复)试验。1799个子代和13个亲本共计1812个材料在亚群体内及亚群体间进行随机排列。亚群体内随机加入该亚群体的双亲。群体整体设置3个对照,分别为该群体的亲本ZZM3、鲁棉研28、锦科178。3个对照在群体中每隔15个材料依次出现,并最终均匀覆盖到整个群体中。5个试验点分别是:河南安阳(AY)、安徽安庆(AQ)、河北邢台(XT)、新疆石河子(SHZ)、新疆阿拉尔(ALE)。每个试验点均按单行区(除新疆阿拉尔为双行)、2m行长种植,每行株数在10-30株之间(具体依照当地栽培模式),取样时间为9月20日至10月20日不等(具体依照当地霜期及栽培模式),除两端2株外,每小区取其余株中部靠主茎铃,每株取1-2个铃不等,共取20铃。为减少错误,采用本发明的唯一条形码编号系统,号牌放入铃重袋中,为减小误差,所有各地铃重材料均在中国农业科学院棉花研究所河南安阳农场采用新乡MPSY-20A皮辑轧花机对收获的20铃样品进行轧花并获取皮棉样品,利用农业农村部棉花纤维品质监督检验中心(安阳)HV1900(HVICC校准水平)进行棉花纤维长度、伸长率、马克隆值和强度的测定。利用R软件包lme4(https://github.com/lme4/lme4)估计最佳线性无偏预测值(2年两次重复)。
棉铃重的测定:通过对1812份棉花材料进行了2年、5个地点、一共10个自然环境的种植,对每个自然环境下的每个棉花材料随机采摘发育条件均匀的吐絮铃30个,晾晒干后称重量,计算平均棉铃重(g)。
(2)SNP的检测:
共采集陆地棉样本1812份提取基因组DNA后进行基因组重测序,其中亲本13份,重组自交系RIL(recombinant inbred lines)1799份。采集样品时,将各品系的种子播种在培养箱中,采集棉株幼叶。用CTAB法提取所有样本高质量的棉花基因组DNA各5μg。上述提取的基因组DNA送到深圳华大基因科技有限公司,用于基因组重测序。测序获得高质量的cleandata,数据量为20.47Gb,亲本平均测序深度35X,子代平均测序深度4X以上。以优质四倍体棉(G.hirsutum‘Texas Marker 1’)基因组为参考基因组进行序列定位。在映射之前,将所有未组装的contigs连接到一个伪染色体(命名为“ChrUN”)。使用BWA(v.0.7.12)软件分别将1812份样本的短序列映射到参考基因组,剔除所有未对齐的读段和低质量(映射质量小于20)的读段。然后,采用GATK UnifiedGenotyper(v.3.8.0)分别对每个样本进行变异鉴定,并将所有样本(n=1812)的变异文件合并为一个总的VCF文件。最后,分别鉴定出11,856,129个和4,543,742个高品质SNP和Indel。基于次等位基因频率大于0.05和缺失率小于0.2,使用VCFtools进一步过滤变异位点筛选出高质量的SNP和Indel分别1,855,955个和l,309,084个,用作后续的全基因组关联分析。所有变异的影响由ANNOVAR进行注解。
(3)陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状的全基因组关联分析
分别对步骤(1)所得的陆地棉性状结果和步骤(2)所得的基因型数据,采用(efficient mixed-model association expedited)(EMMAX)统计分析软件的混合线性模型进行统计分析,具体可参考:http://csg.sph.umich.edu/kang/emmax/download/index.html。统计模型为:
y=Xα+Zβ+Wμ+e
y为表型性状,X为固定效应的指示矩阵,α为固定效应的估计参数,Z为SNP的指示矩阵,β为SNP的效应,W为随机效应的指示矩阵,μ为预测的随机个体,e是随机残差,服从e~(0,δe 2)。该模型中,通过在μ中加入亲缘关系矩阵来校正群体分析。分析发现共计有91个SNPs同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状显著相关,SNP标记的等位基因位点信息如表1所示,参考序列为陆地棉栽培品种TM-1,参考基因组版本号G.hirsutum_TM-1_ICR(http://grand.cricaas.com.cn/page/download/download)。这些SNP位点上下游50bp的核苷酸序列如SEQ ID NO.1-SEQ ID NO.91所示。
表1同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重关联的SNP分子标记
Figure BDA0003729281970000061
/>
Figure BDA0003729281970000071
Figure BDA0003729281970000081
(4)验证:利用1812份棉花多亲本群体2年5点共计10个环境下的纤维长度、伸长率、马克隆值、纤维强度和棉铃重的BLUP值(最佳线性无偏预测值)对上述SNP的效应进行了验证,结果显示95.6%的SNP表现出对陆地棉上述性状变异具有显著的影响。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之做一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (9)

1.同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状关联的SNP分子标记,其特征在于,所述SNP分子标记为SEQ ID NO.1-SEQ ID NO.91任一所示核苷酸序列。
2.根据权利要求1所述的SNP分子标记,其特征在于,所述SNP分子标记为两个及以上SNP分子标记的组合。
3.根据权利要求1所述SNP分子标记,其特征在于,所述SNP分子位点于序列第51bp处发生突变,所述SNP分子标记的突变形式如下所示:
Figure FDA0003729281960000011
/>
Figure FDA0003729281960000021
/>
Figure FDA0003729281960000031
4.一种检测权利要求1-3任一项所述SNP分子标记的引物或试剂。
5.一种检测权利要求1-3任一项所述SNP分子标记的试剂盒。
6.一种权利要求1-3任一项所述SNP分子标记、权利要求4所述引物或试剂、权利要求5所述试剂盒在鉴定棉花纤维长度、伸长率、马克隆值、强度和铃重性状中的应用。
7.根据权利要求6所述的应用,其特征在于,包括以下步骤:
(1)提取待测样品的基因组DNA;
(2)以提取的DNA为模板,根据SNP分子标记设计引物,分别进行PCR扩增;
(3)根据PCR扩增产物,分析棉花纤维长度、伸长率、马克隆值、强度和铃重。
8.一种权利要求1-3任一项所述SNP分子标记、权利要求4所述引物或试剂、权利要求5所述试剂盒在棉花辅助育种中的应用。
9.一种权利要求1-3任一项所述SNP分子标记、权利要求4所述引物或试剂、权利要求5所述试剂盒在棉花种质资源改良中的应用。
CN202210787460.8A 2022-07-04 2022-07-04 同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状关联的snp分子标记及应用 Pending CN115852007A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210787460.8A CN115852007A (zh) 2022-07-04 2022-07-04 同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状关联的snp分子标记及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210787460.8A CN115852007A (zh) 2022-07-04 2022-07-04 同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状关联的snp分子标记及应用

Publications (1)

Publication Number Publication Date
CN115852007A true CN115852007A (zh) 2023-03-28

Family

ID=85660271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210787460.8A Pending CN115852007A (zh) 2022-07-04 2022-07-04 同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状关联的snp分子标记及应用

Country Status (1)

Country Link
CN (1) CN115852007A (zh)

Similar Documents

Publication Publication Date Title
CN108779459B (zh) 棉花全基因组snp芯片及其应用
CN106868131B (zh) 陆地棉6号染色体与纤维强度相关的snp分子标记
CN115820892A (zh) 陆地棉a07号染色体与棉铃重关联的snp分子标记及其应用
CN112094935A (zh) 鉴定棉花纤维比强度和马克隆值的snp分子标记及应用
CN102140506B (zh) 与甜瓜抗蔓枯病基因Gsb-2连锁的分子标记及其应用
CN111778352B (zh) 与小麦粒重相关的kasp引物组及其应用
US11032984B2 (en) Genes and SNP markers associated with lint percentage trait in cotton, and use thereof
Wang et al. Alien genomic introgressions enhanced fiber strength in upland cotton (Gossypium hirsutum L.)
CN107446997A (zh) 与陆地棉纤维细度关联的snp分子标记及其应用
CN105238866B (zh) 一个与陆地棉早熟性状相关的snp位点及其应用
CN111349712B (zh) 异常棉来源的抗旱相关ssr序列及其应用
CN108456740A (zh) 一个水稻稻瘟病抗性位点‘Pi-jx’及其Indel标记引物和育种应用
CN109055593B (zh) 提高棉花衣分的snp标记以及高产棉的鉴定和育种方法
CN107354152B (zh) 与陆地棉棉铃重相关的snp分子标记及其应用
CN110358861A (zh) 与水稻广谱高抗白叶枯病基因Xa45(t)紧密连锁分子标记R13I14
CN113881799B (zh) 用于烟草根黑腐病主效抗性位点筛选/检测的功能分子标记及其应用
CN115852007A (zh) 同时与陆地棉纤维长度、伸长率、马克隆值、强度和铃重性状关联的snp分子标记及应用
CN111607659B (zh) 与苎麻原麻半纤维素含量关联的snp分子标记及其应用
CN110093345B (zh) 与棉花纤维强度和马克隆值相关的ssr分子标记及应用
CN111118192B (zh) 小麦穗基部小穗结实性主效qtl的kasp分子标记及其应用
CN108060247B (zh) 一种与陆地棉8号染色体纤维强度相关的单体型
CN113881794A (zh) 一组与甘蔗叶夹角显著相关的分子标记及其应用
CN116334268A (zh) 与陆地棉纤维长度关联的snp分子标记及其应用
CN108300797B (zh) 陆地棉25号染色体与纤维强度相关的单体型
CN114990257A (zh) 与棉花纤维伸长率品质性状关联的snp分子标记及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination