CN109628630A - 与棉花衣分性状显著相关的基因、snp标记及其应用 - Google Patents

与棉花衣分性状显著相关的基因、snp标记及其应用 Download PDF

Info

Publication number
CN109628630A
CN109628630A CN201811563730.7A CN201811563730A CN109628630A CN 109628630 A CN109628630 A CN 109628630A CN 201811563730 A CN201811563730 A CN 201811563730A CN 109628630 A CN109628630 A CN 109628630A
Authority
CN
China
Prior art keywords
gene
character
cotton
snp marker
snp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811563730.7A
Other languages
English (en)
Other versions
CN109628630B (zh
Inventor
李威
杨代刚
宋成祥
裴小雨
刘艳改
贺昆仑
张飞
任中英
孙宽
马雄风
周晓箭
张文生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Cotton Research of Chinese Academy of Agricultural Sciences
Original Assignee
Institute of Cotton Research of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Cotton Research of Chinese Academy of Agricultural Sciences filed Critical Institute of Cotton Research of Chinese Academy of Agricultural Sciences
Priority to CN201811563730.7A priority Critical patent/CN109628630B/zh
Publication of CN109628630A publication Critical patent/CN109628630A/zh
Priority to PCT/CN2019/084940 priority patent/WO2020038014A1/en
Priority to US16/635,287 priority patent/US11032984B2/en
Priority to AU2019303422A priority patent/AU2019303422B2/en
Priority to ZA2019/04461A priority patent/ZA201904461B/en
Application granted granted Critical
Publication of CN109628630B publication Critical patent/CN109628630B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Botany (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及棉花衣分性状分子生物学领域,特别涉及与棉花衣分性状显著相关的基因、SNP标记及其应用。与棉花衣分性状显著相关的基因,为基因Gh_D05G1124和/或Gh_D05G0313。本发明以276份陆地棉材料为材料,种植于多个环境中,采用CottonSNP63K基因芯片进行基因分型,共获得10660个高质量的SNPs,用于遗传结构分析和GWAS。结果共发现23个与衣分性状显著相关的SNPs,对应15个QTLs。另外,通过qRT‑PCR分析,确定了Gh_D05G1124和Gh_D05G0313为调控衣分性状的候选基因,并得到与衣分显著相关的SNP标记,为棉花衣分性状的研究和应用提供理论支持。

Description

与棉花衣分性状显著相关的基因、SNP标记及其应用
技术领域
本发明涉及棉花衣分性状分子生物学领域,具体而言,涉及与棉花衣分性状显著相关的基因、SNP标记及其应用。
背景技术
棉花是天然纺织纤维的主要来源,也是世界上重要的经济作物。陆地棉(Gossypium hirsutum L.),是一种异源四倍体棉种,约占全球棉花产量的95%。提高棉花产量一直是棉花育种工作的重要目标。其中,皮棉产量是衡量棉花产量的重要指标,由单株铃数、衣分、单铃重等性状构成。众多研究发现,衣分与棉花产量之间存在显著的正相关,并且衣分也是棉花高产量育种的重要性状指标。然而,传统育种工作仅仅通过田间表型鉴定的方式对衣分性状进行改良,效率低下,假阳性高。因此,鉴定衣分性状紧密相关的分子标记和基因,通过分子育种手段针对性改良衣分性状,对棉花育种具有重要的理论和应用价值。
有关研究表明,有利的遗传变异可以提高植物环境适应性和产量性状。然而,大多数植物的性状都为复杂数量性状,受多基因的微效效应控制。因此,对目标性状的基因鉴定相对来说是很困难的。连锁分析和全基因组关联分析是目前挖掘复杂性状遗传变异最常用的研究方法。
棉花的衣分性状是典型复杂的数量性状,由微效多基因调控。在以往的研究中,基于双亲的杂交后代群体剖析棉花衣分性状遗传机理是最常用的策略。在棉花中,基于连锁分析的作图群体,构建了多张种间和种内遗传图谱,并被广泛用于棉花复杂数量性状的相关研究之中。棉花产量和纤维品质性状的QTL定位研究取得了不错的成果。目前,研究者利用不同的作图群体共鉴定4882个与棉花产量、纤维品质、抗逆性和种子等性状相关的QTLs。其中,与衣分性状相关的QTL位点有327个,分布于不同的染色体上。由于作图群体构建的耗时性及连锁分析定位精度低等条件的限制,衣分性状QTL位点的精细定位和关键基因克隆难以实现。近年来,全基因组关联分析(Genome wide association study,GWAS)逐渐成为挖掘植物复杂数量性状的遗传变异及候选基因的一种快捷、方便及有效的研究方法,已经被广泛应用于水稻,玉米,油菜和大豆等作物复杂数量性状的研究中。与其他模式作物相比,棉花基因组庞大,结构复杂及分子标记多态性低,因此,关联分析在棉花中的应用相对滞后。
随着棉花基因组测序的完成、基因芯片和高通量测序技术的快速发展,棉花中挖掘了大量的SNP标记,极大地促进了全基因组关联分析在棉花上的应用。近年来,利用高密度SNP标记的全基因组关联分析策略,研究人员发现了许多与棉花产量、纤维品质和抗性有关的遗传位点。其中,利用全基因组关联分析策略探析目标性状的遗传机理,在棉花衣分性状也有相关报道。Su等利用简化基因组测序技术(SLAF)对355份陆地棉材料进行基因型鉴定,结合多个环境目标性状表型的调查,开展了衣分性状的GWAS研究及相关候选基因的挖掘。通过整合GWAS及RNA-seq分析的方法,鉴定到了一个可能调控衣分性状的候选基因Gh_A02G1268。另外,Huang等利用CottonSNP63K基因芯片及GWAS分析方法对503份陆地棉自然群体重要农艺性状进行遗传解析,共鉴定到了21个与衣分显著相关的SNP位点。通过显著SNP侧翼区域的连锁不平衡分析来进行候选基因的挖掘,共发现17个控制衣分性状候选基因。进而,通过生物信息学方法分析发现Gh_D08G2376与AT3G07020及GhSGT1基因同源,推测Gh_D08G2376可能通过调控种子大小及纤维发育进而影响衣分性状。总的来说,对衣分性状遗传基础的研究相对有限,还需要进一步的相关研究。
有鉴于此,特提出本发明。
发明内容
本发明的第一目的在于提供与棉花衣分性状显著相关的基因,以276份陆地棉为材料,采用分子生物学手段和性状进行大量生物信息分析得到,为棉花性状改良育种工作提供良好的基础。
本发明的第二目的在于提供与棉花衣分性状显著相关的基因中的SNP标记,可应用于种质鉴定、育种或遗传多样性分析,为棉花性状的研究提供良好的基础。
本发明的第三目的在于提供用于检测该SNP标记的产品,为该SNP标记的检测提供便利。
为了实现本发明的上述目的,特采用以下技术方案:
与棉花衣分性状显著相关的基因,为基因Gh_D05G1124和/或Gh_D05G0313,其中,基因Gh_D05G1124的核酸序列如SEQ ID NO:1所示,基因Gh_D05G0313的核酸序列如SEQ IDNO:2所示。
本发明以276份陆地棉材料为材料,种植于多个环境中。采用CottonSNP63K基因芯片进行基因分型,共获得10660个高质量的SNPs,并用于遗传结构分析和GWAS。通过GWAS分析,共发现23个与衣分性状显著相关SNPs,对应15个QTLs。另外,通过qRT-PCR分析,确定了Gh_D05G1124和Gh_D05G0313为调控衣分性状的候选基因。基因Gh_D05G1124和Gh_D05G0313均位于棉花第Dt05条染色体上。
对基因Gh_D05G1124和Gh_D05G0313进一步分析发现,基因Gh_D05G1124的第10个外显子区域序列和基因Gh_D05G0313的第1个外显子区域序列对衣分性状有显著影响。
进一步地,与棉花衣分显著相关的基因为基因Gh_D05G1124的第10个外显子区域序列和/或基因Gh_D05G0313的第1个外显子区域序列。
本发明还提供了含有上述的与棉花衣分显著相关的基因或其反义链的载体。
本发明还提供了含有上述的载体的宿主。
本发明还提供了与棉花衣分显著相关的SNP标记,所述的SNP标记包括以下中的任一种或两种:
位于基因Gh_D05G1124第10个外显子区域,以基因Gh_D05G1124的起始密码子计算,位于第6498碱基处,其核苷酸为G/A;
位于基因Gh_D05G0313第1个外显子区域,以基因Gh_D05G0313的起始密码子计算,位于第176碱基处,其核苷酸为G/A。
即SNP标记位于如SEQ ID NO:1所示的核酸序列的第6498位碱基,和/或位于如SEQID NO:2所示的核酸序列的第176位碱基。
本发明进一步分析发现,衣分性状主要与SNP位点核酸变化相关,得到与衣分显著相关的SNP标记,并且衣分性状的表型值与SNP位点有利等位变异的聚集呈正相关。因此,与衣分显著相关的SNP标记对棉花衣分性状的研究和应用提供理论支持。
本发明还提供了用于检测上述的SNP标记的引物对、探针或芯片。
检测上述的SNP标记的引物对、探针或芯片根据上述的基因序列进行设计即可。如检测基因Gh_D05G1124上的SNP标记的引物对如SEQ ID NO:3-4所示;检测基因Gh_D05G0313上的SNP标记的引物对如SEQ ID NO:5-6所示。
本发明还提供了含有上述的引物对、探针或芯片的试剂盒。
本发明还提供了所述的SNP标记在棉花种质鉴定、育种或遗传多样性分析中的应用。
本发明还提供了一种高产棉的鉴定方法,包括以下步骤:提取待检测的棉花的基因组,对上述的SNP标记进行检测,若为GG基因型则为高产植株。
本发明还提供了一种棉花育种方法,包括以下步骤:提取待检测的棉花的基因组,对上述的SNP标记进行检测,挑选出GG基因型作为高产植株继续杂交繁殖。
进一步地,所述待检测的棉花包括适宜于有性繁殖、植物性繁殖或可再生的细胞的组织培养的材料;
适宜于有性繁殖的材料选自花粉,子房,胚珠,胚囊和卵细胞;
适宜于植物性繁殖的材料选自插枝,根,茎,细胞,原生质体;
适宜于可再生的细胞的组织培养的材料选自叶,花粉,胚,子叶,下胚轴,分生组织细胞,根,根端,花药,花,种子和茎。
进一步地,检测所述SNP标记的方法包括以下一种或几种:
基于凝胶电泳的SNP检测法、DNA测序法、DNA芯片法、变性高效液相色谱法或质谱检测法。
与现有技术相比,本发明的有益效果为:
(1)本发明提供了与棉花衣分显著相关的基因,以276份陆地棉为材料,采用分子生物学手段和性状进行大量生物信息分析得到,为棉花性状改良育种工作提供良好的基础。
(2)本发明还提供了与棉花衣分显著相关的基因中的SNP标记,可应用于种质鉴定、育种或遗传多样性分析,为棉花性状的研究提供良好的基础。
(3)本发明提供了用于检测该SNP标记的产品,为该SNP标记的检测提供便利。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,以下将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例1中SNPs在陆地棉26条染色体上的分布图;
图2为本发明实施例1中276份陆地棉衣分性状在多个环境下的表型表现图;
图3为本发明实施例3中自然群体种群结构图;
图4为本发明实施例3中276份陆地棉亲缘关系热图;
图5为本发明实施例3中自然群体亲缘系数分布图;
图6为本发明实施例3中自然种群的全基因组LD衰退距离估算图;
图7为本发明实施例4中衣分性状BLUP值的全基因组关联分析图;
图8为本发明实施例5中候选基因Gh_D05G1124的相关分析图;
图9为本发明实施例5中候选基因Gh_D05G0313的相关分析图;
图10为本发明实施例5中优异等位变异的聚合效应图。
具体实施方式
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
实施例1
1、材料与方法
试验材料选取和田间试验设计
在本研究中,主要收集了来自中国农业科学院棉花研究所国家棉花种质资源中期库中在不同历史阶段发挥过重要作用及有代表性的棉花品种和本研究团队长期高产育种实践中积累的育种基础材料,共276份陆地棉材料,用于后续的关联分析。
这些材料按地理来源可分为五大类:黄河流域品种(YRR),长江流域品种(YtRR),西北内陆流域材料(NW),北方早熟品种(NSEMR)及来自世界其他国家的品种。所有材料分别于2016年-2017年在五个地点种植。即:河南安阳(2016-2017)、湖北荆州(2016-2017)、江西九江(2016)、湖北黄冈(2017)和安徽安庆(2017),分别标记为16AY、16JZ、16JJ、17AY、17JZ、17HG及17AQ。田间试验均采用完全随机分组设计,两个重复。在每个环境中,所有材料都单行种植,行长6.0米,行宽0.8米,每行种植20-25株。每个种植环境均以当地常规方法进行田间管理。
2、农艺性状的鉴定及表型数据统计分析
在吐絮盛期,每行随机摘取10个植株中部吐絮正常的25个棉铃,计算衣分。衣分计算公式为:衣分率(Lint percentage,简称LP)(%)=皮棉产量/籽棉产量。利用R软件包对多个环境下衣分性状的表型数据进行基本描述统计分析、不同环境间衣分性状的皮尔逊相关性分析(Pearson correlation analysis)及双因素方差分析(Two-way ANOVA)。另外,利用R语言lme4软件包对所有环境衣分性状进行最佳线性无偏估计(BLUP)及广义遗传力的计算。衣分的广义遗传力(H2)的计算公式为H2=δ2 G/(δ2 G2 GE/n+σ2 e/nr),σ2 G是遗传方差,σ2 GE是基因型和环境(G×E)方差,σ2 e是误差方差,n代表环境个数及r代表重复数。其中,σ2 G,σ2 GE及σ2 e等参数利用lme4软件包中的lmer函数进行估算。
3、LP表型变异分析
本研究中,收集了来自不同生态区的276份陆地棉,并构成自然群体,用于全基因组关联分析。在不同的环境下对表型进行了考察,表型数据呈现出丰富的变异。
在7个环境中LP分布于12.89%-49.62%之间,平均值为31.26%。在不同环境中变异系数的变化范围为7.68%-11.20%,衣分均值为35.97%-39.53%(表1)。另外,在不同环境中性状峰度及偏度的绝对值小于1或近似1。由此可知,衣分性状在所有环境下近似连续的正态分布(图1)。
表1衣分性状表型数据的基本描述统计
为了减少环境对性状表型的影响,对所有环境的衣分表型的BLUP值进行了估计。衣分性状BLUP值变化范围为22.37%-43.28%,平均值为37.51%,变异系数为7.78%。方差分析结果表明,基因型(G)、环境(E)及基因型与环境(G×E)间的互作都达到极显著性水平(表2)。
表2方差分析结果
另外,LP的广义遗传力高达90.7%(表2)。然后,通过对不同环境间衣分性状的相关性分析发现,不同环境间的衣分表型间存在显著的正相关关系(图2)。总的来说,衣分性状还是相对稳定的,主要受遗传效应控制,适合用于关联分析。
实施例2
采用改良的CTAB法提取每个材料幼叶组织的DNA。利用CottonSNP63K芯片对材料进行基因分型。利用GenomeStudio v2011.1分析软件对SNP分型结果进行质量控制。然后,根据检出率(call rate)>85%及最小等位基因频率(MAF)>0.05等标准对SNP进行进一步的筛选。最后,把SNP的探针序列与陆地棉参考基因组TM-1(Gossypium hirsutum(AD1)GenomeNAU-NBI Assembly v1.1&Annotation v1.1)进行序列比对,以此来获取SNP的物理位置。
比对结果显示,14977个SNP比对到未确定染色位置的scaffold区域,48081个SNP比对到染色体上,这些比对到染色体上的SNP将用于进一步分析。然后,根据设定的过滤标准,即call rate>85%及MAF>0.05。最后,获得10660个高质量的SNPs,并用于后续相关分析中。
这些高质量的SNP标记不均匀地分布在26条染色体上,发现在Dt亚基因组(6480)上的SNP数目多于在At亚基因组(4180)上的SNP。SNP标记在26条染色体上的分布密度范围为86.43kb/SNP(Dt07)-502.70kb/SNP(At02),平均标记密度为237.32kb/SNP。此外,在26条染色体中,PIC值也有所不同,从0.2(Dt06)到0.29(At13),平均值为0.25。所有染色体的基因多样性平均值为0.31,变化范围为0.24(Dt06)到0.37(At01、At05及At13)(表3)。
表3陆地棉26条染色体上的SNPs,PIC及Gene diversity等信息统计表
实施例3
基于STRUCTURE 2.3.4软件中的贝叶斯模型对276份陆地棉材料进行群体结构分析。群体数(K)设定为1-10,其中不作数迭代(Length of burn-in period)设置为10000,蒙特卡罗迭代(Marko chain monte carlo,MCMC)设置为100000,每个K值独立的运行5次。然后,参考Evanno等方法,根据LnP(K)及ΔK值来推测群体的最优亚群数目。利用CLUMPP软件对最优K值的五次运行的结果进行了整合,以此获得群体结构矩阵(Q矩阵)。此外,使用GAPIT软件包进行主成分分析(PCA)和亲缘关系分析。利用PowerMarker v3.25软件计算多态性信息含量(Polymorphic information content,PIC)、基因多样性(Gene diversity)及Nei’s遗传距离。然后,使用MEGA 6.0软件基于Nei遗传距离,构建进化树。最后,利用PLINK软件,计算不同位点之间的连锁不平衡系数r2,参数设置为:--ld-window-r2 0--ld-window 99999--ld-window-kb1000。
基于R语言GAPIT软件包中的混合线性模型(MLM)方法,并以群体结构矩阵(前三个主成分构成)及亲缘关系矩阵(K)作为协变量,整合多个环境的衣分表型数据及基因型数据进行全基因组关联分析。关联结果显著性阈值(P)是根据标记数进行计算的(P=1/n,n是使用的SNPs总数)。利用Haploview 4.2软件进行LD区块分析及绘制。曼哈顿图由R语言qqman软件包绘制。
在全基因组关联分析中,关联群体的遗传结构可能会影响结果的可靠性。因此,有必要对关联群体的群体结构进行评估。这里,基于10660个基因分型结果,采用三种不同的方法对群体结构进行分析,具体见图3。其中,(a)K=1-10时,LnP(K)的变化图;(b)ΔK与K值的关系图;(c)K=2时,自然群体的群体结构;(d)主成分分析;(e)基于Nei’s遗传距离的NJ聚类树。
首先,STRUCTURE软件对群体的遗传结构分析结果显示,当K从1增加到10时,Ln P(K)值不断增大(图3a)。当K=2时,ΔK达到最大值(图3b)。这表明该群体存在两个亚群(图3c)。主成分分析与群体结构分析结果相似。其中,这两个亚群之间有一些材料混杂在一起(图3)。NJ聚类树结果显示关联群体可划分为两个类群(图3e)。同样地,亲缘关系分析的聚类图结果也于上述结果相吻合(图4)。综上所述,本研究中的自然群体可分为两个亚群。
群体内个体间的亲缘关系是影响关联分析定位精度的另一个因素。在本研究中,大多数材料间的亲缘关系都小于0.2,约占88.71%。其中,亲缘关系系数为0的材料占58.74,只有2.37%的材料间的亲缘关系系数大于0.5(图5)。这些结果表明,本研究选取的自然群体个体间的亲缘关系较远。我们对SNP位点间的连锁不平衡参数r2进行统计发现,该群体的LD距离约530kb(图6)。
综合上述结果可知,我们选取的自然群体群体结构不复杂,个体间亲缘关系较远以及群体LD衰减距离适中。因此,该群体适合用于全基因组关联分析。
实施例4
1、衣分性状的全基因组关联分析
本研究中,为了减少关联结果的假阳性,利用混合线性模型(MLM)方法,并以主成分分析的群体结构(PCs)及亲缘关系(K矩阵)作为关联分析的协变量。整合已鉴定的高质量的SNP数据及田间表型数据(包括单独环境的表型数据及BULP值)进行关联分析,以探析调控衣分性状的遗传位点或候选基因。
根据不同环境中衣分性状的关联结果,将显著性阈值调整为P=1.0×10-3。最后,共鉴定到23个与LP显著关联的SNPs,它们随机分布在13条染色体上(图7a)。其中,7个位于Dt05染色体、4个位于Dt10染色体及2个位于Dt13染色体,剩下的10个SNPs位于其他10条不同的染色体上,即At01、At03、At05、At07、At10、Dt01、Dt02、Dt04、Dt09和Dt11。这些SNP解释的表型变异范围为4.20%-10.23%,平均为5.68%。另外,有11个SNPs在至少两个环境中被同时检测到。其中,位于At03及Dt05染色体上的4个SNPs(i56741Gb、i61131Gt、i08888Gh和i00252Gh)在5个环境中被同时检测到。位于At03染色体上的SNP位点i56741Gb具有最高的-log10(P)值即5.10,同时也解释了最多的表型变异率。而位于Dt05染色体上的SNP位点i00252Gb是Dt05染色体上-log10(P)值最高(5.06)及对性状具有最大的表型贡献率(8.05%)。图7中,(a)BLUP值关联分析的曼哈顿图。(b)BLUP值关联分析的Q-Q图。
考虑本研究关联群体的连锁不平衡衰减距离及参考前人对QTL的定义,我们将与LP显著关联的SNP上下游各延伸200kb的区域视为一个QTL,当相邻QTL的物理区间有重叠时,则认为是同一个QTL。根据这一原则,检测到了15个QTLs,分布于不同的染色体上。除qLP-Dt05-1(含5个)、qLP-Dt05-2(含2个)、qLP-Dt10-2(含3个)及qLP-Dt13(含2个)四个QTLs以外,其余QTL只含有一个显著的SNP位点。
2、与已报道QTL进行共定位
为了验证GWAS方法的可行性和本研究关联结果的可靠性,把本文中检测到的QTL与前人利用连锁分析或关联分析方法报道的LP性状QTL进行比较。
首先,从CottonQTLdb数据库中收集已报道的LP性状的QTL及GWAS位点。然后,从Cottongen数据库下载SSR标记的引物序列。最后,利用e-PCR程序将引物序列与参考基因组进行比对,确定SSR标记的物理位置。即将SNP位点与SSR标记整合到一张物理图谱上,然后进行比较。
通过这种方法,鉴定到9个QTLs与11个前人报道的QTL共区间,它们分别分布于At03、At05、At10、Dt02、Dt04、Dt05、Dt09、Dt10和Dt11等不同染色体上。其中,有6个QTLs与已报道的QTL(qLP-A-1、qLP-Chr10-1、qLP-Chr14-1、qLP-Chr21-2、TMB0206和MGHES46)有重叠区域,其余QTL分别与qGhLP-c5、JESPR220、NAU3269、qLP-19或qLP-D10_16相邻。这些结果证实了我们试验方法及关联结果的可靠性。
实施例5
1、转录组测序数据及荧光定量PCR分析
在公共数据库NCBI上,下载陆地棉参考基因组(TM-1)的棉花组织(根、茎、叶、胚珠和纤维发育时期)的转录组测序数据。利用TopHat及Cufflinks软件对转录组测序数据进行序列比对及基因表达分析。最后,用FPKM(Fragments per kb Million fragments)值来表示基因的表达量。使用Trizol试剂盒提取棉花胚珠不同发育时期(0,10,20,30DPA)及纤维不同发育时期(10,20,30DPA)RNA,并利用Nanodrop2000超微量分光光度计检测RNA的浓度,然后使用TaKaRa反转录试剂盒进行反转录。该实验基于染料法(SYBR)在LightCycler480荧光定量PCR仪上进行。试验选用GhHistone3基因作为内参基因,并采用2-ΔCt方法分析荧光定量PCR试验结果。基因特异性引物如表4所示。
表4荧光定量引物信息
Gene name Forward Primer(5'-3') Reverse Primer(5'-3')
Gh_D05G1124 GGATTCTGAAAGCTGGTGGT CAATTTGCCTTTCAGCAGGT
Gh_D05G0313 TGCCTTTTGGAAAGCAAATC GCAACTCTCGTTCCTTGCTC
GhHis3 TCAAGACTGATTTGCGTTTCCA GCGCAAAGGTTGGTGTCTTC
2、候选基因的鉴定
本研究中,共鉴定出434个候选基因。陆地棉参考系TM-1不同组织的RNA-seq数据分析结果显示,263个基因在不同的组织及器官中优势表达。其中一些基因已经被确定参与棉纤维发育,如GhUPL7、GhTUB5和GhCK1等。这说明本发明鉴定候选基因方法的可靠性。
为了进一步确定与LP性状的SNP位点或基因,我们重点考察在多个环境中被连续鉴定到的及显著性最高SNP位点。位于Dt05染色体上的SNP位点i00252Gh不仅在5个环境中同时被鉴定到,且具有最低的P值及解释最大的表型变异。因此,i00252Gh作为进一步研究对象。
本研究中,利用显著SNP位点侧翼200kb进行候选区域的鉴定。基于此,在Dt05上鉴定到了一个候选区间9.41-9.81Mb(图8a,b)。其中,图8a:Dt05染色体候选区间9.41-9.81Mb曼哈顿图图;图8b:候选区间的LD区块分析。
LD block分析表明,该候选区域存在两个blocks(图8b)。其中,一个block长度为7kb,含有2个SNPs,另一个跨越71kb的区域,含有5个SNP。然而,重点研究的SNP位点i00252Gh没有落入任何一个block区域内。但发现i00252Gh位点位于基因Gh_D05G1124第10外显子区域上,并且i00252Gh是一个非同义突变SNP。具体地,i00252Gh在陆地棉D亚基因组第5条染色体9611840碱基处。碱基的突变导致了氨基酸的变化,即由天冬氨酸转换为甘氨酸(图8c)。图8c:候选基因的结构及其非同义突变位点。
该基因在拟南芥中的同源基因是编码蛋白磷酸酶2C家族蛋白。另外,还研究了相同位点不同等位基因对LP性状的影响。研究发现,等位基因G对LP的表型有正效应,即携带G等位基因的材料LP显著高于A等位基因的材料(图8d)。图8d:具有不同等位基因的材料衣分性状的差异表现。
此外,陆地棉TM-1不同组织的RNA-seq数据显示,Gh_D05G1124在胚珠和纤维发育过程中优势表达(图8e)。图8e:候选基因在胚珠及纤维发育时期的表达水平。qRT-PCR分析表明,该基因在胚珠和纤维发育过程中表达量逐渐增加,在30DPA胚珠及30DPA纤维时表达量达到峰值。这些结果表明,Gh_D05G1124基因参与了陆地棉胚珠及纤维的发育过程,可能是调控陆地棉衣分性状的候选基因之一。
前人研究表明,位于基因区域导致氨基酸变化多态性标记最有可能是与目标性状有关的功能位点。基于此,我们发现一个非同义SNP位点i08888Gh,位于基因Gh_D05G0313的外显子区域,并且造成氨基酸由天冬氨酸转变为丝氨酸(图9a-c)。具体地,i08888Gh在陆地棉D亚基因组第5条染色体2687718碱基处。图9a:Dt05染色体候选区间2.48-2.88Mb曼哈顿图;图9b:候选区间的LD区块分析;图9c:候选基因的结构及其非同义突变位点。
此外,根据该位点的等位基因类型A和G,可将本研究材料的LP分为两组。携带G等位基因的材料LP显著高于携带A等位基因的材料(图9d)。图9d:具有不同等位基因的材料衣分性状的差异表现。
此外,qRT-PCR分析表明Gh_D05G0313在30DPA胚珠中表达量高(图9e)。图9e:候选基因在胚珠及纤维发育时期的表达水平。
Gh_D05G0313在拟南芥中的同源基因是AtLUT2,该基因在植物光合作用中起着重要的作用。由于棉花胚珠和纤维的发育同样需要光合作用,因而我们推测该基因是调控衣分的另一个候选基因。
棉纤维是来源于胚珠表皮的高度伸长细胞,与胚珠表皮纤维细胞突起、纤维伸长和次生壁增厚等过程密切相关。据先前的研究报道,调控LP的基因可能在纤维发育时期高度表达。到目前为止,研究者使用不同的关联群体通过GWAS方法鉴定出一些与LP相关的基因,如Gh_A02G1268,Gh_D08G2376,AIL6和EIL,Gh_D03G1064和Gh_D12G2354,和Gh_D02G0025。本研究中,鉴定到的15QTLs区间内含有434个基因,其中263个基因在不同组织及器官中优势表达。本发明重点关注Gh_D05G1124和Gh_D05G0313这两个基因,因为显著SNP位于它们的外显子区域并导致氨基酸的变化。同时,RNA-seq和qRT-PCR分析表明,这两个基因在30DPA胚珠中表达量高。另外,它们在拟南芥中的同源基因是PP2C及AtLUT2,分别参与了蛋白质磷酸化和光合作用。由于这两个过程与纤维的发育有关,因此,推测Gh_D05G1124和Gh_D05G0313这两个基因是调控LP的候选基因。
3、优异等位变异位点分析
优异等位变异是作物育种的宝贵资源,优异等位变异位点的积累能有效改善作物目标性状。优异等位变异位点的利用已经在多种作物中报道过。例如,通过GWAS鉴定到一些小麦中优异的等位变异位点,同时发现9个优良的等位基因的聚合使得小麦栽培种品东34的千粒重在多个环境下被提高,因而提出适当的优势等位基因的聚合将有利于改善小麦的产量性状。同样地,在油菜中,研究者发现与早熟显著相关的优势等位基因的聚集可导致花期或成熟期提前。
棉花中也有类似地报道,Li等选择3个有利的SNP等位基因来鉴定等位基因变异对陆地棉黄萎病抗性的影响,发现通过聚合有利的SNP等位基因可以提高材料的抗病性。相应地,本研究中发现i00252Gh和i08888Gh这两个与LP显著关联的SNP位点,对LP表型变异有积极的影响,即i00252Gh和i08888Gh位点携带G等位基因的材料LP高于携带A等位基因的材料。同时,发现LP的表型值随着有利等位基因数的增加而不断增加(图10)。即图10中,0表示不具有本发明提供的i00252Gh和i08888Gh两个位点的有利等位变异的材料,1表示具有本发明提供的i00252Gh和i08888Gh两个位点的任一个有利等位变异的材料,2表示具有本发明提供的i00252Gh和i08888Gh两个位点的有利等位变异的材料。因此,我们可以通过分子标记辅助将这些优异等位位点聚集到一起,进而促进棉花衣分性状改良育种。然而,在276份陆地棉材料中,只有16个品种含有两个有利等位基因。这些优异等位变异位点还没有得到很好的利用,但这些有利等位变异在棉花育种中的应用前景十分广阔。
总之,本发明以276份陆地棉材料为材料,种植于多个环境中。采用CottonSNP63K基因芯片进行基因分型,共获得10660个高质量的SNPs,并用于遗传结构分析和GWAS。通过GWAS分析,共发现23个SNPs及相应15个QTLs与LP显著相关。另外,通过qRT-PCR分析,确定Gh_D05G0313和Gh_D05G1124为调控LP性状的候选基因。此外,还发现LP性状的表现与有利SNP等位基因的聚集呈正相关。因此,这些优良等位基因的聚合可能有利于棉花性状改良育种工作。总的来说,上述的发现增强了对棉花LP性状遗传基础的认识,并有助于探索衣分性状的分子机制。
尽管已用具体实施例来说明和描述了本发明,然而应意识到,在不背离本发明的精神和范围的情况下可以作出许多其它的更改和修改。因此,这意味着在所附权利要求中包括属于本发明范围内的所有这些变化和修改。
SEQUENCE LISTING
<110> 中国农业科学院棉花研究所
<120> 与棉花衣分性状显著相关的基因、SNP标记及其应用
<130> 2018
<160> 6
<170> PatentIn version 3.3
<210> 1
<211> 6526
<212> DNA
<213> Gossypium hirsutum L.a
<220>
<221> misc_feature
<222> (712)..(712)
<223> n is a, c, g, or t
<400> 1
atgggggtat atctcagcac cccaaaaact gagaagttat cagaagatgg tgaaaatgac 60
aagcttcgat ttggattgtc gtccatgcaa ggatggcgtg catctatgga agatgctgta 120
agttctctct ctaccttctc attgtttgac ttaatatact atctttgaat cattaactaa 180
agccatcgga cttgccttct gttaacgaca aatcgtaata tctgcttttc atatatctag 240
tatacgtctc ttaacaaggc attaaataat atctagtctt ggccaatatc ctatgtctag 300
tgtattgaat aaatactaat aactgcttat cttacaccta ttacatgctt cttgacatgg 360
tattaagaat catataactt ttaagctgag tgttaagatc gcatcatcac aaggcagtga 420
gaaagttcct tagcctttta ctgattctat ttttttgaat atcaaatcag attataaaga 480
tttcaaaagt taatctgcta ctttcttaaa gttatttcac attgattgga atgttgtgag 540
tcatgacaat aaattgacat gtaatttctt aaagttattt catattgatg ctaaggaatc 600
aaattacatg atatccatgc taaagataga catgagactt agctggtaat attagtctga 660
tatctatggc acaagggatt tttttctttt cttttttttt tttttttttt tngtacttgg 720
tgctggttgg agcgtggggg ttagcaccta tggtacccaa cctcgaggat gagtgtttga 780
tatgggtata tgtccaaaac tggcatgctc tatttttttc taagtttttt cacatgtttg 840
gaagatcaca cttcgatatc catgtctaaa tatgtgccaa acacaagtgt caaacatgca 900
tatttggaaa atgaagagtc taggtaacat aggacagaag agtgtcagtt tggactttag 960
aaatatttat cccaggttac acttttctaa aattttccat ttagtcctga taacatagga 1020
aaatgaagag tctaggaaac ataggataca aaaacatgtc cttttaattt gagctgtgct 1080
gaaacctaac gtatttatct caagagataa tttttgcttc ttatgcgtgc acacatgctt 1140
ttttttggaa gtaattgctt gatgcatttc caactatgtt ggaaacctgt tatatctatg 1200
atgtttgagg gatacaggtc cttgttaaaa gcatgtctgc tataataatt gatgattatt 1260
tccattttaa ctacaggcca tttttgtacc tcttgataac tcaatttgcc ttcaatgatg 1320
ccatgaattt gtttttatgg tttttgcagc atgcagcata tctggatctg gacgactcaa 1380
catcattttt tggtgtttat gatggtcatg gaggtaagga ttgagctccc ttttttttgt 1440
ttgttccttt aatttttatc acatcacttt attttttctt taaaaagttc acaaagttta 1500
gatttcagtg aagtttttct tccctttgct ggtgctgttt gtattccttc ttccgaatat 1560
aattttagtt attcctttag caaatcttaa ctgaccagta tgtgtgttgg tcttgcactg 1620
gtaaagctac tagagcaaaa ttatgtcttt aaatactgag gttttatgat attacaagag 1680
accgacctgt tgacacctga gtgtgtttaa tacatatcat tggaggcatt agctttctct 1740
gtttgtatgc gtgtgtcctt ttctttttgg ttttgtgcaa atattattat ataacttttc 1800
cttaactgta ggcgaaaggt gcaaccttgt ttgtttagaa acggttattg taacaacttt 1860
tatgttttca attcataaaa aggagacaaa gagaaagcta aaaacttgga tctaaggatg 1920
tatctcatca aatcttgttt tttcttttct tgtttttgtt tttagcactc tttcggtaca 1980
aaataatatc tgaagataat gttgagttga cagttcagtc ccatatagta tacggtgcct 2040
taattggtgg agctattttc ttttatttga aggtcgtttg tagtgtccag ttgagcccaa 2100
taatcctttt aaaatttgac ttgcactgac actccattaa tgattctgaa tataccatca 2160
ccctttgatt accagtagag agcaagctgc attttgggct tgcttttctt gtattatgat 2220
gatattttct attagaaaat gagaaaggga ttggagctgg ttaatcacat tactggatgg 2280
gtaagacctg catgtacagg ccatgcctta gttggcaaaa agttcagctt ccaccacagt 2340
tgggttctta agatgcttct ttgtaattga tagagttaag ggcctagaca ctcaactcat 2400
tcttgagttt ctatgcaatg catgcttatg tctggctgca aagtttcttc ttgatttctc 2460
tgctaaaatt ggatttgaat gctttgaaat attgatgcat cttggagagt ttccgggatg 2520
gagggtacct tcctttctca ggcagctttt gataaactga gattatgttc tgcatagtta 2580
atagtatttg taacatttca tgtttgtaaa cttatagaga aagtttttag ttcatataag 2640
ttgtgtaggt aaatattggt ttctgtggaa tgctttaaac aaaaaggttg agctgctcac 2700
aacagaattg ttacttttgc tcttgttccc ttttttctta ttgatgcttt catgattttc 2760
acagctttta tacataaaat tagttgttga tctgattaaa ttctttgtac ctagtcattt 2820
aagcatatta tatgtgggtc catttatctg taggcaaagc agtggctaag ttttgtgcca 2880
agcatcttca tcagcaggtg ctcaagcatg aggcgtattc agctggagat attgggactt 2940
cagtacagaa agcttttctc aggttccttt actggattta tttgtgtatt cttttggtag 3000
caatatacgg aagatatgtc atagctcaac cacaaggcag ctgaaaaatt gcctttgaca 3060
tgtaagtaat atgttctaag tttcctagga atcaggcaat ggaccatgtg cttggagctc 3120
catgatcatt gccactcaaa atttgttaat gccatacatg gttgtttaaa gtttttcctt 3180
ttcatctaat gaatccctta tgacactgat gaaattgcat tttgttattt acataaatgt 3240
tactgttttt aatggatagt ttatttatag ctccattctg gcatatgcta gtgccactgc 3300
atttttgact gtttaggtca ttgttctcta gcatattttg cttttttcac tcatgaactt 3360
gaaatttaag agtatgatca acttcatttt actggataaa atatgatata gtaaggctgc 3420
ttcttgttaa ttgtttcttc tgctatacat gcattcaact gctatttttt ttatcataca 3480
gaatggatga gatgatgtgt ggacaaagag gatggagaga attagcagtc ctgggagata 3540
aaatggacaa agtttctggt tttgttgaag ggtttgtatg gtctcctaag ggtgatgaag 3600
ccaatgacca ttttgatgat tggcctcctg aggaggtatt tttgtgatag aaaactaaat 3660
ttttgtctta ggtgtatgaa gcaatttcat tttgtatgtt actagacaat gtttcagtaa 3720
gatctaagct gcaagacctt aagtttttct taagttgccg tgctcattca tgcaaaggag 3780
tccaagtttt caactaaccc attacctgtt ctatagtaat atgctctaga ttttggtttt 3840
aggagtattc ttgcataata aactctttat aaattagttt tgttatttgc ttatttggta 3900
aactggaaaa ttgttatggg aataccacta acagaagctt cgtgtcttgt gaactttata 3960
caaacacttt ttatactatt tttagtgaac ttagacgttt ttaattttac caatcaatac 4020
ttttttaggg aaatgactta attgaaccaa ctctatgaag tatgctaatt ttaattgagg 4080
taggatatag tcaggaattg aacatgatta gttaagttca ctatattgtt tttaggccta 4140
gatcaagaga gggttgttaa caaaggaaga ggaaagttat tagaaacttt tttgagttct 4200
atgagccttt gagaagccta aacaacggag agtggatata attaaggaga aggaagatct 4260
ttgcttgagg ttttaagatt tattacaagg aatttgatac aaactggatt ggaaataata 4320
taaaaggggc atgtggaccc ttcttatgtt aaaaggggtt ggatttcttc ttattttgcc 4380
ctatgattct gtagaagaaa attggaaaac atgaaggaaa ctagcattct gtcgataagt 4440
acactctggt tgtatgttta agaattttct gcaggttacc taggactgtc atttactgtg 4500
gttacttgaa gtatcatttg tgtttgagac tttactatga ttcatttaat tctttcaatg 4560
caataccact aagtaagaag cttttgtttg attggtcaaa tatgtctatt acttgtgaga 4620
ttccgatgtt gacttttctg ttggttgcca actagggttc tcactctgat tttcatggac 4680
ctacttctgg atgcacagcc tgtgttgcaa taattcgaaa caagcaacta gttgttgcta 4740
atgctggtga ttcccgttgt gtaatatcta gaaaggggca ggtacaattt tcttttctgc 4800
agaaccctga aaacagaatt tcagaatttt gtttatttcc acagagcctt tccttaaggc 4860
ctctcaaagt tgtgagatga aaggatttac aagttgaatg acaagtagtg cttttgtcgt 4920
aagttaatat tctagcactt ttaagggact gttgttcttg cccttttaac tgcatggaaa 4980
tggttgtaga aagtagcaca tgcttttacc attttcaatt ttattgatga tattagagtg 5040
aaaaacattt gctctaagtg taatagtcac tatatttatt gctgaactag catgtaaagc 5100
atttatcaat gctccacgtt cagattcctt tttcctttta cctctctcct ttggatacac 5160
aatatggttc ctctttaata cggcatagct tagctgctgc atgctttatt tcatagatgt 5220
cactttttac aggcatataa tttgtctaaa gatcacaagc cagaccttga actggagaaa 5280
gataggattc tgaaagctgg tggttttatt caagtcggac gtgtcaatgg aagtttaaac 5340
ttggccaggg ctattggtac cttctagatc caaggggaca atggatctaa tatttatttg 5400
cttgttggtt tatgattgtc tttcacttgc aggagatgcg gagttcaaac agaacaaaac 5460
tttacctgct gaaaggcaaa ttgtaacagc taatccagac atcaacactg taagtgaatt 5520
gctttagcct ttaatatttg tgttatattc tagctctttc agtaaaattt gatgatggtc 5580
aattgattta gtaaagcgac taacttttgt agtattcttt aagcaaaatt aaaaacttct 5640
ttttgtattt tttaaaaaaa tcagacgcat gtataaaact tttgctgcca tttaagcaaa 5700
agatacatcg ttcccaatta gtatccatat ttatccacat gtttataatc tggttttacc 5760
ctctttaaaa taggttgaga tctgcgatga cgatgagttt cttgttttag cttgtgatgg 5820
gatttggtga gtctcctatt gtaagaactt gctttccttt taccctcctg ctctgaaatc 5880
aaccttcagt cctacctgga taccattcag aacacttagg taatttgcag tagatggttc 5940
caggcctgtg acacattctg gatgcacaca tgcctacttg ctaatcattc tcaaagatta 6000
aatatcaagc aatctgtcat aggaaatata tacataacat atatatgctt tgctcatatt 6060
tgtttatgta tgtattatgc attgacatgt gtatatatta atttgctaaa aagataaaga 6120
gaacgtagtg taccatttat agattccctt gggaattggg agcttgtaag atggccattg 6180
ctgaggattt ttgttttcat taatttgaag atagcattgt tgtgttttgt tgattaggga 6240
ctgtatgtca agtcaacaac tagtggatta tgtacgagag cagttgaatt ctgtaagttc 6300
cttcacaaaa cattataaac ctatcaatat aaagattcca ttaattaact acagatctct 6360
tcccatggtg caggaaacta aactttcagc aatctgtgaa agagtattcg acaggtgctt 6420
ggctccaaca gctggtgggg agggatgcga caacatgaca atgatccttg ttcagttcaa 6480
aaaacctgtt ggttcaggta cttctttgag cagcacccag cattga 6526
<210> 2
<211> 3943
<212> DNA
<213> Gossypium hirsutum L.a
<400> 2
atgtgtttat tagtttcgat ggtgataaca atggagtgtg tcggagctcg gaacttcgcg 60
gcaatggcgg ttcctacacg tgccttttgg aaagcaaatc tgatgaggac taaaacagcg 120
attccaagtc ataatcggct tatttcctta aaggtgagag ctagtggagc aaggagcgag 180
agttgcgttg cggttaaaga agatttcgcc gacgaagaag atttcataaa ggccggtggc 240
tctgagattc tctttgttca aatgcaacaa aataaagaaa tggataaaca gtcgaaatta 300
gcggataagg ttttcacttt gctcacttta gttcgatttt catttgttgg aactaatatc 360
gggagatata tggatatttt cccttttttt ttggttattt ctgcgtgtaa atatggaggc 420
cctactggtg gcttttgagc cacaagaatt tacataaatt ggaaaaaaaa tagttaaata 480
ctcatgaaag ttatgacata tgatggtcac gtgcatctgg tcaatagtat ttggccgcct 540
tctttgccct taatttttgt ggtaccacta actagttagc tttgttattt gatgttcgat 600
tggtattttc tatttttgat tttatttttt aaaaaattga agaaagattg cattttatta 660
gtgggtttta ctgtttcgtt gaaatatcca ttttgagcct ttgtgatagc atatatgttt 720
ttcacagtta ccgcccatat caactgggga aaacgtattg gacctggtag ttattggttg 780
tggtccggct ggtcttgctc ttgctgcaga gtctgctaag ttgggtttaa atgttggact 840
aattggccct gatcttcctt ttaccaataa ttatggagta tgggaagatg agtttaaagg 900
tattcacttc attttctaag caatttatgt aagattcatt tcgaagcaat caaataaaca 960
ccaagttaat ctaatgttcg ttttcagatc ttggccttga aagatgtatt gagcatgttt 1020
ggcgggacac catagtatac cttgatgatg ataagcctat tatgattggt cgtgcttatg 1080
gacgtgttag tcgatacttg ctccatgagg agttgttgag gaggtaacaa cagctccttg 1140
tcaatgatat ttatggtcat ttttctcttg gttattgctt cttctacttt cccgatcatc 1200
aatgtttaat ttgtattaat tttccctagg tgtatcgagt caggtgtaat gtatcttaac 1260
tcgaaggtag agacgattgt tgaagctacc gatggtcata atcttgtagt ttgtgaacac 1320
aatcgtgtcg ttccttgctg gtactataat ttctttttct cgtactgcta ttcctaaact 1380
tttaaccttt tagtatcaca actcctttca agcccctaat gtgctattat aggcttgcta 1440
ctgttgcttc aggagcagct tcaggtaaac tgttgcaata tgaggtaggg ggtccaaggg 1500
tctctgttca aacagcttat ggcgtcgagg ttgaggtacg tatgatacac taactgtgat 1560
tgttaacagt tgtacatatc tttgcatttg ttattttaat ctcactgcag catgaacaga 1620
agattactct ttaagagggc gatggaagaa aaaatttctg aacttattta acaggatacc 1680
tttttcttat tacatcaggt ggataacaat ccttatgatc caagcctgat ggttttcatg 1740
gattacagag actatgctaa acaagaagtt caatctttag aagcacaata tccaacattt 1800
ctttatgcca tgcccatgtc ttcaacaaga gttttttttg aggtttgcac catgcaatta 1860
atttgtttat tgtttatgtt gtatgccatg attaaatgca aaatgattta gaaagttgca 1920
ttgcaggaaa cttgtttggc ctcaaaagat gccatgcctt ttgatttatt aaagaagaag 1980
ctcatgtcaa ggttagagag catgggaatc cggattttaa aagtttatga agaggtaaac 2040
tgcatggtct aataagatac cagattcatt ccgatataat gtatggatta ctttttatca 2100
ttactcagca ccaaaatagg gctgcatgtc agtcatctcc ttgccatttt ataaattggt 2160
gttgatggtc aaaagatgac tttctccaca agtcattttt ctttactatt cctcattcac 2220
gaacagcccc tcaaatttgt tagtagaaaa tcagagaaaa cagctcgtca caaacaatgc 2280
cacatcaaat tcaggattca cctttctatc atagtagcac ataatttgct atcgacttgg 2340
tttttattca ttattctggt caatgatgga gtgcagagcc caatgctctt aatcctggct 2400
tacttagaat taatgcccat ctatctttgc acttctcaat tagtagtcta tctcatttca 2460
ttcctcacat ttccatgttc caactgcatc atgaagtaac atgtgttgaa tgccaatttt 2520
tattagcaag atgccatgtt tcaatctttt gcaggagtgg tcttacatcc cagttggtgg 2580
ttccttgcca aacacagagc agaagaacct tgcatttggt gctgcagcaa gcatggtgca 2640
tccagctact ggtaggaatt gggttaatag atatttcctt caataattaa gacttaatac 2700
tgccaatcta aaccttctta aacaggttat tcggttgtca gatcattgtc agaggctcca 2760
aattatgctt ctgtaattgc aaatatccta aagaaggata attctaatgg cttgcttacc 2820
agtgaaagaa ataatgggaa tatctcaatg caaggtatgc tgtgtgattt atcttctttt 2880
cctctcaact tcacccattt aagggtttgt aaacaagttc ttcatcttaa gcaagccaca 2940
gtaatggaaa tctttttttt tttagtaata aaagtcatta acaaatcaaa acaaactaaa 3000
ctgaagctct taacgtattc tggacatcat ttttgagcaa ggagcaacag cttggaatca 3060
gatgctcaga acaatgaact gctccatctt gaacagactc aatctttgcc ataaaatcag 3120
ccactttgtt tgcttatact gcatatgcat tatttgggtt tagtaacatg attaatttct 3180
cttggtaaac gtgatgtcaa ttgtcatcct tggtagttgt tgtctttatg atttgtcatt 3240
tttcttttgc ttggcttgta tgattaattt ctcttcataa acgtgatgtt aattgtgtgc 3300
cgtaatgcta tggcgttttg tataatgtat taacaactta aaattcaacg catggtatca 3360
ccctcttagg atgtgttatt ataatttgat tcagcttggg atactctttg gccacaagaa 3420
aggaaacgcc agaggtcatt ctttctcttt gggctagcac tcatactgca actagatatt 3480
gaaggcattc gaacattctt ccatacattc ttccgtttgc caagttggta tgacttcata 3540
tttaccatct tttggtgttt atttataaag aaagccaaga taactaacct ttccctttcc 3600
acatcaccca aatattcagc ttttaaactt gagacagaaa acataactcc atgaataaac 3660
aaacctatca ttaatttttt ttaaaattca tcattataaa agaaataatg cttgactagc 3720
atgagttgca tacttaaaat tttactttgt aataactaag gaatatattt attgcaggat 3780
gtggcaagga tttcttggtt ctaatctttc ctctgccgat ctcattctgt ttgcctttta 3840
tatgtttgtc atagcaccaa acgatatgag aatgtccctt gtcaggcact taatctcaga 3900
tccaactgga gcaactatga taagaacata tctcacaata tag 3943
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<400> 3
ggattctgaa agctggtggt 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<400> 4
caatttgcct ttcagcaggt 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<400> 5
tgccttttgg aaagcaaatc 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<400> 6
gcaactctcg ttccttgctc 20

Claims (10)

1.与棉花衣分性状显著相关的基因,其特征在于,为基因Gh_D05G1124和/或Gh_D05G0313,其中,基因Gh_D05G1124的核酸序列如SEQ ID NO:1所示,基因Gh_D05G0313的核酸序列如SEQ ID NO:2所示;
进一步地,与棉花衣分性状显著相关的基因为基因Gh_D05G1124的第10个外显子区域序列和/或基因Gh_D05G0313的第1个外显子区域序列。
2.含有权利要求1所述的与棉花衣分性状显著相关的基因或其反义链的载体。
3.含有权利要求2所述的载体的宿主。
4.与棉花衣分性状显著相关的SNP标记,其特征在于,所述的SNP标记包括以下中的任一种或两种:
位于基因Gh_D05G1124第10个外显子区域,以基因Gh_D05G1124的起始密码子计算,位于第6498碱基处,其核苷酸为G/A;
位于基因Gh_D05G0313第1个外显子区域,以基因Gh_D05G0313的起始密码子计算,位于第176碱基处,其核苷酸为G/A。
5.用于检测权利要求4所述的SNP标记的引物对、探针或芯片。
6.一种试剂盒,其特征在于,含有权利要求5所述的引物对、探针或芯片。
7.权利要求4所述的SNP标记在棉花种质鉴定、育种或遗传多样性分析中的应用。
8.一种高产棉的鉴定方法,其特征在于,包括以下步骤:提取待检测的棉花的基因组,对权利要求4所述的SNP标记进行检测,若为GG基因型则为高产植株。
9.一种棉花育种方法,其特征在于,包括以下步骤:提取待检测的棉花的基因组,对权利要求4所述的SNP标记进行检测,挑选出GG基因型作为高产植株继续杂交繁殖。
10.根据权利要求8或9所述的方法,其特征在于,所述待检测的棉花包括适宜于有性繁殖、植物性繁殖或可再生的细胞的组织培养的材料;
适宜于有性繁殖的材料选自花粉,子房,胚珠,胚囊和卵细胞;
适宜于植物性繁殖的材料选自插枝,根,茎,细胞,原生质体;
适宜于可再生的细胞的组织培养的材料选自叶,花粉,胚,子叶,下胚轴,分生组织细胞,根,根端,花药,花,种子和茎;
进一步地,检测所述SNP标记的方法包括以下一种或几种:
基于凝胶电泳的SNP检测法、DNA测序法、DNA芯片法、变性高效液相色谱法或质谱检测法。
CN201811563730.7A 2018-08-23 2018-12-20 与棉花衣分性状显著相关的基因、snp标记及其应用 Active CN109628630B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201811563730.7A CN109628630B (zh) 2018-12-20 2018-12-20 与棉花衣分性状显著相关的基因、snp标记及其应用
PCT/CN2019/084940 WO2020038014A1 (en) 2018-08-23 2019-04-29 Genes and snp markers associated with lint percentage trait in cotton, and use thereof
US16/635,287 US11032984B2 (en) 2018-08-23 2019-04-29 Genes and SNP markers associated with lint percentage trait in cotton, and use thereof
AU2019303422A AU2019303422B2 (en) 2018-08-23 2019-04-29 Genes and SNP markers associated with lint percentage trait in cotton, and use thereof
ZA2019/04461A ZA201904461B (en) 2018-08-23 2019-07-08 Genes and snp markers associated with lint percentage trait in cotton, and use thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811563730.7A CN109628630B (zh) 2018-12-20 2018-12-20 与棉花衣分性状显著相关的基因、snp标记及其应用

Publications (2)

Publication Number Publication Date
CN109628630A true CN109628630A (zh) 2019-04-16
CN109628630B CN109628630B (zh) 2020-10-27

Family

ID=66075901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811563730.7A Active CN109628630B (zh) 2018-08-23 2018-12-20 与棉花衣分性状显著相关的基因、snp标记及其应用

Country Status (1)

Country Link
CN (1) CN109628630B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020038014A1 (en) * 2018-08-23 2020-02-27 Institute Of Cotton Research Of The Chinese Academy Of Agricultural Sciences Genes and snp markers associated with lint percentage trait in cotton, and use thereof
CN111218524A (zh) * 2020-03-30 2020-06-02 河南农业大学 棉花纤维品质相关的GhJMJ12基因SNP标记及其应用
CN112599191A (zh) * 2020-12-28 2021-04-02 深兰科技(上海)有限公司 数据关联分析方法、装置、电子设备及存储介质
CN116574834A (zh) * 2023-05-15 2023-08-11 浙江大学 一种具有优异棉花衣分性状的棉花品种鉴定方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106929574A (zh) * 2017-02-22 2017-07-07 中国农业科学院棉花研究所 陆地棉4号染色体与纤维强度相关的snp分子标记
CN106947771A (zh) * 2017-03-22 2017-07-14 南京农业大学 一个棉花产量性状关联的乙烯信号转导途径调节因子

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106929574A (zh) * 2017-02-22 2017-07-07 中国农业科学院棉花研究所 陆地棉4号染色体与纤维强度相关的snp分子标记
CN106947771A (zh) * 2017-03-22 2017-07-14 南京农业大学 一个棉花产量性状关联的乙烯信号转导途径调节因子

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AMANDA M. HULSE-KEMP等: "Development of a 63K SNP Array for Cotton and", 《G3(BETHESDA)》 *
CAIPING CAI等: "High-density 80 K SNP array is a powerful", 《BMC GENOMIC》 *
TIANZHEN ZHANG等: "Gh_D05G0313_NBI-AD1_v1.1", 《COTTONGEN》 *
TIANZHEN ZHANG等: "Gh_D05G1124_NBI-AD1_v1.1", 《COTTONGEN》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020038014A1 (en) * 2018-08-23 2020-02-27 Institute Of Cotton Research Of The Chinese Academy Of Agricultural Sciences Genes and snp markers associated with lint percentage trait in cotton, and use thereof
US11032984B2 (en) 2018-08-23 2021-06-15 Institute Of Cotton Research Of The Chinese Academy Of Agricultural Sciences Genes and SNP markers associated with lint percentage trait in cotton, and use thereof
CN111218524A (zh) * 2020-03-30 2020-06-02 河南农业大学 棉花纤维品质相关的GhJMJ12基因SNP标记及其应用
CN111218524B (zh) * 2020-03-30 2023-04-07 河南农业大学 棉花纤维品质相关的GhJMJ12基因SNP标记及其应用
CN112599191A (zh) * 2020-12-28 2021-04-02 深兰科技(上海)有限公司 数据关联分析方法、装置、电子设备及存储介质
CN116574834A (zh) * 2023-05-15 2023-08-11 浙江大学 一种具有优异棉花衣分性状的棉花品种鉴定方法

Also Published As

Publication number Publication date
CN109628630B (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
Nie et al. Genome-wide SSR-based association mapping for fiber quality in nation-wide upland cotton inbreed cultivars in China
CN109628630B (zh) 与棉花衣分性状显著相关的基因、snp标记及其应用
CN103635483A (zh) 用于选择性调控蛋白质表达的方法和组合物
CN103789306A (zh) 一种稻瘟病抗性基因Pia的SNP分子标记及其方法与应用
CN111961746B (zh) 与陆地棉枯萎病抗病相关的snp分子标记及其应用
CN109234431A (zh) 玉米抗茎腐病qtl的分子标记及其应用
Sarfraz et al. GWAS mediated elucidation of heterosis for metric traits in cotton (Gossypium hirsutum L.) across multiple environments
AU2019303422B2 (en) Genes and SNP markers associated with lint percentage trait in cotton, and use thereof
Han et al. Genomic insights into genetic improvement of upland cotton in the world’s largest growing region
CN108396031B (zh) 调控陆地棉株高的基因及其应用
Hyun et al. Development of low-temperature germinability markers for evaluation of rice (Oryza sativa L.) germplasm
EP2486155B1 (en) Methods of quantifying target organisms and creating reniform resistant cotton plants
UA118173C2 (uk) Спосіб ідентифікації рослини соняшнику, яка має низький вміст пальмітинової кислоти
CN109735650B (zh) 四种基于单核苷酸多态性的甜瓜抗蔓枯病分子标记及用途
CN109111511A (zh) 超长粒水稻的培育方法
CN108456740A (zh) 一个水稻稻瘟病抗性位点‘Pi-jx’及其Indel标记引物和育种应用
CN109797238B (zh) 两种基于抗蔓枯病连锁基因开发的用于甜瓜蔓枯病抗性鉴定的分子标记及其用途
CN109055593B (zh) 提高棉花衣分的snp标记以及高产棉的鉴定和育种方法
CN103215289A (zh) 导致西瓜两性花发育的基因a序列及其获得方法
CN113278723B (zh) 合成芥菜中导入的白菜基因组片段或遗传多样性分析的组合物及应用
CN105925587B (zh) 一个受低温响应的早期水稻叶绿体发育基因及其检测方法和应用
CN111218525B (zh) 棉花纤维品质相关的GhCYSb基因SNP标记及其应用
CN111334597B (zh) 用于检测西瓜白粉病抗性的snp位点、kasp标记及其应用
CN110438135B (zh) 美洲黑杨抗叶锈病的抗病基因PdGsSRK、表达蛋白、克隆引物对及其应用
CN105132428A (zh) 一种与植物根系性状相关的ZmLRT基因及其相关生物材料与应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant