CN108779459A - 棉花全基因组snp芯片及其应用 - Google Patents
棉花全基因组snp芯片及其应用 Download PDFInfo
- Publication number
- CN108779459A CN108779459A CN201680077963.9A CN201680077963A CN108779459A CN 108779459 A CN108779459 A CN 108779459A CN 201680077963 A CN201680077963 A CN 201680077963A CN 108779459 A CN108779459 A CN 108779459A
- Authority
- CN
- China
- Prior art keywords
- cotton
- chip
- snp
- seq
- site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
一种棉花全基因组SNP芯片及其应用,所述芯片命名为CottonSNP80K,包含82,259个SNP位点(SEQ ID NO:1‑SEQ ID NO:82,259),主要基于陆地棉种内SNP变异定制,非常适于陆地棉种内基因分型检测,可大大克服陆地棉种内遗传基础狭窄,遗传多样性低的瓶颈。该芯片可以对陆地棉品种资源进行分子标记指纹分析,品种纯度和真实性鉴定,育种材料遗传背景的分析和筛选、农艺性状重要基因位点关联分析等。同时,该芯片也将有效用于海岛棉等其他棉种的种内及种间基因分型分析。
Description
本发明涉及基因组学、生物信息学和分子植物育种领域,具体地,涉及一种由82,259个SNP位点组成的棉花全基因组SNP芯片(CottonSNP80K)及其应用。
迄今为止,棉花遗传育种研究中可选标记主要为SSR(simple sequence repeat)标记,已被广泛应用到遗传图谱构建、目标性状/QTL定位、关联分析等相关研究。但相比于全基因组覆盖的SNP(single nucleotide polymorphism)标记,SSR标记仍存在基因组中分布不均匀、基因分型多态性不高,以及基因组覆盖度不够等问题,尚不能满足不同基因型高通量分子鉴定及选择的需求。SNP标记是基因组中均匀分布且多态性最为丰富的DNA分子标记,利用覆盖全基因组的SNP芯片,可以通过一次杂交实现数以万计,十万计,乃至百万计的SNP位点分型,具有成本低,通量高,获得的信息量大等优势。目前,SNP芯片已成为全基因组关联分析、指纹图谱构建、基因分型、分子设计育种等研究中最理想的技术平台,已在玉米、水稻等作物遗传育种研究中发挥重要作用。在棉花上,Hulse-Kemp et al(2015)利用不同棉种来源的公共数据库信息,开发了包含63K位点的SNP芯片(CottonSNP63K),并用该芯片对1156个不同来源的材料(包含两个F2分离群体单株)进行检测,共得到38,822个多态位点;进一步利用(G.hirsutum lines Phytogen 72×Stoneville 474)组配的93个单株的F2分离群体构建了一个陆地棉种内遗传图谱,含7171个SNP标记,覆盖3499cM遗传距离。利用(G.barbadense line 3-79×G.hirsutum standard line TM-1)组配的118个单株的F2分离群体,构建了一个海陆种间遗传图谱,含19,191个SNP标记,覆盖3854.3cM遗传距离。但由于该芯片所涉及的SNP位点主要来源于已释放的不同棉种基因组及转录组数据,位点的基因组覆盖度及具体染色体信息未知。
近年来,棉花基因组学相关研究取得令人瞩目的成果。2012年,美国佐治亚大学的Paterson实验室牵头在Nature发表了关于棉花基因组多倍化及纤维发育研究,同时释放了二倍体D基因组雷蒙德氏棉全基因组序列信息(Paterson et al.2012)。最近几年,来自中国不同研究单位的科学家在二倍体棉种亚洲棉和雷蒙德氏棉,四倍体棉种陆地棉和海岛棉的基因组信息解析上取得突出进展。中国农业科学研究院棉花研究所先后于2012年、2014年在Nat Genet上公布了二倍体雷蒙德氏棉(D基因组)、亚洲棉(A基因组)全基因组序列信息(Wang et al.2012;Li et al.2014);南京农业大学和中国农科院棉花研究所于2015年均在Nat Biotechnol分别公布了异源四倍体棉种陆地棉遗传标准系TM-1基因组信息(Zhang et al.2015;Li et al.2015);溢达集团和华中农业大学均在Sci Rep上分别公布了海岛棉新海21及
3-79的基因组信息(Liu et al.2015;Yuan et al.2015)。南京农业大学构建完成了包含4,999,048个SNP位点,4,049个重组bins,覆盖4,042cM的超高密度SNP和SSR整合的海陆种间遗传图谱,并成功用于异源四倍体陆地棉基因组组装中纠错及scaffolds方向和顺序确定(Genome Biol 2015)。针对中国不同培育年份,不同生态来源的100份陆地棉品种,南京农业大学完成平均基因组覆盖5倍的重测序分析。以陆地棉遗传标准系TM-1基因组信息为参考序列,进行全基因组覆盖的陆地棉种内SNP位点发掘研究,获得MAF>10%的1,372,195个SNPs多态位点。上述高密度的SNP遗传图谱、高质量的四倍体棉花基因组序列信息、以及不同陆地棉材料重测序序列信息等为棉花全基因组SNP芯片开发及利用奠定基础。
迄今为止,有近百种不同的基因分型技术用于满足多样化的研究需求。研究人员根据需检测的样本大小、位点多少等选择不同的检测平台及检测技术。在高通量的SNP分型技术中应用较多的有Illumina SNP基因分型平台(技术)和Affymetrix基因分型平台(Affymetrix技术)。其中Illumina公司的SNP分型技术采用微珠芯片技术(BeadArray),包含Infinium和GoldenGate两大系列产品,Infinium技术适合于多位点的中高通量(3万到500万位点)的全基因组分型;而GoldenGate技术适合于SNP位点较少的中低通量(96到3072位点)基因组分型,均提供现成芯片或完全定制的iSelect或半定制芯片,以满足不同的研究和分析需求。例如,Illumina Infinium芯片中,每个SNP位点的被检测率高、重复性好、检测质量可靠等优点,得到业界的广泛认可,已被广泛应用到人类、动植物基因组分析相关研究中。
在植物中,玉米、水稻的芯片开发及应用较其他作物更为广泛。例如,以水稻为研究材料,已利用不同的平台开发了多个不同密度,多功能的芯片,包括:与Illumina公司合作生产的基于Infinium平台的RiceSNP6K、RiceSNP50K和HDRA700K,基于GoldenGate平台开发的1,536SNPs,基于BeadXpress开发的384-plex;与Affymetrix公司合作生产的Rice44KGeneChip和50K chipOsSNPnks等(Plant Biotech,Yu et al.2014;Molecular plant,Chen et al.2014;Nat Commu,McCouch et al.2015;Int JAgri Sci,Utami 2014;Theor Appl Genet,Chen et al.2011;Nat Commu,Zhao et al.2011;Sci Rep,Singh et al.2016)。上述不同用途芯片均取得较好研究进展。本发明基于陆地棉种内SNP变异,利用Assay这一成熟的技术集成一款适于陆地棉种内基因分型检测的棉花全基因组SNP芯片。
发明内容
本发明的目的在于提供一种棉花全基因组SNP芯片。
本发明的目的在于提供上述棉花全基因组SNP芯片的应用。
本发明的目的通过以下技术方案实现:
本发明提供一种棉花全基因组SNP位点集合,包含82,259个SNP位点。每个SNP位点包含两个不同碱基变异位点,用于检测该位点的等位基因变化。所述的SNP位点位于如SEQ ID NO:1-SEQ ID NO:82,259所示核苷酸序列的第61位。
本发明还提供一套用于检测棉花全基因组SNP位点集合的探针,所述探针的核苷酸序列如SEQ ID NO:1-SEQ ID NO:82,259所示,所述的SNP位点位于如SEQ ID NO:1-SEQ ID NO:82,259所示核苷酸序列的第61位。
本发明还提供棉花全基因组SNP分型芯片,命名为CottonSNP80K。所述的芯片含有一套用于检测相应SNP位点的核苷酸探针;所述核苷酸探针序列选自如SEQ ID NO:1-SEQ ID NO:82,259所示,能够用于相应SNP位点基因分型。所述的SNP位点位于如SEQ ID NO:1-SEQ ID NO:82,259所示核苷酸序列的第61位。
所述的基因分型,其实验步骤包括:1)制作基因分型核苷酸探针和试剂;2)在基因分型系统上把探针和样本杂交并扫描,获得所分析样本在所述SNP位点处的基因型。
上述的棉花全基因组SNP位点集合在制备棉花全基因组SNP芯片中的应用。
上述的探针在制备棉花全基因组SNP芯片中的应用。
上述的探针在棉花种质资源指纹图谱构建、棉花杂交后代基因型鉴定、棉花全基因组关联分析、棉花品种身份鉴定或棉花育种材料选择中的应用。
本发明提供棉花全基因组SNP分型芯片是根据SEQ ID NO:1-SEQ ID NO:82,259所示的核苷酸序列,利用Infinium专利设计制造技术由Illumina公司制作的,但不限于此。
本发明提供棉花全基因组SNP芯片的基因分型系统是利用Illumina公司的GenomeStudio基因分型模块,但不限于此。
本发明提供CottonSNP80K芯片在棉花全基因组SNP分型中的应用,适用于棉花种质资源指纹图谱构建、杂交后代基因型鉴定、重要农艺性状全基因组关联分析、品种身份鉴定、育种材料辅助选择、分子设计育种等。
本发明利用南京农业大学组装的异源四倍体陆地棉遗传标准系TM-1全基因组序列信息,及100份不同来源陆地棉材料平均5倍基因组覆盖度的重测序数据,研发覆盖全基因组、多态性高、适于陆地棉种内不同基因型鉴定的SNP芯片。用于重测序的100份陆地棉材料见附表1,用于定制全基因组覆盖的SNP芯片的SNP选点流程见附图1。设计陆地棉全基因组SNP芯片的具体挑选流程如下:
1.基于重测序信息,选取100份陆地棉材料间MAF>10%的1,372,195个SNPs多态位点,用于SNP芯片开发的初始SNP集合。
2.利用选择的SNP位点,回帖参考基因组,完成原始基因型的准确率鉴定,选择准确
率>99.12%的位点。通过repeat-masker寻找重复区域,过滤掉位于重复区域的SNP位点。综合上述分析,过滤后得到1,089,201个SNP位点。
3.通过模拟产生了24倍基因组覆盖,pair-end长度为120bp的reads数据。进一步和基因组比对检测每个基因位点的覆盖度。分别去掉位于染色体间重复区域内的12,385个SNP位点,以及覆盖度未达到24倍的基因位点。过滤后得到899,913个SNP位点。
4.通过实际的重测序覆盖度信息,进一步检测每个位点的覆盖度。发现大部分位点的覆盖率长度在331bp。我们选取覆盖率在231bp到431bp之间的SNP。得到了620,065个SNP位点。
5.由于芯片的探针长度为50bp左右,因此选择SNP位点两侧50bp内没有其他多态位点,且目标SNP也不在Indel区域内的SNP位点。过滤后得到619,979个位点。
6.由于棉花是常异花授粉作物,一些位点杂合率比较高,杂合位点在芯片中难以区分。因此基于重测序数据,去掉杂合率大于15%的位点。得到339,537个位点。
7.通过聚类分析,对于得到的339,537个位点,计算每个多态性位点的多态性值(π)。利用正态分布去掉显著性高于平均值5%的多态性位点和低于5%的多态性位点。利用随机抽样的方法,从339,537点中按照染色体比例抽取160,000个点形成一个数集。重复10000次。对抽样形成的数据集,计算个体相互之间的平均差异程度、最小差异程度和方差。选取10000次中平均差异最高,最小差异度在所有排名最高5%,同时方差也在排名最小20%以内的样本集作为最后的结果。最后筛选出175,192万个SNP位点作为定制SNP芯片的候选位点,送Illumina公司对探针位点进行打分评判。
8.根据探针设计分值,选取基因区>0.7,基因间区>0.9,且在基因组中间距>2500bp的SNP位点,最终确定82,259个位点用于后期芯片点制。
按照上述步骤筛选,最后获得82,259个SNP位点,将这些位点对应的DNA序列提交Illumina公司点制芯片,根据探针序列合成82,259种微珠,将该芯片命名为CottonSNP80K。该芯片可同时检测24个样品,更适宜于陆地棉种内SNP分型检测。
本发明所述的82,259个位点集合在TM-1基因组中的分布见附图1。芯片中涉及到的SNP位点覆盖棉花全基因组,平均23.5Kb有一个SNP位点设计在芯片上。在上述SNP位点的选择方法及其在染色体上的物理位置公开以后,任何人通过增加或减少部分不同的棉花材料测序结果分析,从而获得包含本发明所有公开的SNP位点集合或部分位点的集合,都在本发明保护范围之内。
在获得本发明所公开的SNP位点之后,通过确定具体的SNP位点所在的基因或与该基因连锁的SNP位点以后,通过PCR检测、探针杂交、芯片检测和试剂盒分析等检测方法加
以应用,都在本发明保护范围之内。
通过本发明所公开的SNP芯片挖掘出的与重要农艺性状相关的SNP位点,并通过PCR检测、探针杂交、芯片检测和试剂盒分析等检测方法加以应用,都在本发明保护范围之内。
本发明的有益效果:
本发明的有益效果是构建了棉花高密度的SNP位点集合,这些SNP位点具有多态性高,通量大,在染色体上具有明确的位置,覆盖棉花全基因组特点。其中17,671个SNP位点分布于13,759个基因中,涉及四倍体棉花基因组中19.57%的基因。这些位于基因区的cSNP位点(功能标记)可以满足功能基因相关的育种及研究需求。
本发明的另一个有益效果是开发了用于棉花全基因组SNP分型检测的SNP芯片(CottonSNP80K),可以应用于重要农艺性状的关联分析及定位研究、棉花种质资源指纹分型分析、育种材料进行前景及背景选择研究,开展分子设计育种以及开发棉花育种芯片等,均具有重要的经济价值及应用前景。
1.重要农艺性状的关联分析:
本发明中的多态标记,可用于棉花自然群体(不同棉花种质资源)中与棉花重要农艺性状关联的位点/基因的筛选。根据研究及育种目标的不同,选择不同的棉花种质资源,利用本发明中的SNP芯片完成不同棉花材料全基因组SNP分型工作。结合精准表型鉴定结果,开展产量、品质、抗性(抗生物胁迫或非生物胁迫)等重要农艺性状GWAS分析;发掘重要性状基因/主效QTL及携带大量优异基因的棉花种质材料。
2.目标性状基因/QTLs的定位研究:
本发明中的多态标记,可用于高密度遗传图谱构建,以及基于遗传图谱的目标性状基因/QTLs的定位及图位克隆等研究。根据研究及育种目标的不同,选择不同的亲本,配置大的分离群体(包括:F2、BC1及RIL群体等),利用本发明的SNP芯片,完成群体中SNP位点的分型,构建高密度、高质量的遗传图谱。完成目标性状相关基因的定位及图位克隆研究。
3.种质资源指纹图谱的构建:
本发明中的SNP芯片可用于不同棉花种质资源全基因组SNP分型工作,检测到的多态标记可用于棉花种质资源指纹图谱的构建。棉花品种分子指纹的研制不仅对保护棉花育成品种的知识产权和育种家的权益、提高种子市场的种子质量具有重要意义,而且对棉花品种真实性和纯度的司法鉴定,植物新品种权保护,规范品种管理,控制品种多、乱、杂,打击假冒伪劣,以及进一步理清我国棉花种质亲缘关系等都非常必要。本发明也可有效用于海岛棉等其他棉种的种内及种间基因分型分析。
4.育种材料的辅助选择:
利用本发明中的多态标记获得与目标性状紧密连锁或与重要农艺性状稳定关联的位点,可以利用这些位点针对相关性状表型分析进行辅助选择,其他位点用于背景分析研究。在标记辅助选择中,首先要通过分离群体构建高密度遗传图谱,筛选与目标性状紧密连锁的分子标记;或通过自然群体筛选与重要农艺性状稳定关联的分子标记。如果标记与目标性状连锁越紧密,则利用价值越高。特定标记等位基因与目标性状QTLs之间的关联还可用于杂交种后代基因型的预测、群体规模的估算。本发明中的SNP芯片可用于育种材料前景选择、背景选择过程中所需位点的基因分型。
5.分子设计育种:
利用本发明中的SNP芯片,筛选到与目标性状紧密连锁或与重要农艺性状稳定关联的位点,即利用本发明中包含的目标SNP位点及在附近区域其他SNP背景分子标记,有效用于分子设计育种。
6.育种芯片的开发:
利用本发明中的SNP芯片,筛选到与目标性状紧密连锁或与重要农艺性状稳定关联的位点,提取本发明中的目标SNP位点,包括增加部分新的SNP位点,组合成<1万位点的SNP集合,开发适于育种利用的SNP芯片。
具体的实验流程
1.DNA的提取及质量检测:利用CTAB法提取棉花幼嫩叶片全基因组DNA,用1%的琼脂糖凝胶电泳及紫外分光光度仪,检测DNA的浓度及完整性。保证每个样本满足以下条件:260/280在1.7~2.1之间,样品浓度>50ng/μL,总DNA>1μg,无大分子污染,无降解。
2.芯片检测:用Illumina iScan芯片扫描仪,按照标准的Protocol进行操作。
3.数据统计分析:利用Illumina官方软件(GenomeStudio)的基因分型模块完成原始数据的分型。
图1:82,259个SNP位点在陆地棉遗传标准系TM-1中的染色体分布
图2:棉花CottonSNP80K芯片开发流程图
图3:344个不同来源陆地棉品种聚类图
图4:与棉花纤维强度性状关联的SNP位点曼哈顿图
以下实施例用于说明本发明,但不限制本发明的范围。实例中所用到的技术手段均为本领域技术人员所熟悉的常技术。
实施例1CottonSNP80K陆地棉全基因组SNP芯片制备方法
本发明利用南京农业大学组装的异源四倍体陆地棉遗传标准系TM-1全基因组序列信息,及100份不同来源陆地棉材料5倍基因组覆盖的重测序数据,研发覆盖全基因组、多态性高、适于陆地棉种内基因型鉴定的SNP芯片。100份陆地棉材料见附表1,用于定制芯片的SNP选点流程见附图2。
设计陆地棉全基因组SNP芯片的具体挑选流程如下:
1.基于重测序信息,选取100份陆地棉材料间MAF>10%的1,372,195个SNPs多态位点,用于SNP芯片开发的初始SNP集合。
2.利用选择的SNP位点,回帖参考基因组,完成原始基因型的准确率鉴定,选择准确率>99.12%的位点。通过repeat-masker寻找重复区域,过滤掉位于重复区域的SNP位点。综合上述分析,过滤后得到1,089,201个SNP位点。
3.通过模拟产生了24倍基因组覆盖,pair-end长度为120bp的reads数据。进一步和基因组比对检测每个基因位点的覆盖度。分别去掉位于染色体间重复区域内的12,385个SNP位点,以及覆盖度未达到24倍的基因位点。过滤后得到899,913个SNP位点。
4.通过实际的重测序覆盖度信息,进一步检测每个位点的覆盖度。发现大部分位点的覆盖率长度在331bp。我们选取覆盖率在231bp到431bp之间的SNP。得到了620,065个SNP位点。
5.由于芯片的探针长度为50bp左右,因此选择SNP位点两侧50bp内没有其他多态位点,且目标SNP也不在Indel区域内的SNP位点。过滤后得到619,979个位点。
6.由于棉花是常异花授粉作物,一些位点杂合率比较高,杂合位点在芯片中难以区分。因此基于重测序数据,去掉杂合率大于15%的位点。得到339,537个位点。
7.通过聚类分析,对于得到的339,537个位点,计算每个多态性位点的多态性值(π)。利用正态分布去掉显著性高于平均值5%的多态性位点和低于5%的多态性位点。利用随机抽样的方法,从339,537点中按照染色体比例抽取160,000个点形成一个数集。重复10000次。对抽样形成的数据集,计算个体相互之间的平均差异程度、最小差异程度和方差。选取10000次中平均差异最高,最小差异度在所有排名最高5%,同时方差也在排名最小20%以内的样本集作为最后的结果。最后筛选出175,192万个SNP位点作为定制SNP芯片的候选位点,送Illumina公司对探针位点进行打分评判。
8.根据探针设计分值,选取基因区>0.7,基因间区>0.9,且在基因组中间距>2500bp的SNP位点,最终确定82,259个位点用于后期芯片点制。
按照上述步骤筛选,最后获得82,259个SNP位点,将这些位点对应的DNA序列提交Illumina公司点制芯片,根据探针序列合成82,259种微珠,将该芯片命名为CottonSNP80K。该芯片可同时检测24个样品,更适宜于陆地棉种内SNP分型检测。也可用于海岛棉等其他棉种的种内及种间基因分型分析。
实施例2CottonSNP80K陆地棉全基因组SNP芯片在棉花材料SNP分型中的应用
1.DNA的提取及质量检测:利用CTAB法提取棉花幼嫩叶片全基因组DNA,用1%的琼脂糖凝胶电泳及紫外分光光度仪,检测DNA的浓度及完整性。保证每个样本满足以下条件:260/280在1.7~2.1之间,样品浓度>50ng/μL,总DNA>1μg,无大分子污染,无降解。
2.芯片检测:用Illumina iScan芯片扫描仪,按照标准的Protocol进行操作。
3.数据统计分析:利用Illumina官方软件(GenomeStudio)的基因分型模块,结合手动调点检测,完成原始数据的分型。
实施例3CottonSNP80K陆地棉全基因组SNP芯片在不同棉花种质资源指纹分型中的应用
利用本发明CottonSNP80K芯片对我国三大棉区不同来源的344个棉花材料,编号为1~344,其中342份为陆地棉材料,2份为海岛棉材料。按照实施例2的方法进行芯片检测及SNP分型分析。344个棉花材料名称见附表2,材料间的聚类图见附图3。具体表现如下:
1.每张芯片可同时检测24个样本,在供试的82,259个位点中,实际点到芯片中的位点数为77,774个(94.55%)。
2.在344个棉花材料中,位点的平均检出率为99.37%;共有59,324个位点呈现多态性,占总位点的76.44%。利用该芯片,检测到海岛棉和陆地棉种间的多态率>30%。如:TM-1与Hai7124间多态率为31.10%,TM-1与军海1号间多态率为31.21%。
3.在遗传背景相似的陆地棉材料间也存在大量的多态位点。如:遗传背景相似的新乡小吉无绒无絮与新乡小吉无绒有絮基因组间多态率为15.35%,徐州142无绒无絮与徐州142野生型基因组间多态率为17.51%,7235品系与7235品系突变体基因组间多态率为20.56%;陆地棉遗传标准系TM-1与系列陆地棉纤维发育突变体材料(SL1-7-1、MD-17、N1、n2及T586等)基因组间的多态率在22.17-31.86%之间;纤维突变体材料imim与TM-1基因组间的多态率为21.89%。上述鉴定结果远远高于前期利用SSR位点检测到的多态率,如imim
与TM-1基因组间的SSR标记多态率为1.28%(Wang et al,2012),表明利用CottonSNP80K芯片可以很好的区分遗传背景相似的陆地棉材料。
4.芯片具有很好的重复性。为了检测芯片的重复性,检测了3个转基因受体材料W0的不同单株,2个陆地棉遗传标准系TM-1的不同单株,及不同来源的中12及徐州142各两份不同单株材料。结果表明,3个W0单株间检测到的位点完全相同,2个TM-1单株间检测到的位点也完全相同,两个不同来源的中12单株间一致性为95.24%,两个不同来源的徐州142单株间的一致性为90.43%。表明CottonSNP80K芯片具有很好的重复性及微小差异位点检测能力。
综上所述,CottonSNP80K芯片上的SNP位点具有广泛的适用性,良好的重复性,高效差异检测能力。因此,CottonSNP80K芯片非常适用于建立棉花品种指纹数据库,进行品种间亲缘关系的鉴定及辅助育种材料选择等研究。
实施例4CottonSNP80K陆地棉全基因组SNP芯片在棉花重要农艺性状关联分析中的应用
选取实施例3中242个陆地棉品种SNP分型结果。结合前期测定的三年三点9个不同环境下纤维品质性状数据进行棉花全基因组纤维品质性状关联分析。对分型结果进行质控,去掉MAF<0.05以及基因型类型为1的位点,最终选取54,408个多态SNP位点用于目标性状关联分析,获得与纤维品质显著关联,且重复性好的位点,进一步用于目标性状基因精细定位及克隆研究。例如,通过关联分析,在染色体A11上检测到与纤维强度显著关联的一个SNP区间(附图4)。
本发明的SNP芯片,包含染色体位置明确的82,259个SNP位点,用于棉花品种/材料快速、高通量、低成本的SNP分型。可以应用于重要农艺性状的关联分析及定位研究、棉花种质资源指纹分型分析、育种材料进行前景及背景选择研究,开展分子设计育种以及开发棉花育种芯片等,均具有重要的经济价值及应用前景。
附表1:100份重测序陆地棉材料信息
附表2:用于芯片检测的344份棉花材料信息
Claims (13)
- 一种棉花全基因组SNP位点集合,包含82,259个SNP位点,每个SNP位点包含两个不同碱基变异位点,用于检测该位点的等位基因变化,其特征在于:所述的SNP位点位于如SEQ ID NO:1-SEQ ID NO:82,259所示核苷酸序列的第61位。
- 一组用于检测棉花全基因组SNP位点集合的探针,其特征在于所述探针的核苷酸序列如SEQ ID NO:1-SEQ ID NO:82,259所示,所述的SNP位点位于如SEQ ID NO:1-SEQ ID NO:82,259所示核苷酸序列的第61位。
- 一种用于检测棉花全基因组SNP位点集合的芯片,其特征在于:所述的芯片含有一套用于检测相应SNP位点的核苷酸探针;所述核苷酸探针的序列如SEQ ID NO:1-SEQ ID NO:82,259所示,能够用于相应SNP位点基因分型。
- 根据权利要求3所述的芯片,其特征在于:所述的SNP位点位于如SEQ ID NO:1-SEQ ID NO:82,259所示核苷酸序列的第61位。
- 根据权利要求3所述的芯片,其特征在于:所述的基因分型,其实验步骤包括:1)制作基因分型核苷酸探针和试剂;2)在基因分型系统上把探针和样本杂交并扫描,获得所分析样本在所述SNP位点处的基因型。
- 权利要求1所述的棉花全基因组SNP位点集合在制备棉花全基因组SNP芯片中的应用。
- 权利要求2所述的探针在制备棉花全基因组SNP芯片中的应用。
- 权利要求2所述的探针在棉花种质资源指纹图谱构建、棉花杂交后代基因型鉴定、棉花全基因组关联分析、棉花品种身份鉴定或棉花育种材料选择中的应用。
- 权利要求3~5所述的芯片在棉花种质资源指纹图谱构建中的应用。
- 权利要求3~5所述的芯片在棉花杂交后代基因型鉴定中的应用。
- 权利要求3~5所述的芯片在棉花全基因组关联分析中的应用。
- 权利要求3~5所述的芯片在棉花品种身份鉴定中的应用。
- 权利要求3~5所述的芯片在棉花育种材料选择中的应用。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2016/105001 WO2018085971A1 (zh) | 2016-11-08 | 2016-11-08 | 棉花全基因组snp芯片及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108779459A true CN108779459A (zh) | 2018-11-09 |
CN108779459B CN108779459B (zh) | 2022-09-09 |
Family
ID=62108985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680077963.9A Active CN108779459B (zh) | 2016-11-08 | 2016-11-08 | 棉花全基因组snp芯片及其应用 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108779459B (zh) |
WO (1) | WO2018085971A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110643629A (zh) * | 2019-09-19 | 2020-01-03 | 湖北省农业科学院经济作物研究所 | 一种基于野生种质的优质棉花材料创制方法 |
CN111004861A (zh) * | 2020-01-09 | 2020-04-14 | 中国农业科学院棉花研究所 | 与陆地棉生态适应性关联的snp分子标记及其应用 |
CN111690765A (zh) * | 2020-07-03 | 2020-09-22 | 中国农业科学院棉花研究所 | 棉花纤维伸长率主效QTL qFE-chr.D04区间的分子标记及应用 |
CN113308562A (zh) * | 2021-05-24 | 2021-08-27 | 浙江大学 | 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用 |
WO2022198939A1 (zh) * | 2021-03-23 | 2022-09-29 | 浙江大学 | 一个同时改良棉花纤维长度、强度、伸长率的b3转录因子基因及其应用 |
CN116004898A (zh) * | 2022-12-23 | 2023-04-25 | 广东省农业科学院作物研究所 | 一种花生40K液相SNP芯片PeanutGBTS40K及其应用 |
CN116240305A (zh) * | 2022-12-27 | 2023-06-09 | 石河子大学 | 一种鉴定棉花矮生自封顶性状的分子标记组合及其应用和方法 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3902815A4 (en) * | 2018-12-27 | 2022-10-05 | Corteva Agriscience LLC | METHODS AND COMPOSITIONS FOR SELECTING AND/OR PREDICTING COTTON PLANTS RESISTANT TO FUSARIUM RACE-4 RESISTANCE IN COTTON |
CN112430678A (zh) * | 2019-08-26 | 2021-03-02 | 江苏省农业科学院 | 用于鉴定棉花品种的InDel分子标记组合及其开发方法和应用 |
CN112322775B (zh) * | 2020-12-07 | 2022-06-28 | 河北省农林科学院粮油作物研究所 | 一个鉴定陆地棉衣分的snp分子标记 |
CN113832243B (zh) * | 2021-08-30 | 2022-05-17 | 广东省农业科学院茶叶研究所 | 基于kasp技术开发的用于茶树品种鉴定的核心snp标记 |
CN114410815A (zh) * | 2021-12-31 | 2022-04-29 | 石河子大学 | 一种新疆陆地棉品种指纹图谱的构建方法 |
CN114525353B (zh) * | 2022-01-14 | 2023-10-20 | 西北农林科技大学 | 一种16K小麦全基因组mSNP区段组合、基因芯片及应用 |
CN115679012B (zh) * | 2022-10-18 | 2023-07-04 | 武汉市农业科学院 | 一种辣椒全基因组SNP-Panel及其应用 |
CN116463445B (zh) * | 2023-03-24 | 2024-04-30 | 西南大学 | 一种柑橘全基因组40k液相芯片及应用 |
CN116525000B (zh) * | 2023-07-04 | 2023-09-26 | 北京市农林科学院 | 兼容多荧光信号平台的农作物品种基因型分型方法及装置 |
CN116790807B (zh) * | 2023-08-17 | 2024-05-28 | 中国农业科学院棉花研究所 | 陆地棉d12号染色体与耐盐关联的snp分子标记及其应用 |
CN117821650B (zh) * | 2024-01-11 | 2024-06-11 | 武汉市农业科学院 | 一种芋全基因组SNP-Panel及其应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105368830A (zh) * | 2015-11-19 | 2016-03-02 | 中国农业科学院棉花研究所 | 基于kasp技术开发的用于棉花杂交种鉴定的核心snp标记 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140255922A1 (en) * | 2007-06-14 | 2014-09-11 | Monsanto Technology Llc | Cotton polymorphisms and methods of genotyping |
CN105349537A (zh) * | 2015-12-02 | 2016-02-24 | 中国农业科学院棉花研究所 | 陆地棉snp标记及其应用 |
-
2016
- 2016-11-08 CN CN201680077963.9A patent/CN108779459B/zh active Active
- 2016-11-08 WO PCT/CN2016/105001 patent/WO2018085971A1/zh active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105368830A (zh) * | 2015-11-19 | 2016-03-02 | 中国农业科学院棉花研究所 | 基于kasp技术开发的用于棉花杂交种鉴定的核心snp标记 |
Non-Patent Citations (1)
Title |
---|
AMANDA M. HULSE-KEMP ET.AL.,: "Development of a 63K SNP Array for Cotton and High-Density Mapping of Intraspecific and Interspecific Populations of Gossypium spp.", 《G3-GENES GENOMES GENETICS》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110643629A (zh) * | 2019-09-19 | 2020-01-03 | 湖北省农业科学院经济作物研究所 | 一种基于野生种质的优质棉花材料创制方法 |
CN111004861A (zh) * | 2020-01-09 | 2020-04-14 | 中国农业科学院棉花研究所 | 与陆地棉生态适应性关联的snp分子标记及其应用 |
CN111004861B (zh) * | 2020-01-09 | 2022-10-21 | 中国农业科学院棉花研究所 | 与陆地棉生态适应性关联的snp分子标记及其应用 |
CN111690765A (zh) * | 2020-07-03 | 2020-09-22 | 中国农业科学院棉花研究所 | 棉花纤维伸长率主效QTL qFE-chr.D04区间的分子标记及应用 |
WO2022198939A1 (zh) * | 2021-03-23 | 2022-09-29 | 浙江大学 | 一个同时改良棉花纤维长度、强度、伸长率的b3转录因子基因及其应用 |
CN113308562A (zh) * | 2021-05-24 | 2021-08-27 | 浙江大学 | 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用 |
CN113308562B (zh) * | 2021-05-24 | 2022-08-23 | 浙江大学 | 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用 |
CN116004898A (zh) * | 2022-12-23 | 2023-04-25 | 广东省农业科学院作物研究所 | 一种花生40K液相SNP芯片PeanutGBTS40K及其应用 |
CN116240305A (zh) * | 2022-12-27 | 2023-06-09 | 石河子大学 | 一种鉴定棉花矮生自封顶性状的分子标记组合及其应用和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108779459B (zh) | 2022-09-09 |
WO2018085971A1 (zh) | 2018-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108779459A (zh) | 棉花全基因组snp芯片及其应用 | |
CN109825621B (zh) | 小麦小穗数qtl连锁的snp分子标记及其应用 | |
CN105008599B (zh) | 水稻全基因组育种芯片及其应用 | |
CN102747138B (zh) | 一种水稻全基因组snp芯片及其应用 | |
CN109735652B (zh) | 小麦抗条锈病基因QYr.nwafu-6BL.2的连锁KASP分子标记、引物及应用 | |
CN112481275B (zh) | 一种小麦抗条锈病基因yrZ15-1370及其分子标记和应用 | |
CN112593007B (zh) | 一种与小麦粒长qtl连锁的snp分子标记及应用 | |
CN110724758B (zh) | 一种基于snp标记鉴定京农科728玉米杂交种纯度的方法 | |
CN114774570B (zh) | 与小麦茎基腐病抗性qtl紧密连锁的分子标记及应用 | |
Wang et al. | Establishment and application of an SNP molecular identification system for grape cultivars | |
CN113122651B (zh) | 与莲根状茎膨大性状主效qtl位点连锁的snp分子标记及应用 | |
CN113637789A (zh) | 小麦抗条锈病基因YrTD121连锁的KASP分子标记及引物、试剂盒和应用 | |
CN108165656A (zh) | 小麦分子标记及其在鉴定小麦白粉病抗性中的应用 | |
CN108179220B (zh) | 小麦矮秆基因Rht12紧密连锁的KASP标记及其应用 | |
CN112779350A (zh) | 与小麦小穗粒数QTLQGns.sicau-2D紧密连锁的分子标记及其应用 | |
CN104789648B (zh) | 鉴定水稻CMS恢复基因Rf‑1区段单倍型的分子标记及其应用 | |
CN108456740A (zh) | 一个水稻稻瘟病抗性位点‘Pi-jx’及其Indel标记引物和育种应用 | |
CN116790797A (zh) | 与小麦粒重相关的kasp引物组及其应用 | |
CN111647677A (zh) | 与小麦籽粒灌浆速率QTL QGfr.sicau-6D紧密连锁的分子标记及应用 | |
CN113736866B (zh) | 用于检测番茄黄化曲叶病毒病抗性的snp位点组合及其应用 | |
CN113215297B (zh) | 一个与芝麻含油量主效qtl位点紧密连锁的分子标记id0159及其应用 | |
CN109439788A (zh) | 与小麦株高主效基因位点紧密连锁的kasp分子标记及其应用 | |
CN111118192B (zh) | 小麦穗基部小穗结实性主效qtl的kasp分子标记及其应用 | |
CN111100946B (zh) | 一种油菜粒重性状主效基因位点的分子标记引物及应用 | |
CN108060247B (zh) | 一种与陆地棉8号染色体纤维强度相关的单体型 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |