CN113308562A - 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用 - Google Patents

棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用 Download PDF

Info

Publication number
CN113308562A
CN113308562A CN202110564410.9A CN202110564410A CN113308562A CN 113308562 A CN113308562 A CN 113308562A CN 202110564410 A CN202110564410 A CN 202110564410A CN 113308562 A CN113308562 A CN 113308562A
Authority
CN
China
Prior art keywords
cotton
detection
site
dna
single nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110564410.9A
Other languages
English (en)
Other versions
CN113308562B (zh
Inventor
胡艳
司占峰
韩泽刚
方磊
张天真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202110564410.9A priority Critical patent/CN113308562B/zh
Publication of CN113308562A publication Critical patent/CN113308562A/zh
Application granted granted Critical
Publication of CN113308562B publication Critical patent/CN113308562B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Botany (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种棉花全基因组40K单核苷酸位点及其在棉花基因分型中的应用,其中棉花全基因组40K单核苷酸位点通过基于三个群体重测序获得的VCF文件,以棉花基因组TM‑1_V2.1为参考,对数据中的位点信息进行初步筛选目标区段,然后再合成目标区段对应的探针。通过选取13个棉花品种进行数据测试,选取13个陆地棉材料,包括1个野生种、1个半野生种和11个栽培种进行芯片检测。根据检测结果,优先挑选均一性好的目标区域,并保证整体的均匀分布。最终筛选获得40K单核苷酸位点。本发明位点的应用可以极大提高基因型检测准确度、提高检测水平,降低检测成本,并为棉花分子育种提供重要的技术支撑。

Description

棉花全基因组40K单核苷酸位点及其在棉花基因分型中的 应用
技术领域
本发明涉及遗传学、分子生物学、生物信息学和棉花分子育种领域,更具体涉及棉花全基因40K单核苷酸位点及其在棉花基因分型中的应用。
背景技术
分子检测是生物遗传变异分析的重要手段。理想的分子检测是在个体和群体水平上对生物进行完整检测,如全基因组测序。尽管随着分子检测技术的发展,检测成本呈指数降低,但生物体的全信息分子检测在信息处理和分析上仍然面临重大的挑战。因此,以点带面、基于分子标记的遗传变异检测技术仍然是一种简便、高效、低成本的分子检测手段。分子标记技术就是采用分布在生物基因组上的每个标记作为靶标,测定特定基因组位点和区域的相关基因型变异,简称基因型检测,从而在整体上代表全基因组水平的遗传变异。从20世纪以蛋白质(主要是同工酶)作为分子标记开始,分子标记技术在数量、种类、通量、分析成本等方面均发生一系列革命性的变化,并在应用生物学的许多领域得到日益广泛的应用。
分子标记辅助选择所主导的分子育种,在国际跨国种业公司早已成为与常规育种技术密切整合的重要育种手段。大型跨国种业公司凭借其完整的产业链、巨大的体量、高昂的研发投入和较高的市场占有率,发展了可以高效利用分子标记检测系统支撑其育种流程的平台、技术和方法。一套完整分子育种技术和平台可以为其在世界各地的育种中心提供统一的支撑,在极大地降低成本的同时,也提高了平台的运转和使用效率。然而,在中小育种公司和发展中国家,因为小而分散的育种活动,无法建立起高效低成本的分子标记辅助育种体系,成为制约分子育种的重要瓶颈因素。
单核苷酸多态性(Single Nucleotide Polymorphism,SNP)指基因组单个核苷酸的变异,是由单个核苷酸对置换、颠换、插入或缺失所形成的变异形式。单核苷酸多态性作为第三代遗传标记,SNP数量众多、分布密集、易于检测,是较理想的基因分型目标。纵观分子标记技术的革新,以DNA序列变异为基础的单核苷酸多态性(SNP),已经接近在分子水平进行变异检测的终极标准。预期今后若干年分子检测技术和平台的发展大致是在此基础上进行提升和改进。因此,高效、低成本的SNP基因型检测技术成为发展共享技术和平台的最佳选择。
基于SNP的靶向测序基因型检测(genotyping by target sequencing,GBTS)技术就是要从浩瀚的基因组DNA中,挑选特定的靶向位点,进行测序和基因型检测。由于GBTS技术能够通过不同平台在不同实验室稳定地获得相同的SNP标记,为检测数据的累积、共享、比较和整合提供了简单可靠的技术平台。这种靶向或固定的简化基因组测序大大减少了DNA测序量,简化了生物信息分析和数据处理,提高了对各种基因型检测平台的适应性。因此我们推测,GBTS将成为未来很长一段时间基因型检测的首选。
GBTS技术工作原理是基于目标探针与靶向序列互补结合进行定点捕获。首先对要测试的材料进行gDNA文库构建。同时根据DNA互补原理,在每个待测位点设计覆盖目标SNP的探针,采用生物素(Biotin)标记对目标探针进行标记。然后,在液态中利用生物素标记的目标探针与基因组目标区域杂交形成双链。随后利用链霉亲和素包衣的磁珠对携有生物素标记的目标探针进行分子吸附,从而捕获与探针杂交的靶点。最后,对捕获的靶点序列进行洗脱、靶点扩增、建库和测序,最终获得目标SNP的基因型。
GBTS技术不需要借助于特定的昂贵设备,而可以采用多种测序平台,包括目前三种主流的测序平台Illumina、Ion Torrent和MGI。与高密度分子标记技术——固相芯片相比,GenoBaits标记开发技术简便,开发、测试、验证的成本远低于传统的固相芯片。GBTS检测的最终成本将低于KASP、TaqMan、琼脂糖电泳、HRM、Agena等技术。该技术适用于所有的生物物种,包括各种动物、植物和微生物。除了适用于大宗动植物以外,特别适合于研究基础较差、基因组学信息较为匮乏的物种。对于其他分子检测系统应用难度较大的物种,如多倍体物种,GenoBaits的特异性好,可进行特异的基因组捕获。该技术适合所有标记位点的检测,包括功能已知位点(如已克隆的基因)、功能未知位点(候选基因)以及中性位点。该检测系统标记数量的可塑性为各种应用提供了巨大弹性空间,基本上适合需要不同标记数量的全部场景,如标记辅助的主基因选择、回交育种及其背景选择、多基因聚合育种、种子纯度检测、转基因成份鉴定等。
基于GBTS技术的单核苷酸液相基因芯片已经在玉米、水稻、大豆中开发和筛选利用,但在棉花中还没有这类芯片的报道。随着棉花全基因组测序的完成和重测序技术的开展,SNP位点的开发取得了重要的进展,通过对棉花品种群体重测序,筛选出数百万的SNP位点,这些位点在全基因组关联分析、遗传图谱构建和QTL定位中有重要价值。
发明内容
本发明的目的在于使棉花基因组研究成果得到利用,满足棉花高通量、低成本基因分型以及进一步大规模商业化育种需求,提供了棉花全基因组40K单核苷酸位点,用于全基因组液相基因芯片的开发和棉花基因分型。
其中,所述基因芯片采用液相芯片,基于液相探针捕获技术,设计并合成一套包含40K位点信息、可用于检测棉花背景位点的芯片。
本发明所用的液相芯片技术体系为GenoBaits技术体系。工作原理是基于目标SNP标记设计的探针与检测样本的DNA进行靶向序列互补结合以及测序,从而达到对检测样本的目标SNP标记基因型检测的目的。
本发明提供了一组棉花全基因组40K单核苷酸位点,其编号是A01_43040_G-D13_64244630_T(具体参见实施方式)。其中,位点编号中左侧A01~D11表示位点所在的染色体,中间数值表示位点在染色体上的位置,右侧表示该位点在参考基因组TM-1中的SNP碱基。
上述棉花全基因组40K单核苷酸位点的筛选,具体方法为:基于三个群体重测序获得的VCF文件(Fang等.Genomic analyses in cotton identify signatures ofselection and loci associated with fiber quality and yield traits.Naturegenetics,2017,49(7):1089;Liu等.Association mapping of seed oil and proteincontents in upland cotton.Euphytica,2015,205(2):637-645;Han等),以棉花基因组TM-1_V2.1(Hu等.Gossypiumbarbadense and Gossypiumhirsutum genomes provideinsights into the origin and evolution of allotetraploid cotton.Naturegenetics,2019,51(4):739-748.)为参考,对数据中的位点信息进行初步筛选。筛选标准为:
1.挑选参数:最小等位基因频率(MAF)>0.01、杂合<30%,缺失率<50%,将符合挑选条件的全部位点作为候选位点,最终筛选出122K的候选区段;
2.补充122K候选区段的空洞区域,优先使用mSNP区段进行补充,但因整体的NA比例较高,无法挑选出符合挑选参数的目标区段,因此再次放宽NA和杂合标准,筛选符合需求的候选区段和SNP;
3.将122K候选区段和补空洞的全部候选区段、SNP位点进行合并,最终共计214K目标区段;
4.按照均匀分布的原则优先筛选平均多肽信息含量(PIC)值高的,或者区段内目标SNP的MAF值大的,同时考虑我们的区段评分(评分参数GC碱基含量≥30%,同源区域个数≤5),综合考虑选择候选区段内的最优区段作为目的区段,共筛选出90K目标区段。
5.合成90K目标区段对应的探针,选取13个棉花品种进行数据测试,筛选到57K的目标区段,除去7362个共同的缺失位点,最终的选取了40K目标位点,共计50568个。
6.选取13个陆地棉材料,包括1个野生种、1个半野生种和11个栽培种进行芯片检测。根据检测结果,优先挑选均一性好的目标区域,并保证整体的均匀分布。最终筛选出40071个准确、稳定的位点。
上述棉花全基因组40K单核苷酸位点可在棉花基因分型中的应用,即通过检测棉花中40K单核苷酸位点的基因型。检测获得的基因型可用于构建棉花DNA指纹数据库、对棉花种植资源进行类群划分等,具体如下:
分别提取用于构建棉花DNA指纹数据库或待进行类群划分的所有棉花品种的基因组DNA;
检测所有棉花品种的基因组DNA中40K单核苷酸位点的基因型,所得基因型数据即构成棉花DNA指纹数据库;根据所得基因型数据即可对棉花种植资源进行类群划分。
进一步地,采用探针检测棉花中40K单核苷酸位点。
本发明还提供了一种检测所述一组棉花全基因组40K单核苷酸位点的探针在制备棉花基因分型芯片中的应用。
本发明位点的应用可以极大提高基因型检测准确度、提高检测水平,降低检测成本,并为棉花分子育种提供重要的技术支撑。
附图说明
图1棉花40K目标位点均匀分布图。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述。
实施例1、棉花40K单核苷酸位点用于棉花基因芯片的制备。
40K棉花基因芯片的制备,具体方法为:通过构建文库、杂交捕获、文库质检与测序分析,最终确定40K目标位点。
1. 13个棉花品种的文库构建
在0.2μL PCR管中加入100ng棉花DNA,GenoBaits End Repair Buffer 4μL,GenoBaits End repair Enzyme 3.1μL,用水补足20μL;将反应管置于PCR仪中,37℃20min,72℃20min。再加入GenoBaits Ultra DNA ligase 2μL,GenoBaits Ultra DNA LigaseBuffer 8μL,GenoBaits Adapter 2μL,Nuclease-free water 8μL,置于PCR仪中22℃60min。加入1.2倍的GenoPrep DNA Clean Beads,充分混匀,置于磁力架上,静置3min,移除上清。加入100μL新鲜配制的80vol%乙醇。室温孵育30秒,移除上清。晾干至乙醇全部挥发,加入体系GenoBaits PCR Master Mix 10μL、GenoBaitsUni_oligo 1μL、GenoBaits DNAindex 5μL、Nuclease-free water 4μL。重悬磁珠,置于PCR仪中,98℃2min;98℃30s、65℃30s、72℃40s 6-8个循环。72℃4min。
之后加入20μL GenoPrep DNA Clean Beads,充分混匀静置5min,移除上清,加入100μL新鲜配制的80vol%乙醇。室温孵育30s,移除上清。加入30μL Tris-HCl重悬文库,充分混匀,置于磁力架上,静置3min,取出上清溶液得到DNA文库。
2.文库杂交捕获
将纯化后13个棉花品种(附表2)的DNA文库进行等量混合,进行杂交,65℃杂交2h。使用不同的wash buffer对杂交后的文库进行洗脱。将洗脱下来的目标文库进一步富集,以期获得足够量的文库用于上机;对富集后的文库进行纯化,获得最终文库。
3.文库质检与测序
利用QubitFluorometric Quantitation(Thermo Fisher)对最终文库DNA浓度进行测定,利用琼脂糖凝胶电泳检测文库DNA的片段大小是否在350-400bp之间。构建好的文库利用华大测序仪进行测序。
4.测试数据分析
使用13个棉花测试样本对第一次合成的90K探针进行测试。根据测试结果进行位点挑选,优先挑选均一性和多态性好的目标区段,最终挑选出57K的目标区段。根据检测结果,第二次合成探针对13个材料进行测序,根据测试结果优先挑选均一性好的目标区域,并保证整体的均匀分布。最终筛选出40K位点用于液相芯片制备。图1为40K位点在染色体上的分布。表1为40K核心位点编号,位点编号中左侧A01~D11表示位点所在的染色体,中间数值表示位点在染色体上的位置,右侧表示该位点在参考基因组TM-1中的核苷酸序列。
附表1、40K核心位点信息
Figure BDA0003080363180000051
Figure BDA0003080363180000061
Figure BDA0003080363180000071
Figure BDA0003080363180000081
Figure BDA0003080363180000091
Figure BDA0003080363180000101
Figure BDA0003080363180000111
Figure BDA0003080363180000121
Figure BDA0003080363180000131
Figure BDA0003080363180000141
Figure BDA0003080363180000151
Figure BDA0003080363180000161
Figure BDA0003080363180000171
Figure BDA0003080363180000181
Figure BDA0003080363180000191
Figure BDA0003080363180000201
Figure BDA0003080363180000211
Figure BDA0003080363180000221
Figure BDA0003080363180000231
Figure BDA0003080363180000241
Figure BDA0003080363180000251
Figure BDA0003080363180000261
Figure BDA0003080363180000271
Figure BDA0003080363180000281
Figure BDA0003080363180000291
Figure BDA0003080363180000301
Figure BDA0003080363180000311
Figure BDA0003080363180000321
Figure BDA0003080363180000331
Figure BDA0003080363180000341
Figure BDA0003080363180000351
Figure BDA0003080363180000361
Figure BDA0003080363180000371
Figure BDA0003080363180000381
Figure BDA0003080363180000391
Figure BDA0003080363180000401
Figure BDA0003080363180000411
Figure BDA0003080363180000421
Figure BDA0003080363180000431
Figure BDA0003080363180000441
Figure BDA0003080363180000451
Figure BDA0003080363180000461
Figure BDA0003080363180000471
Figure BDA0003080363180000481
Figure BDA0003080363180000491
Figure BDA0003080363180000501
Figure BDA0003080363180000511
Figure BDA0003080363180000521
Figure BDA0003080363180000531
Figure BDA0003080363180000541
Figure BDA0003080363180000551
Figure BDA0003080363180000561
Figure BDA0003080363180000571
Figure BDA0003080363180000581
Figure BDA0003080363180000591
Figure BDA0003080363180000601
Figure BDA0003080363180000611
Figure BDA0003080363180000621
Figure BDA0003080363180000631
Figure BDA0003080363180000641
Figure BDA0003080363180000651
Figure BDA0003080363180000661
Figure BDA0003080363180000671
Figure BDA0003080363180000681
Figure BDA0003080363180000691
Figure BDA0003080363180000701
Figure BDA0003080363180000711
Figure BDA0003080363180000721
Figure BDA0003080363180000731
Figure BDA0003080363180000741
Figure BDA0003080363180000751
Figure BDA0003080363180000761
Figure BDA0003080363180000771
Figure BDA0003080363180000781
Figure BDA0003080363180000791
Figure BDA0003080363180000801
Figure BDA0003080363180000811
Figure BDA0003080363180000821
Figure BDA0003080363180000831
Figure BDA0003080363180000841
Figure BDA0003080363180000851
Figure BDA0003080363180000861
Figure BDA0003080363180000871
Figure BDA0003080363180000881
Figure BDA0003080363180000891
Figure BDA0003080363180000901
Figure BDA0003080363180000911
Figure BDA0003080363180000921
Figure BDA0003080363180000931
Figure BDA0003080363180000941
Figure BDA0003080363180000951
Figure BDA0003080363180000961
Figure BDA0003080363180000971
Figure BDA0003080363180000981
Figure BDA0003080363180000991
Figure BDA0003080363180001001
Figure BDA0003080363180001011
Figure BDA0003080363180001021
Figure BDA0003080363180001031
Figure BDA0003080363180001041
Figure BDA0003080363180001051
Figure BDA0003080363180001061
Figure BDA0003080363180001071
Figure BDA0003080363180001081
Figure BDA0003080363180001091
Figure BDA0003080363180001101
Figure BDA0003080363180001111
Figure BDA0003080363180001121
Figure BDA0003080363180001131
Figure BDA0003080363180001141
Figure BDA0003080363180001151
Figure BDA0003080363180001161
Figure BDA0003080363180001171
Figure BDA0003080363180001181
Figure BDA0003080363180001191
Figure BDA0003080363180001201
Figure BDA0003080363180001211
Figure BDA0003080363180001221
Figure BDA0003080363180001231
Figure BDA0003080363180001241
Figure BDA0003080363180001251
Figure BDA0003080363180001261
Figure BDA0003080363180001271
Figure BDA0003080363180001281
Figure BDA0003080363180001291
Figure BDA0003080363180001301
Figure BDA0003080363180001311
Figure BDA0003080363180001321
Figure BDA0003080363180001331
Figure BDA0003080363180001341
Figure BDA0003080363180001351
Figure BDA0003080363180001361
Figure BDA0003080363180001371
Figure BDA0003080363180001381
Figure BDA0003080363180001391
Figure BDA0003080363180001401
Figure BDA0003080363180001411
Figure BDA0003080363180001421
Figure BDA0003080363180001431
本发明所提供的棉花40K单核苷酸位点可应用于制备基因芯片进行棉花基因分型,这些位点的应用可以极大提高基因型检测准确度、提高检测水平,降低检测成本,并为棉花分子育种提供重要的技术支撑。
实施例2、棉花40K单核苷酸液相基因芯片在棉花基因分型中的应用。
发明人选取了包含陆地棉遗传标准系TM-1、美棉、半野生棉、我国长江流域、黄河流域、西北内陆三个棉区骨干亲本等共13个四倍体棉花品种材料,利用实施例1制备的40K棉花基因芯片检测这13个品种材料在实施例1所述40K单核苷酸位点的基因型。13个品种材料位点检出率为98.62~99.96%。通过参考基因组(TM-1)位点与芯片检测位点进行比较,检出位点一致性为99.40%。
附表2、13个棉花品种资源
Figure BDA0003080363180001432
Figure BDA0003080363180001441
整个实验流程是基于GenoBaits技术体系完成的。具体实验流程如下:
1.提取待测样本的基因组DNA,并构建样品文库;
1.1样品DNA提取
采用CTAB法对样本DNA进行提取。
1.2样品DNA质检
将测试样品DNA,用QubitFluorometric Quantitation(Thermo Fisher)对DNA浓度进行测定,用1%琼脂糖凝胶电泳检测DNA的完整性。检测合格的样品放入4℃冰箱,保存、备用。
1.3样品DNA片段化
取12μL质检合格的DNA放置于0.2μLPCR管中,将管置于超声波破碎仪中对DNA进行随机物理破碎,片段破碎至200-400bp。
1.4样品末端修复
向管中加入4μLGenoBaits End Repair Buffer(GenoBaits,即石家庄博瑞迪生物科技有限公司)和2.7μLGenoBaits End Repair Enzyme,补水至20μL,放入ABI 9700 PCR仪中37℃温育20分钟,完成破碎片段的末端修复和加A过程。
1.5样品测序接头连接
从PCR仪中取出小管加入2μLGenoBaits Ultra DNA ligase、8μLGenoBaits UltraDNA Ligase Buffer和2μLGenoBaits Adapter,补水至40μL,然后放置于ABI9700 PCR仪上22℃反应30分钟,完成测序接头的连接。
1.6样品DNA纯化
向连接产物中加入48μL的BeackmanAMPure XP Beads(Beackman公司)对连接产物进行纯化,纯化后采用磁珠进行片段筛选,保留插入片段在200~300bp的连接产物。
1.7样品文库扩增
向上一步的PCR管中加入5μL带有Barcode序列的测序接头、1μLP5接头、10μLGenoBaits PCR Master Mix,并用纯水补至20μL;用ABI 9700PCR仪进行扩增,扩增程序为:95℃预变性5min,95℃变性30s,60℃退火30s,72℃延伸30s;重复2-4步,共8个循环;72℃延伸5min。不同的Barcode用于区分不同的样品。
1.8样品文库纯化
向第二轮PCR产物中加入24μLBeckmenAMPure XP Beads(Beackman公司),用移液器上下吸打均匀后,将0.2μL的PCR管置于磁力架上至溶液澄清,弃去上清并用75vol%乙醇洗涤磁珠一次,用pH值为8.0的Tris-HCl将文库DNA洗脱下来获得样品文库。
2.利用液相基因芯片测定目标样品在40K SNP位点的基因型
2.1 DNA杂交
取500ng已完成构建的样品基因组DNA测序文库,加入5μLGenoBaits Block I和2μLGenoBaits Block II,置于Eppendorf Concentrator plus(Eppendorf公司)真空浓缩仪上,在≤70℃的温度下蒸干至干粉。向干粉管中加入8.5μLGenoBaits 2×Hyb Buffer、2.7μLGenoBaitsHyb Buffer Enhancer、2.8μLNuclease-Free Water,用移液器吸打混匀后放置于ABI 9700PCR仪上95℃温育10分钟,然后取出PCR管加入3μL已经合成的探针(探针的浓度为60ng/μL),旋涡震荡混匀后放置于ABI 9700PCR仪上65℃温育2小时,完成探针杂交反应。
2.2 DNA捕获
向上一步杂交完成的反应体系中加入100μLGenoBaits DNA Probe Beads,上下吸打10次,放入ABI 9700PCR仪上65℃温育45分钟,使磁珠与探针结合。用100μLGenoBaitsWash Buffer I、150μLGenoBaits Wash BufferII分别对结合探针后的磁珠进行65℃热洗,然后再用100μLGenoBaits Wash Buffer I、150μLGenoBaits Wash Buffer II(和150μLGenoBaits Wash Buffer III分别对磁珠进行常温洗涤。洗涤完成的磁珠用20μLNuclease-Free Water进行重悬。
取13μL重悬后的DNA(带磁珠)加入到新的0.2mL PCR管中,然后加入15μLGenoBaits PCR Master Mix、2μLGenoBaits Primer Mix配置post-PCR体系,用ABI9700PCR仪进行文库扩增,扩增程序为:95℃预变性5min,95℃变性30s,60℃退火30s,72℃延伸30s;重复2-4步,共15个循环;72℃延伸5min。
向post-PCR产物中加入45μLBeckmenAMPure XP Beads(Beackman公司)并用移液器上下吸打均匀,然后将0.2mL PCR管置于磁力架上至溶液澄清,弃去上清并用75vol%乙醇洗涤磁珠两次,用pH为8.0的Tris-HCl将文库DNA洗脱下来。完成探针的杂交捕获工作。
2.3 DNA杂交捕获文库质检
用QubitFluorometric Quantitation(Thermo Fisher)对文库的DNA浓度进行测定,然后用琼脂糖凝胶电泳检测文库DNA的片段大小是否在300-400bp之间。
2.4 DNA杂交捕获文库测序
将构建好的DNA文库用华大MGISEQ2000测序仪进行测序。
2.5基因型数据分析
测序数据经过FastQC(www.bioinformatics.babraham.ac.uk/project)质控后,用BWA(bio-bwa.sourceforge.net)的默认参数将测序数据比对到参考基因组上,用GATK(software.broadinstitute.org/gatk)软件对测序数据进行SNP鉴定,对探针捕获测序的基因型分型信息进行提取,形成最终的基因型分型结果,所得基因型数据即构成13个棉花品种的DNA指纹数据库。对基因型分型结果进行分析,如附表3所示。附表4是TM-1芯片位点检测情况与基因组序列一致性评估结果,其准确率高达99.4%。
附表3、40K单核苷酸液相基因芯片在13个棉花品种材料中的基因分型结果
材料名称 检出位点数 检出率% 缺失位点数 缺失率%
TM-1 39975 99.76% 96 0.24%
86-1 39583 98.78% 488 1.22%
中棉所7号 39998 99.82% 73 0.18%
中棉所12号 40054 99.96% 17 0.04%
岱字棉15 39975 99.76% 96 0.24%
军棉1号 39901 99.58% 170 0.42%
泗棉2号 39981 99.78% 90 0.22%
泗棉3号 39598 98.82% 473 1.18%
斯字棉2B 39759 99.22% 312 0.78%
石远321 40022 99.88% 49 0.12%
新陆早42号 39899 99.57% 172 0.43%
阔叶棉 39669 99.00% 402 1.00%
尤卡坦棉 39518 98.62% 553 1.38%
附表4芯片位点检测情况与基因组序列(TM-1v2.1,cotton.zju.edu.cn)一致性评估
Figure BDA0003080363180001461

Claims (3)

1.一组棉花全基因组40K单核苷酸位点在棉花基因分型中的应用,其特征在于,位点信息具体如下:
Figure FDA0003080363170000011
Figure FDA0003080363170000021
Figure FDA0003080363170000031
Figure FDA0003080363170000041
Figure FDA0003080363170000051
Figure FDA0003080363170000061
Figure FDA0003080363170000071
Figure FDA0003080363170000081
Figure FDA0003080363170000091
Figure FDA0003080363170000101
Figure FDA0003080363170000111
Figure FDA0003080363170000121
Figure FDA0003080363170000131
Figure FDA0003080363170000141
Figure FDA0003080363170000151
Figure FDA0003080363170000161
Figure FDA0003080363170000171
Figure FDA0003080363170000181
Figure FDA0003080363170000191
Figure FDA0003080363170000201
Figure FDA0003080363170000211
Figure FDA0003080363170000221
Figure FDA0003080363170000231
Figure FDA0003080363170000241
Figure FDA0003080363170000251
Figure FDA0003080363170000261
Figure FDA0003080363170000271
Figure FDA0003080363170000281
Figure FDA0003080363170000291
Figure FDA0003080363170000301
Figure FDA0003080363170000311
Figure FDA0003080363170000321
Figure FDA0003080363170000331
Figure FDA0003080363170000341
Figure FDA0003080363170000351
Figure FDA0003080363170000361
Figure FDA0003080363170000371
Figure FDA0003080363170000381
Figure FDA0003080363170000391
Figure FDA0003080363170000401
Figure FDA0003080363170000411
Figure FDA0003080363170000421
Figure FDA0003080363170000431
Figure FDA0003080363170000441
Figure FDA0003080363170000451
Figure FDA0003080363170000461
Figure FDA0003080363170000471
Figure FDA0003080363170000481
Figure FDA0003080363170000491
Figure FDA0003080363170000501
Figure FDA0003080363170000511
Figure FDA0003080363170000521
Figure FDA0003080363170000531
Figure FDA0003080363170000541
Figure FDA0003080363170000551
Figure FDA0003080363170000561
Figure FDA0003080363170000571
Figure FDA0003080363170000581
Figure FDA0003080363170000591
Figure FDA0003080363170000601
Figure FDA0003080363170000611
Figure FDA0003080363170000621
Figure FDA0003080363170000631
Figure FDA0003080363170000641
Figure FDA0003080363170000651
Figure FDA0003080363170000661
Figure FDA0003080363170000671
Figure FDA0003080363170000681
Figure FDA0003080363170000691
Figure FDA0003080363170000701
Figure FDA0003080363170000711
Figure FDA0003080363170000721
Figure FDA0003080363170000731
Figure FDA0003080363170000741
Figure FDA0003080363170000751
Figure FDA0003080363170000761
Figure FDA0003080363170000771
Figure FDA0003080363170000781
Figure FDA0003080363170000791
Figure FDA0003080363170000801
Figure FDA0003080363170000811
Figure FDA0003080363170000821
Figure FDA0003080363170000831
Figure FDA0003080363170000841
Figure FDA0003080363170000851
Figure FDA0003080363170000861
Figure FDA0003080363170000871
Figure FDA0003080363170000881
Figure FDA0003080363170000891
Figure FDA0003080363170000901
Figure FDA0003080363170000911
Figure FDA0003080363170000921
Figure FDA0003080363170000931
Figure FDA0003080363170000941
Figure FDA0003080363170000951
Figure FDA0003080363170000961
Figure FDA0003080363170000971
Figure FDA0003080363170000981
Figure FDA0003080363170000991
Figure FDA0003080363170001001
Figure FDA0003080363170001011
Figure FDA0003080363170001021
Figure FDA0003080363170001031
Figure FDA0003080363170001041
Figure FDA0003080363170001051
Figure FDA0003080363170001061
Figure FDA0003080363170001071
Figure FDA0003080363170001081
Figure FDA0003080363170001091
Figure FDA0003080363170001101
Figure FDA0003080363170001111
Figure FDA0003080363170001121
Figure FDA0003080363170001131
Figure FDA0003080363170001141
Figure FDA0003080363170001151
Figure FDA0003080363170001161
Figure FDA0003080363170001171
Figure FDA0003080363170001181
Figure FDA0003080363170001191
Figure FDA0003080363170001201
Figure FDA0003080363170001211
Figure FDA0003080363170001221
Figure FDA0003080363170001231
Figure FDA0003080363170001241
Figure FDA0003080363170001251
Figure FDA0003080363170001261
Figure FDA0003080363170001271
Figure FDA0003080363170001281
Figure FDA0003080363170001291
Figure FDA0003080363170001301
Figure FDA0003080363170001311
Figure FDA0003080363170001321
Figure FDA0003080363170001331
Figure FDA0003080363170001341
Figure FDA0003080363170001351
Figure FDA0003080363170001361
Figure FDA0003080363170001371
Figure FDA0003080363170001381
Figure FDA0003080363170001391
其中,位点编号中左侧A01~D11表示位点所在的染色体,中间数值表示位点在染色体上的位置,右侧表示该位点在参考基因组TM-1中的SNP碱基。参考基因组TM-1的全基因组序列的版本号为TM-1v2.1,cotton.zju.edu.cn。
2.根据权利要求1所述的应用,其特征在于,通过检测棉花中40K单核苷酸位点对棉花进行基因分型。
3.根据权利要求2所述的应用,其特征在于,采用探针检测棉花中40K单核苷酸位点。
CN202110564410.9A 2021-05-24 2021-05-24 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用 Active CN113308562B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110564410.9A CN113308562B (zh) 2021-05-24 2021-05-24 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110564410.9A CN113308562B (zh) 2021-05-24 2021-05-24 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用

Publications (2)

Publication Number Publication Date
CN113308562A true CN113308562A (zh) 2021-08-27
CN113308562B CN113308562B (zh) 2022-08-23

Family

ID=77374376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110564410.9A Active CN113308562B (zh) 2021-05-24 2021-05-24 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用

Country Status (1)

Country Link
CN (1) CN113308562B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113755631A (zh) * 2021-09-29 2021-12-07 石家庄博瑞迪生物技术有限公司 一种基于mSNP技术检测西葫芦种子纯度的混样检测方法
CN114292924A (zh) * 2021-12-31 2022-04-08 中国农业科学院特产研究所 梅花鹿全基因组snp分子标记组合、snp芯片及应用
CN114525353A (zh) * 2022-01-14 2022-05-24 西北农林科技大学 一种16K小麦全基因组mSNP区段组合、基因芯片及应用
CN114657238A (zh) * 2022-03-19 2022-06-24 宁夏农林科学院枸杞科学研究所 一种枸杞40k液相芯片及应用
CN114807410A (zh) * 2022-03-19 2022-07-29 西北农林科技大学 一种大麦40k snp液相芯片
CN116004898A (zh) * 2022-12-23 2023-04-25 广东省农业科学院作物研究所 一种花生40K液相SNP芯片PeanutGBTS40K及其应用
CN113755631B (zh) * 2021-09-29 2024-05-24 石家庄博瑞迪生物技术有限公司 一种基于mSNP技术检测西葫芦种子纯度的混样检测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102747138A (zh) * 2012-03-05 2012-10-24 中国种子集团有限公司 一种水稻全基因组snp芯片及其应用
CN105349537A (zh) * 2015-12-02 2016-02-24 中国农业科学院棉花研究所 陆地棉snp标记及其应用
US20160153056A1 (en) * 2013-02-07 2016-06-02 China National Seed Group Co., Ltd. Rice whole genome breeding chip and application thereof
CN108004344A (zh) * 2017-12-20 2018-05-08 中国农业科学院作物科学研究所 一种玉米全基因组snp芯片及其应用
CN108779459A (zh) * 2016-11-08 2018-11-09 南京农业大学 棉花全基因组snp芯片及其应用
CN110050092A (zh) * 2016-12-08 2019-07-23 中国种子集团有限公司 水稻全基因组育种芯片及其应用
CN111088382A (zh) * 2019-11-28 2020-05-01 北京市农林科学院 一种玉米全基因组snp芯片及其应用
CN112575116A (zh) * 2020-12-31 2021-03-30 中国科学院东北地理与农业生态研究所 一种大豆全基因组snp位点组合、基因芯片及应用

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102747138A (zh) * 2012-03-05 2012-10-24 中国种子集团有限公司 一种水稻全基因组snp芯片及其应用
US20160153056A1 (en) * 2013-02-07 2016-06-02 China National Seed Group Co., Ltd. Rice whole genome breeding chip and application thereof
CN105349537A (zh) * 2015-12-02 2016-02-24 中国农业科学院棉花研究所 陆地棉snp标记及其应用
CN108779459A (zh) * 2016-11-08 2018-11-09 南京农业大学 棉花全基因组snp芯片及其应用
CN110050092A (zh) * 2016-12-08 2019-07-23 中国种子集团有限公司 水稻全基因组育种芯片及其应用
CN108004344A (zh) * 2017-12-20 2018-05-08 中国农业科学院作物科学研究所 一种玉米全基因组snp芯片及其应用
CN111088382A (zh) * 2019-11-28 2020-05-01 北京市农林科学院 一种玉米全基因组snp芯片及其应用
CN112575116A (zh) * 2020-12-31 2021-03-30 中国科学院东北地理与农业生态研究所 一种大豆全基因组snp位点组合、基因芯片及应用

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CAIPING CAI等: "High-density 80 K SNP array is a powerful tool for genotyping G. hirsutum accessions and genome analysis", 《BMC GENOMICS》 *
SEN WANG等: "Sequence-based ultra-dense genetic and physical maps reveal structural variations of allopolyploid cotton genomes", 《GENOME BIOLOGY》 *
XIANTAO AI等: "Genetic diversity and structure of elite cotton germplasm (Gossypium hirsutum L.) using genome-wide SNP data", 《GENETICA》 *
姜洪真等: "全基因组关联分析(GWAS)在作物农艺性状研究中的应用", 《农业生物技术学报》 *
王琼: "棉花SSR与SNP分子标记开发及陆地棉重要性状全基因组关联分析", 《中国博士学位论文全文数据库(农业科技辑)》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113755631A (zh) * 2021-09-29 2021-12-07 石家庄博瑞迪生物技术有限公司 一种基于mSNP技术检测西葫芦种子纯度的混样检测方法
CN113755631B (zh) * 2021-09-29 2024-05-24 石家庄博瑞迪生物技术有限公司 一种基于mSNP技术检测西葫芦种子纯度的混样检测方法
CN114292924A (zh) * 2021-12-31 2022-04-08 中国农业科学院特产研究所 梅花鹿全基因组snp分子标记组合、snp芯片及应用
CN114292924B (zh) * 2021-12-31 2023-07-14 中国农业科学院特产研究所 梅花鹿全基因组snp分子标记组合、snp芯片及应用
CN114525353A (zh) * 2022-01-14 2022-05-24 西北农林科技大学 一种16K小麦全基因组mSNP区段组合、基因芯片及应用
CN114525353B (zh) * 2022-01-14 2023-10-20 西北农林科技大学 一种16K小麦全基因组mSNP区段组合、基因芯片及应用
CN114657238A (zh) * 2022-03-19 2022-06-24 宁夏农林科学院枸杞科学研究所 一种枸杞40k液相芯片及应用
CN114807410A (zh) * 2022-03-19 2022-07-29 西北农林科技大学 一种大麦40k snp液相芯片
CN116004898A (zh) * 2022-12-23 2023-04-25 广东省农业科学院作物研究所 一种花生40K液相SNP芯片PeanutGBTS40K及其应用

Also Published As

Publication number Publication date
CN113308562B (zh) 2022-08-23

Similar Documents

Publication Publication Date Title
CN113308562B (zh) 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用
US9976191B2 (en) Rice whole genome breeding chip and application thereof
Kanazin et al. Discovery and assay of single-nucleotide polymorphisms in barley (Hordeum vulgare)
AU2019101778A4 (en) Method for constructing rice molecular marker map based on Kompetitive Allele Specific PCR and application in breeding Using the same
CN107090495B (zh) 与谷子脖长性状相关的分子标记及其检测引物和应用
CN113584216B (zh) 小麦粒重基因TaCYP78A16的KASP标记开发及其应用
CN113795597A (zh) 一种大豆snp分型检测芯片及其在分子育种与基础研究中的应用
Negi et al. Applications and challenges of microarray and RNA-sequencing
CN107090450B (zh) 与谷子穗长性状相关的分子标记及其检测引物和应用
CN113584215B (zh) 小麦白粉病抗性基因pmCH7015的KASP标记开发及其应用
WO2016036553A1 (en) Multiplexed pcr assay for high throughput genotyping
CN112852989B (zh) 一种与大豆农艺性状相关的snp位点组合、液相基因芯片及应用
Boopathi et al. Genotyping of mapping population
CN111471790B (zh) 与小麦籽粒灌浆速率QTL QGfr.sicau-7D.1紧密连锁的分子标记及应用
WO2023208078A1 (zh) 调控番茄果实可溶性固形物含量的基因组结构变异及相关产品和应用
CN115109843A (zh) 一种多个水稻性状控制基因变异检测功能标记方法
CN107365873B (zh) 与谷子叶鞘色性状连锁的分子标记及其应用
CN115612746A (zh) 一种用于肉鸡亲缘关系鉴定的靶向捕获测序芯片
CN108715901B (zh) 一种与谷子株高性状相关的snp标记及其检测引物和应用
CN112746121B (zh) 一种与大豆农艺性状相关的snp位点组合、基因芯片及应用
CN115927733B (zh) 分子标记及其应用
CN115161411A (zh) 一种菜豆全基因组snp位点组合及应用
CN117025786A (zh) 一种基于靶向捕获测序的细毛羊50k snp液相芯片及其应用
Hyten Genotyping Platforms for Genome-Wide Association Studies: Options and Practical Considerations
CN108728566B (zh) 与谷子千粒重性状相关的snp标记及其检测引物和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant