CN115612751A - 西瓜全基因组液相芯片及应用 - Google Patents
西瓜全基因组液相芯片及应用 Download PDFInfo
- Publication number
- CN115612751A CN115612751A CN202211332209.9A CN202211332209A CN115612751A CN 115612751 A CN115612751 A CN 115612751A CN 202211332209 A CN202211332209 A CN 202211332209A CN 115612751 A CN115612751 A CN 115612751A
- Authority
- CN
- China
- Prior art keywords
- watermelon
- liquid phase
- chip
- whole genome
- snp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/6895—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
- C12Q1/6837—Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/13—Plant traits
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Analytical Chemistry (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Mycology (AREA)
- Botany (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种西瓜全基因组液相芯片及应用,该芯片的基因分型对象包括6062个SNP位点,所述SNP位点是将不同基因型西瓜种质的重测序数据比对至西瓜参考基因组“97103_V2”后,进行过滤、评估获得,采用本发明制备的西瓜全基因组液相芯片对西瓜样品进行快速的基因分型,能够应用于西瓜种质资源的遗传多样性分析、品种的快速鉴定、基因定位和分子辅助育种,有助于缩短西瓜育种周期,推动西瓜新品种选育进程。
Description
技术领域
本发明属于分子生物学技术领域,具体涉及西瓜全基因组液相芯片及应用。
背景技术
西瓜,葫芦科一年生蔓生草本植物,起源于非洲,在我国广泛种植。由于西瓜种植周期短,经济效益好,西瓜产业已发展为多地的特色产业,助力乡村振兴。近年来,随着测序技术的发展,西瓜完成了de-nove测序并且公布了大量的重测序数据及分子标记,为我们提供了海量、丰富的遗传信息,然而这些大量的遗传信息很难直接应用到西瓜的实际育种工作中。尽管目前在西瓜中开发了大量的SSR标记,CAPS标记,然而将这些分子标记应用到实际的育种工作中需要较高的技术要求、较高的使用成本以及繁琐的过程,同时该过程选择效率较低,缺乏灵活性,限制了其在西瓜育种中的大规模应用。因此,目前急需一种新的基因分型技术提高西瓜育种中的选择效率,推动西瓜分子育种的发展。
单核苷酸多态性(SNP)在基因组中分布广、数量多、便于筛查及基因分型,具有十分重要的生物学意义,被认为是当前最佳的标记。目前,SNP标记已经成为生物种群鉴定、遗传结构分析、基因定位、基因组选择的重要工具。随着高通量测序技术的发展,对于有参考基因组的物种来说,基于全基因组测序及简化基因组测序的方法成为高通量SNP基因分型技术的主流。然而该技术对于相关数据的管理、分析具有较高的要求,同时成本相对较高。靶向捕获测序基因型分型,通过对已知序列设计探针、开发芯片,利用随机打断的基因组DNA片段与芯片混合,捕获西瓜高通量测序文库中的包含目标位点的DNA片段进行扩增、纯化、高通量测序。以一种降低文库丰度的方式实现对大量目标位点的深度测序,能够降低相关数据的分析及管理难度,并且能够显著降低基因分型的成本。然而该技术在西瓜中尚未展开应用。
简化基因组测序技术(Genotyping of Sequencing,GBS),是一项在多种农作物中广泛应用的技术,通过对全基因组DNA进行限制性酶切,对部分DNA片段进行测序以获得相关基因组序列。而靶向捕获测序技术(Genotyping By Target Sequencing,GBTS)是一种特殊的测序式基因型检测,通过挑选特定的靶向测序位点,进行测序和基因型检测。GenoBaits是GBTS的一种应用,即通过将基于全基因组分析获得的多态性位点进一步设计为特异性探针,通过探针与测序文库结合,再通过测序进行基因分型。该技术相较于传统的固态芯片还具有多个优势,检测成本较低;开发的SNP芯片密度可以灵活调整;可以随时补充新的位点、升级灵活;未来可针对不同的使用场景及使用需求,采用不同组合的芯片,即可检测。然而该项技术尚未有大规模的应用,在葫芦科作物中也鲜有报道。
发明内容
本发明的目的在于提供一种西瓜全基因组液相芯片及应用,采用本发明的液相芯片可以实现对西瓜种质资源的快速分型,解决了现用的大量遗传信息不能应用到实际育种的问题。
为了实现上述目的,本发明的技术方案概述如下:
一种西瓜全基因组液相芯片,该芯片为基于靶向捕获测序的西瓜6K液相基因芯片,所述西瓜6K液相芯片由独立包装的西瓜6K探针混合液和杂交捕获试剂构成,所述西瓜6K探针为DNA双链探针,是根据所筛选的SNP位点设计并合成的核苷酸序列。所述SNP位点是利用BWA-mem将43份不同基因型西瓜种质的重测序数据比对至西瓜参考基因组“97103_V2”上,利用GATK_V_4.0进行SNP calling并进一步对SNP位点进行评估、过滤。筛选MAF>0.2,Het>0.15,Na>0.1的SNP位点作为初步的SNP库。进一步通过判定SNP位点侧翼序列是否适合设计探针进行进一步的筛选,筛选的标准为:探针长度为110-120bp,探针的CG含量为30-80%,同源性区域个数≤5,探针的区域内不包含SSR位点和GAP区域。最终共获得了112K的覆盖基因组的多态性SNP位点,我们以均匀分布的原则,从中选择了5968个SNP作为西瓜6K液相基因芯片的检测位点。Yang等通过对247份西瓜的重测序数据进行分析,挖掘到了241个核心SNP,通过进一步的分析,选择了94个适合合成探针的SNP作为检测位点。最终,我们共挑选了6062个SNP位点并进一步开发为西瓜6K液相基因芯片。以期缩短西瓜育种的周期,提高西瓜育种的效率。具体地,6062个SNP位点的位置如表1所示。
表1 6062个SNP位点在西瓜参考基因组序列“97103_V2”中的位置
在设计、筛选相关探针时,尽量使SNP位点能够均匀分布于全基因组中。同时尽量选择了在43份材料中多态性较为丰富的SNP位点(MAF>0.2,超过3000个SNP位点>0.3),尽可能保证位点多态性及探针的特异性。
本发明的优点:
(1)本发明提供的西瓜6K液相基因芯片能够应用于西瓜的基础研究和分子育种中,能够同时对6062个位点进行检测,其数量、密度及效率均是目前报道西瓜中最高的。
(2)本发明为西瓜的遗传多样性分析,品种鉴定,基因定位,背景筛选及分子标记辅助育种提供了一项高效的基因组分型工具。同时根据现有研究,本发明可随时根据新的位点设计新的探针,同时对于样品量没有较高要求,以满足使用人不同的使用场景及使用需求,在西瓜分子育种中具有较高的应用价值。
附图说明
图1为西瓜6K液相基因芯片6062个位点分布统计情况;图1A为6062个位点在全基因组中的分布;图1B为6062个位点在不同染色体中的统计;图1C为6062个SNP位点的最小等位基因频率。
图2为西瓜6K液相基因芯片及SSR标记对于背景回复率的计算结果比较;
图3为实施例中利用西瓜6K液相基因芯片对76份西瓜种质进行群体结构的分析。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但下述实施例中所涉及的具体实验方法如无特殊说明,均为常规方法或按照制造厂商说明书建议的条件实施。
若未特别指明,实施例中所用技术手段为本领域技术人员所熟知的常规手段。下述实施例中的试验方法,如无特别说明,均为常规方法。如无特殊说明,所采用的试剂及材料,均可以从市场中购买获得。
除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明中。文中所述的较佳实施方法与材料仅作示范之用。
实施例1西瓜6K液相芯片的开发
在设计、筛选相关探针时,尽量使SNP位点能够均匀分布于全基因组中(图1A,图1B)。同时尽量选择了在43份材料中多态性较为丰富的SNP位点(MAF>0.2,超过3000个SNP位点>0.3)(图1C),尽可能保证位点多态性及探针的特异性。
以35份东亚生态型及北美生态型的栽培材料的重测序数据和本实验室完成的8份材料的重测序数据为主要的分析对象(表2)。利用BWA-mem将原始读长比对至西瓜参考基因组“97103_V2”之上,同时利用GATK进行SNP calling、合并、过滤。以MAF>0.2,Het>0.15,Na>0.1为筛选标准,共获得了260K SNP位点,以探针长度为110-120bp,探针的CG含量为30-80%,同源性区域个数≤5,探针的区域内不包含SSR位点和GAP区域。最终共获得了112K的覆盖基因组的多态性SNP位点,以均匀分布的原则,我们首先挑选了5968个SNP作为检测位点。然后从Yang报道的241个核心SNP中挑选出94个SNP位点加入到检测位点中。最终,该西瓜液相基因芯片共有6062个SNP位点(见上表1)。
表2用于开发液相基因芯片的43份西瓜种质材料
实施例2近等基因系背景回复率的检测
(一)检测群体的获得
以WT4和WM102分别为轮回亲本和供体亲本,构建Cldw-1的近等基因系(Near Iso-genic Lines,NIL),创制西瓜短蔓新种质材料。以本实验室Zhu et al.(2019)发表文章中“A Single Nucleotide Deletion in an ABC Transporter Gene Leads to a DwarfPhenotype in Watermelon”报道与短蔓性状共分离的dCAPS标记作为前景标记,双亲杂交获得F1代,然后进一步与WT4回交得到BC1F1代群体。随后利用与短蔓基因Cldw1共分离标记和100个多态并均匀分布在全基因组上的SSR标记对BC1F1代群体进行筛选,筛选出杂合显性基因型中回复率最高的个体,与WT4回交获得BC2F1代群体。对于BC2F1代群体,筛选步骤与BC1F1代群体相同,选取杂合子个体中回复率最高的植株进行自交,获得BC2F2代群体,最后通过共分离dCAPS标记及背景筛选获得短蔓表型同时背景回复率最高的单株。
(二)样品的检测
(1)检测样品的选择
1.亲本材料WT4、WM102;
2.纯合隐性群体中随机选取的3个单株。
(2)DNA提取
采集在子叶期尚未展开的幼嫩叶片,采用改良的CTAB法提取其DNA。
(3)构建高质量西瓜测序文库、文库杂交及数据处
1.本实例所使用的试剂全部来自于石家庄博瑞迪生物技术有限公司的GenoBaitts DNA-seq Library Prep试剂盒。在上述步骤(1)获得的西瓜DNA 200ng按照试剂盒说明进行相关操作,主要由以下4步:(i)DNA片段化,(ii)修复DNA片段末端并加入A尾,(iii)将接头与DNA片段进行连接,(iv)扩增DNA片段构建文库。
2.文库杂交,主要有以下五个步骤:(i)将探针、DNA文库及缓冲液放入管中,并置于PCR仪上,65℃处理16h,(ii)加入MyOneTM Streptavidin C1和缓冲液捕获结合片段,(iii)将获得的片段进行扩增,(iv)使用Beckman AMPure Beads对扩增片段进行纯化,(v)使用qubit and qPCR对文库进行检测,并使用illumina HiSeq X对捕获片段进行测序。
3.数据处理。首先对测序数据进行质控,其次将质控后的数据比对至西瓜参考基因组97103V2之上,随后利用GATK对不同样品的SNP位点进行检测,最后获得所有样品的SNP位点数据。
(三)结果分析
我们前期已经利用100个SSR作为背景选择标记对这3个单株进行了分析,结果显示它们的背景回复率分别为97.5%、97%和97%。我们在本实验中利用包含6062个SNP位点的液相芯片对几个单株的分析显示,有2102个位点在双亲中具有多态性,可用于背景回复率检测。我们进一步分析了这2102个SNP位点在3个检测单株中的基因型,从而计算出它们的背景回复率分别为95.03%、95.03%和94.98%。这些结果说明我们构建的6K液相芯片对于西瓜近等基因系的背景回复率检测结果是可靠的,而且由于检测的背景位点更多,说明利用液相芯片具有更高的分辨率和准确性,也证明了其分子育种上的利用价值。
实施例3 76份西瓜种质资源的群体遗传分析
为了探究西瓜液相基因芯片的应用方向,我们利用西瓜液相基因芯片对76份来自不同地区不同类型的西瓜种质进行基因分型。76份西瓜种质包括67份栽培西瓜种质和9份非栽培西瓜种质(表3)。对于获得的所有种质的SNP位点,我们利用Admixture对76个样本的遗传结构进行分析。通过测试,我们发现共有5个亚群存在于76个样本之中。在K=3时,其中一个亚群包含了9份非栽培西瓜种质和2个来自津巴布韦的栽培种质,另外两个亚群主要是起源于亚洲的栽培西瓜种质和起源于非亚洲区域的栽培西瓜种质。当K=4时,起源于亚洲的栽培西瓜种质进一步分为红色果肉栽培种质和黄色果肉栽培种质。当K=5时,另一个亚群分为起源于北美的栽培西瓜种质和非起源于北美的栽培种质(图3)。其次我们使用VCF2Dis对76个样本的遗传距离进行计算,并进一步通过FastMe2.0和ITOL对相关结果进行优化,同样发现在这76个样本中主要分为5个亚群,与Admixture结果符合。此外,我们利用Plink对所有样本的SNP位点进行了主成分分析,其中PC1和PC2分别能解释26.02%和22.36%的数据变异,结果显示5个亚群是分开聚集的,且红色果肉的东亚栽培种质和黄色果肉的东亚栽培种质具有较高的重叠,也说明了他们之间的亲缘关系更为接近。
表3 76份西瓜种质资源来源
以上所述之实施例,只是本发明的较佳实施例而已,仅仅用以解释本发明,并非限制本发明实施范围,对于本技术领域的技术人员来说,当然可根据本说明书中所公开的技术内容,通过置换或改变的方式轻易做出其它的实施方式,故凡在本发明的原理上所作的变化和改进等,均应包括于本发明申请专利范围内。
Claims (5)
2.根据权利要求1所示的西瓜全基因组液相芯片,其特征在于:所述SNP位点是将不同基因型西瓜种质的重测序数据比对至西瓜参考基因组“97103_V2”后,进行过滤、评估获得的。
3.根据权利要求1所示的西瓜全基因组液相芯片,其特征在于:所述芯片为基于靶向捕获测序的西瓜6K液相芯片。
4.权利要求1中所述的西瓜全基因组液相芯片在西瓜种质资源的遗传多样性分析、品种鉴定、基因定位和分子辅助育种方面的应用。
5.根据权利要求4所述的应用,其特征在于,利用所述西瓜全基因组液相芯片对西瓜样品进行快速的基因分型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211332209.9A CN115612751A (zh) | 2022-10-27 | 2022-10-27 | 西瓜全基因组液相芯片及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211332209.9A CN115612751A (zh) | 2022-10-27 | 2022-10-27 | 西瓜全基因组液相芯片及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115612751A true CN115612751A (zh) | 2023-01-17 |
Family
ID=84876117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211332209.9A Pending CN115612751A (zh) | 2022-10-27 | 2022-10-27 | 西瓜全基因组液相芯片及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115612751A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116452155A (zh) * | 2023-06-14 | 2023-07-18 | 内蒙古盛健农牧业工程技术研究有限公司 | 一种高产奶山羊快速育种的智能化构建系统 |
-
2022
- 2022-10-27 CN CN202211332209.9A patent/CN115612751A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116452155A (zh) * | 2023-06-14 | 2023-07-18 | 内蒙古盛健农牧业工程技术研究有限公司 | 一种高产奶山羊快速育种的智能化构建系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112094937B (zh) | 花生a06染色体上与荚果和种子大小相关的snp分子标记及其应用 | |
CN108998550B (zh) | 用于水稻基因分型的snp分子标记及其应用 | |
CN113308562B (zh) | 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用 | |
CN107090504B (zh) | 用于玉米基因分型的snp分子标记组合及其应用 | |
CN107090494B (zh) | 与谷子码粒数性状相关的分子标记及其检测引物和应用 | |
WO2020118883A1 (zh) | 一种梅花垂枝性状紧密连锁的snp分子标记及其检测方法与应用 | |
CN110846429A (zh) | 一种玉米全基因组InDel芯片及其应用 | |
Ma et al. | RNA-seq-mediated transcriptome analysis of a fiberless mutant cotton and its possible origin based on SNP markers | |
CN115198023A (zh) | 一种海南黄牛液相育种芯片及其应用 | |
CN112289384A (zh) | 一种柑橘全基因组kasp标记库的构建方法及应用 | |
CN114182041B (zh) | 一种与油菜每子房胚珠数关联的parms分子标记及应用 | |
CN115612751A (zh) | 西瓜全基因组液相芯片及应用 | |
CN108642201B (zh) | 与谷子株高性状相关的snp标记及其检测引物和应用 | |
CN117106967A (zh) | 水稻抗稻瘟病基因的功能性kasp分子标记及其应用 | |
Austin et al. | Next-generation mapping of genetic mutations using bulk population sequencing | |
CN107447022B (zh) | 一种预测玉米杂种优势的snp分子标记及应用 | |
CN107365873B (zh) | 与谷子叶鞘色性状连锁的分子标记及其应用 | |
CN113789407B (zh) | 一种用于油莎豆基因分型的snp分子标记组合及其应用 | |
Iorizzo et al. | Carrot molecular genetics and mapping | |
CN116004898A (zh) | 一种花生40K液相SNP芯片PeanutGBTS40K及其应用 | |
Meilan et al. | Forest genomics and biotechnology | |
Hyten | Genotyping Platforms for Genome-Wide Association Studies: Options and Practical Considerations | |
CN115992292B (zh) | 一种甘蓝型油菜snp分子标记组合及其应用 | |
CN117305503B (zh) | 用于柑橘基因型鉴定的20k液相芯片及其应用 | |
Saleem et al. | High-throughput sequencing and SNP markers-based identification of sugarcane cultivars for parentage determination and intellectual property protection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |