CN114657238B - 一种枸杞40k液相芯片及应用 - Google Patents

一种枸杞40k液相芯片及应用 Download PDF

Info

Publication number
CN114657238B
CN114657238B CN202210273849.0A CN202210273849A CN114657238B CN 114657238 B CN114657238 B CN 114657238B CN 202210273849 A CN202210273849 A CN 202210273849A CN 114657238 B CN114657238 B CN 114657238B
Authority
CN
China
Prior art keywords
medlar
sites
snp
site
liquid phase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210273849.0A
Other languages
English (en)
Other versions
CN114657238A (zh
Inventor
赵建华
曹有龙
唐建宁
安巍
李浩霞
尹越
牛锦凤
马利奋
王亚军
梁晓婕
黄文娥
罗青
张波
黄婷
万如
樊云芳
李彦龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute Of Wolfberry Science Ningxia Academy Of Agriculture And Forestry Sciences
Original Assignee
Institute Of Wolfberry Science Ningxia Academy Of Agriculture And Forestry Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute Of Wolfberry Science Ningxia Academy Of Agriculture And Forestry Sciences filed Critical Institute Of Wolfberry Science Ningxia Academy Of Agriculture And Forestry Sciences
Priority to CN202210273849.0A priority Critical patent/CN114657238B/zh
Publication of CN114657238A publication Critical patent/CN114657238A/zh
Application granted granted Critical
Publication of CN114657238B publication Critical patent/CN114657238B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于基因芯片技术领域,涉及一种枸杞40K液相芯片及应用,尤其涉及一种利用靶向捕获测序技术开发的用于枸杞基因组进行基因分型的枸杞40K液相芯片。该枸杞40K液相芯片,包括枸杞40K位点探针混合液和杂交捕获试剂;枸杞40K位点探针混合液包括枸杞40K SNP位点探针和165个枸杞SNP功能位点探针,平均每个位点2根捕获探针。该枸杞40K液相芯片,克服了枸杞在科研中遗传多样性分析、QTL定位、GWAS分析的应用成本高的缺点,解决了枸杞分子辅助育种、全基因组选择育种无适用产品的难题,加快了枸杞研究及育种的进程。

Description

一种枸杞40K液相芯片及应用
技术领域
本发明属于基因芯片技术领域,涉及一种枸杞40K液相芯片及应用,尤其涉及一种利用靶向捕获测序技术开发的用于枸杞基因组进行基因分型的枸杞40K液相芯片。
背景技术
传统分子标记如限制性片段长度多态性、简单序列重复等,因存在基因组分布数量少,以及操作过程繁琐、通量低等缺陷,导致无法满足现代化育种要求。单核苷酸多态性(SNP)具有数量多、分布广泛、易于快速规模化筛查、便于基因分型、价格相对低廉等特点,被广大科研工作者广泛接受并应用。
目前,用于SNP位点分型的基因芯片技术中,传统的固相芯片基于探针与DNA序列的互补杂交,通过标记物的荧光显色信号进行分型。液相芯片基于重测序技术,对每个目标位点进行专一性捕获,并进行高深度的重测序,具有检测准确性高、通量大的优点。液相芯片一般包括根据DNA互补原理,为每个待测位点设计的一条生物素(Biotin)标记、覆盖目标SNP的探针,这些探针在液态中与基因组目标区域杂交形成双链,可以利用链霉亲和素包衣的磁珠与带有生物素的分子的吸附作用,经洗脱、扩增、建库之后进行二代测序,最终还原目标位点及其周围SNP的基因型状态。液相芯片目前在物种进化分析、种质资源评价与DNA指纹鉴定、分子遗传图谱构建、基因/QTL定位和基因克隆、分子标记辅助选择、全基因组选择等方面已经有着较为成熟的应用。
国外的Affymetrix固相芯片技术、llumina固相芯片技术,均因开发成本高、使用价格贵、位点删减不灵活等因素,使广大科研工作者在使用过程中受到一定制约,且在其它已有固相芯片物种中也有被液相芯片取代的趋势。
靶向捕获测序基因型分型(GBTS)是通过降低文库丰度实现仅对目标位点深度重测序的技术,它能够显著降低基因分型的成本;分子辅助育种、基因组选择育种在其它物种中(如猪、奶牛、小麦等)已有应用案例且效果良好。然而,国内尚无已开发成熟的枸杞可用的基因分型芯片,因而,为提高枸杞育种效率、加快枸杞育种进程,更好的服务于枸杞产业化应用,开发一款经济、合适的基因分型产品相当有必要。
发明内容
本发明的目的在于提供一种枸杞40K液相芯片及应用,基于靶向捕获测序技术开发的枸杞基因型分型的高通量40K液相芯片,结合添加的165个功能位点,实现枸杞基因分型,并有效节省样本检测服务周期,为枸杞科研提供技术支持。
本发明解决上述技术问题的技术方案如下。
一种枸杞40K液相芯片,包括枸杞40K位点探针混合液和杂交捕获试剂;枸杞40K位点探针混合液包括枸杞40K SNP位点探针和165个枸杞SNP功能位点探针,平均每个位点2根捕获探针。
进一步地,该枸杞40K液相芯片,枸杞40K SNP位点中的5023个位点信息如说明书表1所示。
进一步地,该枸杞40K液相芯片,165个枸杞SNP功能位点的位点信息如说明书表2所示。
进一步地,该枸杞40K液相芯片,枸杞40K位点探针的设计过程为:
(1)探针长度110bp、探针GC含量在30%~80%之间、同源性区域个数≤5,选取区域最大限度地不包含SSR和GAP区域;
(2)根据筛选获得的SNP位点设计两条有60%~70%重叠且覆盖SNP位点的核苷酸序列;
(3)根据设计的核苷酸序列进行单链核苷酸合成,合成的两条长度为110bp,5’端带有生物素基团修饰的DNA核苷酸序列称为枸杞40K位点探针;
(4)将上述两条合成后的枸杞40K位点探针进行等摩尔质量混合,利用EDTA和TrisHCl混合液定容为3pmol/mL的枸杞40K位点探针混合液。
进一步地,该枸杞40K液相芯片,枸杞40K SNP位点通过下述方法获取:
(1)根据307个枸杞种质资源高深度重测序样本数据,通过BWA比对枸杞参考基因组后,利用GATK检测所有样本SNP位点的并集合位点,并筛选出若干个位点用于目标位点的挑选;按照位点挑选过滤的标准进行再次挑选,并将挑选之后的总集合进行探针评估;按照位点挑选过滤的标准进行再次挑选,并将挑选之后的总集合进行探针评估;其中,位点挑选过滤的标准为:MAF>0.03,NA<25%,杂合率<30%,基因注释优先级exonic>splicing>5'UTR>3'UTR>upstream>intronic>downstream>intergenic;若区段内位点均为无注释基因结构的位点,则优先考虑MAF最高的位点,否则优先考虑位于基因上的位点;
(2)将165个枸杞SNP功能标记与步骤(1)获得的标记总集合进行对比去重,去重后将剩余标记进行合并,得到用于探针评估开发的标记;
(3)探针评估时对位点进行挑选:舍弃上下游50bp在基因组上的序列是小写的重复序列区,计算剩余位点上下游各50bp的GC含量,保留大于30%、小于70%的目标位点作为候选集,并筛选出包含165个枸杞SNP功能位点的若干个位点;
(4)将染色体分为等长的区段,对设计出来的所有位点按每个区段挑选MAF≥0.035的候选位点,按染色体均匀分布和MAF值高的位点并加上所有功能位点共得到若干个位点,加上165个功能标记,作为第一次测试的45K位点集合;
(5)通过第一轮产品检测测试,删除分型表现差的5K位点,形成满足评估要求、且包含165个功能位点的核心位点的产品集合,并形成40K液相芯片;
(6)通过第二轮产品实验优化对样品进行检测测试,确定产品的最佳实验操作流程,经过验证使产品达到设计要求,并形成枸杞40K液相芯片最佳实验流程。
进一步地,该枸杞40K液相芯片,165个枸杞SNP功能位点通过下述方法获取:
(1)基于307份枸杞种质资源材料进行高深度重测序和SNP标记检测,通过BWA比对枸杞参考基因组后,利用GATK检测所有样本SNP位点的并集合位点,并筛选出若干个位点用于目标位点的挑选,按照位点挑选过滤的标准进行再次挑选,并将挑选之后的总集合进行探针评估;结合广靶代谢组表型进行全基因组关联分析,共获得糖候选、生物碱候选、大麦芽碱、有机酸候选、黄酮类、肉桂酰腐胺、丁香酸、对羟基苯乙酸邻鼠李糖甙、香豆素、Hydroxycinnamoyl衍生物、4-香豆酸、羟甲基黄酮5-O-己糖苷、花青素、咖啡酰酒石酸、东莨菪苷、脂类代谢物的关联的SNP位点105个;其中,全基因组关联分析的过程为,利用TASSELv5.0软件的混合线性模型得到显著关联SNP,公式计算为:y=Xα+Qβ+Kμ+e;通过STRUCTURE软件计算样品群体结构Q,通过SPAGeDi软件计算样品间亲缘关系K,X为基因型,y为表型,并使每个代谢物表型中每个SNP位点都得到一个关联值;通过Bonferroni校正后的阈值筛选,从而获得显著关联的105个SNP位点;
(2)以宁杞1号和云南枸杞为亲本杂交,构建F1分离群体用于农艺性状的QTL定位,共筛选步骤(1)中农艺性状的QTL区间内60个SNP位点作为功能位点;具体的,以宁杞1号和云南枸杞为亲本杂交,获得200个F1单株,对叶片长度、叶片宽度、叶形指数、果重、果实横经、果实纵径、果形指数进行连续三年表型考察;通过重测序开发全基因组SNP,具体为,通过BWA比对枸杞参考基因组后,利用GATK检测所有样本SNP位点的并集合位点,并筛选出若干个位点用于目标位点的挑选,按照位点挑选过滤的标准进行再次挑选,并将挑选之后的总集合进行探针评估;利用JoinMap构建包括8507个枸杞高质量SNP的遗传图谱,总遗传距离2122.24cM;再利用MapQTL进行表型性状的QTL定位获得相关表型的QTL,从QTL内部而筛选步骤(1)中农艺性状的60个SNP位点作为功能位点。
一种枸杞40K液相芯片可应用于枸杞遗传多样性分析、分子遗传图谱构建、全基因组关联分析、品种真实性鉴定、分子标记辅助选择育种、全基因组选择育种。
本发明枸杞40K液相芯片及应用的有益效果为:
(1)枸杞40K液相芯片的开发和使用,克服了枸杞在科研中遗传多样性分析、QTL定位、GWAS分析的应用成本高的缺点,解决了枸杞分子辅助育种、全基因组选择育种无适用产品的难题,加快了枸杞研究及育种的进程;
(2)目前基因分型芯片市场依然以Affymetrix、llumina两家美国公司的技术为主,其芯片产品的生产、检测平台、检测试剂等均需从美国进口;而枸杞40K液相芯片实现探针合成、样品检测、检测试剂的完全国产化,进而有效避免了进口相关设备、试剂的高额费用,减少了材料核心数据的外泄风险,避免了样品检测因贸易摩擦还带来的诸多不便;
(3)在枸杞育种研究中,与现有的重测序技术相比,该枸杞40K液相芯片克服了重测序数据量大、无用信息多、分析难度大等缺陷,在达到相同结果的前提下,实现快速检测、降低成本、数据分析简单等有利于产业发展的优势;与简化基因组测序(GBS)相比,枸杞40K液相芯片在获得代表全基因高密度分子标记时,避免了GBS分析时存在的数据量过大,以及不同材料、实验室和平台之间所获得的GBS标记数据很难进行比对和累加,从而致使GBS数据难以长期保存和综合利用的缺陷;枸杞40K液相芯片具有数据输出一致率高、同一材料数据可长期使用且数据分析相对简单等诸多优势;
(4)基于靶向捕获测序技术开发了枸杞基因型分型的高通量SNP 40K液相芯片,探针设计时结合捕获的SNP位点在全基因组的均匀分布情况,以及捕获位点多态性的问题,挑选位点的MAF尽可能大于0.03,同时,考虑了位点检出率问题,去掉缺失率高的位点;同时,通过添加的165个SNP功能标记,利用设计的芯片可以实现基因分型,在枸杞育种中有很大的利用价值;
(5)基于靶向捕获测序技术,其探针对侧翼序列拥有较好的容忍性,在侧翼序列变异不高于10%的情况下,依然可以稳定捕获目标序列;除获取目标SNP信息外,还可获取上下游各80bp的序列信息,为枸杞科研及分子育种提供更多的信息支撑;
(6)采用的液相芯片技术相较于传统的固相芯片技术,无样品检测数量要求,少量样本即可检测,检测时无需凑样、无样品数量的限制,大大节省了样本检测的服务周期,提高了科研效率及育种效率;开发的SNP芯片密度可以灵活调整,可形成40K、20K、10K等不同产品的应用场景,根据需要产品可以补充新的位点;
(7)填补了我国枸杞从传统育种向分子育种迈进时无产品可用的尴尬处境,利用靶向捕获测序技术设计枸杞高通量SNP液相探针芯片,将GBTS技术推广至枸杞基础研究和分子育种应用中,进而更好的应用于科研和育种过程中。
附图说明
图1为标记在不同染色体的分布情况;
图2为SNP位点均匀分布图;
图3为MAF分布统计图;
图4为SNP标记在基因结构中的分布统计图;
图5为SNP标记类型统计图;
图6为枸杞样品利用枸杞40K液相芯片的检测结果。
具体实施方式
实施例1
一种枸杞40K液相芯片,包括枸杞40K位点探针混合液和杂交捕获试剂;所述枸杞40K位点探针混合液包括枸杞40K SNP位点探针和165个枸杞SNP功能位点探针,平均每个位点2根捕获探针。
实施例2
实施例1中的枸杞40K SNP位点中的5023个位点信息如表1所示;其中,起始位点为捕获探针对应的起始位点,终止位点为捕获探针对应的终止位点。
表1.枸杞40K SNP位点中的5023个位点信息
Figure BDA0003554976050000061
/>
Figure BDA0003554976050000071
/>
Figure BDA0003554976050000081
/>
Figure BDA0003554976050000091
/>
Figure BDA0003554976050000101
/>
Figure BDA0003554976050000111
/>
Figure BDA0003554976050000121
/>
Figure BDA0003554976050000131
/>
Figure BDA0003554976050000141
/>
Figure BDA0003554976050000151
/>
Figure BDA0003554976050000161
/>
Figure BDA0003554976050000171
/>
Figure BDA0003554976050000181
/>
Figure BDA0003554976050000191
/>
Figure BDA0003554976050000201
/>
Figure BDA0003554976050000211
/>
Figure BDA0003554976050000221
/>
Figure BDA0003554976050000231
/>
Figure BDA0003554976050000241
/>
Figure BDA0003554976050000251
/>
Figure BDA0003554976050000261
/>
Figure BDA0003554976050000271
/>
Figure BDA0003554976050000281
/>
Figure BDA0003554976050000291
/>
Figure BDA0003554976050000301
/>
Figure BDA0003554976050000311
/>
Figure BDA0003554976050000321
/>
Figure BDA0003554976050000331
/>
Figure BDA0003554976050000341
/>
Figure BDA0003554976050000351
/>
Figure BDA0003554976050000361
/>
Figure BDA0003554976050000371
/>
Figure BDA0003554976050000381
/>
Figure BDA0003554976050000391
/>
Figure BDA0003554976050000401
/>
Figure BDA0003554976050000411
/>
Figure BDA0003554976050000421
/>
Figure BDA0003554976050000431
/>
Figure BDA0003554976050000441
/>
Figure BDA0003554976050000451
/>
Figure BDA0003554976050000461
/>
Figure BDA0003554976050000471
/>
Figure BDA0003554976050000481
/>
Figure BDA0003554976050000491
/>
Figure BDA0003554976050000501
/>
Figure BDA0003554976050000511
/>
Figure BDA0003554976050000521
/>
Figure BDA0003554976050000531
/>
Figure BDA0003554976050000541
/>
Figure BDA0003554976050000551
/>
Figure BDA0003554976050000561
/>
Figure BDA0003554976050000571
/>
Figure BDA0003554976050000581
实施例3
实施例1中的165个枸杞SNP功能位点的位点信息如表2所示;其中,起始位点为捕获探针对应的起始位点,终止位点为捕获探针对应的终止位点。
表2. 165个枸杞SNP功能位点的位点信息
Figure BDA0003554976050000582
/>
Figure BDA0003554976050000591
/>
Figure BDA0003554976050000601
/>
Figure BDA0003554976050000611
/>
Figure BDA0003554976050000621
实施例4
实施例1中枸杞40K位点探针的设计过程为:
(1)探针长度110bp、探针GC含量在30%~80%之间、同源性区域个数≤5,选取区域最大限度地不包含SSR和GAP区域;
(2)根据筛选获得的SNP位点设计两条有60%~70%重叠且覆盖SNP位点的核苷酸序列;
(3)根据设计的核苷酸序列进行单链核苷酸合成,合成的两条长度为110bp,5’端带有生物素基团修饰的DNA核苷酸序列称为枸杞40K位点探针;
(4)将上述两条合成后的枸杞40K探针进行等摩尔质量混合,利用EDTA和Tris HCl混合液定容为3pmol/mL的枸杞40K位点探针混合液。
所使用的杂交捕获试剂为来自石家庄博瑞迪生物技术有限公司的GenoBaits DNAseq Library Prep试剂盒,包括独立包装的GenoBaits Block I、GenoBaits Block II、GenoBaits 2×Hyb Buffer、GenoBaits Hyb Buffer Enhancer、GenoBaits 2×Beads WashBuffer、GenoBaits 10×Wash Buffer I、GenoBaits 10X Wash Buffer II、GenoBaits 10XWash Buffer III、GenoBaits 10X Stringent Wash Buffer。
实施例5
实施例1中的枸杞40K SNP位点通过下述方法获取:
(1)根据307个枸杞种质资源高深度重测序样本数据,通过BWA(Li H,Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform[J] .bioinformatics, 2009, 25(14):1754-1760.)比对枸杞参考基因组(Cao Y L, Li Y, Fan YF,et al. Wolfberry genomes and the evolution of Lycium(Solanaceae)[J] .Communications biology,2021,4(1):1-13.)后,利用GATK(McKenna A,Hanna M,Banks E,et al. The Genome Analysis Toolkit:a MapReduce framework for analyzing next-generation DNA sequencing data[J].Genome research, 2010, 20(9):1297- 1303.)检测所有样本SNP位点的并集合位点,并筛选出位点共计15422028个,用于目标位点的挑选;将以上位点按挑选标准:MAF>0.03,NA<25%,杂合率<30%,且基因注释优先级exonic>splicing>5'UTR>3'UTR>upstream>intronic>downstream>intergenic的标准进行挑选过滤;若区段内位点均为无注释基因结构的位点,则优先考虑MAF最高的位点,否则优先考虑位于基因上的位点;挑选之后的总集合(108783个位点)进行探针评估;
(2)将165个枸杞SNP功能标记与步骤(1)获得的108783个标记进行对比去重,去重后将剩余标记进行合并,共得到108975个标记并进行探针评估开发;
(3)探针评估时对位点进行挑选:舍弃上下游50bp在基因组上的序列是小写的,计算剩余位点上下游各50bp(总长100bp)GC含量,保留大于30%、小于70%的目标位点,作为候选集,最终共设计出62826个位点(其中包含功能位点165个);
(4)将染色体分为等长的区段,对设计出来的所有位点按每个区段挑选MAF>=0.035的候选位点,按染色体均匀分布和MAF值高的位点并加上所有功能位点共得到45214个位点,加上165个功能标记,作为第一次测试的45K位点集合;
(5)通过第一轮12份样品检测测试,删除分型表现差的5K位点,形成满足评估要求的40254个核心位点(包括165个功能位点)的产品集合,并形成40K液相芯片;
(6)第二轮经过产品实验优化进行30份样品检测测试,确定产品最佳实验操作流程,经过验证产品达到设计要求,形成枸杞40K液相芯片最佳实验流程(包含40254个位点)。
另外,实施例2中枸杞40K SNP位点中的5023个位点信息为,从上述方法获取的40254个位点信息中,随机筛选的5023个位点信息。
实施例6
实施例1中165个枸杞SNP功能位点通过下述方法获取。
(1)基于307份枸杞种质资源材料进行高深度重测序和SNP标记检测,通过BWA(Li H, Durbin R. Fast and accurate short read alignment withBurrows–Wheeler transform[J].bioinformatics,2009,25(14):1754-1760.)比对枸杞参考基因组(Cao Y L,Li Y,Fan YF,et al.Wolfberry genomes and the evolution of Lycium(Solanaceae) [J].Communications biology,2021,4(1):1-13.)后,利用GATK(McKenna A, Hanna M, Banks E, et al. The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data[J].Genome research,2010,20(9): 1297-1303.)检测所有样本SNP位点的并集合位点,用于目标位点的挑选,按照位点挑选过滤的标准进行再次挑选,并将挑选之后的总集合进行探针评估;结合广靶代谢组表型进行全基因组关联分析(metabolome Genome-Wide Association Study,mGWAS);关联分析利用TASSEL v5.0软件的混合线性模型(Mixed Linear Model,MLM)得到显著关联SNP,公式计算为:y=Xα+Qβ+Kμ+e;其中,通过STRUCTURE软件计算样品群体结构Q,通过SPAGeDi软件计算样品间亲缘关系K,X为基因型、y为表型,最终每个代谢物表型中每个SNP位点都能得到一个关联值;通过Bonferroni校正(0.05/N,N为SNP总数量)后的阈值筛选,共获得糖候选、生物碱候选、大麦芽碱、有机酸候选、黄酮类、肉桂酰腐胺、丁香酸、对羟基苯乙酸邻鼠李糖甙、香豆素、Hydroxycinnamoyl衍生物、4-香豆酸、羟甲基黄酮5-O-己糖苷、花青素、咖啡酰酒石酸、东莨菪苷、脂类代谢物的显著关联的SNP位点105个。
(2)继续构建F1分离群体用于农艺性状的QTL定位;以宁杞1号和云南枸杞为亲本杂交,获得200个F1单株,对叶片长度(Leaf Length,LL)、叶片宽度(Leaf Width,LD)、叶形指数(Leaf Index,LI)、果重(Fruit Weight,FW)、果实横经(Fruit Longitude,FL)、果实纵径(Fruit Diameter,FD)、果形指数(Fruit Index,FI)进行连续三年表型考察;通过重测序开发全基因组SNP,具体为,通过BWA(Li H, Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform[J].bioinformatics,2009,25(14):1754- 1760.)比对枸杞参考基因组(Cao YL, Li Y, Fan YF,et al.Wolfberry genomes and the evolution of Lycium(Solanaceae)[J].Communications biology,2021,4(1):1-13.)后,利用GATK(McKenna A, Hanna M, Banks E, et al.The Genome Analysis Toolkit:a MapReduce framework for analyzing next-generation DNA sequencing data[J] .Genome research,2010,20(9):1297-1303.)检测所有样本SNP位点的并集合位点,用于目标位点的挑选,按照位点挑选过滤的标准进行再次挑选,并将挑选之后的总集合进行探针评估;利用JoinMap 4.0构建枸杞的高密度遗传连锁图谱,最终构建包括8507个高质量SNP的遗传图谱,总遗传距离2122.24cM;再利用MapQTL V6.0进行表型性状的QTL定位获得相关表型的QTL,从QTL内部筛选步骤(1)中的农艺性状的60个SNP位点作为功能位点。
上述功能位点获取所采用的基因组版本号为:ASM1917538v1
(https://www.ncbi.nlm.nih.gov/genome/?term=wolfberry)。
实施例7
枸杞40K液相芯片的检测实验方法,步骤如下:
(1)采用高通量DNA提取试剂盒进行待测样品DNA的提取;提取后的DNA样品进行2种检测:1.使用1%琼脂糖凝胶电泳方法分析DNA的纯度和完整性;2.使用Qubit对DNA浓度进行准确定量;
(2)取定量质检合格的DNA,利用超声波破碎仪进行随机物理破碎,破碎片段峰值控制在200bp~300bp,破碎后的DNA经过末端修复后连接A尾;
(3)利用连接酶将加A后的DNA片段与测序接头连接在一起,然后利用羧基修饰的磁珠对文库进行纯化和片段选择,保留插入片段在200bp~300bp的连接产物;
(4)连接产物加入带有Barcode的测序引物和高保真PCR反应体系进行PCR扩增,不同的Barcode用于区分不同的样品;经过羧基磁珠纯化后的扩增产物,即可用于探针杂交实验;
(5)取500ng完成构建的测序文库,冻干后加入探针与杂交试剂,变性后置于65℃温育2小时,即可完成杂交反应;杂交产物进行洗液清洗后,再进行一轮PCR,完成杂交捕获文库的构建;
(6)文库构建完成后,先使用Qubit2.0进行初步定量,使用qPCR的方法对文库的有效浓度进行准确定量以保证文库质量;文库检合格后,进入上机测序阶段;
(7)产物经过高通量测序后,利用测序结果回帖到枸杞参考基因组上进行比对,从而获取待测枸杞的基因组基因分型数据;再通过BWA和GATK软件处理后,得到个体特定位点的SNP基因分型。
实施例8
通过实施例1至实施例6所获得的枸杞40K液相芯片,其相关的检测视图如图1至图5所示。
图1为标记在不同染色体的分布情况;即,目标位点在不同染色体上的个数统计结果;其中,a.横坐标为染色体ID;b.左示例Count为位点数/区段数;c.右示例Length为染色体长度(单位bp)。
图2为SNP位点均匀分布图;图3为MAF分布统计图;图4为SNP标记在基因结构中的分布统计图;图5为SNP标记类型统计图。
实施例9
通过实施例1至实施例6所获得的枸杞40K液相芯片,其应用过程如下。
(1)取200份枸杞叶片,放置于实验中自然晾干,用于DNA提取;
(2)按照枸杞40K液相芯片实验操作步骤进行DNA提取,文库构建,上机测序并获得最终的SNP数据,即,按照实施例6进行操作;
(3)计算检出率;产品检出率是衡量芯片质量的重要指标,在植物中一般根据产品检出位点数与开发位点数的比值衡量检出率;本产品的200份样本平均检出率为94.52%。具体检出率结果展示(部分样品)如表3所示。
表3.部分样品的检出率结果
样品名称 位点类型 总位点数 缺失位点数 检出位点数 检出率
X11_132 SNP 40254 3789 36465 90.59%
D13_110 SNP 40254 3113 37141 92.27%
60_1 SNP 40254 3108 37146 92.28%
X15_127 SNP 40254 2478 37776 93.84%
X1_34 SNP 40254 2420 37834 93.99%
D7_133 SNP 40254 2035 38219 94.94%
37_1 SNP 40254 2021 38233 94.98%
D10_42 SNP 40254 2015 38239 94.99%
D11_96 SNP 40254 1660 38594 95.88%
D6_92 SNP 40254 1658 38596 95.88%
D2_111 SNP 40254 1649 38605 95.90%
4_2 SNP 40254 1645 38609 95.91%
40_1 SNP 40254 1339 38915 96.67%
X4_65 SNP 40254 1337 38917 96.68%
D6_108 SNP 40254 1317 38937 96.73%
D14_51 SNP 40254 1262 38992 96.86%
D6_8 SNP 40254 1218 39036 96.97%
X3_143 SNP 40254 1140 39114 97.17%
16_2 SNP 40254 910 39344 97.74%
5_1 SNP 40254 873 39381 97.83%
实施例9
进一步对SNP标记用于群体遗传结构划分;如图6为根据200份枸杞样品利用枸杞40K液相芯片的检测结果,利用主成分分析(Principal Component Analysis,PCA)对群体进行划分;通过图6可看出,能将样本根据群体情况清晰区分。
本申请基于靶向捕获测序技术开发了枸杞基因型分型的高通量SNP 40K液相芯片,该液相芯片,可有效应用于枸杞遗传多样性分析、分子遗传图谱构建、全基因组关联分析、品种真实性鉴定、分子标记辅助选择育种、全基因组选择育种。

Claims (8)

1.一种枸杞40K液相芯片,其特征在于,包括枸杞40K位点探针混合液和杂交捕获试剂;所述枸杞40K位点探针混合液包括枸杞40K SNP位点探针和165个枸杞SNP功能位点探针,平均每个位点2根捕获探针;
所述枸杞40K SNP位点中的5023个位点信息如下:
Figure 82058DEST_PATH_FDA0003995651610000011
Figure 281089DEST_PATH_FDA0003995651610000021
Figure 591985DEST_PATH_FDA0003995651610000031
Figure 987194DEST_PATH_FDA0003995651610000041
Figure 332725DEST_PATH_FDA0003995651610000051
Figure 686346DEST_PATH_FDA0003995651610000061
Figure 733805DEST_PATH_FDA0003995651610000071
Figure 932705DEST_PATH_FDA0003995651610000081
Figure 132743DEST_PATH_FDA0003995651610000091
Figure 657265DEST_PATH_FDA0003995651610000101
Figure 411594DEST_PATH_FDA0003995651610000111
Figure 679765DEST_PATH_FDA0003995651610000121
Figure 485041DEST_PATH_FDA0003995651610000131
Figure 446043DEST_PATH_FDA0003995651610000141
Figure 687669DEST_PATH_FDA0003995651610000151
Figure 493951DEST_PATH_FDA0003995651610000161
Figure 668580DEST_PATH_FDA0003995651610000171
Figure 3747DEST_PATH_FDA0003995651610000181
Figure 513094DEST_PATH_FDA0003995651610000191
Figure 123067DEST_PATH_FDA0003995651610000201
Figure 621045DEST_PATH_FDA0003995651610000211
Figure 923850DEST_PATH_FDA0003995651610000221
Figure 405647DEST_PATH_FDA0003995651610000231
Figure 570043DEST_PATH_FDA0003995651610000241
Figure 922527DEST_PATH_FDA0003995651610000251
Figure 396234DEST_PATH_FDA0003995651610000261
Figure 365327DEST_PATH_FDA0003995651610000271
Figure 785944DEST_PATH_FDA0003995651610000281
Figure 789672DEST_PATH_FDA0003995651610000291
Figure 695266DEST_PATH_FDA0003995651610000301
Figure 620497DEST_PATH_FDA0003995651610000311
Figure 375963DEST_PATH_FDA0003995651610000321
Figure 968619DEST_PATH_FDA0003995651610000331
Figure 784128DEST_PATH_FDA0003995651610000341
Figure 196655DEST_PATH_FDA0003995651610000351
Figure 506544DEST_PATH_FDA0003995651610000361
Figure 219285DEST_PATH_FDA0003995651610000371
Figure 940117DEST_PATH_FDA0003995651610000381
Figure 839940DEST_PATH_FDA0003995651610000391
Figure 937209DEST_PATH_FDA0003995651610000401
Figure 19303DEST_PATH_FDA0003995651610000411
Figure 911036DEST_PATH_FDA0003995651610000421
Figure 298155DEST_PATH_FDA0003995651610000431
Figure 199115DEST_PATH_FDA0003995651610000441
Figure 620869DEST_PATH_FDA0003995651610000451
Figure 699814DEST_PATH_FDA0003995651610000461
Figure 308650DEST_PATH_FDA0003995651610000471
Figure 13301DEST_PATH_FDA0003995651610000481
Figure 555141DEST_PATH_FDA0003995651610000491
Figure 523097DEST_PATH_FDA0003995651610000501
Figure 150387DEST_PATH_FDA0003995651610000511
Figure 642417DEST_PATH_FDA0003995651610000521
Figure 507605DEST_PATH_FDA0003995651610000531
所述165个枸杞SNP功能位点的位点信息如下:
Figure 177621DEST_PATH_FDA0003995651610000532
Figure 292207DEST_PATH_FDA0003995651610000541
Figure 541923DEST_PATH_FDA0003995651610000551
2.如权利要求1所述的枸杞40K液相芯片,其特征在于,所述枸杞40K位点探针的设计过程为:
(1)探针长度110bp、探针GC含量在30%~80%之间、同源性区域个数≤5,选取区域最大限度地不包含SSR和GAP区域;
(2)根据筛选获得的SNP位点设计两条有60%~70%重叠且覆盖SNP位点的核苷酸序列;
(3)根据设计的核苷酸序列进行单链核苷酸合成,合成的两条长度为110bp,5’端带有生物素基团修饰的DNA核苷酸序列称为枸杞40K位点探针;
(4)将上述两条合成后的枸杞40K位点探针进行等摩尔质量混合,利用EDTA和Tris HCl混合液定容为3pmol/mL的枸杞40K位点探针混合液。
3.如权利要求1所述的枸杞40K液相芯片,其特征在于,所述枸杞40K SNP位点通过下述方法获取:
(1)根据307个枸杞种质资源高深度重测序样本数据,通过BWA比对枸杞参考基因组后,利用GATK检测所有样本SNP位点的并集合位点,并筛选出若干个位点用于目标位点的挑选;按照位点挑选过滤的标准进行再次挑选,并将挑选之后的总集合进行探针评估;
(2)将165个枸杞SNP功能标记与步骤(1)获得的标记总集合进行对比去重,去重后将剩余标记进行合并,得到用于探针评估开发的标记;
(3)探针评估时对位点进行挑选:舍弃上下游50bp在基因组上的序列是小写的重复序列区,计算剩余位点上下游各50bp的GC含量,保留大于30%、小于70%的目标位点作为候选集,并筛选出包含165个枸杞SNP功能位点的若干个位点;
(4)将染色体分为等长的区段,对设计出来的所有位点按每个区段挑选MAF≥0.035的候选位点,按染色体均匀分布和MAF值高的位点并加上所有功能位点共得到若干个位点,加上165个功能标记,作为第一次测试的45K位点集合;
(5)通过第一轮产品检测测试,删除分型表现差的5K位点,形成满足评估要求、且包含165个功能位点的核心位点的产品集合,并形成40K液相芯片;
(6)通过第二轮产品实验优化对样品进行检测测试,确定产品的最佳实验操作流程,经过验证使产品达到设计要求,并形成枸杞40K液相芯片最佳实验流程。
4.如权利要求3所述的枸杞40K液相芯片,其特征在于,所述步骤(1)中,位点挑选过滤的标准为:MAF>0.03,NA<25%,杂合率<30%,基因注释优先级exonic>splicing>5'UTR>3'UTR>upstream>intronic>downstream>intergenic;若区段内位点均为无注释基因结构的位点,则优先考虑MAF最高的位点,否则优先考虑位于基因上的位点。
5.如权利要求1所述的枸杞40K液相芯片,其特征在于,165个枸杞SNP功能位点通过下述方法获取:
(1)基于307份枸杞种质资源材料进行高深度重测序和SNP标记检测,具体为,通过BWA比对枸杞参考基因组后,利用GATK检测所有样本SNP位点的并集合位点,并筛选出若干个位点用于目标位点的挑选,按照位点挑选过滤的标准进行再次挑选,并将挑选之后的总集合进行探针评估;结合广靶代谢组表型进行全基因组关联分析,共获得糖候选、生物碱候选、大麦芽碱、有机酸候选、黄酮类、肉桂酰腐胺、丁香酸、对羟基苯乙酸邻鼠李糖甙、香豆素、Hydroxycinnamoyl衍生物、4-香豆酸、羟甲基黄酮5-O-己糖苷、花青素、咖啡酰酒石酸、东莨菪苷、脂类代谢物的关联的SNP位点105个;
(2)以宁杞1号和云南枸杞为亲本杂交,构建F1分离群体用于农艺性状的QTL定位,共筛选步骤(1)中农艺性状的QTL区间内60个SNP位点作为功能位点。
6.如权利要求5所述的枸杞40K液相芯片,其特征在于,所述步骤(1)中,全基因组关联分析的过程为,利用TASSEL软件的混合线性模型得到显著关联SNP,公式计算为:y=Xα+Qβ+Kμ+e;通过STRUCTURE软件计算样品群体结构Q,通过SPAGeDi软件计算样品间亲缘关系K,X为基因型,y为表型,并使每个代谢物表型中每个SNP位点都得到一个关联值;通过Bonferroni校正后的阈值筛选,从而获得显著关联的105个SNP位点。
7.如权利要求5所述的枸杞40K液相芯片,其特征在于,所述步骤(2)中,以宁杞1号和云南枸杞为亲本杂交,获得200个F1单株,对叶片长度、叶片宽度、叶形指数、果重、果实横经、果实纵径、果形指数进行连续三年表型考察;通过重测序开发全基因组SNP,具体为,通过BWA比对枸杞参考基因组后,利用GATK检测所有样本SNP位点的并集合位点,并筛选出若干个位点用于目标位点的挑选,按照位点挑选过滤的标准进行再次挑选,并将挑选之后的总集合进行探针评估;利用JoinMap构建包括8507个枸杞高质量SNP的遗传图谱,总遗传距离2122.24cM;再利用MapQTL进行表型性状的QTL定位获得相关表型的QTL,从QTL内部而筛选步骤(1)中农艺性状的60个SNP位点作为功能位点。
8.如权利要求1-7中任一项所述的枸杞40K液相芯片的应用,其特征在于,应用于枸杞遗传多样性分析、分子遗传图谱构建、全基因组关联分析、品种真实性鉴定、分子标记辅助选择育种、全基因组选择育种。
CN202210273849.0A 2022-03-19 2022-03-19 一种枸杞40k液相芯片及应用 Active CN114657238B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210273849.0A CN114657238B (zh) 2022-03-19 2022-03-19 一种枸杞40k液相芯片及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210273849.0A CN114657238B (zh) 2022-03-19 2022-03-19 一种枸杞40k液相芯片及应用

Publications (2)

Publication Number Publication Date
CN114657238A CN114657238A (zh) 2022-06-24
CN114657238B true CN114657238B (zh) 2023-03-24

Family

ID=82031081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210273849.0A Active CN114657238B (zh) 2022-03-19 2022-03-19 一种枸杞40k液相芯片及应用

Country Status (1)

Country Link
CN (1) CN114657238B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116004898A (zh) * 2022-12-23 2023-04-25 广东省农业科学院作物研究所 一种花生40K液相SNP芯片PeanutGBTS40K及其应用
CN115992265B (zh) * 2023-03-22 2023-07-14 中山大学 一种石斑鱼全基因组液相芯片及其应用
CN116463445B (zh) * 2023-03-24 2024-04-30 西南大学 一种柑橘全基因组40k液相芯片及应用
CN116732026B (zh) * 2023-03-29 2024-05-28 内蒙古农业大学 一种燕麦snp育种芯片的开发方法及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112921076B (zh) * 2021-04-02 2023-04-07 中国农业大学 一种基于靶向捕获测序的猪50k液相芯片的制备方法及其应用
CN113308562B (zh) * 2021-05-24 2022-08-23 浙江大学 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用

Also Published As

Publication number Publication date
CN114657238A (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
CN114657238B (zh) 一种枸杞40k液相芯片及应用
EP3608420B1 (en) Nucleic acids and methods for detecting chromosomal abnormalities
CN105441432B (zh) 组合物及其在序列测定和变异检测中的用途
CN106591441B (zh) 基于全基因捕获测序的α和/或β-地中海贫血突变的检测探针、方法、芯片及应用
CN115029451B (zh) 一种绵羊液相芯片及其应用
CN115198023B (zh) 一种海南黄牛液相育种芯片及其应用
CN109337997B (zh) 一种山茶属多态性叶绿体基因组微卫星分子标记引物及筛选和甄别近缘种的方法
CN115678979A (zh) 菠萝液相芯片及其应用
CN113564266B (zh) Snp分型遗传标记组合、检测试剂盒及用途
CN107090450B (zh) 与谷子穗长性状相关的分子标记及其检测引物和应用
CN115232881A (zh) 一种鲍基因组育种芯片及其应用
CN111485026A (zh) 一种与绵羊出生重相关的snp位点、应用、分子标记和引物
CN116463445B (zh) 一种柑橘全基因组40k液相芯片及应用
CN117095746A (zh) 一种用于水牛的gbs全基因组关联分析方法
CN110305974B (zh) 基于检测五个snp位点区分常见小鼠近交系的pcr分析引物及其分析方法
CN117305503B (zh) 用于柑橘基因型鉴定的20k液相芯片及其应用
CN117265139B (zh) 一种萨福克羊体重相关snp标记及其筛选方法与应用
CN117821642B (zh) 一种用于鉴定蝴蝶兰品种的引物组、试剂盒及其应用
CN117701722B (zh) 一种牛高原适应育种10k液相芯片及应用
CN117587159B (zh) 一种辣椒snp分子标记组合、snp芯片及其应用
CN117701738A (zh) 与水牛初产月龄性状相关的snp分子标记及其应用
CN118086519A (zh) 猪液相芯片及其制备方法和应用
CN117467773A (zh) 一种与奶绵羊产奶性状相关的snp位点组合、液相芯片及其应用
CN114350845A (zh) 水稻耐储基因挖掘与分子标记开发
CN115679011A (zh) 一种snp分子标记组合及其在玉米种质鉴定和育种中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant