CN105624272B - 基因组预定区域核酸测序文库的构建方法及装置 - Google Patents

基因组预定区域核酸测序文库的构建方法及装置 Download PDF

Info

Publication number
CN105624272B
CN105624272B CN201410594702.7A CN201410594702A CN105624272B CN 105624272 B CN105624272 B CN 105624272B CN 201410594702 A CN201410594702 A CN 201410594702A CN 105624272 B CN105624272 B CN 105624272B
Authority
CN
China
Prior art keywords
probe
genome
presumptive area
sequence
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410594702.7A
Other languages
English (en)
Other versions
CN105624272A (zh
Inventor
陈晓丽
何诗阳
方东明
王晓雯
王勇斯
原辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN201410594702.7A priority Critical patent/CN105624272B/zh
Publication of CN105624272A publication Critical patent/CN105624272A/zh
Application granted granted Critical
Publication of CN105624272B publication Critical patent/CN105624272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了基因组预定区域核酸测序文库的构建方法及装置,其中该方法包括:将基因组DNA进行片段化处理;将DNA片段进行片段选择;将经过片段选择的DNA片段依次进行去磷酸化、第一末端修复、与第一测序接头相连;利用探针对第一连接产物进行筛选;将目的片段依次进行双链环化处理、酶切处理;将酶切产物依次进行第二末端修复、第二测序接头相连和DNA双链分离处理,以便获得单链DNA,所述单链DNA构成所述基因组预定区域测序文库,其中,所述探针满足选自10个条件的至少之一。该探针对目标序列捕获特异性好、灵敏度和覆盖度高,利用该方法能够有效构建用于SNP捕获检测的测序文库。

Description

基因组预定区域核酸测序文库的构建方法及装置
技术领域
本发明涉及生物技术领域,特别是测序技术领域,具体地涉及基因组预定区域核酸测序文库的构建方法及装置,更具体地,涉及构建基因组预定区域核酸测序文库的方法、确定基因组预定区域核酸序列的方法、用于构建基因组预定区域核酸测序文库的装置以及用于确定基因组预定区域核酸序列的系统。
背景技术
SNP(Single Nucleotide Polymorphism),即单核苷酸多态性标记,又称单核苷酸多态性,指DNA序列中单个碱基的差别。一个SNP的含义是给定的一个群体中,超过1%的个体在给定的遗传区域内发生一次核苷酸改变,是一个物种中不同个体表型的主要遗传来源。SNP具有数量多、分布广泛、适于快速规模化筛查、易于基因分型等优点,因此,SNP标记成为目前最常用的第三代遗传标记。近些年来,SNP在疾病的基因诊断、制作生物高密度遗传连锁图谱、分子标记辅助育种、数量性状位点定位等方面得到了广泛的应用。
然而,目前的SNP检测分型方法仍有待改进。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出一种能够对SNP位点进行快速、准确、有效的检测分型,且检测特异性好、灵敏度和覆盖度高、重复性好,成本低、操作简单、易推广的方法。
需要说明的是,本发明是基于发明人的下列发现而完成的:
发明人对目前常用的SNP位点检测分型技术进行了深入分析,分析结果如下:
基因分型芯片技术具有快速和高效的优点,得到了研究人员和育种者的大量应用。但该方法也存在一些缺点,如只能针对已知的SNP位点进行分型,仪器复杂、不易推广。Illumina和Affymetrix等公司以及各个国家相继开发了几种重要畜牧物种的覆盖全基因组范围的不同密度的基因芯片。
直接测序得到SNP是检测SNP最直观的方法。特别是最近几年高通量测序技术的发展,使得大量、快速地寻找SNP有了可能。其中重测序是最全面,密度最高的方法,能够在全基因组范围内挖掘到SNP,indel,SV等,但成本较高,且需要有基因组信息;最近几年发展出几种RAD的方法,在酶切位点附近寻找SNP位点,降低了测序量与成本,且对于无基因组信息的物种也可以进行基因分型,并且可以利用不同的限制性内切酶的组合得到不同密度的SNP位点,可以满足科研与育种工作的要求,如RAD,ddRAD,2bRAD等。
目标区域捕获技术(Target–enrichment method)可以在样品的基因组测序之前对目标区域进行捕获,对捕获的区域进行测序,能够降低测序的总量,从而减少费用和时间,同时降低了后续分析的难度。可以用目标区域捕获的技术对SNP位点附近的区域进行捕获,然后将捕获的片段进行建库,而后用测序的方法得到目标SNP位点的基因型。目前已经发展了几种目标区域捕获技术,例如PCR、MIP、固相芯片和液相芯片,可以根据研究的需要选择合适的技术,主要的技术指标是特异性、灵敏度、覆盖度、重复性、费用和操作性。其中液相芯片技术具有高度的灵活性,研究者可以根据自己的需要选择位点,特异性、灵敏度是几个方法中最高的,而且操作简便,不需要昂贵的硬件支持,成为很多研究者进行目标区域捕获的首选。
针对目标区域捕获进行探针设计时,通用的原则为叠瓦式,即确定一段区域后,用探针间有overlap的方法设计探针,此方法适用于对一段区域进行捕获,或用hiseq,proton等平台对目标SNP进行捕获分型。但是当应用探针进行目标SNP捕获并应用CG平台进行测序时,由于CG测序读长比较短(28bp+28bp),经常出现目标SNP位点被捕获但不能被测到的情况,大大浪费了数据量。具体地:针对目标区域捕获时,如图1a所示,探针设计的方法一般如下:确定目标区域,对区域进行延伸,确定探针的长度和覆盖乘数,当乘数>1时,设计为叠瓦式。其它考虑的重要参数包括:探针的熔解温度,探针是否含有发夹结构,探针与参考基因组比对时可以比对到几个位置,探针的最大GC含量,重复区过滤。目前的方法中,进行目标SNP的捕获与测序时,将目标SNP位点向两端延伸,将延伸后的片段看作目标区域,运用与区域捕获相似的方法进行后期的捕获以及建库测序流程。但是,如图1b所示,发明人发现,当运用相同的探针设计方案时,虽然在Illumina的Hiseq平台,以及Ion Proton平台,打断片段为150bp~250bp,测序读长为100bp以上时,目标SNP位点大多可被检测到,但当运用CG平台进行2-adapter建库测序时,该方案存在的问题是:目标SNP所在的延伸区域被捕获到,由于CG平台读长较短,导致目标SNP位点未被测到,延伸区域的测序深度呈双峰型,而目标SNP位点的测序深度低(如图3所示),因而造成了数据的浪费。
因而,发明人根据CG测序平台及探针捕获的特点,进行了不同的探针设计探索,以期提高目标SNP位点被捕获后测到的概率。例如,发明人多次调整了探针与目标SNP位点的距离,探针乘数等参数。通过多次的设计探索以及实验验证,发明人最终确定了SNP位点捕获检测的特异性探针的最佳的参数条件:运用标准2-adapter建库方式,打断片段为200~400bp,探针中点跟目标SNP位点的最佳距离为100bp,目标SNP位点左右各设计1条探针,针对CG含量高于60%以及低于30%的探针,增加探针的条数。探针设计原理示意图如图2所示。其中,利用本发明中对探针设计的改进,将目标SNP左右各设计1条探针时,目标SNP的测序深度提高,显著提高了数据利用率(对比图3和图4)。
本发明针对CG测序平台的特征,对目前的目标区域捕获检测SNP的方法尤其是探针设计方面进行了重大改进,得到了适合于高通量测序技术尤其是CG测序平台的应用于目标SNP捕获分型的方法。
从而,根据本发明的一个方面,本发明提供了一种构建基因组预定区域核酸测序文库的方法。根据本发明的实施例,该方法包括以下步骤:
将基因组DNA进行片段化处理,以便获得DNA片段;
将所述DNA片段进行片段选择,以便获得200-400bp的DNA片段;
将所述经过片段选择的DNA片段依次进行去磷酸化和第一末端修复,以便获得经过第一末端修复的DNA片段;
将所述经过第一末端修复的DNA片段与第一测序接头相连,以便获得第一连接产物;
利用探针对所述第一连接产物进行筛选,以便获得目的片段,其中所述探针特异性识别所述基因组预定区域的至少一部分,所述基因组预定区域包含至少一个SNP位点;
将所述目的片段进行双链环化处理,以便获得环状双链DNA;
将所述环状双链DNA进行酶切处理,以便获得酶切产物;
将所述酶切产物进行第二末端修复,以便获得第二末端修复产物;
将所述第二末端修复产物与第二测序接头相连,以便获得第二连接产物;
将所述第二连接产物进行DNA双链分离处理,以便获得单链DNA,所述单链DNA构成所述基因组预定区域测序文库,
其中,所述探针满足选自下列条件的至少之一:
(1)所述探针乘数为2,且针对一个SNP位点,两条探针分别特异性识别所述SNP位点的上游序列和下游序列;
(2)两条探针分别特异性识别所述SNP位点的上游50bp~150bp和下游50bp~150bp之间的序列;
(3)所述探针的长度为80~100bp;
(4)所述基因组预定区域为非重复序列;
(5)特异性识别GC含量高于0.6及低于0.3的基因组预定区域的探针,乘数大于2;
(6)所述探针与目标序列的熔解温度为60-100摄氏度,优选80摄氏度;
(7)所述探针不包含发夹结构;
(8)所述探针与所述参考基因组上的至多2个位点匹配;
(9)所述探针选择时的窗口滑动大小为10bp。
发明人惊奇地发现,该方法中筛选步骤所采用的满足上述条件的探针,对预定区域SNP位点的捕获特异性好、灵敏度和覆盖度非常高,进而利用本发明的方法能够准确有效地捕获探针特异性识别的目标序列——基因组预定区域核酸序列,从而能够有效构建获得基因组预定区域核酸测序文库,进一步,将该核酸测序文库用于高通量测序文库尤其是CG测序平台后,能够有效确定基因组预定区域的核酸序列尤其是基因组预定区域所包含的所有SNP位点的信息,并且,目标SNP的测序深度高,数据利用率高,进而能够实现对基因组预定区域SNP位点的检测和分型。并且,利用本发明的方法构建基因组预定区域核酸测序文库,并进而用于检测基因组预定区域核酸序列以及SNP位点的基因型,特异性好、灵敏度和覆盖度高,重复性好,且该方法成本低、操作简单、易推广。
另外,根据本发明上述实施例的构建基因组预定区域核酸测序文库的方法还可以具有如下附加的技术特征:
根据本发明的实施例,在利用探针对所述第一连接产物进行筛选之前,进一步包括对所述第一连接产物进行PCR扩增。由此,有利于富集目标序列即包含SNP位点的基因组预定区域的核酸序列。
根据本发明的实施例,在将所述目的片段进行双链环化处理之前,进一步包括将所述目的片段进行PCR扩增。由此,有利于目的片段的扩繁、富集,进而有利于获得的核酸测序文库的后续测序及基因分型。
根据本发明的实施例,在将所述第二连接产物进行DNA双链分离处理之前,进一步包括将所述第二连接产物进行PCR扩增。由此,有利于目标序列的扩繁、富集,进而有利于获得的核酸测序文库的后续测序及基因分型。
根据本发明的实施例,利用Ecop15I酶进行所述酶切处理。由此,酶切效果好,有利于后续步骤的进行。
根据本发明的实施例,进一步包括:将所述单链DNA依次进行环化和滚环复制处理。由此,获得的核酸测序文库尤其适于利用CG测序平台进行测序和基因分型。
根据本发明的实施例,所述基因组预定区域核酸测序文库适于利用高通量测序技术优选CG测序平台进行测序。
根据本发明的实施例,利用液相芯片杂交捕获技术进行所述筛选。由此,筛选效果好,对目的片段的富集准确、高效。
根据本发明的又一方面,本发明还提供了一种确定基因组预定区域核酸序列的方法。根据本发明的实施例,该方法包括以下步骤:
根据前面所述的构建基因组预定区域核酸测序文库方法,构建待测样品的基因组预定区域核酸测序文库,其中所述基因组预定区域包含至少一个SNP位点;
对所述待测样品的基因组预定区域核酸测序文库进行测序,以便获得测序结果;以及
基于所述测序结果,确定所述待测样品基因组预定区域的核酸序列。
发明人发现,本发明所采用的探针,对预定区域SNP位点的捕获特异性好、灵敏度和覆盖度非常高,进而利用本发明的方法能够准确有效地捕获探针特异性识别的目标序列——基因组预定区域核酸序列、构建获得基因组预定区域核酸测序文库,并基于高通量测序技术例如CG测序平台进行测序,确定待测样品基因组预定区域核酸序列以及SNP位点的基因型。根据本发明的实施例,利用本发明的方法进行SNP捕获检测,目标SNP的测序深度高,数据利用率高。此外,该方法对基因组预定区域核酸序列及其包含的所有SNP位点的捕获检测的特异性好、灵敏度和覆盖度高,重复性好,且该方法成本低、操作简单、易推广。也即,本发明的方法能够对SNP位点进行快速、准确、有效的捕获检测分型。
根据本发明的实施例,利用高通量测序技术优选CG测序平台进行所述测序。
根据本发明的实施例,进一步包括:基于所述待测样品基因组预定区域的核酸序列,确定所述SNP位点的基因型。由此,能够准确有效地实现对基因组预定区域核酸序列包含的所有SNP位点的基因分型。
根据本发明的另一方面,本发明还提供了一种用于构建基因组预定区域核酸测序文库的装置。根据本发明的实施例,该装置包括:
片段化处理单元,所述片段化处理单元用于将基因组DNA进行片段化处理,以便获得DNA片段;
片段选择单元,所述片段选择单元与所述片段化处理单元相连,用于将所述DNA片段进行片段选择,以便获得200-400bp的DNA片段;
去磷酸化和第一末端修复单元,所述去磷酸化和第一末端修复单元与所述片段选择单元相连,用于将所述经过片段选择的DNA片段依次进行去磷酸化和第一末端修复,以便获得经过第一末端修复的DNA片段;
第一测序接头连接单元,所述第一测序接头连接单元与所述去磷酸化和第一末端修复单元相连,用于将所述经过第一末端修复的DNA片段与第一测序接头相连,以便获得第一连接产物;
筛选单元,所述筛选单元与所述第一测序接头连接单元相连,并设置有探针,用于利用探针对所述第一连接产物进行筛选,以便获得目的片段,其中所述探针特异性识别所述基因组预定区域的至少一部分,所述基因组预定区域包含至少一个SNP位点;
双链环化处理单元,所述双链环化处理单元与所述筛选单元相连,用于将所述目的片段进行双链环化处理,以便获得环状双链DNA;
酶切处理单元,所述酶切处理单元与所述双链环化处理单元相连,用于将所述环状双链DNA进行酶切处理,以便获得酶切产物;
第二末端修复单元,所述第二末端修复单元所述酶切处理单元相连,用于将所述酶切产物进行第二末端修复,以便获得第二末端修复产物;
第二测序接头连接单元,所述第二测序接头连接单元与所述第二末端修复单元相连,用于将所述第二末端修复产物与第二测序接头相连,以便获得第二连接产物;
DNA双链分离处理单元,所述DNA双链分离处理与所述第二测序接头连接单元相连,用于将所述第二连接产物进行DNA双链分离处理,以便获得单链DNA,所述单链DNA构成所述基因组预定区域测序文库,
其中,所述探针满足选自下列条件的至少之一:
(1)所述探针乘数为2,且针对一个SNP位点,两条探针分别特异性识别所述SNP位点的上游序列和下游序列;
(2)两条探针分别特异性识别所述SNP位点的上游50bp~150bp和下游50bp~150bp之间的序列;
(3)所述探针的长度为80~100bp;
(4)所述基因组预定区域为非重复序列;
(5)特异性识别GC含量高于0.6及低于0.3的基因组预定区域的探针,乘数大于2;
(6)所述探针与目标序列的熔解温度为60-100摄氏度,优选80摄氏度;
(7)所述探针不包含发夹结构;
(8)所述探针与所述参考基因组上的至多2个位点匹配;
(9)所述探针选择时的窗口滑动大小为10bp。
发明人惊奇地发现,本发明的装置中筛选单元所设置的满足上述条件的探针,对预定区域SNP位点的捕获特异性好、灵敏度和覆盖度非常高,进而利用本发明的装置能够准确有效地捕获探针特异性识别的目标序列——基因组预定区域核酸序列,从而能够有效构建获得基因组预定区域核酸测序文库,进一步,将该核酸测序文库用于高通量测序文库尤其是CG测序平台后,能够有效确定基因组预定区域的核酸序列,尤其是基因组预定区域所包含的所有SNP位点的信息,进而能够实现对基因组预定区域SNP位点的检测和分型。并且,利用本发明的装置构建基因组预定区域核酸测序文库,并进而用于检测基因组预定区域核酸序列以及SNP位点的基因型,目标SNP的测序深度高,数据利用率高,对预定区域捕获检测的特异性好、灵敏度和覆盖度高,重复性好,且该装置生产及使用成本低、操作简单、易于推广。
另外,根据本发明上述实施例的用于构建基因组预定区域核酸测序文库的装置还可以具有如下附加的技术特征:
根据本发明的实施例,该装置进一步包括第一扩增单元,所述第一扩增单元与所述第一测序接头连接单元和所述筛选单元相连,用于在利用探针对所述第一连接产物进行筛选之前,对所述第一连接产物进行PCR扩增。由此,有利于富集目标序列即包含SNP位点的基因组预定区域的核酸序列。
根据本发明的实施例,该装置进一步包括第二扩增单元,所述第二扩增单元与所述筛选单元和所述双链环化处理单元相连,用于在将所述目的片段进行双链环化处理之前,将所述目的片段进行PCR扩增。由此,有利于目的片段的扩繁、富集,进而有利于获得的核酸测序文库的后续测序及基因分型。
根据本发明的实施例,该装置进一步包括第三扩增单元,所述第三扩增单元与所述第二测序接头连接单元和所述DNA双链分离处理单元相连,用于在将所述第二连接产物进行DNA双链分离处理之前,将所述第二连接产物进行PCR扩增。由此,有利于目标序列的扩繁、富集,进而有利于获得的核酸测序文库的后续测序及基因分型。
根据本发明的实施例,所述酶切处理单元中设置有Ecop15I酶,以便利用Ecop15I酶进行所述酶切处理。由此,酶切效果好,有利于后续步骤的进行。
根据本发明的实施例,该装置进一步包括环化和滚环复制处理单元,所述环化和滚环复制处理单元与所述DNA双链分离处理单元相连,用于将所述单链DNA依次进行环化和滚环复制处理。由此,获得的核酸测序文库尤其适于利用CG测序平台进行测序和基因分型。
根据本发明的实施例,所述基因组预定区域核酸测序文库适于利用高通量测序技术优选CG测序平台进行测序。
根据本发明的实施例,所述筛选单元适于利用液相芯片杂交捕获技术进行所述筛选。由此,筛选效果好,对目的片段的富集准确、高效。
根据本发明的再一方面,本发明还提供了一种用于确定基因组预定区域核酸序列的系统。根据本发明的实施例,该系统包括:
文库构建装置,所述文库构建装置为前面所述的用于构建基因组预定区域核酸测序文库的装置,用于构建待测样品的基因组预定区域核酸测序文库,其中所述基因组预定区域包含至少一个SNP位点;
测序装置,所述测序装置与所述文库构建装置相连,用于对所述待测样品的基因组预定区域核酸测序文库进行测序,以便获得测序结果;以及
分析装置,所述分析装置与所述测序装置相连,用于基于所述测序结果,确定所述待测样品基因组预定区域的核酸序列。
发明人发现,本发明的系统文库构建装置的筛选单元中所设置的探针,对目标区域SNP位点的捕获特异性好、灵敏度和覆盖度非常高,进而利用本发明的系统能够准确有效地捕获探针特异性识别的目标序列——基因组预定区域核酸序列、构建获得基因组预定区域核酸测序文库,并基于高通量测序技术平台例如CG测序平台进行测序,确定待测样品基因组预定区域核酸序列以及SNP位点的基因型。根据本发明的实施例,利用本发明的方法进行SNP捕获检测,目标SNP的测序深度高,数据利用率高。此外,该系统对基因组预定区域核酸序列及其包含的所有SNP位点的捕获检测的特异性好、灵敏度和覆盖度高,重复性好,且该系统的生产和使用成本低、操作简单、易推广。也即,本发明的系统能够对SNP位点进行快速、准确、有效的捕获检测分型。
根据本发明的实施例,所述测序装置为高通量测序平台,优选CG测序平台。
根据本发明的实施例,该系统进一步包括基因分型装置,所述基因分型装置与所述分析装置相连,用于基于所述待测样品基因组预定区域的核酸序列,确定所述SNP位点的基因型。由此,能够准确有效地实现对基因组预定区域核酸序列包含的所有SNP位点的基因分型。
根据本发明的另一方面,本发明还提供了一种制备探针的方法。根据本发明的实施例,该方法包括以下步骤:
提供基因组预定区域核酸序列,所述基因组预定区域包含至少一个SNP位点;以及
基于所述基因组预定区域核酸序列,设计并合成探针,所述探针特异性识别所述基因组预定区域的至少一部分,
其中,所述探针乘数为2,且针对每一个SNP位点,两条探针分别特异性识别所述SNP位点的上游序列和下游序列。
发明人发现,利用该方法制备获得的探针,对其特异性识别的基因组预定区域SNP位点的捕获特异性好、灵敏度和覆盖度非常高,能够有效用于进行基因组预定区域SNP位点的检测和分型。
根据本发明的实施例,两条探针分别特异性识别所述SNP位点的上游50bp~150bp和下游50bp~150bp之间的序列。由此,探针对其特异性识别的基因组预定区域SNP位点的捕获特异性好、灵敏度和覆盖度高。
根据本发明的实施例,所述探针的长度为80~100bp,优选90bp。由此,探针对其特异性识别的基因组预定区域SNP位点的捕获特异性好、覆盖度高。
根据本发明的实施例,所述基因组预定区域为非重复序列。由此,探针特异性好、灵敏度高。
根据本发明的实施例,特异性识别GC含量高于0.6及低于0.3的基因组预定区域的探针,乘数大于2。由此,探针对其特异性识别的基因组预定区域SNP位点的捕获特异性好、灵敏度和覆盖度高。
根据本发明的实施例,所述探针与目标序列的熔解温度为60-100摄氏度,优选80摄氏度。由此,探针对其特异性识别的基因组预定区域SNP位点的捕获特异性好、灵敏度高。
根据本发明的实施例,所述探针不包含发夹结构。
根据本发明的实施例,所述探针与参考基因组上的至多2个位点匹配。由此,探针对其特异性识别的基因组预定区域SNP位点的捕获特异性好、灵敏度高。
根据本发明的实施例,所述探针选择时的窗口滑动大小为10bp。由此,探针对其特异性识别的基因组预定区域SNP位点的捕获特异性好、灵敏度和覆盖度高。
根据本发明的又一方面,本发明还提供了一种探针。根据本发明的实施例,该探针是通过前面所述的制备探针的方法制备获得的。根据本发明的实施例,本发明的探针,对其特异性识别的基因组预定区域SNP位点的捕获特异性好、灵敏度和覆盖度非常高。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1分别显示了现有技术中,区域捕获和目标SNP捕获的探针叠瓦式设计方法示意图,
其中,
图1a为区域捕获探针叠瓦式设计示意图,
图1b为目标SNP捕获探针叠瓦式设计示意图。
图2显示了根据本发明一个实施例,本发明的目标SNP捕获的探针设计方法示意图。
图3显示了根据本发明一个实施例,根据图1b中所示的叠瓦式设计方法获得的目标SNP捕获探针,经捕获测序后的目标SNP±400bp附近平均测序深度分布图。
图4显示了根据本发明一个实施例,利用图2所示的本发明的探针设计方法获得的目标SNP捕获探针,经捕获测序后的目标SNP±400bp附近平均测序深度分布图。
具体实施方式
一般方法:
下面所描述的实施例所采用的一般方法具体如下:
1、探针设计、合成
基于下列参数要求,设计特异性识别基因组预定区域的至少一部分(SNP位点)的捕获探针,并利用Custom Array B3P平台合成探针:
(1)所述探针乘数为2,且针对一个SNP位点,两条探针分别特异性识别所述SNP位点的上游序列和下游序列;
(2)两条探针分别特异性识别所述SNP位点的上游50bp~150bp和下游50bp~150bp之间的序列;
(3)所述探针的长度为80~100bp;
(4)所述基因组预定区域为非重复序列;
(5)特异性识别GC含量高于0.6及低于0.3的基因组预定区域的探针,乘数大于2;
(6)所述探针与目标序列的熔解温度为60-100摄氏度,优选80摄氏度;
(7)所述探针不包含发夹结构;
(8)所述探针与所述参考基因组上的至多2个位点匹配;
(9)所述探针选择时的窗口滑动大小为10bp。
2、文库构建
根据CG标准2-adapter建库流程,按照以下步骤构建SNP位点捕获检测核酸测序文库:
将基因组DNA进行片段化处理,以便获得DNA片段;
将所述DNA片段进行片段选择,以便获得200-400bp的DNA片段;
将所述经过片段选择的DNA片段依次进行去磷酸化和第一末端修复,以便获得经过第一末端修复的DNA片段;
将所述经过第一末端修复的DNA片段与第一测序接头相连,以便获得第一连接产物;
利用探针对所述第一连接产物进行筛选,以便获得目的片段,其中所述探针特异性识别所述基因组预定区域的至少一部分,所述基因组预定区域包含至少一个SNP位点;
将所述目的片段进行双链环化处理,以便获得环状双链DNA;
将所述环状双链DNA进行酶切处理,以便获得酶切产物;
将所述酶切产物进行第二末端修复,以便获得第二末端修复产物;
将所述第二末端修复产物与第二测序接头相连,以便获得第二连接产物;
将所述第二连接产物进行DNA双链分离处理,以便获得单链DNA,所述单链DNA构成所述基因组预定区域测序文库。
3、测序、数据分析及基因分型
利用CG 2-adapter测序平台进行测序。并对测序数据进行处理、分析,基于测序结果确定待测样品基因组预定区域的核酸序列,以及所包含的SNP位点的基因型。
实施例1:
根据上述的一般方法,以图1b中所示的叠瓦式探针(4X)设计方法制备探针作为对照,对山羊进行目标SNP分型,具体如下:
一、探针设计、合成
根据国际山羊基因组联盟(International Goat Genome Consortium)公布的山羊的52k芯片的SNP数据(http://www.ncbi.nlm.nih.gov/projects/SNP/snp_viewBatch.cgi?sbid=1057128),从中随机挑选40k个位点用于本实施例的测试。
然后,根据CG 2-adapter测序平台的特点,设计特异性识别这些SNP位点的捕获探针,并利用Custom Array B3P平台合成探针,探针名称:AZCO寡核苷酸探针。
其中,探针的设计与合成的参数如下:
过滤掉重复区;
探针长度:90bp;
探针位置:SNP位点左右55~145bp的位置;
探针乘数:2,左右各设计一条探针;
对于GC含量高于0.6及低于0.3的区域,增加探针的数目;
探针的熔解温度:80摄氏度;
发夹结构:包含发夹结构的探针被过滤掉;
探针与参考基因组比对时最多可以比对到2个位置;
探针选择时的窗口滑动大小:10bp。
二、文库构建
取山羊(阿尔巴斯型2~4岁成年母羊)肝脏,利用动物常用的SDS-氛氯仿法提取基因组DNA,然后将提取获得的DNA进行电泳检测质量,结果主带大于23kb并清晰完整;经过Qubit BR检测并定量后,取3ug基因组DNA,根据CG标准2-adapter建库流程,按照以下步骤构建SNP位点捕获检测核酸测序文库:
1.基因组打断:
打断条件:1ug DNA 80ul体系;
E220 5/5/500 100s 主带位置 200bp-400bp(25-27个循环);
片段选择:0.8+0.5×AxyGen磁珠纯化,选取150-300bp片段;
参考浓度>4ng/ul打断后回收片段起始量200ng;
检测:6%Page电泳 20bp marker 150V电压 20-30min。
2.rSAP
提前配置mix体系如下:
10*NEB buffer2 5.4ul
rSAP(1U/ul) 5.4ul
总体积 10.8ul
反应条件:将上述mix与片段选择后的DNA充分混匀,37℃ 45min,65℃ 10min,梯度降温1℃/sec,降温至4℃。
3.末端修复
提前配置mix体系如下:
将该反应Mix与上一步中的反应液充分混匀,12℃孵育20min,4℃保持。
86.4ul XP磁珠纯化,37ul TE回融,记35ul。
4.Ad142-5’接头连接
提前配置mix体系如下:
3*HB 23.5ul
600U/ul 连接酶 1.7ul
总体积 25.2ul。
将该反应Mix充分混匀。
取出142-5’接头融化,在回融的DNA溶液中加入12.2ul接头,充分混匀,再加入上述反应mix,混匀,离心。14℃孵育1小时,4℃保持。
86.4ul XP磁珠纯化,37ul TE回融,记35ul。
5.引物延伸
提前配置mix体系如下:
充分混匀,在上一步DNA回融产物中加入反应mix,混匀,离心。进行如下反应:
86.4ul XP磁珠纯化,37ul TE回融,记35ul。
6.Ad142-3’接头连接
提前配置mix体系如下:
3*HB 23.5ul
600U/ul 连接酶 1.7ul
总体积 25.2ul。
将该反应Mix充分混匀。
取出142-3’接头融化,在回融的DNA溶液中加入12.2ul接头,充分混匀,再加入上述反应mix,混匀,离心。14℃孵育1小时,4℃保持。
86.5ul XP磁珠纯化,38ul TE回融,记36ul。
7.Nitro(缺口平移)
提前配置mix1体系如下:
将试剂混合均匀,瞬时离心后加入到上一步DNA产物中,混匀,离心。于PCR仪中反应,反应条件:60℃ 5min,0.1℃/sec降温到37℃,保持。
提前配置Mix2体系如下:
将试剂充分混匀,往上一步反应液中加入7.2ul Mix2反应液,混匀,离心。于PCR仪中反应,反应条件:37℃ 20min,4℃保持。
86.5ul XP磁珠纯化,47ul TE回融,记45ul。
Qubit测定DNA溶液浓度。
8.AdA-PCR
提前配置PCR体系如下:
反应程序:95℃ 3min;95℃ 30sec,56℃ 30sec,72℃ 4min,4-7个循环;68℃10min;以1℃/sec的速度,梯度降温至4℃;4℃保持。
288ul XP磁珠纯化,65ul H2O回融。
Qubit测定DNA溶液浓度。
9.杂交捕获
9.1杂交:
a)取750ng adAPCR产物转入一个新的1.5ml离心管中,使用真空浓缩仪60℃约40min将产物浓缩蒸干;
b)将所需的试剂置于冰上融化,充分混匀后轻微离心;
c)在离心管中按照下表配制用于富集目的片段的样品文库体系:
试剂 体积(μl)
Pre-PCR library 750ng
无核酸酶水 补水至3.4μl
SureSelect Block#1 2.5
SureSelect Block#2 2.5
Ad142_5B_PCR_05_indexblock,ON3659(1000μM) 0.3
Ad142_3T_PCR_01_block,ON3660(1000μM) 0.3
总体积 9
d)将反应体系全部转入一个新的PCR管中,按照如下反应条件进行预杂交:
Step 温度 时间
Step 1 95℃ 5min
Step 2 65℃ Holding
e)在一个新的1.5ml离心管中按照下表配制杂交Buffer反应体系:
f)根据样品反应个数,按每个反应13μl的量分别加入到PCR管或PCR八联管中,盖好管盖,然后将其放入PCR仪中65℃孵育至少5min,确认体系中没有晶体沉淀才能使用;
g)在一个新的96孔PCR管中按照下表配制AZCO Oligo Library Mix:
试剂 体积(μl)
无核酸酶水 1
RNase Block 1
AZCO寡核苷酸探针 500ng
总体积 7
9.2洗脱:
a)提前2h将水浴锅调至65℃,待水温稳定后为每个杂交反应准备1.8ml WashBuffer#2置于水浴锅中预热;
b)用漩涡混合仪剧烈振荡重悬DynabeadsM-280Streptavidin磁珠至混匀;
c)每一个杂交反应取50μl DynabeadsM-280Streptavidin磁珠于一新的2.0ml离心管;
d)将200μl Binding buffer加入磁珠中,用漩涡混合仪剧烈振荡5秒钟重悬磁珠;
e)将离心管置于磁力架上2min,待液体完全澄清;小心吸取并弃去上清;
f)重复步骤d)到步骤e)2次;
g)加入200μl Binding buffer重悬磁珠;
h)经24h孵育后,继续保持杂交混合液于PCR仪上,用刀片逐行划开、揭起96孔PCR板封口膜后,逐一使用移液器快速量取估计剩余杂交液体积,为了防止样品数量过多,量取体积时间长,导致杂交液蒸发量较大的情况,可以完成6-8个反应后关闭热盖5min,然后继续,
注意事项:若蒸发体积超过8μl则认为杂交实验失败;
i)从PCR仪中直接将全部杂交混合液转移到准备好的磁珠中,上下颠倒离心管3到5次直到混匀;
j)将装有杂交混合液和磁珠的离心管对称的固定于Nutator或类似的装置上360度旋转混匀,室温下孵育30min;
k)将样品从混匀装置取下,瞬时离心5s确保管盖上没有液体残留;
l)将2.0ml离心管转移放置在磁力架上,静置3-5min待液体完全澄清,小心吸取并弃上清;
m)用500μl Wash Buffer#1重悬磁珠,于漩涡混合仪上振荡5秒混匀样品,室温孵育15min;
n)将离心管瞬时离心3s,后置于磁力架上,静置3-5min待液体完全澄清,小心吸弃上清;
o)用500μl Wash Buffer#2重悬磁珠,漩涡混合仪上振荡5秒混匀,置于Thermomixer中65℃孵育10min;
p)颠倒离心管以混匀样品,瞬时离心3s,然后将其放置在磁力架上,静置3-5min待液体;完全澄清,小心吸取并弃去上清;
q)重复步骤o)到步骤p)2次;
r)用70ul ddH2O重悬磁珠。
10.Post-PCR
提前5分钟左右准备下面的PCR反应混合物如下:
反应体系配置:
将PCR板置入PCR仪中反应,PCR反应条件(注:PCR仪需热盖):95℃ 1min;95℃ 30秒,56℃ 30秒,72℃ 4min,16个循环;68℃ 10min;以0.1摄氏度/秒的速度缓降至4℃;4℃保持。
288ul XP磁珠纯化,37ul TE回融。
Qubit测定DNA溶液浓度。
此处可以设置混pool。
11.AdB连接-USERB酶反应
提前5分钟左右准备酶反应混合液,配制如下:
向AdA post-PCR产物中加入上述mix,混匀,离心。在PCR仪中进行反应:37℃ 1小时,4℃保持。
12.AdB连接-第一次环化
12.1反应前5min配制mix:
水 1520ul
10×TA buffer 180ul
总体积 1700ul。
12.2取96孔深孔板(或1.5ml离心管)
每组样品分为四份(两份)55ul/sample/孔/份;
向每个孔中加入850ul mix 共计905ul/孔 吹打混匀;
60℃水浴30min,常温水浴20min(缓慢降温);
1700ul mix+110ul USER B产物;分两只封膜,水浴孵育。
12.35min前制备环化mix:
12.4将b)中的样品取出,每个样本合成一个tube(2ml),加入11.3中的200ul mix,吹打混匀,室温环化1小时。
12.5纯化:0.66×磁珠去除两环及三环产物,1×回收结合单环。
具体地:
a)样本11.4分为4份(500ul/tube/1.5ml tube)
b)0.66×磁珠:Ampure HBB 761.6ul
Ampure XP 558.4 共计1320ul
c)每个tube中加入330ul上述混合液beads,室温结合15min(中间吹打15次)
d)将上清保留在新的离心管中(1.5ml tube)
e)5.75%乙醇洗涤2次,100ul TE或H2O溶解2环/3环,弃之
f)6.将上一步的beads中加入177ul Ampure HBB。加入4中的上清,混匀,室温孵育15min(中间吹打15次)
g)7.75%乙醇洗涤两次,晾干。用65ul TE回融。
13.AdB连接-Plasmide safe B消化线性DNA
13.15min前制备mix:
13.2将11.5中的60ul样品加入上述mix.
37℃ 1小时 4℃ hold (Life Pro PCR 42℃热盖)
13.3 纯化 1×XP磁珠
融于44ul样本,取3ul稀释到8.25ul TE,标记为PS,与Ecop15I后样本一起10%Page检测。
14.Ecop15I酶切
14.15min前制备mix:
14.2将12.3中的37ul样品加入13.1的mix中,记360ul,
37℃ (16hours) 过夜 电热恒温培养箱。
14.3纯化(2次)PEG32磁珠
0.7×磁珠除去长度大于500bp的分子,1.2×回收120bp分子,
具体地:
a)252ul PEG 32磁珠结合15min,(中间混匀一次),磁力架吸附15min。
b)新non-stick tube中加入184ul PEG32磁珠。
c)将1中的上清转入2中,混匀,静置15min(中间吹打15次)。
d)75%乙醇洗两次,晾干。52ul TE洗脱,取2ul加TE稀释至10ul,用于10%PAGE检测。
15:T4-Pol end-repair 2
15.15min配制mix:
将此mix加入14.4的44ul样本中,混匀。12℃ 20min 4℃ hold(Life Pro PCR 30℃热盖)。
15.2电泳:10%PAGE检测Massruler1.5ul 20bp marker 2ul
15.3纯化:向15.1的约53ul样品中加入71ul PEG32磁珠纯化,然后以48ul TE洗脱,记46ul。
16:Fast AP
16.15min前制备反应Mix:
10×NEB Buffer2(LK) 5.75ul
1U/ul Fast AP 5.75ul
总体积 11.5ul,
将上述mix与15.3中46ul样品混匀,记57.5ul。
16.237℃ 45min 4℃ hold(Life Pro PCR 42℃热盖)。
16.3 纯化 1.3×PEG32磁珠。
向57.5ul样品中加入75ul磁珠纯化,然后42ul TE回融,记40ul。
17:Ad141-3’blunt ligation
17.1 5min前配制mix:
17.2 10min前取出Ad141-3’接头(9uM)备用。
17.3 向样品中(40ul)加入5.6ul Ad141-3’接头混匀(PCR tube),
Adaptor避免和酶先混,否则会造成多聚体。
17.4 向17.3的样品中加入17.1的mix,震荡混匀。
14℃ 2小时 4℃ hold(Life Pro PCR 30℃热盖)。
17.5 0.84×beads纯化
上述样品中加入63ul PEG32磁珠纯化,42ul TE洗脱。
18.Nick translation/A-tailing
18.1 5min前制备反应Mix:
18.2向17.5的40ul样品中加入上述mix,记54ul,
37℃ 60min 4℃ hold。
18.3 纯化 1.28×PEG32
上述体系中加入69ul PEG32磁珠纯化,然后42ul TE回融。
19.Ad 141-5’连接酶
19.1 5min前制备反应mix:
19.2 10min前取出9mM Ad 141-5’溶解,取5.6ul加入17.3的40ul样本中,混匀(PCR管)。
19.3向19.2体系中加入19.1的mix,吹打混匀。
14℃ 2小时;4℃ hold。
19.4 纯化 0.84×PEG32
向上述体系中加入63ul PEG32磁珠纯化,然后42ul TE回融,记40uL。
20.Nitro 2(缺口平移)
20.1 10Min前配制反应oligo mix:
20.2 5min前配制反应mix:
20.3向上述19.4的体系中加入20.1的mix(32ul),吹打混匀。
65℃ 5min;0.1℃/sec;37℃hold(Life pro pcr)
降温至37℃后取出,加入20.2的Nitro酶反应液8ul,吹打混匀。
37℃ 20min;4℃ hold。
20.4 纯化 1×PEG32
加入80ul磁珠于上述体系中纯化,然后42ul回融,Qubit定量,取最大59.8ng样本,补充TE至100ul。
21.AdB PCR
21.1 5min前配制反应mix:(每个样品PCR扩增5份)
21.2将PCR-mix与20.5的样品100ul混匀,记550ul,分装于5个PCR管中,110ul/支。
21.3程序:
95℃ 3min;95℃ 30sec,60℃ 30sec,72℃ 4min,7个循环;68℃ 10min;梯度降温0.1℃/sec;4℃ hold。
21.4纯化1×PEG32
将所有同一样本的PCR产物转移至同一1.5ml不沾管中约480ul样本,加480ul磁珠70ul TE回融,Qubit定量
均一化,取<627ng样本稀释至60ul(1×TE稀释)。
21.5电泳检测。
22.单链环化
22.1链分离(Strand Separation)
a)将样品adBPCR产物补TE至60ul后,加20ul 4XBBB。
b)取30ul Streptavidin磁珠,用5倍体积的1XBBB洗2次后,用30ul 1XBBB重悬。
c)将步骤a中溶液转至步骤b,混匀,室温静置20min,期间混匀1次。
d)用1ml磁珠wash buffer洗2次。
e)用78ul 0.1M NaOH溶解10min,取上清。
f)加入37.5ul MOPS中和。
22.2用杂交捕获的方法筛选含有AdA接头的片段
22.2.1杂交
a)提前5分钟左右准备杂交捕获反应混合液,配制如下:
10x LSWB 13ul
Ad142_B_HCP_01(20uM) 4.5ul
总体积 17.5ul
b)将混合液加入样品中,轻轻吹打混匀。
95℃ 2min;0.1℃/sec降温至25 ℃,保持;
22.2.2捕获
a)取90ul streptavidin磁珠,用5倍体积的1XBBB洗2次后,用90ul 1XBBB重悬;
b)上述反应结束后,向上述反应液中加入43.3ul 4XBBB,混匀后,转至步骤a,混匀,室温静置10min;
c)弃上清,用1ml室温1XLSWB洗2次,100ul 56℃ 1XLSWB重悬,56℃孵育10min,弃上清;
d)加入78ul 0.1M NaOH,室温静置5min,取上清,并加入37.5ul MOPS中和。
22.2.3环化(Splint Circulation)
a)提前5分钟左右准备引物反应混合液,配制如下:
水 43ul
20uM ON1587 20ul
总体积 63ul
b)将上述混合液震荡充分混匀,离心后,向上一步得到的112ul的样品中每孔加入63ul的引物反应混合液。
c)提前5分钟准备连接酶反应混合液,配制如下:
d)将连接酶反应混合液震荡充分混匀,离心后,向已经加入引物反应混合液的反应板中每孔加入连接酶反应混合液175ul,热封膜,混匀,离心。
e)将反应板置于孵育箱中37℃孵育1.5h。
f)反应完成后,取出10ul样品,待6%变性胶电泳检测,剩余的约350ul体积,进入下一步酶反应。
22.2.4酶切消化(Exo I and III)
a)提前5分钟左右准备引物反应混合液,配制如下:
1.5ul
10x TA Buffer(LK1) 3.7ul
20U/ul Exo I 11.1ul
200/ul Exo III 3.7ul
总体积 20ul
b)将上述混合液震荡充分混匀,离心后,向上一步得到的350ul/孔的样品板中每孔加入20ul的引物反应混合液;
c)热封膜,混匀后离心,置于孵育箱中37℃孵育30min。
d)酶切30min完成后,向样品板每孔加入15.4ul 500mM EDTA终止酶反应。
EDTA(500mM) 15.4ul
22.3
用1.3X PEG磁珠进行纯化,溶于20ul TE。
三、上机测序
对合格的文库进行CG 2-adapter测序平台上机测序,测序类型为双向末端测序(Pair-end sequencing),测序长度为26bp,测序深度为60X。
四、数据分析
CG 2-adapter建库测序后,对测序得到的reads用Teramap进行处理,与基因组比对后计算捕获效率;最后利用SAMTools进行call SNP。
为计算对照即图1b中所示的叠瓦式设计方法,以及本发明的方法对数据的利用率,测序了不同的数据量下目标SNP的测序深度,随机抽取了不同的数据量,计算该数据量下,目标SNP达到某X数所占的比例。改进前后,对测序量的利用率如下表所示:
表1:4X叠瓦式探针设计时,不同数据量下,目标SNP不同测序深度所占总SNP的比例
数据 >=1X >=5X >=10X >=20X >=30X >=40X >=50X
500M 0.92 0.65 0.38 0.13 0.04 0.02 0.01
1000M 0.95 0.81 0.62 0.35 0.20 0.11 0.06
1500M 0.96 0.87 0.74 0.51 0.34 0.23 0.16
2000M 0.96 0.90 0.81 0.61 0.45 0.33 0.25
表2:2X左右各一条探针,不同数据量下,目标SNP不同测序深度所占总SNP的比例
数据 >=1X >=5X >=10X >=20X >=30X >=40X >=50X
500M 0.91 0.73 0.52 0.24 0.12 0.05 0.03
1000M 0.93 0.84 0.72 0.50 0.33 0.22 0.15
1500M 0.94 0.88 0.80 0.64 0.49 0.37 0.28
2000M 0.94 0.89 0.84 0.72 0.60 0.49 0.40
通过上表可以看出,相对于对照,利用本发明的探针设计方案,相同的数据量下,达到相同的测序深度的目标SNP所占比例大大提高,例如500M的数据量,达到10X以上的SNP位点数从38%提高到52%;而1000M的数据量,达到10X以上的SNP位点数从62%提高到72%,达到20X以上的SNP位点数从35%提高到50%,由此可见,相对于对照的4X叠瓦式探针设计方法,本发明的探针制备方法,一方面减少了探针的数量,可节约探针合成的成本;另一方面,也大大提高了数据的利用率,降低了测序成本。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (30)

1.一种构建基因组预定区域核酸测序文库的方法,其特征在于,包括以下步骤:
将基因组DNA进行片段化处理,以便获得DNA片段;
将所述DNA片段进行片段选择,以便获得200-400bp的DNA片段;
将所述经过片段选择的DNA片段依次进行去磷酸化和第一末端修复,以便获得经过第一末端修复的DNA片段;
将所述经过第一末端修复的DNA片段与第一测序接头相连,以便获得第一连接产物;
利用探针对所述第一连接产物进行筛选,以便获得目的片段,其中所述探针特异性识别所述基因组预定区域的至少一部分,所述基因组预定区域包含至少一个SNP位点;
将所述目的片段进行双链环化处理,以便获得环状双链DNA;
将所述环状双链DNA进行酶切处理,以便获得酶切产物;
将所述酶切产物进行第二末端修复,以便获得第二末端修复产物;
将所述第二末端修复产物与第二测序接头相连,以便获得第二连接产物;
将所述第二连接产物进行DNA双链分离处理,以便获得单链DNA,所述单链DNA构成所述基因组预定区域测序文库,所述基因组预定区域测序文库适于利用CG测序平台进行测序,
其中,所述探针满足下列条件:
(1)所述探针乘数为2,且针对一个SNP位点,两条探针分别特异性识别所述SNP位点的上游序列和下游序列,两条探针分别特异性识别所述SNP位点的上游50bp~150bp和下游50bp~150bp之间的序列;
(2)所述探针的长度为80~100bp;
(3)所述基因组预定区域为非重复序列;
(4)特异性识别GC含量高于0.6及低于0.3的基因组预定区域的探针,乘数大于2;
(5)所述探针与目标序列的熔解温度为60-100摄氏度;
(6)所述探针不包含发夹结构;
(7)所述探针与所述参考基因组上的至多2个位点匹配;
(8)所述探针选择时的窗口滑动大小为10bp。
2.根据权利要求1所述的方法,其特征在于,条件(5)中所述探针与目标序列的熔解温度为80摄氏度。
3.根据权利要求1所述的方法,其特征在于,在利用探针对所述第一连接产物进行筛选之前,进一步包括对所述第一连接产物进行PCR扩增。
4.根据权利要求1所述的方法,其特征在于,在将所述目的片段进行双链环化处理之前,进一步包括将所述目的片段进行PCR扩增。
5.根据权利要求1所述的方法,其特征在于,在将所述第二连接产物进行DNA双链分离处理之前,进一步包括将所述第二连接产物进行PCR扩增。
6.根据权利要求1所述的方法,其特征在于,利用Ecop15I酶进行所述酶切处理。
7.根据权利要求1所述的方法,其特征在于,进一步包括:
将所述单链DNA依次进行环化和滚环复制处理。
8.根据权利要求1所述的方法,其特征在于,所述基因组预定区域核酸测序文库适于利用高通量测序技术进行测序。
9.根据权利要求1所述的方法,其特征在于,利用液相芯片杂交捕获技术进行所述筛选。
10.一种确定基因组预定区域核酸序列的方法,其特征在于,包括以下步骤:
根据权利要求1~9中任一项所述的方法,构建待测样品的基因组预定区域核酸测序文库,其中所述基因组预定区域包含至少一个SNP位点;
对所述待测样品的基因组预定区域核酸测序文库进行测序,以便获得测序结果;以及
基于所述测序结果,确定所述待测样品基因组预定区域的核酸序列。
11.根据权利要求10所述的方法,其特征在于,利用高通量测序技术进行所述测序。
12.根据权利要求11所述的方法,其特征在于,利用CG测序平台进行所述测序。
13.根据权利要求10所述的方法,其特征在于,进一步包括:
基于所述待测样品基因组预定区域的核酸序列,确定所述SNP位点的基因型。
14.一种用于构建基因组预定区域核酸测序文库的装置,其特征在于,包括:
片段化处理单元,所述片段化处理单元用于将基因组DNA进行片段化处理,以便获得DNA片段;
片段选择单元,所述片段选择单元与所述片段化处理单元相连,用于将所述DNA片段进行片段选择,以便获得200-400bp的DNA片段;
去磷酸化和第一末端修复单元,所述去磷酸化和第一末端修复单元与所述片段选择单元相连,用于将所述经过片段选择的DNA片段依次进行去磷酸化和第一末端修复,以便获得经过第一末端修复的DNA片段;
第一测序接头连接单元,所述第一测序接头连接单元与所述去磷酸化和第一末端修复单元相连,用于将所述经过第一末端修复的DNA片段与第一测序接头相连,以便获得第一连接产物;
筛选单元,所述筛选单元与所述第一测序接头连接单元相连,并设置有探针,用于利用探针对所述第一连接产物进行筛选,以便获得目的片段,其中所述探针特异性识别所述基因组预定区域的至少一部分,所述基因组预定区域包含至少一个SNP位点;
双链环化处理单元,所述双链环化处理单元与所述筛选单元相连,用于将所述目的片段进行双链环化处理,以便获得环状双链DNA;
酶切处理单元,所述酶切处理单元与所述双链环化处理单元相连,用于将所述环状双链DNA进行酶切处理,以便获得酶切产物;
第二末端修复单元,所述第二末端修复单元所述酶切处理单元相连,用于将所述酶切产物进行第二末端修复,以便获得第二末端修复产物;
第二测序接头连接单元,所述第二测序接头连接单元与所述第二末端修复单元相连,用于将所述第二末端修复产物与第二测序接头相连,以便获得第二连接产物;
DNA双链分离处理单元,所述DNA双链分离处理与所述第二测序接头连接单元相连,用于将所述第二连接产物进行DNA双链分离处理,以便获得单链DNA,所述单链DNA构成所述基因组预定区域测序文库,所述基因组预定区域测序文库适于利用CG测序平台进行测序,其中,所述探针满足下列条件:
(1)所述探针乘数为2,且针对一个SNP位点,两条探针分别特异性识别所述SNP位点的上游序列和下游序列,两条探针分别特异性识别所述SNP位点的上游50bp~150bp和下游50bp~150bp之间的序列;
(2)所述探针的长度为80~100bp;
(3)所述基因组预定区域为非重复序列;
(4)特异性识别GC含量高于0.6及低于0.3的基因组预定区域的探针,乘数大于2;
(5)所述探针与目标序列的熔解温度为60-100摄氏度;
(6)所述探针不包含发夹结构;
(7)所述探针与所述参考基因组上的至多2个位点匹配;
(8)所述探针选择时的窗口滑动大小为10bp。
15.根据权利要求14所述的装置,其特征在于,条件(6)中所述探针与目标序列的熔解温度为80摄氏度。
16.根据权利要求14所述的装置,其特征在于,进一步包括第一扩增单元,所述第一扩增单元与所述第一测序接头连接单元和所述筛选单元相连,用于在利用探针对所述第一连接产物进行筛选之前,对所述第一连接产物进行PCR扩增。
17.根据权利要求14所述的装置,其特征在于,进一步包括第二扩增单元,所述第二扩增单元与所述筛选单元和所述双链环化处理单元相连,用于在将所述目的片段进行双链环化处理之前,将所述目的片段进行PCR扩增。
18.根据权利要求14所述的装置,其特征在于,进一步包括第三扩增单元,所述第三扩增单元与所述第二测序接头连接单元和所述DNA双链分离处理单元相连,用于在将所述第二连接产物进行DNA双链分离处理之前,将所述第二连接产物进行PCR扩增。
19.根据权利要求14所述的装置,其特征在于,所述酶切处理单元中设置有Ecop15I酶,以便利用Ecop15I酶进行所述酶切处理。
20.根据权利要求14所述的装置,其特征在于,进一步包括环化和滚环复制处理单元,所述环化和滚环复制处理单元与所述DNA双链分离处理单元相连,用于将所述单链DNA依次进行环化和滚环复制处理。
21.根据权利要求14所述的装置,其特征在于,所述基因组预定区域核酸测序文库适于利用高通量测序技术进行测序。
22.根据权利要求14所述的装置,其特征在于,所述筛选单元适于利用液相芯片杂交捕获技术进行所述筛选。
23.一种用于确定基因组预定区域核酸序列的系统,其特征在于,包括:
文库构建装置,所述文库构建装置为权利要求14~22中任一项所述的用于构建基因组预定区域核酸测序文库的装置,用于构建待测样品的基因组预定区域核酸测序文库,其中所述基因组预定区域包含至少一个SNP位点;
测序装置,所述测序装置与所述文库构建装置相连,用于对所述待测样品的基因组预定区域核酸测序文库进行测序,以便获得测序结果;以及
分析装置,所述分析装置与所述测序装置相连,用于基于所述测序结果,确定所述待测样品基因组预定区域的核酸序列。
24.根据权利要求23所述的系统,其特征在于,所述测序装置为高通量测序平台。
25.根据权利要求24所述的系统,其特征在于,所述高通量测序平台为CG测序平台。
26.根据权利要求23所述的系统,其特征在于,进一步包括基因分型装置,所述基因分型装置与所述分析装置相连,用于基于所述待测样品基因组预定区域的核酸序列,确定所述SNP位点的基因型。
27.一种制备探针的方法,其特征在于,包括以下步骤:
提供基因组预定区域核酸序列,所述基因组预定区域包含至少一个SNP位点;以及
基于所述基因组预定区域核酸序列,设计并合成探针,所述探针特异性识别所述基因组预定区域的至少一部分,
其中所述探针满足下列条件:
(1)所述探针乘数为2,且针对每一个SNP位点,两条探针分别特异性识别所述SNP位点的上游序列和下游序列,两条探针分别特异性识别所述SNP位点的上游50bp~150bp和下游50bp~150bp之间的序列;
(2)所述探针的长度为80~100bp;
(3)所述基因组预定区域为非重复序列;
(4)特异性识别GC含量高于0.6及低于0.3的基因组预定区域的探针,乘数大于2;
(5)所述探针与目标序列的熔解温度为60-100摄氏度;
(6)所述探针不包含发夹结构;
(7)所述探针与参考基因组上的至多2个位点匹配;
(8)所述探针选择时的窗口滑动大小为10bp。
28.根据权利要求27所述的方法,其特征在于,所述探针的长度为90bp。
29.根据权利要求27所述的方法,其探针在于,所述探针与目标序列的熔解温度为80摄氏度。
30.一种探针,其是通过权利要求27-29任一项所述的方法制备获得的。
CN201410594702.7A 2014-10-29 2014-10-29 基因组预定区域核酸测序文库的构建方法及装置 Active CN105624272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410594702.7A CN105624272B (zh) 2014-10-29 2014-10-29 基因组预定区域核酸测序文库的构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410594702.7A CN105624272B (zh) 2014-10-29 2014-10-29 基因组预定区域核酸测序文库的构建方法及装置

Publications (2)

Publication Number Publication Date
CN105624272A CN105624272A (zh) 2016-06-01
CN105624272B true CN105624272B (zh) 2019-08-09

Family

ID=56039614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410594702.7A Active CN105624272B (zh) 2014-10-29 2014-10-29 基因组预定区域核酸测序文库的构建方法及装置

Country Status (1)

Country Link
CN (1) CN105624272B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106987905A (zh) * 2017-04-06 2017-07-28 深圳华大基因股份有限公司 一种brca1/2基因检测文库的构建方法和试剂盒
CN110225979B (zh) * 2017-05-23 2024-05-31 深圳华大基因股份有限公司 基于滚环扩增的基因组目标区域富集方法及其应用
CN109207471A (zh) * 2017-06-30 2019-01-15 深圳华大基因股份有限公司 一种构建分片段核酸文库的方法及其应用
JP2020532976A (ja) * 2017-09-14 2020-11-19 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 環状一本鎖dnaライブラリーを生成するための新規な方法
CN109722471B (zh) * 2017-10-27 2022-05-31 深圳华大智造科技股份有限公司 改善文库滚环复制效率均一性的方法、文库构建方法及试剂盒
CN111655868A (zh) * 2018-03-14 2020-09-11 深圳华大生命科学研究院 恶性淋巴瘤标志物及其应用
CN110527724A (zh) * 2018-05-23 2019-12-03 深圳华大智造科技有限公司 一组探针集及其应用
CN112805394B (zh) * 2018-12-07 2024-03-19 深圳华大生命科学研究院 长片段核酸测序的方法
CN111041069B (zh) * 2019-12-26 2021-01-19 人和未来生物科技(长沙)有限公司 一种低起始量dna样本的高通量测序文库构建方法及其应用
CN113122612B (zh) * 2019-12-31 2023-06-27 深圳华大智造科技股份有限公司 一种用于目标区域捕获测序的dna捕获探针制备方法及其应用
CN111524552B (zh) * 2020-04-24 2021-05-11 深圳市儒翰基因科技有限公司 简化基因组测序文库构建分析方法、检测设备及存储介质
WO2021219114A1 (zh) * 2020-04-30 2021-11-04 深圳市真迈生物科技有限公司 测序方法及其分析方法和系统、计算机可读存储介质和电子设备
CN112921076B (zh) * 2021-04-02 2023-04-07 中国农业大学 一种基于靶向捕获测序的猪50k液相芯片的制备方法及其应用
CN113658638B (zh) * 2021-08-20 2022-06-03 江苏先声医学诊断有限公司 一种基于ngs平台的同源重组缺陷的检测方法和质控体系

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101864482A (zh) * 2010-02-10 2010-10-20 深圳出入境检验检疫局动植物检验检疫技术中心 Mlcr探针、二步反应模式和悬浮芯片检测用捕获探针
CN101967684A (zh) * 2010-09-01 2011-02-09 深圳华大基因科技有限公司 一种测序文库及其制备方法、一种末端测序方法和装置
CN102296065A (zh) * 2011-08-04 2011-12-28 盛司潼 用于构建测序文库的系统与方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100028873A1 (en) * 2006-03-14 2010-02-04 Abdelmajid Belouchi Methods and means for nucleic acid sequencing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101864482A (zh) * 2010-02-10 2010-10-20 深圳出入境检验检疫局动植物检验检疫技术中心 Mlcr探针、二步反应模式和悬浮芯片检测用捕获探针
CN101967684A (zh) * 2010-09-01 2011-02-09 深圳华大基因科技有限公司 一种测序文库及其制备方法、一种末端测序方法和装置
CN102296065A (zh) * 2011-08-04 2011-12-28 盛司潼 用于构建测序文库的系统与方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
用于高通量测序的基因组靶序列捕获方法的建立;陈丹;《遗传》;20101231;第32卷(第12期);第1296-1303页 *

Also Published As

Publication number Publication date
CN105624272A (zh) 2016-06-01

Similar Documents

Publication Publication Date Title
CN105624272B (zh) 基因组预定区域核酸测序文库的构建方法及装置
CN102329876B (zh) 一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法
Blumenstiel et al. Targeted exon sequencing by in‐solution hybrid selection
CN106591441B (zh) 基于全基因捕获测序的α和/或β-地中海贫血突变的检测探针、方法、芯片及应用
CN102409047B (zh) 一种构建杂交测序文库的方法
CN105861700B (zh) 一种针对神经肌肉病的高通量检测方法
CN115516109A (zh) 条码化核酸用于检测和测序的方法
WO2020220615A1 (zh) 一种基于竞争性等位pcr构建水稻分子标记图谱的方法及利用其进行育种的应用
US20090123926A1 (en) Method for the diagnosis of genetic diseases by molecular combing and diagnostic kit
CN108753954B (zh) 痴呆相关基因的捕获探针组、试剂盒、文库构建方法和用途
RU2018113795A (ru) Набор зондов для анализа образцов днк и способы их использования
CN107090495B (zh) 与谷子脖长性状相关的分子标记及其检测引物和应用
Itsara et al. Resolving the breakpoints of the 17q21. 31 microdeletion syndrome with next-generation sequencing
CN107922966A (zh) 用于核酸扩增的样品制备
CN103975075A (zh) 一种检测病毒在待测样本中整合方式的探针及其制备方法和应用
LeBlanc et al. Development of a magnetic bead microarray for simultaneous and simple detection of four pestiviruses
CN115109843A (zh) 一种多个水稻性状控制基因变异检测功能标记方法
Baudisch et al. CNV analysis in monozygotic twin pairs discordant for urorectal malformations
JP7034299B2 (ja) ハイスループットシークエンシングに基づくオリゴヌクレオチド配列不純物の分析方法及び使用
Böhme et al. Detection of food spoilage and pathogenic bacteria based on ligation detection reaction coupled to flow‐through hybridization on membranes
CN114540474B (zh) 一种基于暗探针技术的ngs靶向捕获方法及其在差异深度测序中的应用
JPWO2007055255A1 (ja) 複数の識別用核酸配列を増幅する方法
CN109295048A (zh) 一种全基因组分子标记检测的方法
CN115961007A (zh) 一种利用简并引物扩增进行全基因组分子标记开发的方法
CN115725694A (zh) 一种对基因组的一部分进行富集的方法与相关应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant