CN105671644A - 一种基因组混样测序文库的制备方法 - Google Patents

一种基因组混样测序文库的制备方法 Download PDF

Info

Publication number
CN105671644A
CN105671644A CN201610108049.8A CN201610108049A CN105671644A CN 105671644 A CN105671644 A CN 105671644A CN 201610108049 A CN201610108049 A CN 201610108049A CN 105671644 A CN105671644 A CN 105671644A
Authority
CN
China
Prior art keywords
index
label
sequence
sample mixing
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610108049.8A
Other languages
English (en)
Inventor
张洪源
郑媛坤
束礼平
杨冰
范艺翔
王宇峰
何银竹
束礼伟
黄刚
董扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Ice Harbor Biological Science & Technology Co Ltd
Original Assignee
Wuhan Ice Harbor Biological Science & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Ice Harbor Biological Science & Technology Co Ltd filed Critical Wuhan Ice Harbor Biological Science & Technology Co Ltd
Priority to CN201610108049.8A priority Critical patent/CN105671644A/zh
Publication of CN105671644A publication Critical patent/CN105671644A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及分子生物学技术领域,公开了一种基因组混样测序文库的制备方法,包含下述步骤:(1)基因组DNA超声波打断;(2)打断产物进行纯化和末端修复;(3)修复产物进行纯化和接头连接;(4)连接产物纯化回收和浓度测定;(5)混样和片段筛选;(6)片段筛选后的产物进行PCR扩增;(7)纯化PCR产物,得到测序文库;(8)文库质检和上机测序。本发明提供了上述步骤(2)中兼容于Illumina二代测序仪的接头、步骤(2)(3)(4)(7)中对产物进行纯化的方法、步骤(4)中混样的方法以及步骤(6)中PCR扩增体系及程序设置,保证了本发明所提供的建库方法能够快速顺利的进行多个样本混样建库,利用本发明所提供的方法可得到数据均一度好和质量较高的测序数据。

Description

一种基因组混样测序文库的制备方法
技术领域
本发明涉及分子生物学中高通量测序技术的领域。更具体涉及一种基因组混样测序文库的制备方法,它适用于所有真核生物各种样本的重测序或者简化测序,尤其适用于小基因多样本数的重测序或者大基因群体的简化测序。
背景技术
二代测序技术是目前现高通量测序研究中最常用的技术。DNA测序技术经过30多年的发展已经取得重大进展,以高通量为特点的第二代测序技术已经逐步成熟并且商业化。早期的测序技术主要依赖第一代测序,一代测序从传统的化学降解法、双脱氧链终止法以及在它们的基础上发展来的各种DNA测序技术统称为第一代DNA测序技术,其中Sanger法因操作简便,对单个序列检测较快且准确率较高,目前仍得到广泛的应用。第一代测序技术在分子生物学研究中发挥过重要的作用,如人类基因组计划(HumanGenomeProject,HGP)主要基于第一代DNA测序技术完成。但随着人类基因组计划以及其他模式生物的测序工作的完成,我们进入了后基因组时代即功能基因组时代,传统的一代测序方法已经不能满足深度测序和重测序等大规模基因组高通量测序的需求,因此,人类发展出来第二代测序技术。
第二代测序技术主要包括罗氏454公司的GSFLX测序平台、ABI公司的SOLiD测序平台和Illumina公司的SolexaGenomeAnalyzer测序平台以及Solexa的升级版Hiseq测序平台等。第二代测序技术最显著的特征是高通量,一次能对几十万到几百万条DNA分子序列进行测序,使得对一个物种的转录组测序或基因组深度测序变得方便易行。第二代测序技术的主要原理是先将的基因组DNA进行片段化,在两侧加上各自特异的接头,随后用不同的方法产生几百万个空间固定的PCR克隆阵列,然后进行引物杂交和酶延伸反应,对每个延伸反应所掺入的荧光标记进行成像检测就可获取测序数据。454测序的特点是单次读长长大,但单次反应的数据量低。SOLiD测序读长为50bp,单次反应的数据量50G,特点是高通量和高准确度,但成本较高。而Illumina公司的Solexa测序读长为双端读长2×50bp,单次反应的数据量20G,测序成本较低,性价比高。Solexa的升级版Hiseq和桌面式测序仪Miseq以及Nextseq经过近几年的一系列版本的发展,测序通量一致在不断提高,其中Hiseq从早期Hiseq1000和Hiseq2000已经发展到目前的Hiseq2500和Hisq3000/4000等,Hiseq测序平台单次反应可以产生的数据量由300-600G已提升到1.5Tb,双端读长也有50bp提升到了150bp,极大的提升了测序通量,同时降低了测序价格,使得1000美金测一个人类基因组成为了可能。
随着测序技术的发展,测序仪的通量也会随之上升,测序价格也相应降低,大规模多样本数的基因重测序也已实现。但对于一些小基因组,例如真菌基因组大小约2.5~81.15Mb和细胞器基因组如叶绿体基因组大小为120K~217K等,当测序样本数较多时,测序数据量若小于2G时,若对单个文库建单独建库测序,单个样本文库的构建成本将超过其测序成本。本发明专利基于Illumina公司第二代测序平台,设计了含有新的标签(Barcode)序列的接头和含索引(Index)序列的PCR引物,结合NewEnglandBioLabs(NEB)公司的建库试剂,并对建库流程进行改进和优化,设计了一种对多个样本同时构建的混合建库方法,节约了建库成本,同时也提高了建库效率。
发明内容
本发明的目的在于提供了一种基因组混样测序文库的制备方法,我们将设计了多对含有标签(Barcode)序列的接头和含索引(Index)序列的PCR引物对每种打断后的DNA片段进行标记混样和文库构建,这种方式节约了建库试剂,提高了建库的效率。此外,本发明专利设计兼容Illumina二代测序仪特异的接头连接后为双端标签(Barcode),增强了接头互补碱基数,提高了连接效率,可对样品进行精确标记。本发明普遍适于常规分子生物学实验室进行各种样本的重测序或者简化测序,尤其适用于小基因多样本数的重测序或者大基因群体的简化测序。
为了实现上述的目的,本发明采用以下技术方案:
上述种基因组混样测序文库的制备方法的具体流程为:利用超声破碎的方法,分别对每种基因组DNA进行打断,打断后的片段进行磁珠纯化,将设计特异的引物制备成接头(含标签序列)对上述纯化产物进行连接;分别将连接后的产物进行纯化和浓度测定,然后依据所测的每种样本的数据量进行混样;混样后的产物进行片段筛选,回收筛选后的片段利用含索引(Index)序列的引物进行PCR扩增;对PCR产物进行纯化,纯化后的产物即为上机文库,然后对文库浓度和片段范围进行检测;最终将检测合格后的文库利用Illumina公司的二代测序仪进行上机测序。
1、一种基因组混样测序文库的制备方法,其流程示意图如图1所示,具体包括以下步骤:
(1)对需要混样测序样品的基因组DNA进行超声打断,打断的插入片段为350bp。
(2)对超声打断的片段进行纯化,利用NEB末端修复试剂对纯化产物进行末端修复。
(3)对末端修复产物进行纯化,利用特异的含不同标签(Barcode)接头序列分别对纯化产物进行连接反应,连接试剂采用NEB快速连接试剂。
接头的序列如下:
P5-P7-F(5’-3’):ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNN*T
P5-P7-R(5’-3’):/5Phos/YYYYYAGATCGGAAGAGCACACGTCTGAACTCCAGTC
其中,设计的P5-P7-R引物中的五碱基序列YYYYY与P5-P7-F引物中的五碱基序列NNNNN反向互补,其中NNNNN代表标签序列,主要用于标记混样各个样本,标签序列见下表1。此外,/5Phos/代表5’端起始碱基为磷酸基团(-PH3)修饰,*代表硫代磷酸酯化修饰。
(4)对上述连接产物进行纯化,对后续需要混样的纯化产物逐一进行浓度测定。
(5)参照上述纯化产物的浓度和总量,依据所测样本的测序量对纯化产物进行混合,混合后进行片段筛选。片段筛选采用琼脂糖电泳和切胶回收的方法。
(6)利用含索引(Index)序列的PCR引物对上述的回收片段进行PCR扩增,PCR产物利用1.6倍体积的磁珠纯化两次,纯化后的产物即为测序文库。
PCR引物序列为:
F(5’-3’):AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC,
R(5’-3’):CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC。
其中,PCR引物R序列中的NNNNNN代表索引(Index)序列,索引用于标记不同的混样文库,不同混样文库选用不同的索引(Index)引物。本发明总共设计了12种不同索引(Index)接头引物,索引(Index)信息见表1。
(7)纯化PCR产物进行纯化回收即可得到测序文库。
(8)对上述测序文库进行浓度和片段大小范围检测。将文库浓度将检测合格后的文库利用Illumina公司的二代测序仪进行高通量测序。
优选的,如步骤(1)中,打断范围为插入片段350bp,可选用超声打断仪CovarisM220,占空因数(Dutyfactor20%),峰值功率(Peakincidentpower,50W),循环破碎系数(Cyclesperburst,200),持续时间65秒,工作温度20度(℃)。不同的样品的基因组DNA的起始量相同,起始量为100~500ng之间,打断体系为50μL。
优选的,如步骤(2)中,采用NEB修复试剂,体系为修复试剂0.75μl,10倍浓度(10×)的修复缓冲液2μL,片段DNA溶液17.25μL,总体系为20μL。修复条件为20度℃,60分钟(min);65℃,30min;4℃,终止(hold)。
优选的,如步骤(3)中,设计了不同标签(Barcode)的特异接头引物(共10种,表1),采用NEB连接反应试剂,体系为10×T4DNA连接酶缓冲液2μL,加A连连接液3.75μL,接头(浓度为15μM)1μL,连接增强液0.25μL,修复DNA溶液18μL,总体系25μL。连接条件为20℃,90min;4度,hold。
进一步的说,如步骤(5)中,混样根据每个需要测量大小来确定,若所测数据量相同,可进行等量混合,电泳条件为2%琼脂糖凝胶电泳,电泳条件为120V,1.5小时(h)。
进一步的说,如步骤(6)中,采用NEB高保真热启动酶试剂,PCR扩增体系为正反向引物(浓度10μM)各取1μL,混样DNA溶液23μL,PCR扩增溶液(Mix)25μL,总体系50μL。反向引物(R)设计了12种索引(Index)序列。扩增条件为98℃,30秒(sec);98℃,10sec,65℃,30sec,72℃,30sec,8-12循环(cycles);75℃,5min;4℃,Hold。
更进一步的说,如步骤(2)、(3)、(4)和(7)中的纯化为用磁珠进行纯化,纯化时磁珠用量均为1.6×(体积为所纯化溶液的1.6倍)。
表1.Barcode和Index信息表
标签编号 标签序列 索引编号 索引序列
标签1 CTGTA 索引1 CGTGAT
标签2 TAACG 索引2 ACATCG
标签3 AGCAT 索引3 GCCTAA
标签4 GCAGC 索引4 TGGTCA
标签5 AGTAC 索引5 CACTGT
标签6 TCGCA 索引6 ATTGGC
标签7 GACTG 索引7 GATCTG
标签8 CTAGT 索引8 TCAAGT
标签9 GACTC 索引9 CTGATC3 -->
标签10 CTCAG 索引10 AAGCTA
索引11 GTAGCC
索引12 TACAAG
本发明的一种基因组混样测序文库的制备方法主要是基于Illumina高通量测序平台,是大规模重测序中性价比最高和最为切实可行的策略之一。本发明中设计了10种标签序列的接头,单次最多可建一个混合了10个样本的混样池,实际情况可对样本数目进行调整,一般下情况2-4个样本混成一个池进行文库构建较为切实可行。其次本发明专利设计兼容Illumina二代测序仪特异的接头为双端标签(Barcode),提高了接头连接效率,可对样品进行精确标记。另外,我们还设计了12种索引序列的PCR引物,可以同时构建12个混样文库。因此本方法最高可同时建120个样本(10个Barcode×12个Index)的混样文库,极大的节约了建库成本,提高建库效率。
采用上述技术方案后,与现有技术相比,本发明具有以下有益效果:
1、适用性广。本发明适用于所有已知或者未知参考基因组的真核生物物种,可为一般普通分子生物学实验室采用。
2、高通量。本发明利用常规分子操作,设计兼容Illumina二代测序仪特异的接头和PCR引物,极大的提高了检测样本数。
3、数据提取率高。本发明专利设计兼容Illumina二代测序仪特异的接头,接头连接后为双端标签(Barcode),提高了接头连接效率,可对样品进行精确标记,后续下机后数据分装成不同样品对应的数据时提取率高。
4、性价高。本发明采用NEB公司性价比高的建库试剂,对建库流程进行了改进和优化,使得单次建库成本极大降低,若四个样进行混合构建,将节省75%的建库成本
附图说明
下面结合附图和实施例对本发明进一步说明:
图1是混样建库流程示意图。左侧为实验流程,右侧为具体文库序列信息,两边信息相对应。箭头指示为实验流程方向,“。。。”指其他样本,混样样品数可根据实际情况进行调整。
图2是实施示例中混样文库安捷伦2100核酸分析仪片段范围检测结果。左侧图纵轴(FU)表示峰值大小,横轴(bp)表示片段大小范围,两次峰值为参照峰,中间峰为样本检测峰。右侧图为电泳图,上下两条带为参照带,中间为样本检测带。
图3是实施示例中混样文库qPCR浓度定量结果。(A)为文库QPCR定量检测溶解曲线,图中对应的线条的为本实例中样本和标准品的溶解曲线。横轴(Tm)为退火温度,纵轴(-Rn)为标准化报告Rn的倒数。(B)为qPCR产物2%琼脂糖电泳跑胶图,图中左边为文库扩增后产物孔道,右侧为DNAmaker(M)。M为100bpDNAladder,从上到到下依次为1500bp、1000bp、900bp、800bp、700bp、600bp、500bp、400bp、300bp、200bp、100bp。中间最亮带为500bp。
图4是实施示例中Hiseq2500测序仪下机数据质量结果图。(A)为测序数据过滤后结果,纵轴表示数量(M),横轴代表四个样本信息,每个样本左侧柱代表原始数据量,右侧柱代表过滤后数据量。(B)为FastQC数据质量评估结果,纵轴轴代表Q值大小,横轴代表数据长度。Q20处为高质量临界点处,此处代表单个碱基测序质量正确率为99%。
具体实施方式
下面结合说明书附图和实施例,对本发明的具体实施例做进一步详细描述:
下面结合具体实施例,进一步阐述本方法发明。这些实施例仅用于说明本发明而不用于限制本发明要求保护的范围。下列实施例中未注明具体实验条件和方法,实验条件和方法参照相关试剂说明书或者《分子克隆实验指南》(第3版)(J.萨姆布鲁克,D.W.拉塞尔主编,2008出版)。
实施示例四个茄科灯笼草(DC)样本混样测序文库的制备。
表2.混样文库制备中样本、标签序列和索引序列信息表
四个样本分别采用四种标签序列,混样后用同一个含索引物建成一个混样文库。
四个茄科灯笼草(DC)样本混样测序文库的制备包括以下步骤:
(1)DNA样品的提取和超声打断。利用2×CTAB提取液提取4个灯笼草叶片组织的基因组DNA。经液氮研磨、进行酚/氯仿(体积比1:1)抽提、异丙醇沉淀、75%乙醇洗涤和RNA酶处理等步骤后,将DNA溶于50μLTE溶液,Qubit2.0测定浓度。分别取四种样本的DNA,分别取500ng进行超声打断,打断体系为50μL,打断范围为插入片段350bp,可选用超声打断仪CovarisM220,占空因数(dutyfactor20%),峰值功率(peakincidentpower,50W),循环破碎系数(Cyclesperburst,200),持续时间65sec,工作温度20℃。
(2)纯化和修复反应。对上述超声打断的片段进行纯化,纯化时采用AMpureXPBreads磁珠,磁珠用量为1.6×,即90μL,回收体系为17.25μL。利用NEB末端修复试剂对纯化产物进行末端修复,NEB修复试剂(货号#E7371)和修复缓冲液(货号#E7372),体系为修复试剂0.75μl,10×修复缓冲液2μL,回收DNA溶液17.25μL,总体系为20μL。修复条件为20℃,60min;65℃,30min;4℃,终止(hold)。
(3)纯化和接头连接反应。对上述修复反应体系进行纯化,纯化时采用AMpureXPBreads磁珠,磁珠用量为1.6×,即32μL,回收体系为18μL。利用特异的含不同标签(Barcode)接头序列分别对纯化产物进行连接反应,接头信息对应表2。连接试剂采用NEB快速连接反应试剂(货号NEB#E7373)、10×T4DNA连接酶缓冲液(货号NEB#B8001)和连接增强液(货号NEB#E7374)。体系为10×T4DNA连接酶缓冲液2μL,加A快速连接反应试剂3.75μL,接头(浓度为15μM)1μL,连接增强液0.25μL,DNA修复溶液18μL,总体系25μL。连接条件为20℃,90min;4度,hold。
接头的序列如下:
P5-P7-F(5’-3’):ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNN*T
P5-P7-R(5’-3’):/5Phos/YYYYYAGATCGGAAGAGCACACGTCTGAACTCCAGTC
其中,设计的P5-P7-R引物中的五碱基序列YYYYY与P5-P7-F引物中的五碱基序列NNNNN反向互补,其中NNNNN代表标签序列,主要用于标记混样各个样本,接头的标签序列见表2。此外,/5Phos/代表5’端起始碱基为磷酸基团(-PH3)修饰,*代表硫代磷酸酯化修饰。引物序列合成后采用HPLC纯化。
(4)纯化和浓度测定。对上述连接产物进行纯化,对后续需要混样的纯化产物逐一进行浓度测定。片段纯化时加入40μlAMpureXPbreads(1.6X),洗脱体积15μl,取1μl进行Qubit2.0测定浓度,剩余14μl进行后续混样。测定的浓度分别对应DC-1为21.2ng/μl,DC-2为25.7ng/μl,DC-3为18.6ng/μl,DC-4为28.3ng/μl。
(5)纯化、混样和片段筛选。参照上述纯化产物的浓度和总量,依据所测样本的测序量(1G)对纯化产物进行等量混合,每个样本均取250ng进行等量混合。DC-1取11.79μl,DC-2取9.73μl,DC-3取13.44μl,DC-4取8.83μl。混合后进行片段筛选。片段筛选采用2%的琼脂糖电泳,电泳条件为120V,1.5小时(h),切取350-500bp之间的片段进行胶回收,胶回收采用QIAquick胶回收试剂盒(货号cat.No28606),洗脱体积为23μl。
(6)PCR扩增。利用设计的含索引(Index)序列的PCR引物对上述的回收液进行PCR扩增,采用NEB高保真热启动酶试剂(货号NEB#E7374),PCR扩增体系为正反向引物(浓度10μM)各取1μL,上述混样回收后的DNA溶液23μL,PCR扩增溶液(Mix)25μL,总体系50μL。扩增条件为98℃,30秒(sec);98℃,10sec,65℃,30sec,72℃,30sec,10循环(cycles);75℃,5min;4℃,Hold。
PCR引物序列为:
F(5’-3’):AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC
R(5’-3’):CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC
其中,PCR引物R序列中的NNNNNN代表索引(Index)序列,索引用于标记不同的混样文库,不同混样文库选用不同的索引(Index)引物。本实施例1中的索引(Index)信息见表2。引物序列合成后采用HPLC纯化。
(7)PCR产物纯化。PCR产物进行纯化回收后即为测序文库。纯化时采用AMpureXPBreads磁珠,磁珠用量为1.6×,即80μL,纯化两次。最终的回收体系为15μL。
(8)文库质检和上机测序。对上述测序文库进行浓度和片段大小范围检测。浓度>2.0ng/μL、片段范围300-550bp之间和QPCR检测后无二聚体接头污染的文库可进行后续上机测序。文库浓度检测采用Qubit2.0,本实例中混样文库Qubti2.0检测浓度为4.68ng/μL,安捷伦2100核酸分析仪检测显示片段范围为350-550bp之间(图2),QPCR进行绝对定量浓度为16.61nM,QPCR产物用2%琼脂糖电泳检测片段范围主带在300-500之间且无二聚体污染(图3)。文库利用Illumina公司的二代测序仪Hisq2500进行双端(PE125)高通量测序,设定混样文库测序数据量为4G,其中每个样本理论的测序数据量为1G,而实际测序数据量数据总量是4.53G,其中DC-1为0.86G、DC-2为1.28G、DC-3为1.00G和DC-4为1.39G(表3),各样本数据偏移在可控范围内(图4),且可用过滤后的数据(cleandate)大于99%(表3),测序数据质量Q20达到了100%(图4)。
表3.测序下机后混样文库测序数据量及过滤后数据量结果
申请人文库制备结果表明本方法发明能够制备出多个样本的混样测序文库,混样文库可以进行后续的高通量测序,测序下机数据也可于用后续生物信息学分析。据此,本发明专利普遍适于常规分子生物学实验室进行大规模样本的重测序或者简化测序,尤其适用于小基因多样本数的重测序或者大基因群体的简化测序。改进后的文库制备流程成本极大降低,因而本方法发明在同领域中具有极高的性价比。
以上所述,仅是本发明的较佳实施例而已,并非对发明的技术范围作出任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明的技术方案范围内。

Claims (7)

1.一种基因组混样测序文库的制备方法,包括以下步骤:
(1)对需要混样测序样品的基因组DNA进行超声打断,打断的插入片段为350bp;
(2)对超声打断的片段进行纯化,利用NEB末端修复试剂对纯化产物进行末端修复;
(3)对末端修复产物进行纯化,利用特异的含不同标签(Barcode)接头序列分别对纯化产物进行连接反应,连接试剂采用NEB快速连接试剂;
接头的序列如下:
P5-P7-F(5’-3’):ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNN*T
P5-P7-R(5’-3’):/5Phos/YYYYYAGATCGGAAGAGCACACGTCTGAACTCCAGTC
其中,设计的P5-P7-R引物中的五碱基序列YYYYY与P5-P7-F引物中的五碱基序列NNNNN反向互补,其中NNNNN代表标签(Barcode)序列(表1),主要用于标记混样各个样本;
(4)对上述连接产物进行纯化,对后续需要混样的纯化产物逐一进行浓度测定;
(5)参照上述纯化产物的浓度和总量,依据所测样本的测序量对纯化产物进行混合,混合后进行片段筛选,片段筛选采用琼脂糖电泳和切胶回收的方法;
(6)利用含索引(Index)序列的PCR引物对上述的回收片段进行PCR扩增,PCR产物利用1.6倍体积的磁珠纯化两次,纯化后的产物即为测序文库;
PCR引物序列为:
F(5’-3’):AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC,
R(5’-3’):CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC,
其中,PCR引物R序列中的NNNNNN代表索引(Index)序列,索引用于标记不同的混样文库,不同混样文库选用不同的索引(Index)引物;
(7)纯化PCR产物进行纯化回收即可得到测序文库;
(8)对上述测序文库进行浓度和片段大小范围检测;将文库浓度将检测合格后的文库利用Illumina公司的二代测序仪进行高通量测序。
2.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:所述步骤(1)中,打断范围为插入片段350bp,可选用超声打断仪CovarisM220,占空因数(Dutyfactor20%),峰值功率(Peakincidentpower,50W),循环破碎系数(Cyclesperburst,200),持续时间65秒,工作温度20度(℃),不同的样品的基因组DNA的起始量相同,起始量为100~500ng之间,打断体系为50μL。
3.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:所述步骤(2)中,采用NEB修复试剂,体系为修复试剂0.75μl,10倍浓度(10×)的修复缓冲液2μL,片段DNA溶液17.25μL,总体系为20μL,修复条件为20度℃,60分钟(min);65℃,30min;4℃,终止(hold)。
4.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:所述步骤(3)中,设计了不同标签(Barcode)的特异接头引物(共10种,表1),采用NEB连接反应试剂,体系为10×T4DNA连接酶缓冲液2μL,加A连连接液3.75μL,接头(浓度为15μM)1μL,连接增强液0.25μL,修复DNA溶液18μL,总体系25μL,连接条件为20℃,90min;4度,hold。
5.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:所述步骤(5)中,混样根据每个需要测量大小来确定,若所测数据量相同,可进行等量混合;电泳条件为2%琼脂糖凝胶电泳,电泳条件为120V,1.5小时(h),切取350-500bp之间的片段进行回收。
6.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:所述步骤(6)中,采用NEB高保真热启动酶试剂,PCR扩增体系为正反向引物(浓度10μM)各取1μL,混样DNA溶液23μL,PCR扩增溶液(Mix)25μL,总体系50μL,反向引物(R)设计了12种索引(Index)序列;扩增条件为98℃,30秒(sec);98℃,10sec,65℃,30sec,72℃,30sec,8-12循环(cycles);75℃,5min;4℃,Hold。
7.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:步骤(2)、(3)、(4)和(7)中的纯化为用磁珠进行纯化,纯化时磁珠用量均为1.6×(体积为所纯化溶液的1.6倍);
表1.标签(Barcode)和索引(Index)信息表
标签编号 标签序列 索引编号 索引序列 索引编号 索引序列 标签1 CTGTA 索引1 CGTGAT 索引11 GTAGCC 标签2 TAACG 索引2 ACATCG 索引12 TACAAG 标签3 AGCAT 索引3 GCCTAA 标签4 GCAGC 索引4 TGGTCA 标签5 AGTAC 索引5 CACTGT 标签6 TCGCA 索引6 ATTGGC 标签7 GACTG 索引7 GATCTG 标签8 CTAGT 索引8 TCAAGT 标签9 GACTC 索引9 CTGATC 标签10 CTCAG 索引10 AAGCTA
CN201610108049.8A 2016-02-26 2016-02-26 一种基因组混样测序文库的制备方法 Pending CN105671644A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610108049.8A CN105671644A (zh) 2016-02-26 2016-02-26 一种基因组混样测序文库的制备方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610108049.8A CN105671644A (zh) 2016-02-26 2016-02-26 一种基因组混样测序文库的制备方法

Publications (1)

Publication Number Publication Date
CN105671644A true CN105671644A (zh) 2016-06-15

Family

ID=56305399

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610108049.8A Pending CN105671644A (zh) 2016-02-26 2016-02-26 一种基因组混样测序文库的制备方法

Country Status (1)

Country Link
CN (1) CN105671644A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106192023A (zh) * 2016-08-08 2016-12-07 中国科学院北京基因组研究所 一种基于多维Index的多重测序文库构建方法
CN106191045A (zh) * 2016-08-08 2016-12-07 中国科学院北京基因组研究所 用于多重核酸测序的Index和引物
CN106591956A (zh) * 2016-11-15 2017-04-26 上海派森诺医学检验所有限公司 一种测序文库构建方法
CN108018607A (zh) * 2016-10-28 2018-05-11 深圳华大基因股份有限公司 一种提升测序平台文库拆分率的标签序列混库方法和装置
CN108060218A (zh) * 2017-11-14 2018-05-22 广州精科医学检验所有限公司 核酸测序文库中预定范围的核酸片段的筛选方法
CN108642133A (zh) * 2018-05-03 2018-10-12 古博 一种高通量测序标签的应用和文库构建的方法
CN108866155A (zh) * 2018-06-11 2018-11-23 中国农业科学院深圳农业基因组研究所 一种下一代测序文库的制备方法
CN108949905A (zh) * 2017-05-23 2018-12-07 深圳华大基因股份有限公司 对照文库及其构建方法
CN109056077A (zh) * 2018-09-13 2018-12-21 武汉菲沙基因信息有限公司 一种适用于PacBio测序平台的扩增子混样测序文库构建方法
CN109517882A (zh) * 2018-11-09 2019-03-26 广州燃石医学检验所有限公司 一种用于检测独特双端文库标签组合的质控方法及应用
CN110093454A (zh) * 2019-04-24 2019-08-06 南京格致医学检验有限公司 用于多种hpv分型鉴定和基因组整合分析的扩增测序方法
CN111005074A (zh) * 2019-12-19 2020-04-14 江西海普洛斯医学检验实验室有限公司 一种基于illumina测序平台的DNA文库构建试剂盒、文库构建方法和应用
CN111005073A (zh) * 2019-09-29 2020-04-14 深兰科技(上海)有限公司 一种多样本文库的构建方法及装置
CN111534858A (zh) * 2020-04-29 2020-08-14 杭州瑞普基因科技有限公司 用于高通量测序的文库构建方法及高通量测序方法
CN111662969A (zh) * 2020-05-18 2020-09-15 北京优吉科技有限公司 一种基因转录区多变区测序方法
CN111926393A (zh) * 2019-05-13 2020-11-13 苏州金唯智生物科技有限公司 一种测序文库的构建方法及其应用
CN112048543A (zh) * 2019-06-06 2020-12-08 中国农业大学 高通量低成本高碱基准确性的质粒或dna片段的新型测序方法
CN112631562A (zh) * 2020-12-01 2021-04-09 上海欧易生物医学科技有限公司 基于python的二代测序样本混样方法、应用、设备、计算机可读存储介质
WO2024174405A1 (zh) * 2023-02-23 2024-08-29 华智生物技术有限公司 一种用于多样品pooling建库的接头、试剂盒及建库方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102409043A (zh) * 2010-09-21 2012-04-11 深圳华大基因科技有限公司 高通量低成本Fosmid文库构建的方法及其所使用标签和标签接头
CN102978206A (zh) * 2012-11-27 2013-03-20 北京诺禾致源生物信息科技有限公司 一种应用于混合建库的高通量测序接头及其建库方法
US20140213485A1 (en) * 2013-01-28 2014-07-31 Yale University Methods For Preparing cDNA From Low Quantities of Cells
CN104153004A (zh) * 2014-08-11 2014-11-19 上海美吉生物医药科技有限公司 一种用于扩增子测序的建库方法
CN105256379A (zh) * 2015-11-23 2016-01-20 武汉大学 一种新的基因组简化甲基化测序文库的制备方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102409043A (zh) * 2010-09-21 2012-04-11 深圳华大基因科技有限公司 高通量低成本Fosmid文库构建的方法及其所使用标签和标签接头
CN102978206A (zh) * 2012-11-27 2013-03-20 北京诺禾致源生物信息科技有限公司 一种应用于混合建库的高通量测序接头及其建库方法
US20140213485A1 (en) * 2013-01-28 2014-07-31 Yale University Methods For Preparing cDNA From Low Quantities of Cells
CN104153004A (zh) * 2014-08-11 2014-11-19 上海美吉生物医药科技有限公司 一种用于扩增子测序的建库方法
CN105256379A (zh) * 2015-11-23 2016-01-20 武汉大学 一种新的基因组简化甲基化测序文库的制备方法

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106191045A (zh) * 2016-08-08 2016-12-07 中国科学院北京基因组研究所 用于多重核酸测序的Index和引物
CN106192023A (zh) * 2016-08-08 2016-12-07 中国科学院北京基因组研究所 一种基于多维Index的多重测序文库构建方法
CN106191045B (zh) * 2016-08-08 2019-10-11 中国科学院北京基因组研究所 用于多重核酸测序的Index和引物
CN108018607A (zh) * 2016-10-28 2018-05-11 深圳华大基因股份有限公司 一种提升测序平台文库拆分率的标签序列混库方法和装置
CN108018607B (zh) * 2016-10-28 2021-04-27 深圳华大基因股份有限公司 一种提升测序平台文库拆分率的标签序列混库方法和装置
CN106591956A (zh) * 2016-11-15 2017-04-26 上海派森诺医学检验所有限公司 一种测序文库构建方法
CN108949905A (zh) * 2017-05-23 2018-12-07 深圳华大基因股份有限公司 对照文库及其构建方法
CN108060218A (zh) * 2017-11-14 2018-05-22 广州精科医学检验所有限公司 核酸测序文库中预定范围的核酸片段的筛选方法
CN108642133A (zh) * 2018-05-03 2018-10-12 古博 一种高通量测序标签的应用和文库构建的方法
CN108866155A (zh) * 2018-06-11 2018-11-23 中国农业科学院深圳农业基因组研究所 一种下一代测序文库的制备方法
CN108866155B (zh) * 2018-06-11 2022-07-26 中国农业科学院深圳农业基因组研究所 一种下一代测序文库的制备方法
CN109056077A (zh) * 2018-09-13 2018-12-21 武汉菲沙基因信息有限公司 一种适用于PacBio测序平台的扩增子混样测序文库构建方法
CN109517882A (zh) * 2018-11-09 2019-03-26 广州燃石医学检验所有限公司 一种用于检测独特双端文库标签组合的质控方法及应用
CN113957123A (zh) * 2018-11-09 2022-01-21 广州燃石医学检验所有限公司 一种构建和检测含有独特双端文库标签组合的gDNA文库的方法
CN109517882B (zh) * 2018-11-09 2021-08-17 广州燃石医学检验所有限公司 一种用于检测独特双端文库标签组合的质控方法及应用
CN110093454A (zh) * 2019-04-24 2019-08-06 南京格致医学检验有限公司 用于多种hpv分型鉴定和基因组整合分析的扩增测序方法
CN111926393A (zh) * 2019-05-13 2020-11-13 苏州金唯智生物科技有限公司 一种测序文库的构建方法及其应用
CN112048543A (zh) * 2019-06-06 2020-12-08 中国农业大学 高通量低成本高碱基准确性的质粒或dna片段的新型测序方法
CN111005073A (zh) * 2019-09-29 2020-04-14 深兰科技(上海)有限公司 一种多样本文库的构建方法及装置
CN111005074A (zh) * 2019-12-19 2020-04-14 江西海普洛斯医学检验实验室有限公司 一种基于illumina测序平台的DNA文库构建试剂盒、文库构建方法和应用
CN111534858B (zh) * 2020-04-29 2021-07-13 杭州瑞普基因科技有限公司 用于高通量测序的文库构建方法及高通量测序方法
CN111534858A (zh) * 2020-04-29 2020-08-14 杭州瑞普基因科技有限公司 用于高通量测序的文库构建方法及高通量测序方法
CN111662969A (zh) * 2020-05-18 2020-09-15 北京优吉科技有限公司 一种基因转录区多变区测序方法
CN112631562A (zh) * 2020-12-01 2021-04-09 上海欧易生物医学科技有限公司 基于python的二代测序样本混样方法、应用、设备、计算机可读存储介质
WO2024174405A1 (zh) * 2023-02-23 2024-08-29 华智生物技术有限公司 一种用于多样品pooling建库的接头、试剂盒及建库方法

Similar Documents

Publication Publication Date Title
CN105671644A (zh) 一种基因组混样测序文库的制备方法
CN104894651B (zh) 微量起始dna的高通量测序文库构建方法及其所构建的高通量测序文库
KR101795124B1 (ko) 복제 수 변이를 검측하기 위한 방법 및 시스템
CN110546272B (zh) 将衔接子附接至样品核酸的方法
CN107201408B (zh) 一种基于转录组测序开发剑麻ssr引物的方法
CN105734048A (zh) 一种基因组DNA的PCR-free测序文库制备方法
CN103602735B (zh) 利用高通量测序精确测定线粒体dna高频和低频突变的方法
CN104153004A (zh) 一种用于扩增子测序的建库方法
CN108517567B (zh) 用于cfDNA建库的接头、引物组、试剂盒和建库方法
CN108251504A (zh) 一种超快速构建基因组dna测序文库的方法和试剂盒
CN110878334B (zh) 用于扩增子测序的引物及两步pcr建库方法
CN105368930A (zh) 测序基因分型技术中测序酶切组合的确定方法
CN110452959A (zh) 一种黄草乌实时定量pcr内参基因的筛选方法
CN110603327A (zh) Pcr引物对及其应用
CN110970091B (zh) 标签质控的方法及装置
CN104093854A (zh) 表征组合物中的rna的方法和试剂盒
CN108251503A (zh) 一种快速构建链特异性rna高通量测序文库的方法
CN114736951A (zh) 一种小分子rna的高通量测序文库构建方法
CN109136217B (zh) 一种测序文库构建的方法、建库试剂及其应用
CN108588200A (zh) 一种R-Loop高通量测序文库构建方法
CN105256379A (zh) 一种新的基因组简化甲基化测序文库的制备方法
CN113166757A (zh) 核酸文库的制备和分析方法
CN111968706B (zh) 获得目标样本的目标测序数据的方法及对目标样本的序列进行组装的方法
CN103468670B (zh) 全长cDNA核酸线性扩增方法及试剂盒
CN107794257B (zh) 一种dna大片段文库的构建方法及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160615

RJ01 Rejection of invention patent application after publication