CN108866155A - 一种下一代测序文库的制备方法 - Google Patents
一种下一代测序文库的制备方法 Download PDFInfo
- Publication number
- CN108866155A CN108866155A CN201810596876.5A CN201810596876A CN108866155A CN 108866155 A CN108866155 A CN 108866155A CN 201810596876 A CN201810596876 A CN 201810596876A CN 108866155 A CN108866155 A CN 108866155A
- Authority
- CN
- China
- Prior art keywords
- library
- dna
- sequencing
- concentration
- preparation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 62
- 238000002360 preparation method Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000013467 fragmentation Methods 0.000 claims abstract description 27
- 238000006062 fragmentation reaction Methods 0.000 claims abstract description 27
- 238000009826 distribution Methods 0.000 claims abstract description 17
- 238000002156 mixing Methods 0.000 claims abstract description 13
- 238000007481 next generation sequencing Methods 0.000 claims abstract description 12
- 238000001514 detection method Methods 0.000 claims abstract description 11
- 238000001190 Q-PCR Methods 0.000 claims abstract description 10
- 239000012634 fragment Substances 0.000 claims description 25
- 235000002020 sage Nutrition 0.000 claims description 17
- 238000000246 agarose gel electrophoresis Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 8
- 239000000499 gel Substances 0.000 claims description 7
- 239000003292 glue Substances 0.000 claims description 7
- 239000000203 mixture Substances 0.000 claims description 7
- 239000007850 fluorescent dye Substances 0.000 claims description 6
- 238000004064 recycling Methods 0.000 claims description 6
- 239000011324 bead Substances 0.000 claims description 5
- 238000012408 PCR amplification Methods 0.000 claims description 4
- 238000002493 microarray Methods 0.000 claims description 4
- 102000004190 Enzymes Human genes 0.000 claims description 3
- 108090000790 Enzymes Proteins 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 102000003960 Ligases Human genes 0.000 claims description 2
- 108090000364 Ligases Proteins 0.000 claims description 2
- 108090000623 proteins and genes Proteins 0.000 claims 2
- JXASPPWQHFOWPL-UHFFFAOYSA-N Tamarixin Natural products C1=C(O)C(OC)=CC=C1C1=C(OC2C(C(O)C(O)C(CO)O2)O)C(=O)C2=C(O)C=C(O)C=C2O1 JXASPPWQHFOWPL-UHFFFAOYSA-N 0.000 claims 1
- 108020004414 DNA Proteins 0.000 description 104
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000010276 construction Methods 0.000 description 7
- 238000001962 electrophoresis Methods 0.000 description 7
- 102000008579 Transposases Human genes 0.000 description 5
- 108010020764 Transposases Proteins 0.000 description 5
- 238000004445 quantitative analysis Methods 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000005352 clarification Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 241000264288 mixed libraries Species 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 238000012372 quality testing Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 102100035078 ETS-related transcription factor Elf-2 Human genes 0.000 description 1
- 101000877377 Homo sapiens ETS-related transcription factor Elf-2 Proteins 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 235000019441 ethanol Nutrition 0.000 description 1
- RKWPMPQERYDCTB-UHFFFAOYSA-N ethyl n-[4-[benzyl(2-phenylethyl)amino]-2-(4-nitrophenyl)-1h-imidazo[4,5-c]pyridin-6-yl]carbamate Chemical compound N=1C(NC(=O)OCC)=CC=2NC(C=3C=CC(=CC=3)[N+]([O-])=O)=NC=2C=1N(CC=1C=CC=CC=1)CCC1=CC=CC=C1 RKWPMPQERYDCTB-UHFFFAOYSA-N 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种下一代测序文库的制备方法。按照如下步骤进行:DNA定量,在待测DNA片段的两端加上测序时需要的DNA接头序列,DNA文库的浓度和DNA片段长度分布模式的检测,DNA文库混合比例的计算和混合,混合文库的片段选择,被选择DNA文库的检测和定量,被选择DNA文库的测序。本发明的方法将多个文库在PCR后混合在一起进行一次片段分选和Q‑PCR定量,大大的降低了工作量,而且最终的测序数据量在不同样品中的分布没有受到显著影响。
Description
技术领域
本发明属于生物技术领域,具体涉及一种下一代测序文库的制备方法。
背景技术
2015年10月,随着Illumina公司宣布将HiSeq XTM测序系统的应用扩展到非人物种的全基因组测序后,新一代测序(Next-Generation Sequencing,NGS)的成本大幅度下降;2017年1月9日,测序巨头企业Illumina公司在著名的JP摩根健康大会上发布了新的测序系统NovaSeqTM系列仪器,并声称该仪器一次运行的试剂成本比HiSeq XTM低30%,但是数据产出量是HiSeq XTM的3倍,使得未来人类基因组测序的价格进一步降至100美元。HiSeq XTM和NovaSeqTM的推出,也使众多物种的大规模群体重测序项目成为可能。然而,与测序环节技术的快速进步相比,测序文库的构建技术在过去的十年中鲜有实质性的改进和提高,这一点很大程度上限制了NGS的广泛应用,尤其是样品数量多时,测序文库的构建这一步往往成为项目周期和成本的限制因素。
测序文库构建的流程包含三个步骤:第一步,在待测DNA片段的两端加上测序时需要的DNA接头序列;第二步,DNA文库片段选择;第三步,DNA文库中有效DNA片段的准确定量。
在第一个步骤中,目前有两大类在待测DNA片段的两端加上测序时需要的DNA接头序列的方法。第一类一般称为Truseq文库,其大致流程如下:1.根据准备测序的读长,将基因组DNA打断成峰值在300-500bp、但范围弥散分布于200-1000bp的小片段;2.将这些小片段DNA经过末端修复、加腺嘌呤脱氧核糖核苷酸(dATP)尾巴后形成3’端带dATP尾巴的双链DNA分子;3.将3’端带dATP尾巴的双链DNA分子和5’端带胸腺嘧啶脱氧核糖核苷酸(dTTP)的Truseq接头连接;4.根据需要可以用通过聚合酶链式反应(Polymerase Chain Reaction,PCR)扩增连接了接头的DNA片段,或者不用PCR扩增而构建PCR-free的测序文库。另一类在待测DNA片段的两端加上测序时需要的DNA接头序列的方法一般称为转座酶文库。转座酶文库利用Tn5转座酶复合体可以随机切割DNA分子并在切割的位置连接上测序接头的特性,把构建Truseq文库过程中的DNA打断、末端修复、加dATP尾巴、接头连接等过程通过一次转座酶反应完成,大大的简化了文库构建的过程。接头连接上以后,和Truseq文库构建一样,通过PCR扩增获得转座酶文库。
在第一个步骤完成后,无论是Truseq文库还是转座酶文库,其DNA片段的范围都是弥散的分布于大概200-1000bp,因此需要测序文库构建流程中的第二个步骤,即根据测序长度选取跨度大约为100bp的DNA片段进行后续测序反应。比如,如果目的测序长度为双末端150bp(Pair End 150bp),则选择长度为420-520bp(插入片段约300bp,加上两端的接头长度约120-160bp)的DNA片段;如果目的测序长度为双末端250bp(Pair End 250bp),则选择长度为620-720bp。目前一般用磁珠或琼脂糖凝胶切胶的方法选择目的DNA片段,也可以利用Life technology公司开发的预制琼脂糖凝胶电泳系统或Sage Science公司开发的系列仪器(Sage BluePippin、Sage ELF或Sage PippinHT)进行DNA文库片段选择。
在第二个步骤DNA文库片段选择完成后,得到一个DNA长度跨度约为100bp、峰值根据测序长度而异的待测序的文库。由于在文库构建的每一步反应中,酶学反应效率都达不到100%,尤其是Truseq文库的构建需要三次酶学反应,导致最终所得文库中只有部分DNA分子两端都连接上了测序接头。而测序过程中,只有DNA两端均连接上测序接头的DNA分子才能做为模板在测序芯片(Flowcell)上被扩增而产生DNA簇(DNA Cluster),而且模板的浓度对测序数据的产出量和测序质量有重要的影响:如果模板浓度过低,则DNA簇的密度也低,数据产出量也随之就低,导致测序试剂的浪费;如果模板浓度过高,则DNA簇的密度也高,临近的DNA簇上产生的荧光信号会相互干扰,导致数据质量下降,严重时甚至会导致测序失败。因此,需要测序文库构建流程中的第三个步骤,即对DNA文库中两端都带有测序接头的有效DNA片段的准确定量。此外,目前测序仪的通量越来越高,生产中常常需要把多个样品混合在一起进行测序,为了使各样品的数据产出量准确,也需要对单个样品进行准确定量后再根据文库浓度进行文库混合。现在一般常用Q-PCR对文库进行定量。
目前,常规的测序文库构建流程中,需要对每一个样品按照上述三个步骤依次独立进行,工作量很大,效率很低,费时费力。尤其是第二个步骤(DNA文库片段选择)和第三个步骤(DNA文库中有效DNA片段的准确定量),这两个步骤需要的手工操作非常繁杂,虽然可以利用自动化移液工作站替代部分人工操作,但自动化移液站的购置成本昂贵,一般的实验室或公司难以承担。利用琼脂糖凝胶电泳进行文库的片段选择时,为避免不同样品之间相互污染,一个电泳槽最多完成两个样品。一般情况下,每人需要利用12个电泳槽才可以同时处理24个样品,一天最多处理24个样品(上午电泳、切胶,下午做DNA回收)。处理96个样品大约需要4天。Q-PCR对选择的片段进行定量时一般每个样品需要3-5次技术重复,若利用384孔PCR板,每次可以处理大约75-125个样品。这样,完成96个样品的定量也需要1天时间。在这种背景下,常规的测序文库构建方法已经成为下一步大规模群体重测序项目的瓶颈步骤。亟需开发高效率、低手工操作、低成本的测序文库制备方法,打破HiSeq XTM和NovaSeqTM时代常规文库制备、片段选择和文库定量流程对测序的限制瓶颈。
发明内容
本发明的目的在于提供一种高通量、低成本的测序文库制备、片段选择和文库定量的方法。
一种下一代测序文库的制备方法,按照如下步骤进行:
(1)DNA定量:将抽提的基因组DNA取2-5μL,测定基因组DNA的浓度;
(2)在待测DNA片段的两端加上测序时需要的DNA接头序列;
(3)DNA文库的浓度和DNA片段长度分布模式的检测;
(4)DNA文库混合比例的计算和混合:根据每个文库的浓度和该文库中目标片段占的比例,两者相乘即得到该文库中目标片段的浓度,该浓度信息是不同DNA文库混合的依据;根据目标片段的浓度,从每个文库都取相同总量的目标DNA进行混合,获得最终混合的文库;
(5)混合文库的片段选择:将混合好的文库进行片段选择,采用磁珠或琼脂糖凝胶切胶的方法选择目的DNA片段,也可以利用Life technology公司开发的预制琼脂糖凝胶电泳系统或Sage Science公司开发的系列仪器(Sage BluePippin、Sage ELF或SagePippinHT)进行DNA文库片段选择;
(6)被选择DNA文库的检测和定量:采用Fragment analyzer、AgilentBioanalyzer2100或Qsep100检测被选择文库的实际片段大小;文库的定量采用或Q-PCR来测定;
(7)被选择DNA文库的测序:根据文库的浓度,按照Illumina相关仪器的要求,上机测序。
步骤(1)中,测定基因组DNA的浓度采用基于荧光染料的DNA浓度测定方法,所述基于荧光染料的DNA浓度测定方法为或
步骤(2)中,所述在待测DNA片段的两端加上测序时需要的DNA接头序列的方法有2种,第一种方法是将基因组DNA利用超声波打断,然后对其进行末端修复、加A尾巴,然后利用连接酶将DNA接头连接到基因组DNA片段上并通过PCR扩增得到文库;第二种方法是利用Tn5转座酶复合体将DNA打断并连接上DNA接头序列。
步骤(3)中,所述DNA文库的浓度采用或的方法来测定;所述DNA片段分布模式采用Fragment analyzer、Agilent Bioanalyzer 2100或Qsep100来检测。
步骤(4)中,混合的文库的个数可以根据每个文库所需数据量和测序平台而定;常用的Illumina HiseqX每条Lane可产出120Gb的数据(PE150测序),如果每个文库期望获得4G的数据,则可以把30个文库混合在一起。
步骤(5)中,混合文库的片段的回收采用Sage BluePippin、Sage ELF、SagePippinHT或E-Gel。
本发明的有益效果:本发明开发的下一代测序文库的制备方法,主要创新之处是根据文库中目的片段占总文库的比例对目的片段进行定量,根据目的片段的浓度将多个不同的文库混合在一起进行后续的片段分选和Q-PCR定量。和传统方法相比,本发明的方法将多个文库在PCR后混合在一起进行一次片段分选和Q-PCR定量,大大的降低了工作量,而且最终的测序数据量在不同样品中的分布没有受到显著影响。
附图说明
图1为水稻基因组DNA质量检测琼脂糖凝胶电泳图。
图2为Agilent Bioanalyzer 2100检测文库的片段分布图。
图3为30个样品混合测序的数据量分布图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步说明。
实施例1
以30份水稻基因组DNA的文库构建过程为例,所用水稻DNA的琼脂糖凝胶电泳检测结果如图1所示(部分样品),所有DNA条带完整、清晰,质量符合文库构建要求。操作步骤如下:
1.DNA的定量
1.1利用琼脂糖凝胶电泳对水稻基因组DNA进行质量检测,本实施例中DNA质量检测的结果如图1。
1.2Qubit定量的步骤
dsDNA High Sensitivity Kit测定DNA的浓度。本实施例中,30份水稻DNA的浓度如表1:
表1
2.在待测DNA片段的两端连接测序时需要的DNA接头序列
利用转座酶待测DNA片段的两端加上测序时需要的DNA接头序列,使用TruePrepTMDNA Library Prep Kit V2for Illumina进行实验,具体操作步骤如下:
(1)基因组DNA的片段化,连接接头
1)在灭菌PCR管中配置如表2反应体系:
表2
2)使用移液器轻轻吹打5次充分混匀;
3)样品放置PCR仪中,程序如表3所示:
表3
(2)片段化DNA样品的纯化
1)加入90μL VAHTS DNA Clean Beads涡旋振荡或使用移液器吹打10次充分混匀,室温孵育5min;
2)将反应管瞬时离心并置于磁力架上,待溶液澄清后(约5min)小心移除上清;
3)保持反应管始终处于磁力架上,加入500μL新鲜配制的80%乙醇,室温孵育30sec,小心移除上清;
4)重复步骤3)一次;
5)保持反应管始终处于磁力架上,开盖空气干燥约5min;
6)将反应管从磁力架上取出,加入26μL Nuclease-free water混匀,室温孵育5min。
7)将反应管短暂离心并置于磁力架上,待溶液澄清后(约5min)小心吸取24μL上清至新的无菌PCR管中。
(3)PCR富集
1)将PCR管置于冰上,配置如表4反应体系:
表4
*TruePrepTM Index Kit V2for(Vazyme#TD202)中提供8种N5XX和12种N7XX,可根据样品数量和Index搭配策略自行选择。
2)使用移液器轻轻吹打5次充分混匀;
3)样品放置PCR仪中,程序如表5所示:
表5
(4)文库的纯化参照步骤(2)纯化过程。
3.DNA文库的浓度和DNA片段长度分布模式的检测
3.1DNA文库的浓度可以利用基于荧光染料的方法来检测,本实施例中利用Qubit来检测,获得DNA文库的浓度信息如表6:
表6
3.2DNA文库的片段长度分布模式可以利用Agilent Bioanalyzer 2100或Qsep100来检测,本实施例中利用Agilent Bioanalyzer 2100。根据测序需求,选择适宜测序的片段大小的区间。本实施例选择的区间范围是420bp-520bp,统计其占总片段分布的百分比。Agilent Bioanalyzer 2100统计30个样品420bp-520bp区间分布比例结果如表7所示:
表7
4.DNA文库混合比例的计算和混合
为了能够将不同的文库混合在一起进行后续的操作,需要知道上一步得到的文库的浓度和DNA片段长度分布的情况,浓度如前所述可以基于荧光染料的方法,例如或来测定,DNA片段分布模式可以用Fragment analyzer、AgilentBioanalyzer 2100、Qsep100等仪器来检测。
根据每个文库的浓度和该文库中目标片段(比如420-520bp区间)所占的比例,两者相乘可以得到该文库目标片段的浓度,该浓度是不同DNA文库混合的依据。根据目标片段的浓度,每个文库都取相同总量的目标DNA进行混合,由此计算出每个样品混合时需要的体积。本实施例中目标片段取5ng,对应每个样品文库的体积如表8所示。本实施例中利用Illumina HiseqX测序,每条Lane可产出大约120-130Gb的数据(PE150测序),将30个文库混合在一起在一条Lane上测序,每个文库期望获得约4G的数据。
表8
5.混合文库的片段选择
将混合好的文库进行片段选择,可以用磁珠或琼脂糖凝胶切胶的方法选择目的DNA片段,也可以利用Life technology公司开发的预制琼脂糖凝胶电泳系统或Sage Science公司开发的系列仪器(Sage BluePippin、Sage ELF或Sage PippinHT)进行DNA文库片段选择。本实施例利用Sage science公司的Sage ELF进行片段选择。具体操作可为:取30个样品对应体积的文库混合均匀后,吸取50μL,然后再加入10μL 6×loadingbuffer混合均匀,加入Sage ELF2%琼脂糖凝胶DNA回收胶盒(Cassette)中,设定“时间”模式电泳120min,回收不同的片段。
6.被选择DNA文库的检测和定量
本实施例利用dsDNA High Sensitivity Kit检测分选回收的DNA的浓度。并利用Agilent Bioanalyzer 2100来检测文库的片段分布(图2)。文库的定量可以利用或测定,也可以利用Q-PCR来定量,本实施例中利用Q-PCR定量。
7.DNA文库的测序
根据步骤6中所得文库浓度,按照Illumina相关仪器的要求,上机测序。
本发明以单人处理96个样品为例。常规的测序文库构建方法中,第一步,在待测DNA片段的两端加上测序时需要的DNA接头序列,一般需要2天时间;第二步,DNA文库片段选择,利用琼脂糖凝胶电泳进行文库的片段选择时,为避免不同样品间的相互污染,一个电泳槽最多可完成2个样品的分选。一般情况下,每人需要利用12个电泳槽才可以同时处理24个样品,一天最多处理24个样品(上午电泳、切胶,下午做DNA回收)。处理96个样品大约需要4天;第三步,DNA文库中有效DNA片段的准确定量,一般每个样品利用Q-PCR对选择的片段进行定量时需要3-5次技术重复。若利用384孔PCR板,每次可以处理大约75-125个样品。这样,完成96个样品的定量也需要1天时间。综合起来,一个人需要7天时间才能完成96份样品的处理。
而利用本发明的方法,同样对于一个人处理96个样品而言,第一步,在待测DNA片段的两端加上测序时需要的DNA接头序列,需要1天;第二步,DNA文库片段选择,我们可以把96个样品每24个混合在一起,0.5天即可轻松完成4个混合样品的片段选择;第三步,DNA文库中有效DNA片段的准确定量,0.5天即可完成。综合起来,一个人需要用2天时间即可以处理96份样品,而且需要的手工操作时间也比传统方法少。更重要的是,虽然本发明没有对单个样品进行定量,但是最终的测序数据量在不同样品中的分布仍然很均匀。(以30个样品混库测序为例,每个样品预期4G数据量,如图3)。
Claims (7)
1.一种下一代测序文库的制备方法,其特征在于,按照如下步骤进行:
(1)DNA定量:将抽提的基因组DNA取2-5μL,测定基因组DNA的浓度;
(2)在待测DNA片段的两端加上测序时需要的DNA接头序列;
(3)DNA文库的浓度和DNA片段长度分布模式的检测;
(4)DNA文库混合比例的计算和混合:根据每个文库的浓度和该文库中目标片段占的比例,两者相乘即得到该文库中目标片段的浓度,该浓度信息是不同DNA文库混合的依据;根据目标片段的浓度,从每个文库都取相同总量的目标DNA进行混合,获得最终混合的文库;
(5)混合文库的片段选择:将混合好的文库进行片段选择,可以用磁珠或琼脂糖凝胶切胶的方法选择目的DNA片段,也可以利用Life technology公司开发的预制琼脂糖凝胶电泳系统或Sage Science公司开发的Sage BluePippin、Sage ELF或Sage PippinHT,进行DNA文库片段选择;
(6)被选择DNA文库的检测和定量:采用Fragment analyzer、Agilent Bioanalyzer2100或Qsep100检测被选择文库的实际片段大小;文库的定量采用或Q-PCR来测定;
(7)被选择DNA文库的测序:根据文库的浓度,按照Illumina相关仪器的要求,上机测序。
2.根据权利要求1所述下一代测序文库的制备方法,其特征在于,步骤(1)中,测定基因组DNA的浓度采用基于荧光染料的DNA浓度测定方法,所述基于荧光染料的DNA浓度测定方法为或
3.根据权利要求1所述下一代测序文库的制备方法,其特征在于,步骤(2)中,所述在待测DNA片段的两端加上测序时需要的DNA接头序列的方法有2种,第一种方法是将基因组DNA利用超声波打断,然后对其进行末端修复、加A尾巴,然后利用连接酶将DNA接头连接到基因组DNA片段上并通过PCR扩增得到文库;第二种方法是利用Tn5转座酶复合体将DNA打断并连接上DNA接头序列。
4.根据权利要求1所述下一代测序文库的制备方法,其特征在于,步骤(3)中,所述DNA文库的浓度采用或的方法来测定;所述DNA片段分布模式采用Fragment analyzer、Agilent Bioanalyzer 2100或Qsep100来检测。
5.根据权利要求1所述下一代测序文库的制备方法,其特征在于,步骤(4)中,混合的文库的个数可以根据每个文库所需数据量和测序平台而定;常用的Illumina HiseqX每条Lane可产出120Gb的数据,如果每个文库期望获得4G的数据,则可以把30个文库混合在一起。
6.根据权利要求1所述下一代测序文库的制备方法,其特征在于,步骤(5)中,混合文库的片段的回收采用Sage BluePippin、Sage ELF、Sage PippinHT,或E-Gel。
7.根据权利要求1所述下一代测序文库的制备原理与方法,其特征在于,不仅局限于DNA文库的制备,也可以用于其它下一代测序文库,按照本方法的原理制备的测序文库,不仅适用于Illumina测序平台,也适用于其它下一代测序平台。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810596876.5A CN108866155B (zh) | 2018-06-11 | 2018-06-11 | 一种下一代测序文库的制备方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810596876.5A CN108866155B (zh) | 2018-06-11 | 2018-06-11 | 一种下一代测序文库的制备方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108866155A true CN108866155A (zh) | 2018-11-23 |
CN108866155B CN108866155B (zh) | 2022-07-26 |
Family
ID=64338757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810596876.5A Active CN108866155B (zh) | 2018-06-11 | 2018-06-11 | 一种下一代测序文库的制备方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108866155B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109881257A (zh) * | 2019-03-04 | 2019-06-14 | 浙江大学 | 一种单条秀丽隐杆线虫转录组测序文库的构建方法及测序方法 |
CN112867800A (zh) * | 2018-12-17 | 2021-05-28 | Illumina公司 | 用于制备测序文库的方法和手段 |
CN113588392A (zh) * | 2021-07-28 | 2021-11-02 | 北京金匙基因科技有限公司 | 一种改善测序混样均匀性的定量混样方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103088433A (zh) * | 2011-11-02 | 2013-05-08 | 深圳华大基因科技有限公司 | 全基因组甲基化高通量测序文库的构建方法及其应用 |
CN104711250A (zh) * | 2015-01-26 | 2015-06-17 | 北京百迈客生物科技有限公司 | 一种长片段核酸文库的构建方法 |
JP2015173626A (ja) * | 2014-03-14 | 2015-10-05 | ジェノダイブファーマ株式会社 | 次世代シークエンサーのためのdnaライブラリー調製方法 |
EP2929056A1 (en) * | 2012-12-10 | 2015-10-14 | Resolution Bioscience, Inc. | Methods for targeted genomic analysis |
CN105002570A (zh) * | 2015-07-21 | 2015-10-28 | 中国农业科学院深圳农业基因组研究所 | 一种一次制备多个dna大片段插入双末端测序文库的方法 |
CN105200530A (zh) * | 2015-10-13 | 2015-12-30 | 北京百迈客生物科技有限公司 | 一种适用于高通量全基因组测序的多样品混合文库的构建方法 |
CN105506125A (zh) * | 2016-01-12 | 2016-04-20 | 上海美吉生物医药科技有限公司 | 一种dna的测序方法及一种二代测序文库 |
CN105671644A (zh) * | 2016-02-26 | 2016-06-15 | 武汉冰港生物科技有限公司 | 一种基因组混样测序文库的制备方法 |
CN105861700A (zh) * | 2016-05-17 | 2016-08-17 | 湖州昂朴医学检验有限公司 | 一种针对神经肌肉病的高通量检测方法 |
CN106554957A (zh) * | 2015-09-30 | 2017-04-05 | 中国农业科学院深圳农业基因组研究所 | 测序文库及其制备和应用 |
WO2017178655A1 (en) * | 2016-04-15 | 2017-10-19 | Menarini Silicon Biosystems S.P.A. | Method and kit for the generation of dna libraries for massively parallel sequencing |
CN107699957A (zh) * | 2017-05-27 | 2018-02-16 | 领星生物科技(上海)有限公司 | 基于dna的融合基因定量测序建库、检测方法及其应用 |
-
2018
- 2018-06-11 CN CN201810596876.5A patent/CN108866155B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103088433A (zh) * | 2011-11-02 | 2013-05-08 | 深圳华大基因科技有限公司 | 全基因组甲基化高通量测序文库的构建方法及其应用 |
EP2929056A1 (en) * | 2012-12-10 | 2015-10-14 | Resolution Bioscience, Inc. | Methods for targeted genomic analysis |
JP2015173626A (ja) * | 2014-03-14 | 2015-10-05 | ジェノダイブファーマ株式会社 | 次世代シークエンサーのためのdnaライブラリー調製方法 |
CN104711250A (zh) * | 2015-01-26 | 2015-06-17 | 北京百迈客生物科技有限公司 | 一种长片段核酸文库的构建方法 |
CN105002570A (zh) * | 2015-07-21 | 2015-10-28 | 中国农业科学院深圳农业基因组研究所 | 一种一次制备多个dna大片段插入双末端测序文库的方法 |
CN106554957A (zh) * | 2015-09-30 | 2017-04-05 | 中国农业科学院深圳农业基因组研究所 | 测序文库及其制备和应用 |
CN105200530A (zh) * | 2015-10-13 | 2015-12-30 | 北京百迈客生物科技有限公司 | 一种适用于高通量全基因组测序的多样品混合文库的构建方法 |
CN105506125A (zh) * | 2016-01-12 | 2016-04-20 | 上海美吉生物医药科技有限公司 | 一种dna的测序方法及一种二代测序文库 |
CN105671644A (zh) * | 2016-02-26 | 2016-06-15 | 武汉冰港生物科技有限公司 | 一种基因组混样测序文库的制备方法 |
WO2017178655A1 (en) * | 2016-04-15 | 2017-10-19 | Menarini Silicon Biosystems S.P.A. | Method and kit for the generation of dna libraries for massively parallel sequencing |
CN105861700A (zh) * | 2016-05-17 | 2016-08-17 | 湖州昂朴医学检验有限公司 | 一种针对神经肌肉病的高通量检测方法 |
CN107699957A (zh) * | 2017-05-27 | 2018-02-16 | 领星生物科技(上海)有限公司 | 基于dna的融合基因定量测序建库、检测方法及其应用 |
Non-Patent Citations (3)
Title |
---|
PENG LUO等: "A Novel and Simple PCR Walking Method for Rapid Acquisition of Long DNA Sequence Flanking a Known Site in Microbial Genome", 《MOL BIOTECHNOL》 * |
XIANBO JIA等: "Linear and exponential TAIL-PCR: a method for efficient and quick amplification of flanking sequences adjacent to Tn5 transposon insertion sites", 《AMB EXPRESS》 * |
YAO-GUANG LIU 等: "High-efficiency thermal asymmetric interlaced PCR for amplification of unknown flanking sequences", 《BIOTECHNIQUES》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112867800A (zh) * | 2018-12-17 | 2021-05-28 | Illumina公司 | 用于制备测序文库的方法和手段 |
CN109881257A (zh) * | 2019-03-04 | 2019-06-14 | 浙江大学 | 一种单条秀丽隐杆线虫转录组测序文库的构建方法及测序方法 |
CN113588392A (zh) * | 2021-07-28 | 2021-11-02 | 北京金匙基因科技有限公司 | 一种改善测序混样均匀性的定量混样方法 |
CN113588392B (zh) * | 2021-07-28 | 2022-03-04 | 北京金匙基因科技有限公司 | 一种改善测序混样均匀性的定量混样方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108866155B (zh) | 2022-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bentolila et al. | Comprehensive high-resolution analysis of the role of an Arabidopsis gene family in RNA editing | |
Borgström et al. | Large scale library generation for high throughput sequencing | |
CN108866155A (zh) | 一种下一代测序文库的制备方法 | |
CN111808854B (zh) | 带有分子条码的平衡接头及快速构建转录组文库的方法 | |
CN104899474B (zh) | 基于岭回归矫正MB‑seq甲基化水平的方法及系统 | |
CN105734048A (zh) | 一种基因组DNA的PCR-free测序文库制备方法 | |
Negi et al. | Applications and challenges of microarray and RNA-sequencing | |
CN105087560B (zh) | 一种基于高通量测序构建猪bcr重链文库的多重pcr引物和方法 | |
CN110656157A (zh) | 用于高通量测序样本溯源的质控品及其设计和使用方法 | |
CN111304300A (zh) | 一种检测待测样品中各个微生物物种的基因组dna拷贝数的方法 | |
CN114507749B (zh) | 一种准确检测玉米转基因成分的引物组、试剂盒及方法 | |
CN108932401B (zh) | 一种测序样本的标识方法及其应用 | |
WO2024104130A1 (zh) | 一种利用简并引物扩增进行全基因组分子标记开发的方法 | |
CN108733974B (zh) | 一种基于高通量测序的线粒体序列拼接及拷贝数测定的方法 | |
CN115798590A (zh) | 一种样本溯源方法、样本保存器皿、设备及可读存储介质 | |
CN111500691A (zh) | 微生物高通量dna测序数据的质量控制标准品和质量控制方法 | |
CN111394800A (zh) | 一种评估无参物种酵母双杂交文库质量的方法 | |
CN112481390A (zh) | 转基因溶菌酶羊品系特异性微滴式数字pcr引物及基于该引物的检测方法 | |
CN105648100A (zh) | 小鼠短串联重复序列的复合扩增体系及检测试剂盒 | |
CN109266718A (zh) | 检测核酸内切酶存在的方法 | |
CN114774566B (zh) | 检测棉花转基因成分的引物对组合、试剂盒及检测方法 | |
CN118335195B (zh) | 一种基于高通量测序数据的str分型方法 | |
CN118389706B (zh) | 一种用于鳜鱼基因分型的标记组合及应用其的全基因组液相芯片 | |
CN118028493B (zh) | 包含73个多态性dip位点的复合扩增检测体系及其应用 | |
CN114807309A (zh) | 一种文库标签引物的质控方法及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230726 Address after: No.7 Pengfei Road, Dapeng New District, Shenzhen, Guangdong 518000 Patentee after: SHENZHEN ZHONGNONG JINGYUE BIOTECHNOLOGY CO.,LTD. Address before: 518120 Pengfei Road, Dapeng new area, Shenzhen, Guangdong Province, No. 7 Patentee before: AGRICULTURAL GENOMICS INSTITUTE AT SHENZHEN, CHINESE ACADEMY OF AGRICULTURAL SCIENCES |
|
TR01 | Transfer of patent right |