CN116064753A - 高效率的测序文库的构建方法及引物组和试剂盒 - Google Patents
高效率的测序文库的构建方法及引物组和试剂盒 Download PDFInfo
- Publication number
- CN116064753A CN116064753A CN202211026828.5A CN202211026828A CN116064753A CN 116064753 A CN116064753 A CN 116064753A CN 202211026828 A CN202211026828 A CN 202211026828A CN 116064753 A CN116064753 A CN 116064753A
- Authority
- CN
- China
- Prior art keywords
- primer
- sequencing
- sequence
- tag sequence
- pcr amplification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 187
- 238000010276 construction Methods 0.000 title claims abstract description 29
- 108091093088 Amplicon Proteins 0.000 claims abstract description 98
- 238000012408 PCR amplification Methods 0.000 claims abstract description 53
- 238000000034 method Methods 0.000 claims abstract description 26
- 108020004414 DNA Proteins 0.000 claims abstract description 25
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 23
- 230000003321 amplification Effects 0.000 claims abstract description 22
- 230000002441 reversible effect Effects 0.000 claims abstract description 15
- 239000011324 bead Substances 0.000 claims description 19
- 238000000746 purification Methods 0.000 claims description 17
- 239000008280 blood Substances 0.000 claims description 3
- 210000004369 blood Anatomy 0.000 claims description 3
- 210000003296 saliva Anatomy 0.000 claims description 3
- 210000001519 tissue Anatomy 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 description 24
- 239000000047 product Substances 0.000 description 21
- 239000012634 fragment Substances 0.000 description 16
- 238000007403 mPCR Methods 0.000 description 11
- 238000000137 annealing Methods 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 239000012264 purified product Substances 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000012864 cross contamination Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 239000013067 intermediate product Substances 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 101710178035 Chorismate synthase 2 Proteins 0.000 description 2
- 101710152694 Cysteine synthase 2 Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- MXCVHSXCXPHOLP-UHFFFAOYSA-N 4-oxo-6-propylchromene-2-carboxylic acid Chemical compound O1C(C(O)=O)=CC(=O)C2=CC(CCC)=CC=C21 MXCVHSXCXPHOLP-UHFFFAOYSA-N 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 208000027205 Congenital disease Diseases 0.000 description 1
- 102100023381 Cyanocobalamin reductase / alkylcobalamin dealkylase Human genes 0.000 description 1
- 101710164985 Cyanocobalamin reductase / alkylcobalamin dealkylase Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101000581533 Homo sapiens Methylcrotonoyl-CoA carboxylase beta chain, mitochondrial Proteins 0.000 description 1
- 101001056160 Homo sapiens Methylcrotonoyl-CoA carboxylase subunit alpha, mitochondrial Proteins 0.000 description 1
- 101001126977 Homo sapiens Methylmalonyl-CoA mutase, mitochondrial Proteins 0.000 description 1
- 101001098989 Homo sapiens Propionyl-CoA carboxylase alpha chain, mitochondrial Proteins 0.000 description 1
- 101001098982 Homo sapiens Propionyl-CoA carboxylase beta chain, mitochondrial Proteins 0.000 description 1
- 102100025392 Isovaleryl-CoA dehydrogenase, mitochondrial Human genes 0.000 description 1
- 101710201965 Isovaleryl-CoA dehydrogenase, mitochondrial Proteins 0.000 description 1
- 102100027320 Methylcrotonoyl-CoA carboxylase beta chain, mitochondrial Human genes 0.000 description 1
- 102100026552 Methylcrotonoyl-CoA carboxylase subunit alpha, mitochondrial Human genes 0.000 description 1
- 102100030979 Methylmalonyl-CoA mutase, mitochondrial Human genes 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102100039022 Propionyl-CoA carboxylase alpha chain, mitochondrial Human genes 0.000 description 1
- 102100039025 Propionyl-CoA carboxylase beta chain, mitochondrial Human genes 0.000 description 1
- 108091006736 SLC22A5 Proteins 0.000 description 1
- 102100036924 Solute carrier family 22 member 5 Human genes 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000009609 prenatal screening Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明描述了一种高效率的测序文库的构建方法、引物组和试剂盒,构建方法包括:获得多个样本的DNA;利用第一引物、第二引物和第三引物对每个样本的DNA进行第一PCR扩增;将多个样本的扩增产物合并为一管;利用第四引物和第五引物对合并后的扩增产物进行第二PCR扩增,得到测序文库;第一引物为第一测序标签序列和扩增子特异性正向引物;第二引物为第二测序标签序列和扩增子特异性反向引物;第三引物第二测序接头序列、样本标签序列和第二测序标签序列;样本标签序列用于标记不同的样本;第四引物为第一测序接头序列和第一测序标签序列;第五引物为第二测序接头序列。根据本发明,能够提供一种高效率的测序文库的构建方法、引物组和试剂盒。
Description
本申请是申请日为2018年08月28日、申请号为201810986265.1、发明名称为扩增 子测序文库的构建方法及引物组和试剂盒的专利申请的分案申请。
技术领域
本发明属于基因测序技术领域,具体涉及一种高效率的测序文库的构建方法及引物组和试剂盒。
背景技术
随着近年来资讯通量的激增,高通量测序技术在生命科学及医学领域方面的研究和应用越来越广泛,特别是在疾病诊断及预防中发挥重要作用,其主要表现在产前筛查、肿瘤诊断、重大疾病预防、健康相关宏基因组分析等方面。虽然人类全基因组测序从测序时间和资金花费上已有了巨大的飞跃,但庞大的数据分析和遗传信息提取将费时费力,相比较而言,全外显子测序、基因Panel的测序将直击可能引起疾病的大部分基因序列,而扩增子测序更强的目的性及快速的数据分析和少量资金花费等优点将更有利于用于临床疾病检测,如作为新生儿筛查的二线检测,采用illumina第二代高通量测序平台对新生儿样本进行某些先天代谢疾病基因深度测序,能灵敏地将那些携带先天疾病的新生儿在临床症状尚未表现之前或表现轻微时检测出来,通过筛查,得以早期诊断、早期治疗,防止机体组织器官发生不可逆的损伤。
聚合酶链反应(即PCR)是一种广泛运用于分子遗传和诊断的技术,用于放大扩增特定的DNA片段,可看作是生物体外的特殊DNA复制。PCR的最大特点是将样品中微量的DNA大幅增加,达到可检测的水平。扩增子测序则是对特定长度的PCR产物或者捕获的片段进行测序,由于低廉的价格和简便的操作,多重PCR是目标区段富集技术的重要手段。面对大量复杂基因组样本的目标区段捕获,多重PCR技术由于特异性强、价格低、重复性好等优点,已成为首选技术。
目前,基于Illumina测序平台的扩增子建库主要采用传统的两步扩增建库方法,即使用两对引物进行两轮PCR进行建库。两对引物的两步扩增方法虽然可以直接使用Illumina相配套的试剂进行测序,但建库过程中当样本量较多时,而且,由于在第一轮扩增时没有加入样本标签,使后续操作繁琐且容易引起样本间的交叉污染。即常用的两轮PCR扩增子建库方法一方面需对每个样本单独建库,不能将大批量的样本合并统一处理,操作繁琐、建库效率低,易引起样本间的交叉污染;另一方面,在多重PCR反应中,随着引物对数的增加,引物二聚体和非特异扩增产物会急剧增加,进而导致不同目标片段的拷贝数差异巨大,无法得到均一的产物;再次,采用的建库引物合并了公用序列,使引物合成时不仅需要合成大量的特异性引物,还需合成等量的公用序列,耗费成本大,同时由于引物序列太长,降低了PCR扩增效率,文库的覆盖度及均一性受到影响。
发明内容
本发明的目的在于克服现有技术的上述不足,提供一种扩增子测序文库的构建方法及引物组和试剂盒,旨在解决现有扩增子两步建库法的效率低、成本高,以及文库的覆盖度和均一性差的技术问题。
为实现上述发明目的,本发明采用的技术方案如下:
本发明一方面提供一种扩增子测序文库的构建方法,包括如下步骤:
获得样本DNA;
利用第一引物、第二引物和第三引物对所述样本DNA进行第一PCR扩增,得到扩增产物;
利用第四引物和第五引物对所述扩增产物进行第二PCR扩增,得到扩增子测序文库;
其中,
所述第一引物从5’端到3’端依次为第一测序标签序列和扩增子特异性正向引物;
所述第二引物从5’端到3’端依次为第二测序标签序列和扩增子特异性反向引物;
所述第三引物从5’端到3’端依次为第二测序接头序列、样本标签序列和所述第二测序标签序列;
所述第四引物从5’端到3’端依次为第一测序接头序列和所述第一测序标签序列;
所述第五引物为所述第二测序接头序列。
本发明提供的扩增子测序文库的构建方法中,首先提取样本DNA,然后利用本发明设计的引物组进行两轮PCR扩增得到;在两轮PCR扩增中:先以第一引物、第二引物和第三引物进行第一轮PCR得到所有扩增子目的片段,该过程中对不同样本来源的所有扩增子目的片段的5’端加上第一测序标签序列,3’端加上依次连接的第二测序标签序列、样本标签序列和第二测序接头序列,因样本标签序列可标记不同的样本,所以第一轮PCR扩增完成后即可将所有样本的扩增产物合并为一管,然后以第一轮PCR的纯化产物为模板,用第四引物和第五引物进行第二轮PCR,将第一测序接头序列添加到第一轮PCR扩增产物的5’端,从而完成扩增子测序文库的构建。该构建方法可大大地节省试剂和工作量,降低成本,而且两轮PCR的扩增效率都很高,最终构建的扩增子测序文库具有更好的覆盖度和均一性。
本发明另一方面提供一种用于扩增子测序文库构建的引物组,所述引物组包括:用于第一PCR扩增的第一引物、第二引物和第三引物,以及用于第二PCR扩增的第四引物和第五引物;其中,
所述第一引物从5’端到3’端依次为第一测序标签序列和扩增子特异性正向引物;
所述第二引物从5’端到3’端依次为第二测序标签序列和扩增子特异性反向引物;
所述第三引物从5’端到3’端依次为第二测序接头序列、样本标签序列和所述第二测序标签序列;
所述第四引物从5’端到3’端依次为第一测序接头序列和所述第一测序标签序列;
所述第五引物为所述第二测序接头序列。
本发明提供的用于扩增子测序文库构建的引物组,第一引物、第二引物和第三引物用于第一PCR扩增,第四引物和第五引物用于第二PCR扩增;该引物组用于扩增子测序文库构建时,在第一轮PCR扩增过程中,可通过该特有结构的三条引物(第一引物、第二引物和第三引物)使所有扩增子目的片段的5’端加上第一测序标签序列,3’端加上依次连接的第二测序标签、样本标签序列和第二测序接头序列,因样本标签序列可标记不同的样本,所以第一PCR扩增完成后即可将所有样本的扩增产物合并为一管,然后直接用第四引物和第五引物进行第二PCR扩增,完成测序文库构建,这样可大大地节省试剂和减少工作量;而且第三引物中的第二测序接头序列、样本标签序列和第二测序标签序列与扩增子引物(即扩增子特异性正向引物和扩增子特异性反向引物)分开,这使得第三引物的使用更加灵活,当一个样本检测N个扩增子时,需要N对特异性引物即第一引物和第二引物,但只需一条第三引物,即只需合成2N+1条引物,可见当扩增子数量和样本量较大时,本发明用于建库的引物组将大大的降低引物合成的成本,而且该引物组中的引物相对现有的引物可以更短,这样可进一步提高PCR扩增效率,可构建具有更好的覆盖度和均一性的扩增子测序文库。
最后,本发明还提供一种用于扩增子测序文库构建的试剂盒,所述试剂盒包括本发明的上述引物组。
本发明的试剂盒中含有本发明特有的引物组,用该试剂盒进行扩增子测序文库构建时,可节省试剂和工作量,降低成本,而且可进一步提高PCR扩增效率,可构建具有更好的覆盖度和均一性的扩增子测序文库。
附图说明
图1为本发明扩增子测序文库的建构流程示意图;
图2为本发明实施例1的扩增子测序深度结果图,其中,横坐标为均一化测序深度(实际测序深度除以扩增子深度的中位数),纵坐标为大于等于该测序深度的扩增子的比例。
具体实施方式
为了使本发明要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
需要说明的是,术语“第一”、“第二”仅用于描述发明目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
一方面,本发明实施例提供了一种扩增子测序文库的构建方法,包括如下步骤:
S01:获得样本DNA;
S02:利用第一引物、第二引物和第三引物对所述样本DNA进行第一PCR扩增,得到扩增产物;
S03:利用第四引物和第五引物对所述扩增产物进行第二PCR扩增,得到扩增子测序文库;
其中,
所述第一引物从5’端到3’端依次为第一测序标签序列和扩增子特异性正向引物;
所述第二引物从5’端到3’端依次为第二测序标签序列和扩增子特异性反向引物;
所述第三引物从5’端到3’端依次为第二测序接头序列、样本标签序列和所述第二测序标签序列;
所述第四引物从5’端到3’端依次为第一测序接头序列和所述第一测序标签序列;
所述第五引物为所述第二测序接头序列。
本发明实施例提供的扩增子测序文库的构建方法中,首先提取样本DNA,然后利用本发明实施例设计的引物组进行两轮PCR扩增得到;在两轮PCR扩增中:先以第一引物、第二引物和第三引物进行第一轮PCR得到所有扩增子目的片段,该过程中对不同样本来源的所有扩增子目的片段的5’端加上第一测序标签序列,3’端加上依次连接的第二测序标签序列、样本标签序列和第二测序接头序列,因样本标签序列可标记不同的样本,所以第一PCR扩增完成后即可将所有样本的扩增产物合并为一管,然后以第一轮PCR的纯化产物为模板,用第四引物和第五引物进行第二轮PCR,将第一测序接头序列添加到第一轮PCR扩增产物的5’端,从而完成扩增子测序文库构建。该构建方法可大大地节省试剂和工作量,降低成本,而且两轮PCR的扩增效率都很高,最终构建的扩增子测序文库具有更好的覆盖度和均一性。
现有扩增子测序建库构建时使用两对引物进行,第一轮PCR扩增,引物由测序标签序列与扩增子特异性引物组成,当需同时检测多个样本,如96个样本,第一轮PCR扩增完成后,需要对每个样本进行单独的磁珠纯化,纯化后的产物用于第二轮PCR时,需配制96份反应体系,逐个加入模板,即后续的磁珠纯化和第二轮PCR需要处理多个样本,相当于对每个样本单独建库,需要重复大量工作,操作繁琐且耗费试剂。而本发明实施例在第一轮PCR时,如图1所示,给所有样本加上了相同的第一测序标签序列、第二测序标签序列和第二测序接头序列,同时在不同样本目的片段3’端加上不同的样本标签序列,相同的第一测序标签序列和第二测序标签序列便于第二轮PCR通过一对引物(第四引物和第五引物)将测序接头加上,第一轮PCR扩增结束后,可将所有样本的PCR产物合并为一管,然后进行纯化,这就避免了实验中人为的操作误差、PCR仪的孔位差异以及样本间可能存在的交叉污染,能更真实有效的反应样本的测试结果,而且能够节省后续磁珠用量,可由原来纯化96个样本简化为纯化一个样本,大大的减少了工作量;同时,合并后纯化的产物即可作为一个样本用于第二轮PCR,即第二轮PCR配制一个样本的反应体系就可完成,这也将节省试剂并减少工作量。
进一步地,在上述步骤S01中,样本DNA可以来自各种生物体的基因组DNA样本,如来自人的血液、唾液和组织等,最终获得每个样本DNA的重量可为200-300ng。
进一步地,在上述步骤S03中,按所述第一引物、所述第二引物和所述第三引物的摩尔比为3:1:3,对所述样本DNA进行第一PCR扩增,在该条件下可更好地提高扩增效率。本发明实施例中,第一PCR扩增为多重PCR扩增,利用该三种引物进行第一轮PCR是为了得到5’端带有第一测序标签序列,3’端具有第二测序标签序列、样本标签序列(Index)及第二测序接头序列的特异的扩增子片段。扩增过程如下:首先第一引物与第二引物以样本DNA为模板扩增得5’端带有第一测序标签序列,3’端带有第二测序标签序列的特异性扩增子中间产物(这一中间产物并不是我们的目的产物);然后第一引物与第三引物以该特异性扩增子中间产物为模板扩增得到目的片段。可见,该反应过程中,第一引物消耗最大,同时由于PCR扩增的随机性反应过程中会产生只有第一引物和第二引物扩增的中间产物,所以为保证尽可能多地将中间产物转化为目的片段,需加大第一引物和第三引物的浓度,促使该反应的进行。另一方面,我们验证了不同的第一引物、第二引物和第三引物的引物浓度比(如“2:1:2”、“3:1:3”、“5:1:5”和“10:1:10”)进行对比分析,结果表明“按所述第一引物、所述第二引物和所述第三引物的摩尔比为3:1:3,对所述样本DNA进行第一PCR扩增”时,扩增所得的目的片段占比最大,扩增效率最大。
更进一步地,在所述第一PCR扩增的步骤之后,还包括第一磁珠纯化的步骤。优选地,利用AMPure XP Beads纯化2次。而所述第二PCR扩增的步骤之后,还包括第二磁珠纯化的步骤,优选地,利用AMPure XP Beads纯化1次。
更进一步地,在所述第一PCR扩增的步骤中,退火和延伸合并为一步,且每个循环中设置三个退火温度,这样可进一步提高扩增子测序文库的覆盖度。
根据扩增子的个数,可设计多对扩增子特异性正向引物和扩增子特异性反向引物,因此第一PCR可以是针对多个扩增子(可高达上百个,如六百多个扩增子)的超高多重PCR反应,即反应体系有六百多对特异性引物,不同的引物退火温度有所差异,设置三个梯度的退火温度,可使各引物能在最佳退火温度找到模板,如此可增大扩增效率;同时,将退火与延伸合并在一步进行,延长退火/延伸时间,使更多的引物能够匹配到相应模板,同时得到有效延伸。优选地,在一优选实施例中,可以在58-62℃范围的选择三个平行梯度的退火温度,本发明实施例中,优选62℃、60℃和58℃三个退火温度,最终得到扩增子测序文库的覆盖度最佳。
另一方面,本发明实施例还提供了一种用于扩增子测序文库构建的引物组,所述引物组包括:用于第一PCR扩增的第一引物、第二引物和第三引物,以及用于第二PCR扩增的第四引物和第五引物;其中,
所述第一引物从5’端到3’端依次为第一测序标签序列和扩增子特异性正向引物;
所述第二引物从5’端到3’端依次为第二测序标签序列和扩增子特异性反向引物;
所述第三引物从5’端到3’端依次为第二测序接头序列、样本标签序列和所述第二测序标签序列;
所述第四引物从5’端到3’端依次为第一测序接头序列和所述第一测序标签序列;
所述第五引物为所述第二测序接头序列。
本发明实施例提供的用于扩增子测序文库构建的引物组,第一引物、第二引物和第三引物用于第一PCR扩增,第四引物和第五引物用于第二PCR扩增;该引物组用于扩增子测序文库构建时,在第一轮PCR扩增过程中,可通过该特有结构的三条引物(第一引物、第二引物和第三引物)使所有扩增子目的片段的5’端加上第一测序标签序列,3’端加上依次连接的第二测序标签、样本标签序列和第二测序接头序列,因样本标签序列可标记不同的样本,所以第一PCR扩增完成后即可将所有样本的扩增产物合并为一管,然后直接用第四引物和第五引物进行第二PCR扩增,完成测序文库构建,这样可大大地节省试剂和减少工作量;而且第三引物中的第二测序接头序列、样本标签序列和第二测序标签序列与扩增子引物(即扩增子特异性正向引物和扩增子特异性反向引物)分开,这使得第三引物的使用更加灵活,当一个样本检测N个扩增子时,需要N对特异性引物即第一引物和第二引物,但只需一条第三引物,即只需合成2N+1条引物,可见当扩增子数量和样本量较大时,本发明实施例用于建库的引物组将大大的降低引物合成的成本,而且该引物组中的引物相对现有的引物可以更短,这样可进一步提高PCR扩增效率,可构建具有更好的覆盖度和均一性的扩增子测序文库。
具体地,本发明实施例的引物组中,扩增子特异性正向引物和扩增子特异性反向引物是根据扩增子序列设计的特异性引物,可与扩增子特异性结合;样本标签序列(即Index)由碱基按不同的排列组合形成,不同的样本对应的样本标签序列不同,即样本标签序列与样本具有唯一对应关系。而第一测序标签序列和第二测序标签序列,第一测序接头序列和第二测序接头序列为测序时所使用的序列。
优选地,本发明实施例中的第一测序接头序列和第二测序接头序列为Illumina测序平台的接头序列P5、P7,具体第一测序接头序列(P5)如SEQ ID NO.1所示,第二测序接头序列(P7)如SEQ ID NO.2所示。更优选地,由于引物合成量大,合成成本较高,本发明实施例中引入的第一测序标签序列和第二测序标签序列并非Illumina测序平台的测序标签,而是比其碱基数更少的CS1、CS2,具体第一测序标签序列(CS1)如SEQ ID NO.3所示,第二测序标签序列(CS2)如SEQ ID NO.4所示。
更进一步地,本发明实施例的引物组中,所述第一引物、所述第一引物和所述第三引物的摩尔比为3:1:3。在该摩尔比的条件下,第一引物、第一引物和第三引物进行的第一PCR扩增的效率最高。
最后,本发明实施例还提供一种用于扩增子测序文库构建的试剂盒,所述试剂盒包括本发明实施例的上述引物组。
本发明实施例的试剂盒中含有本发明实施例特有的引物组,用该试剂盒进行扩增子测序文库构建时,可节省试剂和工作量,降低成本,而且可进一步提高PCR扩增效率,可构建具有更好的覆盖度和均一性的扩增子测序文库。
进一步地,所述试剂盒还包括PCR缓冲液、DNA聚合酶。
本发明先后进行过多次试验,现举一部分试验结果作为参考对发明进行进一步详细描述,下面结合具体实施例进行详细说明。
实施例1
1、引物设计及合成
应用Ion AmpliSeqTM Designer软件根据目的基因PAH、PTS、SLC25A13、SLC22A5、MMACHC、MUT、PCCA、PCCB、MCCC1、MCCC2、IVD和OTC的外显子区设计特异性引物(即扩增子特异性正向引物和扩增子特异性反向引物),在扩增子特异性正向引物5’端加上第一测序标签序列(即CS1)即为第一引物;扩增子特异性反向引物5’端加上第二测序标签序列(即CS2)即为第二引物;由第二测序接头(即P7)、样本标签序列(即Index)、第二测序标签序列组合为第三引物;第四引物由第一测序接头(即P5)与第一测序标签序列组成;第五引物为第二测序接头序列。因本实施例有275个扩增子,需合成第一引物、第二引物各275条,第三引物3暂合成96条、第四引物与第五引物各合成1条,CS1序列、CS1反向互补序列、CS2序列、CS2反向互补序列各1条。引物设计完成后,由Invitrogen公司合成。
本发明中的第一测序接头序列P5和第二测序接头序列P7为Illumina测序平台的接头序列;另外,由于引物合成量大,合成成本较高,本实施例中引入的测序标签并非Illumina测序平台的测序标签,而是比其碱基数更少的第一测序标签序列CS1、第二测序标签序列CS2,序列如下:
P5序列(SEQ ID NO.1):AATGATACGGCGACCACCGAGATCT;
P7序列(SEQ ID NO.2):CAAGCAGAAGACGGCATACGAGAT;
CS1序列(SEQ ID NO.3):ACACTGACGACATGGTTCTACA;
CS2序列(SEQ ID NO.4):TACGGTAGCAGAGACTTGGTCT。
2、样本DNA提取
选自人的血液、唾液和组织等样本DNA均可用于扩增。在用核酸自动提取仪提取样本DNA后,用Qubit Flurometer 3.0定量,检测每一个样本需要DNA模板约200~300ng。
3、第一轮PCR反应
采用以下表1和表2的PCR反应体系及表3的PCR程序对获得的每份基因组的样本DNA做多重PCR扩增。该轮多重PCR共包含275个扩增子,分2管进行,其中多重PCR反应体系1(表1:反应体系总体积25ul)包含139个扩增子,多重PCR反应体系2(表2:反应体系总体积25ul)包含136个扩增子。配制96个样本所需扩增子上游引物(第一引物)混合池、下游引物(第二引物)混合池,其中各引物终浓度为1μM;96个不同样本标签的对应第三引物终浓度定为50μM。反应体系中每个扩增子三种引物的浓度比为,第一引物:第二引物:第三引物=3:1:3,同一个样本的2个多重PCR反应体系中加入相同样本标签的第三引物,具体反应体系如下:
表1
表2
将上述反应体系的成分加入将PCR管中,然后置于PCR仪中,进行如下表3的PCR程序:
表3
4、第一轮PCR产物纯化
第一轮PCR反应完成后,将96个样本的PCR产物,每管取10μl合并为1管,震荡混匀后取500μl用0.8倍体积的AMPure XP Beads纯化2次,然后溶于50μl的TE。
5、第二轮PCR反应
利用上述第一轮PCR纯化产物,进行第二轮PCR反应,此轮PCR只需两条引物:第四引物和第五引物。PCR反应体系50ul,如下表4:
表4
将上述反应体系的成分加入将PCR管中,然后置于PCR仪中,进行如下表5所示的PCR程序。
表5
6、第二轮PCR产物纯化
第二轮PCR反应完成后,PCR产物用0.8倍体积的AMPure XP Beads纯化1次,溶于50μl的TE,完成测序用文库构建。
7、文库定量、上机测序
参考Qubit Flurometer 3.0说明书,对二轮PCR后建立的扩增子测序文库进行准确定量。产物经文库检测合格后,使用Illumina测序平台进行PE150上机测序,步骤严格按照供应商要求使用。
8、测序数据信息分析
对测序所得的数据进行低质量序列以及接头序列过滤后,利用比对软件BWA将其比对到参考基因组(GRCh37/hg19)上,通过分析不同扩增子的测序深度(reads)来判断多重PCR建库的性能及均一性。
9、测序结果
通过本实施例的方法建库,测序分析结果如下:
不同扩增子的测序深度如图2所示,96个样本的275个扩增子至少有1个测定序列数(reads),95.3%的扩增子测序深度在30×以上,可重复性100%,并且本实施例检测到的所有扩增子深度分布集中,大部分测定的序列数差异在1~2个数量级。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种高效率的测序文库的构建方法,其特征在于,包括如下步骤:
获得多个样本的DNA;
利用第一引物、第二引物和第三引物对每个所述样本的DNA进行第一PCR扩增,得到多个样本的扩增产物;
将所述多个样本的扩增产物合并为一管;
在同一管中,利用第四引物和第五引物对合并后的所述多个样本的扩增产物进行第二PCR扩增,得到所述测序文库;
其中,所述第一引物从5’端到3’端依次为第一测序标签序列和扩增子特异性正向引物;所述第二引物从5’端到3’端依次为第二测序标签序列和扩增子特异性反向引物;所述第三引物从5’端到3’端依次为第二测序接头序列、样本标签序列和所述第二测序标签序列;所述样本标签序列用于标记不同的样本;所述第四引物从5’端到3’端依次为第一测序接头序列和所述第一测序标签序列;所述第五引物为所述第二测序接头序列。
2.如权利要求1所述的构建方法,其特征在于,所述多个样本的DNA来自人的血液、唾液和组织样本中的任一种或多种,所述多个样本中的每个样本的DNA的重量为200-300ng。
3.如权利要求1所述的构建方法,其特征在于,所述第一测序接头序列为Illumina测序平台的接头序列P5,所述第二测序接头序列为Illumina测序平台的接头序列P7,且所述第一测序接头序列如SEQ ID NO.1所示,所述第二测序接头序列如SEQ ID NO.2所示。
4.如权利要求3所述的构建方法,其特征在于,所述第一测序标签序列和所述第二测序标签序列为比Illumina测序平台的测序标签具有更少碱基数的序列,且所述第一测序标签序列如SEQ ID NO.3所示,所述第二测序标签序列如SEQ ID NO.4所示。
5.如权利要求1所述的构建方法,其特征在于,在所述第一PCR扩增的步骤之后,还包括第一磁珠纯化的步骤,所述第一磁珠纯化包括利用AMPure XP Beads纯化两次。
6.如权利要求5所述的构建方法,其特征在于,所述第一磁珠纯化包括将所述第一PCR扩增的扩增产物用0.8倍体积的AMPure XP Beads纯化两次,再溶于50μl的TE。
7.如权利要求1所述的构建方法,其特征在于,在所述第二PCR扩增的步骤之后,还包括第二磁珠纯化的步骤,所述第二磁珠纯化包括利用AMPure XP Beads纯化一次。
8.如权利要求7所述的构建方法,其特征在于,所述第二磁珠纯化包括将所述第二PCR扩增的扩增产物用0.8倍体积的AMPure XP Beads纯化一次,再溶于50μl的TE。
9.一种用于构建如权利要求1所述的测序文库的引物组,其特征在于,所述引物组包括用于第一PCR扩增的第一引物、第二引物和第三引物,以及用于第二PCR扩增的第四引物和第五引物,将所述第一PCR扩增后的PCR产物合并为一管,再进行所述第二PCR扩增;
其中,所述第一引物从5’端到3’端依次为第一测序标签序列和扩增子特异性正向引物;所述第二引物从5’端到3’端依次为第二测序标签序列和扩增子特异性反向引物;所述第三引物从5’端到3’端依次为第二测序接头序列、样本标签序列和所述第二测序标签序列;所述样本标签序列用于标记不同的样本;所述第四引物从5’端到3’端依次为第一测序接头序列和所述第一测序标签序列;所述第五引物为所述第二测序接头序列。
10.一种具有高效率的用于构建测序文库的试剂盒,其特征在于,所述试剂盒包括权利要求9所述的引物组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211026828.5A CN116064753A (zh) | 2018-08-28 | 2018-08-28 | 高效率的测序文库的构建方法及引物组和试剂盒 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211026828.5A CN116064753A (zh) | 2018-08-28 | 2018-08-28 | 高效率的测序文库的构建方法及引物组和试剂盒 |
CN201810986265.1A CN108998508B (zh) | 2018-08-28 | 2018-08-28 | 扩增子测序文库的构建方法及引物组和试剂盒 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810986265.1A Division CN108998508B (zh) | 2018-08-28 | 2018-08-28 | 扩增子测序文库的构建方法及引物组和试剂盒 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116064753A true CN116064753A (zh) | 2023-05-05 |
Family
ID=64593375
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810986265.1A Active CN108998508B (zh) | 2018-08-28 | 2018-08-28 | 扩增子测序文库的构建方法及引物组和试剂盒 |
CN202211026830.2A Pending CN116064754A (zh) | 2018-08-28 | 2018-08-28 | 减少交叉污染的扩增子测序文库的构建方法 |
CN202211026828.5A Pending CN116064753A (zh) | 2018-08-28 | 2018-08-28 | 高效率的测序文库的构建方法及引物组和试剂盒 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810986265.1A Active CN108998508B (zh) | 2018-08-28 | 2018-08-28 | 扩增子测序文库的构建方法及引物组和试剂盒 |
CN202211026830.2A Pending CN116064754A (zh) | 2018-08-28 | 2018-08-28 | 减少交叉污染的扩增子测序文库的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (3) | CN108998508B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116445478A (zh) * | 2023-06-12 | 2023-07-18 | 北京旌准医疗科技有限公司 | 一种构建ighv基因文库的引物组合及其应用 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110029103B (zh) * | 2019-04-30 | 2022-12-27 | 上海思路迪生物医学科技有限公司 | 用于构建brca1/2基因变异检测文库的自动化试剂盒 |
CN110878334B (zh) * | 2019-11-12 | 2022-08-12 | 北京康普森生物技术有限公司 | 用于扩增子测序的引物及两步pcr建库方法 |
CN113088561B (zh) * | 2019-12-23 | 2024-05-14 | 深圳华大智造科技股份有限公司 | 构建侧翼已知序列的测序文库的引物组和方法 |
CN114807302B (zh) * | 2021-10-14 | 2024-07-02 | 深圳联合医学科技有限公司 | 扩增子文库构建方法及用于地中海贫血突变型与缺失型基因检测的试剂盒 |
CN114277096B (zh) * | 2021-12-29 | 2024-06-04 | 深圳联合医学科技有限公司 | 鉴别地中海贫血αααanti4.2杂合型和HKαα杂合型的方法和试剂盒 |
CN115058490B (zh) * | 2022-06-28 | 2023-06-27 | 广州市金圻睿生物科技有限责任公司 | 一种用于构建微生物靶向测序文库的引物组合及其应用 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101829182B1 (ko) * | 2009-04-02 | 2018-03-29 | 플루이다임 코포레이션 | 표적 핵산의 바코딩을 위한 멀티 프라이머 증폭 방법 |
CN105506063A (zh) * | 2014-09-22 | 2016-04-20 | 深圳华大基因科技有限公司 | 引物组合物及其用途 |
CN106555226B (zh) * | 2016-04-14 | 2019-07-23 | 大连晶泰生物技术有限公司 | 一种构建高通量测序文库的方法和试剂盒 |
-
2018
- 2018-08-28 CN CN201810986265.1A patent/CN108998508B/zh active Active
- 2018-08-28 CN CN202211026830.2A patent/CN116064754A/zh active Pending
- 2018-08-28 CN CN202211026828.5A patent/CN116064753A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116445478A (zh) * | 2023-06-12 | 2023-07-18 | 北京旌准医疗科技有限公司 | 一种构建ighv基因文库的引物组合及其应用 |
CN116445478B (zh) * | 2023-06-12 | 2023-09-05 | 北京旌准医疗科技有限公司 | 一种构建ighv基因文库的引物组合及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN108998508A (zh) | 2018-12-14 |
CN108998508B (zh) | 2022-09-16 |
CN116064754A (zh) | 2023-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108998508B (zh) | 扩增子测序文库的构建方法及引物组和试剂盒 | |
CN108893466B (zh) | 测序接头、测序接头组和超低频突变的检测方法 | |
CN107002292B (zh) | 一种核酸的双接头单链环状文库的构建方法和试剂 | |
CN110129415B (zh) | 一种ngs建库分子接头及其制备方法和用途 | |
US20230002821A1 (en) | High-throughput detection method for rare mutation of gene | |
CN108517567B (zh) | 用于cfDNA建库的接头、引物组、试剂盒和建库方法 | |
CN111052249B (zh) | 确定预定染色体保守区域的方法、确定样本基因组中是否存在拷贝数变异的方法、系统和计算机可读介质 | |
WO2018133546A1 (zh) | 无创产前胎儿α型地贫基因突变检测文库构建方法、检测方法和试剂盒 | |
CN110004225B (zh) | 一种肿瘤化疗药个体化基因检测试剂盒、引物及方法 | |
CN105506063A (zh) | 引物组合物及其用途 | |
WO2020007089A1 (zh) | 一种同时检测多种肝癌常见突变的ctDNA文库构建和测序数据分析方法 | |
WO2019076018A1 (zh) | 一种用于检测目的基因低频突变的扩增子文库的构建方法 | |
EP3643789A1 (en) | Pcr primer pair and application thereof | |
CN116287357A (zh) | 一种基于靶向扩增子测序的呼吸道病原菌检测试剂盒 | |
CN117343999B (zh) | 基于左侧探针退火和右侧探针退火延伸的核酸扩增方法 | |
CN103998625B (zh) | 用于病毒检测的方法和系统 | |
CN108103143B (zh) | 一种目标区域多重pcr与快速文库构建的方法 | |
CN111748613A (zh) | 一种双标签接头设计方法及制备方法 | |
CN108588200A (zh) | 一种R-Loop高通量测序文库构建方法 | |
CN114277096B (zh) | 鉴别地中海贫血αααanti4.2杂合型和HKαα杂合型的方法和试剂盒 | |
CN111270011A (zh) | 一种用于检测新型冠状病毒的引物组和检测试剂盒 | |
CN114277114B (zh) | 一种扩增子测序添加唯一性标识符的方法及应用 | |
CN109266723A (zh) | 稀有突变检测方法、其试剂盒及应用 | |
CN112626270B (zh) | 新冠肺炎病毒和甲型流感病毒同时快速检测方法及试剂盒 | |
CN115044686A (zh) | 一种同时检测brdc七种病原体的实时荧光定量pcr引物对和探针组合 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |