CN117050967B - 一种改善二代测序文库gc均衡性的方法 - Google Patents
一种改善二代测序文库gc均衡性的方法 Download PDFInfo
- Publication number
- CN117050967B CN117050967B CN202311048852.3A CN202311048852A CN117050967B CN 117050967 B CN117050967 B CN 117050967B CN 202311048852 A CN202311048852 A CN 202311048852A CN 117050967 B CN117050967 B CN 117050967B
- Authority
- CN
- China
- Prior art keywords
- polymerase
- dna
- exonuclease activity
- seq
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000004817 gas chromatography Methods 0.000 title description 23
- 238000012163 sequencing technique Methods 0.000 title description 11
- 230000000694 effects Effects 0.000 claims abstract description 36
- 108010006785 Taq Polymerase Proteins 0.000 claims abstract description 35
- 102000004190 Enzymes Human genes 0.000 claims abstract description 34
- 108090000790 Enzymes Proteins 0.000 claims abstract description 34
- 108060002716 Exonuclease Proteins 0.000 claims abstract description 24
- 102000013165 exonuclease Human genes 0.000 claims abstract description 24
- 238000010276 construction Methods 0.000 claims abstract description 11
- 108020004414 DNA Proteins 0.000 claims description 29
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 13
- 102000004533 Endonucleases Human genes 0.000 claims description 10
- 108010042407 Endonucleases Proteins 0.000 claims description 10
- 238000012408 PCR amplification Methods 0.000 claims description 9
- 150000007523 nucleic acids Chemical class 0.000 claims description 8
- 238000003776 cleavage reaction Methods 0.000 claims description 6
- 230000002255 enzymatic effect Effects 0.000 claims description 6
- 230000007017 scission Effects 0.000 claims description 6
- 238000000053 physical method Methods 0.000 claims description 5
- 238000000746 purification Methods 0.000 claims description 5
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 claims description 4
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 claims description 4
- 238000013467 fragmentation Methods 0.000 claims description 4
- 238000006062 fragmentation reaction Methods 0.000 claims description 4
- 108020004707 nucleic acids Proteins 0.000 claims description 4
- 102000039446 nucleic acids Human genes 0.000 claims description 4
- 102000053602 DNA Human genes 0.000 claims description 2
- 108010017826 DNA Polymerase I Proteins 0.000 claims description 2
- 102000004594 DNA Polymerase I Human genes 0.000 claims description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims 1
- 230000000865 phosphorylative effect Effects 0.000 claims 1
- 239000000203 mixture Substances 0.000 abstract description 17
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 24
- 238000006243 chemical reaction Methods 0.000 description 14
- 239000000047 product Substances 0.000 description 12
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 9
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 9
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 9
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 9
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 8
- 239000007983 Tris buffer Substances 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 8
- 239000011324 bead Substances 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 102000009097 Phosphorylases Human genes 0.000 description 5
- 108010073135 Phosphorylases Proteins 0.000 description 5
- 239000000872 buffer Substances 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007259 addition reaction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000005549 deoxyribonucleoside Substances 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 230000037048 polymerization activity Effects 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000035484 reaction time Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102220477772 Interferon-inducible GTPase 5_K82A_mutation Human genes 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 101000717237 Tobacco streak virus (strain WC) RNA-directed RNA polymerase 2a Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1229—Phosphotransferases with a phosphate group as acceptor (2.7.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07007—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本申请提供一种酶组合物及其在文库构建中的应用,属于生物技术领域。具体是通过包含3'‑5'外切酶活性缺失或减弱的Taq DNA聚合酶组合物构建文库,从而改善由文库构建过程中导致的GC、AT含量不均衡问题。
Description
技术领域
本申请涉及生物技术领域,具体涉及一种酶组合物及其在文库构建中的应用。
背景技术
新一代高通量测序技术发展至今已广泛应用于多个临床领域进行疾病的诊断,临床样本经过核酸提取、文库构建、上机测序、下机数据比对分析后产生临床诊断或指导建议,对疾病诊断和治疗提供参考。其中文库构建是该技术发挥临床应用价值最重要的一环,文库构建的质量决定了后续下机数据的质量。比如文库转化率高、文库均一性好,那么后续的下机数据相对复杂度就高,相同的测序成本下获得的信息更多。比如现有适配Illumina或MGI测序平台的文库构建技术,主流的方法有机械法、随机内切酶法以及转座酶法。
以随机内切酶法为例,首先模板DNA经过核酸内切酶随机切割,随后被常温聚合酶的外切活性对切割产物的3'凸出进行切平,或者被常温聚合酶的聚合活性对3'凹陷的末端进行聚合补平,接着在高温聚合酶的作用下对修复的产物3'末端进行加dA尾,随后A与接头的T进行互补配对、经过连接反应,随机切割的模板DNA片段两端就接上了与测序平台相匹配的共有序列(接头),再经过PCR扩增富集,就得到了能够用于上机测序的文库。文库制备的过程中理论上模板中不同GC或AT含量的区域都能够随机地、无差别地被连上接头并进行扩增,从而获得非常随机的、均一性良好的预文库。然而实际过程中,随机内切酶在对模板进行打断后,被随机切割的DNA片段因GC或AT含量不同而在体系中的稳定性也不同,因此被聚合酶的外切活性或聚合活性作用的几率也不同,最终造成原始DNA模板的序列,因GC或AT含量不同而被不同程度的丢失或富集,从而造成文库构建的GC、AT均衡性不够。为了解决因文库中GC或AT含量不同造成模板被聚合酶的外切活性切割而丢失的问题,亟需一种方法来改善这一问题,从而提升文库的GC均衡性。
发明内容
本申请通过在文库构建过程中使用无外切酶活性或外切酶活性减弱的Taq DNA聚合酶,从而改善因文库中GC或AT含量不同造成模板被聚合酶的外切活性切割而丢失的问题,提高了核酸文库GC均衡性。
本申请第一方面提供一种酶组合物,所述组合物包含缓冲液、脱氧核糖核苷三磷酸、DNA末端修复酶、无5'-3'外切酶活性或5'-3'外切酶活性减弱的Taq DNA聚合酶,其中DNA末端修复酶用于DNA末端的修复,无5'-3'外切酶活性或5'-3'外切酶活性减弱的TaqDNA聚合酶用于对修复后的DNA3'端加A尾。
在一些实施方案中,所述能够修复DNA末端的酶是具有5'-3'聚合酶活性和/或3'-5'外切酶活性的酶。在一些实施方案中,所述DNA末端修复酶选自以下任意一种或多种酶的组合:T4DNA聚合酶、T7DNA聚合酶、Klenow片段。在一些实施方案中,所述能够修复DNA末端的单一酶的浓度范围是1-10U/μl,优选地,酶的浓度是5U/μl。
在一些实施方案中,所述缓冲液至少包含Tris、镁离子和甘油。在一些实施方案中,所述缓冲液包含Tris、MgCl2、表面活性剂、甘油和EDTA。
在一些实施方案中,所述脱氧核糖核苷三磷酸是dATP、dCTP、dTTP和dGTP的混合物。在一些实施方案中,所述dATP的浓度范围是1-10mM,dCTP、dTTP和dGTP的浓度范围分别是0.2-2mM。在一些实施方案中,所述dATP浓度为6mM,dCTP、dTTP和dGTP的浓度分别为1mM。
在一些实施方案中,所述无5'-3'外切酶活性的TaqDNA聚合酶氨基酸序列如SEQID NO:3所示。在一些实施方案中,所述5'-3'外切酶活性减弱的TaqDNA聚合酶氨基酸序列如SEQ ID NO:2所示。在一些实施方案中,所述无5'-3'外切酶活性或5'-3'外切酶活性减弱的TaqDNA聚合酶的浓度范围是1-10U/μl,优选地,酶的浓度是5U/μl。
在一些实施方案中,所述酶组合物包含Tris、MgCl2、甘油、dATP、dCTP、dTTP、dGTP、T4DNA聚合酶、无5'-3'外切酶活性或5'-3'外切酶活性减弱的Taq DNA聚合酶。在一些实施方案中,所述含酶组合物包含100mM的Tris、10mM的MgCl2、20%的甘油、6mM的dATP、1mM的dTTP、1mM的dCTP、1mM的dGTP、5U/μl的T4DNA聚合酶、5U/μl的TaqDNA聚合酶,其中所述TaqDNA聚合酶的氨基酸序列为SEQ ID NO:2或SEQ ID NO:3。
在一些实施方案中,所述酶组合物还包含片段化酶,其中片段化酶用于片段化DNA模板。
在一些实施方案中,所述片段化酶选自随机切割DNA的非限制性核酸内切酶,优选地,所述片段化酶选自DNaseI、EndonucleaseV、EndonucleaseI或其突变体。在一些实施方案中,所述片段化酶的浓度范围是0.005-0.05U/μl,优选地,所述片段化酶的浓度是0.01U/μl。
在一些实施方案中,所述酶组合物包含Tris、MgCl2、甘油、dATP、dCTP、dTTP、dGTP、DNaseI、T4DNA聚合酶、无5'-3'外切酶活性或5'-3'外切酶活性减弱的TaqDNA聚合酶。在一些实施方案中,所述含酶组合物包含100mM的Tris、10mM的MgCl2、20%的甘油、6mM的dATP、1mM的dTTP、1mM的dCTP、1mM的dGTP、0.01U/μl的DnaseI、5U/μl的T4DNA聚合酶、5U/μl的TaqDNA聚合酶,其中所述TaqDNA聚合酶的氨基酸序列为SEQ ID NO:2或SEQ ID NO:3。
在一些实施方案中,所述酶组合物还包含磷酸化酶,其中磷酸化酶用于使得DNA分子5'-羟基末端磷酸化。
在一些实施方案中,所述磷酸化酶是T4多核苷酸激酶。在一些实施方案中,所述磷酸化酶浓度范围是0.5-5U/μl,优选地,磷酸化酶浓度是3U/μl。
在一些实施方案中,所述酶组合物包含Tris、MgCl2、甘油、dATP、dCTP、dTTP、dGTP、T4多核苷酸激酶、T4DNA聚合酶、无5'-3'外切酶活性或5'-3'外切酶活性减弱的TaqDNA聚合酶。在一些实施方案中,所述含酶组合物包含100mM的Tris、10mM的MgCl2、20%的甘油、6mM的dATP、1mM的dTTP、1mM的dCTP、1mM的dGTP、3U/μl的T4多核苷酸激酶、5U/μl的T4DNA聚合酶、5U/μl的TaqDNA聚合酶,其中所述TaqDNA聚合酶的氨基酸序列为SEQ ID NO:2或SEQ IDNO:3。
本申请第二方面提供一种核酸文库构建方法,所述方法包含DNA片段化、末端修复和加A尾步骤,其中加A尾步骤中使用无5'-3'外切活性或5'-3'外切活性减弱的TaqDNA聚合酶。
在一些实施方案中,所述无5'-3'外切酶活性的TaqDNA聚合酶氨基酸序列如SEQID NO:3所示。在一些实施方案中,所述5'-3'外切酶活性减弱的TaqDNA聚合酶氨基酸序列如SEQ ID NO:2所示。
在一些实施方案中,所述片段化是通过酶切方法实现的,优选地,所述酶切方法是使用随机切割DNA的非限制性核酸内切酶实现对DNA片段化。在一些实施方案中,所述非限制性核酸内切酶选自DNaseI、EndonucleaseV、EndonucleaseI或其突变体。
在一些实施方案中,当使用酶切法片段化DNA时,所述方法还包含使用本申请第一方面所述酶组合物进行末端修复加A尾步骤。在一些实施方案中,当使用酶切法片段化DNA时,所述方法还包含使用本申请第一方面所述的酶组合物对DNA模板同时进行片段化、末端修复和加A尾反应。
在一些实施方案中,所述片段化是通过机械破碎物理方法实现的,优选地,所述物理方法是超声波机械打断法。
在一些实施方案中,当使用物理方法片段化DNA时,所述方法还包含使用本申请第一方面所述酶组合物进行末端修复加A尾步骤。
在一些实施方案中,所述方法还包含接头连接的步骤,优选地,所述接头为双链接头。在一些实施方案中,所述双链接头是illumina平台Y型接头或华大平台泡状接头,优选地,所述双链接头是illumina平台Y型接头。
在一些实施方案中,所述方法还包含PCR扩增步骤,优选地,PCR扩增后还需要进行产物纯化。
本申请第三方面提供一种试剂盒,所述试剂盒包含本申请第一方面所述酶组合物。
在一些实施方案中,所述试剂盒还包含选自接头、连接酶、连接酶缓冲液、PCR反应缓冲液或PCR扩增引物中的一种或多种试剂。
术语
末端修复:片段化后的核酸片段末端生成平端,包括核酸片段的3'凸出链切平和/或3'凹陷的末端进行聚合补平,针对物理法打断的核酸片段在末端修复时还需要对核酸片段5'-羟基末端进行磷酸化;
加A尾:将单一dA添加到被修复的DNA片段的3'端上使该DNA片段腺苷酸化。
附图说明
图1:实施例1中构建的三种文库下机数据不同GC含量区域均一化后的测序深度覆盖图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本申请的技术方案,但下述的实例仅仅是本申请的简易例子,并不代表或限制本申请的权利保护范围,本申请的保护范围以权利要求书为准。
以下实施例中,若无特殊说明,所用试剂及耗材均购自本领域常规试剂厂商;若无特殊说明,所用实验方法和技术手段均为本领域常规的方法和手段。
实施例1:
以CoriellInstituteNA12878人类基因组DNA标准品为模板,通过核酸内切酶随机切割模板,并对打断的片段进行末端修复,分别使用三种Taq酶对修复后的片段进行加A尾反应,后续通过常规的接头连接、PCR扩增,获得三种不同的DNA文库,上机测序,并对下机数据进行分析。
其中,三种Taq酶分别是氨基酸序列为SEQ ID NO:1所示的野生型taqDNA聚合酶、氨基酸序列为SEQ ID NO:2所示的5'外切酶活性减弱的taqDNA聚合酶和氨基酸序列为SEQID NO:3所示的5'外切酶活性完全缺失的taqDNA聚合酶,且,SEQ ID NO:2是在SEQ ID NO:1基础上突变了K82A、K197A和K219A,SEQ ID NO:3是在SEQ ID NO:1基础上缺失了第1-280位氨基酸序列。
(1)模板打断、末端修复和加A尾反应
按照表1配制反应体系,各组分混匀后,按照表3条件进行反应。
表1:模板打断、末端修复和加A尾反应体系
组分 | 体积 |
NA12878gDNA(50ng/μl) | 1μl |
ddH2O | 34μl |
Frag&TailingMix-1/2/3 | 25μl |
Total | 60μl |
其中,Frag&TailingMix按照表2各组分浓度进行配制。
表2:Frag&TailingMix组分浓度
其中,表1中Frag&TailingMix-1代表其配制时使用的TaqDNA聚合酶为野生型的TaqDNA聚合酶,Frag&TailingMix-2代表其中的TaqDNA聚合酶为5'-3'外切活性减弱的TaqDNA聚合酶,Frag&TailingMix-3代表其中的TaqDNA聚合酶为5'-3'外切活性完全缺失的TaqDNA聚合酶。
表3:模板打断、末端修复和加A尾反应程序
温度 | 反应时间 |
37℃ | 10min |
65℃ | 30min |
经过加A尾反应后,共获得三种不同的产物,三种产物均同时进行如下步骤。
(2)接头连接
将上一步反应产物从PCR仪中取出,按照表4反应体系加入试剂,按照表5条件运行反应程序。
表4:接头连接反应体系
组分 | 体积 |
上步反应产物 | 60μl |
RapidDNAligase | 10μl |
DNAAdapter | 5μl |
Total | 75μl |
其中,RapidDNAligase为南京诺唯赞生物科技股份有限公司N103产品,DNAAdapter为南京诺唯赞生物科技股份有限公司N805产品。
表5接头连接反应程序
温度 | 反应时间 |
20℃ | 5min |
(3)接头连接产物纯化
a.吸取60μlVAHTSDNACleanBeads(南京诺唯赞生物科技股份有限公司N411产品)至75μl接头链接产物中,涡旋振荡混匀,室温孵育5min。
b.将PCR管短暂离心并置于磁力架中分离磁珠和液体,待溶液澄清后(约5min),小心移除上清。
c.保持PCR管始终置于磁力架中,加入200μl新鲜配制的80%乙醇漂洗磁珠,室温孵育30sec,小心移除上清。重复该步骤一次。
d.保持PCR管始终置于磁力架中,开盖空气干燥磁珠5-10min至无乙醇残留。将PCR管从磁力架中取出,加入23μl无核酸酶水进行洗脱,取20μl上清至新的PCR管中。
(4)PCR扩增
按照表6配制PCR扩增反应体系,并按照表7运行PCR反应程序:
表6:PCR扩增体系
组分 | 体积 |
上步纯化产物 | 20μl |
PCRPrimerMix3forIllumina | 5μl |
VAHTSHiFiAmplificationMix | 25μl |
Total | 50μl |
其中,PCRPrimerMix3forIllumina和VAHTSHiFiAmplificationMix来自南京诺唯赞生物科技股份有限公司N616产品。
表7:PCR反应程序
(5)PCR产物纯化
a.吸取45μlVAHTSDNACleanBeads(南京诺唯赞生物科技股份有限公司N411产品)至50μlPCR扩增产物中,涡旋振荡混匀,室温孵育5min。
b.将PCR管短暂离心并置于磁力架中分离磁珠和液体,待溶液澄清后(约5min),小心移除上清。
c.保持PCR管始终置于磁力架中,加入200μl新鲜配制的80%乙醇漂洗磁珠,室温孵育30sec,小心移除上清。重复该步骤一次。
d.保持PCR管始终置于磁力架中,开盖空气干燥磁珠5-10min至无乙醇残留。将PCR管从磁力架中取出,加入23μl无核酸酶水进行洗脱,取20μl上清至新的PCR管中。
(6)上机测序
将上述经过PCR纯化的三种文库产物进行上机测序,使用IlluminaX-10测序仪,按照PE150测序模式进行测序。
(7)数据分析
使用picard模块CollectGcBiasMetrics对下机数据进行过滤对比,对比后的bam文件进行GC均衡性分析。
实验结果
将下机数据经过过滤,滤掉接头序列或含N(无法确定碱基信息)、低质量值的碱基后,统计三种文库中GC和AT含量百分比,结果见表8和图1。
表8:三种文库GC和AT含量百分比
注:NCBI数据库公开NA12878人标准品的GC%为40.4%,AT%为59.6%。
表8数据代表文库整体水平AT和GC百分比含量,可知,野生型Taq酶构建的文库整体AT含量占比偏低,GC含量占比偏高,而5'外切活性缺失的Taq酶构建的文库整体AT含量占比和GC含量占比百分比更接近真实占比。
从图1结果显示可知,大圆圈圈出的部分为GC%含量低的部分区域即高AT区域,随着taq外切活性的减弱或缺失,覆盖度有所上升(小圆圈线代表不同GC或AT区域的覆盖度,当小圆圈线位于坐标轴1.0线下方代表该区域覆盖度低于理论水平,当小圆圈线与坐标轴1.0线重合代表该区域覆盖度与理论水平相当,当小圆圈线位于坐标轴1.0线上方代表该区域覆盖度高于理论水平)。
因此,通过将建库过程中Taq酶的5'-3'外切活性完全缺失或通过突变减弱,可使得文库的AT区域覆盖度提升,GC均衡性得以改善。
野生型TaqDNA聚合酶(SEQ ID NO:1)
MRGMLPLFEPKGRVLLVDGHHLAYRTFHALKGLTTSRGEPVQAVYGFAKSLLKALKEDGDAVIVVFDAKAPSFRHEAYGGYKAGRAPTPEDFPRQLALIKELVDLLGLARLEVPGYEADDVLASLAKKAEKEGYEVRILTADKDLYQLLSDRIHVLHPEGYLITPAWLWEKYGLRPDQWADYRALTGDESDNLPGVKGIGEKTARKLLEEWGSLEALLKNLDRLKPAIREKILAHMDDLKLSWDLAKVRTDLPLEVDFAKRREPDRERLRAFLERLEFGSLLHEFGLLESPKALEEAPWPPPEGAFVGFVLSRKEPMWADLLALAAARGGRVHRAPEPYKALRDLKEARGLLAKDLSVLALREGLGLPPGDDPMLLAYLLDPSNTTPEGVARRYGGEWTEEAGERAALSERLFANLWGRLEGEERLLWLYREVERPLSAVLAHMEATGVRLDVAYLRALSLEVAEEIARLEAEVFRLAGHPFNLNSRDQLERVLFDELGLPAIGKTEKTGKRSTSAAVLEALREAHPIVEKILQYRELTKLKSTYIDPLPDLIHPRTGRLHTRFNQTATATGRLSSSDPNLQNIPVRTPLGQRIRRAFIAEEGWLLVALDYSQIELRVLAHLSGDENLIRVFQEGRDIHTETASWMFGVPREAVDPLMRRAAKTINFGVLYGMSAHRLSQELAIPYEEAQAFIERYFQSFPKVRAWIEKTLEEGRRRGYVETLFGRRRYVPDLEARVKSVREAAERMAFNMPVQGTAADLMKLAMVKLFPRLEEMGARMLLQVHDELVLEAPKERAEAVARLAKEVMEGVYPLAVPLEVEVGIGEDWLSAKE。
5'-3'外切活性减弱的TaqDNA聚合酶(SEQ ID NO:2)
MRGMLPLFEPKGRVLLVDGHHLAYRTFHALKGLTTSRGEPVQAVYGFAKSLLKALKEDGDAVIVVFDAKAPSFRHEAYGGYAAGRAPTPEDFPRQLALIKELVDLLGLARLEVPGYEADDVLASLAKKAEKEGYEVRILTADKDLYQLLSDRIHVLHPEGYLITPAWLWEKYGLRPDQWADYRALTGDESDNLPGVAGIGEKTARKLLEEWGSLEALLANLDRLKPAIREKILAHMDDLKLSWDLAKVRTDLPLEVDFAKRREPDRERLRAFLERLEFGSLLHEFGLLESPKALEEAPWPPPEGAFVGFVLSRKEPMWADLLALAAARGGRVHRAPEPYKALRDLKEARGLLAKDLSVLALREGLGLPPGDDPMLLAYLLDPSNTTPEGVARRYGGEWTEEAGERAALSERLFANLWGRLEGEERLLWLYREVERPLSAVLAHMEATGVRLDVAYLRALSLEVAEEIARLEAEVFRLAGHPFNLNSRDQLERVLFDELGLPAIGKTEKTGKRSTSAAVLEALREAHPIVEKILQYRELTKLKSTYIDPLPDLIHPRTGRLHTRFNQTATATGRLSSSDPNLQNIPVRTPLGQRIRRAFIAEEGWLLVALDYSQIELRVLAHLSGDENLIRVFQEGRDIHTETASWMFGVPREAVDPLMRRAAKTINFGVLYGMSAHRLSQELAIPYEEAQAFIERYFQSFPKVRAWIEKTLEEGRRRGYVETLFGRRRYVPDLEARVKSVREAAERMAFNMPVQGTAADLMKLAMVKLFPRLEEMGARMLLQVHDELVLEAPKERAEAVARLAKEVMEGVYPLAVPLEVEVGIGEDWLSAKE。
5'-3'外切缺失的TaqDNA聚合酶(SEQ ID NO:3)
LLHEFGLLESPKALEEAPWPPPEGAFVGFVLSRKEPMWADLLALAAARGGRVHRAPEPYKALRDLKEARGLLAKDLSVLALREGLGLPPGDDPMLLAYLLDPSNTTPEGVARRYGGEWTEEAGERAALSERLFANLWGRLEGEERLLWLYREVERPLSAVLAHMEATGVRLDVAYLRALSLEVAEEIARLEAEVFRLAGHPFNLNSRDQLERVLFDELGLPAIGKTEKTGKRSTSAAVLEALREAHPIVEKILQYRELTKLKSTYIDPLPDLIHPRTGRLHTRFNQTATATGRLSSSDPNLQNIPVRTPLGQRIRRAFIAEEGWLLVALDYSQIELRVLAHLSGDENLIRVFQEGRDIHTETASWMFGVPREAVDPLMRRAAKTINFGVLYGMSAHRLSQELAIPYEEAQAFIERYFQSFPKVRAWIEKTLEEGRRRGYVETLFGRRRYVPDLEARVKSVREAAERMAFNMPVQGTAADLMKLAMVKLFPRLEEMGARMLLQVHDELVLEAPKERAEAVARLAKEVMEGVYPLAVPLEVEVGIGEDWLSAKE 。
Claims (6)
1.无5'-3'外切活性或5'-3'外切活性减弱的Taq DNA聚合酶在提高文库GC均衡性中的应用,其中所述无5'-3'外切酶活性的Taq DNA聚合酶的氨基酸序列如SEQ ID NO:3所示,所述5'-3'外切酶活性减弱的Taq DNA聚合酶的氨基酸序列如SEQ ID NO:2所示。
2.一种核酸文库构建方法,所述方法包括DNA片段化、末端修复、加A尾、接头连接和PCR扩增步骤,所述加A尾步骤中使用SEQ ID NO:2所示的5'-3'外切活性减弱的Taq DNA聚合酶,所述末端修复步骤中使用的酶选自以下任意一种或多种:T4 DNA聚合酶、T7 DNA聚合酶、Klenow片段。
3.如权利要求2所述的方法,所述片段化是通过酶切方法实现的,其中酶切方法是使用随机切割DNA的非限制性核酸内切酶实现对DNA的片段化,所述非限制性核酸内切酶选自DNase I、Endonuclease V、Endonuclease I。
4.如权利要求2所述的方法,所述片段化是通过机械破碎物理方法实现的,其中,物理方法是超声波机械打断法。
5.如权利要求4所述的方法,其还包含使用T4多核苷酸激酶磷酸化DNA分子5'-羟基末端的步骤。
6.如权利要求2-5任一项所述的方法,其还包含产物纯化步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311048852.3A CN117050967B (zh) | 2023-08-21 | 2023-08-21 | 一种改善二代测序文库gc均衡性的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311048852.3A CN117050967B (zh) | 2023-08-21 | 2023-08-21 | 一种改善二代测序文库gc均衡性的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117050967A CN117050967A (zh) | 2023-11-14 |
CN117050967B true CN117050967B (zh) | 2024-04-09 |
Family
ID=88656862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311048852.3A Active CN117050967B (zh) | 2023-08-21 | 2023-08-21 | 一种改善二代测序文库gc均衡性的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117050967B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111073952A (zh) * | 2018-12-29 | 2020-04-28 | 浙江安诺优达生物科技有限公司 | 构建dna文库的方法及其应用 |
CN112661861A (zh) * | 2021-01-26 | 2021-04-16 | 湖北大学 | 重组聚合酶、编码基因、制备方法、载体、试剂盒及应用 |
CN115747304A (zh) * | 2022-11-25 | 2023-03-07 | 上海睿璟生物科技有限公司 | 一种高gc含量文库环化用试剂盒及其用途和方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60133992D1 (de) * | 2000-02-17 | 2008-06-26 | Qiagen Gmbh | Thermostabile chimäre nucleinsäurepolymerasen und ihre verwendungen |
-
2023
- 2023-08-21 CN CN202311048852.3A patent/CN117050967B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111073952A (zh) * | 2018-12-29 | 2020-04-28 | 浙江安诺优达生物科技有限公司 | 构建dna文库的方法及其应用 |
CN112661861A (zh) * | 2021-01-26 | 2021-04-16 | 湖北大学 | 重组聚合酶、编码基因、制备方法、载体、试剂盒及应用 |
CN115747304A (zh) * | 2022-11-25 | 2023-03-07 | 上海睿璟生物科技有限公司 | 一种高gc含量文库环化用试剂盒及其用途和方法 |
Non-Patent Citations (1)
Title |
---|
酶的定向进化策略;蔡勇;杨江科;闫云君;;生命的化学(02);第89-92页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117050967A (zh) | 2023-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11535889B2 (en) | Use of transposase and Y adapters to fragment and tag DNA | |
EP3272879B1 (en) | Transposon end compositions and methods for modifying nucleic acids | |
JP4473573B2 (ja) | 多部位突然変異誘発 | |
EP3555305B1 (en) | Method for increasing throughput of single molecule sequencing by concatenating short dna fragments | |
US20120003657A1 (en) | Targeted sequencing library preparation by genomic dna circularization | |
CN106554957B (zh) | 测序文库及其制备和应用 | |
CN108138175B (zh) | 用于分子条形码编码的试剂、试剂盒和方法 | |
EP3330386A1 (en) | Preparation of adapter-ligated amplicons | |
WO2018144217A1 (en) | Methods and compositions for enrichment of target polynucleotides | |
WO2015050501A1 (en) | Amplification paralleled library enrichment | |
CN111868257A (zh) | 用于单分子测序的双链dna模板的生成 | |
CN110699425B (zh) | 基因目标区域的富集方法及体系 | |
CN116043337A (zh) | Dna甲基化标志物筛查试剂盒及方法 | |
KR20200024167A (ko) | Rna 및 dna로부터의 핵산 라이브러리의 제조 | |
CN117050967B (zh) | 一种改善二代测序文库gc均衡性的方法 | |
CN115715323A (zh) | 一种高兼容性的PCR-free建库和测序方法 | |
EP3198064B1 (en) | Methods for sample preparation | |
EP3865584A1 (en) | Method for constructing sequencing library | |
EP3810805A1 (en) | Method for detection and quantification of genetic alterations | |
CN114808148A (zh) | 一种dna文库构建试剂盒、文库构建方法和应用 | |
CN110331141B (zh) | 一种突变型SSO7d SSB及其应用 | |
CN117343989B (zh) | 一种检测基因融合的靶向建库方法 | |
CN117230170B (zh) | 基于定点成环连接的端粒特异性接头、预文库及其构建方法 | |
CN114196661B (zh) | 一种重组拓扑异构酶及其在构建测序文库中的应用 | |
US20210180125A1 (en) | Method for the detection and quantification of genetic alterations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |