CN113166809B - 一种dna甲基化检测的方法、试剂盒、装置和应用 - Google Patents
一种dna甲基化检测的方法、试剂盒、装置和应用 Download PDFInfo
- Publication number
- CN113166809B CN113166809B CN201980076223.7A CN201980076223A CN113166809B CN 113166809 B CN113166809 B CN 113166809B CN 201980076223 A CN201980076223 A CN 201980076223A CN 113166809 B CN113166809 B CN 113166809B
- Authority
- CN
- China
- Prior art keywords
- sequencing
- dna
- library
- methylation
- double
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 69
- 230000007067 DNA methylation Effects 0.000 title claims abstract description 54
- 238000012163 sequencing technique Methods 0.000 claims abstract description 152
- 239000012634 fragment Substances 0.000 claims abstract description 94
- 238000012164 methylation sequencing Methods 0.000 claims abstract description 90
- 238000010276 construction Methods 0.000 claims abstract description 66
- 238000000034 method Methods 0.000 claims abstract description 64
- 230000004224 protection Effects 0.000 claims abstract description 54
- 230000011987 methylation Effects 0.000 claims abstract description 52
- 238000007069 methylation reaction Methods 0.000 claims abstract description 52
- 238000006243 chemical reaction Methods 0.000 claims abstract description 50
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 50
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims abstract description 44
- 238000005516 engineering process Methods 0.000 claims abstract description 44
- 238000006481 deamination reaction Methods 0.000 claims abstract description 22
- 238000000137 annealing Methods 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 20
- 239000003223 protective agent Substances 0.000 claims abstract description 19
- 230000003321 amplification Effects 0.000 claims abstract description 18
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 18
- 238000005096 rolling process Methods 0.000 claims abstract description 17
- 238000007363 ring formation reaction Methods 0.000 claims abstract description 14
- 239000011324 bead Substances 0.000 claims description 113
- 239000003153 chemical reaction reagent Substances 0.000 claims description 84
- 239000000872 buffer Substances 0.000 claims description 35
- 238000012408 PCR amplification Methods 0.000 claims description 22
- 239000000047 product Substances 0.000 claims description 14
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 13
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 13
- 102000004190 Enzymes Human genes 0.000 claims description 13
- 108090000790 Enzymes Proteins 0.000 claims description 13
- -1 salt ions Chemical class 0.000 claims description 13
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical group [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 claims description 12
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 12
- 238000012070 whole genome sequencing analysis Methods 0.000 claims description 12
- 108010012306 Tn5 transposase Proteins 0.000 claims description 10
- 239000002202 Polyethylene glycol Substances 0.000 claims description 9
- 229920001223 polyethylene glycol Polymers 0.000 claims description 9
- 239000007795 chemical reaction product Substances 0.000 claims description 7
- 239000003960 organic solvent Substances 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 6
- 239000002773 nucleotide Substances 0.000 claims description 5
- 125000003729 nucleotide group Chemical group 0.000 claims description 5
- 238000011084 recovery Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 230000001681 protective effect Effects 0.000 claims description 3
- 238000004925 denaturation Methods 0.000 abstract description 8
- 230000036425 denaturation Effects 0.000 abstract description 8
- 230000009615 deamination Effects 0.000 abstract description 5
- 108020004414 DNA Proteins 0.000 description 125
- 239000000243 solution Substances 0.000 description 20
- 239000011534 wash buffer Substances 0.000 description 18
- 238000011282 treatment Methods 0.000 description 16
- 239000000203 mixture Substances 0.000 description 15
- 238000005406 washing Methods 0.000 description 15
- 102000053602 DNA Human genes 0.000 description 13
- 102000003960 Ligases Human genes 0.000 description 13
- 108090000364 Ligases Proteins 0.000 description 13
- 239000002585 base Substances 0.000 description 13
- 239000006228 supernatant Substances 0.000 description 13
- 238000012360 testing method Methods 0.000 description 13
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 230000002255 enzymatic effect Effects 0.000 description 10
- 229940088598 enzyme Drugs 0.000 description 10
- 241000894007 species Species 0.000 description 9
- 206010028980 Neoplasm Diseases 0.000 description 8
- 238000006911 enzymatic reaction Methods 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 8
- 210000000349 chromosome Anatomy 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 229910021642 ultra pure water Inorganic materials 0.000 description 7
- 239000012498 ultrapure water Substances 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 239000011259 mixed solution Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 108020004635 Complementary DNA Proteins 0.000 description 5
- 102000012410 DNA Ligases Human genes 0.000 description 5
- 108010061982 DNA Ligases Proteins 0.000 description 5
- 208000020584 Polyploidy Diseases 0.000 description 5
- 108010020764 Transposases Proteins 0.000 description 5
- 102000008579 Transposases Human genes 0.000 description 5
- 238000010804 cDNA synthesis Methods 0.000 description 5
- 239000012295 chemical reaction liquid Substances 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000001973 epigenetic effect Effects 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 229920001213 Polysorbate 20 Polymers 0.000 description 4
- 108020004682 Single-Stranded DNA Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 238000005755 formation reaction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 4
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 4
- 230000002265 prevention Effects 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000013020 embryo development Effects 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000017105 transposition Effects 0.000 description 3
- 230000028937 DNA protection Effects 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 239000004353 Polyethylene glycol 8000 Substances 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- 239000007984 Tris EDTA buffer Substances 0.000 description 2
- 208000034953 Twin anemia-polycythemia sequence Diseases 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 239000012148 binding buffer Substances 0.000 description 2
- UORVGPXVDQYIDP-UHFFFAOYSA-N borane Chemical compound B UORVGPXVDQYIDP-UHFFFAOYSA-N 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000002144 chemical decomposition reaction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 238000011901 isothermal amplification Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 229940085678 polyethylene glycol 8000 Drugs 0.000 description 2
- 235000019446 polyethylene glycol 8000 Nutrition 0.000 description 2
- 239000012264 purified product Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000007671 third-generation sequencing Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102000040714 Mu family Human genes 0.000 description 1
- 108091071261 Mu family Proteins 0.000 description 1
- 101100476480 Mus musculus S100a8 gene Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001369 bisulfite sequencing Methods 0.000 description 1
- 229910000085 borane Inorganic materials 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 229940079919 digestives enzyme preparation Drugs 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000007031 hydroxymethylation reaction Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 239000002077 nanosphere Substances 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 229940093429 polyethylene glycol 6000 Drugs 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 239000003761 preservation solution Substances 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 239000004289 sodium hydrogen sulphite Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Physics & Mathematics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Biotechnology (AREA)
Abstract
本申请提供了一种DNA甲基化检测的方法,包括长片段DNA处理步骤,将长片段DNA打断;常规文库构建步骤,用stLFR技术建库;双链保护步骤,取回收的stLFR文库,DNA变性,用退火或延伸方法将分子标签或接头序列转化为双链;重亚硫酸盐转化步骤,加入双链保护剂和重亚硫酸盐,进行脱氨基;甲基化测序文库构建步骤,对脱氨基产物进行常规PCR或环化后滚环扩增,得到甲基化测序文库;甲基化测序步骤,对甲基化测序文库测序,根据测序结果分析基因的甲基化信息;本申请还提供了相应试剂盒、装置和应用。本申请方法利用stLFR技术,获得长片段甲基化信息;通过双链保护策略,可事先加入分子标签序列建库,可有效追踪分子来源。
Description
技术领域
本申请涉及DNA甲基化检测领域,特别是涉及一种DNA甲基化检测的方法、试剂盒、装置和应用。
背景技术
分子生物学的快速发展,使基因测序技术成为现代生物学研究中重要的手段之一,广泛应用于肿瘤的预防、筛查、诊断、治疗和预后中。基因测序技术能够真实地反映基因组上全部DNA遗传信息,进而比较全面地揭示肿瘤的发生机制及其发展过程,因而在肿瘤的科学研究中具有十分重要的地位。第一代测序技术是1977年Sanger等发明的双脱氧核苷酸末端终止法和Gilbert等发明的化学降解法;第二代测序技术包括Roche公司的454技术、Illumina公司的Solexa技术、ABI公司的SOLiD技术和华大基因的纳米球测序技术等;Helicos公司和Pacbio的单分子测序技术被称为第三代测序技术。由于第三代测序技术对文库的要求较高,测序成本也较高,因此目前应用最广泛的是第二代测序技术。例如全基因组测序应用于无创产前基因检测、目标区域捕获测序应用于肿瘤靶向用药基因检测、单细胞基因组和转录组测序应用于肿瘤组织的异质性和发生发展机制的研究、长片段测序应用于无创地贫检测的研究等,多种临床检测及基础研究都是在第二代测序技术的平台上开展进行。第二代测序技术,也称高通量测序技术,为临床实验室的分子检测带来革命性的变化;因此,如何构建更高质量的测序文库,以得到更好的测序数据,成为高效检测和广泛临床应用的重要问题。
近年来,表观遗传学研究再次成为基因诊断和精准医疗研究的热点。表观遗传是指在不改变基因的核苷酸序列的情况下,发生的可遗传的基因表达的变化,例如甲基化修饰。针对甲基化修饰的测序检测称为甲基化测序。甲基化测序所提供的表观遗传学信息,在基因印记、胚胎发育、癌症预防等研究领域都有重要作用。在众多表观遗传因子中,碱基的甲基化,特别是胞嘧啶的甲基化信息,是目前实验手段最容易获得,且研究最为深入的表观遗传学分子级标志物。基于重亚硫酸盐的原理,对非甲基化的胞嘧啶进行化学转化,而甲基化的胞嘧啶不会被转化,从而得到基因组的甲基化信息。利用甲基化分析流程,与已知的参考基因组进行比对,即可确定甲基化位点。
目前,经典的全基因组甲基化测序文库的构建都是通过物理方式、酶切或者化学降解的方式将双链DNA长片段随机打断成几百bp的小片段,再将双链DNA变性成单链后,进行重亚硫酸氢钠处理,将没有甲基化的胞嘧啶通过脱氨基作用转化为尿嘧啶,通过引物退火延伸或加接头后延伸得到双链DNA分子,然后进行末端修复、加“A”、加“接头”、PCR扩增等步骤,最终得到用于测序的文库。在获得测序数据后,因为大部分未甲基化的胞嘧啶转变为了尿嘧啶,因此需要将所得文库与已知的原始基因组进行比对,以确定甲基化位点或获得靶标区域的甲基化水平。
受限于脱氨基反应的反应原理,一般经过重亚硫酸盐处理后DNA降解严重,降解率甚至可以达到90%以上,因此会得到众多小片段DNA分子,为后期的基因组比对带来困难;并且,经过这个过程会损失一部分信息,容易丢失全长信息,虽然可以对基因的特定区域进行精确的甲基化测序,但是为全基因组的甲基化信息组装增加了难度。其次,因为重亚硫酸盐处理会改变非甲基化的DNA序列信息,因此无法事先加入分子标签(barcode)序列进行建库,以至于难以追踪分子来源,这对于多倍体生物的同源染色体甲基化信息提取带来困难,也会降低数据比对的可信度。虽然,部分测序试剂盒通过采用人工合成的已经甲基化的测序接头,将加接头步骤安排在片段化之前,可以一定程度上解决上述分子来源追踪的问题;但是,甲基化的测序接头合成成本高昂,不利于大规模的高通量测序操作。此外,现有的甲基化测序,其主要时间成本体现在测序后的数据分析上;对于没有参考基因组的物种,直接进行甲基化分析会非常困难。
发明内容
本申请的目的是提供一种新的DNA甲基化检测的方法、试剂盒、装置及其应用。
本申请具体采用了以下技术方案:
本申请的第一方面公开了一种DNA甲基化检测的方法,包括以下步骤,
长片段DNA处理步骤,包括将长片段DNA打断成小片段DNA;
常规文库构建步骤,包括采用stLFR技术进行文库构建,获得常规文库;
双链保护步骤,包括取用常规文库构建步骤制备的常规文库,磁珠回收,将DNA变性为单链,然后利用退火或延伸的方法将分子标签序列或测序接头序列转化为双链;其中,对常规文库的磁珠回收,本申请的一种实现方式中,在进行stLFR技术建库时,是采用带有分子标签序列的磁珠对DNA片段进行捕获,然后直接将磁珠和捕获DNA片段一起进行stLFR建库,获得常规文库;由于建库过程中涉及到PCR扩增等步骤,因此,常规文库中有两部分核酸,一部分是始终与磁珠结合的DNA,另一部分则是通过PCR扩增产生的游离DNA;用于甲基化测序的则是其中与磁珠结合的DNA,因此,需要取常规文库进行磁珠回收;而游离DNA则根据需求进行后续的常规测序,获得正常基因测序结果;
重亚硫酸盐转化步骤,包括向双链保护步骤的产物中加入双链保护剂,并加入重亚硫酸盐,进行脱氨基反应;
甲基化测序文库构建步骤,包括对脱氨基反应的产物进行常规PCR扩增或环化后滚环扩增,得到甲基化测序文库;
甲基化测序步骤,包括对甲基化测序文库进行测序,并根据测序结果分析获得基因的甲基化信息。其中,根据测序结果分析甲基化信息,具体的是指,将甲基化文库的测序结果与正常基因测序结果进行比对,获得基因的甲基化信息;对于有参考基因组的物种,用于比对的正常基因测序结果就是参考基因组;对于没有参考基因组的物种,用于比对的正常基因测序结果则是前述游离DNA进行常规测序获得的测序结果。
需要说明的是,本申请的DNA甲基化检测方法,利用stLFR技术进行常规文库构建,通过该技术采用的co-barcoding,获得长片段的甲基化信息,解决了现有的甲基化测序读长偏短的问题;与此同时,采用双链保护的方法对分子标签序列或测序接头序列进行保护,而不影响待测片段的重亚硫酸盐处理,简单而有效的解决了现有的甲基化测序无法事先加入分子标签序列进行建库的问题,不仅可以有效追踪分子来源,也可以方便的对多倍体生物的同源染色体甲基化信息进行提取。
优选的,本申请的DNA甲基化检测方法还包括常规测序步骤,常规测序步骤包括,取用常规文库构建步骤采用stLFR技术构建的常规文库,将DNA变性为单链,然后再进行常规PCR扩增或环化后滚环扩增,获得测序文库,对测序文库进行全基因组测序,获得正常基因测序结果;因此,甲基化测序步骤还包括,将甲基化测序文库的测序结果与常规文库获得的正常基因测序结果比对,从而获得基因的甲基化信息。
需要说明的是,对于有参考基因组的物种,在甲基化测序步骤后,可以直接将甲基化测序文库的测序结果与参考基因进行比对分析,从而获得基因的甲基化信息。而对于没有参考基因组的物种,本申请的优选方案基于共建库的原理,将常规文库构建步骤获得的常规文库分为两部分,一部分进行全基因组测序,获得正常基因测序结果;另一部分经过处理后进行甲基化测序;将甲基化测序的测序结果与全基因组测序的正常基因测序结果进行比对分析,获得基因的甲基化信息。本申请的共建库的方案,可以在无参考文库或无参考基因组的情况下,在分子级别对处理前后的文库进行一对一比对,从而得到更加精确的甲基化信息。
优选的,长片段DNA处理步骤还包括,采用带有分子标签序列的载体对小片段DNA进行捕获,然后再将捕获的DNA用于常规文库构建步骤进行stLFR技术文库构建。
优选的,载体为磁珠。
可以理解,磁珠载体是本领域比较常规使用的载体,不排除还可以使用其它载体。
优选的,长片段DNA处理步骤中,将长片段DNA打断成小片段DNA具体采用Tn5转座酶。
可以理解,Tn5转座酶打断获得小片段DNA是本领域常规使用的技术,不排除还可以采用其它物理或化学手段打断DNA。
优选的,双链保护步骤中,延伸的方法具体包括,利用分子标签序列或测序接头序列自身的3’端序列作为引物或加入外源短片段作为引物,在DNA聚合酶作用下延伸,将分子标签序列或测序接头序列变为双链结构。
优选的,重亚硫酸盐转化步骤中,双链保护剂为盐离子、聚乙二醇、酶和有机溶剂中的至少一种,重亚硫酸盐为重亚硫酸氢钠。其中,盐离子例如NaCl,聚乙二醇例如聚乙二醇8000。
需要说明的是,在重亚硫酸盐进行脱氨基处理的过程,需要保持一定温度,防止单链DNA形成二级结构从而影响反应效率;但是,本申请采用了将分子标签序列或测序接头序列转化为双链的双链保护策略;因此,在重亚硫酸盐的反应温度下,需要保障转化的双链不被破坏,因此,本申请优选的方案中加入了双链保护剂,其作用就是使得已经双链化的分子标签序列或测序接头序列能够在高温下始终保持双链状态,以避免其参与重亚硫酸盐反应,从而起到有效保护的作用。可以理解,凡是能够起到以上作用的双链保护剂都可以用于本申请。
本申请的另一面公开了一种DNA甲基化检测的试剂盒,该试剂盒中包括第一组试剂、第二组试剂、第三组试剂、第四组试剂和第五组试剂;第一组试剂包括用于将长片段DNA打断成小片段DNA的试剂;第二组试剂包括用于stLFR技术建库的试剂,该试剂用于制备常规文库;第三组试剂包括用于通过退火或延伸的方法将分子标签序列或测序接头序列转化为双链的试剂,该试剂用于形成双链结构;第四组试剂包括双链保护剂和重亚硫酸盐,用于进行双链保护和脱氨基反应;第五组试剂包括用于对脱氨基反应的产物进行常规PCR扩增或环化后滚环扩增的试剂,该试剂用于制备甲基化测序文库。
需要说明的是,本申请的试剂盒实际上就是根据本申请的DNA甲基化检测方法,将其中核心的试剂有机的组合在一起,一方面,可以方便本申请的DNA甲基化检测方法的进行;另一方面,可以提高各试剂的使用效率,减少浪费,从而降低本申请的DNA甲基化检测的成本。
可以理解,本申请试剂盒中的各试剂都可以单独通过市售购买,但是,本申请的DNA甲基化检测方法涉及的试剂较多,单独购买一方面是耗费时间、繁琐、使用不便;另一方面,由于各试剂都不是按照本申请检测方法用量配比进行的剂量设计,所以,必然会存在大量的试剂浪费,增加检测成本。因此,本申请以本申请DNA甲基化检测方法为基础,将其使用的主要核心试剂组合为本申请的试剂盒。
优选的,本申请的试剂盒还包括第六组试剂,该第六组试剂包括用于对常规文库进行常规PCR扩增或环化后滚环扩增的试剂,该试剂用于制备常规测序文库,以便于进行全基因测序,获得正常基因测序结果。可以理解,第六组试剂中,还可以根据需求增加常规测序所需的试剂。
需要说明的是,本申请的试剂盒是根据本申请的DNA甲基化检测方法而研发的,因此,第一组试剂、第二组试剂、第三组试剂、第四组试剂和第五组试剂,实际上就是依序用于本申请DNA甲基化检测方法中的长片段DNA处理步骤、常规文库构建步骤、双链保护步骤、重亚硫酸盐转化步骤和甲基化测序文库构建步骤;第六组试剂用于常规测序步骤的常规文库构建。可以理解,由于常规测序步骤并非必须的步骤,例如已经有参考基因组的情况下,则不需要进行常规测序;所以本申请的试剂盒中也可以选择性的增加或不增加第六组试剂,又或者将第六组试剂组合到本申请的试剂盒中,可以根据需求选择性的使用。
还需要说明的是,测序试剂盒是单独的试剂盒产品,因此没有包含在本申请的试剂盒中,例如常规测序有独立的常规测序试剂盒,甲基化测序步骤有甲基化测序试剂盒。
优选的,第一组试剂还包括带有分子标签序列的载体,用于对DNA片段进行捕获。
优选的,载体为磁珠,第一组试剂中还包括磁珠纯化的试剂。其中,磁珠纯化的试剂,例如磁珠缓冲液、清洗液、洗脱液等。
优选的,第一组试剂中,用于将长片段DNA打断成小片段DNA的试剂为Tn5转座酶及其缓冲液。
优选的,第三组试剂中,用于通过退火或延伸的方法将分子标签序列或测序接头序列转化为双链的试剂,具体包括外源短核苷酸片段、DNA聚合酶及其缓冲液,以及用于DNA延伸的dNTPs。
其中,外源短核苷酸片段是作为引物使用的,可以根据需求选择使用,也可以不添加到第三组试剂盒中;例如,本申请的一种实现方式中,可以直接利用分子标签序列或测序接头序列自身的3’端序列作为引物进行延伸,因此,外源短核苷酸片段可以只是作为备选方案放到第三组试剂中。
优选的,第四组试剂中,双链保护剂为盐离子、聚乙二醇、酶和有机溶剂中的至少一种,重亚硫酸盐为重亚硫酸氢钠。
可以理解,本申请的DNA甲基化检测方法,其全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现本申请的方法。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现本申请的方法。当本申请的方法中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现本申请DNA甲基化检测方法的全部或部分功能。
因此,本申请的另一面公开了一种DNA甲基化检测的装置,包括长片段DNA处理模块、常规文库构建模块、常规测序模块、双链保护模块、重亚硫酸盐转化模块、甲基化测序文库构建模块和甲基化测序模块;
长片段DNA处理模块,包括用于将长片段DNA打断成小片段DNA;该模块可以采用常规的物理、化学或酶的方式对长片段DNA进行打断;对于物理方式,例如可借鉴超声波破碎;对应化学或酶的方式,该模块一方面可以自动取样或配制反应液,另一方面可以为反应提供温度等反应条件;
常规文库构建模块,包括用于采用stLFR技术进行文库构建;stLFR技术,即single-tube Long Fragment Read,也就是长片段DNA信息获取技术,可参考专利文件WO2019217452A1;另外,stLFR技术进行文库构建可以采用华大智造发布的MGIEasy stLFR文库制备试剂盒进行,具体参考试剂盒使用说明;
常规测序模块,包括用于取用常规文库构建模块中采用stLFR技术构建的常规文库,将DNA变性为单链,然后再进行常规PCR扩增或环化后滚环扩增,获得测序文库,对测序文库进行全基因组测序,获得正常基因测序结果;该模块仅仅在没有参考基因的情况下使用,当然,如果为了获得更精准的处理前后的结果,也可以采用该模块;该模块可以参考现有的自动建库和测序设备或装置;
双链保护模块,包括用于取用常规文库构建模块中采用stLFR技术构建的常规文库,磁珠回收,将DNA变性为单链,然后利用退火或延伸的方法将分子标签序列或测序接头序列转化为双链;该模块一方面可以参考自动取样或配制反应液,另一方面可以为退火或延伸提供温度等反应条件控制;
重亚硫酸盐转化模块,包括用于向经过双链保护模块处理的产物中加入双链保护剂,并加入重亚硫酸盐,进行脱氨基反应;该模块同样可以参考现有的自动取样和反应液配制装置或设备,并为脱氨基反应提供相应的反应条件;
甲基化测序文库构建模块,包括用于对脱氨基反应的产物进行常规PCR扩增或环化后滚环扩增,得到甲基化测序文库;该模块可以参考现有的测序模块;
甲基化测序模块,包括用于对甲基化测序文库进行测序,将甲基化测序结果与正常基因测序结果比对,获得基因的甲基化信息;该模块可以参考现有的甲基化测序和分析模块或装置。其中,正常基因测序结果可以是常规测序模块获得的测序结果,也可以是已经存在的参考基因组。
本申请的DNA甲基化检测装置,根据本申请DNA甲基化检测方法的需求,将检测方法中的各步骤通过自动化的模块实现DNA甲基化的自动检测,即本申请的DNA甲基化检测装置,为DNA甲基化检测提供了个性化的检测系统,能够方便有效的进行DNA甲基化检测。并且,本申请的DNA甲基化检测装置同样具有本申请的DNA甲基化检测方法的各项优点,例如解决了现有的甲基化测序读长偏短的问题,解决了现有的甲基化测序无法事先加入分子标签序列进行建库、不能追踪分子来源的问题。
优选的,本申请的DNA甲基化检测装置中,其长片段DNA处理模块,还包括用于采用带有分子标签序列的载体对小片段DNA进行捕获,然后再将捕获的DNA用于常规文库构建模块采用stLFR技术进行文库构建;
优选的,载体为磁珠。
优选的,本申请的DNA甲基化检测装置,其长片段DNA处理模块中,将长片段DNA打断成小片段DNA具体采用Tn5转座酶。
优选的,本申请的DNA甲基化检测装置,其双链保护模块中,延伸的方法具体包括,利用分子标签序列或测序接头序列自身的3’端序列作为引物或加入外源短片段作为引物,在DNA聚合酶作用下延伸,将分子标签序列或测序接头序列变为双链结构。
优选的,本申请的DNA甲基化检测装置,其重亚硫酸盐转化模块中,双链保护剂为盐离子、聚乙二醇、酶和有机溶剂中的至少一种,重亚硫酸盐为重亚硫酸氢钠。
本申请的再一面还公开了一种DNA甲基化检测装置,该装置包括存储器和处理器;存储器用于存储程序;处理器用于通过执行存储器存储的程序以实现本申请的DNA甲基化检测方法。
本申请的再一面还公开了一种计算机可读存储介质,包括存储于其中的程序,该程序能够被处理器执行以实现本申请的DNA甲基化检测的方法。
本申请的再一面还公开了本申请的DNA甲基化检测方法、本申请的试剂盒或本申请的DNA甲基化检测装置在基因印记检测、胚胎发育检测或癌症预防检测中的应用。
可以理解,本申请的DNA甲基化检测方法、试剂盒和装置,能够获得长片段的甲基化信息,不仅可以有效追踪分子来源,也可以方便的对多倍体生物的同源染色体甲基化信息进行提取;因此,能够方便的应用于基因印记检测、胚胎发育检测、癌症预防检测等领域。
本申请的有益效果在于:
本申请的DNA甲基化检测方法,利用stLFR技术的优点,能够获得长片段的甲基化信息;采用双链保护的方法对分子标签序列或测序接头序列进行保护,可以事先加入分子标签序列进行建库,从而可以有效追踪分子来源,并方便的对多倍体生物的同源染色体甲基化信息进行提取。
附图说明
图1是本申请实施例中DNA甲基化检测方法的流程示意图;
图2是本申请实施例中DNA甲基化检测装置的构造示意图;
图3是本申请实施例中基于磁珠捕获的双链保护分子标签的示意图;
图4是本申请实施例中不同形式的双链保护的示意图;
图5是本申请实施例中不同形式的双链保护的示意图;
图6是本申请实施例中不同形式的双链保护的示意图;
图7是本申请实施例中构建的stLFR常规文库(WGS)和甲基化测序文库(WGBS)的琼脂糖凝聚电泳图。
具体实施方式
现有的甲基化测序读长偏短,并且,一般常规的甲基化测序不能事先加入分子标签序列进行建库,无法追踪分子来源,难以实现多倍体生物的同源染色体甲基化信息提取。虽然有研究提出可以采用人工合成的甲基化的测序接头,解决事先加入分子标签的问题,但是,人工合成甲基化测序接头成本高昂,难以用于大规模的高通量测序。
基于以上问题,本申请创造性的借鉴stLFR技术进行文库构建,解决读长偏短的问题;然后,创造性的提出双链保护策略,对事先添加的分子标签序列或测序接头序列进行保护,避免其被重亚硫酸盐处理破坏,以解决不能事先加入分子标签序列进行建库的问题;利用同一文库两次建库的策略,解决了无参考基因组条件下的甲基化文库比对问题。根据以上构思,本申请研发了一种DNA甲基化检测的方法,如图1所示,包括长片段DNA处理步骤11、常规文库构建步骤12、双链保护步骤14、重亚硫酸盐转化步骤15、甲基化测序文库构建步骤16、甲基化测序步骤17;在优选的方案中,基于共建库的原理,本申请的方法还包括常规测序步骤13。
其中,长片段DNA处理步骤11,包括将长片段DNA打断成小片段DNA;包括采用物理、化学或酶的方式将长片段DNA打断,例如本申请的一种实现方式中,具体采用Tn5转座酶将DNA打断成小片段。
常规文库构建步骤12,包括采用stLFR技术进行文库构建,获得常规文库。该步骤可以参考专利文献WO2019217452A1或者采用华大智造发布的MGIEasy stLFR文库制备试剂盒进行常规建库。在本申请的一种实现方式中,在此之前还包括采用带有分子标签序列的载体对打断的DNA片段进行捕获,然后再进行stLFR技术建库。其中,带有分子标签序列的载体即带有多拷贝特定标签序列或分子标签的载体,是指在一个载体上,带有相同序列的多个拷贝的寡聚核苷酸序列。
本申请的一种实现方式中,具体采用磁珠作为载体,为了保障磁珠和DNA的稳固结合,本申请通过双链霉亲和素蛋白嵌合体连接,使用化学修饰的DNA与磁珠上的化学基团反应,这些化学修饰包括但不限于I-linker、Amino-modified oligo、Thiol-modifiedoligo、Acrydite-modified oligo等。可以理解,磁珠在后续的反应中需要进行两轮PCR扩增,因此要求DNA与磁珠的偶联必须能够耐酸碱、耐高温且不易降解。
常规测序步骤13,包括取用常规文库构建步骤采用stLFR技术构建的常规文库,将DNA变性为单链,然后再进行常规PCR扩增或环化后滚环扩增,获得测序文库,对测序文库进行测序,获得正常基因测序结果。该步骤即正常的DNA建库和测序步骤,其目的是为了便于没有已知参考基因的物种,可以通过甲基化处理前后对比,准确的分析甲基化位点。可以理解,如果待测物种已经有比较准确的参考基因序列,则可以不用该步骤。
双链保护步骤14,包括取用常规文库构建模块中采用stLFR技术构建的常规文库,磁珠回收,将DNA变性为单链,然后利用退火或延伸的方法将分子标签序列或测序接头序列转化为双链。
双链保护可以采用退火或延伸的方式实现,其中,延伸的方式实现,例如,利用分子标签序列或测序接头序列自身的3’端序列作为引物,如图3的A图所示,或者,加入外源短片段作为引物,如图3的B图所示,在DNA聚合酶作用下延伸,将分子标签序列或测序接头序列变为双链结构。
另外,双链保护根据不同的载体或者DNA的不同形态,还可以有多种保护形式,如图4至图6所示。图4左边一列为与磁珠结合的DNA的双链保护,右边一列为游离DNA的双链保护;“●”表示磁珠,深色双实线表示互补DNA双链,浅色双实线表示非互补DNA双链;a为单端保护、b为双端保护、c为桥式保护、d为3’和/或5’端颈环结构保护、e为3’和/或5’端颈环桥式结构保护、f为分子内颈环结构保护。图5为环状DNA的双链保护机制,同样的,深色双实线表示互补DNA双链;a为引入单链引物的双链保护、b为通过Y接头引物进行的双链保护、c为单链自成环形成双链保护。图6为以固体表面为载体的DNA的双链保护机制,深色双实线表示互补DNA双链,浅色双实线表示非互补DNA双链;其中,a和b是不同位置的单端保护、c为双端保护、d为颈环式单端保护、e为桥式结构保护、f为3’或5’端颈环桥式结构保护、g为分子间桥式结构保护。具体采用怎样的保护机制可以根据DNA序列的设计而定,或者根据不同的载体设计不同的序列,以采取不同的双链保护机制。
重亚硫酸盐转化步骤15,包括向双链保护步骤的产物中加入双链保护剂,并加入重亚硫酸盐,进行脱氨基反应。
在DNA进行重亚硫酸盐,例如重亚硫酸氢钠,处理过程中,需要保持一定温度,防止单链DNA形成二级结构从而影响反应效率,而在本申请中,文库同时存在双链和单链结构,因此需要加入一种DNA的双链保护试剂,使得已经双链化的序列能够在高温下始终保持双链状态,以起到有效的保护作用。本申请可以采用的双链保护试剂包括盐离子、聚乙二醇、酶和有机溶剂等能够有效的防止高温下双链DNA变性,同时能够保持单链的转化效率。
甲基化测序文库构建步骤16,包括对脱氨基反应的产物进行常规PCR扩增或环化后滚环扩增,得到甲基化测序文库。甲基化测序步骤17,包括对甲基化测序文库进行测序,然后进行数据分析,并根据测序结果分析获得基因的甲基化信息。
本申请的DNA甲基化检测方法,相比现有技术,有以下优点:
1)通过stLFR自身具有的co-barcoding技术,获得长片段的甲基化信息,解决了甲基化测序中读长偏短的问题;
2)可以进行长片段DNA序列检测,利于新物种的从头测序,基因组组装;
3)可以在不需要参考序列的前提下,对某一特定DNA片段进行快速准确的比对;
4)可以对多倍型基因组不同染色体的甲基化水平进行测定;
5)适用于对基于oxBS-seq原理的5mC的测序;
6)适用于去甲基酶Tet和AID/APOBEC参与的5hmC的测序;
7)适用于TAPS-seq原理的甲基化测序(5mC)、羟甲基化测序(5hmC)、羧基胞嘧啶(5caC)的测序。
本申请的DNA甲基化检测方法同样适用于甲基化测序(5mC)和羟甲基化测序(5hmC),详细说明如下:
1.采用自BGI自产的甲基化测序试剂盒,对DNA样品进行常规的Bisulfite处理,按照专利WO2019217452A1所描述建库方法建库上机,可以获得5mC测序结果。Bisulfite试剂的主要成分是重重亚硫酸氢钠,其可以将非甲基化的胞嘧啶转化为U,而5mC和5hmC则不会被转化,从而获得DNA的甲基化信息。Bisulfite测序无法区分甲基化的类型是5mC还是5hmC,得到的实际上是一个混合的信号。
2.利用oxBS-seq的原理,先将文库进行氧化处理,将5hmC转化为羧基胞嘧啶(5caC),再进行Bisulfite处理,未甲基化的C和5caC都会转化为U,而5mC则不会被转化,从而得到完整的5mC测序信息。
3.利用TAB-seq或ACE-seq原理,先对5hmC进行糖基化保护,再用Tet酶或A3A酶对DNA进行去甲基化处理,将其他没有糖基化保护的5mC转化为非甲基化的C,再进行Bisulfite处理,从而获得完整的5hmC的测序信息。
4.利用TAPS-seq的原理,先将文库进行氧化处理,将5mC和5hmC转化为羧基胞嘧啶(5caC),再进行硼烷处理,将其转化为U,从而获得5mC和5hmC的测序信息。
基于本申请的DNA甲基化检测方法,本申请研发了一种DNA甲基化检测装置,如图2所示,包括长片段DNA处理模块21、常规文库构建模块22、常规测序模块23、双链保护模块24、重亚硫酸盐转化模块25、甲基化测序文库构建模块26和甲基化测序模块27;长片段DNA处理模块21,包括用于将长片段DNA打断成小片段DNA;常规文库构建模块22,包括用于采用stLFR技术进行文库构建;常规测序模块23,包括用于取用采用stLFR技术构建的常规文库,将DNA变性为单链,然后再进行常规PCR扩增或环化后滚环扩增,获得测序文库,对测序文库进行测序,获得正常基因测序结果;双链保护模块24,包括用于取用部分采用stLFR技术构建的常规文库,磁珠回收,将DNA变性为单链,然后利用退火或延伸的方法将分子标签序列或测序接头序列转化为双链;重亚硫酸盐转化模块25,包括用于向经过双链保护模块处理的产物中加入双链保护剂,并加入重亚硫酸盐,进行脱氨基反应;甲基化测序文库构建模块26,包括用于对脱氨基反应的产物进行常规PCR扩增或环化后滚环扩增,得到甲基化测序文库;甲基化测序模块27,包括用于对甲基化测序文库进行测序,并进行数据分析,将甲基化测序结果与正常基因测序结果比对,获得基因的甲基化信息。
本申请的DNA甲基化检测方法和装置,不但具有stLFR的优点,同时还能够给出精确的甲基化信息:
1)在现有的甲基化测序中,因实验原理限制,通常只能得到较短的读长;而本申请通过co-barcoding技术,可以将短读长组装成长片段,给出更加完整的甲基化图谱;
2)基于共建库的原理,对于WGS和WGBS文库进行比对,可以在无参考文库的情况下,在分子级别对处理前后的文库进行一对一比对,得到更加精确的甲基化信息;
3)通过双链保护机制,有效的避免分子标签信息变异,节约时间及合成成本。
下面通过具体实施例对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。
实施例
本例以人基因组DNA测序为例,进行DNA甲基化检测,其过程包括:首先提取长片段基因组DNA,再用Tn5转座酶将DNA打断成小片段,用带有分子标签序列的磁珠进行捕获。采用stLFR技术进行文库构建,获得常规文库。得到常规建库的文库后,进行常规的PCR扩增,吸取PCR产物上清得到文库L,进行常规的上机测序操作得到WGS数据。同时回收常规文库的磁珠用于甲基化测序建库;将回收的磁珠上的DNA分子充分变性为单链,然后利用磁珠上分子中自身的3’端序列作为引物或加入一个外源的短片段作为引物,如图3所示,在DNA聚合酶作用下,将其中的DNA分子标签序列变为双链结构,加入双链保护剂并进行重亚硫酸氢钠转化反应,反应完成后进行常规的PCR扩增得到文库M,对文库M进行上机测序操作得到WGBS数据;最后将WGS和WGBS数据进行一对一比对,确定甲基化位点。本例的DNA甲基化检测详细如下:
一、制备带有多拷贝的分子标签的载体
(1)将接头序列(linker)通过生物素-链霉亲和素作用连接到修饰有链霉亲和素蛋白的磁珠上。Linker为双链DNA分子,由两条单链DNA链退火在一起,两条单链DNA的退火条件为70℃退火1分钟,然后以0.1℃/s的速度缓慢降温至20℃,20℃反应30分钟。
Linker的双链DNA分子中正义链为Linker-F,反义链为Linker-R;其中,Linker-F为SEQ ID NO.1所示序列,Linker-F的3’端具有Bio修饰,Linker-R为SEQ ID NO.2所示序列。
SEQ ID NO.1:
5’-CTTCCGGCAGAACGACATGGCTACGAAAAAAAAAA-3’Bio
SEQ ID NO.2:5’-CGTAGCCATGTCGTTCTGCC-3’。
本例采用的带有链霉亲和素的磁珠为Dynabeads M-280 streptation(112.06D,Invitrogen)。按照Linker(50μM)2μL与M280磁珠30μL的比例混合;磁珠的保存液替换成1倍浓度的磁珠结合缓冲液,25℃,在垂直混匀仪上混合1个小时,然后用低盐磁珠洗涤缓冲液洗涤2次,最后用12.5μL的1倍浓度的连接缓冲液重悬磁珠。
其中,磁珠结合缓冲液由50mM的Tirs-HCl、150mM的NaCl和0.1mM EDTA组成;低盐磁珠洗涤缓冲液由50mM的Tirs-HCl、150mM的NaCl和0.02%的Tween-20组成;正常配制的连接缓冲液为10倍浓度,10倍浓度的连接缓冲液,其由聚乙二醇800030%、Tris-HCl 150mM、ATP 1mM、BSA 0.15mg/mL、MgCl430mM、DTT 1.5mM组成。
(2)将不同编号,即1至1536号,的序列1和辅助序列1分装在384孔板的不同孔中进行退火,1∶1退火,一共4μL/孔,共计4个384孔板。
标签序列1与辅助序列1的退火条件是:100μM的序列1与辅助序列1按体积比1∶1混合后置于PCR仪器上,70℃1分钟,然后以0.1℃/s的速度缓慢降温至20℃,20℃反应30分钟。
其中,标签序列1为SEQ ID NO.3所示序列,辅助序列1为SEQ ID NO.4所示序列。标签序列1的5’端含有分子标签序列“Barcode”,辅助序列1的第22碱基和第23碱基之间插入分子标签序列“Barcode”。
SEQ ID NO.3:5’-[Barcode]ACCCTGACTAGGTCGC-3’
SEQ ID NO.4:
5’-GGAAGGGCGACCTAGTCAGGGT[Barcode]CGCAGA-3’。
(3)使用DNA连接酶将载体上的接头序列与序列1进行连接。该序列包含一段特定的DNA序列,标记为分子标签1。具体步骤为将步骤(1)中带有Linker的M280磁珠平均分配到4块384孔板的1536个孔中,每孔2.5μL。再在每孔补上3.5μL连接混合液,连接混合液含有1μL连接酶(T4 DNA ligase 600U/μL,Enzymatics),1.5μL超纯水和1μL连接缓冲液(10×T4DNA ligation buffer,Enzymatics),以每个384孔板10μL的总反应体积进行连接反应,反应温度25℃,反应时间1个小时。使用100μL高盐磁珠洗涤缓冲液洗涤一次,再使用100μL低盐磁珠洗涤缓冲液洗涤一次,用于去除反应中的连接酶与未能完全反应的寡聚核苷酸。
其中,高盐磁珠洗涤缓冲液由50mM Tirs-HCl、500mM NaCl、0.02%Tween-20组成;低盐磁珠洗涤缓冲液由50mM Tirs-HCl、150mM NaCl、0.02%Tween-20组成。
(4)将步骤(3)清洗后的磁珠通过磁力架收集,然后用1倍浓度的连接缓冲液重悬磁珠,重悬后Linker的浓度为1.6μM,并使用震荡混匀仪混匀。
(5)将不同编号,即1至1536号,的标签序列2和辅助序列2分装在全新的384孔板的不同孔中退火,共计4个384孔板。
标签序列2与辅助序列2的退火条件是:标签序列2100μM与辅助序列2100uM各2μL混合于384孔板中,然后置于PCR仪器上,70℃ 1分钟,然后以0.1℃/s的速度缓慢降温至20℃,20℃反应30分钟。
其中,标签序列2为SEQ ID NO.5所示序列,辅助序列2为SEQ ID NO.6所示序列。标签序列2的第47碱基和第48碱基之间插入分子标签序列“Barcode”,辅助序列2的3’端含有分子标签序列“Barcode”。
SEQ ID NO.5:
5’-GTACTGAGGGCTGGCGACCTTGAGTGCTTCGACTGGCCGTCGTTTTA[Barcode]TCTGCG-3’
SEQ ID NO.6:5’-TAAAACGACG[Barcode]-3’。
(6)将步骤(4)混匀后的磁珠按每孔2.5μL的量分配到步骤(5)的384孔板的各个孔中。然后加入3.5μL连接混合液,连接混合液含有1μL连接酶(T4 DNA ligase 600U/μL,Enzymatics),1.5μL超纯水和1μL连接缓冲液(10×T4 DNA ligation buffer,Enzymatics),在25℃反应1个小时。
(7)使用100μL高盐磁珠洗涤缓冲液洗涤一次,再使用100μL低盐磁珠洗涤缓冲液洗涤一次,用于去除反应中的连接酶与未能完全反应的寡聚核苷酸;最后,用磁力架收集磁珠,再将磁珠重悬于低盐磁珠洗涤缓冲液中,4℃可保存1年。
至此,完成2359296种分子标签磁珠载体的制备,磁珠的浓度为19000000个/μL。
二、stLFR技术建库
(1)准备带有标签的磁珠,取1千万个磁珠,即5.3μL磁珠,用磁力架去除磁珠中的低盐磁珠洗涤液,用50μL低盐磁珠洗涤液洗涤一次,然后用强碱变性缓冲液50μL重悬磁珠,在常温下孵育5分钟,用磁力架吸附磁珠2分钟,去除强碱变性缓冲液,再加入强碱变性缓冲液50μL洗涤磁珠一次,磁力架吸附磁珠2分钟,去除强碱变性缓冲液,用低盐磁珠洗涤缓冲液50μL洗涤一次,用杂交缓冲液50μL洗涤一次,最后用杂交缓冲液50μL重悬磁珠。
其中,强碱变性缓冲液由1.6M的KOH和1mM的EDTA组成;杂交缓冲液由50mM Tris-HCl、1000mM NaCl、0.05%Tween-20组成。
(2)取20μL长片段DNA(2ng/μL),缓慢加入27μL超纯水、12μL打断缓冲液(5×TIBuffer,MGIEasy stLFR)和1μL转座复合体(2pmol/μL,MGIEasy stLFR),共60μL反应液,55℃孵育10分钟后置于冰上。取15μL反应液,加入35μL超纯水,稀释至50μL,标记为打断DNA溶液。
将50μL的打断DNA溶液与步骤(1)中带标签(Barcode)的磁珠50μL混合,60℃反应1分钟,然后让反应液置于室温,让其自然降温并置于垂直混匀仪,25℃混合反应1个小时,标记为杂交捕获体系。
(3)使用转座复合体1时,在1个小时的杂交时间结束后,加入100μM的封闭序列1(Blocker1)2μL到100μL杂交捕获体系中,置于垂直混匀仪上25℃反应0.5个小时。然后用低盐磁珠洗涤液洗涤磁珠两次,加入聚合酶和连接酶的混合反应液重悬磁珠,置于20℃反应0.5小时。
其中,混合反应液中含有:DNA聚合酶T4 DNA Polymerase(3U/μL,Enzymatics)6μL、连接酶T7 DNA ligase(3000U/μL,NEB)1μL、2×T7 DNA ligase buffer(NEB)25μL、25mMdNTP 0.5μL、10mM ATP 5μL,补足体积的水至50μL。
2×T7 DNA ligase buffer中含有:132mM Tris-HCl、20mM MgCl2、2mM ATP、2mMDTT、15%Polyethyleneglycol(聚乙二醇6000)。
封闭序列1为SEQ ID NO.7所示序列。
SEQ ID NO.7:
5’-CCTAGCATGGACTATCGATCCTTGGTGATCATGTCGTCAGTGC-3’Bio
反应结束后加入5μL的0.44%SDS室温下孵育10分钟使转座酶变性从DNA上释放下来,然后用高盐磁珠洗涤液和低盐磁珠洗涤液分别洗涤一次。加入聚合酶试剂混合液重悬磁珠,置于72℃反应10分钟。
其中,聚合酶试剂混合液中含有:聚合酶Standard Taq polymerase(5U/μL,NEB)1μL、10×thermopol buffer(NEB)5μL、25mM dNTP(Enzymatics)0.8μL,总体积50μL。反应结束后用磁力架吸附磁珠,回收上清液。
10×thermopol buffer中含有:200mM Tris-HCl、100mM(NH4)2SO4、100mM KCl、20mM MgSO4、1%
(4)使用转座复合体2时,在1个小时的杂交时间结束后,加入100μM的封闭序列2(Blocker2)2μL到100μL的杂交捕获体系中,置于垂直混匀仪上25℃反应0.5个小时。加入0.44%SDS 10μL室温下孵育10分钟使转座酶变性从DNA分子上释放下来。用100μL高盐磁珠洗涤液和低盐磁珠洗涤液各洗涤一次,用18μL的TE缓冲液重悬磁珠,再加入USER酶(1U/μL,NEB)2μL,置于垂直混匀仪上37℃反应0.5个小时,在37℃环境下,用37℃预热的高盐磁珠洗涤液和低盐磁珠洗涤缓冲液各洗涤一次。用连接酶试剂混合液重悬磁珠,置于垂直混匀仪上25℃反应1个小时。连接酶试剂混合液中包含连接酶,其组成为:T4 DNA ligase(600U/μL,Enzymatics)5μL、3倍浓度的连接缓冲液10μL和16.7μM接头21.5μL,总体积为30μL。
其中,3倍浓度的连接缓冲液中含有:30%聚乙二醇8000、150mM Tris-HCl、1mMATP、0.15mg/mL BSA、30mM MgCl2、1.5mM DTT。16.7μM接头,即接头2,由正义链接头2-F和反义链接头2-R退火形成。接头2-F为SEQ ID NO.9所示序列,接头2-F的5’端具有磷酸化修饰,3’端为双脱氧碱基;接头2-R为SEQ ID NO.10所示序列,接头2-R的3’端为双脱氧碱基。
SEQ ID NO.9:5’-phos-TCTGCTGAGTCGAGAACGTCTddC-3’
SEQ ID NO.10:5’-CTCGACTCAGCAGddA-3’
反应结束后高盐磁珠洗涤液和低盐磁珠洗涤缓冲液各洗涤一次。用2×T7 ligasebuffer(NEB)10μL、1μL浓度100μM的引物2、1μL浓度100μM的引物3和8μL水配制成20μL退火混合液,用退火混合液重悬磁珠,70℃1分钟,以0.1℃每秒的速度缓慢降温至20℃,20℃反应30分钟。然后,直接加入聚合酶和连接酶混合液试剂20℃反应0.5个小时。
引物2为SEQ ID NO.12所示序列,引物2的5’端具有磷酸化修饰;引物3为SEQ IDNO.8所示序列,封闭序列1的3’端具有Bio修饰。
SEQ ID NO.8:
5’-CGTAGCCATGTCGTTCTGCCGGAAGGGCGACCTAGTCAGGGT-3’
SEQ ID NO.12:5’-phos-GAGACGTTCTCGACTCAGCAGA-3’。
其中,聚合酶和连接酶混合试剂包含:聚合酶(T4 DNA Polymerase 3U/μL,Enzymatics)6μL、连接酶(T7 DNA ligase 3000U/μL,NEB)1μL、2×T7 DNA ligase buffer(NEB)15μL、25mM dNTP 0.5μL、10mM ATP 5μL,补足体积的水至30μL。
反应结束后用100μL高盐磁珠洗涤液和低盐磁珠洗涤缓冲液各洗涤一次。然后加入有链置换活性的聚合酶试剂混合液重悬磁珠,置于65℃反应5分钟。聚合酶试剂混合液中含有:聚合酶(Bst2.0DNA Polymerase 8U/μL,NEB)1μL、10×IsothermalAmplification Buffer(NEB)5μL、25mM dNTP(Enzymatics)0.8μL、100mM MgSO41.5μL,总体积50μL。反应结束后用磁力架吸附磁珠,回收上清液。
其中,10×Isothermal Amplification Buffer中含有:200mM Tris-HCl、100mM(NH4)2SO4、500mM KCl、20mM MgSO4、1%
(5)使用引物1和引物2进行DNA分子聚合酶链式扩增13个循环。
反应体系如下:
50μL步骤(4)中回收的上清液,75μL 2×KAPA HiFi Master Mix(KapaBiosystems),0.75μL引物1(100μmol/L),0.75μL引物2(100μmol/L),23.5μL超纯水。
反应条件如下:
I.98℃ 3分钟;II.95℃ 30秒,58℃ 30秒,72℃ 2分钟,重复步骤(II)
13次;III.72℃ 5分钟;IV.4℃保存。
其中,引物1为SEQ ID NO.11所示序列;引物2为SEQ ID NO.12所示序列,引物2的5’端具有磷酸化修饰。
SEQ ID NO.11:5’-CGTAGCCATGTCGTTCTG-3’。
三、常规测序
将“二、stLFR技术建库”得到的PCR产物置于磁力加上,小心吸取上清液,用AMPureXP beads(Agencourt AMPure XP-Medium,A63882,AGENCOURT)进行纯化,纯化方法参考官方提供的标准操作规程,纯化结束后回收产物为带有分子标签的适合测序的短片段分子。
由于本例采用BGIseq-500进行测序,因此,需要对磁珠纯化的产物进行成环反应,操作详情参照BGIseq-500标准DNA小片段建库流程的成环步骤。然后,对环化的产物进行BGIseq-500测序。
四、双链DNA保护
将stLFR文库磁珠转移至1.5mL离心管中,用500μL的1×Buffer D(0.1M NaOH)充分洗涤2次,将离心管置于磁力架上,弃掉上清液,回收磁珠。再用低盐磁珠洗涤缓冲液充分洗涤2次,弃掉上清液,回收磁珠。向回收的磁珠中加入47μL的超纯水、50μL的2×PfuCx Mixbuffer(Agilent),2μL的PfuCx聚合酶(Agilent),以及1μL的ME引物。其中,ME引物是对应于文库中靠近barcode的3’末端的一段互补序列,ME引物为SEQ ID NO.13所示序列。
SEQ ID NO.13:5’-CTGTCTCTTATACACATCT-3’。
将混合物及磁珠充分混匀,离心并转移至250μL的PCR管中,在PCR仪器上运行如下程序:98℃ 3分钟,50℃ 1分钟,72℃ 10分钟,室温保持。
将反应物取出,至于冰上,并用高盐磁珠洗涤液洗涤1次,低盐磁珠洗涤缓冲液洗涤2次,移去上清,回收磁珠于1.5mL的离心管中。
五、重亚硫酸氢钠转化和甲基化测序文库
按照BGI甲基化测序试剂盒的实验步骤,完成重亚硫酸氢钠转化反应,详细如下:
1.加入20μL双链DNA保护buffer,加入130μL的Bisulfite Buffer(ZymoBioTech),充分混匀,用锡箔纸覆盖管体,避光。
2.将离心管置于旋转混合仪上,在60℃,孵育1个小时。
3.将离心管置于磁力架上2分钟,弃去上清液,加入400μL的Wash buffer(ZymoBioTech),前后置换离心管位置,充分洗涤磁珠后,弃去上清液。
4.加入200μL的Desulphonation buffer(Zymo BioTech),在室温下孵育25-30分钟,不时轻微震荡离心管,防止磁珠沉降。
5.将磁珠置于磁力架上2分钟,弃去上清液,加入400μL的低盐磁珠洗涤缓冲液,前后置换离心管位置,充分洗涤磁珠后,弃去上清液,将磁珠重悬于TE buffer中。
6.取10M磁珠加入PCR Mix并补水至体积为50μL。
其中,PCR Mix包括:25μL的2×PfuCx Mix(Agilent)、0.25μL的浓度为100μM的PCRForward primer、0.25μL的浓度为100μM的PCR Reverse primer、0.75μL的PfuCxpolymerase(Agilent)。
PCR Forward primer为SEQ ID NO.14所示序列,PCR Reverse primer为SEQ IDNO.15所示序列。
SEQ ID NO.14:5’-TGTGAGCCAAGGAGTTG-3’
SEQ ID NO.15:5’-GAGACGTTCTCGACTCAGCAGA-3’。
将PCR管置于PCR仪器上运行如下程序:98℃ 3分钟,然后进入10个循环:98℃ 30秒、58℃ 30秒、72℃ 2分钟,循环结束后,72℃延伸10分钟,然后降温至4℃保存。
7.用0.8×的AMPure XP beads(Agencourt AMPure XP-Medium,A63882,AGENCOURT)对PCR产物进行纯化,并将PCR产物重悬至20μL超纯水中,即得到LFR甲基化测序文库。
六、甲基化测序
由于本例采用BGIseq-500进行测序,因此,需要对磁珠纯化的产物进行成环反应,操作详情参照BGIseq-500标准DNA小片段建库流程的成环步骤。然后,对环化的产物进行BGIseq-500测序。
七、实验结果
1.文库电泳结果
甲基化测序文库及对应的stLFR文库制备的结果,本例用1.5%琼脂糖凝胶140V、30分钟跑电泳,结果如图7所示。图7中,第一泳道为DNA marker,本例采用的是Thermofisher 1kb plus DNA ladder;第二和第三泳道为WGS的S1和S2,即正常基因测序的stLFR测序文库的两个重复;第四和第五泳道为WGBS的S1和S2,即甲基化测序文库的两个重复。
2.甲基化测序结果
本例采用相同的人基因组DNA,按照现有的甲基化测序方法进行测序,作为对比。结果如表1所示。
表1测序结果比对
试验 | Clean_reads | Clean_bases(bp) | Mapped_reads | Mapping_rate(%) |
试验组一(常规文库) | 156770568 | 15677056800 | 149334322 | 95.26 |
试验组二(甲基化文库) | 156868710 | 15686871000 | 150202688 | 95.75 |
对照组SRR6006942 | 157796950 | 23827339450 | 133582687 | 84.65 |
表1中,试验组一为本例stLFR技术建库后用于常规测序获得的数据,试验组二为本例stLFR技术建库后进行甲基化建库和测序获得的数据,对照组即按照常规的甲基化测序获得的数据。与对照组相比较,本例常规测序和甲基化测序结果的mapping效率都高于常规甲基化测序的对照组。并且,在无参考基因组的前提下,本例从试验组一和试验组二中分别抽取分子标签序列一致且长度一致的reads进行一对一比对,即可获得甲基化信息。例如,对于已知的低甲基化水平LINE基因片段:
试验组一的分子标签序列:1320_499_969序列如SEQ ID NO.16所示,
SEQ ID NO.16:
5’-ATGGAAACTGAACAACCTGCTCCTGAATGACTACTGGGTACATAACGAA-3’
试验组二的分子标签序列:1320_499_969序列如SEQ ID NO.17所示,
SEQ ID NO.17:
5’-ATGGAAATTGAATAATTTGTTTTTGAATGATTATTGGGTATATAATGAA-3’
直接比较SEQ ID NO.16和SEQ ID NO.17,即可确认该序列没有甲基化位点。而无需与人基因组参考序列进行比对,这对于本身没有参考基因组序列的物种而言,具有重要意义。
需要说明的是,以上试验只是本申请的一种具体实现方式,试验中采用的具体的反应体系、反应条件只是一个常规的参考,在此基础上可以根据具体试验进行改变。以上试验中试验的DNA片段化的酶,除Tn5转座酶以外,还可以是Tn转座酶家族的其他酶,如Tn7;或者其他转座酶家族,如Mu家族;甚至不限于转座酶或者酶制剂,只要其能够使DNA被片段化同时将一段序列连接至DNA上即可。本实例涉及到的酶、缓冲液、使用的分子标签数量、载体、载体表面修饰、分子标签结构、加接头方案等可参考WO2019217452A1。
本申请的DNA甲基化检测可以用于全基因组甲基化测序、基因未知区域甲基化测序、已知特定区域的甲基化测序、同源染色体上等位基因的甲基化信息对比、单倍体全基因组甲基化测序及组装。并且,可以是线粒体、叶绿体等的DNA甲基化检测。
以上内容是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换。
SEQUENCE LISTING
<110> 深圳华大生命科学研究院
<120> 一种DNA甲基化检测的方法、试剂盒、装置和应用
<130> 19P29597-A27516
<160> 17
<170> PatentIn version 3.3
<210> 1
<211> 35
<212> DNA
<213> 人工序列
<400> 1
cttccggcag aacgacatgg ctacgaaaaa aaaaa 35
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<400> 2
cgtagccatg tcgttctgcc 20
<210> 3
<211> 16
<212> DNA
<213> 人工序列
<400> 3
accctgacta ggtcgc 16
<210> 4
<211> 28
<212> DNA
<213> 人工序列
<400> 4
ggaagggcga cctagtcagg gtcgcaga 28
<210> 5
<211> 53
<212> DNA
<213> 人工序列
<400> 5
gtactgaggg ctggcgacct tgagtgcttc gactggccgt cgttttatct gcg 53
<210> 6
<211> 10
<212> DNA
<213> 人工序列
<400> 6
taaaacgacg 10
<210> 7
<211> 43
<212> DNA
<213> 人工序列
<400> 7
cctagcatgg actatcgatc cttggtgatc atgtcgtcag tgc 43
<210> 8
<211> 42
<212> DNA
<213> 人工序列
<400> 8
cgtagccatg tcgttctgcc ggaagggcga cctagtcagg gt 42
<210> 9
<211> 22
<212> DNA
<213> 人工序列
<400> 9
tctgctgagt cgagaacgtc tc 22
<210> 10
<211> 14
<212> DNA
<213> 人工序列
<400> 10
ctcgactcag caga 14
<210> 11
<211> 18
<212> DNA
<213> 人工序列
<400> 11
cgtagccatg tcgttctg 18
<210> 12
<211> 22
<212> DNA
<213> 人工序列
<400> 12
gagacgttct cgactcagca ga 22
<210> 13
<211> 19
<212> DNA
<213> 人工序列
<400> 13
ctgtctctta tacacatct 19
<210> 14
<211> 17
<212> DNA
<213> 人工序列
<400> 14
tgtgagccaa ggagttg 17
<210> 15
<211> 22
<212> DNA
<213> 人工序列
<400> 15
gagacgttct cgactcagca ga 22
<210> 16
<211> 49
<212> DNA
<213> 常规测序barcode:1320_499_969序列
<400> 16
atggaaactg aacaacctgc tcctgaatga ctactgggta cataacgaa 49
<210> 17
<211> 49
<212> DNA
<213> 甲基化测序barcode:1320_499_969序列
<400> 17
atggaaattg aataatttgt ttttgaatga ttattgggta tataatgaa 49
Claims (20)
1.一种DNA甲基化检测的方法,其特征在于:包括以下步骤,
长片段DNA处理步骤,包括将长片段DNA打断成小片段DNA;
常规文库构建步骤,包括采用stLFR技术进行文库构建,获得常规文库;
双链保护步骤,包括取用所述常规文库,磁珠回收,将DNA变性为单链,然后利用退火或延伸的方法将分子标签序列或测序接头序列转化为双链;
重亚硫酸盐转化步骤,包括向所述双链保护步骤的产物中加入双链保护剂,并加入重亚硫酸盐,进行脱氨基反应;
甲基化测序文库构建步骤,包括对脱氨基反应的产物进行常规PCR扩增或环化后滚环扩增,得到甲基化测序文库;
甲基化测序步骤,包括对甲基化测序文库进行测序,并根据测序结果分析获得基因的甲基化信息。
2.根据权利要求1所述的方法,其特征在于:还包括常规测序步骤,
所述常规测序步骤,包括取用所述常规文库构建步骤中采用stLFR技术构建的所述常规文库,将DNA变性为单链,然后再进行常规PCR扩增或环化后滚环扩增,获得测序文库,对测序文库进行全基因组测序,获得正常基因测序结果;
所述甲基化测序步骤还包括,将甲基化测序文库的测序结果与所述常规文库获得的正常基因测序结果比对,从而获得基因的甲基化信息。
3.根据权利要求1或2所述的方法,其特征在于:所述长片段DNA处理步骤还包括,采用带有分子标签序列的载体对DNA片段进行捕获,然后再将捕获的DNA用于所述常规文库构建步骤进行stLFR技术文库构建。
4.根据权利要求3所述的方法,其特征在于:所述载体为磁珠。
5.根据权利要求1或2所述的方法,其特征在于:所述长片段DNA处理步骤中,将长片段DNA打断成小片段DNA具体采用Tn5转座酶。
6.根据权利要求1或2所述的方法,其特征在于:所述双链保护步骤中,延伸的方法具体包括,利用分子标签序列或测序接头序列自身的3’端序列作为引物或加入外源短片段作为引物,在DNA聚合酶作用下延伸,将分子标签序列或测序接头序列变为双链结构。
7.根据权利要求1或2所述的方法,其特征在于:所述重亚硫酸盐转化步骤中,所述双链保护剂为盐离子、聚乙二醇、酶和有机溶剂中的至少一种,所述重亚硫酸盐为重亚硫酸氢钠。
8.一种DNA甲基化检测的试剂盒,其特征在于:包括第一组试剂、第二组试剂、第三组试剂、第四组试剂和第五组试剂;
所述第一组试剂包括用于将长片段DNA打断成小片段DNA的试剂;
所述第二组试剂包括用于stLFR技术建库的试剂,该试剂用于制备常规文库;
所述第三组试剂包括用于通过退火或延伸的方法将分子标签序列或测序接头序列转化为双链的试剂;
所述第四组试剂包括双链保护剂和重亚硫酸盐,用于进行双链保护和脱氨基反应;
所述第五组试剂包括用于对脱氨基反应的产物进行常规PCR扩增或环化后滚环扩增的试剂,该试剂用于制备甲基化测序文库。
9.根据权利要求8所述的试剂盒,其特征在于:还包括第六组试剂,所述第六组试剂包括用于对常规文库进行常规PCR扩增或环化后滚环扩增的试剂,该试剂用于制备常规测序文库,以便于进行全基因测序,获得正常基因测序结果。
10.根据权利要求8所述的试剂盒,其特征在于:所述第一组试剂还包括带有分子标签序列的载体,用于对DNA片段进行捕获。
11.根据权利要求10所述的试剂盒,其特征在于:所述载体为磁珠,第一组试剂中还包括磁珠纯化的试剂。
12.根据权利要求8所述的试剂盒,其特征在于:所述第一组试剂中,用于将长片段DNA打断成小片段DNA的试剂为Tn5转座酶及其缓冲液。
13.根据权利要求8所述的试剂盒,其特征在于:所述第三组试剂中,用于通过退火或延伸的方法将分子标签序列或测序接头序列转化为双链的试剂,具体包括外源短核苷酸片段、DNA聚合酶及其缓冲液,以及用于DNA延伸的dNTPs。
14.根据权利要求8-13任一项所述的试剂盒,其特征在于:所述第四组试剂中,双链保护剂为盐离子、聚乙二醇、酶和有机溶剂中的至少一种,重亚硫酸盐为重亚硫酸氢钠。
15.一种DNA甲基化检测的装置,其特征在于:包括长片段DNA处理模块、常规文库构建模块、常规测序模块、双链保护模块、重亚硫酸盐转化模块、甲基化测序文库构建模块和甲基化测序模块,
长片段DNA处理模块,包括用于将长片段DNA打断成小片段DNA;
常规文库构建模块,包括用于采用stLFR技术进行文库构建,获得常规文库;
常规测序模块,包括取用所述常规文库构建模块中采用stLFR技术构建的所述常规文库,将DNA变性为单链,然后再进行常规PCR扩增或环化后滚环扩增,获得测序文库,对测序文库进行全基因组测序,获得正常基因测序结果;
双链保护模块,包括用于取用所述常规文库构建模块中采用stLFR技术构建的所述常规文库,磁珠回收,将DNA变性为单链,然后利用退火或延伸的方法将分子标签序列或测序接头序列转化为双链;
重亚硫酸盐转化模块,包括用于向经过所述双链保护模块处理的产物中加入双链保护剂,并加入重亚硫酸盐,进行脱氨基反应;
甲基化测序文库构建模块,包括用于对脱氨基反应的产物进行常规PCR扩增或环化后滚环扩增,得到甲基化测序文库;
甲基化测序模块,包括用于对甲基化测序文库进行测序,将甲基化测序结果与正常基因测序结果比对,获得基因的甲基化信息。
16.根据权利要求15所述的装置,其特征在于:所述长片段DNA处理模块,还包括用于采用带有分子标签序列的载体对DNA片段进行捕获,然后再将捕获的DNA用于所述常规文库构建模块采用stLFR技术进行文库构建。
17.根据权利要求16所述的装置,其特征在于:所述载体为磁珠。
18.根据权利要求15所述的装置,其特征在于:所述长片段DNA处理模块中,将长片段DNA打断成小片段DNA具体采用Tn5转座酶。
19.根据权利要求15所述的装置,其特征在于:所述双链保护模块中,延伸的方法具体包括,利用分子标签序列或测序接头序列自身的3’端序列作为引物或加入外源短片段作为引物,在DNA聚合酶作用下延伸,将分子标签序列或测序接头序列变为双链结构。
20.根据权利要求15-19任一项所述的装置,其特征在于:所述重亚硫酸盐转化模块中,所述双链保护剂为盐离子、聚乙二醇、酶和有机溶剂中的至少一种,所述重亚硫酸盐为重亚硫酸氢钠。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811642291 | 2018-12-29 | ||
CN2018116422919 | 2018-12-29 | ||
PCT/CN2019/127537 WO2020135347A1 (zh) | 2018-12-29 | 2019-12-23 | 一种dna甲基化检测的方法、试剂盒、装置和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113166809A CN113166809A (zh) | 2021-07-23 |
CN113166809B true CN113166809B (zh) | 2023-12-26 |
Family
ID=71125728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980076223.7A Active CN113166809B (zh) | 2018-12-29 | 2019-12-23 | 一种dna甲基化检测的方法、试剂盒、装置和应用 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113166809B (zh) |
WO (1) | WO2020135347A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118234874A (zh) * | 2021-11-15 | 2024-06-21 | 深圳华大智造科技股份有限公司 | 一种基于标签序列和链置换的全基因组甲基建库测序方法 |
CN116343919B (zh) * | 2023-04-11 | 2023-12-08 | 天津大学四川创新研究院 | 一种全基因组图谱绘制测序方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102409042A (zh) * | 2010-09-21 | 2012-04-11 | 深圳华大基因科技有限公司 | 一种高通量基因组甲基化dna富集方法及其所使用标签和标签接头 |
CN102796808A (zh) * | 2011-05-23 | 2012-11-28 | 深圳华大基因科技有限公司 | 甲基化高通量检测方法 |
CN103088433A (zh) * | 2011-11-02 | 2013-05-08 | 深圳华大基因科技有限公司 | 全基因组甲基化高通量测序文库的构建方法及其应用 |
CN104372079A (zh) * | 2014-10-24 | 2015-02-25 | 中国科学院遗传与发育生物学研究所 | 一种甲基化dna的测序方法及其应用 |
CN104711250A (zh) * | 2015-01-26 | 2015-06-17 | 北京百迈客生物科技有限公司 | 一种长片段核酸文库的构建方法 |
CN104894233A (zh) * | 2015-04-22 | 2015-09-09 | 上海昂朴生物科技有限公司 | 一种多样本多片段dna甲基化高通量测序方法 |
CN105002567A (zh) * | 2015-06-30 | 2015-10-28 | 北京百迈客生物科技有限公司 | 无参考基因组高通量简化甲基化测序文库的构建方法 |
CN106755319A (zh) * | 2016-11-24 | 2017-05-31 | 广州市基准医疗有限责任公司 | 甲基化dna检测方法 |
CN107002153A (zh) * | 2015-02-04 | 2017-08-01 | 深圳华大基因研究院 | 一种构建长片段测序文库的方法 |
CN107267596A (zh) * | 2009-06-15 | 2017-10-20 | 考利达基因组股份有限公司 | 用于长片段阅读测序的方法和组合物 |
CN107904669A (zh) * | 2018-01-02 | 2018-04-13 | 华中农业大学 | 一种单细胞甲基化测序文库的构建方法及其应用 |
CN107937985A (zh) * | 2017-10-25 | 2018-04-20 | 人和未来生物科技(长沙)有限公司 | 一种微量碎片化dna甲基化检测文库的构建方法和检测方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8592150B2 (en) * | 2007-12-05 | 2013-11-26 | Complete Genomics, Inc. | Methods and compositions for long fragment read sequencing |
CN102409408B (zh) * | 2010-09-21 | 2013-08-07 | 深圳华大基因科技服务有限公司 | 一种利用微量基因组dna进行全基因组甲基化位点精确检测的方法 |
CN103233072B (zh) * | 2013-05-06 | 2014-07-02 | 中国海洋大学 | 一种高通量全基因组dna甲基化检测技术 |
CN105986030A (zh) * | 2016-02-03 | 2016-10-05 | 广州市基准医疗有限责任公司 | 甲基化dna检测方法 |
US20210130879A1 (en) * | 2017-03-24 | 2021-05-06 | The Johns Hopkins University | Strand-specific detection of bisulfite-converted duplexes |
-
2019
- 2019-12-23 CN CN201980076223.7A patent/CN113166809B/zh active Active
- 2019-12-23 WO PCT/CN2019/127537 patent/WO2020135347A1/zh active Application Filing
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107267596A (zh) * | 2009-06-15 | 2017-10-20 | 考利达基因组股份有限公司 | 用于长片段阅读测序的方法和组合物 |
CN102409042A (zh) * | 2010-09-21 | 2012-04-11 | 深圳华大基因科技有限公司 | 一种高通量基因组甲基化dna富集方法及其所使用标签和标签接头 |
CN102796808A (zh) * | 2011-05-23 | 2012-11-28 | 深圳华大基因科技有限公司 | 甲基化高通量检测方法 |
CN103088433A (zh) * | 2011-11-02 | 2013-05-08 | 深圳华大基因科技有限公司 | 全基因组甲基化高通量测序文库的构建方法及其应用 |
CN104372079A (zh) * | 2014-10-24 | 2015-02-25 | 中国科学院遗传与发育生物学研究所 | 一种甲基化dna的测序方法及其应用 |
CN104711250A (zh) * | 2015-01-26 | 2015-06-17 | 北京百迈客生物科技有限公司 | 一种长片段核酸文库的构建方法 |
CN107002153A (zh) * | 2015-02-04 | 2017-08-01 | 深圳华大基因研究院 | 一种构建长片段测序文库的方法 |
CN104894233A (zh) * | 2015-04-22 | 2015-09-09 | 上海昂朴生物科技有限公司 | 一种多样本多片段dna甲基化高通量测序方法 |
CN105002567A (zh) * | 2015-06-30 | 2015-10-28 | 北京百迈客生物科技有限公司 | 无参考基因组高通量简化甲基化测序文库的构建方法 |
CN106755319A (zh) * | 2016-11-24 | 2017-05-31 | 广州市基准医疗有限责任公司 | 甲基化dna检测方法 |
CN107937985A (zh) * | 2017-10-25 | 2018-04-20 | 人和未来生物科技(长沙)有限公司 | 一种微量碎片化dna甲基化检测文库的构建方法和检测方法 |
CN107904669A (zh) * | 2018-01-02 | 2018-04-13 | 华中农业大学 | 一种单细胞甲基化测序文库的构建方法及其应用 |
Non-Patent Citations (4)
Title |
---|
Brock A. Peters等.Co-barcoded sequence reads from long DNA fragments: a cost-effective solution for "perfect genome" sequencing.FRONTIERS IN GENETICS.2015,第5卷Atricle 466. * |
Haplotype phasing of whole human genomes using bead-based barcode partitioning in a single tube;Fang Zhang等;NATURE BIOTECHNOLOGY;第35卷(第9期);第852-857页 * |
Single tube bead-based DNA co-barcoding for cost effective and accurate sequencing, haplotyping, and assembly;Ou Wang等;bioRxiv;第1-17页 * |
基于微量DNA样本的简化甲基化文库构建方法研究;魏冬凯等;生物信息学;第15卷(第01期);第33-45页 * |
Also Published As
Publication number | Publication date |
---|---|
WO2020135347A1 (zh) | 2020-07-02 |
CN113166809A (zh) | 2021-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113166797B (zh) | 基于核酸酶的rna耗尽 | |
EP3192900B1 (en) | Method for constructing nucleic acid single-stranded cyclic library and reagents thereof | |
JP7256748B2 (ja) | エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法 | |
EP3377625B1 (en) | Method for controlled dna fragmentation | |
JP5977234B2 (ja) | 対象の3−dゲノム領域配列決定戦略 | |
EP3612641A1 (en) | Compositions and methods for library construction and sequence analysis | |
US10718015B2 (en) | Sequencing library, preparation method and use thereof | |
CN110079592B (zh) | 用于检测基因突变和已知、未知基因融合类型的高通量测序靶向捕获目标区域的探针和方法 | |
JP2021176302A (ja) | 腫瘍のディープシークエンシングプロファイリング | |
TW201321518A (zh) | 微量核酸樣本的庫製備方法及其應用 | |
CN109576346A (zh) | 高通量测序文库的构建方法及其应用 | |
AU2014361730A1 (en) | Methods and probes for identifying gene alleles | |
US20050100911A1 (en) | Methods for enriching populations of nucleic acid samples | |
CN113166809B (zh) | 一种dna甲基化检测的方法、试剂盒、装置和应用 | |
CN111378720A (zh) | 长链非编码rna的测序文库构建方法及其应用 | |
CN114729349A (zh) | 条码化核酸用于检测和测序的方法 | |
JP2022525373A (ja) | メチル化されたdnaの標的領域に基づいてシーケンシングライブラリーを構築する方法、システム及び応用 | |
Yang et al. | A genome-phenome association study in native microbiomes identifies a mechanism for cytosine modification in DNA and RNA | |
US11136576B2 (en) | Method for controlled DNA fragmentation | |
CN112080555A (zh) | Dna甲基化检测试剂盒及检测方法 | |
US20230340609A1 (en) | Cancer detection, monitoring, and reporting from sequencing cell-free dna | |
CN111718981A (zh) | Ace基因检测引物组、检测试剂盒及检测方法 | |
US20180298430A1 (en) | Genomic dna mutation assays and uses thereof | |
Xi et al. | Preparing single-cell DNA library using nextera for detection of CNV | |
WO2023217214A1 (zh) | 一种单细胞RNA m5C修饰的分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |