CN117467740A - 具有独特分子标签的多样本多位点dna甲基化检测方法和试剂盒 - Google Patents
具有独特分子标签的多样本多位点dna甲基化检测方法和试剂盒 Download PDFInfo
- Publication number
- CN117467740A CN117467740A CN202210898909.8A CN202210898909A CN117467740A CN 117467740 A CN117467740 A CN 117467740A CN 202210898909 A CN202210898909 A CN 202210898909A CN 117467740 A CN117467740 A CN 117467740A
- Authority
- CN
- China
- Prior art keywords
- sequence
- seq
- dna
- sequencing
- methylation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 31
- 230000007067 DNA methylation Effects 0.000 title claims abstract description 12
- 238000012163 sequencing technique Methods 0.000 claims abstract description 67
- 238000000034 method Methods 0.000 claims abstract description 66
- 238000007403 mPCR Methods 0.000 claims abstract description 53
- 238000006243 chemical reaction Methods 0.000 claims abstract description 46
- 230000011987 methylation Effects 0.000 claims abstract description 45
- 238000007069 methylation reaction Methods 0.000 claims abstract description 45
- 230000003321 amplification Effects 0.000 claims abstract description 35
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 35
- 239000012634 fragment Substances 0.000 claims abstract description 33
- 239000000047 product Substances 0.000 claims abstract description 27
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 9
- 239000012264 purified product Substances 0.000 claims abstract description 7
- 108020004414 DNA Proteins 0.000 claims description 74
- 239000011324 bead Substances 0.000 claims description 38
- 102000004190 Enzymes Human genes 0.000 claims description 27
- 108090000790 Enzymes Proteins 0.000 claims description 27
- 230000000295 complement effect Effects 0.000 claims description 20
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 18
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 18
- 238000000746 purification Methods 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 14
- 238000005516 engineering process Methods 0.000 claims description 14
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 12
- 230000002441 reversible effect Effects 0.000 claims description 12
- 238000011144 upstream manufacturing Methods 0.000 claims description 12
- 238000012408 PCR amplification Methods 0.000 claims description 11
- 230000004048 modification Effects 0.000 claims description 10
- 238000012986 modification Methods 0.000 claims description 10
- 125000006850 spacer group Chemical group 0.000 claims description 10
- 102000053602 DNA Human genes 0.000 claims description 9
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 claims description 7
- 239000000126 substance Substances 0.000 claims description 7
- 101710086015 RNA ligase Proteins 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 230000008439 repair process Effects 0.000 claims description 6
- 102000012410 DNA Ligases Human genes 0.000 claims description 5
- 108010061982 DNA Ligases Proteins 0.000 claims description 5
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 claims description 5
- 239000013060 biological fluid Substances 0.000 claims description 5
- 230000030609 dephosphorylation Effects 0.000 claims description 5
- 238000006209 dephosphorylation reaction Methods 0.000 claims description 5
- 238000006911 enzymatic reaction Methods 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 238000007671 third-generation sequencing Methods 0.000 claims description 5
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 4
- 230000009471 action Effects 0.000 claims description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical class N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 4
- 230000003252 repetitive effect Effects 0.000 claims description 4
- 210000001519 tissue Anatomy 0.000 claims description 4
- 108010006785 Taq Polymerase Proteins 0.000 claims description 3
- 238000002844 melting Methods 0.000 claims description 3
- 230000008018 melting Effects 0.000 claims description 3
- 108010017826 DNA Polymerase I Proteins 0.000 claims description 2
- 102000004594 DNA Polymerase I Human genes 0.000 claims description 2
- 102000003960 Ligases Human genes 0.000 claims description 2
- 108090000364 Ligases Proteins 0.000 claims description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 claims description 2
- 210000003567 ascitic fluid Anatomy 0.000 claims description 2
- 210000004369 blood Anatomy 0.000 claims description 2
- 239000008280 blood Substances 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 claims description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 2
- 239000012530 fluid Substances 0.000 claims description 2
- 238000007672 fourth generation sequencing Methods 0.000 claims description 2
- 238000010438 heat treatment Methods 0.000 claims description 2
- 210000000056 organ Anatomy 0.000 claims description 2
- 230000001575 pathological effect Effects 0.000 claims description 2
- 210000004910 pleural fluid Anatomy 0.000 claims description 2
- 210000003296 saliva Anatomy 0.000 claims description 2
- 210000004243 sweat Anatomy 0.000 claims description 2
- 210000002700 urine Anatomy 0.000 claims description 2
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 claims 2
- 238000007259 addition reaction Methods 0.000 claims 1
- 230000007547 defect Effects 0.000 claims 1
- 230000005257 nucleotidylation Effects 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 18
- 230000000694 effects Effects 0.000 abstract description 14
- 238000013461 design Methods 0.000 abstract description 12
- 238000004458 analytical method Methods 0.000 abstract description 6
- 239000000523 sample Substances 0.000 description 29
- 239000006228 supernatant Substances 0.000 description 28
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 20
- 239000007788 liquid Substances 0.000 description 19
- 239000000243 solution Substances 0.000 description 18
- 238000002156 mixing Methods 0.000 description 17
- 239000003153 chemical reaction reagent Substances 0.000 description 10
- 239000000872 buffer Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 238000005119 centrifugation Methods 0.000 description 6
- 239000000539 dimer Substances 0.000 description 5
- 239000011534 wash buffer Substances 0.000 description 5
- 108091029430 CpG site Proteins 0.000 description 4
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 239000013024 dilution buffer Substances 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000011068 loading method Methods 0.000 description 4
- 241000264288 mixed libraries Species 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000010355 oscillation Effects 0.000 description 3
- 210000002381 plasma Anatomy 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000001179 sorption measurement Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 101100533985 Dictyostelium discoideum spcs3 gene Proteins 0.000 description 2
- 101000630267 Homo sapiens Probable glutamate-tRNA ligase, mitochondrial Proteins 0.000 description 2
- 102100026125 Probable glutamate-tRNA ligase, mitochondrial Human genes 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000012148 binding buffer Substances 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- 239000012149 elution buffer Substances 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- 101100344898 Arabidopsis thaliana MED13 gene Proteins 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 230000007064 DNA hydrolysis Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 101001073409 Homo sapiens Retrotransposon-derived protein PEG10 Proteins 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 102100035844 Retrotransposon-derived protein PEG10 Human genes 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000003181 biological factor Substances 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005869 desulfonation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-M hydrosulfide Chemical compound [SH-] RWSOTUBLDIXVET-UHFFFAOYSA-M 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000012164 methylation sequencing Methods 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000006452 multicomponent reaction Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000002980 postoperative effect Effects 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- -1 salt ion Chemical class 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000011537 solubilization buffer Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006277 sulfonation reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种具有独特分子标签(UMI)设计的多样本多位点DNA甲基化检测方法和检测试剂盒,所述检测方法包括以下步骤:提取样本基因组DNA,对提取的DNA进行转化处理,然后在转化后的DNA片段的3端连接接头序列并进行模板扩增;对获得的模板扩增产物进行多重PCR以获取多位点序列,再进行产物纯化;对获得的纯化产物进行测序文库构建并完成待测位点甲基化水平检测。本发明所述检测方法和试剂盒可以同时对多样本多基因的DNA甲基化进行检测,通过UMI的去重处理得到待测甲基化位点的原始拷贝数信息,减小因mPCR过程中的扩增效率差异以及建库过程中引入的批次效应的影响,将使分析结果更加准确可信。
Description
技术领域
本发明涉及医学检测领域,具体是涉及一种具有独特分子标签(UMI)的多样本多位点DNA甲基化检测方法和试剂盒。
背景技术
DNA甲基化在不改变碱基序列的情况下,可以对基因表达水平进行有效调节。CpG二核苷酸是DNA甲基化主要发生的位置。人类基因组中有大约2800万个CpG位点,其中60-80%的CpG位点发生了甲基化。如此数量众多的甲基化位点在细胞生命活动的各个方面发挥着重要作用。在肿瘤的发生发展过程中,肿瘤细胞基因组DNA的甲基化程度也会发生变化,尤其对于某些基因位置的CpG位点。甲基化程度发生显著变化的CpG位点经鉴定,可作为肿瘤早诊早筛的重要依据。
通过从外周血血浆中提取游离DNA(cell-free DNA,cfDNA),从中检测肿瘤细胞死亡裂解产生或外泌体分泌的DNA片段(circulating tumor DNA,ctDNA)。这些ctDNA片段在血浆中的含量极低,通过对ctDNA片段中甲基化位点信息的放大和检测,可实现对早期肿瘤发生的预警,以及对术后肿瘤复发的动态监测。
甲基化测序常通过重亚硫酸盐(Bisulfite,BS)将DNA片段中的胞嘧啶(C)转化为尿嘧啶(U),而DNA片段中发生甲基化的C在此过程中将不被转化,从而将表观遗传修饰的信息转化为碱基序列信息,并通过高通量测序所获得的。但从技术层面,ctDNA甲基化多位点检测存在较大难度:探针捕获的方法成本较高,且应用于甲基化位点检测的灵敏性与特异性不够;PCR扩增放大信号的方法常造成信号背景噪音过高与有效信息的丢失。
采用多重PCR(multiplex PCR,mPCR)对待测甲基化位点进行特异性扩增,可从一定程度上解决信号获取问题。mPCR指在同一反应体系中,以多对不同的引物同时进行不同目标片段的特异性扩增。引物对的数量可高达上百对,同时进行上百重PCR扩增,可在模板量较少的情况下,一次获得所有待测目标的扩增,有利于节约成本。但BS转化将使转化的DNA片段在GC含量上出现较大变化,这使得引物设计难度增大并造成扩增均一性难以保证。半靶标多重PCR(Semi-target mPCR)为解决mPCR扩增效率问题提供了一种解决方案。Semi-target mPCR指一种特殊的mPCR方式,反应体系中上游引物与普通mPCR相同,为所有待测目标的上游引物集合;而下游引物使用通用引物,该通用引物结合的区域可通过连接反应的方式添加至待测文库的一端。Semi-target mPCR体系中,特异性引物的数量减少,引物二聚体(Primer dimer)产生的几率大大降低;下游使用通用引物,保证了扩增效率。
mPCR扩增与后续建库过程中由于实验操作误差和试剂盒不同批次之间的差异等非生物因素引入的批次效应(batch effect)也可能造成最终结果的误差,这对于以甲基化程度定量作为早诊早筛结果判读依据的准确性,是十分不利的。
发明内容
基于此,本发明的目的之一在于提供具有独特分子标签(UMI)设计的多样本多位点DNA甲基化检测方法,所述检测方法可以对多样本来源的多个甲基化位点同时进行检测,并通过UMI读段对测序噪音、多重PCR(mPCR)过程中的错配、目标扩增子扩增效率差异以及实验过程中的批次效应(batch effect)进行有效地校正。本发明对血浆中微量ctDNA检测的灵敏度高、特异性好,扩增效率高且检测成本低,适合于多个不同来源的ctDNA样本的多个甲基化位点同时准确定量分析。
实现上述目的的技术方案包括如下。
一种具有独特分子标签的多样本或多位点DNA甲基化检测方法,包括以下步骤:
S1.提取样本基因组的DNA或cfDNA,对提取的DNA或cfDNA使用化学方法或酶法进行重亚硫酸盐转化处理,得到转化后的DNA片段;
然后通过在转化后的DNA片段的3’末端连接接头序列进行预文库构建,所述接头序列包括至少一对由上链序列和下链序列构成的序列,所述每条上链序列从5’端至3’端包含:长度为9-15个碱基的能与下链序列完全互补配对的连接序列、6-10bp的随机序列作为独特分子标签、通用序列的反向互补序列(通用引物结合区);每条所述下链序列由5’端至3’端包括:长度为9-15个碱基的能与上链序列完全互补配对连接序列、6-12bp相同碱基的重复序列;
每条所述上链序列和下链序列的3’端分别有间隔子修饰;
S3.对步骤S2获得的预文库通过针对目的基因或目的甲基化位点上游的特异性引物和下游的通用序列进行多重PCR以获取多位点序列,再进行产物纯化;
S4.对步骤S3获得的纯化产物进行测序文库构建,并完成待测位点甲基化水平检测。
本发明所述具有独特分子标签的多样本多位点DNA甲基化的检测方法,具有以下优点:
1)独特分子标签(UMI)设计提供分析结果校正:本发明通过独特分子标签(UMI)为降低批次效应,减少系统误差并区别测序错误产生的背景噪音,提供了一种有效的解决策略。为原始DNA分子随机分配并连接一条接头序列,该序列内具有一段确定位置与碱基数目的随机碱基序列读段,即UMI;通过测序结果分析UMI序列,具有相同UMI序列的读长(Reads)可被回溯到同一个原始DNA分子;统计一致性序列对测序分析结果进行校正。由于在预文库建库中即为每一条DNA原始拷贝分配并连接了包含UMI序列的接头,在最终测序结果分析过程中通过对UMI序列的统一化,可回溯原始拷贝数并降低由于人为操作和试剂批次导致的批次效应和测序错误导致的假阳性结果。UMI的设计将显著提高多样本多位点甲基化检测的准确性和可信度。
2)Semi-target mPCR扩增效率提高:原有方法在检测ctDNA甲基化位点时,采用mPCR方法对感兴趣甲基化位点区域进行特异性扩增,但由于经BS转化后ctDNA序列的GC含量发生显著变化,这常会造成设计引物的困难以及扩增效率的低下。本发明采用半靶标多重PCR(Semi-target mPCR)的方式对甲基化位点区域进行扩增,与预建库中对应,采用对目的基因或目的位点的特异性引物作为上游引物,以通用序列作为下游引物,进行扩增。由于mPCR在同一体系中同时进行多达上百对引物的同时扩增,引物复杂度高,常常导致引物二聚体(Primer dimer)的形成,引物之间互相非特异性结合并发生扩增。Primer dimer混入测序文库后在测序检测中会占用大量测序空间。采用Semi-target mPCR的方式对甲基化位点区域进行扩增,一侧使用通用引物,这将使特异性引物的数量减少一半,从而有效减少Primer dimer的形成。可以显著提高扩增效率,微量甲基化信号得到明显放大。
附图说明
图1上链序列和下链序列结构示意图。
图2UMI接头与Semi-target mPCR设计原理图。
图3UMI接头连接过程原理图。
图4模板0%甲基化-UMI-6接头时的结果示意图。
图5模板0%甲基化-UMI-10接头时的结果示意图。
图6模板100%甲基化-UMI-6接头时的结果示意图。
图7模板100%甲基化-UMI-10接头时的结果示意图。
具体实施方式
本发明下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。实施例中所用到的各种常用化学试剂,均为市售产品。
除非另有定义,本发明所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不用于限制本发明。
本发明的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤。
在本发明中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本发明所述“化学方法”,是指通过重亚硫酸盐或亚硫酸氢盐等化学试剂的氧化和脱磺酸反应。
本发明所述“酶法”,是指TET等双加氧酶和Apobec等脱氨酶家族的联合作用。
本发明所述“转化处理”,是指通过前述的化学方法或酶法对DNA分子中的胞嘧啶产生的碱基种类的转化。
本发明所述“连接接头”,是指通过多种酶的联合作用在DNA片段的3’末端连接合成的DNA单链或双链接头。
本发明所述“模板扩增”,是指以接头序列为引物进行若干轮单向线性扩增以获取更多量的DNA模板用于后续检测。
本发明所述“多重PCR”,是指同一个PCR扩增体系中,在多个感兴趣位点及其附近同时进行PCR扩增,各个位点可位于引物上或扩增子内部。
本发明所述“多位点序列的获取”,是指同时对多个感兴趣位点的序列通过引物序列的互补配对以及互补链合成获取该位点的序列信息。
本发明所述“纯化”,是指从多组分反应溶液中将其中的核酸分子进行提取,并重新溶解在水或其他盐离子溶液中。
本发明所述“测序文库构建”,是指对所有待测DNA片段进行测序接头连接及扩增以获得可以用于上机测序的DNA片段混合物的过程;
本发明所述“DNA甲基化”,是指DNA序列中碱基分子以共价键结合的方式获得甲基基团化学修饰的过程。
本发明所述“检测”,是指通过常规核酸序列检测方法获取待测位点的DNA序列信息,从而分析得出待测位点的甲基化水平。
一些实施例中,本发明涉及一种具有独特分子标签的多样本多位点DNA甲基化的检测方法,包括以下步骤:
S1.提取样本基因组的DNA或cfDNA,对提取的DNA或cfDNA使用化学方法或酶法进行重亚硫酸盐转化处理,得到转化后的DNA片段;
S2.然后通过在转化后的DNA片段的3’末端连接接头序列进行预文库构建,所述接头序列包括至少一对由上链序列和下链序列构成的序列,所述每条上链序列从5’端至3’端包含:长度为9-15个碱基的与下链序列配对连接序列、6-10个碱基的随机序列作为独特分子标签、通用序列的反向互补序列(通用引物结合区);每条下链序列由5’端至3’端包括:长度为9-15个碱基的与上链序列配对连接序列、6-12bp相同碱基的重复序列;每条上链序列和下链序列的3’端有间隔子修饰;
S3.对步骤S2获得的预文库通过针对目的基因或目的甲基化位点上游的特异性引物和下游的通用序列进行多重PCR以获取多位点序列,再进行产物纯化;
S4.对步骤S3获得的纯化产物进行测序文库构建,并完成待测位点甲基化水平检测。
在其中一些实施例中,所述预文库构建包括:1)对转化后DNA单链片段的5’端进行去磷酸化修饰;2)升温解链,获取单链并通过末端转移酶在目标DNA片段3’端连接相同碱基的重复碱基序列;3)连接3’端所述接头序列;4)上链序列的5’端与DNA片段的3’端连续重复碱基末端之间的缺刻进行连接;5)使用所述通用序列作为引物进行单向线性扩增,引物结合位点位于所述上链序列片段中的通用引物结合区,该区域与通用引物序列反向互补;6)扩增产物经纯化后得到预文库。
在其中一些实施例中,所述预文库构建包括:1)对转化后的DNA单链片段的5'端进行去磷酸化修饰;2)加入接头序列,在单链DNA连接酶或RNA连接酶的作用下与目标DNA片段的3'端进行连接;3)使用所述通用序列作为引物进行单向线性扩增,引物结合位点位于所述上链序列片段中的通用引物结合区,该区域与通用引物序列反向互补;4)扩增产物经纯化后得到预文库。
在其中一些实施例中,所述间隔子为SpC3。
在其中一些实施例中,所述独特分子标签为7-9bp的随机序列,更优选为8bp的随机序列。
在其中一些实施例中,所述接头序列包括以下中的至少一对:
SEQ ID NO.1和SEQ ID NO.2,SEQ ID NO.3和SEQ ID NO.4,SEQ ID NO.5和SEQ IDNO.6,SEQ ID NO.7和SEQ ID NO.8,SEQ ID NO.9和SEQ ID NO.10,SEQ ID NO.11和SEQ IDNO.12,SEQ ID NO.13和SEQ ID NO.14,SEQ ID NO.15和SEQ ID NO.16,SEQ ID NO.17和SEQID NO.18,SEQ ID NO.19和SEQ ID NO.20。
在其中一些实施例中,所述通用序列为SEQ ID NO.21。
在其中一些实施例中,所述重复碱基序列为多个连续A或T或G或C碱基,所述重复碱基序列的碱基与所述下链序列中的重复序列配对。
在其中一些实施例中,重复序列为8-10个T,更优选为10个T。
在其中一些实施例中,步骤S1中所述“转化处理”,使用EZ-96DNA Methylation-DirectTM MagPrep(Zymo Research)试剂盒完成。
在其中一些实施例中,所述“EZ-96DNA Methylation-DirectTM MagPrep(ZymoResearch)试剂盒”的使用方法主要包括以下步骤:1)对提取出的待转化DNA分子进行定量;2)稀释至要求体积并加入CT Conversion Reagent,按标准程序进行转化;3)转化完成后加入MagBinding Beads与M-Binding Buffer进行磁珠吸附;4)使用M-Wash Buffer漂洗磁珠,并加入M-Desulphonation Buffer对DNA样品进行磺化反应;5)再次使用M-Wash Buffer漂洗两次,烘干后加入M-Elution Buffer进行洗脱。
在其中一些实施例中,优选地,EZ-96DNA Methylation-DirectTM MagPrep(ZymoResearch)试剂盒的标准的转化程序为98℃8min,64℃3.5h,4℃storage for up to 20h。
在其中一些实施例中,步骤S1中所述“样本”,为生物体液、细胞或组织。
在其中一些实施例中,所述“生物体液”,为人体在正常或病理状态下各个器官和组织分泌的液体。
在其中一些实施例中,所述“生物体液”,为血液、尿液、唾液、汗液、脑脊液、胸腔积水或腹腔积水。
在其中一些实施例中,步骤S3中所述“多重PCR”,指同一PCR反应体系中,同时进行多对引物分别对多个目标区域进行特异性扩增的PCR反应。
在其中一些实施例中,优选地,步骤S3中所述“多重PCR”,指半靶标多重PCR(Semi-target mPCR),即扩增所用每对引物中,上游引物针对待测甲基化位点设计,下游引物采用预文库接头上的通用序列。
在其中一些实施例中,优选地,步骤S3中所述“多重PCR”所用上游引物靶向待测甲基化位点,引物5’端可包含特别设计的通用序列。
在其中一些实施例中,步骤S3中所述“多重PCR”的反应条件为:95℃30sec-5min;10-25个循环(95℃15sec,60±5℃15sec-10min,72℃0-5min);72℃0-15min。
在其中一些实施例中,优选地,步骤S3中所述“多重PCR”的反应条件为:95℃5min;20个循环(95℃15sec,63℃4min);72℃5min。
在其中一些实施例中,步骤S3中所述“多重PCR”的反应酶为Phusion DNA聚合酶、Q5酶、Hieff酶、KAPA DNA聚合酶、Pfu酶或SuperFi酶。
在其中一些优选的实施例中,Phusion DNA聚合酶可为Phusion Hot StartⅡDNAPolymerase,Phusion U Hot Start DNA Polymerase;Q5酶例如Q为5Hot Start High-Fidelity DNA Polymerase,Q5U Hot Start High-Fidelity DNA Polymerase;Hieff酶例如为Hieff NGS HG热启动多重PCR酶、KAPA DNA聚合酶例如为KAPA Hifi Uracil+Kit,KAPA2G快速热启动DNA聚合酶。
在其中一些实施例中,优选地,步骤S3所述“多重PCR”的反应酶为KAPA DNA聚合酶。
在其中一些实施例中,更优选地,步骤S3所述“多重PCR”的反应酶为KAPA2G FastDNA Polymerase(KAPA2G快速热启动DNA聚合酶)。
在其中一些实施例中,步骤S3中所述“多位点序列的获取”,泛指包括对多个目标区域序列信息的获取,可以对多个目标区域的特异性单向或双向扩增并测序得到序列信息。
在其中一些实施例中,步骤S3中所述“纯化”,指磁珠分选纯化。
在其中一些实施例中,优选地,所述“磁珠分选纯化”,指Beckman AMPure XP磁珠或HieffSmarter DNA Clean Beads。
在其中一些实施例中,步骤S4中所述“甲基化水平”,指基因组中感兴趣CpG位点发生甲基化修饰的比例。
在其中一些实施例中,步骤S4中所述“甲基化水平检测”,指通过DNA测序检测待测样本的甲基化水平。
在其中一些实施例中,步骤S4中所述“测序文库构建”包含以下步骤:A)对步骤S3中所得纯化产物DNA进行3’端修复并在3’端添加1个腺嘌呤核苷酸(Adenine,A);B)将上一步获得的DNA产物与测序接头进行连接;C)使用接头引物对上一步所获得的DNA连接产物进行PCR扩增并获得测序文库;D)将不同样本来源的测序文库进行同摩尔数混合并进行测序。
在其中一些实施例中,步骤S4的A)中所述3’端修复与加A反应在同一个反应体系中完成,所用反应酶为Klenow Fragment(3’→5’exo-)、Taq DNA Polymerase(Taq DNA聚合酶)或Terminal Transferase(末端转移酶)。
在其中一些实施例中,优选地,步骤S4-A)中所述3’端修复与加A反应采用UltraTMⅡDNA Library Prep Kit for Illumina试剂盒中的末端修复试剂NEBNext UltraⅡEnd Prep Enzyme Mix及NEBNext UltraⅡEnd Prep Reaction Buffer完成。
在其中一些实施例中,步骤S4-B)中所述DNA产物与测序接头进行连接,所用反应酶为DNA连接酶,或RNA连接酶。
在其中一些实施例中,优选地,步骤S4-B)中所述DNA产物与测序接头进行的连接反应采用UltraTMⅡDNA Library Prep Kit for Illumina试剂盒中的NEBNextUltraⅡLigation Master Mix、NEBNext Ligation Enhancer及NEBNext Adaptor forIllumina完成。
在其中一些实施例中,步骤S4-C)中所述PCR扩增指index PCR扩增,即所用两端扩增引物具有已知的index序列,从而标记不同样本来源的测序文库。
在其中一些实施例中,步骤S4-D)中所述测序包括二代测序技术或三代测序技术。二代测序技术原理为大规模平行测序(massive parallel sequencing,MPS),三代测序技术为单分子测序技术。
在其中一些实施例中,二代测序技术包括:
1)基于DNA聚合酶合成测序技术(Sequencing by synthesis technology,SBS):代表公司为Illumina(可逆终止测序,Reversible terminator sequencing)、ThermoFisher/Life Technologies(Ion Torrent),GenapSys,罗氏诊断(454焦磷酸测序);
2)基于DNA连接酶或RNA连接酶连接测序技术(Sequencing by ligationtechnology,SBL):代表公司为华大基因/Complete Genomics(复合探针-锚定分子连接,cPAL)、Thermo Fisher/Applied Biosystems(Sequencing by Oligonucleotide Ligationand Detection,SOLiD)。
在其中一些实施例中,三代测序技术包括:
1)单分子实时荧光测序技术(SMRT,Pacific Biosciences);
2)纳米孔测序技术(Oxford Nanopore Technologies);
3)Genia Technologies和Stratos Genomics(罗氏诊断);
4)纳米门测序技术(Nanogate,Quantum Biosystems);
基于DNA水解测序技术(Sequencing by de-synthesis,pyrophosphorolysis,Base4)。
实施例1
本实施例一种具有独特分子标签(UMI)设计的多样本多位点DNA甲基化检测方法,包括以下步骤:
S1.提取样本基因组DNA或cfDNA,对提取的DNA使用重亚硫酸盐(Bisulfite,BS)进行转化处理;
S2.然后进行预文库构建;预文库构建的过程包括:1)对转化后DNA单链片段的5’端进行去磷酸化修饰;2)升温解链,保持单链状态,并通过末端转移酶TdT在单链DNA片段3’端连接重复碱基序列(添加dA尾);3)连接3’端接头(接头序列):该接头由上下两条单独的DNA单链发生退火结合形成;上链序列(如列表1中的UMI-1-10bx-top共10条不同设计),每条单链上链序列由5’端至3’端包含:长度为9-15个碱基的配对连接序列+8个碱基随机序列(UMI)+通用序列SBS491片段的反向互补序列+3’SpC3间隔子修饰;下链序列单链DNA序列包含(由5’端至3’端):长度为9-15个碱基的配对连接序列+9bp重复T序列+3’SpC3间隔子修饰;上下两条序列经过退火,通过配对连接序列部分互补结合,形成完整的接头结构;4)DNA连接酶对上接头5’端与DNA片段的3’端间的缺刻进行连接;5)使用通用序列SBS491作为引物进行单向线性扩增,引物结合位点位于上链序列的SBS491片段反向互补序列;6)经过4-10轮单向线(下游用序列)性扩增,扩增产物经纯化后得到预文库。
S3.对步骤S2获得的预文库产物进行DNA浓度测定,本实施例优选的投入量为20ng预文库产物进行多重PCR(mPCR);mPCR反应使用的酶为高保真酶,本实施例优选使用KAPA2G快速热启动DNA聚合酶;PCR反应扩增方式为多重PCR,针对不同目的基因或不同目的甲基化位点使用不同的特异性上游引物,下游引物使用通用引物;优选地,反应体系中上游引物终浓度为50nM,下游通用引物终浓度为800nM;优选反应条件:95℃5min;20个循环(95℃15sec,63℃4min);72℃5min。多重PCR反应完成后,对扩增产物进行纯化,可选方法为磁珠纯化、吸附柱纯化、凝胶电泳胶回收纯化;本实施例优选0.8×SmarterBeads纯化扩增产物。
S4.对步骤S3获得的纯化产物继续处理,构建测序文库。本实施例优选的测序文库构建方法为UltraTMⅡDNA Library Prep Kit for Illumina试剂盒,参照试剂盒推荐使用方法进行后续建库操作,最终获得测序文库。测序文库经浓度测定后,按相同的摩尔数进行混合,并利用Illumina MiSeq/MisSeqDx/NextSeq/NextSeqDx平台对混合文库进行测序。测序完成后,数据分析中将通过不同的index序列,对不同组样品进行区分。最终测序数据分析可得到各组样品的甲基化信息。
所述间隔子为一种修饰在DNA 3’端,且可阻止链延伸的方法,还可以是3’磷酸化修饰等,例如SpC3。
所述上链序列和下链序列结构请参见图1,UMI接头与Semi-target mPCR设计请参见图2。UMI接头连接过程请参见图3。
本实施例包含本发明中特别设计的各种接头及引物序列,如表1所示:
其中,NNNNNNNN是碱基随机序列(UMI)
实施例2
本实施例对本发明在提高扩增效率、减少引物二聚体形成和对测序数据提供UMI校准方面的优势,与普通mPCR甲基化检测方法进行对比。本实施例采用人基因组DNA标准品(NA12878),通过超声打断制备cfDNA mock标准品并进行重亚硫酸盐转化。按照实施例1中所述方法对cfDNA mock标准品进行预文库构建以及Semi-target mPCR扩增和后续的纯化和建库步骤,并最终获得各组测序文库。测序后通过UMI读段对Reads进行预处理,再分析各组数据结果间的偏差,评价UMI设计策略对优化扩增一致性及降低整体批次效应(batcheffect)所起到的作用。
本实施例中,针对不同目的基因或不同目的甲基化位点使用不同的特异性上游引物举例如下。
所述检测方法具体步骤如下:
S1.获得cfDNA mock标准品及转化
1.将人基因组DNA标准品(NA12878)用EB缓冲液稀释成10ng/μL,取50μL DNA样品加入配套超声打断管(规格为130μL),用以下程序进行打断:
2.打断后进行磁珠纯化及质检
1)将AMPure磁珠由冰箱取出,涡旋震荡或充分颠倒磁珠以保证充分混匀,室温平衡至少30min;
2)取40μL磁珠至1.5mL离心管,加入上一步产物(约50μL)涡旋震荡混匀;
3)室温孵育5min后瞬时离心,上磁力架吸附至液体澄清;
4)将上清液转移至新的已含有40μL磁珠的1.5mL离心管中,涡旋震荡混匀;
5)室温孵育5min后瞬时离心,上磁力架吸附至液体澄清,弃上清;
6)200μL 80%乙醇溶液漂洗30s,弃上清;
7)200μL 80%乙醇溶液漂洗30s,弃上清;
8)离心1min,上磁力架吸附至液体澄清,吸除余液;
9)开盖晾干至磁珠表面无反光;
10)加入55μL EB缓冲液,涡旋震荡混匀,室温孵育5min;
11)离心1min,上磁力架吸附至液体澄清,收集上清53μL。
3.重亚硫酸盐转化
1)配制CT Conversion Reagent:向CT Conversion Reagent中加入7.9mL M-Solubilization Buffer,3mL M-Dilution Buffer,室温下涡旋充分混匀15min;加入1.6mLM-Reaction Buffer,涡旋充分混匀4min;
2)取10ng DNA样本,稀释至20μL,加入130μL Direct CT Conversion Reagent,移液器混匀30次;
3)转移75μL混合液至新的200μL PCR管中,将两个PCR管一起进行PCR反应;PCR程序:98℃8min→64℃210min→4℃Hold(Hold<20
h),热盖105℃,体积75μL;
4)在1.5mL离心管中加入600μL M-Binding Buffer,将MagBinding Beads漩涡混匀30s,每管加入10μL Beads;
5)从PCR仪中取出反应后的PCR管并简单离心30s,将150μL反应后的样品加入上一步的1.5mL离心管中;
6)涡旋震荡30s后室温静置5min,瞬时离心后上磁力架吸附至溶液澄清,去上清;
7)加入400μL M-Wash Buffer,涡旋震荡30s,瞬时离心后上磁力架吸附至溶液澄清,去上清;
8)加入200μL M-Desulphonation Buffer,涡旋震荡30s,室温静置15min后瞬时离心,上磁力架吸附至溶液澄清,去上清;
9)加入400μL M-Wash Buffer,涡旋震荡30s,瞬时离心后上磁力架吸附至溶液澄清,去上清;
10)再次加入400μL M-Wash Buffer,涡旋震荡30s,瞬时离心后上磁力架吸附至溶液澄清,去上清;
11)瞬时离心,上磁力架,吸除残余液滴;
12)离心管管盖开启并置于金属浴中55℃晾干20min;
13)加入22μL M-Elution Buffer,涡旋震荡30s,金属浴55℃孵育4min;
14)瞬时离心,上磁力架吸附至溶液澄清后吸取18μL上清。
S2.接头连接及模板构建
1.准备工作
将试剂盒中MLE1、MLE5、MSE1、MSE5酶短暂离心后插入冰上,于专门的同批次的Enzyme Dilution Buffer盒子中分别取出相对应的MLE1 Enzyme Dilution Buffer、MLE5Enzyme Dilution Buffer、MSE1 Enzyme Dilution Buffer、MSE5 Enzyme Buffer,短暂离心并放置于冰上,将四种Dilution Buffer(吸完全部液体)分别加入对应的四种酶中,缓慢上下颠倒5次混匀辅以用手指肚轻弹并离心。
2.末端修复
反应条件:37℃30min→95℃10min(热盖105℃,体积20μL)
反应结束立即取出样品并直接插入冰中,放置2min以上再进行下一步操作。
3.连接1
反应条件:37℃30min→95℃5min→10℃Hold(热盖105℃,体积40μL)
试剂配制过程中严格按照顺序添加,缓慢上下颠倒混匀,不可剧烈震荡。
4.扩增1
Reagents | μL |
上一步产物 | 40 |
H2O | 17 |
MAB2 Buffer | 20 |
通用序列-SBS491(10μM) | 20 |
MAR2 Reagent | 2 |
MAE3 Enzyme | 1 |
反应条件:95℃3min→4×(95℃30sec→60℃30sec→68℃1min)→68℃5min→10℃Hold(热盖105℃,体积100μL)
5.纯化回收
1)AMPure XP磁珠室温平衡30min,取适量磁珠加入5倍体积的SB Buffer配置成1:6AMPure XP磁珠稀释液;
2)混匀后取166μL 1:6AMPure XP磁珠与样品涡旋震荡混匀,室温孵育5min,瞬时离心后上磁力架吸附至溶液澄清,去上清;
3)500μL 80%乙醇漂洗30sec,弃上清;
4)500μL 80%乙醇漂洗30sec,弃上清;
5)离心1min,上磁力架吸附至液体澄清,吸余液并开盖晾干至磁珠表面无反光;
6)加21μL EB缓冲液洗脱,涡旋震荡混匀,室温孵育5min;
7)瞬时离心,上磁力架吸附至液体澄清,收集上清20μL。
S3.Semi-target mPCR扩增及纯化
1.Semi-target mPCR反应体系如下:
反应条件:95℃5min→20×(95℃15sec,63℃4min)→72℃5min→4℃Hold
2.0.8×SmarterBeads纯化扩增产物,纯化步骤如下:
1)将磁珠由冰箱中取出,涡旋振荡或充分颠倒磁珠以保证充分混匀,室温平衡至少30min;配制80%乙醇10mL待用;
2)取50μL DEPC水加入上一步mPCR产物,得到DNA溶液100μL;
3)按比例(0.8×)吸取80μL Smarter Beads至DNA溶液中,涡旋震荡,室温孵育5min;
4)将PCR管短暂离心并置于磁力架中分离磁珠和液体,待溶液澄清后(约5min),小心移除上清;
5)保持PCR管始终置于磁力架中,加入200μL新鲜配制的80%乙醇漂洗磁珠,室温孵育30sec后,小心移除上清;
6)重复步骤5,总计漂洗2次;
7)保持PCR管始终置于磁力架中,开盖空气干燥磁珠至刚刚出现龟裂(约5min);
8)将PCR管从磁力架中取出,加入55μL DEPC水,涡旋振荡或使用移液器轻轻吹打至充分混匀,室温静置5min;
9)将PCR管短暂离心并置于磁力架中静置,待溶液澄清后(约5min),小心移取53μL上清至新PCR管中,勿触碰磁珠。
S4.测序文库构建
1.末端修复
反应条件:20℃30min→65℃30min→4℃hold(热盖85℃,体积60μL)
2.接头连接
反应条件:20℃15min→4℃hold(关闭热盖,体积100μL)
反应条件:37℃15min→4℃hold(热盖47℃,体积100μL)
3.AMPure XP磁珠双筛纯化
1)原倍AMPure XP磁珠涡旋,室温平衡30min;
2)混匀后取50μL(0.5×)AMPure XP磁珠至1.5mL离心管,加入上一步产物(约100μL)Votex混匀;
3)室温孵育5min后离心30sec,上磁力架吸附5min至液体澄清;
4)将上清液转移至新的已含有25μL AMPure XP磁珠的EP管;
5)Votex混匀并室温孵育5min;
6)离心30sec,上磁力架吸附5min至液体澄清,弃上清;
7)200μL80%乙醇漂洗30sec并弃上清;
8)200μL80%乙醇漂洗30sec并弃上清;
9)离心1min,上架至液体澄清,吸除余液;
10)开盖晾干至磁珠表面无反光;
11)加17μL EB洗脱,混匀,室温孵育5min;
12)离心1-2min,上架吸附3-5min至液体澄清,收集上清16μL。
4.Index PCR扩增
反应条件:98℃30s→7×(98℃10s→65℃75s)→65℃5min→4℃hold(热盖105℃,体积50μL)
5.AMPure XP磁珠纯化
1)AMPure XP磁珠室温平衡30min;
2)混匀后取45μL(0.9×)AMPure XP磁珠至1.5mL的离心管中,再将产物(约50μL)加入Votex混匀;
3)室温孵育5min并离心30sec,上磁力架吸附5min至液体澄清,吸弃上清;
4)200μL 80%乙醇漂洗30sec,弃上清;
5)200μL 80%乙醇漂洗30sec,弃上清;
6)离心1min,上架至液体澄清,吸余液并开盖晾干至磁珠表面无反光;
7)加33μL 0.1×TE洗脱,混匀,室温孵育5min;
8)离心1-2min,上架吸附3-5min至液体澄清,收集上清(约31μL);
9)得到的终文库检测浓度并使用Agilent 2100Bioanalyzer对文库进行检测。
S5.测序及数据分析
1.将各样品终文库等摩尔量混合成混合文库,并进行二代高通量测序,包括以下步骤:
1)根据各样品终文库的浓度(ng/μL)以及2100检测结果中显示的目的扩增片段的平均长度(bp),计算各个样品终文库需要加入混合文库的体积,以及混合文库的理论摩尔浓度。
2)混合文库后,使用NovaSeq平台进行双端测序:产出的测序结果以fastq格式进行存储,通过测序文库标签(index)、样本标签序列(barcode)将测序序列对应到每个样本,并计算每个样本的待测位点甲基化状态。
2.检测结果如下:
本发明检测方法可有效提高数据结果稳定性,降低批次效应的影响:以表1所示序列UMI-6及UMI-10两种UMI(UMI-6(SEQ ID NO.11/SEQ ID NO.12)及UMI-10(SEQ ID NO.19/SEQ ID NO.20))接头设计为例,测序得到的总Reads数(reads_total)及其中含有UMI接头的Reads数(reads_umi)如表1所示,表明本发明所述方法的特异性较好,非特异性扩增虽然存在,但是整体的结果可信度高。对于模板0%及100%甲基化程度的各三个重复组,经过UMI去重处理后,有超过63%至80%(0%甲基化模板-UMI-6/UMI-10:80%/83%;100%甲基化模板-UMI-6/UMI-10:65%/63%)的甲基化marker经标准化后的Readcount在三个重复组间的标准变异系数(Coefficient of Variance,CV)显著降低(见图4-7);这表明数据稳定性增加,批次效应减弱。实验说明,通过UMI的去重处理得到待测甲基化位点的原始拷贝数信息,减小因mPCR过程中的扩增效率差异以及建库过程中引入的批次效应的影响,将使分析结果更加准确可信。
参见表2.1。
表2.1Reads数统计
以上实验说明,本申请所述检测方法,将单链建库与半锚定PCR的过程结合,半特异性地对目标区域进行扩增;在此过程中,通过接头内部含有的UMI序列,对每一条原始分子的接头连接产物赋予一段唯一的UMI序列,以此对最终的测序结果进行去重处理。所述方法简化了扩增子测序的流程,通过UMI的去重作用提高了数据的稳定性,并减少了由于半锚定PCR扩增带来的误差及批次效应。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (29)
1.一种具有独特分子标签的多样本或多位点DNA甲基化的检测方法,其特征在于,包括以下步骤:
S1.提取样本基因组的DNA或cfDNA,对提取的DNA或cfDNA使用化学方法或酶法进行重亚硫酸盐转化处理,得到转化后的DNA片段;
S2.然后通过在转化后的DNA片段的3’末端连接接头序列进行预文库构建,
所述接头序列包括至少一对由上链序列和下链序列构成的序列,所述每条上链序列从5’端至3’端包含:长度为9-15个碱基的能与下链序列完全互补配对的连接序列、6-10bp的随机序列作为独特分子标签、通用序列的反向互补序列;所述每条下链序列从5’端至3’端包括:长度为9-15个碱基的能与上链序列完全互补配对连接序列、6-12bp相同碱基的重复序列;
所述每条上链序列和下链序列的3’端分别有间隔子修饰;
S3.对步骤S2获得的预文库通过针对目的基因或目的甲基化位点的特异性上游引物和下游的通用序列进行多重PCR以获取多位点序列,再进行产物纯化;
S4.对步骤S3获得的纯化产物进行测序文库构建,并完成待测位点甲基化水平检测。
2.根据权利要求1所述的检测方法,其特征在于,所述预文库构建包括:1)对转化后DNA单链片段的5’端进行去磷酸化修饰;2)升温解链,获取单链并通过末端转移酶在目标DNA片段3’端连接相同碱基的重复碱基序列;3)连接3’端所述接头序列;4)DNA连接酶或RNA连接酶对所述上链序列的5’端与目标DNA片段的3’端连续重复碱基末端之间的缺刻进行连接;5)使用所述通用序列作为引物进行单向线性扩增,引物结合位点位于所述上链序列片段中的通用引物结合区,该区域与通用引物序列反向互补;6)扩增产物经纯化后得到预文库;或
1)对转化后的DNA单链片段的5'端进行去磷酸化修饰;2)加入接头序列,在单链DNA连接酶或RNA连接酶的作用下与目标DNA片段的3'端进行连接;3)使用所述通用序列作为引物进行单向线性扩增,引物结合位点位于所述上链序列片段中的通用引物结合区,该区域与通用引物序列反向互补;4)扩增产物经纯化后得到预文库。
3.根据权利要求1至2任一所述的检测方法,其特征在于,所述独特分子标签为7-9bp的随机序列,优选为8bp的随机序列。
4.根据权利要求1至3任一所述的检测方法,其特征在于,所述间隔子为SpC3。
5.根据权利要求2所述的检测方法,其特征在于,所述重复序列为多个连续A或T或G或C碱基,所述重复碱基序列与所述下链序列中的重复序列配对。
6.根据权利要求5所述的检测方法,其特征在于,所述重复序列为8-10个T,更优选为10个T。
7.根据权利要求1至6任一所述的检测方法,其特征在于,步骤S3中所述多重PCR为半靶标多重PCR。
8.根据权利要求1至7任一所述的检测方法,其特征在于,步骤S3中所述多重PCR的反应条件为:95℃30sec-5min;10-25个循环:95℃15sec,60±5℃15sec-10min,72℃0-5min;72℃0-15min。
9.根据权利要求8所述的检测方法,其特征在于,步骤S3中所述多重PCR的反应条件为:95℃5min;20个循环:95℃15sec,63℃4min;72℃5min。
10.根据权利要求1所述的检测方法,其特征在于,步骤S3中所述多重PCR的反应酶为Phusion DNA聚合酶、Q5酶、Hieff酶、KAPA DNA聚合酶、Pfu酶或SuperFi酶;更优选为KAPADNA聚合酶。
11.根据权利要求1至10任一所述的检测方法,其特征在于,步骤S3中所述纯化为磁珠分选纯化。
12.根据权利要求1至11任一所述的检测方法,其特征在于,步骤S1中所述样本为生物体液、细胞或组织。
13.根据权利要求12所述的检测方法,其特征在于,所述生物体液为人体在正常或病理状态下各个器官和组织分泌的液体。
14.根据权利要求13所述的检测方法,其特征在于,所述生物体为血液、尿液、唾液、汗液、脑脊液、胸腔积水或腹腔积水。
15.根据权利要求1所述的检测方法,其特征在于,步骤S4中所述测序文库构建包含以下步骤:A)对步骤S3中所得纯化产物DNA进行3’端修复并在3’端添加1个腺嘌呤核苷酸;B)将上一步获得的DNA产物与所述测序接头进行连接;C)使用接头引物对上一步所获得的DNA连接产物进行PCR扩增并获得测序文库;D)将不同样本来源的测序文库进行同摩尔数混合并进行测序。
16.根据权利要求15所述的检测方法,其特征在于,步骤S4中的A)中所述3’端修复与添加1个腺嘌呤核苷酸反应在同一个反应体系中完成,所用反应酶为Klenow Fragment(3’→5’exo-)、Taq DNA聚合酶或末端转移酶。
17.根据权利要求15至16任一所述的检测方法,其特征在于,步骤S4的C)中所述PCR扩增为Index PCR扩增。
18.根据权利要求15至17任一所述的检测方法,其特征在于,步骤S4的D)中所述测序包括使用二代测序技术或使用三代测序技术。
19.根据权利要求18所述的检测方法,其特征在于,所述二代测序技术包括基于DNA聚合酶合成测序技术或基于DNA连接酶或RNA连接酶连接测序技术。
20.根据权利要求18所述的检测方法,其特征在于,所述三代测序技术包括单分子实时荧光测序技术、纳米孔测序技术、Genia Technologies、Stratos Genomics、或纳米门测序技术。
21.根据权利要求1-20任一项所述的检测方法,其特征在于,所述接头序列包括以下中的至少一对:SEQ ID NO.1和SEQ ID NO.2,SEQ ID NO.3和SEQ ID NO.4,SEQ ID NO.5和SEQID NO.6,SEQ ID NO.7和SEQ ID NO.8,SEQ ID NO.9和SEQ ID NO.10,SEQ ID NO.11和SEQID NO.12,SEQ ID NO.13和SEQ ID NO.14,SEQ ID NO.15和SEQ ID NO.16,SEQ ID NO.17和SEQ ID NO.18,SEQ ID NO.19和SEQ ID NO.20。
22.根据权利要求1-21任一项所述的检测方法,其特征在于,所述通用序列为SEQ IDNO.21。
23.一种具有独特分子标签的多样本多位点DNA甲基化的检测试剂盒,其特征在于,包括接头序列,所述接头序列包括至少一对由上链序列和下链序列构成的序列,所述每条上链序列从5’端至3’端包含:长度为9-15个碱基的能与下链序列完全互补配对的连接序列、6-10bp的随机序列作为独特分子标签、通用序列的反向互补序列;每条下链序列从5’端至3’端包括:长度为9-15个碱基的与上链序列配对连接序列、6-12bp相同碱基的重复序列;每条上链序列和下链序列的3’端有间隔子修饰。
24.根据权利要求23所述的检测试剂盒,其特征在于,所述独特分子标签为7-9bp的随机序列,优选为8bp的随机序列。
25.根据权利要求23至24任一所述的检测试剂盒,其特征在于,所述重复序列为多个连续A或T或G或C碱基,优选为8-10个T,更优选为10个T。
26.根据权利要求23至25任一所述的检测试剂盒,其特征在于,所述间隔子为SpC3。
27.根据权利要求23-26任一项所述的检测试剂盒,其特征在于,所述接头序列包括以下至少一对:SEQ ID NO.1和SEQ ID NO.2,SEQ ID NO.3和SEQ ID NO.4,SEQ ID NO.5和SEQID NO.6,SEQ ID NO.7和SEQ ID NO.8,SEQ ID NO.9和SEQ ID NO.10,SEQ ID NO.11和SEQID NO.12,SEQ ID NO.13和SEQ ID NO.14,SEQ ID NO.15和SEQ ID NO.16,SEQ ID NO.17和SEQ ID NO.18,SEQ ID NO.19和SEQ ID NO.20。
28.根据权利要求23-27任一项所述的检测试剂盒,其特征在于,所述通用序列为SEQID NO.21。
29.根据权利要求23-28任一项所述的检测试剂盒,其特征在于,还包括特异性上游引物,所述特异性上游引物选自SEQ ID NO.22-SEQ ID NO.91中的中至少一种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210898909.8A CN117467740A (zh) | 2022-07-28 | 2022-07-28 | 具有独特分子标签的多样本多位点dna甲基化检测方法和试剂盒 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210898909.8A CN117467740A (zh) | 2022-07-28 | 2022-07-28 | 具有独特分子标签的多样本多位点dna甲基化检测方法和试剂盒 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117467740A true CN117467740A (zh) | 2024-01-30 |
Family
ID=89633624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210898909.8A Pending CN117467740A (zh) | 2022-07-28 | 2022-07-28 | 具有独特分子标签的多样本多位点dna甲基化检测方法和试剂盒 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117467740A (zh) |
-
2022
- 2022-07-28 CN CN202210898909.8A patent/CN117467740A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Khodakov et al. | Diagnostics based on nucleic acid sequence variant profiling: PCR, hybridization, and NGS approaches | |
CN108300716B (zh) | 接头元件、其应用和基于不对称多重pcr进行靶向测序文库构建的方法 | |
CN106906211B (zh) | 一种分子接头及其应用 | |
JP2022036975A (ja) | ナノポア技術を用いた短いdna断片の迅速な配列決定 | |
EP3612641A1 (en) | Compositions and methods for library construction and sequence analysis | |
CN109576347B (zh) | 含单分子标签的测序接头和测序文库的构建方法 | |
CN108998508B (zh) | 扩增子测序文库的构建方法及引物组和试剂盒 | |
CN110117574B (zh) | 一种基于多重pcr富集循环肿瘤dna的方法和试剂盒 | |
US20220056519A1 (en) | Method and system for constructing sequencing library on the basis of methylated dna target region, and use thereof | |
CN115717163B (zh) | 一种用于监控及纠正测序污染的分子编码检测体系及其应用 | |
CN113493932B (zh) | 一种构建高检测性能捕获文库的方法和试剂盒 | |
CN115011672A (zh) | 一种超低频基因突变检测方法 | |
EP3565906B1 (en) | Quantifying dna sequences | |
CN114277114B (zh) | 一种扩增子测序添加唯一性标识符的方法及应用 | |
CN117467740A (zh) | 具有独特分子标签的多样本多位点dna甲基化检测方法和试剂盒 | |
CN105603052B (zh) | 探针及其用途 | |
KR102383799B1 (ko) | 서열-기반의 유전 검사용 대조군을 제조하기 위한 조성물 및 방법 | |
CN107904297B (zh) | 用于微生物多样性研究的引物组、接头组和测序方法 | |
EP3988665A1 (en) | Method and use for construction of sequencing library based on dna samples | |
JP2022546485A (ja) | 腫瘍高精度アッセイのための組成物および方法 | |
WO2004050906A1 (fr) | Procede de detection de la methylation de l'adn | |
CN111718981A (zh) | Ace基因检测引物组、检测试剂盒及检测方法 | |
CN113930487B (zh) | 一种新型多样本多片段dna甲基化检测方法 | |
WO2023201487A1 (zh) | 接头、接头连接试剂及试剂盒和文库构建方法 | |
JP2010029068A (ja) | 内部標準dnaの製造方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |