CN110938674B - 甲基化测序dna文库的构建方法及其应用 - Google Patents
甲基化测序dna文库的构建方法及其应用 Download PDFInfo
- Publication number
- CN110938674B CN110938674B CN201911233926.4A CN201911233926A CN110938674B CN 110938674 B CN110938674 B CN 110938674B CN 201911233926 A CN201911233926 A CN 201911233926A CN 110938674 B CN110938674 B CN 110938674B
- Authority
- CN
- China
- Prior art keywords
- dna
- methylation
- sequencing
- adaptor
- constructing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012164 methylation sequencing Methods 0.000 title claims abstract description 16
- 238000010276 construction Methods 0.000 title abstract description 8
- 108020004414 DNA Proteins 0.000 claims abstract description 108
- 102000053602 DNA Human genes 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 34
- 108020004682 Single-Stranded DNA Proteins 0.000 claims abstract description 26
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims abstract description 19
- 102000004190 Enzymes Human genes 0.000 claims abstract description 16
- 108090000790 Enzymes Proteins 0.000 claims abstract description 16
- 238000012163 sequencing technique Methods 0.000 claims abstract description 16
- 102000003960 Ligases Human genes 0.000 claims abstract description 9
- 108090000364 Ligases Proteins 0.000 claims abstract description 9
- 230000000295 complement effect Effects 0.000 claims abstract description 5
- 230000011987 methylation Effects 0.000 claims description 27
- 238000007069 methylation reaction Methods 0.000 claims description 27
- 230000004048 modification Effects 0.000 claims description 12
- 238000012986 modification Methods 0.000 claims description 12
- 108091029865 Exogenous DNA Proteins 0.000 claims description 6
- 238000013467 fragmentation Methods 0.000 claims description 5
- 238000006062 fragmentation reaction Methods 0.000 claims description 5
- 241000124008 Mammalia Species 0.000 claims description 4
- 210000004369 blood Anatomy 0.000 claims description 4
- 239000008280 blood Substances 0.000 claims description 4
- 239000013592 cell lysate Substances 0.000 claims description 3
- 210000004381 amniotic fluid Anatomy 0.000 claims description 2
- 210000000988 bone and bone Anatomy 0.000 claims description 2
- 238000004113 cell culture Methods 0.000 claims description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 2
- 239000012228 culture supernatant Substances 0.000 claims description 2
- 210000003296 saliva Anatomy 0.000 claims description 2
- 210000000582 semen Anatomy 0.000 claims description 2
- -1 tag sequence Proteins 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 16
- 230000007067 DNA methylation Effects 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 8
- 102000039446 nucleic acids Human genes 0.000 description 7
- 108020004707 nucleic acids Proteins 0.000 description 7
- 150000007523 nucleic acids Chemical class 0.000 description 7
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- 208000035657 Abasia Diseases 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 5
- 101100452003 Caenorhabditis elegans ape-1 gene Proteins 0.000 description 4
- YLQBMQCUIZJEEH-UHFFFAOYSA-N Furan Chemical compound C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 4
- 238000012175 pyrosequencing Methods 0.000 description 4
- 208000005623 Carcinogenesis Diseases 0.000 description 3
- 108091029430 CpG site Proteins 0.000 description 3
- 238000007400 DNA extraction Methods 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 239000012472 biological sample Substances 0.000 description 3
- 230000036952 cancer formation Effects 0.000 description 3
- 231100000504 carcinogenesis Toxicity 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000008367 deionised water Substances 0.000 description 3
- 229910021641 deionized water Inorganic materials 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000000741 silica gel Substances 0.000 description 3
- 229910002027 silica gel Inorganic materials 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000001179 sorption measurement Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 208000032818 Microsatellite Instability Diseases 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000001223 reverse osmosis Methods 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- KWIUHFFTVRNATP-UHFFFAOYSA-N Betaine Natural products C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 102100036263 Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Human genes 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101001001786 Homo sapiens Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Proteins 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- KWIUHFFTVRNATP-UHFFFAOYSA-O N,N,N-trimethylglycinium Chemical compound C[N+](C)(C)CC(O)=O KWIUHFFTVRNATP-UHFFFAOYSA-O 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007068 beta-elimination reaction Methods 0.000 description 1
- 229960003237 betaine Drugs 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- YTRQFSDWAXHJCC-UHFFFAOYSA-N chloroform;phenol Chemical class ClC(Cl)Cl.OC1=CC=CC=C1 YTRQFSDWAXHJCC-UHFFFAOYSA-N 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 239000012154 double-distilled water Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000011365 genetic imprinting Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000006607 hypermethylation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000007886 magnetic bead extraction Methods 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 101150061338 mmr gene Proteins 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002205 phenol-chloroform extraction Methods 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 229940005657 pyrophosphoric acid Drugs 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000002407 reforming Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种甲基化测序DNA文库的构建方法,包括:a)使用一端带接头的随机引物和/或半随机引物扩增重亚硫酸盐处理后的单链DNA,得到同时具有所述接头和所述单链DNA互补链的中间体DNA;其中所述接头具有由衔接物连接在一起的两段测序接头序列,且所述衔接物具有AP位点;b)用单链DNA环化连接酶将所述中间体DNA的两端连接得到环化DNA;以及c)使用APE酶切割所述环化DNA中的AP位点以去环化。该方法构建的文库多样性好,且基本不影响后续的测序过程。
Description
技术领域
本发明涉及分子生物学领域,具体而言,涉及一种甲基化测序DNA文库的构建方法及其应用。
背景技术
DNA甲基化是表观遗传学(Epigenetics)的重要组成部分,在维持正常细胞功能、遗传印记、胚胎发育以及人类肿瘤发生中起着重要作用,是目前新的研究热点之一。甲基化的主要形式有5-甲基胞嘧啶,N6-甲基腺嘌呤和7-甲基鸟嘌呤。原核生物中CCA/TGG和GATC常被甲基化,而真核生物中甲基化仅发生于胞嘧啶。DNA的甲基化是在DNA甲基化转移酶(DNMTs)的作用下使CpG二核苷酸5'端的胞嘧啶转变为5'甲基胞嘧啶(5’mC)。这种DNA修饰方式并没有改变基因序列,但是它调控了基因的表达。脊椎动物基因的甲基化状态有三种:持续的低甲基化状态,如管家基因;去甲基化状态,如发育阶段中的一些基因;高度甲基化状态,如女性的一条失活的X染色体。
最近研究表明,DNA甲基化水平和模式的改变是肿瘤发生的一个重要因素,包括抑癌基因或MMR基因的高甲基化和基因组DNA低甲基化状态。从而导致基因印记丢失,细胞过度增长,不合适的细胞特异性表达,基因组脆性增加,以及内寄生序列(endoparasiticsequence)的激活,最终也导致肿瘤发生。例如,hMLH1是重要的错配修复基因,MLH1启动子甲基化导致的表达缺失可能致使微卫星不稳定(MSI),与散发性结直肠癌的发生、发展相关。所以甲基化可以作为肿瘤等早期诊断的生物标记物和预后评估指标,对肿瘤的筛查和风险评估、早期诊断、预后判断及治疗监测都具有重要的意义。
目前DNA甲基化检测技术包括焦磷酸测序法(Pyrosequencing)、定量甲基化位点特异性PCR法(Methylight、MS-HRM)等。二者均采用甲基化微点特异的引物扩增目的CpG,然后经过焦磷酸测序或荧光定量PCR方法检测目的位点。二者只能完成单一位点检测,效率低,通量低。DNA甲基化的功能单位不是单个CpG,而是整个基因启动子区域或染色体,乃至基因组水平的甲基化模式发生变化。因此焦磷酸测序法(Pyrosequencing)、定量甲基化位点特异性PCR法等低通量的甲基化检测技术已无法满足当前表观遗传学研究的要求。
发明内容
无论是焦磷酸测序法(Pyrosequencing)还是定量甲基化位点特异性PCR法(Methylight、MS-HRM)等均存在效率低,通量低等缺点。本发明提供一种新颖的甲基化DNA文库的构建方法,可以通过配合高通量测序全面地高效地检测基因组范围内的甲基化模式。
具体的,本发明涉及一种甲基化测序DNA文库的构建方法,包括:
a)使用一端带接头的随机引物和/或半随机引物扩增重亚硫酸盐处理后的单链DNA,得到同时具有所述接头和所述单链DNA互补链的中间体DNA;
其中所述接头具有由衔接物连接在一起的两段测序接头序列,且所述衔接物具有AP位点;
b)用单链DNA环化连接酶将所述中间体DNA的两端连接得到环化DNA;以及
c)使用APE酶切割所述环化DNA中的AP位点以去环化。
与现有技术相比,本发明的有益效果为:
本发明利用PCR扩增合成方法使单链DNA接上5’接头,并利用ssDNA环化连接酶使单链DNA的3’端接上接头,APE酶水解AP位点,即形成带双端接头的DNA文库。该方法构建的文库多样性好,且基本不影响后续的测序过程。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例中亚硫酸氢盐处理后经EB染色的ssDNA的凝胶电泳图;
图2为本发明一个实施例中DNA甲基化文库质控分析结果;
图3为本发明一个实施例中DNA测序后的甲基化比对结果;
图4为非经典的DNA甲基化模式的非对称性甲基化修饰示意图。
具体实施方式
现将详细地提供本发明实施方式的参考,其一个或多个实例描述于下文。提供每一实例作为解释而非限制本发明。实际上,对本领域技术人员而言,显而易见的是,可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。
因此,旨在本发明覆盖落入所附权利要求的范围及其等同范围中的此类修改和变化。本发明的其它对象、特征和方面公开于以下详细描述中或从中是显而易见的。本领域普通技术人员应理解本讨论仅是示例性实施方式的描述,而非意在限制本发明更广阔的方面。
本发明涉及一种甲基化测序DNA文库的构建方法,包括:
a)使用一端带接头的随机引物和/或半随机引物扩增重亚硫酸盐处理后的单链DNA,得到同时具有所述接头和所述单链DNA互补链的中间体DNA;
其中所述接头具有由衔接物连接在一起的两段测序接头序列,且所述衔接物具有AP位点;
b)用单链DNA环化连接酶将所述中间体DNA的两端连接得到环化DNA;以及
c)使用APE酶切割所述环化DNA中的AP位点以去环化。
在一些实施方式中,步骤c)后还包括,在酶切后的DNA的至少一段添加标签序列(index/barcode)。
APE酶即脱嘌呤/脱嘧啶(AP)核酸内切酶,其家族共有4种类型的酶,在本发明中,APE酶可以为I型或II型APE,其只要能切开AP位点即可。Ⅰ型APE在AP位点的3'端通过β-消除作用切开核酸链,在AP位点处生成3'-OH以及带有5'-磷酸基团的正常核酸链;Ⅱ型APE在AP位点的5'端通过水解作用切开核酸链,在AP位点处生成5'-磷酸基团以及带有3'-OH的正常核酸链。由于APE1的活性较高,因而优选APE 1酶。
AP位点即缺嘌呤/缺嘧啶位点,也被称作是缺碱基位点、脱碱基位点、无碱基位点。在本发明中,AP位点也可以为dSpacer所表示,例如“abasic dSpacer furan”。
在一些实施方式中,所述半随机引物中G碱基的含量低于25%,例如低于23%、20%、17%、15%、13%。
在一些实施方式中,所述半随机引物中不含G碱基;
和/或;
在一些实施方式中,所述半随机引物中仅含有一个G碱基。
在一些实施方式中,当所述半随机引物中仅含有一个G碱基时,G碱基位于所述半随机引物的基本中段位置。
在一些实施方式中,所述半随机引物的长度为6nt~10nt,优选8nt。
在一个具体的实施方式中,所述半随机引物的序列为HHHHHHHH,H=A/C/T中的任一种;
和/或;
在一个具体的实施方式中,所述半随机引物的序列为HHHHGHHH,H=A/C/T中的任一种。
人基因组中的GC比例约为40%,而经过亚硫酸氢盐处理后,C碱基比例大大降低,造成一个不平衡碱基比例。本发明据此设计的半随机引物大大降低了随机引物的冗余度,能够有效提高其与重亚硫酸盐处理后的单链DNA的退火结合效率。
在哺乳动物中,经典CpG位点为对称性甲基化修饰,非经典的DNA甲基化模式(包括CHG与CHH)是非对称性甲基化修饰(如图4所示)。i)由于甲基化的C碱基基本不受亚硫酸氢盐处理影响,HHHHGHHH序列既可以特异性结合经典CpG位点的+链与-链,也可以匹配甲基化状态的CHG与CHH位点的+链;ii)HHHHHHHH序列特异性结合非甲基化状态的CHG与CHH位点的+链与-链。以此实现半随机引物对各类型甲基化位点的全面匹配,并有效提高引物对甲基化位点的匹配效率。
在一些实施方式中,所述衔接物完全由AP位点构成。
本发明优选的测序接头序列,二者经过随机引物所形成的序列能形成发夹结构,提高单链DNA的稳定性。
在一些实施方式中,所述单链DNA由基因组DNA及任选的外源DNA片段化得到,所述基因组DNA及所述外源DNA独立地选自植物或动物DNA。
在一些实施方式中,所述植物是拟南芥。
在一些实施方式中,所述动物是昆虫(例如秀丽线虫)、斑马鱼或哺乳动物。
在一些实施方式中,所述哺乳动物是人、大鼠或小鼠。
在一些实施方式中,所述基因组DNA为动物DNA,且其来源为血液、血浆、细胞培养上清、脑脊液、唾液、精液、羊水、绒毛、组织或细胞裂解液、骨骼或毛发。
在一些实施方式中,所述血液为外周血或骨髓血。
本文使用的“组织或细胞裂解物”也可与“裂解物”、“裂解的样品”、“组织或细胞提取物”等用语通用,表示包含裂解的组织或细胞的样品和/或生物样品材料,即其中组织或细胞的结构完整性已经被破坏。为了释放细胞或组织样品的内容物,通常用酶和/或化学试剂处理所述材料,以溶解、降解或破坏这样的组织或细胞的细胞壁和细胞膜。熟练的技术员非常熟悉用于得到裂解物的适当方法。该过程被术语“裂解”包括。
在一些实施方式中,重亚硫酸盐处理单链DNA之前或之后被片段化。
在一些实施方式中,所述片段化的方法为超声随机打断。片段化的对象可以为单链DNA,也可以为双链DNA(片段化后再处理为单联并进行重亚硫酸盐处理)。
在一些实施方式中,所述片段化后DNA的长度可以为20bp~5kb,例如20bp、30bp、40bp、50bp、100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1kb、1.1kb、1.2kb、1.3kb、1.4kb、1.5kb、1.6kb、1.7kb、1.8kb、1.9kb、2kb、3kb、4kb、5kb,或上述任意两个数值组成的范围值。其优选的长度为约200bp~600bp。
在一些实施方式中,所述外源DNA为是没有甲基化修饰的λDNA。
所述单链DNA优选与外源DNA(特别是没有甲基化修饰的λDNA)一起用重亚硫酸盐处理,如利用DNA Methylation-GoldTMKit(ZYMO)使非甲基化胞嘧啶转换为尿嘧啶。外源基的作用是在重亚硫酸盐处理时与样品一起高效共处理,对微量的DNA片段起到保护作用,最大限度的降低重亚硫酸盐对微量DNA的破坏。
根据本发明的再一方面,本发明还涉及试剂盒,其包括如上任一项方法中所定义的:带接头的随机引物、APE酶以及单链DNA环化连接酶。
在一些实施方式中,其还包括重亚硫酸盐、DNA聚合酶、标签序列、dNTP、水、DNA提取体系以及没有甲基化修饰的λDNA中的一种或多种。
在一些实施方式中,所述水通常没有核酸及核酸酶,例如双蒸水或去离子水。水为蒸馏水(Distilled Water)、去离子水(Deionized Water)、反渗水(Reverse osmosisWater)。
在一些实施方式中,所述DNA聚合酶选自Taq、Bst、Vent、Phi29、Pfu、Tru、Tth、Tl1、Tac、Tne、Tma、Tih、Tf1、Pwo、Kod、Sac、Sso、Poc、Pab、Mth、Pho、ES4 DNA聚合酶、Klenow片段中的一种或多种。
在一些实施方式中,所述基因组DNA通过饱和苯酚-氯仿法、硅胶吸附柱法、树脂提取法或磁珠提取法提取;在一些实施方式中,所述DNA提取体系用于实现上述DNA提取方法。
如上所述方法或如上所述的试剂盒在甲基化测序中的应用。
在一些实施方式中,其中甲基化测序为是第二代测序。
下面将结合实施例对本发明的实施方案进行详细描述。
实施例1
(1)核酸纯化与片段化
本实施例检测的为外周血样本,采用核酸提取试剂盒(包括硅胶吸附柱法,磁珠法等)提取或纯化生物样本中的DNA,经分光光度仪或者Qubit法测定DNA浓度。
(2)亚硫酸氢盐处理
取200ng片段化后的DNA,采用DNA Methylation-GoldTMKit(ZYMO Research)(或Epiject等其他市售试剂盒)进行亚硫酸氢盐处理,具体操作步骤详见说明书;在该过程中重亚硫酸盐使DNA中未发生5m甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变。在后续的文库构建中尿嘧啶会转变为胸腺嘧啶,并对文库进行测序,通过与参考基因组序列比对,判断是否CpG位点的甲基化状态。22μl无核酸酶水洗脱。取1μl洗脱液经EB染色凝胶电泳,如图1所示,观察到ssDNA的片段分布大概在200~600bp。
(3)ssDNA随机扩增与添加标签
设计合成两种带特定接头的8nt半随机引物,结构如下:i)5’P-GATCGGAAGAGCACACGTCTGAACTCCAGTC(A1)-θ-ACACTCTTTCCCTACACGACGCTCTTCCGATC(A2)-HHHHGHHH 3’;ii)5’P-A1-θ-A2-HHHHHHHH 3’。其中P是磷酸基团;A1与A2分别是特异性接头;θ是abasic dSpacer furan位点,可特异性地被APE 1酶剪切。下划线标注的序列表示8nt半随机序列,H=T/A/C。
该扩增体系为:DNA Polymerase I,Large(Klenow)Fragment(InvitrogenTM)1μl(0.5U),上述ssDNA洗脱液22μl,0.5mM dNTP 1μl,100μM带标签的8nt随机引物1μl,无核酸酶水5μl。吹打混匀后,微离心,25℃孵育15min。使用60μl Ampure XP磁珠纯化,12μl无核酸酶水洗脱。
(4)第二链ssDNA环化
利用ssDNA Ligase(单链DNA环化连接酶)使上述单链DNA产物发生自身环化。首先,80℃孵育上述单链DNA产物10min,使之变性。然后配制以下体系:12μl Single-stranded DNA,2μL CircLigase II 10X Reaction Buffer,1μL 50mM MnCl2,4μL 5MBetaine,1μL CircLigase II ssDNA Ligase(100U)。60℃孵育60min,80℃10min。
(5)环化ssDNA去环化
该步骤的作用是APE 1酶切断θ位点,重新形成单链DNA产物。同时在ssDNA的两端分别连接上A1、A2接头。该体系为:3μl 10x NEBuffer 4,1μl APE1酶(10U),6μl无核酸酶水,20μl上述反应液。PCR程序为37℃孵育60min。使用45μl Ampure XP磁珠纯化,20μl无核酸酶水洗脱。
(6)文库扩增
该步骤的作用是采用含测序所需要的样本标签的引物扩增ssDNA。引物如下:
P1:5′-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC*T-3
P2:5-CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC-s-T-3′;
其中NNNNNN为6nt唯一样本标签(N=A/T/C/G)。该体系为:25μl 2x KAPA HiFiHotStart ReadyMix,5μl primer mix,20μl上述反应液。PCR程序为98℃孵育45s,10个循环:98℃15s,65℃30s,72℃30s;72℃孵育60s。使用45μl Ampure XP磁珠纯化,20μl无核酸酶水洗脱。使用Qubit3.0检测文库浓度,合格文库(>1ng/μL)放置于-20℃保存。DNA甲基化文库使用安捷伦Agilent 2100生物分析仪进行质控分析,如图2所示,观察到其文库片段分布在200bp~700bp之间。
(7)DNA测序
采用IlluminaNovaseq6000平台对上述DNA甲基化文库进行150bp配对末端测序。使用FastQC与Trim Galore软件对原始数据进行质量评估与低质量碱基序列剔除;使用Bismark软件(http://www.bioinformatics.babraham.ac.uk/projects/bismark/)将干净数据与人参考基因组进行比对,并识别甲基化C碱基。数据比对显示如图3所示。
实施例2
本实施例检测的为组织样本,采用核酸提取试剂盒(包括硅胶吸附柱法,磁珠法等)提取或纯化生物样本中的DNA,经分光光度仪或者Qubit法测定DNA浓度。使用超声打断等方法使所述DNA断裂为200bp~500bp长的片段。
步骤(2)~(7)与实施例1一致。
对比例
采用公开号CN110305946A,公开日为2019年10月08日,优先权日为2019年07月18日的发明专利中的实施例1作为对比例,其检测样本与实施例1相同,从其结果来看,由于其测序过程中需要引入大量的核苷酸同聚物序列以及其互补序列,会对后续的测序结果造成分辨失真,测序质量较差。
本发明利用PCR扩增合成方法使单链DNA接上5’接头,并利用ssDNA环化连接酶使单链DNA的3’端接上接头,APE酶水解AP位点,即形成带双端接头的DNA文库。该方法没有引入多余的甲基基团修饰位点,且接头是在重亚硫酸盐处理后加上的,不会由于亚硫酸氢盐处理导致更多的片段断裂;针对单联稳定性相对较差的问题,优选对接头序列进行优化;构建的文库多样性好,且基本不影响后续的测序过程。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (9)
1.甲基化测序DNA文库的构建方法,包括:
a) 使用一端带接头的半随机引物扩增重亚硫酸盐处理后的单链DNA,得到同时具有所述接头和所述单链DNA互补链的中间体DNA;所述半随机引物的序列为HHHHHHHH和HHHHGHHH,且H=A/C/T;
其中所述接头具有由衔接物连接在一起的两段测序接头序列,且所述衔接物具有AP位点;所述单链DNA由基因组DNA及外源DNA片段化得到,所述外源DNA为没有甲基化修饰的λDNA,所述基因组DNA为哺乳动物DNA;
b) 用单链DNA环化连接酶将所述中间体DNA的两端连接得到环化DNA;以及
c) 使用APE酶切割所述环化DNA中的AP位点以去环化;
步骤c)后还包括,在酶切后的DNA的至少一段添加标签序列。
2.根据权利要求1所述的甲基化测序DNA文库的构建方法,所述衔接物完全由AP位点构成。
3.根据权利要求1~2任一项所述的甲基化测序DNA文库的构建方法,所述哺乳动物DNA的来源为血液、脑脊液、唾液、精液、羊水、绒毛、组织、骨骼或毛发。
4.根据权利要求1~2任一项所述的甲基化测序DNA文库的构建方法,所述哺乳动物DNA的来源为血浆。
5.根据权利要求1~2任一项所述的甲基化测序DNA文库的构建方法,所述哺乳动物DNA的来源为细胞培养上清或细胞裂解物。
6.根据权利要求1所述的甲基化测序DNA文库的构建方法,所述片段化的方法为超声随机打断。
7.一种哺乳动物甲基化测序DNA文库的构建试剂盒,其包括权利要求1~6任一项中所定义的:带接头的半随机引物、APE酶、标签序列、单链DNA环化连接酶以及没有甲基化修饰的λDNA。
8.权利要求1~6任一项所述的方法或权利要求7所述的试剂盒在哺乳动物甲基化测序中的应用,所述应用为非诊断目的的。
9.根据权利要求8所述的应用,其中甲基化测序为第二代测序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911233926.4A CN110938674B (zh) | 2019-12-05 | 2019-12-05 | 甲基化测序dna文库的构建方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911233926.4A CN110938674B (zh) | 2019-12-05 | 2019-12-05 | 甲基化测序dna文库的构建方法及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110938674A CN110938674A (zh) | 2020-03-31 |
CN110938674B true CN110938674B (zh) | 2024-03-19 |
Family
ID=69909178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911233926.4A Active CN110938674B (zh) | 2019-12-05 | 2019-12-05 | 甲基化测序dna文库的构建方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110938674B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110760936B (zh) * | 2018-07-26 | 2023-04-28 | 深圳华大生命科学研究院 | 构建dna甲基化文库的方法及其应用 |
CN113584600A (zh) * | 2021-08-11 | 2021-11-02 | 翌圣生物科技(上海)股份有限公司 | 一种全基因组甲基化单链dna建库方法 |
CN116555426B (zh) * | 2023-05-04 | 2024-07-12 | 杭州圣庭医疗科技有限公司 | 一种鉴定肿瘤组织来源的试剂盒及数据分析方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105986030A (zh) * | 2016-02-03 | 2016-10-05 | 广州市基准医疗有限责任公司 | 甲基化dna检测方法 |
CN107208157A (zh) * | 2015-02-27 | 2017-09-26 | 赛卢拉研究公司 | 用于条形编码核酸以用于测序的方法和组合物 |
CN107904669A (zh) * | 2018-01-02 | 2018-04-13 | 华中农业大学 | 一种单细胞甲基化测序文库的构建方法及其应用 |
CN110305946A (zh) * | 2019-07-18 | 2019-10-08 | 重庆大学附属肿瘤医院 | 基于高通量测序的dna甲基化检测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2559209C (en) * | 2004-03-08 | 2016-06-07 | Rubicon Genomics, Inc. | Methods and compositions for generating and amplifying dna libraries for sensitive detection and analysis of dna methylation |
US8722585B2 (en) * | 2011-05-08 | 2014-05-13 | Yan Wang | Methods of making di-tagged DNA libraries from DNA or RNA using double-tagged oligonucleotides |
-
2019
- 2019-12-05 CN CN201911233926.4A patent/CN110938674B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107208157A (zh) * | 2015-02-27 | 2017-09-26 | 赛卢拉研究公司 | 用于条形编码核酸以用于测序的方法和组合物 |
CN105986030A (zh) * | 2016-02-03 | 2016-10-05 | 广州市基准医疗有限责任公司 | 甲基化dna检测方法 |
CN107904669A (zh) * | 2018-01-02 | 2018-04-13 | 华中农业大学 | 一种单细胞甲基化测序文库的构建方法及其应用 |
CN110305946A (zh) * | 2019-07-18 | 2019-10-08 | 重庆大学附属肿瘤医院 | 基于高通量测序的dna甲基化检测方法 |
Non-Patent Citations (2)
Title |
---|
Chongyuan Luo et al..Robust single-cell DNA methylome profiling with snmC-seq2.NATURE COMMUNICATIONS.2018,第9卷摘要,正文第2页左栏第2段至第3页右栏第2段. * |
Stephen J Clark et al..Genome-wide base-resolution mapping of DNA methylation in single cells using single-cell bisulfite sequencing (scBS-seq).nature protocols.2017,第12卷摘要、正文第534页左栏第2段至537页左栏第2段. * |
Also Published As
Publication number | Publication date |
---|---|
CN110938674A (zh) | 2020-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220282242A1 (en) | Contiguity Preserving Transposition | |
CN106661631B (zh) | 从血液特异性靶向捕获人类基因组和转录组区域的方法 | |
US8936912B2 (en) | Method for multiplexed nucleic acid patch polymerase chain reaction | |
US11725230B2 (en) | Selective degradation of wild-type DNA and enrichment of mutant alleles using nuclease | |
EP3207134B1 (en) | Contiguity preserving transposition | |
EP1456407B1 (en) | Nucleic acid enrichment | |
CN110938674B (zh) | 甲基化测序dna文库的构建方法及其应用 | |
JP2021509587A (ja) | シトシン修飾の、亜硫酸水素塩非含有、塩基分解能特定 | |
US20120316075A1 (en) | Sequence preserved dna conversion for optical nanopore sequencing | |
AU2018279112A1 (en) | Creation and use of guide nucleic acids | |
EP4253565A2 (en) | Methods for constructing copies of nucleic acid molecules | |
US20200255823A1 (en) | Guide strand library construction and methods of use thereof | |
US10023908B2 (en) | Nucleic acid amplification method using allele-specific reactive primer | |
EP3927717A1 (en) | Guide strand library construction and methods of use thereof | |
US11111514B2 (en) | Method for multiplexed nucleic acid patch polymerase chain reaction | |
CN113817723B (zh) | 一种多核苷酸及其标准品、试剂盒与用途 | |
US9909170B2 (en) | Method for multiplexed nucleic acid patch polymerase chain reaction | |
WO2018009677A1 (en) | Fast target enrichment by multiplexed relay pcr with modified bubble primers | |
Shagin et al. | REVIEW MOLECULAR BIOLOGY | |
Chandradoss et al. | MASTR-seq: Multiplexed Analysis of Short Tandem Repeats with sequencing | |
Deards | BRIDGING THE GAP: PROBING THE EFFECTS OF DNA METHYLATION ON BINDING DYNAMICS THROUGH NOVEL METHODOLOGY, AND HISTORICAL REVIEW |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |