WO2023082251A1 - 一种基于标签序列和链置换的全基因组甲基建库测序方法 - Google Patents

一种基于标签序列和链置换的全基因组甲基建库测序方法 Download PDF

Info

Publication number
WO2023082251A1
WO2023082251A1 PCT/CN2021/130644 CN2021130644W WO2023082251A1 WO 2023082251 A1 WO2023082251 A1 WO 2023082251A1 CN 2021130644 W CN2021130644 W CN 2021130644W WO 2023082251 A1 WO2023082251 A1 WO 2023082251A1
Authority
WO
WIPO (PCT)
Prior art keywords
sequence
dna
sequencing
methylation
cytosine
Prior art date
Application number
PCT/CN2021/130644
Other languages
English (en)
French (fr)
Inventor
夏军
杨林
宋喆
史千玉
杨新
赵霞
Original Assignee
深圳华大智造科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳华大智造科技股份有限公司 filed Critical 深圳华大智造科技股份有限公司
Priority to PCT/CN2021/130644 priority Critical patent/WO2023082251A1/zh
Publication of WO2023082251A1 publication Critical patent/WO2023082251A1/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification

Definitions

  • the invention relates to the field of biotechnology, in particular to a whole genome methyl library construction and sequencing method based on tag sequence and strand replacement.
  • DNA methylation is an important manifestation of epigenetics. DNA methylation can not only show changes in state due to differences with the environment, but also show genetic characteristics that can be passed on to offspring along with the DNA replication process. DNA methylation can regulate gene expression and play an important role in maintaining normal cell function and genetic imprinting, as well as in embryonic development and human tumorigenesis. DNA can be passed on to newborn offspring along with the DNA replication process.
  • DNA methylation in a broad sense means that the bases on the DNA chain are catalyzed by DNA methyltransferase, with S-adenosyl methionine (SAM) as the methyl donor , the chemical modification process of obtaining a methyl group by means of covalent bonding. Methylation can occur at the C5 position of cytosine, the N6 position of adenine and the N7 position of guanine.
  • SAM S-adenosyl methionine
  • Methylation can occur at the C5 position of cytosine, the N6 position of adenine and the N7 position of guanine.
  • the research on DNA methylation is mainly focused on the methylation of cytosine C5. At present, about 1% of the methylated cytosine in the human genome is studied, which is the most abundant DNA modification found so far.
  • DNA methylation can regulate gene expression, it plays an important role in a series of life activities of organisms. For example, abnormal DNA methylation is one of the distinctive features of cancer. DNA methylation has been widely used in disease diagnosis and treatment. Biomarkers for disease risk detection. Therefore, many methods have been applied to detect methylation modifications on DNA, such as HPLC-Mass, qPCR/ddPCR, pyrosequencing, Microarry chip and next-generation sequencing methods, etc. With the continuous development of next-generation sequencing in recent years, the method based on next-generation sequencing has become more and more widely used, such as the detection of methylation targets in liquid biopsy and early tumor screening.
  • Next-generation sequencing-based DNA methylation detection methods also include reduced representative bisulfite sequencing (RRBS), whole genome bisulfite sequencing (WGBS), methylation co-immunoprecipitation sequencing (MeDIP-seq), Targeted DNA methylation sequencing, etc.
  • RRBS reduced representative bisulfite sequencing
  • WGBS whole genome bisulfite sequencing
  • MeDIP-seq methylation co-immunoprecipitation sequencing
  • Targeted DNA methylation sequencing etc.
  • the first is whole genome sequencing (WGBS) based on bisulfite (BS) treatment. It uses bisulfite (commonly known as BS conversion) to treat DNA, which can "convert” unmethylated C, 5fC and 5caC into uracil (U), and finally “convert” into thymine (T) through PCR amplification , while the methylated 5mC and 5hmC are not converted ( Figure 1), and the DNA methylation level can be obtained by analyzing the CT ratio of the base in the original position in the sequencing data.
  • BS conversion commonly known as BS conversion
  • GPS Guide Positioning Sequencing
  • This method allows one of the two ends of the library to be the original DNA sequence, and the other end is the sulfite-converted sequence.
  • the first part of the double-end sequencing is the original DNA sequence sequencing, and the second part is the bisulfite sequence. Transformation sequence sequencing. Since the first part of the sequencing results can be accurately compared to the reference genome, it can be used as a "guide" for the second step.
  • the specific method is that after the DNA is broken, when using T4 DNA polymerase for end repair, first use its 3'-5' exonuclease activity in the absence of dNTP in the reaction system to excise a section of 3'-5' exonuclease. 'the sequence of.
  • the 5'-3' polymerase activity exerted by dNTP in the reaction system is used to re-synthesize the excised fragment, and in the reaction system, dCTP is replaced with methylated dmCTP, so that the synthesized DNA3
  • the fragment at the 'end maintains the genome sequence after sulfite treatment, which can be used for positioning in the sequencing data; while the 5' end is changed after sulfite treatment, which can be used to detect methylation modification.
  • the navigation, positioning and sequencing GPS method utilizes the 3'-5' exonuclease activity and 5'-3' polymerase activity of T4 DNA polymerase to form a section at the 3' end that is not blocked.
  • the sulfite-converted fragment was used for localization.
  • the purpose of the present invention is to provide a whole genome methyl library construction and sequencing method based on tag sequence and strand replacement.
  • the present invention claims a methylation library construction and sequencing method.
  • the methylation library construction and sequencing method claimed in the present invention may include the following steps: relying on the method of tag sequence labeling and strand replacement, so that the original sequence library and the bisulfite sequence library that are correlated with each other by the tag sequence exist in the library.
  • the library after salt conversion is sequenced and then the same tag sequence and original sequence are used to locate or identify the bisulfite converted sequence.
  • the method may include the following steps:
  • the method also includes the following steps: converting the intermediate double-stranded DNA molecule through bisulfite to obtain a terminal double-stranded DNA molecule; one strand of the terminal double-stranded DNA molecule is consistent with the original sequence, and is recorded as fragment A , and the other is the transformed sequence, denoted as Fragment B.
  • the method also includes the step of library sequence determination, and then determines the grouping of reads through the same tag sequence, and locates the fragment B in the same group by means of the fragment A to determine its position on the genome.
  • the method may include the following steps:
  • methylated cytosine deoxyribonucleoside triphosphate (mdCTP) is used instead of dCTP, so that the C in the replaced replication chain is methylated modified 5mC.
  • dCTP methylated cytosine deoxyribonucleoside triphosphate
  • the original double-stranded DNA will become two double-stranded DNAs, and each DNA double-strand has the original DNA strand (including methylated and non-methylated modified C) and is completely methylated.
  • the modified C replaces the DNA strand composition of the original C, and the two single strands have the same tag sequence.
  • the original DNA strand in the DNA double strand contains both unmethylated C and methylated C strands.
  • the methylated C does not change, and the unmethylated C
  • the optimized C will be converted to U, and the overall sequence will change. Since the duplicated strands in the DNA double strands are all methylated C, no conversion will occur, and the overall sequence will not change, which is consistent with the original sequence.
  • each set of DNA libraries are 2 DNA libraries containing the same tag sequence, one is a DNA library with the same original sequence, and the other is a transformed DNA library. later library.
  • the fragmented DNA may include free extracellular DNA or degraded DNA.
  • step (B) the labeling is performed through a linker ligation reaction.
  • the linker includes a universal primer binding sequence and a random sequence consisting of 3-25 Ns; wherein, the cytosine in the universal primer binding sequence is methylated cytosine; N is A or T or mC Or G, mC is methylated cytosine.
  • the linker includes a universal primer binding sequence, a random sequence consisting of 6-25 Ns, and a sequence combined with a sequencing primer; wherein, the cytosine in the universal primer binding sequence is methylated modified cytosine; N is A or T or mC or G, mC is methylated modified cytosine; the cytosine in the sequence combined with the sequencing primer is methylated modified cytosine.
  • the universal primer-binding sequence and the sequencing primer-binding sequence are double-stranded; the random sequence is single-stranded.
  • sequencing primer and the universal primer are adapted to the DNBSEQ platform or the illumina platform or any other adapted sequencing platform.
  • the linker is a linker of the DNBSEQ platform. Specifically, it is formed by the annealing of the following three DNA single strands:
  • N is A or T or mC or G
  • mC is methylated cytosine.
  • C in the above three chains is mC (ie, methylated cytosine).
  • the primers used for the PCR amplification are the universal primers.
  • the general primer sequence is as follows:
  • Each of the above sequences is the sequence from the 5' to the 3' end.
  • the sequencing may specifically be paired-end sequencing.
  • step (F) the data analysis may be performed according to a method comprising the following steps:
  • the present invention claims a kit for methylation library construction.
  • the kit for building a methylation library as claimed in the present invention may include a linker containing a tag sequence, a polymerase with a strand displacement function, and 5mdCTP.
  • the linker includes a universal primer binding sequence and a random sequence consisting of 3-25 Ns; wherein, the cytosine in the universal primer binding sequence is methylated cytosine; N is A or T or mC Or G, mC is methylated cytosine.
  • the linker includes a universal primer binding sequence, a random sequence consisting of 6-25 Ns, and a sequence combined with a sequencing primer; wherein, the cytosine in the universal primer binding sequence is a methylated cytosine Pyrimidine; N is A or T or mC or G, mC is methylated modified cytosine; the cytosine in the sequence combined with the sequencing primer is methylated modified cytosine.
  • the universal primer-binding sequence and the sequencing primer-binding sequence are double-stranded; the random sequence is single-stranded.
  • sequencing primer and the universal primer are adapted to the DNBSEQ platform or the illumina platform or any other adapted sequencing platform.
  • the linker is a linker of the DNBSEQ platform. Specifically, it is formed by the annealing of the following three DNA single strands:
  • N is A or T or mC or G
  • mC is methylated cytosine.
  • C in the above three chains is mC (ie, methylated cytosine).
  • the primers used for the PCR amplification are the universal primers.
  • the general primer sequence is as follows:
  • Each of the above sequences is the sequence from the 5' to the 3' end.
  • the present invention claims the application of the kit described in the second aspect above in genome methylation library construction and sequencing.
  • the present invention claims the application of the method described in the first aspect above in the detection of target region methylation.
  • the present invention claims the application of the method described in the first aspect above in early tumor screening and/or liquid biopsy.
  • the present invention claims a method for early screening of tumors.
  • the method for early screening of tumors claimed in the present invention may include the step of performing genome methylation library construction and sequencing on the sample to be tested using the method described in the first aspect above.
  • the present invention claims a liquid biopsy method.
  • the liquid biopsy method claimed in the present invention may include the step of performing genome methylation library construction and sequencing on the sample to be tested using the method described in the first aspect above.
  • Figure 1 is a schematic diagram of bisulfite conversion.
  • Fig. 2 is a schematic diagram of a new genomic methyl library construction method based on tags and strand replacement.
  • Figure 3 is a flow chart of new genome methyl library construction and sequencing based on tags and strand replacement.
  • Fig. 4 is a base distribution diagram of each sequencing cycle.
  • the present invention uses tag sequence to mark DNA molecules, and then utilizes DNA polymerase and methylated cytosine deoxyribonucleoside triphosphate to generate a copy chain in which all C bases are methylated and replace the original strand of DNA.
  • the original DNA fragment will generate 2 DNA strands with the same tag sequence.
  • sequencing it can be determined by the same tag sequence. These two sequences are a group. This method can be used to compare the original sequence that has undergone important sulfate conversion, which makes it difficult to compare the sequence to the genome or the one that is aligned to multiple positions in the genome. reads, relying on the non-transformed section to reposition to determine its position on the genome. See Figures 2 and 3.
  • fragmentation and end repair plus A are performed on a DNA sample that is intact genomic DNA.
  • the sample is fragmented genomic DNA (including free extracellular DNA, degraded DNA, etc.), and the DNA sample is directly subjected to end repair plus A.
  • adapter ligation is performed on the DNA fragments that have undergone end repair plus A, and the adapter needs to include the sequence that binds to the sequencing primer and a section of N ranging from 6 to 25 (cytosine in N can use methyl Modified cytosine) random sequence and universal PCR primer binding sequence, wherein the sequencing primer sequence and universal PCR primer sequence can be adapted to the DNBSEQ platform or illumina platform or any other sequencing platform, this part is a double-stranded structure, and the random sequence Some are single-chain structures.
  • the DNA fragments that have completed end repair plus A are tagged with a tag that includes a sequence that binds to the sequencing primer and a segment of N ranging from 6 to 25 (the cytosine in N can be methylated Modified cytosine), wherein the sequencing primer sequence can be adapted to the DNBSEQ platform or illumina platform or any other sequencing platform, this part is a double-stranded structure, while the random sequence part is a single-stranded structure.
  • a DNA polymerase with strand displacement capability is used for strand displacement, and methylated cytosine deoxyribonucleoside triphosphate (5mdCTP) is used in the reaction system to replace dCTP, so that after displacement
  • the C in the replicating strand of the gene is methylated 5mC.
  • the original double-stranded DNA will become 2 double-stranded DNAs, and each DNA double-stranded strand has the original DNA strand (including methylated and unmethylated modified C) and is completely methylated.
  • the modified C replaces the DNA strand composition of the original C, and the two single strands have the same tag sequence.
  • bisulfite conversion is performed on the DNA duplexes generated by the displacement.
  • the original DNA strand in the DNA double strand contains unmethylated C and methylated C strands.
  • the methylated C does not change, and the unmethylated The C will be converted to U, and the overall sequence will change. Since the duplicated strands in the DNA double strands are all methylated C, no conversion will occur, and the overall sequence will not change, which is consistent with the original sequence.
  • a PCR reaction is performed on the product of the bisulfite conversion reaction.
  • the original double-stranded DNA will generate two sets of DNA libraries, each set of DNA libraries are two DNA libraries containing the same target sequence, one is a DNA library with the same original sequence, and the other is a transformed library .
  • the library construction has been completed so far.
  • the DNBSEQ sequencing platform continue with subsequent library construction operations.
  • an extension reaction is performed on the product of the completed bisulfite conversion reaction.
  • the original DNA double strands will generate 2 sets of DNA libraries, each set of DNA libraries are 2 DNA libraries containing the same target sequence, one is the DNA library with the same original sequence, and the other is the transformed library .
  • the library construction has been completed so far.
  • the DNBSEQ sequencing platform continue with subsequent library construction operations.
  • single-stranded circularization is performed on the PCR product to obtain a single-stranded circular library, and further rolling circle amplification reaction is performed to complete the preparation of DNB
  • the extension product is subjected to single-stranded circularization to obtain a single-stranded circular library, which is further subjected to rolling circle amplification to complete the preparation of DNB.
  • the bridge amplification reaction is performed after the PCR reaction product or the extension reaction product is loaded onto the sequencing chip.
  • the library can be sequenced using the DNBSEQ sequencing platform or the illumina sequencing platform.
  • the sequencing data is analyzed and controlled, and then the tag sequences in the reads (read1 or read2) are identified, and the reads with the same tag sequence are taken as a group, and then the sequencing data is analyzed using common methylation analysis software. comparative analysis.
  • the reads that are not aligned on the genome or the reads that are aligned to multiple positions on the genome are re-aligned, that is, the group information of the tag sequence will bring The reads with the same label information are matched. Since there are no converted reads among them, the accuracy and comparison rate of the comparison will be higher. Through such one-to-one correspondence, it will not be possible to relocate accurately for comparison and multiple comparisons. on the genome.
  • subsequent conventional methylation analysis is performed on the data after the further alignment.
  • the following examples facilitate a better understanding of the present invention, but do not limit the present invention.
  • the experimental methods in the following examples are conventional methods unless otherwise specified.
  • the test materials used in the following examples, unless otherwise specified, were purchased from conventional biochemical reagent stores. Quantitative experiments in the following examples were all set up to repeat the experiments three times, and the results were averaged.
  • NA12878 human cell line DNA standard (Coriell Institute, NA12878).
  • step 13 Repeat step 12, and try to blot up the liquid in the tube. If there is a small amount remaining on the tube wall, centrifuge the centrifuge tube instantaneously. After separating on the magnetic stand, use a small-range pipette to blot up the liquid at the bottom of the tube.
  • the methylated DNA Adapter is the adapter of the DNBSEQ platform. Specifically, it is formed by the annealing of the following three DNA single strands:
  • N is A or T or mC or G
  • mC is methylated cytosine.
  • C in the above three chains is mC (ie, methylated cytosine).
  • Centrifuge the centrifuge tube briefly, place it on a magnetic stand, and let it stand for 2-5 minutes until the liquid is clear. Use a pipette to carefully suck up the supernatant and discard it.
  • Centrifuge the centrifuge tube briefly, place it on a magnetic stand, and let it stand for 2-5 minutes until the liquid is clear. Use a pipette to carefully suck up the supernatant and discard it.
  • Centrifuge the centrifuge tube briefly, place it on a magnetic stand, and let it stand for 2-5 minutes until the liquid is clear. Use a pipette to transfer 20 ⁇ L of the supernatant to a new 1.5 mL centrifuge tube.
  • CT Conversion Reagent can be stored at room temperature for a maximum of 1 day, at 4°C for a maximum of 1 week, and at -20°C for a maximum of 1 month.
  • Non-ready CT Conversion Reagent should be preheated to 37°C before use. Vortex frequently for 10 minutes at room temperature before use.
  • PCR Primer Mix is as follows:
  • step 70 Use a pipette to pipette 30 ⁇ L of the prepared PCR reaction solution into the 0.2 mL PCR tube in step 68, vortex 3 times for 3 seconds each time, and centrifuge briefly to collect the reaction solution to the bottom of the tube.
  • Centrifuge the centrifuge tube briefly, place it on a magnetic stand, and let it stand for 2-5 minutes until the liquid is clear. Use a pipette to transfer 30 ⁇ L of the supernatant to a new 1.5 mL centrifuge tube.
  • the dsDNA HS Assay Kit (Invitrogen, Q32854) was used to quantify the PCR product, and 360ng of the PCR product was transferred to a new 0.2mL PCR tube, supplemented with TE Buffer to a total volume of 48 ⁇ L.
  • Digestion Buffer and Digestion Enzyme are from MGIEasy cyclization kit (MGI, 1000005259).
  • Centrifuge the centrifuge tube briefly, place it on a magnetic stand, and let it stand for 2-5 minutes until the liquid is clear. Use a pipette to transfer 20 ⁇ L of the supernatant to a new 1.5 mL centrifuge tube.
  • the ssDNA Assay Kit Fluorescent Quantification Kit (Invitrogen, Q10212) was used to quantify the products after enzyme digestion and purification according to the operation instructions of the quantification kit.
  • MGISEQ-2000 sequencer uses the MGISEQ-2000 high-throughput sequencing reagent set (PE100) (MGI, catalog number 1000012536), and follow the instructions for DNB production and sequencing.
  • PE100 high-throughput sequencing reagent set
  • 105 Use the commonly used methylation analysis software Bismark to perform quality control and comparison on the sequencing data. After the first comparison is completed, reads that have not been compared on the genome or reads that are compared to multiple positions on the genome Alignment, through the group information of the tag sequence, corresponds to the reads with the same tag information. Since there are no converted reads, the accuracy and ratio of the comparison will be higher. Through such a one-by-one Correspondingly, the unmatched and multiple alignments will be accurately relocated to the genome. After the comparison is completed, use the Bismark analysis software to analyze the genomic methylation level of the sample DNA.
  • the present invention relies on the method of tag sequence labeling and strand replacement, so that the original sequence library and the BS-transformed library that are correlated with the tag sequence exist in the library at the same time, and after sequencing, the unique tag sequence and original sequence are used to realize the BS-transformed sequence positioning.
  • half of the library is not transformed, which greatly increases the complexity of the library, thereby improving the quality of sequencing data.
  • the alignment rate and alignment accuracy of the sequence are greatly improved, and the accuracy of methylation detection is improved, thereby improving the genome-wide
  • the sensitivity of range methylation detection also reduces the cost of whole genome methylation sequencing.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

公开了一种基于标签序列和链置换的全基因组甲基建库测序方法。所述方法可包括如下:依靠标签序列标记和链置换的方法,使得文库中同时存在被所述标签序列相互关联的原始序列文库和经重亚硫酸盐转化后文库,测序后再利用唯一的所述标签序列和原始序列实现对经重亚硫酸盐转化序列的定位。

Description

一种基于标签序列和链置换的全基因组甲基建库测序方法 技术领域
本发明涉及生物技术领域,具体涉及一种基于标签序列和链置换的全基因组甲基建库测序方法。
背景技术
目前已知的DNA修饰有十几种,其中甲基化是最普遍的,也是被研究的最多的DNA修饰。DNA甲基化是表观遗传学的重要表现形式,DNA的甲基化既能表现出与环境差异而出现的状态的改变,也表现出可随DNA的复制过程遗传给子代的遗传特性。DNA甲基化能调控基因表达,在维持正常的细胞功能和遗传印记以及在胚胎发育和人类肿瘤发生中起着重要作用。可随DNA的复制过程遗传给新生的子代DNA。广义上的DNA甲基化是指DNA链上的碱基子在DNA甲基化转移酶的催化作用下,以S-腺苷甲硫氨酸(S-adenosyl methionine,SAM)作为甲基供体,通过共价键结合的方式获得一个甲基基团的化学修饰过程。甲基化修饰可以发生在胞嘧啶的C5位、腺嘌呤的N6位以及鸟嘌呤的N7位。目前对于DNA甲基化的研究主要还是集中在对胞嘧啶C5位甲基化的研究,目前研究人类基因组上大约有1%的甲基化胞嘧啶,是目前发现的最丰富DNA修饰。
由于DNA甲基化修饰可以调控基因表达,在生物体一系列生命活动中发挥重要作用,例如异常DNA甲基化是癌症的显著特征之一,DNA甲基化已被广泛用作疾病诊断和患病风险检测的生物标志物。因此很多方法被应用于检测DNA上的甲基化修饰,例如HPLC-Mass,qPCR/ddPCR,焦磷酸测序,Microarry芯片和二代测序方法等。基于二代测序的方法,也随着近年来二代测序的不断发展而越来越被广泛使用,例如应用于液体活检和肿瘤早筛中甲基化靶标检测。基于二代测序的DNA甲基化检测方法,也包括简化代表性亚硫酸氢盐测序(RRBS),全基因组亚硫酸氢盐测序(WGBS),甲基化免疫共沉淀测序(MeDIP-seq),靶向DNA甲基化测序等。
目前存在的众多检测DNA甲基化修饰的方法中,基于二代测序的DNA甲基化检测方法被应用的最为广泛。而基于二代测序DNA甲基化检测方法中,全基因组甲基化测序是目前最常用的方法。全基因组亚硫酸氢盐测序(WGBS),将二代测序技术与重亚硫酸氢盐转化结合,可以通过分析重亚硫酸盐处理后的DNA样本中C碱基到T碱基的转变,从而产生单碱基分辨率的DNA甲基化图谱,可以涵盖生物体的整个基因组。亚硫酸氢盐转化是甲基化测序高通量应用或其他甲基化全基因组范围的研究方法和应用的基础。因此,研究人员在全基因组亚硫酸氢盐转化的基础上开发了一系列新的技术,例如导航定位测序(Guide Positioning Sequencing,GPS)等。
以下为几种常见的全基因组甲基化化测序方法:
首先是基于重亚硫酸盐(Bisulfite,BS)处理的全基因组测序(WGBS)。 它是使用重亚硫酸盐(俗称BS转化)处理DNA,可以将未甲基化C和5fC以及5caC“转化”为尿嘧啶(U),最后经PCR扩增“转化”为胸腺嘧啶(T),而发生甲基化的5mC和5hmC则不被转换(图1),经过分析测序数据中原有位置的碱基的CT占比就可以得出DNA的甲基化水平。
导航定位测序(Guide Positioning Sequencing,GPS),方法出自文章“Guide Positioning Sequencing identifies aberrant DNA methylation patterns that alter cell identity and tumor-immune surveillance networks”。该方法可以让文库的两端中一端是原始DNA序列,一端是亚硫酸盐转化后的序列,这样进行测序后,双端测序的第一部分是原始DNA序列测序,第二部分是亚硫酸氢盐转化序列测序。由于第一部分测序结果可以精确地比对上参考基因组,因此可以作为第二步的“向导”。具体的方法是DNA打断后,使用T4DNA聚合酶进行末端修复时,先利用其在反应体系中没有dNTP的情况下,发挥的3'-5'外切酶的活性,切除一段3’-5’的序列。之后,再利用反应体系中存在dNTP的时候其发挥的5'-3'聚合酶活性,重新合成被切除的片段,并且在反应体系中,将dCTP换成甲基化的dmCTP,使所合成DNA3’端的片段在亚硫酸盐处理后维持基因组序列,这一段序列测序数据中可用来定位;而5’端在亚硫酸盐处理后发生改变,用来检测甲基化修饰。
然而这些现有方法具有一定的弊端,具体如下:
基于重亚硫酸盐(Bisulfite,BS)处理的全基因组测序(WGBS)是将没有甲基化修饰的C和5fC以及5caC转化成T,而5mC和5hmC不被转化,由于5mC和5hmC占的比例只占总的C的5%,所以全基因组上接近95%的C被转化成了T,这造成了文库的复杂度降低,在测序的时候会因为C碱基的比例非常低,只有接近1%,从而影响测序质量,造成测序数据量和测序准确性降低。同时在进行比对的时候,由于绝大部分C转化为T以及测序质量降低的问题,使得数据的比对率和比对准确性偏低。
导航定位测序GPS的方法在重亚硫酸盐转化的基础上,利用T4DNA聚合酶的3’-5’的外切酶活性和5’-3’的聚合酶活性,在3’端形成一段不被亚硫酸盐转化的片段用于定位。但是酶切效果难以精准把控,无法精准控制3’端被切除的片段的长度。因此,一是会造成建库不稳定,可能会过度切除,造成文库产量低。另外无法确保原来认为是原始DNA序列的一端是否整个reads都是原始DNA序列。如果切除的序列不够长,则reads中会既包含原始DNA序列又包含重亚硫酸盐转化后的序列,这样就会无法用来定位,也可能会造成了甲基化率检测可能会出现偏差。
发明公开
本发明的目的是提供一种基于标签序列和链置换的全基因组甲基建库测序方法。
第一方面,本发明要求保护一种甲基化建库测序方法。
本发明所要求保护的甲基化建库测序方法,可包括如下步骤:依靠标签序列标记和链置换的方法,使得文库中同时存在被所述标签序列相互关联的原始序列文库和经重亚硫酸盐转化后文库,测序后再利用相同的所述标签序列和原始序列实现对经重亚硫酸盐转化序列的定位或鉴定。
进一步地,所述方法可包括如下步骤:
利用所述标签序列对待测双链DNA分子进行标记;
再利用具有链置换能力的聚合酶和甲基化修饰的胞嘧啶脱氧核糖核苷三磷酸进行链置换,得到中间双链DNA分子;所述中间双链DNA分子中的置换链上所有C碱基均被甲基化修饰,另一条模板链上的所有C碱基均为原始状态。
所述方法还包括如下步骤:将所述中间双链DNA分子经过重亚硫酸盐转化,得到终端双链DNA分子;所述终端双链DNA分子中的一条链与原始序列一致,记为片段A,另一条是转化后序列,记为片段B。
所述方法还包括文库序列测定的步骤,然后通过相同的所述标签序列确定reads分组,依靠所述片段A对同组所述片段B进行定位,确定其在基因组上的位置。
更进一步地,所述方法可包括如下步骤:
(A)将待测基因组DNA打断后进行末端修复加“A”。或者,将待测片段化DNA直接进行末端修复加“A”。
(B)对完成末端修复加“A”的DNA片段进行标签标记。
(C)使用聚合酶和5mdCTP对经过标签标记的DNA片段进行链置换。
反应体系中使用甲基化修饰的胞嘧啶脱氧核糖核苷三磷酸(5mdCTP)代替dCTP,使得置换后的复制链中的C都是甲基化修饰的5mC。置换完成后会使原本的双链DNA会变成2条双链DNA,每条DNA双链都是有原本的DNA链(包含甲基化和非甲基化修饰的C)和完全被甲基化修饰C替换原有C的DNA链组成,并且这2条单链具有相同的标签序列。
(D)对链置换后产生的DNA双链进行重亚硫酸盐转化。
对于生成的DNA链来说,DNA双链中原始DNA链既包含未甲基化C和甲基化C的链,在重亚硫酸盐转化后,甲基化的C不发生变化,未甲基化的C会转化为U,整体序列发生改变。DNA双链中的复制链,由于都是甲基化的C,所以都不会发生转化,整体序列不发生改变,与原始序列一致。
(E)对重亚硫酸盐转化后的DNA进行PCR或延伸反应,完成C到T的转化和建库。
PCR反应后,原有的DNA双链会生成2组DNA文库,每组DNA文库都是包含相同的所述标签序列的2个DNA文库,1个是原始序列一致的DNA文库,1个是转化后的文库。
(F)测序以及数据分析。
进一步地,步骤(A)中,所述片段化DNA可包括胞外游离DNA或发生降解的DNA等。
进一步地,步骤(B)中,通过接头连接反应进行所述标签标记。
其中,所述接头包括通用引物结合序列和由3-25个N组成的随机序列;其中,所述通用引物结合序列中的胞嘧啶为甲基化修饰的胞嘧啶;N为A或T或mC或G,mC为甲基化修饰的胞嘧啶。
更进一步地,步骤(B)中,所述接头包括通用引物结合序列、由6-25个N组成的随机序列,以及与测序引物结合的序列;其中,所述通用引物结合序列中的胞嘧啶为甲基化修饰的胞嘧啶;N为A或T或mC或G,mC为甲基化修饰的胞嘧啶;所述与测序引物结合的序列中的胞嘧啶为甲基化修饰的胞嘧啶。
在所述接头中,所述通用引物结合序列和所述与测序引物结合的序列,这两部分为双链结构;所述随机序列部分为单链结构。
进一步地,所述测序引物和所述通用引物适配DNBSEQ平台或illumina平台或者其它任何适配的测序平台。
在本发明的具体实施方式中,所述接头为DNBSEQ平台的接头。具体为由如下三条DNA单链退火后形成:
A:TGTGAGCCAAGGAGTT(SEQ ID No.1);
B:GAACGACATGGCTACGATCCGACTT(SEQ ID No.2);
C:/5phos/CAGTCGGAGGCCAAGCGGTCTTAGGAAGACAANNNNNNNNNNCAACTCCTTGGCTCACA(SEQ ID No.3)。其中,N为A或T或mC或G,mC为甲基化修饰的胞嘧啶。
上述三条链中的C均为mC(即甲基化修饰的胞嘧啶)。
进一步地,步骤(E)中,进行所述PCR扩增时采用的引物为所述通用引物。通用引物序列,具体如下:
A:/5Phos/GAACGACATGGCTACGA(SEQ ID No.4);
B:TGTGAGCCAAGGAGTTG(SEQ ID No.5)。
上述各序列均为自5’到3’端的顺序。
进一步地,步骤(F)中,所述测序具体可为双端测序。
进一步地,步骤(F)中,可按照包括如下步骤的方法进行所述数据分析:
(F1)识别reads中的标签序列,带相同标签序列的reads为一组;
(F2)使用常用甲基化分析软件(如Bismark)对测序数据进行比对分析;
(F3)经(F2)比对后,对没有比对到基因组上的reads或比对到基因组上多个位置的reads进行重新比对,即通过依据(F1)的分组信息,将带有相同标签的reads进行一一对应和重新定位;
(F4)对完成(F3)后的数据进行常规的甲基化分析。
第二方面,本发明要求保护一种用于甲基化建库的试剂盒。
本发明要求保护的用于甲基化建库的试剂盒,可包括含有标签序列的接头、具有链置换功能的聚合酶、5mdCTP。
其中,所述接头包括通用引物结合序列和由3-25个N组成的随机序列;其中,所述通用引物结合序列中的胞嘧啶为甲基化修饰的胞嘧啶;N为A或T或mC或G,mC为甲基化修饰的胞嘧啶。
进一步地,所述接头包括通用引物结合序列、由6-25个N组成的随机序列,以及与测序引物结合的序列;其中,所述通用引物结合序列中的胞嘧啶为甲基化修饰的胞嘧啶;N为A或T或mC或G,mC为甲基化修饰的胞嘧啶;所述与测序引物结合的序列中的胞嘧啶为甲基化修饰的胞嘧啶。
在所述接头中,所述通用引物结合序列和所述与测序引物结合的序列,这两部分为双链结构;所述随机序列部分为单链结构。
进一步地,所述测序引物和所述通用引物适配DNBSEQ平台或illumina平台或者其它任何适配的测序平台。
在本发明的具体实施方式中,所述接头为DNBSEQ平台的接头。具体为由如下三条DNA单链退火后形成:
A:TGTGAGCCAAGGAGTT(SEQ ID No.1);
B:GAACGACATGGCTACGATCCGACTT(SEQ ID No.2);
C:/5phos/CAGTCGGAGGCCAAGCGGTCTTAGGAAGACAANNNNNNNNNNCAACTCCTTGGCTCACA(SEQ ID No.3)。其中,N为A或T或mC或G,mC为甲基化修饰的胞嘧啶。
上述三条链中的C均为mC(即甲基化修饰的胞嘧啶)。
进一步地,步骤(E)中,进行所述PCR扩增时采用的引物为所述通用引物。通用引物序列,具体如下:
A:/5Phos/GAACGACATGGCTACGA(SEQ ID No.4);
B:TGTGAGCCAAGGAGTTG(SEQ ID No.5)。
上述各序列均为自5’到3’端的顺序。
第四方面,本发明要求保护前文第二方面所述试剂盒在基因组甲基化建库测序中的应用。
第五方面,本发明要求保护前文第一方面所述方法在目标区域甲基化检测中的应用。
第六方面,本发明要求保护前文第一方面所述方法在肿瘤早筛和/或液体活检中的应用。
第七方面,本发明要求保护一种肿瘤早筛的方法。
本发明要求保护的肿瘤早筛的方法,可包括利用前文第一方面所述方法对待测样本进行基因组甲基化建库测序的步骤。
第八方面,本发明要求保护一种液体活检的方法。
本发明要求保护的液体活检的方法,可包括利用前文第一方面所述方法对待测样本进行基因组甲基化建库测序的步骤。
附图说明
图1为重亚硫酸盐转化示意图。
图2为基于标签和链置换的新基因组甲基建库方法示意图。
图3为基于标签和链置换的新基因组甲基建库测序流程图。
图4为每个测序循环的碱基分布图。
实施发明的最佳方式
本发明利用标签序列对DNA分子进行标记,再利用DNA聚合酶和甲基化修饰的胞嘧啶脱氧核糖核苷三磷酸生成完全一条所有C碱基都是甲基化修饰的复制链,置换原来的DNA链。原来的DNA片段会生成2条带有相同的标签序列的DNA链。经过重亚硫酸盐转化后,形成相应的2条不同的DNA片段,1条是原始序列一致的DNA片段,1条是转化后序列的DNA片段。测序之后,可以通过相同的标签序列确定,这2条序列是一组,可以通过这个方法对原本经过重要硫酸盐转化导致序列难以比对上基因组或在比对到基因组多个位置上的那条reads,依靠没有转化的这段重新进行定位,确定其在基因组上的位置。参见图2和图3。
具体的实施方式如下:
在一个实施例中,对DNA样本进行打断和末端修复加A,DNA样本是完整的基因组DNA。
在另一个实施例中,样本为片段化的基因组DNA(包括胞外游离DNA,发生降解的DNA等),对DNA样本直接进行末端修复加A。
在一个实施例中,对完成末端修复加A的DNA片段进行接头连接,接头中需要包括与测序引物结合的序列以及一段6个到25个不等的N(N中的胞嘧啶可以使用甲基化修饰的胞嘧啶)组成的随机序列以及通用PCR引物结合序列,其中测序引物序列和通用PCR引物序列可以适配DNBSEQ平台或illumina平台或其它任何测序平台,这一部分为双链结构,而随机序列部分为单链结构。
在另一个实施例中,对完成末端修复加A的DNA片段标记标签,标签中包括与测序引物结合的序列以及一段6个到25个不等的N(N中的胞嘧啶可以使用甲基化修饰的胞嘧啶)组成的随机序列,其中测序引物序列可以适配DNBSEQ平台或illumina平台或其它任何测序平台,这一部分为双链结构,而随机序列部分为单链结构。
在一个实施例中,接头连接完成后,使用具有链置换能力的DNA聚合酶进行链置换,反应体系中使用甲基化修饰的胞嘧啶脱氧核糖核苷三磷酸(5mdCTP)代替dCTP,使得置换后的复制链中的C都是甲基化修饰的5mC。置换完成后会原本的双链DNA会变成2条双链DNA,每条DNA双链链都是有原本的DNA链(包含甲基化和非甲基化修饰的C)和完全被甲基化修饰C替换原有C的DNA链组成,并且这2 条单链具有相同的标签序列。
在一个实施例中,对置换产生的DNA双链进行重亚硫酸盐转化。对于生成的DNA链来说,DNA双链中原始DNA链包含未甲基化C和甲基化C的链,在重亚硫酸盐转化后,甲基化的C不发生变化,未甲基化的C会转化为U,整体序列发生改变。DNA双链中的复制链,由于都是甲基化的C,所以都不会发生转化,整体序列不发生改变,与原始序列一致。
在一个实施例中,对完成重亚硫酸盐转化反应产物,进行PCR反应。PCR反应后,原有的DNA双链会生成2组DNA文库,每组DNA文库都是包含相同标序列的2个DNA文库,1个是原始序列一致的DNA文库,1个是转化后的文库。对于illumina测序平台,至此已完成建库。对于DNBSEQ测序平台,则继续进行后续建库操作。
在一个实施例中,对完成重亚硫酸盐转化反应产物,进行延伸反应。延伸反应后,原有的DNA双链会生成2组DNA文库,每组DNA文库都是包含相同标序列的2个DNA文库,1个是原始序列一致的DNA文库,1个是转化后的文库。对于illumina测序平台,至此已完成建库。对于DNBSEQ测序平台,则继续进行后续建库操作。
在一个实施例中,,对PCR产物进行单链环化得到单链环状文库,进一步进行滚环扩增反应,完成DNB的制备
在一个实施例中,对延伸产物进行单链环化得到单链环状文库,进一步进行滚环扩增反应,完成DNB的制备。
在一个实施例中,对PCR反应产物或延伸反应产物加载到测序芯片之后再进行桥式扩增反应。
在一个实施例中,完成文库构建后,可以使用DNBSEQ测序平台或illumina测序平台对文库进行测序。
在一个实施例中,对测序数据进行分析与控制,之后识别reads(read1或read2)中的标签序列,带相同的标签序列的reads作为一组,再使用常用甲基化分析软件对测序数据进行比对分析。
在一个实施例中,使用软件对数据比对完成之后,对没有比对上基因组上的reads或比对基因组上多个位置的reads进行重新比对,既通过标签序列的组别信息,将带有相同标签信息的reads进行对应,由于其中是没有转化的reads,所以比对的准确性和比对率会更高,通过这样的一一对应,将无法比对和多重比对重新准确定位到基因组上。
在一个实施例中,完成上一步借助标签序列的定位后,对进一步比对完成的数据进行后续常规的甲基化分析。
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。
实施例1、人细胞系DNA全基因组甲基化文库构建与测序
一、实验材料
NA12878人细胞系DNA标准品(Coriell Institute,NA12878)。
二、实验步骤
1、准备500ng DNA到0.2mL PCR管中,并置于冰盒上,并加入25ng的Unmodified CpG-methylatedλ-DNA(Promega,D1521)。
2、使用NF Water补足体积到45μL,将PCR管置于冰盒上。
3、取出Frag Enzyme(YEASEN,12907ES96),轻轻颠倒混匀10次,瞬时离心后置于冰上待用。
4、按表1在冰上配制打断反应液。
表1、打断反应液
组分 单个反应体积
Frag Buffer 10μL
Frag Enzyme 5μL
总体积 15μL
5、用移液器吸取15μL配制好的打断反应液加入PCR管中,涡旋震荡3次,每次3s,瞬时离心将反应液收集至管底。
6、当PCR仪温度降至4℃,将PCR管置于PCR仪上,按照表2中的条件进行反应。
表2、打断反应条件
温度 时间
105℃热盖 On
4℃ 1min
30℃ 15min
72℃ 10min
4℃ Hold
7、瞬时离心将反应液收集至管底,全部液体转移到新的1.5mL离心管中,补TE到100μL。
8、提前取出DNA Clean Beads(为度,CNGS-R-0.5L),置于室温平衡至少30min,使用前充分震荡混匀。
9、用移液器吸取70μL DNA Clean Beads到新的1.5mL离心管中,并轻轻吹打至少10次至完全混匀,最后一次应确保将吸头中所有液体及磁珠都打入离心管中。
10、室温孵育10min,然后短暂离心后,将离心管置于磁力架上,静置2-5min,至液体澄清,用移液器小心吸取上清到新的1.5mL离心管中。
11、用移液器吸取20μL DNA Clean Beads到新的1.5mL离心管中,并 轻轻吹打至少10次至完全混匀,最后一次应确保将吸头中所有液体及磁珠都打入离心管中。
12、保持离心管置于磁力架上,加入200μL新鲜配制的80%乙醇,漂洗磁珠及管壁,静置30s,小心吸取并丢弃上清。
13、重复步骤12,尽量吸干管内液体,有少量残留在管壁时可将离心管瞬时离心,在磁力架上分离后,用小量程的移液器将管底液体吸干。
14、保持离心管固定于磁力架上,打开离心管管盖,室温干燥,直至磁珠表面无反光。
15、将离心管从磁力架上取下,加入32μL TE Buffer洗脱DNA,用移液器轻轻吸打至少10次至完全混匀。
16、室温下孵育5min,然后瞬时离心,将离心管置于磁力架上,静置2-5min至液体澄清,将30μL上清液转移到新的0.2mL PCR管中。
17、使用MGIEsay全基因组甲基化文库制备试剂盒(MGI,1000005251)进行,根据所需反应数,按照表3配方在冰上配制末端修复反应液。
表3、末端修复反应液
组分 单个反应体积
ER Buffer Mix 7.3μL
ER Enzyme Mix 2.7μL
总体积 10μL
18、用移液器吸取10μL配制好的末端修复反应液加入PCR管中,涡旋振荡3次,每次3s,瞬时离心将反应液收集至管底。
19、将PCR管置于PCR仪上,按照表4中的条件进行反应。
表4、末端修复反应条件(反应体系40μL)
温度 时间
65℃热盖 On
25℃ 30min
4℃ Hold
20、反应结束后,瞬时离心将反应液收集至管底。
21、用移液器吸取6μL ER Stop Buffer(来自MGIEsay全基因组甲基化文库制备试剂盒(MGI,1000005251))加入0.2mL PCR管中,涡旋震荡3次,每次3s,瞬时离心将反应液收集至管底,静置2分钟。
22、将上述0.2mL PCR管置于提前预热至75℃的PCR仪上反应20min终止反应。
23、反应结束后,瞬时离心将反应液收集至管底。
24、使用MGIEsay全基因组甲基化文库制备试剂盒(MGI,1000005251)中试剂,在冰上配制表5中的末端修复AT反应液。
表5、末端修复AT反应液
组分 单个反应体积
AT Buffer Mix 3.8μL
AT Enzyme Mix 0.2μL
总体积 4μL
25、用移液器吸取4μL配制好的末端修复AT反应液加入PCR管中,涡旋振荡3次,每次3s,瞬时离心将反应液收集至管底。
26、将PCR管置于PCR仪上,按照表6中的条件进行反应。
表6、AT反应条件(反应体系50μL)
温度 时间
65℃热盖 On
25℃ 30min
4℃ Hold
27、反应结束后,瞬时离心将反应液收集至管底。
28、向PCR管中加入5μL对应的甲基化DNA Adapter,涡旋振荡3次,每次3s,瞬时离心将反应液收集至管底。
其中,甲基化DNA Adapter为DNBSEQ平台的接头。具体为由如下三条DNA单链退火后形成:
A:TGTGAGCCAAGGAGTT(SEQ ID No.1);
B:GAACGACATGGCTACGATCCGACTT(SEQ ID No.2);
C:/5phos/CAGTCGGAGGCCAAGCGGTCTTAGGAAGACAANNNNNNNNNNCAACTCCTTGGCTCACA(SEQ ID No.3)。其中,N为A或T或mC或G,mC为甲基化修饰的胞嘧啶。
上述三条链中的C均为mC(即甲基化修饰的胞嘧啶)。
29、使用MGIEsay全基因组甲基化文库制备试剂盒(MGI,1000005251)中的试剂,根据所需反应数,按照表7配方在冰上配制接头连接反应液。
表7、接头连接反应液
组分 单个反应体积
Ligation Buffer 23.4μL
DNA Ligase 1.6μL
总体积 25μL
30、用移液器缓慢吸取25μL配制好的接头连接反应液加入PCR管中,涡旋振荡6次,每次3s,瞬时离心将反应液收集至管底。
31、将上述PCR管置于PCR仪上,按照表8中的条件进行反应。
表8、接头连接反应条件(反应体系80μL)
温度 时间
25℃热盖 On
23℃ 30min
4℃ Hold
32、反应结束后,瞬时离心将反应液收集至管底。全部转移到新的1.5mL离心管中。
33、提前取出DNA Clean Beads,置于室温平衡至少30min,使用前充分震荡混匀。吸取40μL DNA Clean Beads至上一步的新的1.5mL离心管中,用移液器轻轻吹打至少10次至所有磁珠悬浮,最后一次应确保将吸头中所有液体及磁珠都打入离心管中。
34、室温孵育10min。
35、将离心管瞬时离心,置于磁力架上,静置2-5min至液体澄清,用移液器小心吸取上清并丢弃。
36、保持离心管置于磁力架上,加入200μL新鲜配制的80%乙醇漂洗磁珠及管壁,静置30s后小心吸取上清并丢弃。
37、重复上一步,尽量吸干管内液体,有少量残留在管壁时可将离心管瞬时离心,在磁力架上分离后,用小量程的移液器将管底液体吸干。
38、保持离心管置于磁力架上,打开离心管管盖,室温干燥,直至磁珠表面无反光。
39、将离心管从磁力架上取下,加入22μL TE Buffer进行DNA洗脱,用移液器轻轻吹打至少10次至所有磁珠悬浮。
40、室温下孵育10min。
41、将离心管瞬时离心,置于磁力架上,静置2-5min至液体澄清,用移液器吸取20μL上清液转移到新的1.5mL离心管中。
42、使用MGIEasy单细胞全基因组扩增试剂盒(MGI,1000007744)中的试剂,根据所需反应数,按照表9配方在冰上配制链置换反应液。
表9、链置换反应液
组分 单个反应体积
Phi29 reaction Buffer 29μL
Phi29 DNA polymerase 1μL
总体积 30μL
43、用移液器吸取30μL配制好的链置换反应液加入PCR管中,涡旋振荡3次,每次3s,瞬时离心将反应液收集至管底。
44、将PCR管置于PCR仪上,按照表10中的条件进行反应。
表10、链置换反应条件
温度 时间
75℃热盖 On
30℃ 30min
65℃ 5min
4℃ Hold
45、反应结束后,瞬时离心将反应液收集至管底。全部转移到新的1.5mL离心管中。
46、提前取出DNA Clean Beads,置于室温平衡至少30min,使用前充分震荡混匀。吸取60μL DNA Clean Beads至上一步新的1.5mL离心管中,用移液器轻轻吹打至少10次至所有磁珠悬浮,最后一次应确保将吸头中所有液体及磁珠都打入离心管中。
47、室温孵育10min。
48、将离心管瞬时离心,置于磁力架上,静置2-5min至液体澄清,用移液器小心吸取上清并丢弃。
49、保持离心管置于磁力架上,加入200μL新鲜配制的80%乙醇漂洗磁珠及管壁,静置30s后小心吸取上清并丢弃。
50、重复上一步,尽量吸干管内液体,有少量残留在管壁时可将离心管瞬时离心,在磁力架上分离后,用小量程的移液器将管底液体吸干。
51、保持离心管置于磁力架上,打开离心管管盖,室温干燥,直至磁珠表面无反光。
52、将离心管从磁力架上取下,加入22μL TE Buffer进行DNA洗脱,用移液器轻轻吹打至少10次至所有磁珠悬浮。
53、室温下孵育10min。
54、将离心管瞬时离心,置于磁力架上,静置2-5min至液体澄清,用移液器吸取20μL上清液转移到新的1.5mL离心管中。
55、将离心管瞬时离心,置于磁力架上,静置2-5min至液体澄清,用移液器吸取19μL上清液转移到新的0.2mL PCR管中。
56、使用EZ DNA Methylation-Gold Kit(Zymo Research,Cat.No.D5005/D5006)对接头连接产物进行Bisulfite处理和纯化。
57、依次吸取900μL NF water,300μL M-Dilution Buffer和50μL M-Dissolving Buffer到一管CT Conversion Reagent粉末(开盖前需瞬时离心),在室温下频繁涡旋震荡10min,完成CT Conversion Reagent的配制。CT Conversion Reagent应减少曝光,最好现配现用。CT Conversion Reagent在室温下可最多保存1天,在4℃下可最多保存1周,在-20℃下可最多保存1个月,非现配的CT Conversion Reagent使用前应预热到37℃,在室温下频繁涡旋震荡10min方可使用。
58、M-Wash Buffer第一次开盖使用前需按照瓶子标签所示加入正确体积的无水乙醇,混匀方可使用。在室温下,将表11中所示成分加入新的0.2mL PCR管中,其中Lambda DNA不需打断,浓度为200ng/μL。
表11、BS转化反应体系
组分 单个反应体积
CT Conversion Reagent 130μL
连接后纯化产物 19μL
Lambda DNA 1μL
Total 150μL
59、将0.2mL PCR管置于PCR仪上,按照表12所示Bisulfite处理条件进行反应。
表12、Bisulfite处理条件
温度 时间
热盖 On
98℃ 10min
64℃ 2.5h
4℃ Hold
60、将反应产物转移到新的1.5mL离心管中,加入600μL M-Binding Buffer,涡旋震荡6次,每次3s,瞬时离心将反应液收集至管底。
61、把Zymo-Spin IC Column放入2mL Collection Tube,将混合液转移至Zymo-Spin IC Column上,13000rpm离心30s,弃废液,将Zymo-Spin IC Column放回Collection Tube。
62、向Zymo-Spin IC Column加入100μL M-Wash Buffer,13000rpm离心30s。
63、向Zymo-Spin IC Column加入200μL M-Desulphonation Buffer,迅速盖紧管盖后,室温孵育15-20min,13000rpm离心30s,弃废液,将Zymo-Spin IC Column放回Collection Tube。
64、向Zymo-Spin IC Column加入200μL M-Wash Buffer,13000rpm离心30s,弃废液,将Zymo-Spin IC Column放回Collection Tube。
65、向Zymo-Spin IC Column加入200μL M-Wash Buffer,13000rpm离心30s,弃废液,将Zymo-Spin IC Column放回Collection Tube。13000rpm空转离心30s,弃Collection Tube,用移液器将Zymo-Spin IC Column外壁液体尽量吸干,放在新的1.5mL离心管中。
66、打开Zymo-Spin IC Column管盖,室温干燥2min,然后将Zymo-Spin IC Column放在另一新的1.5mL离心管中。
67、缓慢在Zymo-Spin IC Column滤膜中央加入10μL M-Elution Buffer,静置1min,13000rpm离心30s,纯化后的Bisulfite处理后的纯化产物即被 收集在1.5mL离心管中。
68、取全部Bisulfite处理和纯化后产物于新0.2mL PCR管中,加入分子级水将总体积补至20μL。
69、使用来自MGIEasy单细胞全基因组扩增试剂盒(MGI,1000007744)中的PCR试剂,在冰上配制表13所示PCR反应液。
表13、PCR反应液
组分 单个反应体积
WGBS PCR Enzyme Mix 25μL
PCR Primer Mix 5μL
Total 30μL
其中,PCR Primer Mix如下:
A:/5Phos/GAACGACATGGCTACGA(SEQ ID No.4);
B:TGTGAGCCAAGGAGTTG(SEQ ID No.5)。
70、用移液器吸取30μL配制好的PCR反应液加入步骤68的0.2mL PCR管中,涡旋震荡3次,每次3s,瞬时离心将反应液收集至管底。
71、用移液器吸取30μL配制好的PCR反应液加入装有Bisulfite处理和纯化后产物PCR管中,涡旋振荡3次,每次3s,瞬时离心将反应液收集至管底。
72、将PCR管置于PCR仪上,按照表14的条件进行PCR反应。
表14、PCR反应条件
Figure PCTCN2021130644-appb-000001
73、反应结束后,瞬时离心将反应液收集至管底,加入50μL TE Buffer至总体系100μL,全部转移到新的1.5mL离心管中。
74、吸取60μL DNA Clean Beads至的1.5mL离心管中,用移液器轻轻吹打至少10次至所有磁珠悬浮,最后一次应确保将吸头中所有液体及磁珠都打入离心管中。
75、室温孵育5min,然后短暂离心后,将离心管置于磁力架上,静置2-5min,至液体澄清,用移液器小心吸取上清并弃掉。
76、保持离心管置于磁力架上,加入200μL新鲜配制的80%乙醇漂洗磁珠及管壁,静置30s后小心吸取上清并丢弃。
77、重复上一步,尽量吸干管内液体,有少量残留在管壁时可将离心管瞬 时离心,在磁力架上分离后,用小量程的移液器将管底液体吸干。
78、保持离心管置于磁力架上,打开离心管管盖,室温干燥,直至磁珠表面无反光。
79、将离心管从磁力架上取下,加入32μL TE Buffer进行DNA洗脱,用移液器轻轻吹打至少10次至完全混匀。
80、室温下孵育5min。
81、将离心管瞬时离心,置于磁力架上,静置2-5min至液体澄清,用移液器吸取30μL上清液转移到新的1.5mL离心管中。
82、使用
Figure PCTCN2021130644-appb-000002
dsDNA HS Assay Kit(Invitrogen,Q32854)对PCR产物进行定量,取360ngPCR产物至新的0.2mL PCR管中,用TE Buffer补充至总体积48μL。
83、将PCR管置于PCR仪上,按照表15的条件进行变性反应。
表15、变性反应条件
温度 时间
105℃热盖 On
95℃ 3min
84、反应结束后,立即将PCR管置于冰上,静置2min后,加入单链环化反应液。
85、使用MGIEasy环化试剂盒(MGI,1000005259)中的试剂,根据反应数,按照表16的配方在冰上配制单链环化反应液。
表16、单链环化反应液
组分 单个反应体积
Splint Buffer 11.6μL
DNA Rapid Ligase 0.5μL
总体积 12.1μL
86、用移液器吸取12.1μL配制好的单链环化反应液加入PCR管中,涡旋振荡3次,每次3s,瞬时离心将反应液收集至管底。
87、将PCR管置于PCR仪上,按照表17的条件进行反应。
表17、单链环化反应条件
温度 时间
75℃热盖 On
37℃ 30min
4℃ Hold
88、反应结束后,将PCR管瞬时离心并置于冰上,立即进入下步反应。
89、提前按照表18的配方在冰上配制酶切消化反应液。
表18、酶切消化反应液
组分 单个反应体积
Digestion Buffer 1.4μL
Digestion Enzyme 2.6μL
总体积 4μL
其中,Digestion Buffer和Digestion Enzyme均来自MGIEasy环化试剂盒(MGI,1000005259)。
90、用移液器吸取4μL配制好的酶切消化反应液加入PCR管中,涡旋振荡3次,每次3s,瞬时离心将反应液收集至管底。
91、将PCR管置于PCR仪上,按照表19的条件进行反应。
表19、酶切消化反应条件
温度 时间
75℃热盖 On
37℃ 30min
4℃ Hold
92、反应结束后,瞬时离心将反应液收集至管底。
93、立即向PCR管中加入7.5μL Digestion Stop Buffer(来自MGIEasy环化试剂盒(MGI,1000005259)),涡旋振荡3次,每次3s,瞬时离心将反应液收集至管底,吸取全部反应液转移到新的1.5mL离心管中。
94、提前取出DNA Clean Beads,置于室温平衡至少30min,使用前充分震荡混匀。吸取170μL DNA Clean Beads至酶切消化产物中,用移液器轻轻吹打至少10次至所有磁珠悬浮,最后一次应确保将吸头中所有液体及磁珠都打入离心管中。
95、室温孵育10min。
96、将离心管瞬时离心,置于磁力架上,静置2-5min至液体澄清,用移液器小心吸取上清并丢弃。
97、保持离心管置于磁力架上,加入200μL新鲜配制的80%乙醇漂洗磁珠及管壁,静置30s后小心吸取上清并丢弃。
98、重复上一步,尽量吸干管内液体,有少量残留在管壁时可将离心管瞬时离心,在磁力架上分离后,用小量程的移液器将管底液体吸干。
99、保持离心管置于磁力架上,打开离心管管盖,室温干燥,直至磁珠表面无反光。
100、将离心管从磁力架上取下,加入22μL TE Buffer进行DNA洗脱,用移液器轻轻吹打至少10次至所有磁珠悬浮。
101、室温下孵育10min。
102、将离心管瞬时离心,置于磁力架上,静置2-5min至液体澄清,用移液器吸取20μL上清液转移到新的1.5mL离心管中。
103、使用
Figure PCTCN2021130644-appb-000003
ssDNA Assay Kit荧光定量试剂盒(Invitrogen,Q10212),按照定量试剂盒的操作说明对酶切消化纯化后产物进行定量。
104、使用MGISEQ-2000测序仪进行PE100的双端测序,使用MGISEQ-2000高通量测序试剂套装(PE100)(MGI,货号1000012536),按照说明书指导进行DNB制作和测序。
105、使用常用的甲基化分析软件Bismark对测序数据进行质控,比对,第一次比对完成之后,对没有比对上基因组上的reads或比对基因组上多个位置的reads进行重新比对,既通过标签序列的组别信息,将带有相同标签信息的reads进行对应,由于其中是没有转化的reads,所以比对的准确性和比对率会更高,通过这样的一一对应,将无法比对和多重比对重新准确定位到基因组上。完成比对后,再使用Bismark分析软件对样本DNA的基因组甲基化水平的分析。
三、实验结果
1、建库结果
如表20所示。可见:链置换后文库产量与PCR文库产量都符合预期,单链环DNA文库产量和DNB浓度也都满足测序要求。
表20、建库结果
Figure PCTCN2021130644-appb-000004
2、测序与分析结果
一半的reads没有进行转化,碱基的复杂度会比WGBS更好,C碱基的占比会是T碱基的1/3左右。参见图4和表21。可见:本发明的方法在碱基复杂度上要比传统WGBS好,C碱基的占比是8%左右;测序数据的比对率和唯一比对率都超过了90%,20x覆盖度都超过80%,这些指标都优于传统甲基化方法。
表21、结果分析
Figure PCTCN2021130644-appb-000005
Figure PCTCN2021130644-appb-000006
工业应用
本发明是依靠标签序列标记和链置换的方法,使得文库中同时存在被标签序列相互关联的原始序列文库和BS转化后文库,测序后再利用唯一的标签序列和原始序列实现对BS转化后序列的定位。与传统的WGBS相比,由于存在一半的文库是没有转化后的文库,大大提升了文库的复杂度,从而提高测序数据质量。另一方面,通过唯一的标签序列和原始序列对BS转化后序列的定位功能后,大大提高了序列的比对率和比对准确性,提高了甲基化检测的准确性,从而提高全基因组范围甲基化检测的灵敏度,还降低了全基因组甲基化测序的成本。与导航定位测序GPS相比的话,不需要对酶反应实现精确控制,不会出现建库不稳定的问题。另外可以确保reads都是完整的原始DNA序列和转化后的序列,不会出现甲基化率检测偏差。

Claims (20)

  1. 一种甲基化建库方法,包括如下步骤:依靠标签序列标记和链置换的方法,使得文库中同时存在被所述标签序列相互关联的原始序列文库和经重亚硫酸盐转化后文库,最后利用相同的所述标签序列和原始序列实现对经重亚硫酸盐转化序列的定位或鉴定。
  2. 根据权利要求1所述的方法,其特征在于:所述方法包括如下步骤:
    先利用所述标签序列对待测双链DNA分子进行标记;
    再利用具有链置换能力的聚合酶和甲基化修饰的胞嘧啶脱氧核糖核苷三磷酸进行链置换,得到中间双链DNA分子;所述中间双链DNA分子中的置换链上所有C碱基均被甲基化修饰,另一条模板链上的所有C碱基均为原始状态;
  3. 根据根据权利要求2所述的方法,其特征在于:所述方法还包括如下步骤:
    将所述中间双链DNA分子经过重亚硫酸盐转化,得到终端双链DNA分子;所述终端双链DNA分子中的一条链与原始序列一致,记为片段A,另一条是转化后序列,记为片段B。
  4. 根据权利要求1-3中任一所述方法,其特征在于:所述方法还包括文库序列测定的步骤,然后通过相同的所述标签序列确定reads分组,依靠所述片段A对同组所述片段B进行定位,确定其在基因组上的位置。
  5. 根据权利要求1-4中任一所述的方法,其特征在于:所述方法包括如下步骤:
    (A)将待测基因组DNA打断后进行末端修复;或者,将待测片段化DNA直接进行末端修复;
    (B)对完成末端修复的DNA片段进行标签标记;
    (C)使用聚合酶和5mdCTP对经过标签标记的DNA片段进行链置换反应;
    (D)对链置换后产生的DNA双链进行重亚硫酸盐转化;
    (E)对重亚硫酸盐转化后的DNA进行PCR或延伸反应,完成C到T的转化和建库;
    (F)测序以及数据分析。
  6. 根据权利要求5所述的方法,其特征在于:步骤(A)中,所述片段化DNA包括胞外游离DNA或发生降解的DNA。
  7. 根据权利要求5所述的方法,其特征在于:步骤(B)中,通过接头连接反应进行所述标签标记。
  8. 根据权利要求5所述的方法,其特征在于:步骤(B)中,所述接头包括通用引物结合序列和由3-25个N组成的随机序列;其中,所述通用引物结合序列中的胞嘧啶为甲基化修饰的胞嘧啶;N为A或T或mC或G,mC为甲基化修饰的胞嘧啶。
  9. 根据权利要求7所述的方法,其特征在于:步骤(B)中,所述接头包括通用引物结合序列、由6-25个N组成的随机序列,以及与测序引物结合的序列;其中,所述通用引物结合序列中的胞嘧啶为甲基化修饰的胞嘧啶;N为A或T或mC或G,mC为甲基化修饰的胞嘧啶;所述与测序引物结合的序列中的胞嘧啶为甲基化修饰的胞嘧啶。
  10. 根据权利要求9所述的方法,其特征在于:在所述接头中,所述通用引物结合序列和所述与测序引物结合的序列,这两部分为双链结构;所述随机序列部分为单链结构。
  11. 根据权利要求5-10中任一所述的方法,进一步包括甲基化位点鉴定步骤,其特征在于:步骤(F)中,是按照包括如下步骤的方法进行所述数据分析的:
    (F1)识别reads中的标签序列,带相同标签序列的reads为一组;
    (F2)使用甲基化分析软件对测序数据进行比对分析;
    (F3)经(F2)比对后,对没有比对到基因组上的reads或比对到基因组上多个位置的reads进行重新比对,即通过依据(F1)的分组信息,将带有相同标签的reads进行一一对应和重新定位;
    (F4)对完成(F3)后的数据进行甲基化分析。
  12. 一种用于甲基化建库的试剂盒,包括含有标签序列的接头、具有链置换功能的聚合酶、5mdCTP。
  13. 根据权利要求12所述的试剂盒,其特征在于:所述接头包括通用引物结合序列和由3-25个N组成的随机序列;其中,所述通用引物结合序列中的胞嘧啶为甲基化修饰的胞嘧啶;N为A或T或mC或G,mC为甲基化修饰的胞嘧啶。
  14. 根据权利要求12所述的试剂盒,其特征在于:所述接头包括通用引物结合序列、由6-25个N组成的随机序列,以及与测序引物结合的序列;其中,所述通用引物结合序列中的胞嘧啶为甲基化修饰的胞嘧啶;N为A或T或mC或G,mC为甲基化修饰的胞嘧啶;所述与测序引物结合的序列中的胞嘧啶为甲基化修饰的胞嘧啶。
  15. 根据权利要求14所述试剂盒,其特征在于:在所述接头中,所述通用引物结合序列和所述与测序引物结合的序列,这两部分为双链结构;所述随机序列部分为单链结构。
  16. 权利要求12-15中任一所述试剂盒在基因组甲基化建库测序中的应用。
  17. 权利要求1-11中任一所述方法在目标区域甲基化检测中的应用。
  18. 权利要求1-11中任一所述方法在肿瘤早筛和/或液体活检中的应用。
  19. 一种肿瘤早筛的方法,包括利用权利要求1-11中任一所述方法对待测样本进行基因组甲基化建库测序的步骤。
  20. 一种液体活检的方法,包括利用权利要求1-11中任一所述方法对待测样本进行基因组甲基化建库测序的步骤。
PCT/CN2021/130644 2021-11-15 2021-11-15 一种基于标签序列和链置换的全基因组甲基建库测序方法 WO2023082251A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2021/130644 WO2023082251A1 (zh) 2021-11-15 2021-11-15 一种基于标签序列和链置换的全基因组甲基建库测序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2021/130644 WO2023082251A1 (zh) 2021-11-15 2021-11-15 一种基于标签序列和链置换的全基因组甲基建库测序方法

Publications (1)

Publication Number Publication Date
WO2023082251A1 true WO2023082251A1 (zh) 2023-05-19

Family

ID=86334942

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2021/130644 WO2023082251A1 (zh) 2021-11-15 2021-11-15 一种基于标签序列和链置换的全基因组甲基建库测序方法

Country Status (1)

Country Link
WO (1) WO2023082251A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011132798A1 (ja) * 2010-04-21 2011-10-27 国立大学法人鹿児島大学 新規なdnaメチル化解析方法
CN104250663A (zh) * 2013-06-27 2014-12-31 北京大学 甲基化CpG岛的高通量测序检测方法
CN110195095A (zh) * 2018-02-27 2019-09-03 上海鲸舟基因科技有限公司 一种新的基因组甲基化文库的构建方法和应用
CN111074353A (zh) * 2018-10-18 2020-04-28 深圳华大智造科技有限公司 全基因组甲基化文库单链建库方法和得到的全基因组甲基化文库
WO2020135347A1 (zh) * 2018-12-29 2020-07-02 深圳华大生命科学研究院 一种dna甲基化检测的方法、试剂盒、装置和应用

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011132798A1 (ja) * 2010-04-21 2011-10-27 国立大学法人鹿児島大学 新規なdnaメチル化解析方法
CN104250663A (zh) * 2013-06-27 2014-12-31 北京大学 甲基化CpG岛的高通量测序检测方法
CN110195095A (zh) * 2018-02-27 2019-09-03 上海鲸舟基因科技有限公司 一种新的基因组甲基化文库的构建方法和应用
CN111074353A (zh) * 2018-10-18 2020-04-28 深圳华大智造科技有限公司 全基因组甲基化文库单链建库方法和得到的全基因组甲基化文库
WO2020135347A1 (zh) * 2018-12-29 2020-07-02 深圳华大生命科学研究院 一种dna甲基化检测的方法、试剂盒、装置和应用
CN113166809A (zh) * 2018-12-29 2021-07-23 深圳华大生命科学研究院 一种dna甲基化检测的方法、试剂盒、装置和应用

Similar Documents

Publication Publication Date Title
Kim et al. Deep sequencing reveals distinct patterns of DNA methylation in prostate cancer
US20220033890A1 (en) Method for highly sensitive dna methylation analysis
EP3524688B1 (en) Multiple detection method of methylated dna
US7608402B2 (en) DNA methylation specific signal amplification
Lee et al. Improved reduced representation bisulfite sequencing for epigenomic profiling of clinical samples
JP2001525181A (ja) 複合dnaメチル化フィンガープリントの調製方法
US20150259743A1 (en) Methods of assessing epigenetic regulation of genome function via dna methylation status and systems and kits therefor
US20160108476A1 (en) Colorectal cancer markers
TWI664293B (zh) 用於檢測肝癌的基因標誌物及其用途
US20220056519A1 (en) Method and system for constructing sequencing library on the basis of methylated dna target region, and use thereof
CN110760936A (zh) 构建dna甲基化文库的方法及其应用
TWI694152B (zh) 用於檢測肝癌的基因標誌物及其用途
TWI667480B (zh) Gene marker, reagent group and detection method for detecting benign and malignant liver tumors
WO2023082251A1 (zh) 一种基于标签序列和链置换的全基因组甲基建库测序方法
US20220364173A1 (en) Methods and systems for detection of nucleic acid modifications
Murgatroyd Laboratory techniques in psychiatric epigenetics
CN118234874A (zh) 一种基于标签序列和链置换的全基因组甲基建库测序方法
WO2022232795A1 (en) Compositions and methods related to modification and detection of pseudouridine and 5-hydroxymethylcytosine
TURAN 2. INTERNATIONAL PARIS CONGRESS ON AGRICULTURE & ANIMAL HUSBANDRY
JP2024035110A (ja) 変異核酸の正確な並行定量するための高感度方法
CN114634982A (zh) 一种检测多核苷酸变异的方法
TW202405188A (zh) 用於測定核酸是否甲基化的組成物以及用於測定核酸是否甲基化的方法
US20210079481A1 (en) Diagnostic assay for cancer
Amouroux et al. Current technological advances in mapping new DNA modifications
CN112714796A (zh) 扩增经亚硫酸氢盐处理的dna的方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21963697

Country of ref document: EP

Kind code of ref document: A1