WO2013064066A1 - 全基因组甲基化高通量测序文库的构建方法及其应用 - Google Patents
全基因组甲基化高通量测序文库的构建方法及其应用 Download PDFInfo
- Publication number
- WO2013064066A1 WO2013064066A1 PCT/CN2012/083821 CN2012083821W WO2013064066A1 WO 2013064066 A1 WO2013064066 A1 WO 2013064066A1 CN 2012083821 W CN2012083821 W CN 2012083821W WO 2013064066 A1 WO2013064066 A1 WO 2013064066A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- methylation
- dna
- fragment
- sequencing
- genomic dna
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
Definitions
- the invention relates to the field of biotechnology. Specifically, it relates to genome-wide methylation detection technology, especially in the field of micro-DNA genome-wide methylation detection technology. More specifically, the present invention provides a method of constructing a genome-wide methylation high-throughput sequencing library, a method for determining a methylation site of a DNA sample, and a method for determining a genomic DNA sample. A site for site-based sites, a set of isolated restriction enzymes, and a kit for constructing a genome-wide methylation high-throughput sequencing library.
- DNA methylation is the most in-depth epigenetic mechanism in research. DNA methylation maintains normal cell function, inhibits parasitic DNA components from damage to genomic integrity, staining shield structure modification, X chromosome inactivation, genomic imprinting, and embryos. It plays an important role in development and human tumorigenesis and is one of the new research hotspots.
- DMRs differentially methylated regions
- T-DMR tissue-specific differentially methylated regions
- C-DMR differentially methylated regions in cancer
- the present invention is directed to solving at least one of the problems of the prior art.
- the present invention provides a method for constructing a whole genome methylation high-throughput sequencing library and its application .
- the invention provides a method of constructing a whole genome methylated high throughput sequencing library.
- the method comprises the steps of: digesting the genomic DNA with Msp I and a second restriction enzyme to obtain a DNA fragment, wherein the second restriction enzyme is selected from the group consisting of fotN I, HpyCm V, Alu l, Hae IIL HpyCH4 Apek L Ban IL Taqa L Sph l. Bgl ll.
- BssS L BamlU and Kpn l At least one of; the DNA fragment is end-repaired to obtain a DNA fragment that has undergone end repair; A is added to the 3' end of the end-repaired DNA fragment to obtain a DNA fragment having a sticky end A; The DNA fragment having a sticky end A is linked to a methylation linker to obtain a ligation product having a methylated linker; the ligation product having the methylated linker is subjected to fragment selection to obtain a fragment of interest; The target fragment is subjected to bisulfite treatment to convert the unmethylated cytosine of the target fragment into uracil to obtain a converted target fragment; the transformed target fragment is subjected to PCR amplification to obtain Amplifying the product; and isolating and purifying the amplification product, the amplification product comprising a whole genome methylation high throughput sequencing library.
- the method for constructing a whole genome methylation high-throughput sequencing library can efficiently construct a genome-wide methylation high-throughput sequencing library of genomic DNA samples, in particular, capable of efficiently constructing a micro sample.
- the genomic methylation high-throughput sequencing library can be effectively and fully applied to high-throughput sequencing technology, and the whole genome methylation position can be effectively obtained by sequencing the library and then analyzing the data based on the sequencing results. Point information to achieve a genome-wide methylation test of genomic DNA samples.
- the invention provides a method of determining a methylation site of a genomic DNA sample.
- the method comprises the steps of: #4 constructing a whole genome methylation high-throughput sequencing library as described above, constructing a genome-wide methylation high-throughput sequencing of genomic DNA samples; The whole genome methylation high-throughput sequencing library is sequenced for sequencing results; and the sequencing results are analyzed to determine the methylation site of the genomic DNA sample.
- the method for determining the methylation site of a genomic DNA sample can accurately determine the methylation site of the genomic DNA sample, thereby realizing the whole genome methylation detection of the genomic DNA sample, as opposed to The current RRBS technique, the method for determining the methylation site of a genomic DNA sample of the present invention, significantly increases the coverage of the genome-wide regulatory region, and significantly increases the coverage of the CpG site in the regulatory region.
- the present invention provides an apparatus for determining a methylation site of a genomic DNA sample.
- the apparatus comprises: a library preparation unit for preparing a whole genome methylation high-throughput sequencing library of a genomic DNA sample, wherein the library preparation unit is provided with Msp I
- the enzyme and the second restriction endonuclease, wherein the second restriction enzyme is selected from the group consisting of Bsm I, HpyCm V, Alu I, Hae ⁇ , HpyCm IL Apek l.
- B m JL TaqaA, Sph l B m JL TaqaA, Sph l.
- a sequencing unit the sequencing unit is ligated to the library preparation unit, and the whole genome methylation Qualcomm of the genomic DNA sample is received from the library preparation unit a sequencing library for sequencing a whole genome methylation high-throughput sequencing library of the genomic DNA sample to obtain sequencing results; and a data analysis unit, the data analysis unit being coupled to the sequencing unit, and The sequencing unit receives the sequencing result to perform data analysis on the sequencing result to determine a methylation site of the genomic DNA sample.
- a device for methylation of DNA samples which can easily and accurately determine the methylation site of genomic DNA samples, and can be applied to a variety of studies on whole-genome methylation, for example, can be used for tumor gene suppression in humans. Detection of abnormal methylation of genes to provide an effective pathway for early diagnosis of human disease.
- the invention provides a set of isolated restriction enzymes.
- a set of isolated restriction enzymes which is composed of an Msp I enzyme and a second restriction endonuclease, wherein the second restriction enzyme is selected from the group consisting of I, HpyCm ⁇ , Alu l. Hae ⁇ HpyCH4 IL Apek l Ban IL Taqa l. Sph l, Bgl L. BssS L BamR 1 and at least one of « 1 .
- the combination of the M p I enzyme and the second restriction endonuclease according to the embodiment of the present invention can efficiently cleave genomic DNA, and the DNA fragment obtained by digestion is very suitable for constructing the whole genome methyl group of the present invention.
- the invention provides a kit for constructing whole genome methylation high throughput sequencing.
- the kit comprises: an Msp I enzyme, and a second restriction endonuclease, wherein the second restriction enzyme is selected from the group consisting of BsfN I, HpyCm V, Alu I, Hae III At least one of HpyCH4 II, Apek I, Ban ⁇ , Taq I, Sph I, Bgl ⁇ , BssS I, BamR I, and Kpn I.
- a kit for constructing a genome-wide methylation high-throughput sequencing library of genomic DNA samples can be conveniently and efficiently constructed using a kit for constructing a genome-wide methylation high-throughput sequencing library according to an embodiment of the present invention.
- FIG. 1 shows a schematic flow diagram of a method of constructing a whole genome methylation high throughput sequencing library in accordance with one embodiment of the present invention.
- Figure 2 shows the Agilent 2100 assay results for a genome-wide methylated high throughput sequencing library constructed for fragments of different lengths of interest, in accordance with one embodiment of the present invention.
- D shows a whole genome methyl group having a fragment length of 160 bp to 420 bp according to an embodiment of the present invention.
- Figure 3 A schematic diagram showing an apparatus for determining a methylation site of a genomic DNA sample in accordance with one embodiment of the present invention.
- the invention provides a method of constructing a whole genome methylated high throughput sequencing library.
- the method comprises the steps of: digesting genomic DNA with I and a second restriction enzyme to obtain a DNA fragment; and performing end repair of the DNA fragment to obtain an end a repaired DNA fragment; A is added to the 3' end of the end-repaired DNA fragment to obtain a DNA fragment having a sticky terminal A; a DNA fragment having a sticky terminal A is linked to a methylated linker to obtain methylation a ligation product of the linker; the ligation product having a methylation linker is subjected to fragment selection to obtain a fragment of interest; the target fragment is subjected to bisulfite treatment to convert the unmethylated cytosine of the target fragment into uracil, Obtaining the transformed target fragment; performing PCR amplification on the transformed target fragment to obtain an amplification product; and isolating and purifying the amplification product,
- DNA as used in the present invention may be any polymer comprising deoxyribonucleotides including, but not limited to, modified or unmodified DNA. It will be understood by those skilled in the art that the source of genomic DNA is not particularly limited and can be obtained from any possible route, and can be obtained directly from a commercial market, directly obtained from other laboratories, or directly from a sample. extract. #4 In the embodiment of the present invention, genomic DNA can be extracted from a sample. According to one embodiment of the invention, the method of constructing a whole genome methylation high throughput sequencing library can further comprise the step of extracting genomic DNA from the sample. According to some specific examples of the invention, the sample may be derived from at least one of a mammal, a plant, and a living being.
- the mammal can be at least one of a human and a mouse.
- the genomic DNA may be human whole blood genomic DNA. The inventors found that when human whole blood genomic DNA was used to construct whole-genome methylation high-throughput sequencing, the extraction of genomic DNA from the sample was easy and convenient, and the obtained DNA shield was good and the methylation information was complete. The constructed by it can be conveniently applied to high-throughput sequencing technology, so that the whole genome methylation information of the sample can be conveniently and efficiently obtained based on the data analysis of the sequencing result.
- the amount of genomic DNA is not particularly limited, and according to a specific example of the present invention, the amount of genomic DNA is preferably 150-200 ng, more preferably 100 ng.
- the inventors have surprisingly found that when the amount of genomic DNA is 100 ng, constructing a whole genome methylation high throughput sequencing library according to an embodiment of the present invention
- the library constructed by the method can be conveniently applied to high-throughput sequencing technologies, such as Solexa sequencing technology, and the library sequencing results are accurate and reproducible, including complete methylation information and CpG site coverage.
- the step of digesting genomic DNA with Msp I and a second restriction enzyme is the present application.
- the inventor was accidentally acquired through painstaking research and creative labor.
- the term "second restriction enzyme” as used herein means a restriction enzyme different from M I .
- the second restriction enzyme that can be used has the meaning of SWN HpyCm ⁇ , Alu l. Hae ⁇ HpyCH4 IL Apek L Ban IL Taqa L Sph l. Bglll. BssS L 10 and « At least one of 1.
- ⁇ K I the second restriction endonuclease.
- restriction enzymes are known, and the optimal digestion conditions and recognition sites are also known.
- the recognition sites for restriction enzymes M p I and ApeK I are CCGG and GCWGC, respectively (where W represents 4 & A or T ).
- the inventors have found that when genomic DNA is digested with a combination of Msp I and the above second restriction enzyme, the DNA fragment obtained by digestion has a very good coverage of the genomic regulatory region, specifically, Msp l and ApeK.
- the I binding enzyme digestion can theoretically detect that the number of CpG sites in the CpG island is increased from less than 50% to nearly 70%.
- genomic DNA is digested by I and the above second restriction enzyme, and then the whole gene methylation high-throughput sequencing library is constructed to determine the genome-wide methylation site.
- Efficient detection of methylated regions, especially in areas not detected by existing RRBS techniques, such as greater than 70% tissue-specific differences in methylation regions (T-DMR) and differential methylation regions in cancer (C-DMR) the detection range is significantly expanded and can cover more CpG sites, which has broad application prospects.
- the order in which the restriction endonuclease processes the genomic DNA is not particularly limited, and may be performed sequentially or simultaneously. get on.
- Msp I and ApeK I as an example, according to a specific example of the present invention, Msp I may be first subjected to enzymatic cleavage treatment, and then subjected to enzymatic cleavage treatment using ⁇ 3 ⁇ 43 ⁇ 4 1 .
- the inventors have surprisingly found that when the enzyme is digested with this restriction enzyme sequence, the genomic DNA can be efficiently digested, and after the digestion of the genomic DNA by M p I is completed, the enzyme is not required to be purified. To cut the product, only the restriction endonuclease needs to be inactivated, that is, ⁇ eK I can be added for enzyme digestion.
- a control sample when genomic DNA is digested with Msp I and a second restriction enzyme, a control sample may be added to verify the effectiveness of the method.
- the control sample can be any DNA whose sequence is known and which is different from the source of the sample genomic DNA.
- it is preferred to use ⁇ -DNA because the sequence information of ⁇ -DNA is known, and no methylation site exists in the nucleotide sequence. Thereby, the conversion efficiency of bisulfite in the library construction process can be more accurately evaluated, so as to improve the application range and detection reliability of the detection sample.
- an inventor of the present invention uses Msp I and Apek I to cleave lambda Genomic DNA ( ⁇ -DNA), which was selected from the same size range (40-300 bp) as the human genome hgl9, showed that all selected ⁇ -DNA fragments did not return to the human genome. Further, the inventors used 100 ng of mature dendritic cell (mDC) genome and mixed 50 pg of complete ⁇ -DNA to form a library. The calculation proved that the bisulfite conversion rate was about 99% during the establishment process. The accuracy of the bisulfite conversion efficiency was evaluated as a reference.
- mDC mature dendritic cell
- the inventors can more accurately evaluate the detection accuracy of different experimental samples by introducing unmethylated ⁇ -DNA into the database construction and sequencing process, which provides an important criterion for judging the credibility of experimental data. in accordance with. Further, according to an embodiment of the present invention, the amount of ⁇ -DNA mixed with genomic DNA is not particularly limited.
- a very small amount of ⁇ -DNA may be added in combination with genomic DNA, and those skilled in the art will understand that the term “extremely trace” as used herein refers to the amount of genomic DNA relative to each other.
- the amount of mixed ⁇ -DNA is very small, and does not interfere with the enzymatic cleavage of genomic DNA and its subsequent database construction process.
- the amount of genomic DNA and ⁇ -DNA added may not be an order of magnitude. For example, in 100 ng of genomic DNA, 30-100 pg of ⁇ - ⁇ may be mixed. The inventors have found that a mixture of picogram-derived unmethylated lambda DNA enables its reference function to accurately assess the conversion efficiency of bisulfite during library construction.
- 100 ng of ⁇ -DNA is mixed in 100 ng of genomic DNA, thereby accurately measuring the conversion efficiency of bisulfite, and efficiently constructing a genome-wide methylation of a genomic DNA sample.
- Flux sequencing library and this can be effectively used in subsequent whole-genome methylation detection, detecting a wide methylation region and a large number of CpG points.
- the step of purifying the DNA fragment may be further included before the DNA fragment is subjected to end repair, thereby making subsequent end repair easy.
- end-repairing a DNA fragment can be carried out using a Klenow fragment, T4 DNA polymerase, and T4 polynucleotide kinase, wherein the Klenow fragment has 5' ⁇ 3' polymerase activity and 3' ⁇ 5 'Polymerase activity, but lacks 5' ⁇ 3' exonuclease activity. Thereby, the DNA fragment can be easily and accurately repaired at the end.
- Klenow (3'-5' exo-), Klenow having 3' ⁇ 5' exonuclease activity may be used to add base A at the 3' end of the end-repaired DNA fragment. . Thereby, it is possible to conveniently and accurately add the base A to the 3' end of the DNA fragment which has been repaired at the end.
- methylated linker refers to a linker in which all C sites are methylated.
- the step of methylating the linker used in conventional sequencing may be further included prior to linking the DNA fragment having the sticky end A to the methylation linker. Thereby, it is possible to avoid the interference of the sequencing link to the subsequent operations such as bisulfite treatment.
- the method of methylating the linker is not particularly limited, and the sequencing linker can be methylated by any method known in the art.
- the methylation linker may further comprise a tag, thereby facilitating simultaneous construction of a whole genome methylation high-throughput sequencing library of various genomic DNA samples, and can be effectively applied to high
- the flux sequencing platform based on the sequence analysis of the sequencing results, can accurately distinguish the sequence information of the libraries of the various genomic DNA samples and the information of the whole genome methylation sites based on the sequence information of the tags, thereby The ability to leverage high-throughput sequencing platforms saves time and costs.
- the attachment of a DNA fragment having a cohesive terminal A to a methylation linker is carried out using T4 DNA ligase, whereby a ligation product having a methylated linker can be conveniently obtained.
- fragmentation of a ligation product having a methylation linker is carried out by 2% agarose O electrophoresis.
- the obtained target fragment can also be purified and recovered, so that the experiment is easy to carry out.
- the ligation product having a methylated linker is subjected to fragment selection, and the obtained fragment of interest is 160-420 bp in length.
- the length of the segment of interest may be 160 bp or more and less than 240 bp.
- the length of the segment of interest may be 240 bp or more and less than 340 bp.
- the length of the target segment may be 340 bp or more and 420 bp or less.
- the fragment of interest may be mixed with the fragmented ⁇ -DNA prior to subjecting the fragment of interest to bisulfite treatment.
- the inventors have found that by adding exogenous DNA ( ⁇ -DNA), the target fragment is mixed with exogenous DNA, and then the bisulfite is co-processed efficiently, thereby protecting the target DNA fragment and minimizing the weight.
- the destruction of trace DNA by sulphate can further improve the detection accuracy, making it possible to detect high-precision methylation at the nano level, for example, 50-150 ng genome.
- the amount of the fragmented ⁇ -DNA to be added is not particularly limited, and #4 is a specific example, and the amount of the fragmented ⁇ -DNA is preferably 100-500 ng, more preferably 200 ng.
- these fragmented lambda-DNAs can be prepared by any method known in the art, for example, can be prepared along with the previous DNA fragmentation treatment.
- the bisulfite treatment of the fragment of interest can be carried out by any method known in the art, and according to a specific example of the present invention, it can be carried out using a commercially available kit, preferably EZ DNAMethylation-Gold KitTM (ZYMO) proceed.
- EZ DNAMethylation-Gold KitTM ZYMO
- the inventors have surprisingly found that the use of EZ DNA Methylation-Gold KitTM (ZYMO) for the bisulfite treatment of the target fragment is convenient, rapid, and effective, and the non-methylated cytosine in the target fragment is highly efficient and accurate. Conversion to uracil and facilitate subsequent processing.
- the transformed target fragment can be subjected to PCR amplification using a hot-starting taq DNA polymerase.
- the kind of the hot-starting taq DNA polymerase is not particularly limited, and according to a specific example of the present invention, the hot-starting taq DNA polymerase may be r-taq polymerase, whereby the PCR amplification efficiency is high and time-consuming less.
- the number of cycles of PCR amplification can be determined based on the length of the segment of interest.
- the number of cycles of PCR amplification may be 11; when the length of the target fragment is 240 bp or more and less than 340 bp, the number of cycles of PCR amplification may be 13 And when the length of the target fragment is 340 bp or more and 420 bp or less, the number of cycles of PCR amplification may be 15.
- the inventors have surprisingly found that when the number of cycles of PCR amplification is determined by the above method, the PCR amplification efficiency is high, the time is small, and the amplification effect is very good.
- the number of cycles of PCR amplification may be 13, and the inventors have found that a better amplification effect can still be achieved.
- the method of isolating and purifying the amplification product is not particularly limited, and according to a specific example of the present invention, at least one selected from the group consisting of magnetic bead purification, purification column purification, and 2% agarose; O electrophoresis
- the seeding is preferably carried out by 2% agarose O electrophoresis.
- the method for constructing a whole genome methylation high-throughput sequencing library can efficiently construct a genome-wide methylation high-throughput sequencing library of genomic DNA samples, in particular, capable of efficiently constructing a micro sample.
- the genomic methylation high-throughput sequencing library can be effectively and fully applied to high-throughput sequencing technology, and the whole genome methylation position can be effectively obtained by sequencing the library and then analyzing the data based on the sequencing results. Point information to achieve a genome-wide methylation test of genomic DNA samples.
- the invention provides a method of determining a methylation site of a genomic DNA sample.
- the method comprises the steps of: constructing a genome-wide methylated high-throughput sequencing library of genomic DNA samples by constructing a whole genome methylation high-throughput sequencing library according to an embodiment of the invention; Whole genome methylation high-throughput sequencing libraries are sequenced for sequencing results; and sequencing results are analyzed to determine methylation sites for genomic DNA samples.
- sequencing is performed using high throughput sequencing techniques.
- sequencing can be performed by any high throughput sequencing technique known in the art, preferably in accordance with a specific example of the invention, using the Solexa sequencing platform.
- the inventors found that using the Solexa sequencing platform to sequence a genome-wide methylation high-throughput sequencing library of genomic DNA samples, the sequencing results can be efficiently obtained, and the sequencing time is low, the efficiency is high, the sequencing results are accurate, and the repeatability is good. .
- the method for determining the methylation site of a genomic DNA sample according to an embodiment of the present invention can be efficiently constructed Whole-genome methylation high-throughput sequencing libraries of genomic DNA samples, and accurate sequencing of libraries by high-throughput sequencing technologies such as Solexa sequencing technology, based on data analysis of sequencing results, accurate determination of genomic DNA samples Methylation site, thereby enabling genome-wide methylation detection of genomic DNA samples, relative to current RRBS techniques, methods for determining methylation sites of genomic DNA samples according to embodiments of the invention, whole genome The coverage of the regulatory area was significantly improved, resulting in a significant increase in the coverage of CpG sites in the regulatory region.
- the present invention provides an apparatus 1000 for determining a methylation site of a genomic DNA sample.
- the apparatus includes: a library preparation unit 100, a sequencing unit 200, and a data analysis unit 300, in accordance with an embodiment of the present invention.
- the library preparation unit 100 is configured to prepare a whole genome methylation high-throughput sequencing library of a genomic DNA sample, wherein the library preparation unit 100 is provided with a restriction enzyme I and a second restriction Dicer.
- the second restriction enzyme is selected from the group consisting of Bsm I, HpyCm V, Alu I, Hae ⁇ , HpyCm II, Apek l. B m JL TaqaA, Sph l. Bgl ll. BssS L Sa HI and At least one of 1, preferably the second restriction endonuclease is ⁇ 3 ⁇ 4?kl.
- the second restriction endonuclease it has been described in detail above and is not further described.
- library preparation Unit 100 can be adapted to perform the whole genome methylation high throughput sequencing library construction method described above.
- the sequencing unit 200 is coupled to the library preparation unit 100, and the prepared whole genome methylation high-throughput sequencing library can be received from the library preparation unit 100, and the received whole genome methylation high-throughput sequencing library is sequenced, thereby Sequencing results can be obtained.
- the data analysis unit 300 is connected to the sequencing unit 200, and can receive the obtained sequencing result from the sequencing unit 200, and can further perform data analysis on the sequencing result, thereby determining a methylation site of the genomic DNA sample based on the analysis result, and finally implementing the pair.
- Whole genome methylation detection of genomic DNA samples can be employed as a component of each of the above units.
- the term "connected” as used herein is used in a broad sense and may be directly connected or indirectly connected through an intermediate medium, and the meaning of the above terms may be understood by one of ordinary skill in the art.
- the apparatus for determining the methylation site of a genomic DNA sample can conveniently and accurately determine the methylation site of the genomic DNA sample, and thus can be applied to various genome-wide methylation. Studies, for example, can be used to detect methylation abnormalities in human tumor suppressor genes to provide an effective pathway for early diagnosis of human disease. Kit
- the invention provides a set of isolated restriction enzymes. According to an embodiment of the invention, it consists of an I enzyme and a second restriction enzyme.
- the second restriction enzyme is selected from the group consisting of BstN L HpyCm ⁇ , Alu l. Hae ⁇ HpyCH4 IL Apek l. Ban JL Taqa l. Sph l, Bglll. BssS I, at least one of 10 and «1, preferably the second restriction enzyme is ⁇ 3 ⁇ 4 ⁇ 1.
- the second restriction enzyme it has been described in detail above and will not be described again.
- the enzyme digestion combination of the I enzyme and the second restriction endonuclease enzyme can efficiently cleave the genomic DNA, and the DNA fragment obtained by digestion is very suitable for the construction of the whole genome of the present invention.
- a method of basking a high throughput sequencing library The use and effects of the isolated restriction endonucleases of the group have been described in detail above and will not be described herein.
- the invention provides a kit for constructing whole genome methylation high throughput sequencing.
- the kit comprises: an Msp I enzyme, and a second restriction enzyme.
- the second restriction enzyme is at least selected from the group consisting of fotN L HpyCm Alu l. Hae ⁇ HpyCm ⁇ , Apek L Ban JL. Taqa L Sph l. Bg! JL BssS L Sa HI and «I
- the second restriction enzyme is ⁇ 3 ⁇ 4 ⁇ 1.
- the second restriction enzyme it has been described in detail above and will not be described.
- kits for constructing a genome-wide methylation high-throughput sequencing library of genomic DNA samples can be conveniently and efficiently constructed using a kit for constructing a genome-wide methylation high-throughput sequencing library according to an embodiment of the present invention.
- the DNA in the reaction system was recovered using a MiniElute PCR Purification Kit (Qiagen), purified by a centrifugal purification column, and dissolved in 42 ⁇ Elution Buffer (EB) (Qiagen).
- EB Elution Buffer
- the DNA obtained in the previous step is prepared in the 1.5 ml centrifuge tube as follows: The DNA obtained in the previous step is 32 ⁇ L ⁇
- the methylation tag linker sequence is:
- Linker 1 5'Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCAC ( SEQ ID NO. l )
- Linker 2 5'TACACTCTTTCCCTACACGACGCTCTTCCGATCT ( SEQ ID NO. 2 ) 4 & C in Linker 1 and Linker 2 are methylated
- Heavy-Asian acid salt treatment The 200 ng fragmented ⁇ -DNA was used as the exogenous DNA, and the gel-recovered target fragment was co-treated with the heavy tartaric acid salt.
- the bisulfite treatment is performed with EZ DNAMethylation-Gold KitTM (ZYMO) and operated according to the manufacturer's instructions (incorporating the specification by reference); the specific steps are as follows:
- N is any combination of four 3 ⁇ 4 & A, T, C, G
- the number of cycles For the length of the library fragment, select a different number of cycles, that is, if the length is 160 bp or more and less than 240 bp, the number of cycles is 11; if the length is 240 bp or more, and less than 340 bp, the number of cycles is 13; When the frequency is 340 bp or more and 420 bp or less, the number of cycles is 15. For further subdivided library fragments in the range of ⁇ 160-340 bp, the number of cycles was 13.
- Agilent 2100 Bioanalyzer detects the feasibility of double-cutting RRBS technology to construct different numbers of libraries.
- the inventors selected an insert of 40-300 bp in length (plus a sequencing linker, the length was shown as 160-420 bp), and the library fragment was The library was divided into three length ranges (ie, 160 bp or more, and less than 240 bp; 240 bp or more, and less than 340 bp; 340 bp or more, and 420 bp or less), and a library of 160-240 bp in length was directly constructed.
- Figure 2 shows the results of an Agilent 2100 assay of a whole genome methylation high throughput sequencing library constructed with different target fragment length ranges in accordance with one embodiment of the present invention.
- Figure 2A shows the Agilent 2100 assay results for a whole genome methylation high throughput sequencing library with a fragment length of 160 bp or more and less than 240 bp, in accordance with one embodiment of the present invention.
- Figure 2B shows the Agilent 2100 assay results for a whole genome methylation high throughput sequencing library with a fragment length of 240 bp or more and less than 340 bp, in accordance with one embodiment of the present invention.
- FIG. 2C shows the Agilent 2100 assay results for a whole genome methylation high throughput sequencing library with a fragment length of 340 bp or more and 420 bp or less, according to one embodiment of the present invention.
- Figure 2D shows the results of an Agilent 2100 assay of whole genome methylation high throughput sequencing with a fragment length of 160 bp to 420 bp, in accordance with one embodiment of the present invention.
- the Agilent 2100 test results indicate the distribution range of the library fragments of each library. As shown in Fig. 2, the library of each fragment length has a distribution range that is consistent with the theoretical value.
- the Agilent 2100 results demonstrate that the 160-420 bp range can be used to directly construct a library for sequencing or to construct several libraries for sequencing in several degrees.
- the same sample mDC cell line genome was used to construct the RRBS library with restriction enzyme digestion of RRBS and p I and ApeK I, respectively.
- the sequencing reads were 50PE and 90PE, respectively (ie, 50 3 ⁇ 4 & double ends and 90 ends)
- the order data amount is about 7.7G and 9.6G, respectively, and the results of the statistical analysis are shown in Table 2.
- Table 2 the number of CpG sites detected by double-enzyme-cutting RRBS was about 10.5 M, while the number of CpG sites detected by single-enzyme-cutting RRBS was only 3.8 M.
- the cost of double-cutting RRBS is not relative to the number of sites where CpG methylation information is detected. Any increase, that is, the average cost of methylation information per site does not increase.
- the number of sites detectable by double-enzyme-cutting RRBS is an order of magnitude increase, the methylation information provided will be more accurate, and the increased detection sites are mainly distributed in differentially methylated regions, indicating that the double-cut RTBS is more than a single Enzyme-cutting RRBS technology is more conducive to the analysis of methylation differences between different samples, providing a more favorable tool for exploring the role of methylation in the development of disease.
- the bisulfite conversion rate is estimated based on the conversion rate of the unbranched ⁇ -DNA.
- the inventors used the bioinformatics tool to analyze the whole genome to undergo M p I digestion or M p I and ApeK I digestion, and select different fragment spans to analyze and compare the percentage of CpG sites that different methods can cover in the target region. .
- the description of the terms “one embodiment”, “some embodiments”, “example”, “specific example”, or “some examples” and the like means a specific feature described in connection with the embodiment or example.
- a structure, material or feature is included in at least one embodiment or example of the invention.
- the schematic representation of the above terms does not necessarily mean the same embodiment or example.
- the particular features, structures, materials, or characteristics described may be combined in a suitable manner in any one or more embodiments or examples.
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
提供了全基因组甲基化高通量测序文库的构建方法及其应用。构建全基因组甲基化高通量测序文库的方法包括:用Msp I和第二限制性内切酶对基因组DNA进行酶切;将DNA片段进行末端修复;在经过末端修复的DNA片段的3'末端添加碱基A;将具有粘性末端A的DNA片段与甲基化接头相连;将具有甲基化接头的连接产物进行片段选择,以便获得目的片段;将目的片段进行重亚硫酸盐处理,以便将目的片段中非甲基化的胞嘧啶转换为尿嘧啶;将经过转换的目的片段进行PCR扩增;分离纯化扩增产物,该扩增产物构成全基因组甲基化高通量测序文库。釆用本发明的构建全基因组甲基化高通量测序文库的方法及其应用,能够方便有效地构建基因组DNA样品的全基因组甲基化高通量测序文库。
Description
全基因组曱基化高通量测序文库的构建方法及其应用 技术领域
本发明涉及生物技术领域。 具体地, 涉及全基因组甲基化检测技术, 特别是微量 DNA 全基因组甲基化检测技术领域。 更具体地, 本发明提供了一种构建全基因组甲基化高通量测 序文库的方法、 一种确 因组 DNA样品的甲基化位点的方法、 一种用于确定基因组 DNA 样品的甲基化位点的装置、一组分离的限制性内切酶以及一种用于构建全基因组甲基化高通 量测序文库的试剂盒。
背景技术
DNA甲基化是研究最为深入的表观遗传学机制, DNA甲基化在维持正常细胞功能、 抑 制寄生 DNA成分对基因组完整性的损害、 染色盾结构修饰、 X染色体失活、 基因组印迹、 胚胎发育以及人类肿瘤发生中起着重要作用, 是目前新的研究热点之一。
然而, 目前对全基因组 DNA甲基化的研究仍有待改进。
发明内容
本发明是基于发明人的下列发现完成的:
减少的代表性重亚硫酸盐测序 (RRBS ) (参见 Smith ZD等人, 2009. 在哺乳动物基因 组中高通量重亚石克酸盐测序 ( High-throughput bisulfite sequencing in mammalian genomes )
Methods. 48:226-232. ,通过引用将其全文并入本文),是目前常用的全基因组甲基化检测方法, 其可以检测人类和鼠基因组中大部分的 CpG岛和启动子区域。然而,越来越多的研究显示差 异甲基化区域(DMR )如组织特异性差异甲基化区域(T-DMR )和癌症中的差异甲基化区域 ( C-DMR )并非仅仅位于 CpG岛内, 更多的甲基化差异区域位于 CpG岛夕卜, 如 CpG岛外
( CGIshore )来调控基因的表达,而这些区¾^现有 RRBS技术不足以检测到的。另一方面, 现有 RRBS技术对岛内 CG数量的覆盖度低。
本发明旨在解决现有技术问题的至少之一。 由此, 为了检测基因组中更多具有 性区 域的甲基化状态并更真实的反应这些区域的甲基化水平, 本发明提供了全基因组甲基化高通 量测序文库的构建方法及其应用。
根据本发明的一个方面, 本发明提供了一种构建全基因组甲基化高通量测序文库的方 法。根据本发明的实施例,该方法包括以下步骤:用 Msp I和第二限制性内切酶对基因组 DNA 进行酶切, 以便获得 DNA片段, 其中, 所述第二限制性内切酶为选自 fotN I、 HpyCm V, Alu l, Hae IIL HpyCH4 Apek L Ban IL Taqa L Sph l. Bgl ll. BssS L BamlU和 Kpn l
的至少一种; 将所述 DNA片段进行末端修复, 以便获得经过末端修复的 DNA片段; 在所述 经过末端修复的 DNA片段的 3'末端添加 A, 以便获得具有粘性末端 A的 DNA片段; 将所述具有粘性末端 A的 DNA片段与甲基化接头相连, 以便获得具有甲基化接头的连接产 物; 将所述具有甲基化接头的连接产物进行片段选择, 以便获得目的片段; 将所述目的片段 进行重亚硫酸盐处理, 以便将所述目的片段中非甲基化的胞嘧啶转换为尿嘧啶, 获得经过转 换的目的片段; 将所述经过转换的目的片段进行 PCR扩增, 以便获得扩增产物; 以及分离纯 化所述扩增产物, 所述扩增产物构成全基因组甲基化高通量测序文库。
利用根据本发明实施例的构建全基因组甲基化高通量测序文库的方法, 能够有效地构建 基因组 DNA样品的全基因组甲基化高通量测序文库, 特别是能够有效地构建微量样本的全 基因组甲基化高通量测序文库, 从而能够有效、 充分地应用于高通量测序技术, 通过对文库 的测序, 然后基于对测序结果的数据分析, 就能够有效地获得全基因组甲基化位点信息, 实 现对基因组 DNA样品的全基因组甲基^ ^测。
根据本发明的另一方面,本发明提供了一种确定基因组 DNA样品的甲基化位点的方法。 根据本发明的实施例, 该方法包括下列步骤: #4居前面所述构建全基因组甲基化高通量测序 文库的方法, 构建基因组 DNA样品的全基因组甲基化高通量测序 ^; 对该全基因组甲基 化高通量测序文库进行测序, 以便得到测序结果; 以及对测序结果进行数据分析, 以便确定 基因组 DNA样品的甲基化位点。利用根据本发明实施例的确定基因组 DNA样品的甲基化位 点的方法, 能够准确地确定基因组 DNA样品的甲基化位点,从而实现对基因组 DNA样品的 全基因组甲基化检测, 相对于目前的 RRBS技术, 本发明的确定基因组 DNA样品的甲基化 位点的方法,对全基因组的调控区域的覆盖广度得到显著提高,对调控区域内 CpG位点的覆 盖量显著增加。
根据本发明的再一方面, 本发明提供了一种用于确定基因组 DNA样品的甲基化位点的 装置。 # ^据本发明的实施例, 该装置包括: 文库制备单元, 所述文库制备单元用于制备基因 组 DNA样品的全基因组甲基化高通量测序文库, 所述文库制备单元内设置有 Msp I酶以及 第二限制性内切酶,其中,所述第二限制性内切酶为选自 Bsm I、 HpyCm V、 Alu I、 Hae ΙΠ、 HpyCm IL Apek l. B m JL TaqaA、 Sph l. Bg!JL BssS L Sa H I和 " 1的至少一种; 测 序单元, 所述测序单元与所述文库制备单元相连, 并且从所述文库制备单元接收所述基因组 DNA样品的全基因组甲基化高通量测序文库, 以便用于对所述基因组 DNA样品的全基因组 甲基化高通量测序文库进行测序, 获得测序结果; 以及数据分析单元, 所述数据分析单元与 所述测序单元相连, 并且从所述测序单元接收所述测序结果, 以便对所述测序结果进行数据 分析, 确定所述基因组 DNA样品的甲基化位点。 利用根据本发明实施例的用于确定基因组
DNA样品的甲基化位点的装置, 能够方便准确地确定基因组 DNA样品的甲基化位点, 可以 应用于多种针对全基因组甲基化的研究, 例如可以用于对人的肿瘤基因抑制基因的甲基化异 常的检测 , 以便为人类疾病的早期诊断提供有效的途径。
才艮据本发明的又一方面,本发明提供了一组分离的限制性内切酶。根据本发明的实施例, 其由 Msp I酶以及第二限制性内切酶构成, 其中, 所述第二限制性内切酶为选自 I、 HpyCm \, Alu l. Hae ΠΚ HpyCH4 IL Apek l. Ban IL Taqa l. Sph l、 Bgl L. BssS L BamR 1和 « 1的至少一种。 根据本发明实施例的 M p I酶和第二限制性内切酶构成的组合, 能够 有效地对基因组 DNA进行酶切,且酶切获得的 DNA片段非常适用于本发明的构建全基因组 甲基化高通量测序文库的方法。
根据本发明的另一方面, 本发明提供了一种用于构建全基因组甲基化高通量测序 的 试剂盒。 根据本发明的实施例, 该试剂盒包括: Msp I酶, 以及第二限制性内切酶, 其中, 所述第二限制性内切酶为选自 BsfN I、 HpyCm V、 Alu I、 Hae III、 HpyCH4 II、 Apek I、 Ban Π、 Taq I、 Sph I、 Bgl Π、 BssS I、 BamR I和 Kpn I的至少一种。 利用根据本发明实施例的用于 构建全基因组甲基化高通量测序文库的试剂盒, 能够方便有效地构建基因组 DNA样品的全 基因组甲基化高通量测序文库。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显, 或通过本发明的实践了解到。
附图说明 本发明的上述和 /或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和 容易理解, 其中:
图 1 显示了根据本发明一个实施例的构建全基因组甲基化高通量测序文库的方法的流 程示意图
图 2 显示了根据本发明一个实施例的针对不同长度目的片段所构建全基因组甲基化高 通量测序文库的安捷伦 2100检测结果。
A: 显示了根据本发明一个实施例的目的片段长度为 160bp以上, 且小于 240bp的 全基因组甲基化高通量测序文库的安捷伦 2100检测结果。
B: 显示了根据本发明一个实施例的目的片段长度为 240bp以上, 且小于 340bp的 全基因组甲基化高通量测序文库的安捷伦 2100检测结果。
C: 显示了根据本发明一个实施例的目的片段长度为 340bp以上, 且 420bp以下的 全基因组甲基化高通量测序文库的安捷伦 2100检测结果。
D: 显示了根据本发明一个实施例的目的片段长度为 160bp-420bp的全基因组甲基
化高通量测序文库的安捷伦 2100检测结果。
图 3:显示了根据本发明一个实施例的用于确定基因组 DNA样品的甲基化位点的装置的 示意图。
具体实施方式
下面详细描述本发明的实施例, 所述实施例的示例在附图中示出, 其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。 下面通过参 考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
构建全基因组甲基化高通量测序文库的方法
根据本发明的一个方面, 本发明提供了一种构建全基因组甲基化高通量测序文库的方 法。 参考图 1 , 根据本发明的实施例, 该方法包括以下步骤: 用 I和第二限制性内切酶 对基因组 DNA进行酶切, 以便获得 DNA片段; 将 DNA片段进行末端修复, 以便获得经过 末端修复的 DNA片段;在经过末端修复的 DNA片段的 3'末端添加 A, 以便获得具有粘 性末端 A的 DNA片段; 将具有粘性末端 A的 DNA片段与甲基化接头相连, 以便获得具有 甲基化接头的连接产物; 将具有甲基化接头的连接产物进行片段选择, 以便获得目的片段; 将目的片段进行重亚硫酸盐处理, 以便将目的片段中非甲基化的胞嘧啶转换为尿嘧啶, 获得 经过转换的目的片段; 将经过转换的目的片段进行 PCR扩增, 以便获得扩增产物; 以及分离 纯化扩增产物, 所得到的扩增产物构成全基因组甲基化高通量测序文库。
在本发明中所使用的术语 "DNA"可以是任何包含脱氧核糖核苷酸的聚合物, 包括但不限 于经过修饰的或者未经修饰的 DNA。 本领域的技术人员可以理解, 基因组 DNA的来源不受 特别限制, 可以从任何可能的途径获得, 可以是通过市售直接获得, 也可以是从其他实验室 直接获取, 还可以是直接从样本中提取。 #4居本发明的实施例, 可以从样本中提取获得基因 组 DNA。根据本发明的一个实施例,构建全基因组甲基化高通量测序文库的方法可以进一步 包括从样本中提取基因组 DNA的步骤。 根据本发明的一些具体示例, 样本可以来源于哺乳 动物、 植物、 和 生物的至少一种。 根据本发明的一些实施例, 哺乳动物可以为人和小鼠的 至少一种。 根据本发明的一个实施例, 基因组 DNA可以为人类全血基因组 DNA。 发明人发 现, 当釆用人类全血基因组 DNA构建全基因组甲基化高通量测序 时, 从样本中提取基 因组 DNA的操作方便易行, 且获得的 DNA盾量好、 甲基化信息完整, 由其构建的 能够 方便地应用于高通量测序技术, 从而基于对测序结果的数据分析就能方便有效地获得样本的 全基因组甲基化信息。 根据本发明的实施例, 基因组 DNA的量不受特别限制, 根据本发明 的具体示例, 优选基因组 DNA的量为 150-200ng, 更优选为 100ng。 发明人惊奇地发现, 当 基因组 DNA的量为 lOOng时, 根据本发明实施例的构建全基因组甲基化高通量测序文库的
方法构建的文库, 能够非常方便地应用于高通量测序技术, 如 Solexa测序技术, 且文库测序 结果准确, 可重复性好, 包含甲基化信息完整、 CpG位点覆盖多。
另外, 需要说明的是, 根据本发明实施例的构建全基因组甲基化高通量测序文库的方法 中用 Msp I和第二限制性内切酶对基因组 DNA进行酶切的步骤, 是本申请的发明人经过艰 苦的研究和创造性劳动而意外获得的。 在本文中所使用的术语 "第二限制性内切酶 "的含义是 指与 M I不同的限制性内切酶。 根据本发明的实施例, 可以釆用的第二限制性内切酶的含 义为选 SWN HpyCm \, Alu l. Hae ΠΚ HpyCH4 IL Apek L Ban IL Taqa L Sph l. Bglll. BssS L 謂10和 « 1的至少一种。 根据本发明的具体示例, 优选釆用^^ K I作为 第二限制性内切酶。 这些限制性内切酶均为已知的, 并且其最佳酶切条件以及识别位点也都 是已知的。例如, 限制性内切酶 M p I和 ApeK I的识别位点分别为 CCGG和 GCWGC (其中 W表示 4 & A或 T )。发明人发现,当釆用 Msp I和上述第二限制性内切酶组合对基因组 DNA 进行酶切时, 酶切所得的 DNA片段对基因组调控区域的覆盖情况非常好, 具体地, Msp l和 ApeK I结合酶切与 RRBS技术中的 Msp I单酶切相比, 理论上可检测到 CpG岛内的 CpG位 点数由不足 50%提高到近 70%。 发明人发现, 通过 I和上述第二限制性内切酶对基因组 DNA进行酶切,然后进行全基因甲基化高通量测序文库构建以^^续的全基因组甲基化位点 的确定, 能够实现对甲基化区域的有效检测, 尤其是现有 RRBS技术无法检测到的区域例如 大于 70%的组织特异性差异的甲基化区域( T-DMR )和癌症中的差异甲基化区域( C-DMR ), 由此检测范围得到显著扩大并且可覆盖更多的 CpG位点, 具有广阔的应用前景。
根据本发明的实施例, 使用 I和第二限制性内切酶对基因组 DNA进行酶切时, 限 制性内切酶对基因组 DNA进行处理的先后顺序不受特别限制, 可以依次进行, 也可以同时 进行。 以 Msp I和 ApeK I的组合为例, 根据本发明的具体示例, 可以首先使用 Msp I进行酶 切处理, 然后再使用^ ¾¾ 1进行酶切处理。发明人惊奇地发现, 当釆用这种酶切顺序进行酶 切处理时, 能够有效地对基因组 DNA进行酶切处理, 并且在完成 M p I对基因组 DNA的酶 切处理后,不需要纯化酶切产物,只需要对限制性内切酶进行失活处理,即可以添加 ^eK I, 进行酶切。
根据本发明的一个实施例, 在使用 Msp I和第二限制性内切酶对基因组 DNA进行酶切 时, 可以添加对照样品, 以验证方法的有效性。 根据本发明的实施例, 对照样品可以为序列 已知且与样品基因组 DNA来源不同的任何 DNA。 具体地, 优选釆用 λ-DNA, 因为 λ-DNA 的序列信息已知, 且其核苷酸序列中不存在甲基化位点。 由此, 能够更加精确地评估文库构 建过程重亚硫酸盐的转换效率, 以便提高检测样本的应用范围和检测可信度。 具体地, 根据 以 Msp I和 Apek I的组合为例,本发明的一个实施例,发明人利用 Msp I和 Apek I酶切 lambda
基因组 DNA ( λ-DNA ), 选取同样大小范围的片段(40-300bp )与人类基因组 hgl9比对, 结 果显示所有选取范围内的 λ-DNA片段均不会比回到人类基因组上。进一步,发明人使用 lOOng 的成熟树突状细胞( mDC )基因组, 同时混入 50pg完整的 λ-DNA共同酶切建库, 计算证明 建库过程重亚硫酸盐转换率约为 99%,确定了其作为参照评估重亚硫酸盐转换效率的精确性。 目前已知千细胞等相关细胞中存在大量非 CpG位点上的甲基化修饰, 因此, 不能按照基因组 本身单个 C碱基 (非 CG二核苷酸处的 C碱基 )的甲基化状态来计算重亚硫酸盐处理的转换 率。 居本发明的实施例, 发明人通过将未甲基化的 λ-DNA 引入建库和测序过程, 可更加 精确的评估不同实验样本的检测准确性, 为实验数据可信性的判定提供了重要依据。 此外, 根据本发明的实施例, 与基因组 DNA混合的 λ-DNA的量不受特别限制。根据本发明的一些 具体示例, 可以添加极微量的 λ-DNA与基因组 DNA混合, 本领域的技术人员可以理解, 这 里所使用的术语 "极微量"是相对而言, 是指与基因组 DNA的量相比, 混合的 λ-DNA的量非 常少, 不会千扰基因组 DNA的酶切及其后续的建库过程。 基因组 DNA和 λ-DNA的添加量 可以不是一个数量级, 例如 lOOng基因组 DNA中, 可以混合 30-100pg的 λ-ϋΝΑ。 发明人发 现, 皮克级的未甲基化 λ-DNA的混合, 就能够实现其参照作用, 即能够精确地评估文库构 建过程中重亚硫酸盐的转换效率。根据本发明的具体示例,优选地, lOOng基因组 DNA中混 合 50pg的 λ-DNA, 由此既能精确评估重亚硫酸盐的转换效率, 还能有效地构建基因组 DNA 样品的全基因组甲基化高通量测序文库, 且该 能有效地用于后续的全基因族甲基化检测 中, 检测到的甲基化区域广、 CpG为点多。
根据本发明的一个实施例, 在将 DNA片段进行末端修复前, 可以进一步包括纯化 DNA 片段的步骤, 由此, 使得后续的末端修复易于进行。 根据本发明的实施例, 将 DNA片段进 行末端修复可以利用 Klenow片段、 T4 DNA聚合酶和 T4多核苷酸激酶进行, 其中, 所述 Klenow片段具有 5'→3'聚合酶活性和 3'→5'聚合酶活性, 但缺少 5'→3'外切酶活性。 由此, 能够方便准确地对 DNA片段进行末端修复。
根据本发明的一个实施例, 可以利用 Klenow (3'-5' exo-), 即具有 3'→5'外切酶活性的 Klenow, 在经过末端修复的 DNA片段的 3'末端添加碱基 A。 由此, 能够方便准确地将碱基 A添加到经过末端修复的 DNA片段的 3'末端。
本发明中所使用的术语"甲基化接头"是指这样的一种接头, 在其核苷 列中, 所有 C 位点均被甲基化修饰。 根据本发明的一个实施例, 在将具有粘性末端 A的 DNA片段与甲基 化接头相连前, 可以进一步包括对常规测序所使用的接头进行甲基化的步骤。 由此, 能够避 免测序接头对后续重亚硫酸盐处理等操作的千扰。 本领域的技术人员可以理解, 对接头进行 甲基化的方法不受特别限制, 可以利用本领域已知的任何方法对测序接头进行甲基化。
根据本发明的一些实施例, 甲基化接头中还可以进一步包含标签, 由此可以方便地同时 构建多种基因组 DNA样品的全基因组甲基化高通量测序文库, 并能够有效地应用于高通量 测序平台, 从而在对测序结果进行数据分析后, 基于标签的序列信息, 就能够准确地区分多 种基因组 DNA样品的文库的序列信息以及全基因组甲基化位点的信息, 由此, 能够充分地 利用高通量测序平台, 且能够节省时间、 降低成本。
根据本发明的一个实施例,将具有粘性末端 A的 DNA片段与甲基化接头相连是利用 T4 DNA连接酶进行的, 由此可以方便地获得具有甲基化接头的连接产物。
才艮据本发明的实施例, 将具有甲基化接头的连接产物进行片段选择, 是通过 2%的琼脂 糖 O交电泳进行的。 根据本发明的实施例, 通过 2%的琼脂糖;O交电泳对具有甲基化接头的 连接产物进行片段选择后 , 还可以对获得的目的片段进行纯化回收, 以便^ ^续的实验易于 进行。 才 居本发明的一些具体示例, 将具有甲基化接头的连接产物进行片段选择, 获得的目 的片段的长度为 160-420bp。根据本发明的一个实施例,目的片段的长度可以为 160 bp以上, 且小于 240bp。根据本发明的另一个实施例,目的片段的长度可以为 240 bp以上,且小于 340bp。 根据本发明的又一个实施例, 目的片段的长度可以为 340 bp以上, 且 420bp以下。 发明人发 现, 当目的片段的长度为 160-420bp时, 构建的样品的全基因组甲基化高通量测序文库, 能 够方便有效地应用于高通量测序平台如 Solexa测序平台,且可重复性好,测序结果真实可靠, 包含基因组甲基化信息完整、 CpG位点 多。
根据本发明的一些具体示例, 在将目的片段进行重亚硫酸盐处理之前, 可以将目的片段 与片段化的 λ-DNA混合。发明人发现, 通过添加外源 DNA ( λ-DNA ), 即将目的片段与外源 DNA混合, 然后进行重亚硫酸盐高效共处理, 对目标 DNA片段能够起到保护作用, 最大限 度地降低重亚硫酸盐对微量 DNA的破坏, 可以进一步提高检测精度, 使得纳克级, 例如 50-150ng基因组整体水平高精度的甲基化检测成为现实。 根据本发明的实施例, 片段化的 λ-DNA的添加量不受特别限制, #4居具体的示例, 优选片段化的 λ-DNA的量为 100-500ng, 更优选为 200ng。 本领域技术人员能够理解, 可以通过本领域已知的任意方法制备这些片段 化的 λ-DNA, 例如可以随同前面的 DNA片段化处理一起进行制备。
此外, 将目的片段进行重亚硫酸盐处理, 可以通过本领域已知的任何方法进行, 根据本 发明的具体示例,可以釆用商品化的试剂盒进行,优选地釆用 EZ DNAMethylation-Gold Kit™ ( ZYMO )进行。 发明人惊奇地发现, 釆用 EZ DNA Methylation-Gold Kit™ ( ZYMO )对目 的片段进行重亚硫酸盐处理时, 方便快捷, 且处理效果好, 目的片段中非甲基化的胞嘧啶能 够高效准确地转换为尿嘧啶, 并且利于后续处理。
根据本发明的实施例,可以使用热启动 taq DNA聚合酶对经过转换的目的片段进行 PCR 扩增。 根据本发明的实施例, 热启动 taq DNA聚合酶的种类不受特别限制, 根据本发明的具 体示例, 热启动 taq DNA聚合酶可以为 r-taq聚合酶, 由此 PCR扩增效率高、 用时少。 根据 本发明的实施例, 可以基于目的片段的长度, 确定 PCR扩增的循环数。 具体地, 当目的片段 的长度为 160bp以上, 且小于 240bp时, PCR扩增的循环数可以为 11; 当目的片段的长度为 240bp以上,且小于 340bp时, PCR扩增的循环数可以为 13;以及当目的片段的长度为 340bp 以上, 且 420bp以下时, PCR扩增的循环数可以为 15。 发明人惊奇地发现, 当釆用上述方法 确定 PCR扩增的循环数时, PCR扩增效率高、 用时少, 扩增效果都非常好。 在为对目的片 段长度进行细分的情况下, 如果目的片段的长度在 160-420bp的范围内, PCR扩增的循环数 可以为 13 , 发明人发现仍然可以实现较好的扩增效果。
根据本发明的实施例,分离纯化扩增产物的方法不受特别限制,根据本发明的具体示例, 可以通过选自磁珠纯化、 纯化柱纯化和 2%的琼脂糖; O交电泳的至少一种进行, 优选通过 2% 的琼脂糖 O交电泳进行。
利用根据本发明实施例的构建全基因组甲基化高通量测序文库的方法, 能够有效地构建 基因组 DNA样品的全基因组甲基化高通量测序文库, 特别是能够有效地构建微量样本的全 基因组甲基化高通量测序文库, 从而能够有效、 充分地应用于高通量测序技术, 通过对文库 的测序, 然后基于对测序结果的数据分析, 就能够有效地获得全基因组甲基化位点信息, 实 现对基因组 DNA样品的全基因组甲基^ ^测。 确^^因组 DNA样品的甲基化位点的方法和装置
根据本发明的另一方面,本发明提供了一种确定基因组 DNA样品的甲基化位点的方法。 根据本发明的实施例, 该方法包括下列步骤: 根据本发明实施例的构建全基因组甲基化高通 量测序文库的方法构建基因组 DNA样品的全基因组甲基化高通量测序文库; 对该全基因组 甲基化高通量测序文库进行测序, 以便得到测序结果; 以及对测序结果进行数据分析, 以便 确定基因组 DNA样品的甲基化位点。
根据本发明的一些实施例, 测序是利用高通量测序技术进行的。 本领域的技术人员可以 理解, 可以通过本领域已知的任何高通量测序技术进行测序, 根据本发明的具体示例, 优选 地釆用 Solexa测序平台进行测序。 发明人发现, 釆用 Solexa测序平台对基因组 DNA样品的 全基因组甲基化高通量测序文库进行测序, 能够有效地获得测序结果, 且测序用时少、 效率 高、 测序结果准确, 可重复性好。
利用根据本发明实施例的确定基因组 DNA样品的甲基化位点的方法, 能够有效地构建
基因组 DNA样品的全基因组甲基化高通量测序文库,并且能够通过高通量测序技术如 Solexa 测序技术实现对文库的准确测序, 基于对测序结果的数据分析, 就能够准确地确定基因组 DNA样品的甲基化位点, 从而实现对基因组 DNA样品的全基因组甲基化检测 , 相对于目前 的 RRBS技术, 根据本发明实施例的确定基因组 DNA样品的甲基化位点的方法, 全基因组 的调控区域的覆盖广度得到显著提高, 使得调控区域内 CpG位点的覆盖量显著增加。
根据本发明的再一方面, 本发明提供了一种用于确定基因组 DNA样品的甲基化位点的 装置 1000。 参考图 3 , 根据本发明的一个实施例, 该装置包括: 文库制备单元 100、 测序单 元 200以及数据分析单元 300。
根据本发明的实施例, 文库制备单元 100用于制备基因组 DNA样品的全基因组甲基化 高通量测序文库, 其中, 文库制备单元 100内设置有限制性内切酶 I和第二限制性内切 酶。根据本发明的实施例第二限制性内切酶为选自 Bsm I、 HpyCm V、 Alu I、 Hae ΙΠ、 HpyCm II、 Apek l. B m JL TaqaA、 Sph l. Bgl ll. BssS L Sa H I和 " 1的至少一种, 优选所述第 二限制性内切酶为^ ¾?k l。关于第二限制性内切酶,在前面已经进行了详细描述,不再赞述。 由此,文库制备单元 100可以适于实施前面所述的全基因组甲基化高通量测序文库构建方法。
测序单元 200与文库制备单元 100相连, 可以从文库制备单元 100接收所制备的全基因 组甲基化高通量测序文库, 并对所接收的全基因组甲基化高通量测序文库进行测序, 从而可 以获得测序结果。
数据分析单元 300与测序单元 200相连, 可以从测序单元 200接收所获得的测序结果, 并且能够进一步对测序结果进行数据分析, 从而基于分析结果确定基因组 DNA样品的甲基 化位点, 最终实现对基因组 DNA样品的全基因组甲基化检测。 本领域技术人员能够理解的 是, 可以釆用本领域中已知的任何适于进行上述操作的装置作为上述各个单元的组成部件。 在本文中所使用的术语 "相连 "应作广义理解, 可以是直接相连, 也可以通过中间媒介间接相 连, 对于本领域的普通技术人员而言, 可以根据具体情况理解上述术语的具体含义。
利用根据本发明实施例的用于确定基因组 DNA样品的甲基化位点的装置, 能够方便准 确地确定基因组 DNA样品的甲基化位点,从而可以应用于多种针对全基因组甲基化的研究, 例如可以用于对人的肿瘤基因抑制基因的甲基化异常的检测, 以便为人类疾病的早期诊断提 供有效的途径。 试剂盒
才 居本发明的又一方面,本发明提供了一组分离的限制性内切酶。根据本发明的实施例, 其由 I酶以及第二限制性内切酶构成。 根据本发明的实施例, 第二限制性内切酶为选自
BstN L HpyCm \, Alu l. Hae ΠΚ HpyCH4 IL Apek l. Ban JL Taqa l. Sph l、 Bglll. BssS I、 謂10和 « 1的至少一种, 优选所述第二限制性内切酶为^¾^ 1。 关于第二限制性内切 酶, 在前面已经进行了详细描述, 不再赘述。 根据本发明实施例的 I酶和第二限制性内 切酶酶构成的酶切组合, 能够有效地对基因组 DNA进行酶切,且酶切获得的 DNA片段非常 适用于本发明的构建全基因组甲基化高通量测序文库的方法。 该组分离的限制性内切酶的用 途及效果, 前面已经详细描述, 在此不再赘述。
根据本发明的另一方面, 本发明提供了一种用于构建全基因组甲基化高通量测序 的 试剂盒。 根据本发明的实施例, 该试剂盒包括: Msp I酶, 以及第二限制性内切酶。 根据本 发明的实施例, 第二限制性内切酶为选自 fotN L HpyCm Alu l. Hae ΠΚ HpyCm Π, Apek L Ban JL. Taqa L Sph l. Bg! JL BssS L Sa H I和 « I的至少一种, 优选所述第二 限制性内切酶为^¾^ 1。 关于第二限制性内切酶, 在前面已经进行了详细描述, 不再赞述。 本领域的技术人员可以理解, 试剂盒中还可以进一步包括构建全基因组甲基化高通量测序文 库所需的任何其他组分, 在此不再赘述。 利用根据本发明实施例的用于构建全基因组甲基化 高通量测序文库的试剂盒, 能够方便有效地构建基因组 DNA样品的全基因组甲基化高通量 测序文库。
需要说明的是, 根据本发明实施例的构建全基因组甲基化高通量测序文库的方法及其应 用, 是本申请的发明人经过艰苦的创造性劳动和优化工作完成的。
下面将结合实施例对本发明的实施方案进行详细描述, 但是本领域技术人员将会理解, 下列实施例仅用于说明本发明, 而不应视为限定本发明的范围。 实施例中未注明具体技术或 条件的, 按照本领域内的文献所描述的技术或 牛(例如参考 J.萨姆布鲁克等著, 黄培堂等 译的 《分子克隆实验指南》, 第三版, 科学出版社)或者按照产品说明书进行。 所用试剂或 仪器未注明生产厂商者, 均为可以通过市购获得的常规产品。
实施例 1:
一、 实验 呈
1. 使用 p l和^ ¾?K I酶切基因组 DNA:
1.1 p l酶切: 釆 p l对 lOOng人源 mDC细胞系全基因组 DNA样品(mDC, 成 熟树突状细胞)进行酶切:
1 )在 1.5ml的离心管中配制 Msp I酶切反应体系:
mDC基因组 DNA lOOng 未甲基化的 -DNA(Promega) ( 50pg/ul ) Ιμί
10 x NEB緩冲液 2 ΙΟμί
Msp I (NEB) (100,000单位 /ml ) 5μL·
H20 补足至 ΙΟΟμί 总体积 \00μL·
2 )将上述反应体系在 37°C 7j浴中反应 7h。 反应完成后, 将酶切反应体系置于 80°C下
20min, 使限制性内切酶 p I失活。
1.2 ApeK l酶切:
1 )在限制性内切酶失活的 Msp I酶切反应体系中, 直接力。入 5 L eK I(NEB) (4,000单 位 /ml)
2 )将反应体系在 75°C水浴进行酶切反应过夜 (16-19h)。
1、 向反应体系中加入 l L EDTA ( ImM ), 使限制性内切酶^ ¾?K I失活。
2、 用 MiniElute PCR纯化试剂盒(Qiagen)回收反应体系中的 DNA, 用离心纯化柱进行 纯化, 溶于 42μί Elution緩冲液(EB ) (Qiagen)中。
2. 末端修复:
1)将上一步得到的 DNA按下表在 1.5ml的离心管中配制末端修复反应体系:
酶切后回收纯化的 DNA 40μί
¾0 28 μL·
10 X 多核苷酸激酶緩冲液(Enzymatics) \0μL· dNTPs (Enzymatics) (每种 dNTP均为 10mM ) 6μ
T4 DNA聚合酶(Enzymatics) 6μ
Klenow 片段 (Enzymatics) (稀释 10倍) 4μ
T4 多核苷酸激酶 (Enzymatics) 6μ 总体积 \00μL·
2)将上述反应体系置于 20°C的 Thermomixer(Eppendrf)上, 进行反应 30min。 反应完后用
MiniElute PCR纯化试剂盒(Qiagen )进行纯化, 最后将纯化的产物溶于 34μ1 Elution緩冲 液( EB )。
3. 末端添加石 A:
1 )将上一步得到的 DNA按下表在 1.5 ml的离心管中配制末端添加 A的反应体系:
上一步得到的 DNA 32μL·
10 χ blue緩冲液 (Enzymatics) 5μL· dATP (Enzymatics) (ImM) \0μL·
Klenow (3'-5' exo-)(Enzymatics) 3μL· 总体积 50μL·
2)将上述反应体系置于 37°C的 Thermomixer(Eppendrf) , 进行反应 30min。 反应完后用
MiniElute PCR纯化试剂盒 Qiagen )进行纯化, 最后将纯化的产物溶于 12μί Elution緩冲液
( EB )。
4. 连接甲基化标签接头:
1 )将上一步得到的 DNA按下表配制连接甲基化标签接头的反应体系:
上一步得到的 DNA \0μL·
2 X Rapid连接緩冲液 (Enzymatics) 25μL· 甲基化标签接头 (2μιη)* 3μL·
Η20 9μ
Τ4 DNA连接酶 (Rapid, L603-HC-L) (Enzymatics) 3μL· 总体积 50μL·
其中甲基化标签接头序列为:
接头 1 : 5'Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCAC ( SEQ ID NO. l ) 接头 2: 5'TACACTCTTTCCCTACACGACGCTCTTCCGATCT ( SEQ ID NO.2 ) 接头 1和接头 2中的 4 & C均经过甲基化修饰
2)将上述反应体系置于 20°C的 Thermomixer (Eppendrf)上反应 15 min。
5. 片段选择
1 )将上一步得到的样品进行 2%琼脂糖电泳并进行切胶回收, 电泳条件为: 100V, 2h。 2 )片段选择大小及范围: 160bp以上,且小于 240bp; 240 bp以上,且小于 340bp; 340bp 以上, 且 420 bp以下; 或直接回收 160-420bp的片段。
3 )用 QIAquick凝胶提取试剂盒 (Qiagen)分别回收纯化不同大小的片段, 并溶于 22μί
Elution緩冲液(EB )。
6. 重亚 A酸盐处理:
以 200ng片段化的 λ-DNA作为外源 DNA分别与胶回收的目的片段经重亚石克酸盐共处理。 重亚硫酸盐处理釆用 EZ DNAMethylation-Gold Kit™(ZYMO),并按照制造商提供的说明书进 行操作 (通过参照将其说明书并入本文;), 具体步骤如下:
1 )制备 CT转换试剂( CT Conversion Reagent )溶液: 从试剂盒中取出 CT转换试剂(固 体混合物), 分别加入 900μ1水、 50μ1Μ-溶解緩冲液( M-Dissolving Buffer )和 300μ1 Μ-稀释 緩冲液( M-Dilution Buffer ), 室温下溶解并且震荡 10分钟或在摇床上摇动 10分钟。
2 )M-洗涤緩冲液的制备:向 M-洗涤緩冲液( M-Wash Buffer )中添加 24ml 100%的乙醇, 备用。
3 )将待转换的目的片段 DNA与 λ-DNA的混合物, 按照目的片段大小分别加入不同的 PCR管中, 若不足 20μ1的则用水补足。
4 )在 PCR管中分别加入 130μ1的 CT转换试剂溶液, 轻弹或移液器吹悬混合样品。
5 )将上述 PCR管置于 PCR仪上按以下步骤操作:
98°C持续 5分钟
64 °C持续 2.5小时
完成上述操作后, 立刻进行下一步操作或者在 4°C下存储 (最多 20小时) ^用。
6 )将 Zymo-Spin IC™ Column放入收集管( Collection Tube ) 中, 并加入 600μ1 Μ-结合 緩冲液( M-Binding Buffer )。
7 )将重亚 4酸盐处理的样品分别加入到不同的含 M-结合緩冲液的 Zymo-Spin IC™ Column中, 加盖颠倒混匀。
8 )全速(>10,000 x g)离心 30秒, 弃收集管中的液体。
9 )向柱中加入 ΙΟΟμΙ M-洗涤緩冲液, 全速 (>10,000 χ g)离心 30秒, 弃收集管中的液 体。
10 )向柱中添加 200μ1 M-Desulphonation緩冲液, 室温放置 15min, 全速 (>10,000 x g) 离心 30s, 弃收集管中的液体。
11 )向柱中添加 200μ1的 M-洗涤緩冲液, 全速 (>10,000 x g)离心 30s, 弃收集管中的液 体, 并再重复此步骤 1次。
12 )将 Zymo-Spin IC™ Column分别置于新的 1.5ml EP管中, 分别加入 12μ1的 Μ-洗脱 緩冲液到柱基盾中, 室温放置 2min, 全速 (>10,000 x g)离心洗脱 DNA。
7. PCR扩增及文库大小选择:
1 )将上一步得到的 DNA按以下体系配制 PCR反应体系:
重亚^ ^酸盐处理的 DNA ΙΟμΙ
dNTP(2.5mM) (Takara) 4μ1
10 x PCR緩冲液 (Sigma) 5ul
JumpStart™ Taq DNA聚合酶 (Sigma) 0.5μ1
PI公用引物 * 1 μΐ 标签 N** Ιμΐ dH20 28.5μ1 总体积 50μ1
* 其中, PI 公用引物的序列为:
TCT ( SEQ ID N0.3 )
**标签 Ν的序列为:
CAAGCAGAAGACGGCATACGAGAT mGTGACTGGAGTTCAGACGTGT GCTCTTCCGATCT ( SEQ ID NO 4 ), N为 A、 T、 C、 G四个¾ &的任意组合
PCR反应条件:
94 °C lmin
11-15个循环的以下 3个步骤 *:
94 °C 30 s
58 °C 30 s
72 °C 30 s 72 °C 5min
12V 保持
*针对文库片段的长度,选择不同的循环数目,即如果长度为 160bp以上,且小于 240bp, 则循环数为 11; 如果长度为 240 bp以上, 且小于 340bp, 则循环数为 13; 如果长度为 340bp 以上, 且 420 bp以下, 则循环数为 15。 对于^ ^ 160-340bp范围内进一步细分的文库片段, 循环数为 13。
2 ) PCR产物经 2%琼脂糖电泳后 ,使用 QIAquick 交提取试剂盒 (Qiagen)分别回收纯化 不同大小片段的文库。
8. 文库检测:
使用 Bioanalyzer分析系统 (Agilent, Santa Clara, USA),检测文库插入片段的大小及含量; 并利用 Q-PCR精确定量文库的浓度。
9. 测序及数据分析:
经检测, 所构建的 合格。
按照双末端 90个碱基, 在 Hiseq2000测序仪上进行序列分析。 通过与现有的 Msp I单酶 切 RRBS方法测序数据比较, 得出结论: 使用 1^ 71和^¾¾ 1双酶切, 提高了对靶区域覆盖 广度以及区域内 CpG位点的覆盖深度, 确定该技术显著优于现有 Msp I单酶切 RRBS技术。
二、 实验结果:
1、利用表 1中所列出的酶组合重复前述实验,获得人和小鼠基因组经单酶切和不同的双 酶切组合对不同元件的覆盖度, 结果示于表 1中。
由上表 1可以看出, 人类基因组经 p I和第二限制性内切酶的双酶切与仅经 p I的 单酶切相比,对各靶区域内 CpG位点的覆盖均有较大程度的提高,特别是对最近研究发现的 肿瘤和组织特异性差异甲基化区域 ( DMR ) 比较集中的元件如: CpG 岛外(CpGshore ) 由 约 24%提升到 50%, 启动子由约 38%提升到 55%, 外显子由约 29%提升到 54%, 内含子由 约 11%提升到 30%,增强子由约 8%提升到 33%,基因下游 2Kb区域由约 20%提升到 43%等。 表 1 数据充分显示 M p l和第二限制性内切酶,尤其是 eK I双酶切技术比目前 M p l单酶 切 RRBS技术有显著的进步。
2. 安捷伦 2100生物分析仪检测双酶切 RRBS技术构建不同个数文库的可行性。
在一定测序数据量的基础上, 为了获取尽可能多的甲基化信息, 发明人选取长度为 40-300bp的插入片段(加上测序接头后, 长度显示为 160-420bp ), 并且将文库片段分为 3个 长度范围(即: 160bp以上, 且小于 240bp; 240 bp以上, 且小于 340bp; 340bp以上, 且 420 bp以下 )构建文库, 以及直接构建一个长度范围 160-240bp的文库。
图 2显示了根据本发明一个实施例的构建的目的片段长度范围不同的全基因组甲基化高 通量测序文库的安捷伦 2100检测结果。图 2A显示了根据本发明一个实施例的目的片段长度 为 160bp以上, 且小于 240bp的全基因组甲基化高通量测序文库的安捷伦 2100检测结果。 图 2B显示了根据本发明一个实施例的目的片段长度为 240bp以上, 且小于 340bp的全基因 组甲基化高通量测序文库的安捷伦 2100检测结果。 图 2C显示了根据本发明一个实施例的目 的片段长度为 340bp以上, 且 420bp以下的全基因组甲基化高通量测序文库的安捷伦 2100 检测结果。 图 2D显示了根据本发明一个实施例的目的片段长度为 160bp-420bp的全基因组 甲基化高通量测序 的安捷伦 2100检测结果。 其中, 安捷伦 2100检测结果表示的是各个 文库的文库片段分布范围。如图 2所示,各个片段长度的文库,其分布范围均与理论值相符。 此外,安捷伦 2100结果证明 160-420bp的 ί夸度范围可以直接构建一个文库进行测序也可以分 几个 ί夸度范围构建几个文库进行测序。
3. 以 Msp I与 ApeK l双酶切为例, mDC细胞系基因组单酶切与双酶切 RRBS技术产出 数据比较
用相同样品 mDC细胞系基因组分别构建 p I单酶切 RRBS和 p I与 ApeK I双酶切 的 RRBS文库, 测序读长分别为 50PE和 90PE (即双末端 50个¾ &和双末端 90个 测
序数据量分别约为 7.7G和 9.6G, 下机数据经统计分析结果示于表 2中。 如表 2所示, 双酶 切 RRBS可检测到的 CpG位点数约为 10.5M,而单酶切 RRBS检测到的 CpG位点数仅为 3.8M。
虽然单酶切对 CpG位点的平均测序深度较双酶切对 CpG位点的平均测序深度要高, 但 相对于检测到 CpG甲基化信息的位点数来讲,双酶切 RRBS成本并没有任何提高,即平均每 一个位点的甲基化信息的成本并没有任何提高。 但是, 双酶切 RRBS可检测到的位点数有数 量级的增加, 提供的甲基化信息将更加精确 , 而且增加的检测位点主要分布在差异甲基化区 域, 这表明双酶切 RRBS比单酶切 RRBS技术更有利于分析不同样本间的甲基化差异信息, 对于探索甲基化在疾病发生发展过程中所承担的角色提供了一个更有利的工具。
表 2. mDC样品 Msp I单酶切 RRBS与 Msp I和 ApeK I双酶切 RRBS测序数据比较
检 测唯一检 CpG 样品起始 t 片段选择转 换 率总测序序列唯一比对测序唯一比对 CpG总测 CpG平均覆 样品名 酶
量( g) (bp) (%) (M) 序列 (M) 率(%) 数 位点数盖深度
(M) (M) (倍) mDC 0.1 Msp l 40-220 >99.2* 153.6 98.7 64.3% 85.5 3.8 22.5 mDC 0.1 sp l和^ pekl 40-300 >99.2* 106.5 71.7 67.3% 73.7 10.5 7.0
*:重亚硫酸盐转换率是根据加入未曱基化的 λ-DNA的转换率进 4ti平估的
4. 单酶切与双酶切 RRBS检测不同元件上 CpG位点
发明人借助生物信息学工具分析了全基因组分别经过 M p I酶切或经过 M p I和 ApeK I 酶切, 选择不同片段跨度后, 分析比较不同方法可覆盖到靶区域内的 CpG位点百分比。
同时, 发明人 mDC细胞系基因组作为样本, 重复前述实验, 证明了实际数据与信息预 测结果的一致性。 并且实验证明,使用 Msp I和 ApeK I双酶切后, 不论选择 40-220bp还是选 择 40-300bp的跨度范围, 在各靶区域内可检测到的 CpG位点数均比单酶切可检测的位点数 要多, 尤其是在最近研究发现差异甲基化区域分布较多的区域如 CpG岛外、 内^^、基因下 游调控区域等可检测的位点增加更为显著。 在本说明书的描述中, 参考术语"一个实施例"、 "一些实施例"、 "示例"、 "具体示例"、 或"一些示例"等的描述意指结合该实施例或示例描述的具体特征、 结构、 材料或者特点包含 于本发明的至少一个实施例或示例中。 在本说明书中, 对上述术语的示意性表述不一定指的 是相同的实施例或示例。 而且, 描述的具体特征、 结构、 材料或者特点可以在任何的一个或 多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例, 本领域的普通技术人员可以理解: 在不脱离本 发明的原理和宗旨的情况下可以对这些实施例进行多种变化、 修改、 替换和变型, 本发明的 范围由权利要求及其等同物限定。
Claims
1、 一种构建全基因组甲基化高通量测序文库的方法, 其特征在于, 包括以下步骤: 用 Msp I和第二限制性内切酶对基因组 DNA进行酶切, 以便获得 DNA片段, 其中所述 第二限制性内切酶为选自 Ν Ι、 HpyCm \, Alu l. Hae III. HpyCH4 IL Apek L B m JL Taqa L Sph l. Bg!JL BssS L Sa H I和 " 1的至少一种;
将所述 DNA片段进行末端修复, 以便获得经 端修复的 DNA片段;
在所述经过末端修复的 DNA片段的 3'末端添加碱基 A, 以便获得具有粘性末端 A的 DNA片段;
将所述具有粘性末端 A的 DNA片段与甲基化接头相连, 以便获得具有甲基化接头的连 接产物;
将所述具有甲基化接头的连接产物进行片段选择, 以便获得目的片段;
将所述目的片段进行重亚石克酸盐处理, 以便将所述目的片段中非甲基化的胞嘧啶转换为 尿嘧啶, 获得经过转换的目的片段;
将所述经过转换的目的片段进行 PCR扩增, 以便获得扩增产物; 以及
分离纯化所述扩增产物, 所述扩增产物构成全基因组甲基化高通量测序文库。
2、 根据权利要求 1所述的方法, 其特征在于, 所述第二限制性内切酶为^ ¾?k l。
3、根据权利要求 1或 2所述的方法,其特征在于,进一步包括从样本中提取基因组 DNA 的步骤。
4、 根据权利要求 3 所述的方法, 其特征在于, 所述样本来源于哺乳动物、 植物和微生 物的至少一种。
5、 根据权利要求 4所述的方法, 其特征在于, 所述哺乳动物为人和小鼠的至少一种。
6、 根据权利要求 1-5任一项所述的方法, 其特征在于, 所述基因组 DNA为人类全血基 因组 DNA。
7、根据权利要求 1-6任一项所述的方法,其特征在于,所述基因组 DNA的量为 150-200ng。
8、 根据权利要求 7所述的方法, 其特征在于, 所述基因组 DNA的量为 100ng。
9、 根据权利要求 1-8任一项所述的方法, 其特征在于, 在将所述 DNA片段进行末端修 复前, 进一步包括纯化 DNA片段的步骤。
10、 根据权利要求 1-9任一项所述的方法, 其特征在于, 将所述 DNA片段进行末端修 利用 Klenow片段、 T4 DNA聚合酶和 T4多核苷酸激酶进行的, 其中, 所述 Klenow片 段具有 5'→3'聚合酶活性和 3'→5'聚合酶活性, 但缺少 5'→3'外切酶活性。
11、 根据权利要求 1-10任一项所述的方法, 其特征在于, 将所述经过末端修复的 DNA 片段的 3'末端添加 A是利用 Klenow (3'-5' exo-)进行的。
12、 根据权利要求 1-11任一项所述的方法, 其特征在于, 所述甲基化接头中包含标签。
13、根据权利要求 1-12任一项所述的方法,其特征在于,将所述具有粘性末端 A的 DNA 片段与甲基化接头相连前, 进一步包括对接头进行甲基化的步骤。
14、根据权利要求 1-13任一项所述的方法,其特征在于,将所述具有粘性末端 A的 DNA 片段与甲基化接头相连是利用 T4 DNA连接酶进行的。
15、根据权利要求 1-14任一项所述的方法, 其特征在于, 将所述具有甲基化接头的连接 产物进行片段选择, 是通过 2%的琼脂糖; 交电泳进行的。
16、 根据权利要求 1-15 任一项所述的方法, 其特征在于, 所述目的片段的长度为
160-420bpo
17、根据权利要求 1-16任一项所述的方法, 其特征在于, 在将所述目的片段进行重亚硫 酸盐处理之前, 将所述目的片段与片段化的 λ-DNA混合。
18、 根据权利要求 17所述的方法, 其特征在于, 所述片段化的 λ-DNA的量为 200ng。
19、根据权利要求 1-18任一项所述的方法, 其特征在于, 将所述目的片段进行重亚硫酸 盐处理是釆用 EZ DNAMethylation-Gold Kit™ ( ZYMO )进行的。
20、 根据权利要求 1-19任一项所述的方法, 其特征在于, 所述 PCR扩增使用热启动 taq DNA聚合酶。
21、 根据权利要求 20所述的方法, 其特征在于, 所述热启动 taq DNA聚合酶为! "-taq聚 合酶。
22、根据权利要求 1-21任一项所述的方法, 其特征在于, 基于所述目的片段的长度, 确 定所述 PCR扩增的循环数,
其巾,
当所述目的片段的长度为 160bp以上, 且小于 240bp时, 所述 PCR扩增的循环 数为 11;
当所述目的片段的长度为 240bp以上, 且小于 340bp时, 所述 PCR扩增的循环 数为 13; 以及
当所述目的片段的长度为 340bp以上, 且 420bp以下时, 所述 PCR扩增的循环 数为 15。
23、 根据权利要求 1-22任一项所述的方法, 其特征在于, 分离纯化所述扩增产物是通过 选自磁珠纯化、 纯化柱纯化和 2%的琼脂糖; O交电泳的至少一种进行的。
24、 根据权利要求 23所述的方法, 其特征在于, 分离纯化所述扩增产物是通过 2%的琼 脂糖 O交电泳进行的。
25、 一种确定基因组 DNA样品的甲基化位点的方法, 其特征在于, 包括下列步骤: 根据权利要求 1-24任一项所述的方法构建所述基因组 DNA样品的全基因组甲基化高通 量测序文库;
对所述全基因组甲基化高通量测序文库进行测序, 以便得到测序结果; 以及
对所述测序结果进行数据分析, 以便确定所述基因组 DNA样品的甲基化位点。
26、 根据权利要求 25 所述的方法, 其特征在于, 所述测序是利用高通量测序技术进行 的。
27、 根据权利要求 26所述的方法, 其特征在于, 所述测序是通过 Solexa测序平台进行 的。
28、 一种用于确定基因组 DNA样品的甲基化位点的装置, 其特征在于, 包括: 文库制备单元, 所述文库制备单元用于制备基因组 DNA样品的全基因组甲基化高通量 测序文库, 所述文库制备单元内设置有 p I酶以及第二限制性内切酶, 其中, 所述第二限 制性内切酶为选自 ΝΙ、 HpyCm \, Alul. Hae ΠΚ HpyCH4 IL Apek L BmJL Taqa L Sphl、 Bg!JL BssS L Sa HI和 «1的至少一种;
测序单元, 所述测序单元与所述文库制备单元相连, 并且从所述文库制备单元接收所述 基因组 DNA样品的全基因组甲基化高通量测序文库,以便用于对所述基因组 DNA样品的全 基因组甲基化高通量测序文库进行测序, 获得测序结果; 以及
数据分析单元, 所述数据分析单元与所述测序单元相连, 并且从所述测序单元接收所述 测序结果, 以便对所述测序结果进行数据分析, 确定所述基因组 DNA样品的甲基化位点。
29、 根据权利要求 28所述的装置, 其特征在于, 所述第二限制性内切酶为^ ¾?kl。
30、 一组分离的限制性内切酶, 其特征在于, 由 pl酶以及^¾¾1酶构成。
31、 一种用于构建全基因组甲基化高通量测序文库的试剂盒, 其特征在于, 包括: pl酶, 以及
第二限制性内切酶,
其巾,
所述第二限制性内切酶为选自 ΝΙ、 HpyCm \, Alul. Hae ΙΠ^ HpyCH4 Apek L Ban IL TaqaA、 Sphl. Bglll. BssS L Sa HI和 " I的至少一种。
32、 根据权利要求 31所述的试剂盒, 其特征在于, 所述第二限制性内切酶为^ ¾?kl。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110342351.7A CN103088433B (zh) | 2011-11-02 | 2011-11-02 | 全基因组甲基化高通量测序文库的构建方法及其应用 |
CN201110342351.7 | 2011-11-02 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2013064066A1 true WO2013064066A1 (zh) | 2013-05-10 |
Family
ID=48191334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2012/083821 WO2013064066A1 (zh) | 2011-11-02 | 2012-10-31 | 全基因组甲基化高通量测序文库的构建方法及其应用 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN103088433B (zh) |
WO (1) | WO2013064066A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105274629A (zh) * | 2015-11-17 | 2016-01-27 | 安诺优达基因科技(北京)有限公司 | 简化的表观重亚硫酸氢盐测序用文库的构建方法及试剂盒 |
CN111575347A (zh) * | 2020-05-19 | 2020-08-25 | 清华大学 | 构建用于同时获得血浆中游离dna甲基化和片段化模式信息的文库的方法 |
CN112126987A (zh) * | 2020-08-19 | 2020-12-25 | 深圳思凝一云科技有限公司 | 一种用于甲基化扩增子测序的建库方法 |
CN114480576A (zh) * | 2022-01-26 | 2022-05-13 | 纳昂达(南京)生物科技有限公司 | 靶向甲基化测序文库的构建方法及试剂盒 |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10023856B2 (en) * | 2013-09-25 | 2018-07-17 | Thermo Fisher Scientific Baltics Uab | Enzyme composition for DNA end repair, adenylation, phosphorylation |
CN104611410A (zh) * | 2013-11-04 | 2015-05-13 | 北京贝瑞和康生物技术有限公司 | 一种无创癌症检测方法及其试剂盒 |
CN103555856B (zh) * | 2013-11-15 | 2015-02-11 | 复旦大学 | 一种全基因组dna甲基化的导向测序技术 |
CN107075732B (zh) * | 2014-11-25 | 2020-08-04 | 深圳华大智造科技有限公司 | 游离dna测序文库的构建方法 |
CN104532360B (zh) * | 2014-12-17 | 2017-02-22 | 北京诺禾致源科技股份有限公司 | 全基因组甲基化测序文库及其构建方法 |
CN104480214B (zh) * | 2014-12-30 | 2018-01-16 | 深圳市易基因科技有限公司 | 羟甲基化暨甲基化长序列标签测序技术 |
CN104694635B (zh) * | 2015-02-12 | 2017-10-10 | 北京百迈客生物科技有限公司 | 一种高通量简化基因组测序文库的构建方法 |
CN104946623A (zh) * | 2015-04-08 | 2015-09-30 | 浙江圣庭生物科技有限公司 | 基于Illumina Hiseq 2500测序平台的小片段DNA文库的构建方法 |
CN105002567B (zh) * | 2015-06-30 | 2017-10-13 | 北京百迈客生物科技有限公司 | 无参考基因组高通量简化甲基化测序文库的构建方法 |
WO2017027779A1 (en) * | 2015-08-13 | 2017-02-16 | Centrillion Technology Holdings Corporation | Library construction using y-adapters and vanishing restriction sites |
MX2018008197A (es) * | 2015-12-31 | 2019-02-20 | Quest Diagnostics Invest Llc | Composiciones y metodos para cribar mutaciones en el cancer de tiroides. |
CN106283198B (zh) * | 2015-12-31 | 2021-08-13 | 浙江安诺优达生物科技有限公司 | 用于单细胞全基因组重亚硫酸氢盐测序的文库构建方法 |
CN105506109A (zh) * | 2015-12-31 | 2016-04-20 | 安诺优达基因科技(北京)有限公司 | 一种单细胞简化代表性重亚硫酸氢盐测序的方法及试剂盒 |
CN105986030A (zh) * | 2016-02-03 | 2016-10-05 | 广州市基准医疗有限责任公司 | 甲基化dna检测方法 |
CN106701939A (zh) * | 2016-12-22 | 2017-05-24 | 中国热带农业科学院热带生物技术研究所 | 一种胞嘧啶甲基化挖掘的方法 |
CN106980774A (zh) * | 2017-03-29 | 2017-07-25 | 电子科技大学 | 一种dna甲基化芯片数据的扩展方法 |
CN107190003A (zh) * | 2017-06-09 | 2017-09-22 | 武汉天问生物科技有限公司 | 一种高效快速分离t‑dna插入位点侧翼序列的方法及其用途 |
EP3646326A4 (en) * | 2017-06-28 | 2021-06-16 | Icahn School of Medicine at Mount Sinai | METHOD FOR HIGH RESOLUTION MICROBIOMANALYSIS |
CN107460238A (zh) * | 2017-07-07 | 2017-12-12 | 沈阳宁沪科技有限公司 | 一种无创高通量甲基化前列腺癌诊断、研究和治疗方法 |
CN107451419B (zh) * | 2017-07-14 | 2020-01-24 | 浙江大学 | 通过计算机程序模拟产生简化dna甲基化测序数据的方法 |
CN107541791A (zh) * | 2017-10-26 | 2018-01-05 | 中国科学院北京基因组研究所 | 血浆游离dna甲基化检测文库的构建方法、试剂盒及应用 |
CN108034705A (zh) * | 2018-01-15 | 2018-05-15 | 武汉爱基百客生物科技有限公司 | 一种全基因组甲基化高通量测序方法 |
CN108251504A (zh) * | 2018-01-17 | 2018-07-06 | 翌圣生物科技(上海)有限公司 | 一种超快速构建基因组dna测序文库的方法和试剂盒 |
CN108753923A (zh) * | 2018-06-04 | 2018-11-06 | 广州微芯生物科技有限公司 | 一种构建甲基化测序文库的方法及相应的接头序列和试剂盒 |
CN108866155B (zh) * | 2018-06-11 | 2022-07-26 | 中国农业科学院深圳农业基因组研究所 | 一种下一代测序文库的制备方法 |
CN109402285A (zh) * | 2018-11-09 | 2019-03-01 | 北京林业大学 | 一种基于全基因组dna甲基化位点基因型的分型方法 |
CN109943628A (zh) * | 2018-12-11 | 2019-06-28 | 北京中科遗传与生殖医学研究院有限责任公司 | 利用DedscRRBS分析法对活检细胞进行PGS及甲基化分析的方法 |
CN113166809B (zh) * | 2018-12-29 | 2023-12-26 | 深圳华大生命科学研究院 | 一种dna甲基化检测的方法、试剂盒、装置和应用 |
CN109629009B (zh) * | 2019-01-10 | 2022-02-22 | 北京中科遗传与生殖医学研究院有限责任公司 | 一种基于RAD-seq对胚胎进行无创PGS的方法 |
CN113490750B (zh) * | 2019-05-21 | 2024-03-22 | 深圳华大智造科技股份有限公司 | 微量dna甲基化高通量测序方法 |
CN110331446A (zh) * | 2019-08-27 | 2019-10-15 | 上海鹍远生物技术有限公司 | Dna甲基化标志物筛查试剂盒及方法 |
GB201913594D0 (en) * | 2019-09-20 | 2019-11-06 | Univ Birmingham | Epigenetic profiling method |
CN110669824A (zh) * | 2019-10-11 | 2020-01-10 | 广州迈森致远基因科技有限公司 | 低起始量血浆游离dna甲基化建库试剂盒及方法 |
CN110820050A (zh) * | 2019-11-22 | 2020-02-21 | 北京吉因加科技有限公司 | 全基因组甲基化非重亚硫酸氢盐测序文库及构建 |
CN112779320B (zh) * | 2020-12-04 | 2023-07-14 | 深圳市易基因科技有限公司 | 多区域dna甲基化检测探针设计及其检测方法 |
CN113421608B (zh) * | 2021-07-03 | 2023-12-01 | 南京世和基因生物技术股份有限公司 | 肝癌早筛模型的构建方法、检测装置以及计算机可读取介质 |
CN113604540B (zh) * | 2021-07-23 | 2022-08-16 | 杭州圣庭医疗科技有限公司 | 一种利用血液循环肿瘤dna快速构建rrbs测序文库的方法 |
CN113550013B (zh) * | 2021-07-23 | 2022-11-01 | 杭州圣庭医疗科技有限公司 | 一种利用福尔马林固定石蜡包埋样本快速构建rrbs测序文库的方法 |
CN114045342A (zh) * | 2021-12-01 | 2022-02-15 | 大连晶泰生物技术有限公司 | 一种游离DNA(cfDNA)甲基化突变的检测方法及试剂盒 |
CN114507737A (zh) * | 2022-03-22 | 2022-05-17 | 杭州医学院 | 一种石棉相关疾病甲基化标记物的检测引物组合、试剂盒及扩增子测序文库的构建方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101979545B (zh) * | 2010-11-12 | 2013-02-27 | 深圳华大基因科技有限公司 | 一种用于定向克隆的核苷酸序列及载体 |
CN102533944B (zh) * | 2010-12-10 | 2014-04-09 | 深圳华大基因科技服务有限公司 | 用于甲基化dna的富集和测序的半甲基化接头及其用途 |
-
2011
- 2011-11-02 CN CN201110342351.7A patent/CN103088433B/zh active Active
-
2012
- 2012-10-31 WO PCT/CN2012/083821 patent/WO2013064066A1/zh active Application Filing
Non-Patent Citations (3)
Title |
---|
GU, H. ET AL.: "Preparation of reduced representation bisulfite sequencing libraries for genome-scale DNA methylation profiling", NATURE PROTOCOLS, vol. 6, no. 4, 17 March 2011 (2011-03-17), pages 468 - 481, XP055151116, doi:10.1038/nprot.2010.190 * |
SMITH, Z.D. ET AL.: "High-throughput bisulfite sequencing in mammalian genomes", METHODS, vol. 48, no. 3, July 2009 (2009-07-01), pages 226 - 232 * |
TAQI COMMODITY WEBPAGE, 22 November 2012 (2012-11-22), Retrieved from the Internet <URL:http://www.superri.com/productsdetail/&productId=2720.html> [retrieved on 20121122] * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105274629A (zh) * | 2015-11-17 | 2016-01-27 | 安诺优达基因科技(北京)有限公司 | 简化的表观重亚硫酸氢盐测序用文库的构建方法及试剂盒 |
CN111575347A (zh) * | 2020-05-19 | 2020-08-25 | 清华大学 | 构建用于同时获得血浆中游离dna甲基化和片段化模式信息的文库的方法 |
CN112126987A (zh) * | 2020-08-19 | 2020-12-25 | 深圳思凝一云科技有限公司 | 一种用于甲基化扩增子测序的建库方法 |
CN114480576A (zh) * | 2022-01-26 | 2022-05-13 | 纳昂达(南京)生物科技有限公司 | 靶向甲基化测序文库的构建方法及试剂盒 |
Also Published As
Publication number | Publication date |
---|---|
CN103088433A (zh) | 2013-05-08 |
CN103088433B (zh) | 2014-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2013064066A1 (zh) | 全基因组甲基化高通量测序文库的构建方法及其应用 | |
JP6571895B1 (ja) | 核酸プローブ及びゲノム断片検出方法 | |
US9518295B2 (en) | High-throughput sequencing method for methylated DNA and use thereof | |
CN105531375B (zh) | 靶向基因组分析的方法 | |
EP3192869B1 (en) | Isolated oligonucleotide and use thereof in nucleic acid sequencing | |
WO2012037878A1 (zh) | 核酸标签及其应用 | |
US10100351B2 (en) | High-throughput sequencing detection method for methylated CpG islands | |
WO2012068919A1 (zh) | DNA文库及其制备方法、以及检测SNPs的方法和装置 | |
WO2020135259A1 (zh) | 一种测序文库构建试剂盒及其使用方法和应用 | |
WO2012159564A1 (zh) | 甲基化高通量检测方法 | |
WO2013056640A1 (zh) | 核酸文库的制备方法及其应用以及试剂盒 | |
WO2012071985A1 (zh) | 从ffpe样本中提取dna的方法及其用途 | |
WO2012079486A1 (zh) | 制备用于测序的dna样品的方法及其应用 | |
WO2012028105A1 (zh) | 测序文库及其制备方法、确定核酸末端序列的方法和系统 | |
EP1929039A2 (en) | High throughput screening of mutagenized populations | |
JP2010535513A (ja) | 高スループット亜硫酸水素dnaシークエンシングのための方法および組成物ならびに有用性 | |
WO2013075629A1 (zh) | 一种检测核酸羟甲基化修饰的方法及其应用 | |
WO2018191702A2 (en) | Methods of attaching adapters to sample nucleic acids | |
WO2016082130A1 (zh) | 一种核酸的双接头单链环状文库的构建方法和试剂 | |
CN107858409B (zh) | 一种微量降解基因组dna甲基化建库测序方法及其试剂盒 | |
CN113668068B (zh) | 基因组甲基化文库及其制备方法和应用 | |
CN111378720A (zh) | 长链非编码rna的测序文库构建方法及其应用 | |
WO2022199242A1 (zh) | 一组条码接头以及中通量多重单细胞代表性dna甲基化建库和测序方法 | |
WO2012075959A1 (zh) | 半甲基化接头及其用途 | |
JP2002537774A (ja) | 多型dnaフラグメントおよびその使用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 12846234 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 12846234 Country of ref document: EP Kind code of ref document: A1 |