WO2012037878A1 - 核酸标签及其应用 - Google Patents

核酸标签及其应用 Download PDF

Info

Publication number
WO2012037878A1
WO2012037878A1 PCT/CN2011/079900 CN2011079900W WO2012037878A1 WO 2012037878 A1 WO2012037878 A1 WO 2012037878A1 CN 2011079900 W CN2011079900 W CN 2011079900W WO 2012037878 A1 WO2012037878 A1 WO 2012037878A1
Authority
WO
WIPO (PCT)
Prior art keywords
dna
strand
sequence
library
pcr
Prior art date
Application number
PCT/CN2011/079900
Other languages
English (en)
French (fr)
Inventor
孙继华
闫淑静
王君文
罗慧娟
王俊
Original Assignee
深圳华大基因科技有限公司
深圳华大基因研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳华大基因科技有限公司, 深圳华大基因研究院 filed Critical 深圳华大基因科技有限公司
Publication of WO2012037878A1 publication Critical patent/WO2012037878A1/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Definitions

  • the invention relates to the field of biotechnology. Specifically, it relates to whole-genome thiolation high-throughput sequencing technologies, particularly in the field of micro-DNA whole-genome thiolation high-throughput sequencing technologies. More specifically, it relates to an isolated nucleic acid tag, an isolated oligonucleotide, a set of PCR primers, a method of constructing a whole genome thiolated high-throughput sequencing library, and a genome-wide thiolation high A flux sequencing library, a method for determining a thiolation site of a genomic sample, and a kit for constructing a genome-wide thiolated high throughput sequencing library.
  • DNA thiolation is the most in-depth epigenetic mechanism in research. DNA thiolation is responsible for maintaining normal cell function, inhibiting the damage of genomic integrity by parasitic DNA components, chromatin structure modification, X chromosome inactivation, genomic imprinting, and embryos. It plays an important role in development and human tumorigenesis and is one of the new research hotspots.
  • Illumina GA is the most popular new high-throughput sequencing instrument in use today and has been successfully applied to genome-wide thiosylation sequencing studies.
  • the main main defects or problems of this method are as follows: 1. It is not possible to mix multiple samples for thiolated library construction; 2. PCR amplification efficiency is not high, and multiple cycles (16 cycles or more) are required for amplification to obtain sufficient amount.
  • the library is subjected to high-throughput sequencing; 3.
  • the library construction starts with genomic DNA of 5-10 ⁇ or more, and is not suitable for DNA sample building.
  • the present invention aims to solve at least one of the technical problems existing in the prior art.
  • the invention proposes an isolated nucleic acid tag.
  • the nucleic acid sequence of the isolated nucleic acid tag is AACCAA.
  • the invention provides an isolated oligonucleotide.
  • the oligonucleotide has a first strand and a second strand, wherein the sequence of the first strand is ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCAAT (SEQ ID NO: 1);
  • nucleic acid tag can be conveniently and efficiently introduced into a constructed sequencing library (also referred to herein as a whole-genome thiolated high-throughput sequencing library) by a ligation reaction.
  • the invention proposes a set of PCR primers.
  • the set of PCR primers comprises a first PCR primer and a second PCR primer, wherein the sequence of the first PCR primer is
  • AACCAA (SEQ ID NO: 3); and the sequence of the second PCR primer is TTCCGATCTAACCAA (SEQ ID NO: 4).
  • the PCR primers in this group contain nucleic acid tags, which can effectively improve the efficiency of PCR amplification.
  • the method of constructing a whole genome thiolated high-throughput sequencing library comprises the steps of: fragmenting genomic DNA to obtain a DNA fragment; performing end-repairing of the DNA fragment to obtain end-repair a DNA fragment; ⁇ the base A is added to the end of the end-repaired DNA fragment to obtain a DNA fragment having a sticky end A; the DNA fragment having the sticky end A and claim 2
  • the isolated oligonucleotides are linked to obtain a linker having a tag linker; the linker-ligated ligation product is treated with bisulfite to provide the tagged linker product Converting the thiolated cytosine to uracil, obtaining a transformed ligation product; amplifying the transformed ligation product using the set of PCR primers of claim 3 to obtain an amplification product;
  • a genome-wide thiolated high throughput sequencing library is presented.
  • a whole genome thiolated high throughput sequencing library was constructed according to the methods previously described.
  • a method of determining a thiolation site of a genomic sample comprises the steps of constructing a genome-wide thiolated high-throughput sequencing library of the genomic sample according to the method described above; and the whole genome thiolated high-throughput sequencing library Sequencing is performed to determine the thiolation site of the genomic sample.
  • the thiolation site in the genomic sample can be efficiently determined.
  • the invention provides a kit for constructing a whole genome thiolated high throughput sequencing library.
  • the kit comprises: an isolated oligonucleotide having a first strand and a second strand, wherein the sequence of the first strand is ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCAAT (SEQ ID NO: 1) ; said
  • cytosine C in the first strand and the second strand are both thiolated; a set of PCR primers comprising a first PCR primer and a second PCR primer, wherein The sequence of the first PCR primer is
  • AACCAA SEQ ID NO: 3
  • sequence of the second PCR is
  • Figure 1 Flow chart of a construction of a microDNA whole genome thiolated high throughput sequencing library in accordance with one embodiment of the present invention.
  • Figure 2 Schematic diagram of the construction of a trace DNA whole genome thiolated high throughput sequencing library in accordance with one embodiment of the present invention.
  • Figure 3 The results of a method according to an embodiment of the present invention, using 1000 ng of micro DNA to initiate micro-banking, and using Agilent 2100 to detect PCR amplification products.
  • Figure 4 The results of a method according to an embodiment of the present invention, using 30 ng of trace DNA to initiate micro-banking, and using Agilent 2100 to detect PCR amplification products.
  • Figure 5 Agilent 2100 assay results using the lOOng starting genomic DNA using the conventional Illumina linker to construct the PCR amplification product obtained according to the method of the present invention.
  • Figure 6 Comparison of sequencing depths of chromosomes of the entire genome according to the data of the library (lOOng DNA) and the conventional database (5 g DNA) according to an embodiment of the present invention.
  • Figure 7 Comparison of chromosome coverage by ⁇ : Quantitative database (100 ng DNA) and conventional database (5 g DNA) sequencing data according to an embodiment of the present invention.
  • Figure 8 Comparison of the numerator model of the Quantitative Database (lOOng D NA ) and the conventional database (5 g DNA) in accordance with an embodiment of the present invention.
  • Fig. 9 is a comparative analysis of the correlation between the quantitative database (lOOng DNA) and the conventional database (5 g DNA) sequencing data according to an embodiment of the present invention.
  • the Methylation rate of YH_3.5G indicates the thiolation rate of YH_3.5G
  • the Methylation rate of lOOng indicates the microenzyme formation rate of 1 OOng DNA.
  • first and second are used for descriptive purposes only, and are not to be construed as indicating or implying relative importance or implicitly indicating the number of technical features indicated. Thus, features defining “first”, “second” may explicitly or implicitly include one or more of the features. Further, in the description of the present invention, “multiple” means two or more unless otherwise stated.
  • Illumina GA is the most popular new high-throughput sequencing instrument in use today and has been successfully applied to genome-wide thiosylation sequencing studies.
  • the main main defects or problems of this method are as follows: 1. It is not possible to mix multiple samples for thiolated library construction; 2. PCR amplification efficiency is not high, and multiple cycles (16 cycles or more) are required for amplification to obtain sufficient amount.
  • the library is subjected to high-throughput sequencing; 3.
  • the library construction requires genomic DNA of 5-10 ⁇ ⁇ or more, which is not suitable for micro-DNA sample construction.
  • the invention proposes an isolated nucleic acid tag.
  • the nucleic acid sequence of the isolated nucleic acid tag is AACCAA.
  • the present invention provides an isolated oligonucleotide.
  • the oligonucleotide has a first strand and a second strand,
  • the sequence of the second strand is wherein cytosine C in the first strand and the second strand are both thiolated.
  • Based on the oligonucleotide having a sticky end T thus, by forming a sticky end A on the DNA fragment, it is convenient to introduce the tag sequence into the sequencing library using the oligonucleotide.
  • a nucleic acid tag into a constructed sequencing library (also referred to herein as a genome-wide thiolated high-throughput sequencing library) can be used to efficiently determine thiolation sites in genomic DNA.
  • the invention also proposes a set of PCR primers.
  • the set of PCR primers comprises a first PCR primer and a second PCR primer, wherein the sequence of the first PCR primer is
  • the PCR reaction efficiently amplifies a DNA fragment to which a nucleic acid tag is attached.
  • the inventors have found that the efficiency of PCR amplification can be significantly improved by using the set of PCR primers.
  • a method of constructing a whole genome thiolated high throughput sequencing library comprises the steps of:
  • the genomic DNA is fragmented to obtain a DNA fragment.
  • the source of genomic DNA as a starting material is not particularly limited.
  • the inventors of the present invention have surprisingly found that a method of constructing a genome-wide thiolated high-throughput sequencing library according to an embodiment of the present invention can be applied to micro genomic DNA, for example, genomic DNA that can be used according to one embodiment of the present invention.
  • the amount is 30 - 100ng.
  • the genomic DNA is not particularly limited and may be at least one derived from mammals, plants, and microorganisms, for example, at least one mammal is human and mouse, and the plant is Arabidopsis thaliana.
  • a method and apparatus for fragmenting genomic DNA which can be used are not particularly limited.
  • DNA fragmentation can be performed by at least one of nebulization, ultrasonic fragmentation, HydroShear, and enzymatic digestion.
  • the genomic DNA is preferably fragmented by sonication. Thereby, the size of the obtained fragment can be easily controlled, thereby improving the efficiency of constructing the library.
  • the size of the obtained DNA fragment is not particularly limited.
  • the DNA fragment which can be used has a length of 100 to 200 bp.
  • the inventors have found that when a 100-200 bp DNA fragment is used, the efficiency of subsequent ligation, amplification, and the like can be remarkably improved, thereby improving the efficiency of constructing the library and analyzing the efficiency of thiolation.
  • the obtained DNA fragment is subjected to end repair to obtain a DNA fragment which has been subjected to end repair.
  • end repair By repairing the DNA fragments to obtain blunt-ended DNA fragments, it is convenient to connect the streets with nucleic acid tags by subsequent processing.
  • the method and means for end-repairing a DNA fragment are not particularly limited, and according to some embodiments of the present invention, the DNA fragment can be terminated by Klenow, T4 polymerase and T4 polynucleotide kinase. repair. Thereby, the efficiency of the end repair process can be improved, and the efficiency of constructing the library can be improved.
  • DNA fragment of A is added to the end of the end-repaired DNA fragment using Klenow Frgment (3'-5' exo-) polymerase.
  • Klenow Frgment (3'-5' exo-) polymerase The inventors have found that the use of the polymerase to add base A can significantly increase the efficiency of constructing the library.
  • the resulting DNA fragment having a sticky terminal A was ligated to the isolated oligonucleotide described above to obtain a ligation product having a tag linker. Because the isolated oligonucleotide described above has a first strand and a
  • the sequence of the second strand is wherein cytosine c in the first strand and the second strand are both thiolated.
  • the tag linker has a sticky end ⁇ , and thus, the nucleic acid tag can be efficiently introduced into the DNA fragment having the sticky end A at the end by a ligation reaction, thereby remarkably improving the efficiency of constructing the library.
  • the prepared linker-ligated ligation product is treated with bisulfite, whereby the non-thiolated cytosine in the ligation product having the tag linker can be converted to uracil to obtain a converted ligation product.
  • the conversion with bisulfite can be accomplished using any known method.
  • a commercially available kit can be used, such as ZYMO EZ DNA Methylation-Gold KitTM.
  • the fragmented Arabidopsis genomic DNA can be added during the treatment of the ligation product with the tag linker using bisulfite.
  • the inventors have found that by adding exogenous DNA for efficient co-sulfite co-treatment, the target DNA fragment can be protected, and the damage of micro-sulfite to micro-DNA can be minimized, which can further improve the detection precision.
  • the gram-level (30-100ng) genome-wide high-precision thiolization detection becomes a reality.
  • the amount of fragmented Arabidopsis genomic DNA that can be added is not particularly limited, and according to a specific example, the amount of fragmented Arabidopsis genomic DNA is preferably 100-500 ng, more preferably 200 ng. .
  • these Arabidopsis genomic DNAs can be prepared by any method, for example, can be prepared along with the previous DNA fragmentation treatment.
  • the transformed ligation product is amplified using a set of PCR primers as described above to obtain an amplification product.
  • the type of polymerase which can be used for the PCR reaction is not particularly limited, and according to a specific example, a hot start taq polymerase, preferably a hot start taq polymerase, may be used as the r-taq polymerase.
  • the resulting amplification products are isolated and these amplification products constitute a genome-wide thiolated high-throughput sequencing library.
  • the amplification products can be separated by any known method. For example, it is preferred to perform electrophoresis and purification using a 2% agarose gel, thereby efficiently separating the amplified products, and finally obtaining a whole genome thiolated high-throughput sequencing library.
  • a genome-wide thiolated high-throughput sequencing library can be efficiently constructed by the method according to the present invention, and further, according to the method of the embodiment of the present invention, fragment size selection is not required, and PCR is directly performed after bisulfite treatment. Conditions for amplification. It overcomes the shortcomings of the inability to mix samples in conventional thiolation sequencing, the low efficiency of PCR amplification and the inability to study micro DNA samples. Further, according to the method of the embodiment of the present invention, it is not necessary to subject the fragment size selection before the bisulfite treatment, and then the PCR amplification process can be carried out directly after the bisulfite treatment. It overcomes the shortcomings of the inability to mix samples in conventional thiolation sequencing, the low efficiency of PCR amplification and the inability to study micro DNA samples.
  • a genome-wide thiolated high throughput sequencing library is presented.
  • a whole genome thiolated high throughput sequencing library was constructed according to the methods previously described.
  • This whole-genome thiolated high-throughput sequencing library enables efficient sequencing of trace DNA samples and further analysis of thiolation sites.
  • sequencing using a second generation sequencing platform can be preferably employed.
  • high-throughput sequencing of genome-wide thiolation can be achieved.
  • the inventors have found that a sequencing library constructed by the method of constructing a sequencing library according to an embodiment of the present invention is particularly suitable for sequencing by an Illumina GA sequencing instrument.
  • a method of determining a thiolation site of a genomic sample comprises the steps of: first, constructing a genome-wide thiolated high-throughput sequencing library of the genomic sample according to the method described above for the extracted genomic sample; The prepared whole genome thiolated high throughput sequencing library is sequenced to determine the thiolation site of the genomic sample. Thereby, the thiolation site in the genomic sample can be efficiently determined.
  • sequencing using a second generation sequencing platform can be preferably employed. Thereby, high-throughput sequencing of genome-wide thiolation can be achieved.
  • a sequencing library constructed by the method of constructing a sequencing library according to an embodiment of the present invention is particularly suitable for sequencing by an Illumina GA sequencing instrument.
  • it is particularly preferred to perform sequencing using Illumina GA.
  • the invention provides a kit for constructing a whole genome thiolated high throughput sequencing library.
  • the kit comprises: an isolated oligonucleotide having a first strand and a second strand, wherein the sequence of the first strand is ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCAAT (SEQ ID NO: 1); second strand
  • cytosine C in the first strand and the second strand are both thiolated; a set of PCR primers.
  • the first PCR primer and the second PCR primer are included, wherein the sequence of the first PCR primer is
  • TTCCGATCTAACCAA SEQ ID NO: 4
  • the present invention provides a method for genome-wide thiolation high throughput sequencing comprising the steps of:
  • the starting material for the study and the material used as the exogenous genomic DNA may be genomic DNA of any species (eg, human, plant, insect), and methods commonly used for fragmentation include atomization, ultrasonic fragmentation, HydroShear or restriction enzyme digestion, and genomes.
  • the DNA was interrupted into fragments of 100-200 bp in size.
  • ultrasonic fragmentation it is preferred to use ultrasonic fragmentation, and the exogenous genomic DNA preferably selects Arabidopsis genomic DNA.
  • Fragmented DNA requires end-modification, first using a polymerase such as Klenow, T4 polymerase and T4 polynucleotide kinase and dNTP to fill the ends to produce blunt-ended DNA. Klenow Frgment (3'-5' exo-) polymerase and dATP were then used to prime the "A" base at the 3' end of the filled sequence.
  • a polymerase such as Klenow, T4 polymerase and T4 polynucleotide kinase and dNTP
  • Step C Micro-construction joint connection and bisulfite treatment
  • the sequence of the "A" base at the 3' end was ligated with a specially designed and thiolated modified micro-banking linker (C-site thiolation modification) under the action of T4 ligase. Then, 200 ng of the fragmented Arabidopsis genomic DNA was added to the fragment to which both ends were ligated, and then treated with bisulfite, thereby converting non-thiolated cytosine to uracil.
  • Step D PCR amplification and library gel purification
  • PCR amplification preferably uses a hot start taq enzyme.
  • the advantages of the present invention over the existing thiolated high-throughput sequencing technology are as follows: 1. Replace the conventional library with a special linker (Minim-adapter) for the micro DNA cleavage library with higher PCR amplification efficiency.
  • the linker used which changed part of the sequence compared to the conventional linker, increased the length of the sequence by 8 bp (can be used as a tag sequence for sequencing of multiple samples), and adds subsequent PCR to the bisulfite-treated DNA. Amplification efficiency and product amount, the same material was used to build the library. The concentration of the product increased from 1.67 ng l to 20.04 ng/ ⁇ under the same PCR conditions (see Figure 6-8 for the results of the example). 2.
  • micro-genome When DNA is constructed into a thiolated library, the exogenous vector DNA and the target DNA are innovatively added for efficient co-sulfite co-processing.
  • Adding foreign DNA has a certain buffering effect on this destructive effect, which can maximize The reduction of the destruction of trace DNA by bisulfite, and the increase of the amount of DNA, the subsequent purification efficiency is improved, making the nano-scale (30-100ng) genome level high-precision thiolation detection become a reality. 3. Altering the Illumina thiolation routine sequencing.
  • the process of selecting the size of the fragment and then performing the PCR amplification is carried out, and a fragment size selection is not required, and the bisulfite treatment is performed.
  • the conditions for direct PCR amplification are shown in detail in the detailed parameters of the examples, which mainly change the amount of the terminal repair enzyme and the amount of the linker in the linker step (reduced to 1/10 of the conventional build amount).
  • the method of the invention overcomes the disadvantages of the inability to mix samples in conventional thiolation sequencing, the low efficiency of PCR amplification and the inability to study micro-DNA samples. For low Sample size samples can also be accurately studied for genome-wide thiolation.
  • a method of constructing a whole genome thiolated high throughput sequencing library for use in microgenomic DNA preferably a nanogram-level genome, more preferably a 30-100 ng genome .
  • the method comprises the following steps:
  • the target genomic DNA and the material as the foreign genomic DNA may be any species including genomic DNA of various plants, animals, microorganisms, such as humans, plants, especially Arabidopsis, insects, especially mammals including humans and mice.
  • the method of fragmentation includes atomization, ultrasonic fragmentation, HydroShear or restriction enzyme digestion to break the genomic DNA into fragments of preferably 100-200 bp in size; in the fragmentation method, preferably by ultrasonic fragmentation, Exogenous genomic DNA preferably selects Arabidopsis genomic DNA;
  • a polymerase including but not limited to Klenow, T4 polymerase and T4 polynucleotide kinase and dNTP to fill the ends to generate blunt-ended DNA; then preferably using Klenow Frgment (3 ' -5, exo-) polymerase and dATP add "A" base to the 3' end of the filled sequence.
  • Step C Micro-construction joint connection and bisulfite treatment
  • the DNA sequence of the obtained 3' end plus "A" base is modified by a ligase, including but not limited to T4 ligase, with a thiolation modification, preferably a C site thiolation modification.
  • the linker is ligated, preferably a micro-banking linker is ligated at both ends of the sequence; then 100-500 ng, preferably 200 ng of the fragmented Arabidopsis genomic DNA in step A is added to the fragment with the linker added at both ends, and then Treated together with bisulfite, preferably for 2 hours, thereby converting non-thiolated cytosine to uracil;
  • Step D PCR amplification and library gel purification
  • PCR primer sequences for the micro-splicing linker sequence are added for PCR amplification; PCR amplification preferably uses a hot-start taq enzyme, and the hot-start taq enzyme includes However, it is not limited to the conventional r-taq or other polymerase, and the amplification product is electrophoresed using preferably 2% agarose and the target band is excised and purified, which is the library to be sequenced.
  • the micro-architecture joints used in step C of the method are the Minim adapter 1 and the Minim adapter 2 shown in Table 1.
  • PCR primers used in step D of the method described in one embodiment of the present invention are Minim-PCR primer 1.1 and Minim_PCR primer 2.1 shown in Table 1.
  • Another aspect of the invention provides a sequencing library constructed by the method described above, preferably a DNA whole genome merging high throughput sequencing library.
  • a further aspect of the invention further provides a sequencing library constructed by the method described above, preferably a trace DNA whole genome thiolated high throughput sequencing library for sequencing, wherein the sequencing can be performed by a second On behalf of the sequencing platform.
  • Another aspect of the invention provides a linker for a microsequencing library, particularly a micro-DNA whole genome thiolated high throughput sequencing library, which is Minim adapter 1 and Minim-adapter 2 shown in Table 1.
  • the linker is useful for constructing a microsequencing library, particularly a micro-DNA whole genome thiolated high throughput sequencing library.
  • a microsequencing library constructed using the linker described above, particularly a micro-DNA whole genome thiolated high throughput sequencing library, is used.
  • Another aspect of the invention also provides PCR primers for microsequencing libraries, particularly microgenomic whole genome thiolated high throughput sequencing libraries, which are Minim_PCR primer 1.1 and Minim_PCR primer 2.1 shown in Table 1.
  • the PCR primers are used to construct a microsequencing library, particularly a micro
  • a microsequencing library constructed using the PCR primers described above, in particular a micro-DNA whole genome thiolated high throughput sequencing library, is used.
  • the embodiments of the present invention will be described in detail below with reference to the accompanying drawings, however, Where the specific techniques or conditions are not indicated in the examples, the techniques or conditions described in the literature in the field (for example, refer to J. Sambrook et al., Huang Peitang et al., Molecular Cloning Experimental Guide, Third Edition, Science Press) or in accordance with the product manual.
  • the reagents or instruments used are not indicated by the manufacturer, and are all conventional products that can be obtained commercially.
  • micro-genome thiolated high-throughput sequencing libraries were constructed using 30 ng and 100 ng of human peripheral blood whole genome DNA (genomic DNA extracted from Chinese adult male blood) as a starting material. S The quality of the two libraries was tested by Sanger sequencing method, and high-throughput whole genome sequencing (Illumina GA) was performed on lOOng library.
  • the micro-banking method of the present invention was compared with 100 ng human peripheral blood whole genomic DNA (the genomic DNA extracted from blood of Chinese adult males), and the joints were respectively used with conventional building joints [commercialized Illumina] Adapterl and Illumina adapter2, see Illumina's protocol, Multiplexing Sample Preparation Guide. (Illumina part # 1005361), in which is incorporated by reference in this article and micro-linkers (Minim-adapterl and Minim_adapter2) for PCR amplification efficiency difference. ⁇ ⁇
  • the interrupted DNA is directly subjected to the next step.
  • Thermomixer (Eppendrf) was adjusted to 20 °C for 30 min, then purified using QIAquick PCR Purification Kit (Qiagen), and finally the sample was dissolved in 32 L of elution buffer (EB). 1.3 DNA fragment 3' end plus base "A"
  • Thermomixer (Eppendrf) was adjusted to 37 °C for 30 min, then purified using a MiniElute PCR Purification Kit (Qiagen), and the sample was finally dissolved in 10 elution buffer.
  • the synthesized ⁇ ⁇ Miniim-adapter 1 and Minim-adapter 2 were respectively mixed and ⁇ were mixed, 94 ° C, 5 minutes, 65 ° C water bath for 15 minutes and then naturally cooled to obtain 5 ⁇ Minim-adapter product, 5 ⁇ Minim-adapter product diluted 10 times to 5 ⁇ Minim-adapter working solution.
  • Kit (Qiagen) was purified and finally dissolved in 30 ⁇ L of EB.
  • CT Conversion Reagent Remove CT Conversion Reagent (solid mixture) from the kit, then add 900 ⁇ M of water, 50 ⁇ M-Dissolving Buffer and 300 ⁇ M M-Dilution Buffer to a tube of CT Conversion Reagent. Dissolve at room temperature and shake for 10 minutes or shake on a shaker for 10 minutes.
  • G) Load the sample into the Zymo-Spin lCTM Column containing the M-Binding Buffer. Cover the column and invert the column several times to mix the sample.
  • the reaction system was prepared in the following reaction system, and the reagent was placed on water.
  • the amplified product was purified by PCR Purification Kit (Qiagen), then electrophoresed with 2% agarose gel, and then the target size library was subjected to gelatinization selection, and the gel was purified by MiniElute PCR Purification Kit (Qiagen).
  • the library was dissolved in 20 ⁇ l ⁇ .
  • FIG. 3 and Figure 4 PCR products Agilent 2100 Bioanalyzer results show that 30 ng and 100 ng of starting genomic DNA can be used to construct high-throughput sequencing thiolated libraries using high-throughput next-generation sequencing instruments, combined with the actual The results of sequencing data analysis show that the method of the invention is feasible, applicable and practical.
  • Figure 5 is the Agilent 2100 Bioanalyzer test results of the PCR amplification products obtained by using the conventional Illumina linker according to the microbanking method of the present invention. Compared with Figure 3 and Figure 4, the PCR product in Figure 5 has a target band, but the band is not obvious, and the concentration does not meet the high-throughput sequencing requirements. It can be seen from the comparison that the method of the present invention does significantly improve the efficiency of PCR amplification and improve the efficiency of subsequent sequencing.
  • the lOOng library alignment rate (also known as map rate) is higher than 30 ng, indicating that the initial amount has a greater impact on the database construction results, but the 30 ng initial alignment rate is above 40%, taking into account the amount of starting DNA. The results are in an acceptable range.
  • sequence repetition rate there is no repeat sequence, indicating that PCR amplification is very random and has no bias.
  • the above constructed lOOng library was subjected to high-throughput sequencing and prepared in the same manner as the conventional database (conventional database method: using 5 ug of the same human whole blood genome as in the above example, using a conventional thiolated sequencing library)
  • the library was prepared by the procedure.
  • Illumina GA's product specification Multiplexing Sample Preparation Guide. (Illumina part # 1005361), which is incorporated herein by reference, for the high-order alignment analysis, 100 ng library sequencing data 2.52G original Data were compared with normal whole genome sequencing 1.99G data, and conventional database data was represented by YH_3.4G.
  • the distribution pattern is basically the same.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

公开了分离的核酸标签、分离的寡核苷酸、PCR引物、构建全基因组甲基化高通量测序文库的方法、全基因组甲基化高通量测序文库、确定基因组样品的甲基化位点的方法、以及用于构建全基因组甲基化高通量测序文库的试剂盒。其中,根据本发明的一个实施例的分离的核酸标签的核酸序列为AACCAA。

Description

核酸标签及其应用 优先权信息
本申请请求 2010 年 9 月 21 日向中国国家知识产权局提交的、 专利申请号为 2010102993 15.2的专利申请的优先权和权益, 并且通过参照将其全文并入此处。 技术领域
本发明涉及生物技术领域。 具体地, 涉及全基因组曱基化高通量测序技术, 特别 是微量 DNA全基因组曱基化高通量测序技术领域。 更具体地, 涉及一种分离的核酸标 签、 一种分离的寡核苷酸、 一组 PCR引物、 一种构建全基因组曱基化高通量测序文库的 方法、一种全基因组曱基化高通量测序文库、一种确定基因组样品的曱基化位点的方法、 以及一种用于构建全基因组曱基化高通量测序文库的试剂盒。
背景技术
DNA 曱基化是研究最为深入的表观遗传学机制, DNA 曱基化在维持正常细胞功 能、 抑制寄生 DNA成分对基因组完整性的损害、 染色质结构修饰、 X染色体失活、 基 因组印迹、 胚胎发育以及人类肿瘤发生中起着重要作用, 是目前新的研究热点之一。
然而, 目前对样本中 DNA曱基化的研究仍有待改进。
发明内容
本发明是基于发明人的下列发现完成的: Illumina GA 是当今应用最为普遍的新 一代高通量测序仪器, 现已经成功应用于全基因组曱基化测序研究。该方法的主要主要 缺陷或问题是: 1、 不能混合多个样品进行曱基化文库构建; 2、 PCR扩增效率不高, 需要多个循环 ( 16 个循环以上)扩增后方可得到足够量的文库进行高通量测序; 3、 文 库构建起始需要基因组 DNA 5- 10μ§以上, 不适宜 量 DNA样品建库。
本发明旨在至少解决现有技术中存在的技术问题之一。
为此, 根据本发明的第一方面, 本发明提出了一种分离的核酸标签。 根据本发明的 实施例, 该分离的核酸标签的核酸序列为 AACCAA。 利用该核酸标签, 通过在文库的构 建过程中, 将核酸标签引入到构建的测序文库中, 由此, 可以提高测序的效率。
根据本发明的第二方面, 本发明提供了一种分离的寡核苷酸。 根据本发明的实施例, 寡 核 苷 酸 具 有 第 一 链 和 第 二 链 , 其 中 , 所 述 第 一 链 的 序 列 为 ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCAAT ( SEQ ID NO: 1 ) ; 所述第
ID NO: ) 其中, 所述第一链和所述第二链中的胞嘧啶 C均被曱基化修饰。 借助该寡 ^ 苷酸, 能够通过连接反应, 方便有效地将核酸标签引入到构建的测序文库 (在本文中, 有 时也称为全基因组曱基化高通量测序文库) 中。
根据本发明的第三方面,本发明提出了一组 PCR引物。根据本发明的实施例,该组 PCR 引物包括第一 PCR 引物和第二 PCR 引物, 其中, 所述第一 PCR 引物的序列为
AACCAA ( SEQ ID NO: 3 ) ; 以及所 述 第 二 PCR 引 物 的 序 列 为 TTCCGATCTAACCAA ( SEQ ID NO: 4 )。 在该组 PCR引物中, 含有核酸标签, 可以有效 地提高 PCR扩增的效率。
根据本发明的第四方面, 提出了一种构建全基因组曱基化高通量测序文库的方法。 根 据本发明的实施例, 该构建全基因组曱基化高通量测序文库的方法包括以下步骤: 将基 因组 DNA片段化, 以便获得 DNA片段; 将所述 DNA片段进行末端修复,以便获得经 过末端修复的 DNA片段; ^所述经过末端修复的 DNA片段的末端添加碱基 A , 以便 获得具有粘性末端 A的 DNA片段; 将所述具有粘性末端 A的 DNA片段与权利要求 2 所述的分离的寡核苷酸相连, 以便获得具有标签接头的连接严物; 利用重亚硫酸盐对所 述具有标签接头的连接产物进行处理, 以便将所述具有标签接头的连接产物中非曱基化的 胞嘧啶转换为尿嘧啶, 获得经过转换的连接产物; 利用权利要求 3所述的一组 PCR引物, 对所述经过转换的连接产物进行扩增, 以便获得扩增产物; 以及分离所述扩增产物, 所述 扩增产物构成所述全基因组曱基化高通量测序文库。 通过该方法, 能够有效地构建全基 因组曱基化高通量测序文库, 另外, 根据本发明的实施例的方法, 不需要进行片段大小 选择, 在重亚硫酸盐处理后直接进行 PCR扩增的条件。 克服了常规曱基化测序中不能 混合样品, PCR 扩增效率低及不能对 量 DNA样品进行研究的缺点。
根据本发明的第五方面, 提出了一种全基因组曱基化高通量测序文库。 根据本发明 的实施例, 全基因组曱基化高通量测序文库是根据前面所述的方法构建的。
根据本发明的第六方面, 提出了一种确定基因组样品的曱基化位点的方法。 根据本 发明的实施例, 该方法包括以下步骤:根据前面所述的方法构建所述基因组样品的全基 因组曱基化高通量测序文库; 以及对所述全基因组曱基化高通量测序文库进行测序, 以 便确定所述基因组样品的曱基化位点。 由此, 可以有效地确定基因组样品中的曱基化位 点。
根据本发明的第七方面, 本发明提出了一种用于构建全基因组曱基化高通量测序 文库的试剂盒。 根据本发明的实施例, 该试剂盒包括: 一种分离的寡核苷酸, 所述寡核 苷 酸 具 有 第 一 链 和 第 二 链 , 其 中 , 所 述 第 一 链 的 序 列 为 ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCAAT ( SEQ ID NO: 1 ) ; 所述第
ID NO: ) 其中, 所述第一链和所述第二链中的胞嘧啶 C均被曱基化修饰; 一组 PCR引 物, 其包括第一 PCR 引物和第二 PCR 引物, 其中, 所述第一 PCR 引物的序列为
CTCTTCCGATCT
AACCAA ( SEQ ID NO : 3 ) ; 以 及所 述 第 二 PCR 的 序 列 为
AGACGTGTGCTC
TTCCGATCTAACCAA ( SEQ ID NO: 4 )。
前面所涉及的序列总结在下表 1中。
表 1 基于 Illumina G A的微量 DNA全基因组曱基化高通量测序相关序列( ;'->3' )
Figure imgf000003_0001
本发明的附加方面和优点将在下面的描述中部分给出, 部分将从下面的描述中变得 明显, 或通过本发明的实践了解到。 附图说明 本发明的上述和 /或附加的方面和优点从结合下面附图对实施例的描述中将变得明 显和容易理解, 其中:
图 1 : 根据本发明一个实施例的微量 DNA全基因组曱基化高通量测序文库构建流 程图。
图 2: 根据本发明一个实施例的微量 DNA全基因组曱基化高通量测序文库构建原 理示意图。
图 3: 按照根据本发明实施例的方法, 利用 lOOng 微量 DNA起始微量建库, 并 且利用安捷伦 2100对 PCR扩增产物进行检测的结果。
图 4: 按照根据本发明实施例的方法, 利用 30ng 微量 DNA起始微量建库, 并 且利用安捷伦 2100对 PCR扩增产物进行检测的结果。
图 5 : 利用 lOOng起始基因组 DNA, 釆用常规 Illumina 接头, 按照本发明方法建 库所得 PCR扩增产物的安捷伦 2100检测结果。
图 6: 根据本发明实施例的^:量建库 ( lOOng DNA ) 与常规建库 ( 5 g DNA ) 测 序数据对整个基因组各染色体测序深度比较结果。
图 7: 根据本发明实施例的^:量建库( lOOng DNA )与常规建库( 5 g DNA )测序 数据对染色体覆盖度比较结果。
图 8: 根据本发明实施例的^:量建库 ( lOOng D NA ) 与常规建库 ( 5 g DNA ) 测 序数据曱基化模式比较。
图 9: 根据本发明实施例的^:量建库 ( lOOng DNA ) 与常规建库 ( 5 g DNA ) 测 序数据曱基化相关性的比较分析。其中 Methylation rate of YH_3.5G表示 YH_3.5G的曱 基化率, Methylation rate of lOOng表示 1 OOng DNA微量建库 ^曱基化率。 发明详细描述
一 下面详细描述本发明的实施例, 所述实施例的示例在附图中示出, 其中自始至终相 图描述的实施例是示例性的, 仅用于解释本发明, 而不能理解为对本发明的限制。
需要说明的是, 术语 "第一" 、 "第二" 仅用于描述目的, 而不能理解为指示或暗 示相对重要性或者隐含指明所指示的技术特征的数量。 由此, 限定有 "第一"、 "第二" 的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地,在本发明的描述中, 除非另有说明, "多个" 的含义是两个或两个以上。
本发明是基于发明人的下列发现完成的: Illumina GA 是当今应用最为普遍的新 一代高通量测序仪器, 现已经成功应用于全基因组曱基化测序研究。该方法的主要主要 缺陷或问题是: 1、 不能混合多个样品进行曱基化文库构建; 2、 PCR扩增效率不高, 需要多个循环 ( 16 个循环以上)扩增后方可得到足够量的文库进行高通量测序; 3、 文 库构建起始需要基因组 DNA 5-10μ§以上, 不适宜微量 DNA样品建库。
为此, 根据本发明的第一方面, 本发明提出了一种分离的核酸标签。 根据本发明的 实施例, 该分离的核酸标签的核酸序列为 AACCAA。 利用该核酸标签, 通过在文库的构 建过程中, 将核酸标签引入到构建的测序文库中, 由此, 可以提高测序的效率。
为了能够将根据本发明实施例的标签引入到测序文库中, 根据本发明的第二方面, 本 发明提供了一种分离的寡核苷酸。 根据本发明的实施例, 寡核苷酸具有第一链和第二链,
ID NO : 1 ) ; 第 二 链 的 序 列 为 其中, 第一链和第二链中的胞嘧啶 C均被曱基化修饰。 基于该寡核苷酸具 ¾粘性末端 T, 因而, 通过在 DNA片段上形成粘性末端 A, 即可以方便地利用该寡核苷酸将标签序列引入 到测序文库中。 因而, 借助根据本发明实施例的寡核苷酸, 能够通过连接反应, 方便有效 地将核酸标签引入到构建的测序文库(在本文中, 有时也称为全基因组曱基化高通量测序 文库) 中, 进而可以有效地确定基因组 DNA中的曱基化位点。
根据本发明的第三方面, 本发明还提出了一组 PCR引物。 根据本发明的实施例, 该组 PCR 引物包括第一 PCR 引物和第二 PCR 引物, 其中, 第一 PCR 引物的序列为
AACCAA ( SEQ ID NO : 3 ) ; 第 二 PCR 引 物 的 序 歹' J 为
TTCCGATCTAACCAA ( SEQ ID NO: 4 )。 在该组 PCR引物中, 含有核酸标签, 可以通过
PCR反应高效地对连接有核酸标签的 DNA 片段进行扩增。 另外, 发明人发现, 利用该组 PCR引物可以显著地提高 PCR扩增的效率。
根据本发明的第四方面, 提出了一种构建全基因组曱基化高通量测序文库的方法。 参 考图 1 , 根据本发明的实施例, 该构建全基因组曱基化高通量测序文库的方法包括以下 步骤:
首先, 将基因组 DNA片段化, 以便获得 DNA片段。 根据本发明的实施例, 作为起 始材料的基因组 DNA的来源并不受特别限制。 本发明的发明人惊奇地发现, 根据本发 明实施例的构建全基因组曱基化高通量测序文库的方法可以适用于微量基因组 DNA, 例如根据本发明的一个实施例, 可以釆用的基因组 DNA的量为 30 - 100ng。 另外, 基 因组 DNA不受特别限制, 可以为来源于哺乳动物、 植物、 和微生物的至少一种, 例如 哺乳动物为人和小鼠的至少一种, 植物为拟南芥。 发明人发现, 根据本发明实施例的方 法特别适于构建这些生物基因组 DNA的文库, 用于高效地分析这些生物全基因组的曱 基化位点。根据本发明的实施例,可以釆用的对基因组 DNA进行片段化的方法和设备, 不受特别限制。 根据本发明的一些示例, 可以通过雾化、 超声片段化、 HydroShear和 酶切处理的至少一种进行 DNA片段化。 优选通过超声片段化进行将基因组 DNA片段 化。 由此, 可以容易控制所得到的片段的大小, 从而提高构建文库的效率。 根据本发明 的实施例, 所得到的 DNA片段的大小不受特别限制。 根据本发明的具体示例, 可以釆 用的 DNA片段的长度为 100-200bp。 发明人发现, 当釆用 100-200bp的 DNA片段时, 可以显著地提高后续连接、 扩增等处理的效率, 从而提高构建文库的效率, 和分析曱基 化的效率。
接下来, 将所得到的 DNA片段进行末端修复, 以便获得经过末端修复的 DNA片 段。 通过将 DNA片段进行修复, 获得平端的 DNA片段, 因而可以方便地通过后续处 理连接具有核酸标签的街头。 根据本发明的实施例, 对 DNA片段进行末端修复的方法 和手段不受特别限制, 根据本发明的一些实施例, 可以通过 Klenow、 T4聚合酶和 T4 多聚核苷酸激酶对 DNA片段进行末端修复。 由此, 可以提高末端修复处理的效率, 并 进而提高构建文库的效率。
接下来,在经过末端修复的 DNA片段的末端添加碱基 A, 以便获得具有粘性末端
A的 DNA片段。 根据本发明的一个具体示例, 利用 Klenow Frgment (3'-5' exo-)聚合酶 进行在经过末端修复的 DNA片段的末端添加碱基 A。 发明人发现, 利用该聚合酶添加 碱基 A能够显著提高构建文库的效率。
接下来, 将所得到的具有粘性末端 A的 DNA片段与前面所述的分离的寡核苷酸相 连, 以便获得具有标签接头的连接产物。 因为前面所述的分离的寡核苷酸具有第一链和第
ID NO: 1 ) , 并且第二链的序列为 其中, 第一链和第二链中的胞嘧啶 c均被曱基化修饰。 因而, 该寡核苷酸?标签接头)具 有粘性末端 Τ, 因而, 可以有效地将核酸标签通过连接反应, 引入到在末端具有粘性末端 A 的 DNA片段中, 从而显著提高构建文库的效率。 接下来, 利用重亚硫酸盐对所制备的具有标签接头的连接产物进行处理, 从而可以将具 有标签接头的连接产物中非曱基化的胞嘧啶转换为尿嘧啶, 获得经过转换的连接产物。 根 据本发明的一些示例, 可以釆用任何已知的方法完成利用重亚硫酸盐的转换。 根据本发明 的实施例,可以釆用商业化的试剂盒来进行,例如 ZYMO EZ DNA Methylation-Gold Kit™。 根据本发明的实施例,可以在利用重亚硫酸盐对具有标签接头的连接产物进行处理的过程 中, 添加片段化的拟南芥基因组 DNA。 发明人发现, 通过添加外源 DNA进行重亚硫酸盐 高效共处理,对目标 DNA片段能够起到保护作用,最大限度地降低重亚硫酸盐对微量 DNA 的破坏, 可以进一步提高检测精度, 使得纳克级别 (30-100ng )基因组整体水平高精度的曱 基化检测成为现实。 根据本发明的实施例, 可以添加的片段化的拟南芥基因组 DNA的量不 受特别限制, 根据具体的示例, 优选片段化的拟南芥基因组 DNA的量为 100-500ng, 更优 选为 200ng。 本领域技术人员能够理解, 可以通过任意方法制备这些拟南芥基因组 DNA, 例如可以随同前面的 DNA片段化处理一起进行制备。
在获得连接产物之后,利用前面所述的一组 PCR引物,对经过转换的连接产物进行扩 增, 以便获得扩增产物。 根据本发明的实施例, 可以釆用的进行 PCR反应的聚合酶的类型 不受特别限制,根据具体的示例,可以使用热启动 taq聚合酶,优选热启动 taq聚合酶为 r-taq 聚合酶。
最后,分离所得到的扩增产物,这些扩增产物构成了全基因组曱基化高通量测序文库。 本领域技术人员能够理解, 可以釆用任何已知的方法, 对扩增产物进行分离。 例如优选 通过利用 2%琼脂糖凝胶进行电泳并进行纯化, 从而实现高效地分离扩增产物, 并最终获得 全基因组曱基化高通量测序文库。
通过根据本发明的方法, 能够有效地构建全基因组曱基化高通量测序文库, 另外, 根据本发明的实施例的方法, 不需要进行片段大小选择,在重亚硫酸盐处理后直接进行 PCR扩增的条件。 克服了常规曱基化测序中不能混合样品, PCR 扩增效率低及不能对 微量 DNA样品进行研究的缺点。 另外, 根据本发明实施例的方法, 在重亚硫酸盐处理 之前不需要经过片段大小选择, 然后再进行 PCR 扩增的流程, 可以在重亚硫酸盐处理 后直接进行 PCR扩增的条件。 克服了常规曱基化测序中不能混合样品, PCR 扩增效率 低及不能对微量 DNA样品进行研究的缺点。
由此, 根据本发明的第五方面, 提出了一种全基因组曱基化高通量测序文库。 根据本 发明的实施例, 全基因组曱基化高通量测序文库是根据前面所述的方法构建的。 利用该 全基因组曱基化高通量测序文库, 能够有效地对微量 DNA样品进行测序, 并进一步分 析曱基化位点。 根据本发明的实施例, 可以优选釆用利用第二代测序平台进行测序。 由 此, 可以实现全基因组曱基化的高通量测序。 另外, 发明人发现, 根据本发明实施例的 构建测序文库的方法构建的测序文库,特别适合 Illumina GA测序仪器进行测序。 因而, 根据本发明的实施例, 特别优选釆用 Illumina GA进行测序。
进而, 根据本发明的第六方面, 提出了一种确定基因组样品的曱基化位点的方法。 根据本发明的实施例, 该方法包括以下步骤:首先, 针对所提取的基因组样品, 根据前 面所述的方法构建所述基因组样品的全基因组曱基化高通量测序文库; 接下来,对所制 备的全基因组曱基化高通量测序文库进行测序, 以便确定基因组样品的曱基化位点。 由 此, 可以有效地确定基因组样品中的曱基化位点。 根据本发明的实施例, 可以优选釆用 利用第二代测序平台进行测序。 由此, 可以实现全基因组曱基化的高通量测序。 另夕卜, 发明人发现, 根据本发明实施例的构建测序文库的方法构建的测序文库, 特别适合 Illumina GA测序仪器进行测序。因而,根据本发明的实施例,特别优选釆用 Illumina GA 进行测序。
根据本发明的第七方面, 本发明提出了一种用于构建全基因组曱基化高通量测序 文库的试剂盒。 根据本发明的实施例, 该试剂盒包括: 一种分离的寡核苷酸, 该寡核苷 酸 具 有 第 一 链 和 第 二 链 , 其 中 , 第 一 链 的 序 列 为 ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCAAT ( SEQ ID NO: 1 ) ; 第二链
NO: 2 ) , 其中, 第一链和第二链中的胞嘧啶 C均被曱基化修饰; 一组 PCR引物, 其。包括 第 一 PCR 引 物和第 二 PCR 引 物 , 其 中 , 第 一 PCR 引 物 的 序 列 为
AACCAA ( SEQ ID NO : 3 ) ; 以 及 第 二 PCR 引 物 的 序 歹' J 为
TTCCGATCTAACCAA ( SEQ ID NO: 4 ) 。 利用该试剂盒, 能够有效地构建基因组样品的 全基因组曱基化高通量测序文库, 从而可以有效地对微量基因组 DNA进行曱基化分析。
因而, 根据本发明的实施例, 本发明提供了全基因组曱基化高通量测序的方法, 其包括如下步骤:
步骤 A 目的基因组 DNA及外源基因组 DNA的片段化
起始目的研究材料和作为外源基因组 DNA的材料可以为任意物种(例如人,植物, 昆虫) 的基因组 DNA, 片段化常用的方法包括雾化、 超声片段化、 HydroShear或酶切 处理, 将基因组 DNA打断为大小 100-200bp的片段。 上述众多常用方法中优选地釆用 超声片段化法, 外源基因组 DNA优选地选择拟南芥基因组 DNA。
步骤 B 基因组 DNA的末端修饰
片段化的 DNA 需要进行末端修饰, 首先利用聚合酶如 Klenow、 T4聚合酶和 T4 多聚核苷酸激酶以及 dNTP补平末端,以产生平端化的 DNA。然后利用 Klenow Frgment (3'-5' exo-)聚合酶及 dATP在补平的序列的 3'末端加上 "A" 碱基。
步骤 C 微量建库接头连接及重亚硫酸盐处理
3'末端加上 "A" 碱基的序列在 T4连接酶的作用下与特殊设计且曱基化修饰的微 量建库接头(C 位点曱基化修饰) 进行连接。 然后在两端加了接头的片段中加入 200ng 片段化了的拟南芥基因组 DNA, 然后一起用重亚硫酸盐处理, 从而使非曱基化胞嘧啶 转换为尿嘧啶。
步骤 D PCR扩增及文库切胶纯化
以重亚硫酸盐转换后的 DNA 为模板, 加入针对微量建库接头序列特别别设计的 PCR引物序列, 用针对重亚硫酸盐转换后的 DNA的热启动 taq酶进行 PCR扩增(可用 常规的 r-taq或其它聚合酶扩增), 扩增产物使用 2%的琼脂糖进行电泳并将目的条带切 下纯化后, 即为待测序的文库。 PCR 扩增优选地使用热启动 taq酶。
本发明与现有曱基化高通量测序技术相比的优点有: 1、 使用 PCR 扩增效率更高 的特殊的针对微量 DNA 曱基化建库的接头 (Minim—adapter )替代了常规文库使用的 接头, 与常规接头相比改变了部分序列, 序列长度增加了 8bp的碱基(可作为标签序列 用于混合多个样品的测序),对于重亚硫酸盐处理完的 DNA增加了后续 PCR扩增效率 及产物量, 相同材料等量起始建库, 相同 PCR条件下产物浓度由 1.67ng l 提高到了 20.04 ng/μΐ (见实施例结果部分图 6 - 8 ) ; 2、 在使用微量基因组 DNA 进行曱基化文 库构建时, 创新性的添加外源载体 DNA与目的 DNA—起进行重亚硫酸盐高效共处理。 在高温和重亚硫酸盐(高盐及低 pH值环境)双重作用下变性的单链 DNA 极易破坏和 降解, 加入外源 DNA对这种破坏作用起到一定的緩冲作用, 能够最大限度的降低重亚 硫酸盐对微量 DNA的破坏, 另外也因为 DNA量的增多使得后续纯化效率提高, 使得 纳克级别( 30-100ng )基因组整体水平高精度的曱基化检测成为现实。 3、改变了 Illumina 曱基化常规测序在重亚硫酸盐处理之前和之后需要经过片段大小选择然后再进行 PCR 扩增的流程, 摸索出了一个不需要进行片段大小选择, 在重亚硫酸盐处理后直接进行 PCR扩增的条件, 具体见实施例详细参数, 主要改变了末端修复酶的用量和接头链接 步骤接头的加入量(减少至常规建库用量的 1/10 )。 本发明的方法克服了常规曱基化测 序中不能混合样品, PCR扩增效率低及不能对微量 DNA样品进行研究的缺点。 对于低 样本量的样品也可进行全基因组曱基化精确研究。
根据本发明的实施例, 提供了构建全基因组曱基化高通量测序文库的方法, 所述 方法用于微量基因组 DNA, 优选的是纳克级别的基因组, 更优选的是 30 - lOOng的基 因组。
在本发明的一个实施例中, 所述方法包括如下步骤:
步骤 A 目的基因组 DNA及外源基因组 DNA的片段化
目的基因组 DNA和作为外源基因组 DNA的材料可以为任意物种,其中包括各种 植物、 动物、 微生物, 例如人, 植物特别是拟南芥, 昆虫, 特别是哺乳动物包括人、 小 鼠的基因组 DNA; 进行片段化的方法包括雾化、 超声片段化、 HydroShear或酶切处理, 从而将基因组 DNA打断为大小优选地为 100-200bp的片段; 片段化方法中优选地釆用 超声片段化法, 外源基因组 DNA优选地选择拟南芥基因组 DNA;
步骤 B 基因组 DNA的末端修饰
对于经片段化的 DNA, 首先利用聚合酶包括但不限于 Klenow、 T4聚合酶和 T4 多聚核苷酸激酶以及 dNTP补平末端, 以产生平端化的 DNA; 然后优选地利用 Klenow Frgment (3 '-5, exo-)聚合酶及 dATP在补平的序列的 3'末端加上 "A" 碱基。
步骤 C 微量建库接头连接及重亚硫酸盐处理
将所得到的 3'末端加上 "A" 碱基的 DNA序列在连接酶包括但不限于 T4连接酶 的作用下与经曱基化修饰, 优选地 C位点曱基化修饰的微量建库接头进行连接, 优选 地在序列两端都连接上微量建库接头; 然后在两端加了接头的片段中加入 100-500ng, 优选的 200ng步骤 A中片段化了的拟南芥基因组 DNA, 然后一起用重亚硫酸盐处理, 优选地处理 2小时, 从而使非曱基化胞嘧啶转换为尿嘧啶;
步骤 D PCR扩增及文库切胶纯化
以所得到的重亚硫酸盐转换后的 DNA为模板,加入针对微量建库接头序列的 PCR 引物序列, 进行 PCR扩增; PCR 扩增优选地使用热启动 taq酶, 所述热启动 taq酶包 括但不限于常规的 r-taq或其它聚合酶,扩增产物使用优选地 2%的琼脂糖进行电泳并将 目的条带切下纯化后, 即为待测序的文库。
在本发明的一个实施例中, 所述方法步骤 C中使用的微量建库接头是表 1中所示 的 Minim adapter 1和 Minim adapter 2。
在本发明的一个实施例 所述方法步骤 D中使用的 PCR引物是表 1 中所示的 Minim— PCR primer 1.1和 Minim_ PCR primer 2.1。
^发明另一方面提供了通 £上文所述的方法构建的测序文库,优选地是^:量 DNA 全基因组曱基化高通量测序文库。
本发明另一方面进一步提供了通过上文所述的方法构建的测序文库, 优选地是微 量 DNA全基因组曱基化高通量测序文库用于进行测序的用途, 其中所述测序可通过第 二代测序平台进行。
本发明另一方面提供了用于微量测序文库,特别是微量 DNA全基因组曱基化高通 量测序文库的接头, 其是表 1中所示的 Minim adapter 1和 Minim—adapter 2。
在本发明的一个实施例中, 所述的接头用 构建微量测序文库, 特别是微量 DNA 全基因组曱基化高通量测序文库的用途。
在本发明的一个实施例中, 使用上文所述的接头构建的微量测序文库, 特别是微 量 DNA全基因组曱基化高通量测序文库。
本发明另一方面还提供了用于微量测序文库,特别是微量 DNA全基因组曱基化高 通量测序文库的 PCR引物, 其是表 1中所示的 Minim_ PCR primer 1.1和 Minim_ PCR primer 2.1。
在本发明的一个实施例中, 所述的 PCR引物用于构建微量测序文库, 特别是微量
DNA全基因组曱基化高通量测序文库的用途。 在本发明的一个实施例中, 使用上文所述的 PCR引物构建的微量测序文库, 特别 是微量 DNA全基因组曱基化高通量测序文库。 下面将结合实施例对本发明的实施方案进行详细描述, 但是本领域技术人员将会 理解, 下列实施例仅用于说明本发明, 而不应视为限定本发明的范围。 实施例中未注明 具体技术或条件的, 按照本领域内的文献所描述的技术或条件(例如参考 J.萨姆布鲁克 等著, 黄培堂等译的 《分子克隆实验指南》 , 第三版, 科学出版社)或者按照产品说明 书进行。 所用试剂或仪器未注明生产厂商者, 均为可以通过市购获得的常规产品。
使用本发明的方法, 以 30ng和 lOOng人外周血全基因组 DNA (—个中国成年男 子血液提取的基因组 DNA )作为为起始原料, 构建了 2个微量全基因组曱基化高通量 测序文库, 釆用 Sanger测序方法检测了 2个文库的质量, 并对其中 lOOng文库进行了 高通量全基因组测序(Illumina GA )。 同时比较了以 l OOng人外周血全基因组 DNA (— 个中国成年男子血液提取的基因组 DNA ) 为起始材料使用本发明的微量建库方法, 接 头分别釆用常规建库接头 【商业化的 Illumina adapterl和 Illumina adapter2, 参见 Illumina 公司的操作规程, Multiplexing Sample Preparation Guide. ( Illumina part # 1005361 ) , 在 ofc 通过参照并入本文】 和微量接头 ( Minim—adapterl和 Minim _adapter2 )后的 PCR扩增效 率的差异。 ― ―
1.1 DNA 片段化
使用超声仪 ( covaris S2 ) 将人全血基因组 DNA ( 30ng和 lOOng ) 及拟南芥基因组 DNA ( 5 g ) 按下表参数设置打断成主带 (琼脂糖凝胶电泳中显示的主要条带) 在 100-200bp左右的片段。 超声仪( covaris S2 ) 的参数(下表中适当标注中文)设置:
Figure imgf000009_0001
将打断后的 DNA直接进行下一步操作。
1.2 末端修复
按照下列的配比准备反应混合物:
打断后的 DNA片段 100 μL
10x 多核苷酸激酶緩冲液 15 μ
dNTP溶液组合 6 μ
T4 DNA 聚合酶 7.5 μ
Klenow DNA 聚合酶 1 μ
H20 l3μ
T4 多核苷酸激酶 7.5 μ
总体积 100 μ
将 Thermomixer(Eppendrf)调至 20 °C , 反应 30 min , 然后用 QIAquick PCR Purification Kit ( Qiagen ) 进行纯化, 最后将样品溶于 32 L洗脱緩冲液 ( EB ) 。 1.3 DNA片段 3'末端加碱基 "A"
按照下列的配比准备反应混合物:
末端修复后的 DNA 32
10x blue buffer 5
dATP(lmM) 10
Klenow exo-(3' to 5' exo-) 3 μL
总体积 50 μΐ
将 Thermomixer(Eppendrf)调至 37 °C ,反应 30min,然后用 MiniElute PCR Purification Kit ( Qiagen ) 进行纯化, 最后将样品溶于 10 洗脱緩冲液。
1.4 Minim adapter 连接
将合成好的 Ι ΟΟμΜ 的 Minim—adapter 1 和 Minim—adapter 2 分别取 ΙΟμΙ^进行混 合, 94 °C , 5分钟, 65 °C水浴放置 15分钟后自然冷却, 得到 5 ΟμΜ Minim—adapter产物, 将 5 ΟμΜ Minim—adapter产物稀释 10 倍为 5μΜ Minim—adapter工作液。
Minim _adapter 接按照下列的配比准备反应混合物:
上述步骤中得到的 DNA 10 μL
T4 DNA ligase buffer 25 μΐ
Minim adapter ( 5μΜ ) 1
DNA ligase 5 μL
dd¾0 9μ
总体积 50 μΐ
将 Thermomixer(Eppendrf)调至 20 °C ,反应 15 min,然后用 QIAquick PCR Purification
Kit ( Qiagen ) 进行纯化, 最后将样品溶于 30 μL EB。
1.5 连接产物加入外源 DNA重亚硫酸盐共处理
连接产物中加入 200ng片段化的外源拟南芥基因组 DNA , 然后加入重亚硫酸盐处 理 2h。 重亚硫酸盐处理釆用 ZYMO EZ DNA Methylation-Gold Kit™, 具体步骤如下: A ) CT Conversion Reagent的制备: 从试剂盒试剂盒 取出 CT Conversion Reagent (固体混 合物) , 然后添加 900 μΐ的水、 50 μΐ的 M-Dissolving Buffer和 300 μΐ的 M-Dilution Buffer 到一管的 CT Conversion Reagent中。 在室温下溶解并且震荡 10分钟或在摇床上摇动 10分 钟.
B ) M-WASH BUFFER的制备: 添加 24ml 100%的乙醇到 M-Wash Buffer中来制备 最终可以使用的 M-Wash Buffer。
C ) 将待转换的 DNA按照分装到 PCR管中, 补水至 20μ1。
D ) PCR管中添加 130 μΐ的 CT Conversion Reagent, 通过轻弹试管或移液器操作来 混合样品。
E ) 将样品管放到 PCR仪上按以下步骤操作:
98 °C放置 10分钟
64 °C放置 2.5小时
立刻进行下一步操作或者在 4 °C下存储 (最多 20小时).
F ) 添力口 600 μΐ的 M-Binding Buffer到 Zymo-Spin ICTM Column 中, 并^1柱放 ¾口试剂 盒所提供的 Collection Tube中。
G )装填样品到 Zymo-Spin lC™ Column含有 M-Binding Buffer。 盖上盖将柱颠倒数 次来混合样品。 H ) 全速 (>10,000 x g)离心 30秒, 去除流出液。
I ) 添加 200 μΐ的 M-Wash Buffer到柱中, 全速离心 30秒。
J ) 添加 200 μΐ的 M-Desulphonation Buffer到柱中并且在室温 (20 °C - 30 °C )下放置 15分钟, 在培养后, 全速离心 30秒。
K ) 添加 200 μΐ的 M- Wash Buffer到柱中, 全速离心 30秒; 再添加 200 μΐ的 M-Wash Buffer并且离心 30秒。
L ) 直接添加 ΙΟμΙ的 M-Elution Buffer到柱基质中。 将柱放置在 1.5 ml的管中, 全速 离心来洗脱 DNA。
1.6 PCR扩增及文库大小选择
下列的反应体系准备反应混合物, 将试剂放置于水上。
重亚 υ酸盐处理的 DNA 20μ1
Minim PCR primer 1.1 Ιμΐ
Minim PCR primer 2.1 Ιμΐ
dNTP Solution Set 4μ1
10X PCR Buffer 5μ1
Jump Start™ Taq DNA Polymerase 0.5 μΐ
dd¾0 18.5μ1
总体积 50μ1
PCR反应条件
98 °C 30s
(注: 30ng 12个循环, lOOng 10个循环)
Figure imgf000011_0001
72 °C 2min
4 °C 保存
用 PCR Purification Kit(Qiagen)对扩增产物进行纯化, 然后用 2%的琼脂糖胶进行电 泳, 然后对目的大小文库进行切胶 择, 釆用 MiniElute PCR Purification Kit (Qiagen)进 行胶纯化回收, 最后将文库溶于 20μ1 ΕΒ中。
1.7 文库检测
1 ) 使用安捷伦 2100 Bioanalyzer检测文库产量。
2 ) 使用 QPCR定量检测文库产量。
关于上述检测方法的详细描述, 可以参见 Bemd Buehler, Holly H. Hogrefe, Graham Scott, et a/. (2010) Rapid quantification of DNA libraries for next-generation sequencing. Methods. 50:S15-S18 , 在此通过参照并入本文。
2、 结果部分:
2.1 PCR产物的安捷伦 2100 Bioanalyzer检测结果
图 3 和 图 4 的 PCR产物安捷伦 2100 Bioanalyzer检测结果表明从起始基因组 DNA 30ng和 l OOng即可构建利用高通量新一代测序仪器进行高通量测序的曱基化文库, 结合 下文所述实际测序数据分析结果表明该发明方法切实可行, 可应用与实际研究中。 图 5是釆用常规 Illumina接头按照本发明的微量建库方法,所得 PCR扩增产物的 安捷伦 2100 Bioanalyzer检测结果。与图 3和图 4相比,图 5中 PCR产物虽有目的条带, 但条带不明显, 浓度达不到高通量测序要求。 比较可以看出本发明方法确实显著提高了 PCR 扩增效率, 提高了后续测序的效率。
2.2 文库质量检测结果 ( Sanger测序法)
30ng DNA 与 lOOng DNA微量建库文库质量检测结果
Figure imgf000012_0001
从所构建的 2 个文库中, 分别挑选 76和 78个克隆进行质量检测, 结果转换效率都 在 99%以上, 说明重亚硫酸盐处理实现了高效的转换。 lOOng文库比对率 (也称为 map rate ) 高于 30ng, 说明起始量对建库结果有较大影响, 但 30ng起始比对率在 40%以上, 考虑到起始的 DNA量, 这样的结果在可接受范围。 另外从序列重复率来看, 都没有重 复序列, 说明 PCR扩增随机性很好, 没有产生偏向性。
3、 测序 ( Illumina GA ) 结果信息高级分析部分
取上述构建的 lOOng 文库上机进行高通量测序并与常规建库(常规建库方法: 使 用 5ug与上述实施例中相同的人的全血基因组相同的 DNA , 使用常规曱基化测序文库制 备流程进行文库制备, 方法参见 Illumina GA的产品说明书 Multiplexing Sample Preparation Guide. ( Illumina part # 1005361 ) , 在此通过参照并入本文) 的测序结果进 行高级比对分析,将 100ng文库测序数据 2.52G的原始数据和正常全基因组测序 1.99G 数 据比较, 常规建库数据以 YH_3.4G表示。
3.1 与全基因组比对率比较
表 3 微量建库 ( lOOng DNA ) 与常规建库 ( 5 g DNA ) 测序数据结果基本比对结 果
Figure imgf000012_0002
3.2 对全基因组覆盖度比较
表 4 微量建库 ( lOOng DNA ) 与常规建库 ( 5ug DNA ) 测序数据对全基因组覆盖度 比较
Figure imgf000012_0003
3.3 对每条染色体的覆盖度比较 (参加以下表 5 和图 6 )
表 5 微量建库 ( lOOng DNA ) 与常规建库 (5 g DNA ) 测序数据在每条染色体上的 覆盖度比较结果 染色体 , (Cf/G ¾ —盖車
tOOng YH 3.5G
chr1 19.60168427 16.1619485
chr2 20.00241441 17.20107308
chr3 20.06349049 17.60313435
chr4 19孺 16616 18.08138198
chr5 19.83523319 : 17.39148265
chr6 19 971 19982 17.49325394
chr7 19.58081576 16.45269166
chr8 19.94313856 17.25455946
chr9 18.67547381 15,38194398
chr10 19.55473041 16.15250015
c rl 1 19.83785702 16.34877778
chrl 2 19.77910108 16.78161507
chr13 20.1 1 494007 18.09266384
chrl 4 19.84617042 16.86771249
c r15 19,46989798 15.81779536
chr16 19.32717248 14.51504302
chr17 19.08767065 13.94369765
chrl 8 20.16828038 17.66067029
chr19 18—42482697 12.06363746
chr20 20.0232219 15.56875261
chr21 20.50133724 ! 16.97730179
chr22 18.63886918 ! 12.72283029
chrM 95.77388232 88.81641527
chrX 10.62848597 : 9.Q29724418
chrY 9-3352標 88 7 262010172
比较结果来看微量建库和常规建库数据在每条染色体上的覆盖度趋势基本一致。
3.4 全基因组甲基化模式比例比较(参见表 6、 表 7 和 图 8、 图 9 )
表 6 微量建库 ( l OOng DNA ) 与常规建库 ( 5ug DNA ) 测序数据甲基化模式整体 分析比较结果
Figure imgf000013_0001
表 7 微量建库( lOOng DNA ) 与常规建库( 5μδ DNA )测序数据曱基化模式在每 条染色体上的分析比较结果 染色体 ¾ YH-3-5G
^ C CG CHG CHH C CG CHH
Figure imgf000014_0001
化模 式分布上基本一致。
3.5 数据相关性比较
lOOng文库测序数据和正常建库相应测序数据进行甲基化相关性的比较分析,结果 来看相关性很好 (相关系数 0.9258572 )。
通过将 lOOng 文库上机测序数据与常规文库测序相应数据进行高级信息分析比 较, 可以得出以下结论: 从比对效率、 覆盖度、 每条染色体的甲基化率及相关性来看, lOOng测序数据比对情况更理想, 各方面覆盖率都相对好一些, 但从甲基化变化趋势上 仍是很一致的, 在甲基化率上, 也有很好的一致性, 这些都说明了采用微量 DNA进行 甲基化全基因组高通量测序研究是切实可行的, 为曱基化研究样品少, 不易获得的瓶颈 提供了很好的解决方案。
工业实用性
利用根据本发明实施例的技术方案, 能够有效地对微量 DNA进行曱基化分析。 尽管本发明的具体实施方式已经得到详细的描迷, 本领域技术人员将会理解。 根 据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的 保护范围之内。 本发明的全部范围由所附权利要求及其任何等同物给出。
在本说明书的描述中, 参考术语 "一个实施例"、 "一些实施例" 、 "示意性实施 例" 、 "示例" 、 "具体示例" 、 或 "一些示例" 等的描迷意指结合该实施例或示例描 述的具体特征、 结构、 材料或者特点包含于本发明的至少一个实施例或示例中。 在本说
13 ( 26 ) 明书中, 对上述术语的示意性表述不一定指的是相同的实施例或示例。 而且, 描述的具 体特征、 结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结 合。
尽管已经示出和描述了本发明的实施例, 本领域的普通技术人员可以理解: 在不脱 离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、 修改、 替换和变型, 本发明的范围由权利要求及其等同物限定。

Claims

权利要求书
1、 一种分离的核酸标签, 其核酸序列为 AACCAA。
2、 一种分离的寡核苷酸, 所述寡核苷酸具有第一链和第二链,
其中,
所述第一链的序列为 ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCAAT ( SEQ ID NO: 1 ) ;
所述第二链的序列为 其中, 所述第一链和所述第二链中的胞嘧啶 C均被甲基化修饰。
3、 一组 PCR引物, 其包括第一 PCR引物和第二 PCR引物,
其巾,
所述第一 PCR引物的序列为 AACCAA ( SEQ ID NO: 3 ) ; 以及
所述第二 PCR引物的序列为
TTCCGATCTAACCAA ( SEQ ID NO: 4 ) 。
4、 一种构建全基因组甲基化高通量测序文库的方法, 其特征在于, 包括以下步骤: 将基因组 DNA片段化, 以便获得 DNA片段;
将所述 DNA片段进行末端修复, 以便获得经过末端修复的 DNA片段;
在所述经过末端修复的 DNA片段的末端添加碱基 A, 以便获得具有粘性末端 A的 DNA片段;
将所述具有粘性末端 A的 DNA片段与权利要求 2所述的分离的寡核苷酸相连,以便 获得具有标签接头的连接产物;
利用重亚硫酸盐对所述具有标签接头的连接产物进行处理,以便将所述具有标签接头的 连接产物中非甲基化的胞嘧啶转换为尿嘧啶, 获得经过转换的连接产物;
利用权利要求 3所述的一组 PCR引物, 对所述经过转换的连接产物进行扩增, 以便获 得扩增产物; 以及
分离所述扩增产物, 所述扩增产物构成所述全基因组甲基化高通量测序文库。
5、根据权利要求 4所述的方法, 其特征在于, 所述基因组 DNA的量为 30 - 100ng。
6、 根据权利要求 4所述的方法, 其特征在于, 所述基因组 DNA来源于哺乳动物、 植物、 和微生物的至少一种。
7、 根据权利要求 6所述的方法, 其特征在于, 所述哺乳动物为人和小鼠的至少一 种, 所述植物为拟南芥。
8、 根据权利要求 4所述的方法, 其特征在于, 所述将基因组 DNA片段化是通过 雾化、 超声片段化、 HydroShear和酶切处理的至少一种进行的。
9、 根据权利要求 8所述的方法, 其特征在于, 所述将基因组 DNA片段化是通过 超声片段化进行的。
10、根据权利要求 4所述的方法,其特征在于,所述 DNA片段的长度为 100-200bp。
11、根据权利要求 4所述的方法, 其特征在于, 所述将所述 DNA片段进行末端修 复是通过 Klenow、 T4聚合酶和 T4多聚核苷酸激酶进行的。
12、 根据权利要求 4所述的方法, 其特征在于, 所述在所述经过末端修复的 DNA 片段的末端添加碱基是利用 Klenow Frgment (3'-5' exo-)聚合酶进行的。
13、 根据权利要求 4所述的方法, 其特征在于, 在利用重亚硫酸盐对所述具有标签 接头的连接产物进行处理的过程中, 添加片段化的拟南芥基因组 DNA。
14、 根据权利要求 4所述的方法, 其特征在于, 所述片段化的拟南芥基因组 DNA的 量为 100-500ng。
15、 根据权利要求 15所述的方法, 其特征在于, 所述片段化的拟南芥基因组 DNA的 量为 200ng。
16、根据权利要求 4所述的方法,其特征在于,所述 PCR反应使用热启动 taq聚合酶。
17、 根据权利要求 16所述的方法, 其特征在于, 所述热启动 taq聚合酶为 r-taq聚合 酶。
18、 根据权利要求 4所述的方法, 其特征在于, 所述分离扩增产物是通过利用 2%琼 脂糖凝胶进行电泳并进行纯化进行的。
19、 一种全基因组甲基化高通量测序文库, 其是根据权利要求 4-19任一项所述的 方法构建的。
20、 一种确定基因组样品的甲基化位点的方法, 其特征在于, 包括以下步骤: 根据权利要求 4- 19任一项所述的方法构建所述基因组样品的全基因组甲基化高通 量测序文库; 以及
对所述全基因组甲基化高通量测序文库进行测序, 以便确定所述基因组样品的甲 基化位点。
21、 根据权利要求 20所述的方法, 其特征在于, 所述测序是利用第二代测序平台 进行的。
22、一种用于构建全基因组甲基化高通量测序文库的试剂盒, 其特征在于, 包括: 一种分离的寡核苷酸, 所述寡核苷酸具有第一链和第二链,
其巾,
所述第一链的序列为 ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCAAT ( SEQ ID NO: 1 ) ;
所述第二链的序列为 其中, 所述第一链和所述第二链中的胞嘧啶 C均被甲基化修饰;
一组 PCR引物, 其包括第一 PCR引物和第二 PCR引物,
其巾,
所述第一 PCR引物的序列为
AACCAA ( SEQ ID NO: 3 ) ; 以及
所述第二 PCR引物的序列为
GCTCTTCCGATCTAACCAA ( SEQ ID NO: 4 )
PCT/CN2011/079900 2010-09-21 2011-09-20 核酸标签及其应用 WO2012037878A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN 201010299315 CN102409408B (zh) 2010-09-21 2010-09-21 一种利用微量基因组dna进行全基因组甲基化位点精确检测的方法
CN201010299315.2 2010-09-21

Publications (1)

Publication Number Publication Date
WO2012037878A1 true WO2012037878A1 (zh) 2012-03-29

Family

ID=45873442

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2011/079900 WO2012037878A1 (zh) 2010-09-21 2011-09-20 核酸标签及其应用

Country Status (3)

Country Link
CN (1) CN102409408B (zh)
HK (1) HK1168393A1 (zh)
WO (1) WO2012037878A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104694654A (zh) * 2015-03-18 2015-06-10 北京明谛生物医药科技有限公司 一种检测胎儿染色体数目变异的方法
CN108251504A (zh) * 2018-01-17 2018-07-06 翌圣生物科技(上海)有限公司 一种超快速构建基因组dna测序文库的方法和试剂盒

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102796808B (zh) * 2011-05-23 2014-06-18 深圳华大基因科技服务有限公司 甲基化高通量检测方法
CN103667432B (zh) * 2012-09-20 2015-03-04 中国科学院沈阳应用生态研究所 一种改进的亚硫酸盐测序方法
CN103806111A (zh) * 2012-11-15 2014-05-21 深圳华大基因科技有限公司 高通量测序文库的构建方法及其应用
CN105209642A (zh) * 2013-03-15 2015-12-30 卡耐基华盛顿学院 基因组测序和表观遗传分析的方法
CA2901293A1 (en) * 2013-03-15 2014-09-25 Abbott Molecular Inc. Detection of bisulfite converted nucleotide sequences
CN105648040A (zh) * 2014-11-11 2016-06-08 上海派森诺生物科技有限公司 一种应用于全基因组重亚硫酸盐测序的pcr扩增体系及文库构建方法
CN104894651B (zh) * 2015-06-29 2017-04-12 天津诺禾医学检验所有限公司 微量起始dna的高通量测序文库构建方法及其所构建的高通量测序文库
CN105274629B (zh) * 2015-11-17 2017-11-17 安诺优达基因科技(北京)有限公司 简化的表观重亚硫酸氢盐测序用文库的构建方法及试剂盒
CN105296655A (zh) * 2015-11-26 2016-02-03 北京市中医研究所 检测顺式作用元件有无甲基化修饰或其修饰位点的方法
CN105349528B (zh) * 2015-11-30 2019-06-28 浙江安诺优达生物科技有限公司 用于全基因组甲基化重亚硫酸氢盐测序的文库构建方法
CN108103052B (zh) * 2016-11-24 2021-05-07 浙江安诺优达生物科技有限公司 提高基因组覆盖度的单细胞全基因组扩增及文库构建方法
CN107022622A (zh) * 2017-05-04 2017-08-08 河海大学常州校区 一种基于长链非编码rna的分子标记物鉴定方法
CN107354148A (zh) * 2017-08-17 2017-11-17 上海派森诺生物科技股份有限公司 一种用于微量dna高效建库的方法
CN107541791A (zh) * 2017-10-26 2018-01-05 中国科学院北京基因组研究所 血浆游离dna甲基化检测文库的构建方法、试剂盒及应用
CN107858409B (zh) * 2017-11-12 2021-05-04 深圳市易基因科技有限公司 一种微量降解基因组dna甲基化建库测序方法及其试剂盒
CN108300766A (zh) * 2018-01-16 2018-07-20 四川大学 利用转座酶对染色质开放区和线粒体甲基化研究的方法
CN109576800A (zh) * 2018-12-07 2019-04-05 北京安智因生物技术有限公司 一种遗传性扩张型心肌病的基因检测文库的构建方法及其试剂盒
CN113166809B (zh) * 2018-12-29 2023-12-26 深圳华大生命科学研究院 一种dna甲基化检测的方法、试剂盒、装置和应用
CN112553298B (zh) * 2019-09-10 2023-06-23 深圳华大生命科学研究院 一种可以改善全基因组甲基化测序偏向性的建库方法
CN111945232A (zh) * 2020-08-27 2020-11-17 天津诺禾医学检验所有限公司 构建rrbs文库的y型接头、试剂盒及方法
CN112779320B (zh) * 2020-12-04 2023-07-14 深圳市易基因科技有限公司 多区域dna甲基化检测探针设计及其检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1833034A (zh) * 2003-06-20 2006-09-13 埃克斯魁恩公司 用于分析核酸混合物的探针、文库和试剂盒及其构建方法
CN101090979A (zh) * 2004-12-22 2007-12-19 埃克斯魁恩公司 用于分析核酸混合物的探针、文库和试剂盒及其构建方法
WO2008093098A2 (en) * 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
WO2009089384A1 (en) * 2008-01-09 2009-07-16 Life Technologies Method of making a paired tag library for nucleic acid sequencing
WO2010030683A1 (en) * 2008-09-09 2010-03-18 Rosetta Inpharmatics Llc Methods of generating gene specific libraries
WO2010053587A2 (en) * 2008-11-07 2010-05-14 Mlc Dx Incorporated Methods of monitoring conditions by sequence analysis

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100564618C (zh) * 2007-06-13 2009-12-02 北京万达因生物医学技术有限责任公司 分子置换标签测序并行检测法即寡聚核酸代码标签分子库微球阵列分析

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1833034A (zh) * 2003-06-20 2006-09-13 埃克斯魁恩公司 用于分析核酸混合物的探针、文库和试剂盒及其构建方法
CN101090979A (zh) * 2004-12-22 2007-12-19 埃克斯魁恩公司 用于分析核酸混合物的探针、文库和试剂盒及其构建方法
WO2008093098A2 (en) * 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
WO2009089384A1 (en) * 2008-01-09 2009-07-16 Life Technologies Method of making a paired tag library for nucleic acid sequencing
WO2010030683A1 (en) * 2008-09-09 2010-03-18 Rosetta Inpharmatics Llc Methods of generating gene specific libraries
WO2010053587A2 (en) * 2008-11-07 2010-05-14 Mlc Dx Incorporated Methods of monitoring conditions by sequence analysis

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DONG C. ET AL: "A Simple Method Quickly to Construct the DNA Virus Sequencing Library", BIOTECHNOLOGY, vol. 15, no. 4, 31 August 2005 (2005-08-31), pages 34 - 36 *
ZHANG J. ET AL.: "Construction of Wheat BAC Shotgun Library", JOURNAL OF TRITICEAE CROPS, vol. 27, no. 3, 31 December 2007 (2007-12-31), pages 374 - 377 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104694654A (zh) * 2015-03-18 2015-06-10 北京明谛生物医药科技有限公司 一种检测胎儿染色体数目变异的方法
CN108251504A (zh) * 2018-01-17 2018-07-06 翌圣生物科技(上海)有限公司 一种超快速构建基因组dna测序文库的方法和试剂盒

Also Published As

Publication number Publication date
CN102409408B (zh) 2013-08-07
HK1168393A1 (en) 2012-12-28
CN102409408A (zh) 2012-04-11

Similar Documents

Publication Publication Date Title
WO2012037878A1 (zh) 核酸标签及其应用
US20200325471A1 (en) Compositions and methods for detecting nucleic acid regions
EP3377625B1 (en) Method for controlled dna fragmentation
EP3234200B1 (en) Method for targeted depletion of nucleic acids using crispr/cas system proteins
WO2013064066A1 (zh) 全基因组甲基化高通量测序文库的构建方法及其应用
US9243242B2 (en) Methods of making di-tagged DNA libraries from DNA or RNA using double-tagged oligonucleotides
US20200123534A1 (en) Production of encoded chemical libraries
WO2013056640A1 (zh) 核酸文库的制备方法及其应用以及试剂盒
WO2013071876A1 (zh) 高通量测序文库的构建方法及其应用
WO2012159564A1 (zh) 甲基化高通量检测方法
WO2012079490A1 (zh) 构建dna测序文库的方法及其用途
JP2009529876A (ja) 核酸を配列決定するための方法および手段
CA2892646A1 (en) Methods for targeted genomic analysis
WO2012028105A1 (zh) 测序文库及其制备方法、确定核酸末端序列的方法和系统
WO2012089147A1 (zh) 针对核酸样本构建测序文库的方法及其用途
WO2016082130A1 (zh) 一种核酸的双接头单链环状文库的构建方法和试剂
WO2012079486A1 (zh) 制备用于测序的dna样品的方法及其应用
WO2012071985A1 (zh) 从ffpe样本中提取dna的方法及其用途
AU2016102398A4 (en) Method for enriching target nucleic acid sequence from nucleic acid sample
WO2012126398A1 (zh) Dna标签及其用途
CN107385018A (zh) 一种优化的rna高通量测序文库构建的方法及其应用
JP2023533418A (ja) シークエンシングライブラリーの収率を増加させるための方法
WO2012075959A1 (zh) 半甲基化接头及其用途
WO2013075313A1 (zh) 一种检测病毒在待测样本中整合方式的探针及其制备方法和应用
EP3303584B1 (en) Methods of analyzing nucleic acids

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11826405

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 12.08.2013.)

122 Ep: pct application non-entry in european phase

Ref document number: 11826405

Country of ref document: EP

Kind code of ref document: A1