WO2013053207A1 - 测定待检测样本中疾病相关核酸分子的核苷酸序列的方法 - Google Patents

测定待检测样本中疾病相关核酸分子的核苷酸序列的方法 Download PDF

Info

Publication number
WO2013053207A1
WO2013053207A1 PCT/CN2012/001381 CN2012001381W WO2013053207A1 WO 2013053207 A1 WO2013053207 A1 WO 2013053207A1 CN 2012001381 W CN2012001381 W CN 2012001381W WO 2013053207 A1 WO2013053207 A1 WO 2013053207A1
Authority
WO
WIPO (PCT)
Prior art keywords
primer
nucleic acid
sequence
disease
linker
Prior art date
Application number
PCT/CN2012/001381
Other languages
English (en)
French (fr)
Inventor
魏晓明
陈洋
杨光辉
朱倩
谢姝琦
汪建
王俊
杨焕明
Original Assignee
深圳华大基因科技有限公司
深圳华大基因研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳华大基因科技有限公司, 深圳华大基因研究院 filed Critical 深圳华大基因科技有限公司
Publication of WO2013053207A1 publication Critical patent/WO2013053207A1/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Definitions

  • the present invention relates to the field of biotechnology, and in particular to a method for determining a nucleotide sequence of a disease-associated nucleic acid molecule in a sample to be detected.
  • the method comprises the steps of: designing a plurality of disease-specific probe chips, capturing and enriching a specific target DNA fragment with a linker, high-throughput sequencing, and analyzing gene mutation information.
  • a monogenic disease is a disease or pathological trait controlled by a pair of alleles, also known as Mendelian genetic disease or a monogenic genetic disease.
  • Mendelian genetic disease or a monogenic genetic disease There are more than 6,000 single-gene diseases that have been discovered, of which more than 1,700 diseases have known phenotypes and whose molecular basis is unknown, and monogenic diseases are known due to genetic heterogeneity, phenotype and pathogenic molecular basis ( Of the more than 2,900 species, many subtypes have not been discovered.
  • a gene is a genetic unit located on a chromosome. The chromosome has an autosomal and a sex chromosome. The gene also has a dominant gene and a recessive gene.
  • monogenic diseases can be divided into autosomal dominant genetic diseases, autosomal recessive genetic diseases, X-linked dominant genetic diseases, X-linked recessive genetic diseases, and Y-linked genetic diseases.
  • the detection methods for monogenic diseases are currently based on the first generation sequencing technology, mainly for the following: pedigree analysis, karyotype analysis, enzymatic reaction and activity assay, RALF, SSCP (single strand conformation polymorphism), MOLDI- TOF, FISH (fluorescence in situ hybridization), a-CGH (a-comparative genomic hybridization), qPCR, MLPA (multiple ligation probe amplification), Sanger method, and the like.
  • pedigree analysis mainly for the following: pedigree analysis, karyotype analysis, enzymatic reaction and activity assay, RALF, SSCP (single strand conformation polymorphism), MOLDI- TOF, FISH (fluorescence in situ hybridization), a-CGH (a-comparative genomic hybridization), qPCR, MLPA (multiple ligation probe amplification), Sanger method, and the like.
  • pedigree analysis, karyotype analysis, enzymatic activity determination method and FISH analysis method are all chromosomal level detection with low accuracy; RALF, SSCP and MOLDI-TOF analysis methods are The indirect detection method cannot directly reflect the change of the locus; a-CGH, qPCR, and MLPA can only target specific sites, and the newly discovered mutation sites cannot be detected, and the sequencing flux of the above methods is very small, and The PCR amplification process is first performed. Therefore, although the first generation sequencing technology based on the Sanger method is currently the gold standard for single gene disease detection, the number of samples for simultaneous sequencing is limited due to the small number of samples that are simultaneously sequenced, and is limited to one or several types.
  • One of the objects of the present invention is to provide a method for determining the nucleotide sequence of a disease-associated nucleic acid molecule in a sample to be detected and an application thereof.
  • Another object of the present invention is to provide a kit for determining the nucleotide sequence of a disease-associated nucleic acid molecule in a sample to be detected.
  • a method of determining a nucleotide sequence of a disease-associated nucleic acid molecule in a sample to be detected comprising the steps of:
  • the sample comprising an interrupted genome-derived DNA double-stranded nucleic acid fragment, and wherein the DNA double-stranded nucleic acid fragment has a blunt end;
  • a linker ligation sequence is added at the end; and a linker is added at both ends of the DNA double-stranded nucleic acid fragment by the linker ligation sequence, wherein the linker has a primer a binding region and a joining complementary region, said linking complementary region being complementary to said linker joining sequence;
  • step b c PCR-amplifying the DNA double-stranded nucleic acid fragment with a linker obtained in step b with a first primer and a second primer to obtain a mixture of first PCR amplification products, wherein the first primer and the second primer
  • the primer has a linker binding region corresponding to the primer binding region of the linker, and a sequencing probe binding region located outside the linker binding region;
  • PCR amplification is performed using the third primer and the fourth primer to obtain a mixture of the second PCR amplification products, wherein the third primer and the fourth primer respectively correspond to each other. Or in combination with the first primer and the second primer;
  • the mixture of the second PCR amplification product is hybridized with the sequencing probe immobilized on the solid phase carrier in step g, and subjected to solid phase bridge PCR amplification to form a sequencing cluster;
  • the sequencing cluster is sequenced by the "Synthesis-Side Sequencing" method to obtain the nucleotide sequence of the disease-related nucleic acid molecule in the sample to be detected.
  • the length of the interrupted, genome-derived DNA double-stranded nucleic acid fragment of step a is 100-1000 bp or an average length of 800-1000 bp.
  • the fragment is 150-500 bp in length, preferably 200-300 bp.
  • the blunt end of the DNA double stranded nucleic acid fragment is prepared by a method of end repair.
  • the linker sequence in step b is poly(N) n , wherein each N is independently selected from A, T, G or C, and n is any positive integer selected from 1-20.
  • the sequence of the linker joining complementary regions described in step b is poly(N, wherein each N' is independently selected from A, T, G or C, m is a positive integer of 1-20, and Poly(N) P poly(N') m is a complementary sequence.
  • n is any positive integer selected from 1-3.
  • the length of the linker-ligation complementary region is the same as the length of the linker ligation sequence, ie, polyi(P)(N') m is a fully complementary sequence.
  • the first primer and the second primer described in the step c are oligonucleotides having a length of 30 to 80 nt. In another preferred embodiment, the first primer and the second primer are 55-65 nt in length.
  • first primer and the second primer are different, and/or the third primer and the fourth primer are different.
  • the blocking molecule of step d blocks a 70%-100% region of the first PCR amplification product corresponding to the first primer and the second primer.
  • the blocking molecule described in step d blocks 100% of the first PCR amplification product corresponding to the first and second primers.
  • 5-200,000 specific probes corresponding to the disease are immobilized on the nucleic acid chip described in the step e.
  • the specific probe type on the nucleic acid chip in the step e is 50-150,000, more preferably 500-100,000, and most preferably 5000-80,000.
  • sequence of the specific probe corresponds to the following region of the disease causing gene: exons and/or 200 nt at both ends of the exon.
  • the specific probe has a length of 20 to 120 nt, preferably 50 to 100 nt, more preferably 60 to 80 nt.
  • the specific probe is a fully synthetic or in vitro clone synthesis.
  • the third primer and the fourth primer described in step f are specifically bound to the outside of the first primer and the second primer, respectively, and the length is smaller than the first bow and the second Bow I.
  • the third primer and the fourth primer are 15-40 nt in length, preferably 20-25 nt.
  • the sample to be detected is derived from a human, an animal, a plant, or a microorganism.
  • the sample to be detected is derived from a human or non-human mammal, preferably from a human. In another preferred embodiment, the sample to be detected contains human genomic DNA.
  • the disease is Mendel's monogenic disease.
  • the disease is selected from the group consisting of familial adenomatous polyposis, achondroplasia, familial hypercholesterolemia, polymorphism, Marfan syndrome, hereditary chorea, baldness, Phenylketonuria, cystinuria, hereditary high myopia, anti-D rickets, hereditary nephritis, hemophilia, thalassemia, cerebral sclerosis syndrome, Duchenne muscular dystrophy, progressive muscular dystrophy, multiple Cystic renal syndrome, sexual reversal due to mutation of a sex-determining gene, or a combination thereof.
  • kits for determining a nucleotide sequence of a disease-associated nucleic acid molecule in a sample to be detected which kit can be used in the method of the first aspect of the invention, the kit comprising:
  • a third container and a primer selected from the group consisting of: (a) a first primer and/or a second primer; or a third bow I and/or a fourth primer;
  • the kit further comprises an agent selected from the group consisting of: a reagent required for performing PCR amplification, a reagent required for performing a blocking reaction, and a reagent for performing a hybridization reaction. Reagent, or a combination thereof.
  • the disease is Mendel's monogenic disease.
  • the disease is selected from the group consisting of familial adenomatous polyposis, achondroplasia, familial hypercholesterolemia, polymorphism, Marfan syndrome, hereditary chorea, baldness, Phenylketonuria, cystinuria, hereditary high myopia, anti-D rickets, hereditary nephritis, hemophilia, thalassemia, cerebral sclerosis syndrome, Duchenne muscular dystrophy, progressive muscular dystrophy, multiple Cystic renal syndrome, sexual reversal due to mutation of a sex-determining gene, or a combination thereof.
  • one or more probes selected from the group consisting of:
  • Probe 1 sequence as shown in SEQ ID NO: 7, capture position 112073411, detection of familial adenomatoid-like polyps; probe 2 sequence as shown in SEQ ID NO 8 , capture position 51479999, detection of polycystic kidney disease; probe 3 sequence as shown in SEQ ID NO 9 , capture position 135766620, detection of cerebral sclerosis syndrome; probe 4 sequence as shown in SEQ ID NO 10, capture position 103231969, detection of phenylketonuria; probe 5 sequence such as SEQ As shown by ID NO 11, the capture position is 48700368, and the detection of Marfan syndrome; Probe 6: The sequence is shown in SEQ ID NO: 12, capture position 31137199, and Duchenne muscular dystrophy is detected.
  • Figure 1 shows a flow chart for the simultaneous detection of multiple monogenic diseases in one embodiment of the invention.
  • the present inventors have for the first time established a method for determining the nucleotide sequence of a disease-associated nucleic acid molecule in a sample to be detected.
  • the present inventors designed a nucleic acid chip immobilized with a plurality of disease-specific probes based on information of existing disease genes; and added the end of fragmented, genome-derived DNA double-stranded nucleic acid molecules in the sample to be tested.
  • Linker, and enrichment capture the DNA fragment containing the linker with the nucleic acid chip, sequence the captured fragment on a high-throughput sequencing platform, and analyze the sequencing result based on the known gene locus information to obtain the sample.
  • Nucleotide sequence of a disease-associated nucleic acid molecule is the term
  • the term "monogenic disease” refers to a disease or pathological trait controlled by a pair of alleles, also known as Mendelian genetic disease, which can be divided into autosomal dominant genetic diseases, autosomal recessive genetic diseases, X with sexually transmitted diseases, Y with sexually transmitted diseases.
  • Autosomal dominant genetic disease pathogenic genes localize to autosomes, common subtypes: fully dominant: normal homozygotes and heterozygous patients have no difference in phenotype; incomplete dominance: heterozygous performance is dominant Homozygous patients and normal people, often manifested as mild disease; irregular phenotype: for some reason can make heterozygous dominant genes do not show the corresponding symptoms; codominance: no between alleles Both dominant and recessive, both genes can be expressed in hybrids; delayed dominant: heterozygous dominant genes are not expressed in early life, until after a certain age; sexual dominant: miscellaneous The expression of zygotes is influenced by gender, and the corresponding phenotype is expressed in one gender, and the corresponding phenotype is not expressed in the other gender.
  • Autosomal oncogenic genes of autosomal recessive diseases do not show corresponding diseases in the heterozygous state, but only when homozygous.
  • the disease-causing gene located on the X chromosome inherits the disease with the X chromosome, including X-linked dominant inheritance and X-linked recessive Genetic.
  • the causative gene located on the Y chromosome inherits the disease along with the Y chromosome.
  • Monogenic diseases suitable for use in the detection methods of the invention include, but are not limited to, familial adenomatous polyposis, achondroplasia, familial hypercholesterolemia, polymorphism, Marfan syndrome, hereditary chorea, baldness, Phenylketonuria, cystinuria, hereditary high myopia, anti-D rickets, hereditary nephritis, hemophilia, thalassemia, cerebral sclerosis syndrome, Duchenne muscular dystrophy, progressive muscular dystrophy, multiple Cystic renal syndrome, sexual reversal due to mutation of a sex-determining gene, or a combination thereof.
  • exon refers to the portion that is retained in mature mRNA, i.e., the mature mRNA corresponds to a portion of the gene.
  • Introns are parts that are cleaved off during mRNA processing and are not present in mature mRNA. Both exons and introns are for genes, the coding part is exon, the intron is not encoded, and the intron has no genetic effect.
  • probe refers to a simple DNA or RNA molecule capable of detecting a complementary nucleic acid sequence.
  • the probe must be pure and not affected by other different sequence nucleic acids.
  • a typical probe is a cloned DNA sequence or DNA obtained by PCR amplification, a synthetic oligonucleotide or RNA obtained by cloning a DNA sequence in vitro, and can also be used as a probe.
  • the probe may have a length of from 20 to 120 nt, preferably from 50 to 100 nt, more preferably from 60 to 80 nt.
  • Probe design and synthesis methods are well known to those skilled in the art, and probes can be designed based on the exon of a known disease-causing gene of a single gene disease and its anterior-posterior sequences (preferably about 200 bp). In a preferred embodiment, the probe is 50-80 nt in length. Probes synthesized by artificial chemical synthesis or commercially available probes can be used. Typical probe sequences are shown in Table 4. Heart piece
  • chip means that a variety of fine structures can be fabricated on the substrate material of a chip by micromachining, applying the necessary biochemicals and performing surface treatment to immobilize multiple probe molecules and surfaces. , a substrate material containing a large amount of probes.
  • a person skilled in the art can obtain a chip using a general method.
  • the first type is a light-guided in-situ synthesis method in which a photolithography process is combined with a photochemical synthesis method in a micromachining technique.
  • the second method is a chemical jet method in which a synthesized oligonucleotide probe is spot-sprayed onto a chip and immobilized to produce a DNA chip.
  • the third method is a contact dot coating method in which a DNA probe is applied to a chip by contacting the pipetting head with a glass chip by precise movement of a high-speed precision robot.
  • the fourth method is to synthesize DNA probes in parallel on a chip using four piezoelectric nozzles each containing A, T, G, and C nucleosides.
  • the present invention provides a nucleic acid chip having a surface-immobilized probe corresponding to a specific sequence of a known gene, and the surface of the chip has a variety of probes of tens of thousands, and can detect a plurality of diseases at the same time for the same sample to be tested.
  • DNA library preparation refers to disrupting a fragment of interest in a genome to obtain a mixture of DNA fragments of a given size.
  • sample comprising an interrupted, genome-derived DNA double-stranded nucleic acid fragment, and the DNA double-stranded nucleic acid fragment having a blunt end;
  • a linker ligation sequence is added at the end; and a linker is added to the both ends of the DNA double-stranded nucleic acid fragment by the linker ligation sequence, wherein the linker has a primer
  • the junction region and the junction complementary region are complementary to the linker ligation sequence; the sequence of the linker at the 3' end and the 5' end of the two sides is different.
  • the disrupted product, the end repair product, the linker product, and the enriched product can also be purified.
  • Purification conditions and parameters are well known to those skilled in the art, and it is within the abilities of those skilled in the art to make certain changes or optimizations to the conditions of the reaction. Exon capture
  • exon capture and “chip hybridization” are used interchangeably to refer to the specific selection of a DNA fragment containing a target exon region in a library using a chip with a disease-specific probe. And the process of combining.
  • DNA molecules are normally double-stranded, so before they are captured, the DNA molecules must become single-stranded, usually by heat denaturation to achieve melting. The unzipped DNA molecules are rapidly cooled, ie, remain single-stranded.
  • capture hybridization was performed with the chip on the hybridization platform. Molecular hybridization is carried out under stringent conditions between the DNA fragment containing the target exon region and the probe immobilized on the chip. Preferably, the concentration of the probe molecules on the chip is much higher than the concentration of the target molecule.
  • the captured sequence is collected by purification or the like and purified to obtain a sequence mixture from the capture.
  • Those skilled in the art can perform exon capture and elution and purification of the desired fragment by a general method, and can also carry out the above process using a commercially available kit (e.g., Minage's MinElute PCR Purification kit).
  • a commercially available kit e.g., Minage's MinElute PCR Purification kit.
  • the mixture of PCR amplification products of the DNA library to be detected is single-stranded, and the region corresponding to the first and second analytes in the PCR amplification product is blocked with a blocking molecule, Thereby obtaining the closed ends a mixture of single-stranded PCR amplification products; capturing a disease-associated nucleic acid molecule from a mixture of said blocked single-stranded PCR amplification products using a nucleic acid chip; using a third primer and a fourth primer for the captured nucleic acid molecule The primer is amplified to obtain a mixture of the second PCR amplification products, wherein the third primer and the fourth primer specifically correspond to or bind to the first primer and the second primer, respectively; A mixture of two PCR amplification products is sequenced to obtain a nucleotide sequence of the disease-associated nucleic acid molecule in the test sample.
  • the term "primer” refers to a generic term for an oligonucleotide that is complementary to a template and which synthesizes a DNA strand complementary to a template in the action of a DNA polymerase.
  • the primer may be natural RNA, DNA, or any form of natural nucleotide, and the primer may even be a non-natural nucleotide such as LNA or ZNA.
  • the bow “substantially” is complementary to a specific sequence on one strand of the template.
  • the bow must be fully complementary to one strand of the template to begin extension, but the sequence of the primer does not have to be fully complementary to the sequence of the template.
  • a sequence that is not complementary to the template is added to the 5' end of the primer complementary to the template at a 3' end, such primers are still substantially complementary to the template.
  • the non-complementary complex can also form a complex with the template to amplify.
  • the first primer (SEQ ID NO: 1) and the second panel (SEQ ID NO: 2) amplify the DNA double-stranded nucleic acid fragment carrying the linker to obtain a first PCR amplification product
  • the first primer And the second primer has a linker binding region corresponding to the primer binding region of the linker, and a sequencing probe binding region located outside the linker binding region.
  • Blocking molecule 1 (SEQ ID NO: 3) and blocking molecule 2 (SEQ ID NO : 4) function to complement the linker when sequence capture is performed, avoiding the capture of non-specific sequences.
  • the role of the third primer (SEQ ID NO: 5) and the fourth primer (SEQ ID NO: 6) is to amplify a large amount of the captured specific DNA fragment for subsequent sequencing. Enrichment detection
  • the invention also provides a method for detecting amplification product enrichment, comprising: Ligation-Mediated PCR (LM-PCR) and P qPCR (Real-time Quantitative PCR) Detecting System) two steps.
  • LM-PCR Ligation-Mediated PCR
  • P qPCR Real-time Quantitative PCR
  • qPCR is to add an excess fluorescent dye (SYBR, etc.) in the PCR reaction system. After the fluorescent dye is specifically incorporated into the DNA double strand, the fluorescent signal is emitted, and the SYBR dye molecule not incorporated into the chain does not emit any fluorescent signal.
  • the amount of the specific product was immediately determined by continuously monitoring the change in the intensity of the fluorescent signal during PCR exponential amplification, and the initial amount of the target gene was inferred therefrom.
  • LM-PCR refers to the attachment of a specific linker to specifically amplify a DNA fragment for the purpose of sensitive detection of nucleic acid fragments.
  • the LM-PCR assay is semi-quantitative, so comparisons of different samples can be performed.
  • the enrichment detection comprises the steps of:
  • the "re-sequencing" of the genome enables humans to detect abnormal changes in disease-associated genes as early as possible, and contributes to in-depth research on the diagnosis and treatment of individual diseases.
  • Those skilled in the art can generally perform high-throughput sequencing using three second-generation sequencing platforms: 454 FLX (Roche), Solexa Genome Analyzer (Illumina), and SOLID from Applied Biosystems.
  • the common feature of these platforms is the extremely high sequencing throughput.
  • high-throughput sequencing can read 400,000 to 4 million sequences in one experiment. According to the platform, the reading length is from 25 From nt to 450 nt, different sequencing platforms can read bases ranging from 1G to 14G in one experiment.
  • Solexa high-throughput sequencing includes two steps: DNA cluster formation and on-machine sequencing: a mixture of PCR amplification products is hybridized with a sequencing probe immobilized on a solid phase carrier, and subjected to solid phase bridge PCR amplification to form a sequencing. Clustering; sequencing of the sequencing cluster by "edge synthesis-edge sequencing” to obtain a nucleotide sequence of a disease-associated nucleic acid molecule in a sample to be detected.
  • the DNA cluster is formed by using a flow cell with a single-stranded primer attached to the surface, and the DNA fragment of the single-stranded state is fixed in the sequencing by the principle of complementary pairing of the linker sequence with the primer on the sequencing chip.
  • the amplified single-stranded DNA becomes double-stranded DNA by amplification reaction, and the double strand is denatured into a single strand, one end of which is anchored on the sequencing chip, and the other end is randomly complementary to another primer in the vicinity to be anchored.
  • Set form a "bridge"; on the sequencing chip, there are tens of millions of DNA single molecules at the same time.
  • the single-strand bridge is formed, and the surrounding primers are used as amplification primers to be amplified again on the surface of the sequencing chip to form Double-stranded, double-stranded, denatured into a single strand, again becomes a bridge, and the template called the next round of amplification continues to expand; after repeated rounds of, for example, 30 rounds of amplification, each single molecule is, for example, 1000-fold amplified. , called a monoclonal DNA cluster.
  • the DNA clusters were sequenced on the Solexa sequencer while sequencing.
  • the four bases were labeled with different fluorescence, and each base was blocked by a protected base. Only one base could be added to a single reaction. After reading the color of the reaction, the protecting group is removed, and the next reaction can be continued. Thus, the base is accurate.
  • Sequence In the Solexa Multiplexed Sequencing process, Index is used to distinguish the samples, and after the conventional sequencing is completed, additional cycles such as 7 cycles of sequencing for the Index portion can be performed. For example, 12 different samples are distinguished in the strip sequencing channel.
  • the present invention provides a method of determining the nucleotide sequence of a disease-associated nucleic acid molecule in a sample to be detected. Referring to Figure 1, a preferred embodiment of the invention includes (but is not limited to) the following steps:
  • the genome in the sample to be detected is broken into a double-stranded DNA fragment having a main band of 200-250 bp, and the double-stranded DNA fragments are end-repaired into a blunt-end double-stranded DNA fragment, 3' in each chain.
  • the base error rate distribution on Read is not more than 5% at the tail.
  • Kit The invention also provides a kit for determining a nucleotide sequence of a disease-associated nucleic acid molecule in a sample to be detected, the kit comprising:
  • a third container and a primer selected from the group consisting of: (a) a first primer and/or a second primer; or a third bow I and/or a fourth primer;
  • the kit further comprises an agent selected from the group consisting of:
  • the main advantages of the invention include:
  • the target DNA fragment is captured by a chip immobilized with a nucleic acid probe, and the coverage is comprehensive;
  • the amplification products are first synthesized into sequencing clusters, and then sequenced while being synthesized, so the efficiency is high, and the repeated sequences can be accurately read, which can achieve a very high sequencing depth;
  • test cost is low, only 1/100 of the traditional method
  • the probe is designed from the exon sequence of the known pathogenic gene of the single gene disease and 100 bp before and after the exon, a total of more than 70,000 probes, SEQ ID NO., chromosome coordinates, capture position, length and involved
  • SEQ ID NO. SEQ ID NO.
  • chromosome coordinates SEQ ID NO.
  • the obtained human genomic DNA sample was extracted and fragmented on a Covaris S2 instrument (purchased from Covaris, USA), and finally a mixture of the double-stranded DNA fragment of 200 bp was disrupted, and the fragment was purified and purified.
  • the process was carried out using the Ampure Beads method according to the Agencourt AMPure protocol (Beckman, USA).
  • the DNA fragment is end-repaired into a mixture of fragments with blunt ends, and an "A" is added to the 3' end of each single strand to facilitate ligation with a linker with "T", followed by purification and purification.
  • the method was performed using Ampure Beads according to Agencourt AMPure protocol (Beckman, USA). After purification, remove excess reagents such as buffers, enzymes, guanidines, etc., and finally leave only DNA samples with linkers.
  • the PCR reaction system was as follows: 94 V, 2 min; denaturation at 94 °C for 15 s, annealing at 62 °C for 30 s, extension at 72 °C for 30 s, and a total expansion of 4 cycles; and finally extension at 72 °C for 5 min.
  • Table 1 The PCR reaction system was as follows: 94 V, 2 min; denaturation at 94 °C for 15 s, annealing at 62 °C for 30 s, extension at 72 °C for 30 s, and a total expansion of 4 cycles; and finally extension at 72 °C for 5 min.
  • Platimum Pfe DNA polymerase (*) 2 First primer (SEQ ID NO: 1) ( ⁇ ) 8 Second primer (SEQ ID NO: 2) ( ⁇ ) 8 DNA sample after ligation of the link 30 ⁇ L Total volume 100 ⁇ L ⁇
  • the amplified DNA was ligated with a linker, and the PCR product was purified using the Ampure beads method according to the procedure of Agencourt AMPure protocol (Beckman, USA).
  • the purified product is dissolved in 25 ⁇ 1 pure water, and the concentration of the PCR product is detected by NanoDroplOOO, which constitutes a DNA library.
  • the DNA library can be stored at 4 ° C for several days, or stored at -20 ° C for several weeks, or directly Used for subsequent procedures.
  • the chip with the corresponding probe in Example 1 was immobilized on a hybridization apparatus (Roche NimbleGen, USA), and the sample denatured in the previous step was added to the chip, and the chip was blocked and hybridized at 42 ° C for 64 hours.
  • the concentration of probe molecules on the gene chip is much higher than the concentration of the target molecule.
  • the hybridization reaction system is shown in Table 6: 3 ⁇ 46
  • Chip washing and sample purification were performed according to the instructions of the US Roche NimbleGen Kit (Sequemce Capture Array Hybridization and wash kit Catlog Number: 05853257001). The specific steps are shown in Table 7 (buffer from Roche NimbleGen kit).
  • Phusion Mix F-531L from FINNZYMES (containing Phusion DNA polymerase, 2x Phusion High-Fidelity PCR Master x with HF Buffer, 500 reactions in 50 ⁇ volume).
  • the PCR product was purified using the Ampure Beads protocol (BECKMAN COULTER; model: Agencourt AMPurebeads XP).
  • the mixture of PCR amplification products is hybridized with the sequencing probe immobilized on the solid phase carrier, and subjected to solid phase bridge PCR amplification to form a sequencing cluster; the sequencing cluster is sequenced by "edge synthesis-edge sequencing method".
  • a single-stranded primer is attached to a flow cell of a Solexa sequencing.
  • the single-stranded DNA fragment and the sequencing chip are "anchored” on the sequencing chip by base complementation; the single-stranded DNA by amplification reaction becomes Double-stranded DNA; double-stranded DNA is denatured again into single-stranded DNA, one end of which is “anchored” on the sequencing chip, and the other end (5' or 3') is randomly complementary to another nearby one, and is "anchored” "Living, forming a bridge”; on the sequencing chip, a colleague has tens of millions of DNA single molecules to react with the above; a single-stranded bridge is formed, and the surrounding primers are used as amplification primers, and the surface of the sequencing chip is expanded again.
  • Examples 1-5 were repeated, which differed in the sequencing method and the linker attachment region. The differences and test results are shown in Table 9.
  • a kit for determining the nucleotide sequence of a disease-associated nucleic acid molecule in a sample to be detected comprising the components:

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种测定待检测样本中疾病相关分子的核苷酸序列的方法,包括:对待测样本中片段化的、源自基因组的DNA双链核酸片段末端添加接头,并进行富集;用核酸芯片对含接头的DNA双链核酸片段进行捕获,将捕获的片段在高通量测序平台进行测序。本发明还提供了可用于该方法的、固定有数种至数万种疾病特异性探针的核酸芯片,以及包含所述芯片的试剂盒。

Description

测定待检测样本中疾病相关核酸分子的核苷酸序列的方法 技术领域
本发明涉及生物技术领域, 具体地, 涉及一种测定待检测样本中疾病相关核酸分子的核 苷酸序列的方法。 所述方法包括: 设计具有多种疾病特异性探针芯片、 对带有接头的特异性 目的 DNA片段进行捕获和富集、 高通量测序、 分析基因突变位信息等步骤。
背景技术 多种模式生物基因组测序工作的完成, 极大地提高了人们在基因水平对疾病致病机理和 机体生理状态的认识, 也极大地促进了第二代高通量测序技术的发展。 目前完成基因组组测 序的生物有: 人、 小鼠、 大鼠、 果蝇、 水稻、 大豆、 拟南芥等。 然后由于受到测序成本的限 制, 对个体进行基因组测序和疾病相关基因的鉴定和分析远不能满足日益发展的需要。
单基因病是由一对等位基因控制的疾病或病理性状, 又称孟德尔遗传病或单基因遗传 病。 目前已经发现的单基因病有 6000多种, 其中表型已知而分子基础未知的疾病有 1700多 种, 而由于遗传异质性, 表型和致病分子基础均已知的单基因病 (约 2900多种)中, 还有很多 的亚型未被发现。 基因是位于染色体上的遗传单位, 染色体有常染色体和性染色体之分, 基 因也有显性基因与隐性基因之别, 因此位于不同染色体上的致病基因具有不同的遗传方式。 通常, 单基因病可分为常染色体显性遗传病、 常染色体隐性遗传病、 X伴性显性遗传病、 X 伴性隐性遗传病、 Y伴性遗传病等几类。
单基因病的检测方法目前主要基于第一代测序技术, 主要为以下几种: 系谱分析、 染色 体核型分析、酶促反应及活性测定、 RALF、 SSCP (单链构象多态性)、 MOLDI-TOF, FISH (荧 光原位杂交)、 a-CGH(a-比较基因组杂交)、 qPCR、 MLPA (多重连接探针扩增)、 Sanger法等。 上述方法中存在诸多缺点,比如:系谱分析、染色体核型分析、酶促反应活性测定方法和 FISH 法分析方法都是染色体水平的检测, 准确性较低; RALF、 SSCP和 MOLDI-TOF分析方法是 间接检测方法, 不能直接反映位点的变化; a-CGH、 qPCR、 MLPA只能针对特定位点, 不能 对新发现的突变位点进行检测,并且以上方法的测序通量都很小,且要先经过 PCR扩增过程。 因此, 虽然以 Sanger法为基础的第一代测序技术是目前单基因病检测的金标准, 但是由于同 时测序的样本数很少, 检测的单基因病种类有限, 仅限于一种或几种, 测序成本高昂, 不能 对多种已知分子基础的单基因病进行同时检测, 大大限制了个体基因病的鉴定。 目前本领域尚缺乏有效的测定待检测样本中疾病相关核酸分子的核苷酸序列的方法。 因 此, 迫切需要基于已知的多种疾病的基因信息, 开发检测个体化样本中疾病相关核酸分子的核 苷酸序列的新方法。
发明内容
本发明的目的之一是提供一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方 法及其应用。
本发明的另一目的是提供一种测定待检测样本中疾病相关核酸分子的核苷酸序列的试 剂盒。
在本发明的第一方面, 提供了一种测定待检测样本中疾病相关核酸分子的核苷酸序列的 方法, 包括步骤:
a. 提供一待检测样本, 所述样品含有经打断的、 源自基因组的 DNA双链核酸片段, 并 且所述 DNA双链核酸片段具有平末端;
b. 对于上一步骤的所述 DNA双链核酸片段, 在末端添加接头连接序列; 并且通过所述 接头连接序列, 在所述 DNA双链核酸片段的两端添加接头, 其中所述接头具有引物结合区 以及连接互补区, 所述的连接互补区与所述的接头连接序列互补;
c 对步骤 b获得的带有接头的 DNA双链核酸片段,用第一引物和第二引物进行 PCR扩 增,从而获得第一 PCR扩增产物的混合物,其中所述的第一引物和第二引物具有对应于所述 接头的引物结合区的接头结合区, 以及位于接头结合区外侧的测序探针结合区;
d. 对所述的第一 PCR扩增产物的混合物进行单链化, 并用封闭分子封闭位于所述 PCR 扩增产物两端的、对应于第一引物和第二引物的区域,从而获得两端被封闭的单链 PCR扩增 产物的混合物;
e. 用核酸芯片, 从所述的经封闭的单链 PCR扩增产物的混合物中, 捕获疾病相关的核 酸分子;
£ 对上一步骤中经捕获的核酸分子, 用第三引物和第四引物进行 PCR扩增, 从而获得 第二 PCR扩增产物的混合物,其中第三弓 I物和第四引物分别特异性对应于或结合于所述的第 一引物和第二引物;
g. 对上一步骤获得的第二 PCR扩增产物的混合物进行测序, 从而获得所述待检测样本 中疾病相关核酸分子的核苷酸序列。
在另一优选例中,步骤 g中将所述的第二 PCR扩增产物的混合物与固相载体上固定的测 序探针进行杂交, 并进行固相桥式 PCR扩增, 形成测序簇; 然后对所述测序簇用 "边合成- 边测序"法进行测序, 从而得到所述待检测样本中疾病相关核酸分子的核苷酸序列。
在另一优选例中, 步骤 a 的所述经打断的、 源自基因组的 DNA双链核酸片段长度为 100-1000 bp或者平均长度为 800-1000 bp。
在另一优选例中, 所述片段长度为 150-500 bp, 较佳地为 200-300 bp。
在另一优选例中, 所述 DNA双链核酸片段具有的平末端是通过末端修复的方法制备。 在另一优选例中,步骤 b中的接头连接序列为 poly(N)n,其中各个 N分别独立地选自 A、 T、 G或 C, n为选自 1-20的任一正整数。
在另一优选例中,所述的接头连接序列为 poly(A)n,其中 n为 1-20的正整数,较佳地 n=l-2。 在另一优选例中, 步骤 b中所述的接头连接互补区序列为 poly(N , 其中各个 N'分别 独立地选自 A、 T、 G或 C, m为 1-20的正整数, 并且 poly(N) P poly(N')m为互补序列。
在另一优选例中, m为选自 1-3的任一正整数。
在另一优选例中, 所述的接头连接互补区的长度与所述接头连接序列的长度相同, 即 polyi^ P poly(N')m为完全互补序列。
在另一优选例中, 所述的接头连接互补区为 poly(T)m, 其中 m为 1-20的正整数, 较佳地 m=l-2 o
在另一优选例中, 步骤 c中所述的第一引物和第二引物为长度 30-80 nt的寡核苷酸。 在另一优选例中, 第一引物和第二引物长度为 55-65 nt。
在另一优选例中, 所述的第一引物和第二引物是不同的, 和 /或所述的第三引物和第四引 物是不同的。
在另一优选例中,步骤 d所述的封闭分子封闭第一 PCR扩增产物中对应于第一弓 I物和第 二引物的 70%-100%区域。
在另一优选例中,步骤 d中所述的封闭分子封闭第一 PCR扩增产物中对应于第一弓 I物和 第二引物的 100%区域。
在另一优选例中, 步骤 e中所述的核酸芯片上固定有 5-200,000种对应于所述疾病的特 异性探针。
在另一优选例中, 步骤 e中所述核酸芯片上特异性探针的种类为 50-150,000种, 更佳地 500-100,000种, 最佳地 5000-80,000种。
在另一优选例中, 所述特异性探针的序列对应于疾病致病基因的以下区域: 外显子和 / 或外显子前后两端 200 nt。
在另一优选例中,所述特异性探针的长度为 20-120 nt,较佳地, 50-100 nt,更佳地, 60-80 nt。
在另一优选例中, 所述特异性探针为全人工合成或体外克隆合成。
在另一优选例中, 步骤 f所述的第三引物和第四引物分别特异性结合于所述的第一引物 和第二弓 I物的外侧, 并且长度小于第一弓 I物和第二弓 I物。 在另一优选例中, 所述的第三引物和第四引物长度为 15-40 nt, 较佳地为 20-25 nt。 在另一优选例中, 所述待检测样本来源于人、 动物、 植物, 或微生物。
在另一优选例中, 所述待检测样本来源于人或非人哺乳动物, 较佳地, 来源于人。 在另一优选例中, 所述待检测样本含有人基因组 DNA。
在另一优选例中, 所述疾病为孟德尔单基因病。
在另一优选例中, 所述疾病选自下组: 家族性腺瘤样息肉病、 软骨发育不良、 家族性高 胆固醇血症、 多指畸形、 马凡综合症、 遗传性舞蹈病、 秃发、 苯丙酮尿症、 胱氨酸尿症、 遗 传性高度近视、 抗 D佝偻病、 遗传性肾炎、 血友病、 地中海贫血、 节性脑硬化综合症、 杜氏 肌营养不良、 进行性肌营养不良、 多囊肾综合症、 性别决定基因突变所致的性反转, 或其组 合。 在本发明的第二方面, 提供了一种可用于本发明第一方面所述方法的、 用于测定待检测 样本中疾病相关核酸分子的核苷酸序列的试剂盒, 所述试剂盒包括:
(1)第一容器以及位于容器内的核酸芯片;
(2)第二容器以及位于容器内的接头;
(3)第三容器以及位于容器内的选自下组的引物: (a)第一引物和 /或第二引物; 或 第三 弓 I物和 /或第四引物;
(4)第四容器以及位于容器内的封闭分子;
(5)检测说明书。
在另一优选例中,所述试剂盒还包括任选自下组的试剂:用于进行 PCR扩增所需的试剂、 用于进行封闭反应所需的试剂、 用于进行杂交反应所需的试剂、 或其组合。
在另一优选例中, 所述疾病为孟德尔单基因病。
在另一优选例中, 所述疾病选自下组: 家族性腺瘤样息肉病、 软骨发育不良、 家族性高 胆固醇血症、 多指畸形、 马凡综合症、 遗传性舞蹈病、 秃发、 苯丙酮尿症、 胱氨酸尿症、 遗 传性高度近视、 抗 D佝偻病、 遗传性肾炎、 血友病、 地中海贫血、 节性脑硬化综合症、 杜氏 肌营养不良、 进行性肌营养不良、 多囊肾综合症、 性别决定基因突变所致的性反转, 或其组 合。 在另一优选例中, 所述的核酸芯片上固定有选自下组的一个或多个探针:
探针 1 : 序列如 SEQ ID NO: 7所示, 捕获位置 112073411, 检测家族性腺瘤样息肉; 探针 2 序列如 SEQ ID NO 8所示, 捕获位置 51479999, 检测多囊肾综合症; 探针 3 序列如 SEQ ID NO 9所示, 捕获位置 135766620, 检测节性脑硬化综合症; 探针 4 序列如 SEQ ID NO 10所示, 捕获位置 103231969, 检测苯丙酮尿症; 探针 5 序列如 SEQ ID NO 11所示, 捕获位置 48700368, 检测马凡综合症; 探针 6: 序列如 SEQ ID NO: 12所示, 捕获位置 31137199, 检测杜氏肌营养不良。 应理解, 在本发明范围内中, 本发明的上述各技术特征和在下文 (如实施例)中具体描述的 各技术特征之间都可以互相组合, 从而构成新的或优选的技术方案。 限于篇幅, 在此不再一一 累述。
附图说明
下列附图用于说明本发明的具体实施方案, 而不是用于限定由权利要求书所界定的 本发明范围。
图 1显示了在本发明一个实例中, 可以同时检测多种单基因病的流程图。
具体实施方式
本发明人经过广泛而深入的研究, 首次建立了一种测定待检测样本中疾病相关核酸分子 的核苷酸序列的方法。 具体而言, 本发明人根据现有疾病基因的信息, 设计了固定有多种疾 病特异性探针的核酸芯片; 对待测样本中片段化的、 源自基因组的 DNA双链核酸分子的末 端添加接头, 并进行富集; 用核酸芯片对含接头的 DNA片段进行捕获, 将捕获的片段在高 通量测序平台进行测序, 基于已知的基因位点信息, 对测序结果进行分析, 得到样本中疾病 相关核酸分子的核苷酸序列。 术语
本文所用, 术语"含有"包括"具有 (comprise)"、 "基本上由...构成"和"由...构成"的含义。 单基因病
如本文所用, "单基因病"一词是指由一对等位基因控制的疾病或病理性状, 又称孟德尔 遗传病, 可以分为常染色体显性遗传病、 常染色体隐性遗传病、 X伴性遗传病、 Y伴性遗传 病。
常染色体显性遗传病致病基因定位于常染色体上, 常见的亚型: 完全显性: 正常纯合子 和杂合子患者在表型上无差异;不完全显性:杂合子表现介于显性纯合子患者和正常人之间, 常表现为轻病型; 不规则显型: 由于某种原因可使杂合子的显性基因不表现出相应的症状; 共显性: 等位基因之间无显性与隐性之分, 在杂合体时都能表现两种基因作用; 延迟显性: 杂合子在生命早期显性基因不表达, 待到某一年龄后才表达; 从性显性: 杂合子的表达受性 别的影响, 在某一性别表达出相应的表现型, 在另一性别不表达相应表现型。 常染色体隐性 遗传病的常染色体上的致病基因在杂合状态时不表现相应的疾病, 而只在纯合子时才致病。 定位于 X染色体上的致病基因随 X染色体而遗传疾病, 包括 X连锁显性遗传和 X连锁隐性 遗传。 定位于 Y染色体上的致病基因随 Y染色体而遗传疾病。
适用于本发明检测方法的单基因病包括但不限于:家族性腺瘤样息肉病、软骨发育不良、 家族性高胆固醇血症、 多指畸形、 马凡综合症、 遗传性舞蹈病、 秃发、 苯丙酮尿症、 胱氨酸 尿症、 遗传性高度近视、 抗 D佝偻病、 遗传性肾炎、 血友病、 地中海贫血、 节性脑硬化综合 症、杜氏肌营养不良、进行性肌营养不良、多囊肾综合症、性别决定基因突变所致的性反转, 或其组合。 外显子
如本文所用, "外显子"一词是指在成熟 mRNA中被保留下的部分, 即成熟 mRNA对应 于基因中的部分。 内含子是在 mRNA加工过程中被剪切掉的部分,在成熟 mRNA中不存在。 外显子和内含子都是对于基因而言的, 编码的部分为外显子, 不编码的为内含子, 内含子没 有遗传效应。 探针
如本文所用, "探针 "一词是指能够检测互补核酸序列的简单 DNA或 RNA分子。探针必 须是纯净的,而且不受其他不同序列核酸的影响。典型的探针是克隆的 DNA序列或通过 PCR 扩增获得的 DNA, 人工合成的寡核苷酸或从体外转录克隆 DNA序列后获得的 RNA, 也可 以作为探针。 探针长度可以从 20-120 nt, 较佳地 50-100 nt, 更佳地 60-80 nt。 探针设计和合 成方法为本领域技术人员所熟知, 根据单基因病的已知的致病基因的外显子及其前后两端序 列 (较佳地前后 200 bp左右), 可以设计探针。在一个优选例中, 探针长度 50-80 nt。可以使用 人工化学合成法合成的探针或使用市售探针。 典型的探针序列见表 4。 心片
如本文所用, "芯片 "一词是指可以采用微加工技术在芯片的基底材料上加工出多种微 细结构, 施加必要的生物化学物质并进行表面处理, 将多个探针分子与表面固定化, 制得含 有大量探针的基底材料。
本领域技术人员可以使用通用的方法获得芯片。 DNA芯片制备方法通常有 4种。 第 1 种是光引导原位合成法, 在微加工技术中用光刻工艺与光化学合成法相结合。 第 2种方法是 化学喷射法, 将合成好的寡核苷酸探针定点喷射到芯片上并加以固定化来制作 DNA芯片。 第 3种方法是接触式点涂法, 通过高速精密机械手的精确移动让移液头与玻璃芯片接触而将 DNA探针涂敷在芯片上。 第 4种方法是使用 4支分别装有 A, T, G, C核苷的压电喷头在 芯片上并行合成出 DNA探针。 本发明提供了一种表面固定有对应于已知基因特定序列探针的核酸芯片, 所述芯片表面 的探针种类可达数万种, 能一次对同一个待测样品检测多种疾病。
DNA文库及其制备
如本文所用, "DNA文库制备"一词是指对基因组的目的片段进行打断, 获得一组具有一 定大小的 DNA片段混合物。
文库的制备方法为本领域技术人员所熟知, 包括 (但不局限于)步骤:
1. 提供一个待检测样本, 所述样品含有经打断的、 源自基因组的 DNA双链核酸片段, 并且所述 DNA双链核酸片段具有平末端;
2. 对于上一步骤的所述 DNA双链核酸片段, 在末端添加接头连接序列; 并且通过所述 接头连接序列, 在所述 DNA双链核酸片段的两端添加接头, 其中所述接头具有引物结合区 以及连接互补区, 所述的连接互补区与所述的接头连接序列互补; 两侧 3'端和 5'端的接头的 弓 I物结合区序列不同。
3. 对上一步骤获得的带有接头的 DNA双链核酸片段,用第一弓 I物和第二弓 I物进行扩增, 从而获得 PCR扩增产物的混合物,其中所述弓 I物具有对应于所述接头的弓 I物结合区的接头结 合区, 并且位于接头结合区外侧的测序探针结合区。
在一个优选例中, 还可以对打断产物、 末端修复产物、 接头产物和富集产物进行纯化。 纯化条件及参数为本领域技术人员所熟知, 对反应的条件进行一定的变化或优化也在本领域 技术人员能力范围之内。 外显子捕获
如本文所用, 术语"外显子捕获", "芯片杂交"可互换使用, 指的是用带有疾病特异性探 针的芯片对文库中含有目标外显子区域的 DNA片段进行特异性选择和结合的过程。
DNA分子正常情况下是双链, 因此捕获之前, DNA分子必须变为单链, 一般通过加热 变性而达到解链目的, 解链的 DNA分子被迅速冷却, 即保持单链状态。 文库变性后在杂交 平台与芯片进行捕获杂交。 含有目标外显子区域的 DNA片段与固定在芯片上的探针之间在 严格的条件下进行分子杂交。 较佳地, 芯片上探针分子的浓度要远远高于靶分子浓度。 待杂 交完毕后, 通过变性等方法收集捕获的序列并纯化, 得到来自捕获后的序列混合物。
本领域技术人员可以通过通用的方法进行外显子捕获和目的片段的洗脱和纯化, 也可以 应用市售 (如: 德国 Qiagen公司的 MinElute PCR Purification kit)试剂盒进行上述过程。
在一个优选例中, 对待检测的 DNA文库的 PCR扩增产物的混合物进行单链化, 并用封 闭分子封闭所述 PCR扩增产物中对应于第一弓 I物和第二弓 I物的区域,从而获得两端被封闭的 单链 PCR扩增产物的混合物;用核酸芯片从所述的经封闭的单链 PCR扩增产物的混合物中, 捕获疾病相关的核酸分子; 对经捕获的核酸分子, 用第三引物和第四引物进行扩增, 从而获 得第二 PCR扩增产物的混合物,其中第三引物和第四引物分别特异性对应于或结合于所述的 第一引物和第二引物;对上一步骤获得的第二 PCR扩增产物的混合物进行测序,从而获得所 述检测样本中疾病相关核酸分子的核苷酸序列。 引物
如本文所用, 术语"引物"指的是能与模板互补配对, 在 DNA聚合酶的作用合成与模板 互补的 DNA链的寡聚核苷酸的总称。 引物可以是天然的 RNA、 DNA, 也可以是任何形式的 天然核苷酸, 引物甚至可以是非天然的核苷酸如 LNA或 ZNA等。
弓 I物"大致上 "(或 "基本上")与模板一条链上的一个具体的序列互补。弓 I物必须与模板的一 条链充分互补才能开始延伸, 但引物的序列不必与模板的序列完全互补。 比如, 在一个 3'端 与模板互补的引物的 5'端加上一段与模板不互补的序列, 这样的引物仍大致上与模板互补。 只要有足够长的弓 I物能与模板充分的结合,非完全互补的弓 I物也可以与模板形成弓 I物-模板复 合物, 从而进行扩增。
在本发明中, 几类重要示例性引物的序列和名称见表 1。 表 1
SEQ ID
引物名称 序列 (5'-3')
NO.
AATGATACGGCGACCACCGAGATCTACACTCTTTCC
1 第一引物
CTACACGACGCTCTTCCGATCT
CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCAT
2 第二引物
TCCTGCTGAACCGCTCTTCCGATCT
AATGATACGGCGACCACCGAGATCTACACTCTTTCC
3 封闭分子 1
CTACACGACGCTCTTCCGATCT
CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCAT
4 封闭分子 2
TCCTGCTGAACCGCTCTTCCGATCT
5 第三引物 AATGATACGGCGACCACCGAGA
6 第四引物 CAAGCAGAAGACGGCATACGAG 第一弓 I物 (SEQ ID NO: 1)和第二弓 I物 (SEQ ID NO: 2)对带有接头的 DNA双链核酸片段 进行扩增,获得第一 PCR扩增产物,第一引物和第二引物具有对应于所述接头的引物结合区 的接头结合区, 以及位于接头结合区外侧的测序探针结合区。 封闭分子 1(SEQ ID NO: 3)和 封闭分子 2(SEQ ID NO: 4)的作用是在进行序列捕获时, 与接头互补, 避免捕获非特异性序 列。 第三弓 I物 (SEQ ID NO: 5)和第四引物 (SEQ ID NO: 6)的作用是大量扩增捕获的特异性 DNA片段, 以便进行下一步测序。 富集度检测
本发明还提供了一种检测扩增产物富集度 (Enrichment) 的方法, 包括: 连接介导的聚 合酶链式反应 (Ligation-Mediated PCR^LM-PCR)禾 P qPCR(Real-time Quantitative PCR Detecting System)两个步骤。本领域技术人员可以通过荧光定量核酸扩增检测系统,对富集度进行检测。 qPCR是在 PCR反应体系中,加入过量荧光染料 (SYBR等), 荧光染料特异性地掺入 DNA双 链后, 发射荧光信号, 而不掺入链中的 SYBR染料分子不会发射任何荧光信号, 在 PCR指 数扩增期间通过连续监测荧光信号强弱的变化来即时测定特异性产物的量, 并据此推断目的 基因的初始量。
如本文所用, LM-PCR是指连上特异性接头, 专一性地扩增 DNA片段, 从而达到灵敏 检测核酸片段的目的。 此外, LM-PCR检测是半定量的, 因此可进行不同样品的比较。
在本发明的一个优选例中, 富集度检测包括步骤:
1 )将稀释好的 4种 NSC Assay ηώ 购于美国 Roche NimbleGen公司), 根据试剂盒内的 说明书进行)取出在冰上溶解;
2)根据 Nanodrop (Thermo Fisher Scientific Inc. 型号: Nanodrop 8000)检测浓度, 将未 捕获的以及捕获的 LM-PCR产物稀释至 1 ng/μΐ, 最后体积要求 >12 μΐ;
3)按照每个样品 4种 NSC Assay, 每个样品包括 2种 DNA模版, 每个样品需要 4x2=8 个反应, 每个平板需要 1个阴性对照共 4个反应;
4)在 1.5 ml的离心管中配制 QPCR反应混合液;
5 )将配置好的 12 μΐ QPCR反应混合液转移至 96孔 QPCR反应板中, 向其中加入 3μ1 稀释的 lng/μΐ LM-PCR产物, 把所有的试剂和样品加完后使用封口膜将平板封口, 4000 rpm 离心 2 min;
6 )将 96? L板置于 QPCR仪上进行检测;
7) 实验完成后分析试验结果, 整理 QPCR试验数据, 根据公式计算富集度, 判断文库 是否合格, 合格后能否进行下一步试验。 平均富集度 >60时, 文库合格, 可以进行下一步测 序。 富集度计算公式见表 2。 表 2
QPCR引物 产物长度 QPCR效率 △Ct 水浴温度
NSC1 80 nt 1.84 Ct前 -Ct后 (1.84)ACt
NSC2 74 nt 1.80 Ct前 -Ct后 (1.80)ACt
NSC3 75 nt 1.78 Ct前 -Ct后 (1.78)ACt
NSC4 71 nt 1.93 Ct前 -Ct后 (1.93)ACt 平均富集率 =(NSCl+NSC2+NSC3+NSC4)/4 高通量测序
基因组的"再测序"使得人类能够尽早地发现与疾病相关基因的异常变化, 有助于对个体 疾病的诊断和治疗进行深入的研究。 本领域技术人员通常可以采用三种第二代测序平台进行 高通量测序: 454 FLX(Roche 公司)、 Solexa Genome Analyzer(Illumina 公司)禾口 Applied Biosystems公司的 SOLID等。 这些平台共同的特点是极高的测序通量, 相对于传统测序的 96道毛细管测序, 高通量测序一次实验可以读取 40万到 400万条序列, 根据平台的不同, 读取长度从 25 nt到 450 nt不等,因此不同的测序平台在一次实验中,可以读取 1G到 14G不 等的碱基数。
其中, Solexa高通量测序包括 DNA簇形成和上机测序两个步骤: PCR扩增产物的混合物与 固相载体上固定的测序探针进行杂交, 并进行固相桥式 PCR扩增, 形成测序簇; 对所述测序 簇用"边合成 -边测序法"进行测序, 从而得到待检测样本中疾病相关核酸分子的核苷酸序列。
DNA簇的形成是使用表面连有一层单链引物 (primer)的测序芯片 (flow cell),单链状态的 DNA片段通过接头序列与测序芯片上的引物通过碱基互补配对的原理被固定在测序芯片的 表面, 通过扩增反应, 固定的单链 DNA变为双链 DNA, 双链再次变性成为单链, 其一端锚 定在测序芯片上, 另一端随机和附近的另一个引物互补从而被锚定, 形成"桥"; 在测序芯片 上同时有上千万个 DNA单分子发生以上的反应; 形成的单链桥, 以周围的引物为扩增引物, 在测序芯片的表面再次扩增, 形成双链, 双链经变性成单链, 再次成为桥, 称为下一轮扩增 的模板继续扩增; 反复进行了多轮例如 30轮扩增后, 每个单分子得到例如 1000倍扩增, 称 为单克隆的 DNA簇。
DNA簇在 Solexa测序仪上进行边合成边测序, 测序反应中, 四种碱基分别标记不同的 荧光, 每个碱基末端被保护碱基封闭, 单次反应只能加入一个碱基, 经过扫描, 读取该次反 应的颜色后, 该保护基团被除去, 下一个反应可以继续进行, 如此反复, 即得到碱基的精确 序列。 在 Solexa多重测序 (Multiplexed Sequencing)过程中会使用 Index(标签)来区分样品, 并 在常规测序完成后, 针对 Index部分额外进行多个循环例如 7个循环的测序, 通过 Index的 识别, 可以在 1条测序通道中区分例如 12种不同的样品。 本发明提供了一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法。参见图 1, 本发明的一个优选例包括 (但不局限于;)以下步骤:
将所述待检测样本中的基因组打断成为主带在 200-250 bp的双链 DNA片段,对这些 双链 DNA片段进行末端修复成为平末端的双链 DNA片段, 在每一条链的 3'端加入一个 "A", 并与带有一个 "T"的接头相连, 成为两端都带有接头的双链的 DNA片段混合物; 将所 述混合物与固定有疾病特异性探针的芯片进行杂交, 捕获疾病特异性的 DNA片段, 将捕获 的 DNA片段富集后进行固相桥式 PCR扩增, 形成测序簇; 对所述测序簇用"边合成边测序" 的方法, 上机测序, 最后进行数据分析。
测序结果分析:
( 1 )根据测序仪的使用说明, 将测序结果原始 read质控, 其中原始 read质控包括的项 目见表 3; 表 3
质控指标 质控标准
Read碱基 Q20统计 90%以上为合格, 低于 85%不合格 插入片段长度波动幅度 上下均小于插入片段长度的一半为合格
Read上 AT及 CG的统计量吻合度 通过质控图判断
Read上的碱基错误率分布 尾部最高不超过 5%为合格
Insertsize分布均匀度 通过质控图判断
(2)进行短序列比对, 输出, 原始比对结果一 SAM文件(BWA软件(Burrows Wheeler Aligner; http:〃 sourceforge.net/projects/bio-bwa/) 比对后产生的结果文件);
(3 )使用 samtools工具 (http:〃 sourceforge.net/projects/samtools/)将比对结果处理, 包括步 骤: 格式转换、 压缩; 比对结果按染色体号及坐标进行排序; 同一个文库的泳道结果进行合 并; 分别对每一个文库去重复 (duplication); 将所有文库合并到一起, 最后, 使用 soapsnp 工具 (http:〃 soap.genomics.org.cn/)进亍 SNP检则。 试剂盒 本发明还提供了一种用于测定待检测样本中疾病相关核酸分子的核苷酸序列的试剂盒, 所述试剂盒包括:
(1)第一容器以及位于容器内的核酸芯片;
(2)第二容器以及位于容器内的接头;
(3)第三容器以及位于容器内的选自下组的引物: (a)第一引物和 /或第二引物; 或 第三 弓 I物和 /或第四引物;
(4)第四容器以及位于容器内的封闭分子;
(5)可选的检测说明书。
在本发明的一个优选例中, 试剂盒还包括任选自下组的试剂:
用于进行 PCR扩增所需的试剂、用于进行封闭反应所需的试剂、用于进行杂交反应所需 的试剂、 或其组合。 本发明的主要优点包括:
1.通过固定有核酸探针的芯片对目的 DNA片段进行捕获, 覆盖全面;
2.使用特异性与 DNA片段两端接头结合的一对引物对所有捕获的片段进行扩增, 获 得具有同样的接头序列而中间片段不同的扩增混合物;
3.将扩增产物先合成测序簇, 再进行边合成边测序, 因此效率高, 可以精确读取重复 序列, 可以达到很高测序深度;
4.可以同时检测多个待检测样品, 且没有荧光背景的干扰;
5.试验费用低, 只有传统方法的 1/100;
6. 不受物种的限制, 人、 动物、 微生物、 植物等都可以进行个体式检测;
7.灵敏度高、 精确度高、 重复性好。 下面结合具体实施例, 进一步阐述本发明。 应理解, 这些实施例仅用于说明本发明而 不是用于限制本发明的范围。 下列实施例中未注明具体条件的实验方法, 通常按照常规条 件如 Sambrook等人,分子克隆:实验室手册 (New York: Cold Spring Harbor Laboratory Press, 1989)中所述的条件, 或按照制造厂商所建议的条件。 实施例 1
建立芯片杂交平台
探针设计自单基因病已知致病基因的外显子序列及外显子前后 100 bp, 共 7万多个探 针, 其 SEQ ID NO.、 染色体坐标、 捕获位置、 长度和所涉及的疾病种类见表 4。 表 4
SEQ ID
染色体坐标 捕获位置 长度 (bp) 疾病种类
NO.
7 CHR05FS112073411 112073411 77 家族性腺瘤样息肉
8 CHR06FS051479999 51479999 69 多囊肾综合症
9 CHR09FS 135766620 135766620 70 节性脑硬化综合症
10 CHR12FS103231969 103231969 76 苯丙酮尿症
11 CHR15FS048700368 48700368 70 马凡综合症
12 CHRXFS031137199 31137199 72 杜氏肌营养不良 实施例 2
制备 DNA文库
1. 基因组 DNA获得
取人的外周血, 提取基因组 DNA, 获得 3 μ§ ϋΝΑ。
2. DNA片段化
将抽提获得的人基因组 DNA样品, 在 Covaris S2仪器 (购自美国 Covaris公司)上进行片 段化, 最终打断成为主带在 200 bp的 DNA双链片段的混合物, 并将片段进行纯化, 纯化过 程采用 Ampure Beads方法, 按照 Agencourt AMPure protocol进行 (;美国 Beckman公司)。
3. DNA片段接头化
将 DNA片段进行末端修复, 成为带有平末端的片段混合物, 并在每一条单链的 3'端添 加一个 "A", 以便于与带有 "T"的接头相连, 连接后进行纯化, 纯化方法采用 Ampure Beads, 按照 Agencourt AMPure protocol (;美国 Beckman公司)进行。纯化后, 去除多余试剂如缓冲物、 酶、 ΑΓΡ等, 最终只剩下连有接头的 DNA样品。
4. 扩增 DNA片段
由于连有接头的 DNA样品浓度很低, 需要进行扩增富集, PCR反应在 Bio-Rad公司的 PTC-200PCR仪上运行。 PCR扩增反应试剂的配置见表 5。
PCR反应体系如下: 94 V , 2 min; 94°C变性 15 s, 62°C退火 30 s, 72°C延伸 30 s, 共扩 增 4个循环; 最终 72°C延伸 5 min。 表
ddH20 (来自 PROMEGA的 Nuclease-Free water) 34 μL 10 pfe Amplification Buffer (*) 10
dNTP (lOmM) (*) 4
MgS04 (50mM) (*) 4
Platimum Pfe DNA polymerase (*) 2 第一引物 (SEQIDNO:l) (ΙΟμΜ) 8 第二引物 (SEQIDNO:2) (ΙΟμΜ) 8 连接接头后的 DNA样品 30 μL 总体积 100 μL·
( * )来自 INVITROGEN公司的 Platinum® P& DNA Polymerase试剂盒
经扩增的 DNA都带有接头, 使用 Ampure beads法, 按照 Agencourt AMPure protocol的 程序 (;美国 Beckman公司)纯化 PCR产物。
5. 将纯化的产物溶解于 25μ1纯水中,使用 NanoDroplOOO检测 PCR产物浓度, 即构成 DNA文库, DNA文库可在 4°C保存数天, 也可在 -20°C保存数周, 也可直接用于后续程序。 实施例 3
序列捕获
1. 文库变性
将准备好的 DNA样品置于 SpeedVac (来自 Eppendorf; 型号: Concentrator plus 5305) 中 60°C蒸干, 然后加入 11.2 的超纯水, 充分溶解。全速离心样品 30秒, 分别加入以下两 种试剂: 18.5 μL·的 2xSC Hybridiation Buffer (购于美国 Roche NimbleGen公司)和 7.3 μL·的 1 SC Hybridiation Component A (购于美国 Roche NimbleGen公司)。 震荡混匀后置于离心机上 全速离心 30秒, 然后于 95°C使 DNA充分变性, 变性过程 10分钟, 得到单链的带有接头的 DNA文库。
2. 杂¾ /序列捕获
将实施例 1中带有相应探针的芯片固定在杂交仪 (美国 Roche NimbleGen公司)上, 将上 一步骤变性后的样品加入芯片中, 封闭芯片, 于 42°C杂交 64小时。 在杂交体系中, 基因芯 片上探针分子的浓度要远远高于靶分子浓度。
杂交反应体系如表 6所示: ¾6
组分 重量 /体积 Cot-1 DNA 450 μg
DNA文库 5 μβ 封闭分子 1(SEQ ID NO:3) ( 100 μΜ) 10 μL· 封闭分子 2(SEQ ID NO:4) ( ΙΟΟ μΜ) \0 μL· 其中, Cot-1 DNA通过 Human Cot-1 DNA®-Fluorometric QC (Invitrogen)按照提供商说 明书获取, 它可以很好地封闭来自基因组重复序列的非特异性杂交, 在最大程度上提高杂交 的效率; 封闭分子 1(SEQ ID NO:3)和封闭分子 2(SEQ ID NO:4)可以将实施例 2中的第一弓 I物 (SEQ ID ΝΟ:1)和第二引物 (SEQ ID NO:2)封闭, 避免非特异性捕获。
3. 芯片洗漆与样品纯化
芯片洗涤与样品纯化根据美国 Roche NimbleGen公司的试剂盒 ( Sequemce Capture Array Hybridization and wash kit Catlog Number: 05853257001 ) 说明书进行, 具体步骤见表 7 (缓冲 液来自 Roche NimbleGen公司的试剂盒)。
表 7 次序 洗涤 /洗脱缓冲液 颠倒洗脱次数 水浴时间 水浴温度
1 l xWash Buffer II 10次 1
2 1 x Stringent Wash Buffer 10次 5 分钟 47.5 °C
3 1 x Stringent Wash Buffer 10次 5分钟 47.5 °C
3 l Wash Buffer I 2分钟 (1稱、 1
5 l Wash Buffer II 1分钟 (1稱、 1
6 l x Wash Buffer III 10 1 i¾ ¾m
7 NaOH (900 μί) 1 10分钟 将 NaOH洗脱液回收后用 40 μL 的 20%冰醋酸中和, 中和液用德国 Qiagen公司的 MinElute PCR Purification Kit进行纯化, 得到捕获后的样品, 最后溶解于 165 纯水中。 实施例 4
PCR扩增捕获的序列
由于捕获的含有特定序列的 DNA片段浓度很低, 需要进行 PCR扩增, 每管的反应体系 为 50 μί, 反应组分见表 8。 表 8
捕获的 DNA 28.8 μL
2xPhusion Mix 25 μL· 第三引物 (SEQ ID NO: 5) ( ΙΟ μΜ) 0.6μί 第四引物 (SEQ ID NO:6) ( ΙΟ μΜ) 0.6μί 总体积 50 μL·
Phusion Mix: 来自 FINNZYMES 的 F-531L (含 Phusion DNApolymerase、 2x Phusion High-Fidelity PCR Master x with HF Buffer, 500 reactions in 50 μΐ volume )。
反应条件:
98°C预变性 30s, 98°C变性 10s, 60°C退火 30s, 72°C延伸 30s, 循环 15次; 最终 72°C延 伸 5min, 可 4°C静置过夜。
PCR产物使用 Ampure Beads流程 (BECKMAN COULTER;型号: Agencourt AMPurebeads XP)进行纯化。
完成后溶于 32μ1洗脱缓冲液 (Elution Buffer,来自 QIAGEN : QIAquick PCR Purification Kit (Cat. no.28106)或 MinElute PCR Purification Kit (Cat. no.28006)) 中, 使用 NanoDrop
(Thermo Fisher Scientific Inc.; 型号: Nanodrop 8000)及 Bioanalyzer 2100 (Agilent; 型号: 2100)检测浓度。 实施例 5
检测捕获序列的富集度
1. 将稀释好的 4种 NSC Assay mix (购于美国 Roche NimbleGen公司), 根据试剂盒内的 说明书进行)取出在冰上溶解。 将未捕获的以及捕获的 LM-PCR产物稀释至 20η§/μ1, 最后体 积〉 5μ1。
2. 在 1.5 ml的离心管中配制 qPCR反应混合液, 并分配转移至 96孔 qPCR反应板中, 向其中加入 3μ1稀释的 lng^l LM-PCR产物, 把所有的试剂和样品加完后使用封口膜将平板 封口, 4000rpm离心 2min。
3. 将 96 ?L板置于 qPCR仪上, 按说明书操作手册进行操作。
4. 实验完成, 整理分析 qPCR试验数据, 计算富集度 (Enrichment), 结果表明, 人基因组
DNA样品 (n= 10)经实施例 1-5所述方法处理后, 其富集度均 > 60, 可用于后续测序。 实施例 6
Solexa高通量测序及数据分析
PCR扩增产物的混合物与固相载体上固定的测序探针进行杂交, 并进行固相桥式 PCR 扩增, 形成测序簇; 对所述测序簇用"边合成 -边测序法"进行测序, 从而得到所述待检测样本 中疾病相关核酸分子的核苷酸序列, 包括步骤:
Solexa测序专用的测序芯片 (flow cell)上连接有单链引物, 单链状态的 DNA片段与测 序芯片通过碱基互补被一端 "锚定 "在测序芯片上;通过扩增反应的单链 DNA成为双链 DNA; 双链 DNA再次变性后成为单链 DNA, 其一端 "锚定 "在测序芯片上, 另一端 (5'或 3' ) 随机 和附近的另外一个弓 I物互补,被"锚定"住,形成"桥" (bridge);在测序芯片上同事有上千万 DNA 单分子发生以上的反应; 形成的单链桥, 以周围的引物为扩增引物, 在测序芯片表面再次进 行扩增, 形成双链; 双链经变性成单链, 再次形成桥, 成为下一轮扩增的模板继续扩增反应; 在反复进行 30轮扩增, 每个单分子得到了 1000倍的扩增, 成为单克隆" DNA簇群"; "DNA 簇群"在 Solexa测序仪上进行序列分析; 测序反应: "可逆性末端终止反应"提高碱基合成来 进行测序。 四种碱基分别标记四种不同荧光, 每个碱基末端被保护基团封闭, 单次反应只能 加入一个碱基, 经过扫描, 读取该次反应颜色后, 该保护基团被除去, 下一个反应可继续进 行, 如此反复, 得出碱基的精确序列; 自动读取碱基, 数据被转移到自动分析通道进行二次 分析。 实施例 7
用四种方法检测样本是否携带以下三种单基因病。
具体地, 重复实施例 1-5, 其不同点在于测序法和接头连接区域。 其不同点和检测结果 见表 9。
¾ 9
测序方法 接头连接序列 杜氏肌营养不良 苯丙酮尿症 多囊肾综合症
12号染色体上
X染色体上发生
1 Solexa法 AAA 发生突变 未发现突变 突变 R3381X
R241C
12号染色体上
X染色体上发生
2 454法 A 发生突变 未发现突变 突变 R3381X
R241C 12号染色体上
X染色体上发生
3 SOLID法 GCTT 发生突变 未发现突变 突变 R3381X
R241C
4 Sanger法 TT 阳性 阳性 阴性 由表 9可以看出, 本发明的方法制得带有不同接头连接区的 DNA文库, 与二代测序方 法结合进行分析, 通过 Sanger法验证, 表明本发明方法可以获得准确的筛查结果。 实施例 8
试剂盒制备
一种测定待检测样本中疾病相关核酸分子的核苷酸序列的试剂盒, 包括组分:
(1)第一容器以及位于容器内的核酸芯片;
(2)第二容器以及位于容器内的接头;
(3)第三容器以及位于容器内的第一弓 I物和 /或第二弓 I物; 和第三弓 I物和 /或第四引物;
(4)第四容器以及位于容器内的封闭分子;
(5)第五容器以及位于容器内的用于进行 PCR扩增所需的试剂;
(6)第六容器以及位于容器内的用于进行封闭反应所需的试剂;
(7)第七容器以及位于容器内的用于杂交反应所需的试剂;
(5;)任选的检测说明书。 在本发明提及的所有文献都在本申请中引用作为参考, 就如同每一篇文献被单独引用作 为参考那样。 此外应理解, 在阅读了本发明的上述讲授内容之后, 本领域技术人员可以对本 发明作多种改动或修改, 这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims

权 利 要 求 书
1. 一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法, 其特征在于, 包括步 骤:
a. 提供一待检测样本, 所述待检测样品含有经打断的、 源自基因组的 DNA双链核酸片 段, 并且所述 DNA双链核酸片段具有平末端;
b. 对于上一步骤的所述 DNA双链核酸片段, 在末端添加接头连接序列; 并且通过所述 接头连接序列, 在所述 DNA双链核酸片段的两端添加接头, 其中所述接头具有引物结合区 以及连接互补区, 所述的连接互补区与所述的接头连接序列互补;
c 对步骤 b获得的带有接头的 DNA双链核酸片段,用第一引物和第二引物进行 PCR扩 增,从而获得第一 PCR扩增产物的混合物,其中所述的第一弓 I物和第二弓 I物具有对应于所述 接头的引物结合区的接头结合区, 以及位于接头结合区外侧的测序探针结合区;
d. 对所述的第一 PCR扩增产物的混合物进行单链化, 并用封闭分子封闭位于所述 PCR 扩增产物两端的、对应于第一引物和第二引物的区域,从而获得两端被封闭的单链 PCR扩增 产物的混合物;
e. 用核酸芯片, 从所述的经封闭的单链 PCR扩增产物的混合物中, 捕获疾病相关的核 酸分子;
£ 对上一步骤中经捕获的核酸分子,用第三引物和第四引物进行 PCR扩增,从而获得第 二 PCR扩增产物的混合物,其中第三弓 I物和第四引物分别特异性对应于或结合于所述的第一 引物和第二引物;
g. 对上一步骤获得的第二 PCR扩增产物的混合物进行测序, 从而获得所述待检测样本 中疾病相关核酸分子的核苷酸序列。
2. 如权利要求 1所述的方法, 其特征在于, 在步骤 g中, 将所述的第二 PCR扩增产物 的混合物与固相载体上固定的测序探针进行杂交, 并进行固相桥式 PCR扩增, 形成测序簇; 然后对所述测序簇用 "边合成-边测序"法进行测序,从而得到所述待检测样本中疾病相关核酸 分子的核苷酸序列。
3. 如权利要求 1 所述的方法, 其特征在于, 步骤 a中所述的经打断的、 源自基因组的 DNA双链核酸片段长度为 100-1000 bp或者平均长度为 800-1000 bp;
较佳地, 所述片段长度为 150-500 bp, 较佳地为 200-300 bp。
4. 如权利要求 1所述的方法, 其特征在于, 所述 DNA双链核酸片段具有的平末端是通 过末端修复的方法制备。
5. 如权利要求 1所述的方法, 其特征在于, 步骤 b中所述的接头连接序列为 poly(N)n, 其中各个 N分别独立地选自 、 T、 G或 C, n为选自 1-20的任一正整数; 较佳地, 所述的接头连接序列为 poly(A)n, 其中, n为 1-20的正整数, 较佳地 n=l-2。
6. 如权利要求 1 所述的方法, 其特征在于, 步骤 b 中所述的接头连接互补区序列为 poly(N')m, 其中各个 N'分别独立地选自 A、 T、 G或 C, m为选自 1-20的任一正整数, 并且 poly(N) P poly(N')m为互补序列;
较佳地, m为选自 1-3的任一正整数; 或较佳地, 所述的接头连接互补区的长度与所述 接头连接序列的长度相同, 即 poly(N) P poly(N')m为完全互补序列; 或较佳地, 所述的接头 连接互补区为 poly(T)m, 其中 m为 1-20的正整数, 更佳地 m=l-2。
7. 如权利要求 1所述的方法, 其特征在于, 步骤 b中所述的接头连接序列为 A, 所述的 接头连接互补区序列为 T。
8. 如权利要求 1所述的方法, 其特征在于, 步骤 c中所述的第一引物和第二引物为长度
30-80 nt的寡核苷酸; 更佳地, 第一引物和第二引物长度为 55-65 nt。
9. 如权利要求 1 所述的方法, 其特征在于, 所述的第一引物和第二引物是不同的, 和 / 或所述的第三弓 I物和第四弓 I物是不同的。
10. 如权利要求 1所述的方法, 其特征在于, 步骤 d中所述的封闭分子封闭第一 PCR扩 增产物中对应于第一弓 I物和第二弓 I物的 70%-100%区域;
较佳地,步骤 d中所述的封闭分子封闭第一 PCR扩增产物中对应于第一引物和第二引物 的 100%区域。
11. 如权利要求 1所述的方法,其特征在于,步骤 e中所述的核酸芯片上固定有 5-200,000 种对应于所述疾病的特异性探针;
较佳地,步骤 e中所述核酸芯片上特异性探针的种类为 50-150,000种,更佳地 500-100,000 种, 最佳地 5000-80,000种。
12. 如权利要求 1所述的方法, 其特征在于, 步骤 e中所述的核酸芯片上固定有对应于 疾病致病基因的以下区域的特异性探针: 外显子和 /或外显子前后两端 200 bp;
优选地, 所述特异性探针的长度为 20-120 nt, 较佳地, 50-100 nt, 更佳地, 60-80 nt。
13. 如权利要求 1所述的方法, 其特征在于, 所述方法具有选自下组的一个或多个特征: 所述特异性探针为全人工合成或体外克隆合成;
步骤 f 所述的第三引物和第四引物分别特异性结合于所述的第一引物和第二引物的外 侧, 并且长度小于第一引物和第二引物;
所述的第三引物和第四引物长度为 15-40 nt, 较佳地为 20-25 nt;
所述待检测样本来源于人、 动物、 植物, 或微生物;
所述待检测样本来源于人或非人哺乳动物, 较佳地, 来源于人;
所述待检测样本含有人基因组 DNA; 所述疾病为孟德尔单基因病。
14. 一种可用于权利要求 1所述方法的、 用于测定待检测样本中疾病相关核酸分子的核 苷酸序列的试剂盒, 其特征在于, 所述试剂盒包括:
(1)第一容器以及位于容器内的核酸芯片;
(2)第二容器以及位于容器内的接头;
(3)第三容器以及位于容器内的选自下组的引物: (a)第一引物和 /或第二引物; 或 第三 弓 I物和 /或第四引物;
(4)第四容器以及位于容器内的封闭分子;
(5)可选的检测说明书。
15.如权利要求 14所述的试剂盒, 其特征在于, 所述疾病为孟德尔单基因病; 较佳地, 所述疾病选自下组: 家族性腺瘤样息肉病、软骨发育不良、家族性高胆固醇血症、多指畸形、 马凡综合症、 遗传性舞蹈病、 秃发、 苯丙酮尿症、 胱氨酸尿症、 遗传性高度近视、 抗 D佝偻 病、 遗传性肾炎、 血友病、 地中海贫血、 节性脑硬化综合症、 杜氏肌营养不良、 进行性肌营 养不良、 多囊肾综合症、 性别决定基因突变所致的性反转, 或其组合。
16. 如权利要求 14所述的试剂盒, 其特征在于, 所述试剂盒还包括选自下组的试剂: 用 于进行 PCR扩增所需的试剂、用于进行封闭反应所需的试剂、用于进行杂交反应所需的试剂、 或其组合; 和 /或
所述的核酸芯片上固定有选自下组的一个或多个探针:
探针 1 : 序列如 SEQ ID NO: 7所示, 捕获位置 112073411, 检测家族性腺瘤样息肉; 探针 2: 序列如 SEQ ID NO: 8所示, 捕获位置 51479999, 检测多囊肾综合症; 探针 3: 序列如 SEQ ID NO: 9所示, 捕获位置 135766620, 检测节性脑硬化综合症; 探针 4: 序列如 SEQ ID NO: 10所示, 捕获位置 103231969, 检测苯丙酮尿症; 探针 5: 序列如 SEQ ID NO: 11所示, 捕获位置 48700368, 检测马凡综合症; 探针 6: 序列如 SEQ ID NO: 12所示, 捕获位置 31137199, 检测杜氏肌营养不良。
PCT/CN2012/001381 2011-10-14 2012-10-12 测定待检测样本中疾病相关核酸分子的核苷酸序列的方法 WO2013053207A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110311333.2 2011-10-14
CN201110311333.2A CN102329876B (zh) 2011-10-14 2011-10-14 一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法

Publications (1)

Publication Number Publication Date
WO2013053207A1 true WO2013053207A1 (zh) 2013-04-18

Family

ID=45481837

Family Applications (4)

Application Number Title Priority Date Filing Date
PCT/CN2011/084329 WO2013053180A1 (zh) 2011-10-14 2011-12-21 一种超级芯片及其制备方法和应用
PCT/CN2011/084395 WO2013053183A1 (zh) 2011-10-14 2011-12-21 对核酸样本中预定区域进行基因分型的方法和系统
PCT/CN2011/084380 WO2013053182A1 (zh) 2011-10-14 2011-12-21 检测核酸样本中预定事件的方法和系统以及捕获芯片
PCT/CN2012/001381 WO2013053207A1 (zh) 2011-10-14 2012-10-12 测定待检测样本中疾病相关核酸分子的核苷酸序列的方法

Family Applications Before (3)

Application Number Title Priority Date Filing Date
PCT/CN2011/084329 WO2013053180A1 (zh) 2011-10-14 2011-12-21 一种超级芯片及其制备方法和应用
PCT/CN2011/084395 WO2013053183A1 (zh) 2011-10-14 2011-12-21 对核酸样本中预定区域进行基因分型的方法和系统
PCT/CN2011/084380 WO2013053182A1 (zh) 2011-10-14 2011-12-21 检测核酸样本中预定事件的方法和系统以及捕获芯片

Country Status (5)

Country Link
US (2) US20140249038A1 (zh)
CN (4) CN102329876B (zh)
HK (2) HK1193845A1 (zh)
TW (1) TW201315813A (zh)
WO (4) WO2013053180A1 (zh)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102329876B (zh) * 2011-10-14 2014-04-02 深圳华大基因科技有限公司 一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法
CN104136611B (zh) * 2012-02-27 2018-03-27 东丽株式会社 核酸的检测方法
EP3094742A1 (en) * 2014-01-16 2016-11-23 Illumina, Inc. Amplicon preparation and sequencing on solid supports
EP3208343B1 (en) * 2014-10-13 2022-01-05 MGI Tech Co., Ltd. Nucleic acid fragmentation method and sequence combination
CN105648043A (zh) * 2014-11-13 2016-06-08 天津华大基因科技有限公司 试剂盒及其在检测矮小相关基因中的用途
CN107002080B (zh) * 2014-12-18 2020-11-06 深圳华大智造科技股份有限公司 一种基于多重pcr的目标区域富集方法和试剂
CA2980327A1 (en) * 2015-03-26 2016-09-29 Quest Diagnostics Investments Incorporated Alignment and variant sequencing analysis pipeline
CN104805183A (zh) * 2015-03-31 2015-07-29 江汉大学 一种测试纯系植物新品种的特异性、一致性与稳定性的方法
CN104805192A (zh) * 2015-03-31 2015-07-29 江汉大学 一种测试油菜品种实质性派生关系的方法
CN104805187B (zh) * 2015-03-31 2018-02-13 农业部科技发展中心 一种测试纯系大豆新品种的特异性、一致性与稳定性的方法
CN104805196A (zh) * 2015-04-08 2015-07-29 江汉大学 一种植物亲本来源真实性及其比例测试新方法
CN104805195A (zh) * 2015-04-08 2015-07-29 江汉大学 一种水稻亲本来源真实性及其比例测试新方法
CN104878085A (zh) * 2015-04-08 2015-09-02 江汉大学 一种油菜亲本来源真实性及其比例测试新方法
CN108350498B (zh) * 2016-02-18 2021-10-19 深圳华大生命科学研究院 分型方法和装置
CN105925666A (zh) * 2016-03-30 2016-09-07 广州精科生物技术有限公司 试剂盒、试剂盒的用途及检测目标区域变异的方法及系统
CN105986032A (zh) * 2016-03-30 2016-10-05 广州精科生物技术有限公司 试剂盒、建库方法以及检测目标区域变异的方法及系统
CN105861700B (zh) * 2016-05-17 2019-07-30 上海昂朴生物科技有限公司 一种针对神经肌肉病的高通量检测方法
CN106355045B (zh) * 2016-08-30 2019-03-15 天津诺禾致源生物信息科技有限公司 一种基于扩增子二代测序小片段插入缺失检测的方法及装置
CN106282356B (zh) * 2016-08-30 2019-11-26 天津诺禾医学检验所有限公司 一种基于扩增子二代测序点突变检测的方法及装置
CN106372459B (zh) * 2016-08-30 2019-03-15 天津诺禾致源生物信息科技有限公司 一种基于扩增子二代测序拷贝数变异检测的方法及装置
CN106399535A (zh) * 2016-10-19 2017-02-15 江苏苏博生物医学股份有限公司 一种高通量测序检测无创亲子鉴定的方法
CN106480222B (zh) * 2016-12-20 2019-09-24 广东辉锦创兴生物医学科技有限公司 基于悬浮微珠阵列系统检测遗传性耳聋的探针、引物、检测试剂盒及检测方法
CN108277267B (zh) * 2016-12-29 2019-08-13 安诺优达基因科技(北京)有限公司 检测基因突变的装置和用于对孕妇和胎儿的基因型进行分型的试剂盒
CN106591461A (zh) * 2016-12-29 2017-04-26 天津协和华美医学诊断技术有限公司 一种检测遗传性易栓症相关基因群的检测试剂盒
WO2018137496A1 (zh) * 2017-01-24 2018-08-02 深圳华大基因股份有限公司 确定生物样本中预定来源的游离核酸比例的方法及装置
CN109097457A (zh) * 2017-06-20 2018-12-28 深圳华大智造科技有限公司 确定核酸样本中预定位点突变类型的方法
CN109280701A (zh) * 2017-07-21 2019-01-29 深圳华大基因股份有限公司 用于地中海贫血检测的探针、基因芯片及制备方法和应用
CN107937513B (zh) * 2017-11-30 2018-12-25 东莞市第八人民医院 新生儿50种遗传病基因检测探针组及筛查方法
CN109913539A (zh) * 2017-12-13 2019-06-21 浙江大学 一种靶向捕获hla基因序列并测序的方法
CN108004301B (zh) * 2017-12-15 2022-02-22 格诺思博生物科技南通有限公司 基因目标区域富集方法及建库试剂盒
JP6891150B2 (ja) * 2018-08-31 2021-06-18 シスメックス株式会社 解析方法、情報処理装置、遺伝子解析システム、プログラム、記録媒体
EP3867397A4 (en) * 2018-10-16 2022-07-13 Twinstrand Biosciences, Inc. METHODS AND REAGENTS FOR THE EFFECTIVE GENOTYPING OF LARGE NUMBERS OF SAMPLES BY POOLING
CN109517819A (zh) * 2018-10-24 2019-03-26 深圳市易基因科技有限公司 一种用于检测多靶点基因突变、甲基化修饰和/或羟甲基化修饰的检测探针、方法和试剂盒
CN109576799B (zh) * 2018-11-30 2022-04-26 深圳安吉康尔医学检验实验室 Fh测序文库的构建方法和引物组及试剂盒
WO2020113577A1 (zh) * 2018-12-07 2020-06-11 深圳华大生命科学研究院 一种靶基因文库的构建方法、检测装置及其应用
CN113039283B (zh) * 2018-12-12 2023-12-26 深圳华大生命科学研究院 分离和/或富集宿主源核酸和病原核酸的方法和试剂及其制备方法
CN109554485B (zh) * 2018-12-26 2022-04-19 北京迈基诺基因科技股份有限公司 一种用于无创检测待测胎儿染色体是否为非整倍体的试剂盒及其专用探针组
CN110029158B (zh) * 2019-02-01 2021-03-30 北京大学第三医院 一种马凡综合征检测panel及其应用
CN111961763A (zh) * 2020-09-17 2020-11-20 生捷科技(杭州)有限公司 一种新型冠状病毒检测基因芯片
CN112164423B (zh) * 2020-10-14 2021-03-23 深圳吉因加医学检验实验室 基于RNAseq数据的融合基因检测方法、装置和存储介质
CN114395620B (zh) * 2021-12-20 2022-09-20 温州谱希医学检验实验室有限公司 一种检测高度近视易感人群的生物标志物组合
WO2023172877A2 (en) * 2022-03-07 2023-09-14 Arima Genomics, Inc. Oncogenic structural variants
CN114540474B (zh) * 2022-03-11 2024-04-26 上海交通大学 一种基于暗探针技术的ngs靶向捕获方法及其在差异深度测序中的应用
CN114774515A (zh) * 2022-03-24 2022-07-22 北京安智因生物技术有限公司 一种检测多囊肾疾病基因突变的捕获探针、试剂盒和检测方法
CN115305290A (zh) * 2022-08-30 2022-11-08 西北农林科技大学 一种鸡液相芯片及其应用
WO2024124378A1 (zh) * 2022-12-12 2024-06-20 深圳华大智造科技股份有限公司 对同步测序的碱基判读结果进行校正的方法、同步测序方法及系统、计算机程序产品
CN115948574B (zh) * 2022-12-28 2023-11-10 中国人民解放军空军特色医学中心 一种基于三代测序的个体识别体系、试剂盒及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101012482A (zh) * 2007-02-12 2007-08-08 中国农业大学 一种筛选基因组dna中差异位点及其侧翼序列的方法
CN102329876A (zh) * 2011-10-14 2012-01-25 深圳华大基因科技有限公司 一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7108976B2 (en) * 2002-06-17 2006-09-19 Affymetrix, Inc. Complexity management of genomic DNA by locus specific amplification
US20040110153A1 (en) * 2002-12-10 2004-06-10 Affymetrix, Inc. Compleixity management of genomic DNA by semi-specific amplification
EP1590477B1 (en) * 2003-01-29 2009-07-29 454 Corporation Methods of amplifying and sequencing nucleic acids
EA028642B1 (ru) * 2007-07-23 2017-12-29 Те Чайниз Юниверсити Ов Гонгконг Способ пренатальной диагностики фетальной хромосомной анэуплоидии
EP2053132A1 (en) * 2007-10-23 2009-04-29 Roche Diagnostics GmbH Enrichment and sequence analysis of geomic regions
CN101921841B (zh) * 2010-06-30 2014-03-12 深圳华大基因科技有限公司 基于Illumina GA测序技术的HLA基因高分辨率分型方法
CN101921874B (zh) * 2010-06-30 2013-09-11 深圳华大基因科技有限公司 基于Solexa测序法的检测人类乳头瘤病毒的方法
CN102127819B (zh) * 2010-11-22 2014-08-27 深圳华大基因科技有限公司 Mhc区域核酸文库的构建方法及用途

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101012482A (zh) * 2007-02-12 2007-08-08 中国农业大学 一种筛选基因组dna中差异位点及其侧翼序列的方法
CN102329876A (zh) * 2011-10-14 2012-01-25 深圳华大基因科技有限公司 一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JAMIE K. TEER ET AL.: "Systematic comparison of three genomic enrichment methods for massively parallel DNA sequencing", GENOME RESEARCH, vol. 20, no. 10, October 2010 (2010-10-01), pages 1420 - 1431, XP055074121, DOI: doi:10.1101/gr.106716.110 *

Also Published As

Publication number Publication date
CN103874767A (zh) 2014-06-18
CN103890189B (zh) 2017-07-07
HK1193845A1 (zh) 2014-10-03
WO2013053180A1 (zh) 2013-04-18
CN102329876A (zh) 2012-01-25
WO2013053183A1 (zh) 2013-04-18
US20180371539A1 (en) 2018-12-27
CN102329876B (zh) 2014-04-02
CN105392893A (zh) 2016-03-09
CN103874767B (zh) 2016-08-17
US20140249038A1 (en) 2014-09-04
WO2013053182A1 (zh) 2013-04-18
CN103890189A (zh) 2014-06-25
TW201315813A (zh) 2013-04-16
HK1215812A1 (zh) 2016-09-15

Similar Documents

Publication Publication Date Title
WO2013053207A1 (zh) 测定待检测样本中疾病相关核酸分子的核苷酸序列的方法
KR102354422B1 (ko) 대량 평행 서열분석을 위한 dna 라이브러리의 생성 방법 및 이를 위한 키트
US9574234B2 (en) Solid-phase clonal amplification and related methods
US20190024141A1 (en) Direct Capture, Amplification and Sequencing of Target DNA Using Immobilized Primers
JP6830094B2 (ja) 染色体異常を検出するための核酸及び方法
Blumenstiel et al. Targeted exon sequencing by in‐solution hybrid selection
US20070141604A1 (en) Method of target enrichment
US20080274904A1 (en) Method of target enrichment
TWI467020B (zh) 檢測dmd基因外顯子缺失和/或重複的方法
JP2001525181A (ja) 複合dnaメチル化フィンガープリントの調製方法
FR2755149A1 (fr) Procede de diagnostic de maladies genetiques par peignage moleculaire et coffret de diagnostic
KR20180098412A (ko) 종양의 심층 서열분석 프로파일링
WO2017193044A1 (en) Noninvasive prenatal diagnostic
WO2020219759A1 (en) Methods and compositions for enrichment of target nucleic acids
JPH11506937A (ja) Dnaの配列決定およびポジショナルクローニングを含む、dnaの遺伝子的修飾を特定する方法
JP5197661B2 (ja) 核酸検出用プローブ担体
US20100144545A1 (en) Arrays, Systems, and Methods of Using Genetic Predictors of Polycystic Diseases
EP3696279A1 (en) Methods for noninvasive prenatal testing of fetal abnormalities
WO2021030716A1 (en) Probe-capture method for tcr alpha and beta chain vdj-recovery from oligo-dt reverse transcribed rna
JP2009125018A (ja) ハプロタイプの検出法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12840253

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12840253

Country of ref document: EP

Kind code of ref document: A1