WO2013059967A1 - 一种检测染色体微缺失和微重复的方法 - Google Patents

一种检测染色体微缺失和微重复的方法 Download PDF

Info

Publication number
WO2013059967A1
WO2013059967A1 PCT/CN2011/001805 CN2011001805W WO2013059967A1 WO 2013059967 A1 WO2013059967 A1 WO 2013059967A1 CN 2011001805 W CN2011001805 W CN 2011001805W WO 2013059967 A1 WO2013059967 A1 WO 2013059967A1
Authority
WO
WIPO (PCT)
Prior art keywords
sample
site
sequencing
sites
chromosome
Prior art date
Application number
PCT/CN2011/001805
Other languages
English (en)
French (fr)
Inventor
陈芳
潘小瑜
陈盛培
李旭超
蒋慧
张秀清
Original Assignee
深圳华大基因科技有限公司
深圳华大基因研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳华大基因科技有限公司, 深圳华大基因研究院 filed Critical 深圳华大基因科技有限公司
Priority to CN201180075188.0A priority Critical patent/CN104136628A/zh
Priority to US14/354,109 priority patent/US20140274745A1/en
Priority to PCT/CN2011/001805 priority patent/WO2013059967A1/zh
Priority to TW101139077A priority patent/TW201317362A/zh
Publication of WO2013059967A1 publication Critical patent/WO2013059967A1/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Definitions

  • the invention relates to the field of genomic mutation detection, in particular to the detection of copy number variation (CNV) of a cell chromosome DNA fragment.
  • CNV copy number variation
  • the invention also relates to disease detection associated with copy number variation of a chromosomal DNA fragment of a cell.
  • Chromosomal microdeletion/microreplication refers to deletions or duplications on the chromosome that range from 1.5 kb to 10 Mb in length.
  • Human microdeletion/microduplication syndromes are a type of complex phenotypic disease caused by small fragment deletions or duplications on human chromosomes (ie, DNA fragment copy number variation), which occur in perinatal and neonatal Higher rates can lead to serious diseases and abnormalities such as congenital heart disease or cardiac malformations, severe growth retardation, appearance or limb deformities.
  • microdeletion syndrome is one of the main causes of mental retardation in addition to Down syndrome and X chromosome vulnerability syndrome. [Knight SJL (ed): Genetics of Mental Retardation.
  • the syndrome is a type of clinical syndrome caused by loss of heterozygosity in human chromosome 22ql 1.21 - 22ql 1.23, including DiGeorge syndrome, palpebral syndrome, and abnormal surface of vertebrae.
  • microdeletion syndrome Because some types of microdeletion syndrome cannot be cured, and died within a few months or years after birth, it brings a heavy mental and economic burden to society and families. According to incomplete statistics, the full 'happy puppet syndrome' (ie Angelman) Syndrome) The patient has reached 15,000. The number of other types of chromosome microdeletion syndrome patients is also increasing year by year. Therefore, pre-pregnancy chromosomal microdeletion/microrepetition detection of clinically suspected patients and parents with associated adverse maternal history is beneficial to provide genetic counseling and provide clinical decision-making basis; early prenatal diagnosis during pregnancy can effectively prevent the birth of the child or Provide a basis for providing post-natal treatment for children [ Bretdle F, et aL. Prenatal and postnatal diagnosis of 22ql l .2 deletion syndrome. Eur J Med Genet. 2010 Nov-Dec; 53(6): 367 -370].
  • microdeletion/microrepetition syndrome include high-resolution karyotype analysis, FISH (fluorescence in situ hybridization), and Array CGH (comparative genomic hybridization). , MLPA (Multiple Linker Probe Amplification Technology), and PCR methods, etc., using these methods, can detect microdeletions/microrepetitions of chromosomes.
  • High-resolution karyotype analysis is a high-resolution banding technique that emerged after the 1980s. It uses a cell homogenization method to obtain a large number of high-quality mitotic late or early metaphase karyotypes, making a single set of chromosomes. The number of bands has increased to more than a hundred, thereby improving the ability to recognize changes in the fine structure of chromosomes, but the resolution is only about 3-5M. Although the resolution of this method is higher than that of conventional karyotyping, it is not sufficient to detect microdeletion/microrepetition mutations at smaller chromosome levels [Jorge J. Yunis, Jeffrey R. Sawyer and David W. Ball. The characterization of High-resolution G-banded chromosomes of man. Chromosoma. 67(4), 293-307].
  • FISH Fluorescence In situ Hybridization
  • This method is the gold standard for microdeletion/microrepetition detection, which can effectively detect most chromosomal deletions.
  • the basic principle is: If the target DNA on the detected chromosome or DNA fiber slice is homologously complementary to the nucleic acid probe used, and the two are denatured-annealed-refolded, the target DNA and the nucleic acid probe can be formed. Hybrid.
  • the fluorescence detection system is in the mirror Qualitative, quantitative or relative localization analysis of the DNA to be tested.
  • the advantages are: short experimental period, quick results, good specificity and accurate positioning.
  • the resolution of metaphase chromosome FISH can reach 1 ⁇ 2M, and the resolution of interphase chromosome FISH can reach 50K.
  • this technique needs to design probes to verify the known deletion sites, which is not suitable for discovering new chromosome levels. Micro-deletion or repeated anomalies, and expensive, requiring high technical skill for the operator [Fluorescence in situ hybridization. Nature Methods, 2237 - 2238, 2005
  • Array CGH microarray-comparative genomic hybridization
  • Array CGH is a technology that has been applied to clinical cytogenetics in recent years. It uses a specific DNA fragment as a target probe to be immobilized on a carrier to form a microarray, which is labeled with fluorescein. DNA and reference DNA are hybridized to the microarray to detect DNA copy number variation.
  • the resolution of Array CGH depends on the type and size of the probe being designed and its distance on the genome. Theoretically, DNA sequences of 5 to 10 kb or less can be detected, but the method is expensive and generally does not cover the whole genome. All the sites.
  • the current diagnosis for chromosome microdeletion syndrome has been found in the literature [ACOG Committee Opinion No. 446: array comparative genomic hybridization in prenatal diagnosis. Obstetrics and Gynecology, 2009].
  • MLPA Multiple Linked Probe Amplification Technology
  • PCR methods are commonly used for the detection of Y chromosome microdeletions. For example, deletions of AZF genes (AZFa, AZFb, AZFc) related to male reproduction on the Y chromosome are detected by PCli.
  • the PCR method can also be used for the verification of known chromosome microdeletion sites. The method is simple and easy, and the disadvantage is that it can only be detected for known sites, and can only be detected for one site at a time. The exact detection method needs to combine the PCR reactions of multiple sites to achieve the detection purpose [Cong-yi YU, et al. Multiplex PCR Screening of Y Chromosome Microdeletions in Azoospermic Patients. JOURNAL OF REPRODUCTION AND CONTRACEPTION. 2004, 15(4) ⁇ .
  • the present invention designs a method for detecting chromosomal microdeletions/microrepetitions based on high-throughput sequencing technology for detecting DNA copy number variation.
  • the method overcomes the shortcomings of the prior art commonly used methods, such as low resolution, inability to cover the whole genome, low throughput and high cost, and detection of chromosomal microdeletions/microrepetitions at the genome-wide level, both for diseases
  • the known sites are searched and verified, and the unknown sites can be explored and discovered, with high throughput, high specificity, and accurate positioning.
  • Detection of chromosomal microdeletion/microrepetition syndrome can be achieved by detecting chromosomal microdeletions/microrepetitions.
  • the invention relates to a method for detecting copy number variation (CNV) of a cell chromosomal DNA fragment, which comprises the following steps: a) randomly interrupting the genomic DNA molecules obtained from the test subject and the normal subject to obtain a DNA fragment, and sequencing the DNA fragment to obtain a sequencing read;
  • the number of reads that are the sum of the sum and the falling in the window ( ⁇ , ) to the reference sequence are respectively; ⁇ and ⁇ , ⁇ ), by normalizing the test statistic / The two-sided significance test, get ( ⁇ , 3 ⁇ 4)
  • the data set to be tested is sorted by saliency (P value) from small to large to obtain their rank (r); from top to bottom, the test is performed until the last site A that satisfies A ⁇ « stops, where ⁇ is the first P value of k positions, ⁇ is the rank of the kth position, N is the total number of sites, "is a significant level, such as 0.01;
  • step C For each of the set of selection points in step C, ⁇ .., ⁇ , there are windows on both sides: (b k ⁇ , , b k -V ⁇ and (b k , b k J, remove the difference between the two windows with a small difference in the copy number variation ratio, that is, delete/maximize the position and update the merge interval (b ⁇ bk+o value, by repeating the above steps until all the positions are satisfied) ,, 3 ⁇ 4 +1 )
  • ⁇ ⁇ can be set, for example, setting the number of remaining sites to 1/2, 1/10 of the number of original candidate sites,
  • a normal sample may also be by way of selecting / m as a test sample, the above steps a) to d), so the combined number of candidate sites becomes the initial site The number of 1/2, 1/10, 1/100 or 1/1000, of which the largest; was chosen to be 7 m ⁇ .
  • the present invention also relates to a method for analyzing a disease which produces a complex clinical phenotypic effect due to copy number variation (CNV) of a cell chromosomal DNA fragment, the method comprising, in addition to the above steps a) - d), Also includes:
  • step d performing CNV analysis based on the breakpoint obtained in step d, selecting a site where the CNV ratio of the sample to be normal is less than or equal to the microdeletion detection threshold as a microdeletion site; CNV of the sample to be tested for the normal sample The site whose ratio is greater than or equal to the micro-repetition detection threshold is selected as a micro-repeat site.
  • micro-deletion detection threshold and the micro-repetition detection threshold may be selected empirically by those skilled in the art, for example, the micro-deletion detection threshold is 0.75, and the micro-repetition detection threshold is 1.25;
  • FIG. 1 A specific technical flow of an embodiment of the present invention is shown in FIG. 1
  • the advantages of the present invention are mainly as follows:
  • the present invention can perform chromosome CNV on the whole genome range. Analysis, without relying on known probes and design probes, can reveal new chromosomal abnormalities.
  • High-throughput Based on high-throughput sequencing technology, the present invention enables high-throughput chromosomal CNV analysis, and by adding different label sequences to each sample, a large number of samples can be analyzed at one time.
  • Figure 1 A simplified flow chart of the invention for chromosome CNV analysis.
  • a read refers to a sequence fragment obtained by sequencing.
  • a breakpoint refers to a boundary point at which copy number variation occurs on a chromosome.
  • genomic DNA obtained from a subject can be obtained from blood, tissue or cells of a subject.
  • the blood may be derived from the peripheral blood of the parent or the cord blood of the fetus; the tissue may be a placental tissue or a chorion tissue; the cells may be uncultured or cultured amniocytes, villous cells.
  • the subject to be tested is the same species as the normal subject.
  • the genomic DNA may be obtained by a conventional DNA extraction method such as a salting out method, a column chromatography method, a magnetic bead method or an SDS method, and preferably a magnetic bead method.
  • the so-called magnetic bead method refers to the blood, tissue or cell through the action of cell lysate and proteinase K to obtain naked DNA molecules, using a specific magnetic beads for reversible affinity adsorption of DNA molecules, washed by a rinse solution After removing impurities such as proteins and lipids, the DNA molecules are eluted from the magnetic beads with a purification solution.
  • the magnetic bead method can be carried out according to the scheme provided by the manufacturer.
  • the random disruption treatment of DNA molecules may employ enzymatic, nebulized, ultrasonic, or HydroShear methods.
  • the ultrasonic method is employed.
  • Covaris' S-series is based on the AFA technique, and when the acoustic energy/mechanical energy released by the sensor passes through the DNA sample, the dissolved gas forms bubbles. When energy is removed, the bubbles rupture and produce the ability to break DNA molecules.
  • energy intensity and time interval examples of interrupting parameters are as follows: Duty cycle 20%, Intensity 10, cycles/Burst 1000, Time 60s, Mode: power tracking
  • the DNA molecules can be interrupted to a certain range. Size (for example, 200bp - 800bp). Specific principles and methods please refer to See the instructions provided by the manufacturer to break the DNA molecules into a relatively large number of fragments of a certain size.
  • the DNA molecule is disrupted to a size of about 500 bp.
  • the sequencing method employed can be high-throughput sequencing methods such as mumina/Sole X a, ABI/SOLiD, and Roche/454 sequencing types, which can be single-end sequencing and Pair-end sequencing.
  • the sequencing length can be 50 bp, 90 bp, or 100 bp.
  • the sequencing platform is Illumina/Solexa
  • the sequencing type is Pair-end sequencing, resulting in a 100 bp size DNA sequence molecule having a bidirectional positional relationship.
  • the sequencing depth may be ⁇ 30 X, that is, the total data amount is 1-30 times the length of the human genome, for example, in one embodiment of the present invention, the sequencing depth is 2 X, that is, 2 times (6 x 10 9 bp) ).
  • the specific sequencing depth can be determined according to the size of the detected chromosomal variation fragment. The higher the sequencing depth, the smaller the detection loss and repeated fragments.
  • each sample can be labeled with a different tag sequence for sample differentiation during sequencing [Micah Hamady, Jeffrey J Walker, J Kirk Harris et Al. Error-correcting barcoded primers for pyrosequencing hundreds of samples in multiplex. Nature Methods, 2008, 5(3)], thereby enabling simultaneous sequencing of multiple samples.
  • the genomic reference sequence can be from a public database.
  • the human genome sequence can be a human genome reference sequence in the NCBI database.
  • the human genome sequence is the human genome reference sequence of version 36 (hgl 8; NCBI Build 36) in the NCBI database.
  • Sequence alignments can be performed by any sequence alignment program, such as the Short Oligonucleotide Analysis Package (SOAP) and BWA Aligner (Burrows-Wheel Aligner) available to those skilled in the art, which will read The segment is aligned with the reference genome sequence to obtain the position of the read on the reference genome. Sequence alignment can be performed using default parameters provided by the program, or can be selected by those skilled in the art as needed. In one embodiment of the present invention, the ratio employed of software SOAPalign er / soap2.
  • SOAP Short Oligonucleotide Analysis Package
  • BWA Aligner Bitrows-Wheel Aligner
  • the read sequence is compared to the chromosomal sequence data is a software such as SOAP;
  • the software algorithm of the copy number variation (CNV) is a Matlab script developed by the Broad Institute (: group ), known as the Segseq software algorithm. See Figure 2. It can calculate the breakpoint and the copy-normal copy ratio of the copy by the data generated by the next-generation sequencing technology, and compare the cancerous sample with the normal sample, and estimate the corresponding P.
  • Statistics such as _value can detect CNV fragments of around 50K at low sequencing depth (10M PE: 32, 36 reads).
  • finding the breakpoint of the CNV analysis of the sample to be tested refers to using the modified Segseq software algorithm to use the normal sample as a negative control, and searching for the copy number variation ratio of the sample to be tested and the normal sample on the reference genome sequence.
  • the search for the breakpoint includes two steps: (1) initialization, the purpose is to select candidate points; (2) repeatedly merging adjacent segments to reduce the false positive rate.
  • the specific principle and mathematical model are: Under the premise that the read segment is a random fragment from genomic DNA, the number of reads falling into a region after the alignment should obey the Poisson distribution.
  • the AA shell number variation ratio is defined as ⁇ ⁇ ' ⁇ . Under the condition of large sampling, (; ⁇ , ) is close to the logarithm
  • 3 ⁇ 4 repeat the above steps until all >(
  • W may be any integer greater than 1, such as 5 - 5000, preferably 10 - 2000, more preferably
  • the repeated merging of adjacent segments means that the adjacent segments with smaller difference in copy number variation ratio are combined by the maximum likelihood processing, thereby reducing the false positive rate.
  • the candidate point set obtained in step (1) is B c , BH , b N , then the left and right sides of the candidate point * are respectively (b w , -1) and the copy between the two windows is removed. A site with a small difference in the number of variation ratios.
  • the CNV analysis after finding the candidate point refers to the CNV ratio of the test sample to the normal sample of 0.75 and 1.25 as the detection threshold of the chromosome copy number variation according to the empirical value of the population data analysis in the field, and the CNV ratio is 0.75. It is a chromosome deletion, and the CNV ratio of 1.25 is a chromosome repeat.
  • the chromosomal digital karyotype map was drawn based on the microdeletion/microrepetition results obtained by the analysis. Chromosome digital karyotype is a technique for quantifying DNA copy number variation on a genome, and lists the short sequences of DNA at specific sites on the whole genome.
  • mapping a karyotype usually involves arranging the chromosomes in one cell from the largest (Chromosome 1) to the smallest (Chromat 22), showing the sex chromosomes (X and/or Y). At the end.
  • This is a representation commonly used in the art and is within the abilities of one of ordinary skill in the art. For example, refer to the article [Tian-Li Wang et al. Digital karyotyping. PNAS, 2002, vol. 99, no. 25, 16156 ⁇ 16161.], [Henry Wood et al. Using next-generation sequencing for high resolution multiplex analysis of Copy number variation from nanogram quantities of DNA from formalin-fixed paraffin-embedded specimens. Nucleic Acids Research, 2010, 38(14), doi: 10.1093/nar/gkq510.] or in accordance with an embodiment of the present invention.
  • / 7 ⁇ can be set, for example, when the candidate site is 10, 100, 1000 or 10000, the minimum setting is ⁇ ⁇ ; or the normal sample can be selected as / to be tested Sample, perform the calculation of the present invention /? (
  • it may be set, for example, such that the number of remaining sites is the number of original candidate sites.
  • ) at 1/2, 1/10, 1/100 or 1/1000 is p merge ; you can also choose p merge by : using a normal sample as the sample to be tested, Performing steps a) through d) of the method of the invention such that the number of post-merger candidate sites becomes 1/2, 1/10, 1/100 or 1/1000 of the original number of sites, with the largest /?(
  • a default control sample eg, paracancerous
  • the calculation method of the normal distribution significance test P value can use a method known in the art, The calculations can be performed by a number of existing software algorithms, which are available to those of ordinary skill in the art.
  • the existing CNV and disease database refers to a database having copy number variation and disease-related information.
  • the database value used is DECIPHER (https://decipher.sanger.ac.uk/svndromes), and the 58 microdeletion/microrepetition syndromes listed in the database are missing repeats. A clear relationship with the disease.
  • a specific method for performing chromosomal CNV analysis of villus tissue includes the following steps:
  • DNA extraction and sequencing After extracting the villus tissue DNA according to the magnetic bead genomic DNA extraction kit (for example, Tiangen DP329) operation manual, the library is constructed according to the niumina/Solexa standard library construction process. In this process, the villus tissue DNA is randomly interrupted by ultrasonication into DNA molecules concentrated at about 500 bp, and the ends are coupled with the linkers used for sequencing. Each sample is labeled with a different tag sequence, thereby obtaining a single sequencing sequence. The data in the data can distinguish the data of multiple samples.
  • the magnetic bead genomic DNA extraction kit for example, Tiangen DP329
  • the library is constructed according to the niumina/Solexa standard library construction process. In this process, the villus tissue DNA is randomly interrupted by ultrasonication into DNA molecules concentrated at about 500 bp, and the ends are coupled with the linkers used for sequencing. Each sample is labeled with a different tag sequence, thereby obtaining a single sequencing sequence. The data in the data can
  • the micro-deletion/micro-repetition results are analyzed, and the chromosome karyotype map is drawn and the gene annotation is performed.
  • the method of the present invention is applicable to chromosomal CNV analysis of animals and humans, particularly mammals, and more particularly humans.
  • the invention can be used to perform chromosomal CNV analysis on a population of people who can be used for non-diagnostic purposes, for example as a tool for studying the genome.
  • the invention can also be used for chromosome CNV analysis of the applicable population, which is beneficial for providing genetic counseling and providing clinical decision-making basis; pre-implantation diagnosis or prenatal diagnosis can effectively prevent the birth of the child.
  • the applicable population of the present invention may be a population with no abnormalities in routine karyotype analysis but having the following clinical manifestations -
  • sample 1 3 cases of high risk due to prenatal screening, pregnant women themselves as carriers of balanced translocation and previous cases of abnormal fetal Fetal tissue samples from membrane puncture (hereinafter referred to as sample 1, sample 2 and sample 3, 2 cases of villi and 1 case of placenta)
  • sample 2 3 cases of high risk due to prenatal screening, pregnant women themselves as carriers of balanced translocation and previous cases of abnormal fetal Fetal tissue samples from membrane puncture (hereinafter referred to as sample 1, sample 2 and sample 3, 2 cases of villi and 1 case of placenta)
  • the DNA of the sample was quantified using Qubit (Invitrogen, the Quant-iT* 1 dsDNA HS Assay Kit), and the total amount of DNA extracted was about 500 ng.
  • the extracted tissue DNA is complete genomic DNA and is constructed according to the Illumina/Solexa standard database construction process.
  • the linker used for sequencing is added to both ends of the DNA molecule focused on 500 bp, each sample is labeled with a different tag sequence, and then hybridized with a complementary junction on the surface of the flowcell.
  • the nucleic acid molecules were clustered under certain conditions, and then subjected to double-end sequencing on m U mina m Se q 2000 to obtain a paired DNA fragment sequence having a positional relationship of 100 bp in length.
  • DNA samples obtained from the above three tissues were operated in accordance with the Illumina/Solexa officially published Cluster Station and Hiseq 2000 (PE sequencing) instructions.
  • each sample was separated according to the tag sequence and a DNA sequence of a fragment of a size of about 500 bp, i.e., a read, was obtained.
  • a DNA sequence of a fragment of a size of about 500 bp i.e., a read
  • the sequenced reads were compared with the human genome reference sequence of version 36 (hgl 8; NCBI Build 36) in the NCBI database, and the measured DNA sequence was mapped to the corresponding position of the genome. Information. Only unique reads that are uniquely aligned with the human genome reference sequence are selected as valid data for subsequent CNV analysis, and the number ⁇ is counted.
  • sample 4 Three cases of fluff tissue (hereinafter referred to as sample 4, sample 5 and sample 6) were obtained after the same treatment method and sequencing process as in the first embodiment, and the results were compared with the results of the ⁇ resolution karyotype analysis.
  • the number of valid reads for Sample 4, Sample 5, and Sample 6 above was calculated to be 44,719,212, 4,048,450 and 45,374,254, respectively.
  • the flow of the remaining data analysis and the related parameter settings are the same as in the first embodiment.
  • the micro-deletion/micro-repetition results are analyzed, and the chromosome digital karyotype map is drawn and the gene annotation is performed.
  • the region is consistent with the existing arrayCGH (The Fetal DNA Chip, http://www.fetalmedicine.hk/en/Fetal DNA Chip.asp), and the specific digital karyograph is shown in Figure 4A-C.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于基因组突变检测领域,公开了染色体DNA片段拷贝数变异(Copy number variation,CNV)的检测。本发明还公开了与染色体DNA片段拷贝数变异有关的疾病检测。

Description

一种检测染色体微缺失和微重复的方法
技术领域
本发明涉及基因组突变检测领域, 特别涉及细胞染色体 DNA片段拷贝数变异 (Copy number variation, CNV ) 的检测。 本发明还涉及与细胞染色体 DNA片段拷贝数变异有关 疾病检测。
背景技术
染色体微缺失 /微重复是指染色体上出现长度为 1.5kb-10Mb的缺失或重复。 人类染色 体微缺失 /微重复综合征 (microdeletion/microduplication syndromes)是一类因人类染色体上 出现微小片段缺失或重复 (即 DNA片段拷贝数变异) 引起复杂表型疾病, 在围产儿和新 生儿中发病率较高, 可导致严重的疾病和异常, 如先天性心脏病或心脏畸形、 严重的生长 发育迟缓、 外貌或肢体畸形等。 另外, 微缺失综合征也是除唐氏综合征与 X染色体易损综 合征外引起智力发育迟缓的主要原因之一。【Knight SJL (ed): Genetics of Mental Retardation. Monogr Hum Genet. Basel, Karger, 2010, vol 18, 101-113 ]0 近年在来, 在国内外的主要出生 缺陷发病率统计中,排在前列的是与染色体微缺失 /微重复有关的先天性心脏病、智力低下、 脑瘫和先天性耳聋。常见的微缺失综合征包括 22ql l微缺失综合征、猫叫综合征、 Angelman 综合征、 AZF缺失等。
以 22ql l微缺失综合征为例, 该综合征是由人类染色体 22ql 1.21 - 22ql 1.23区域杂合 性缺失引起的一类临床症候群, 包括 DiGeorge综合征、腭心面综合征、椎干异常面容综合 征、 Cayler心面综合征和 Opitz综合征等数个具有相同遗传学基础的临床综合征, 该病最 常见的临床表现包括心脏畸形、 异常面容、 胸腺发育不良、 腭裂和低钙血症; 此外该综合 征患者还可以出现体格和智力发育迟缓、 学习和认知困难、 精神异常等表现, 是人类最常 见的微缺失综合征, 其发生率为 1 : 4000 (活产婴儿), 男女发病率无明显差异。 [ Drew LJ, et al. The 22ql 1.2 microdeletion: Fifteen years of insights into the genetic and neural complexity of psychiatric disorders. Int J Dev Neurosci. 2010 Oct 8.】。
尽管每种微缺失综合征发病率都很低 (https://decipher.saneer.ac.uk/svndromes ) , 其中 较常见的 22ql l微缺失综合征、 猫叫综合征、 Angelman综合征、 MiUer-Dieker综合征等发 生率分别为 1 : 4000 (活产婴儿) 、 1 : 50000、 1 : 10000、 1 : 12000, 但由于临床检测技术的 限制, 大量的微缺失综合征患者在产前筛査和产前诊断中无法检出, 甚至在婴儿出生数月 甚至数年后出现典型的临床表征后, 回溯性的寻找原因时, 也因检测技术的限制无法对病 因进行确诊。 由于部分类型的微缺失综合征无法根治, 在出生后数月或数年内去世, 给社 会和家庭带来沉重的精神和经济负担。据不完全统计,全 '快乐木偶综合征" (即 Angelman 综合征) 患者己达 1.5万名。 其他类型的染色体微缺失综合征患者数量也呈逐年增加的趋 势。因此,孕前对临床疑似患者和有相关不良孕产史的父母进行染色体微缺失 /微重复检测, 有利于提供遗传咨询和提供临床决策依据; 在孕期进行早期产前诊断可有效防止患儿出生 或为针对性的为患儿提供出生后的治疗方法提供依据 [ Bretdle F, et aL.Prenatal and postnatal diagnosis of 22ql l .2 deletion syndrome. Eur J Med Genet. 2010 Nov-Dec; 53(6): 367-370】 。
然而, 这类疾病由于染色体水平微小变异而无法用常规的临床方法如染色体核型分析 方法等(分辨率为 10M以上)检出【]^1&1(;01111 S. Microdeletion and microduplication syndromes. Prenat Diagn. 1996 Dec; 16(13): 1213 - 9】 。 目前针对微缺失 /微重复综合征的诊断方法主要 有高分辨率染色体核型分析、 FISH (荧光原位杂交) 、 Array CGH (比较基因组杂交) 、 MLPA (多重连接探针扩增技术)和 PCR的方法等, 利用这些方法, 可以检测染色体的微 缺失 /微重复。
高分辨率染色体核型分析是 20世纪 80年代后出现的高分辨显带技术, 其采用细胞同 歩化的方法, 获得大量优质的有丝分裂晚前期或早中期的显带核型, 使单套染色体的条带 数量增至数百条以上,从而提高识别染色体细微结构改变的能力,但其分辨率只有约 3-5M。 尽管该方法的分辨率较常规染色体核型分析高, 但不足以检测更小的染色体水平上的微缺 失 /微重复变异【 Jorge J. Yunis, Jeffrey R. Sawyer and David W. Ball. The characterization of high-resolution G-banded chromosomes of man. Chromosoma. 67(4), 293 - 307】。
FISH (荧光原位杂交)是在 20世纪 80年代末发展起来的一种非放射性分子细胞遗传 技术, 该方法是微缺失 /微重复检测的黄金标准, 该方法可以有效地检测出大部分染色体缺 失。其基本原理是: 如果被检测的染色体或 DNA纤维切片上的靶 DNA与所用的核酸探针 是同源互补的, 二者经变性-退火-复性, 即可形成靶 DNA与核酸探针的杂交体。将核酸探 针的某一种核苷酸标记上报告分子如生物素、 地高辛, 可利用该报告分子与荧光素标记的 特异亲和素之间的免疫化学反应, 经荧光检测体系在镜下对待测 DNA进行定性、 定量或 相对定位分析。 其优点是: 实验周期短、 能迅速得到结果、 特异性好、 定位准确。 中期染 色体 FISH的分辨率可达 1~2M, 间期染色体 FISH分辨率可达 50K, 但该技术需在已知缺 失位点的情况下,设计探针进行验证,不宜用于发现新的染色体水平的微缺失或重复异常, 且价格昂贵, 对操作人员的技术熟练程度要求高 [Fluorescence in situ hybridization. Nature Methods, 2237 - 2238, 2005
Array CGH (微阵列 -比较基因组杂交)是近年被应用到临床细胞遗传学领域的一项技 术, 其将特异 DNA片段作为靶探针固化在载体上形成微阵列, 通过将荧光素标记的待测 DNA和参考 DNA与微阵列杂交从而检测 DNA拷贝数变异。 Array CGH的分辨率取决于 所设计的探针的类型、 大小及其在基因组上的距离, 理论上可检测 5至 10kb甚至更小的 DNA序列,但该方法价格昂贵且一般并不覆盖全基因组的所有位点。 目前用于染色体微缺 失综合征的诊断已多见于文献【ACOG Committee Opinion No. 446: array comparative genomic hybridization in prenatal diagnosis. Obstetrics and Gynecology, 2009】。
MLPA (多重连接探针扩增技术)是近几年发展起来的一种针对待检 DNA序列进行定 性和半定量分析的新技术。 MLPA 技术目前在临床实验室己应用于 Y 染色体微缺失、 22ql l .2染色体微缺失等的检测,优点是高效、特异、快速、简便,缺点是样品容易被污染, 不适合检测未知的点突变类型、 不能检测染色体的平衡易位【王科等, MLPA技术检测 22ql l .2染色体微缺失. 《第七届全国唇腭裂学术会议论文集》,2009】。
PCR方法常用于 Y染色体微缺失方面的检测, 如 Y染色体上与男性生殖相关的 AZF 基因 (AZFa、 AZFb、 AZFc)等的缺失则多用 PCli的方法检测。 对于己知的染色体微缺失 位点的验证也可以用 PCR方法。该方法简便易行, 缺点是只能针对已知位点进行检测, 且 一次仅能针对一个位点进行检测。确切的检测方法需结合多个位点的 PCR反应方能达到检 测目的【Cong-yi YU, et al. Multiplex PCR Screening of Y Chromosome Microdeletions in Azoospermic Patients. JOURNAL OF REPRODUCTION AND CONTRACEPTION. 2004, 15(4)】 。
结合上述内容可知, 目前对于染色体微缺失 /微重复的检测方法存在的限制因素主要有 分辨率低、 不能覆盖全基因组、 低通量和高成本。 急需开发一种克服这些限制因素的检测 染色体微缺失 /微重复的新方法。
发明内容
随着髙通量测序技术的不断发展与测序成本的不断降低, 通过高通量测序进行染色体 异常的检测分析得到了越来越广泛的应用。为了解决目前检测染色体微缺失 /微重复方法的 缺陷如分辨率不高等, 本发明设计了一种基于高通量测序技术的检测 DNA拷贝数变异进 而对染色体微缺失 /微重复进行检测的方法。该方法克服了现有技术常用的几种方法的分辨 率低、 不能覆盖全基因组、 低通量和高成本的缺点, 在全基因组水平上进行染色体微缺失 /微重复的检测,既能对疾病的已知位点进行査找和验证,也能对未知位点进行探索和发现, 通量高、 特异性高、 定位准确。 通过对染色体微缺失 /微重复进行检测, 可以实现对染色体 微缺失 /微重复综合征的检测。
本发明涉及一种检测细胞染色体 DNA片段拷贝数变异(Copy number variation, CNV ) 的方法, 其包括以下步骤: a) 将获自待测受试者和正常受试者基因组 DNA分子随机打断, 得到 DNA片段, 并 对所述 DNA片段进行测序, 获得测序的读段;
b)将步骤 a中测定的 DNA序列与所述受试者的物种的基因组参考序列进行比对, 将 所测 DNA序列定位于参考序列上, 只选用在参考序列上有唯一位置的读段进行分析; c)寻找参考序列上符合以下条件的位点:待测受试者样品的比对结果与正常受试者样 品的比对结果相比, 在两侧拷贝数变异比率有差异的位点, 步骤如下:
i) 对于参考序列上每一个位点 b, 强制使其左右两侧的局部窗口包含 w条正常读段, 即满足 N(^,b) = N(b, ) = w, 其中 NO^x 为正常样品落在窗口 (^, )中的比对条数; ii) 在这些位置中, 筛选符合^ ^^/^^,^ 的位点, 剔出符合 A(xt,jcfl) = 0, b-w<i<b + w 的 位 点 , 其 中 1)(;^, ) = 10§( (^,(:))-10§(?((:,^)) ,
R(x,,xR)= Χι',Χκ)Ι '' , 其中正常样品读段和待测样品读段唯一比对到参考序列上的条 ' N{xL,xR)laN
数分别为和 和 、 落在窗口(^, )中的唯一比对到参考序列的读段条数分别为 ;^^^^和^^,^),通过对检验统计量/ 进行正态分布的双侧显著性检验, 得到 每个位点的 ( ^,¾)|); iii) 设置/ , 反复进行以上步骤直至得到所有符合 ^^^,^^)〉 ^的位点, 得到 候选位点集合为 Bc, Bc = H..,bN} . 其中 可以被设定,例如将侯选位点为 10、100、1000或10000时最小的/7(|/)(^, )|) 设定为 pbkp; 也可以通过以下方式选择 将正常样品作为待测样品, 执行前述歩骤 a) 至 c)的 ii),并将所有 ^^(x, , )|)通过错误发现率控制(False discovery rate control, FDR control)进行过滤,并将过滤后的位点中最后一个突破 FDR阈值的 作为 pbkp; 进行错误发现率控制的歩骤为:
将待检验的数据集按显著性 (P值) 从小到大排序, 得到他们的秩 (r); 从上到下做检验, 直到最后一个满足 A «的位点 k停止, 其中 ^为第 k个位置 的 P值, ^为第 k个位置的秩, N为总位点个数, "为显著性水平, 如 0.01;
保留 k及其之前的所有位点, 去除之后的假阳性位点; d) 对步骤 C中所得的选位点集合 , ^ .., }中的每一个位点 Α, 其两侧存 在窗口: (bk―、, bk -V}和 (bk,bkJ, 去除该两窗口之间拷贝数变异比率差异较小的位点, 即删 除/ 最大的位点 并更新合并区间 (b^bk+o 值, 通过设 重 复以上步骤,直到所有位点满足 ―,, ¾+1)|) < ,则剩余的位点即为满足寻找 CNV 所需要求的位点, 即获得发生染色体拷贝数变异的断点;
其中^ ^的可以被设定, 例如设定使剩余位点数目为原侯选位点数目的 1/2、 1/10、
I/loo或 1/1000时的最大 ? 为 Pmeise ; 也可以通过以下方式选择/ m 将正常 样品作为待测样品, 执行上述步骤 a) 至 d), 使得合并后候选位点数量变为最初位点数量 的 1/2、 1/10、 1/100或 1/1000, 其中最大的; 被选为 7m^。 本发明还涉及一种检测一类因细胞染色体 DNA 片段拷贝数变异 (Copy number variation, CNV)产生复杂的临床表型效应的疾病分析方法,所述方法除了包括上述步骤 a) -d) 外, 还包括:
e) 基于歩骤 d中得到的断点进行 CNV分析, 将待测样品对于正常样品的 CNV比率 小于等于微缺失检测阈值的位点选择为微缺失位点; 将待测样品对于正常样品的 CNV 比 率大于等于微重复检测阈值的位点选择为微重复位点,
微缺失检测阈值和微重复检测阚值可以由本领域技术人员根据经验选择, 例如微缺失 检测阈值为 0.75, 微重复检测阈值为 1.25;
f)将所述微缺失位点和 /或微重复位点对照已有的 CNV和疾病数据库进行基本的基因 注释和缺失部分涉及的基因功能分析, 标注出微缺失综合征疾病类型。
本发明的实施方案的具体技术流程见图 1。
本发明的效果
与目前检测染色体微缺失 /微重复常用的方法 (如高分辨率染色体核型分析、 FISH、 Array CGH和 PCR的方法) 相比, 本发明的优越性主要有以下几点:
1) 高分辨率: 本发明对染色体 CNV分析的精度可达 100kb, 能有效检测出染色体微 缺失 /微重复。
2) 适用于更广的数据分析, 提高内存设备利用率: 重编译算法, 改进数据处理的方 法, 原 SegSeq软件只适合 1~4X低深度测序数据分析, 改良后的 SegSeq可用于 1〜30X不 同测序深度的数据分析。
3) 覆盖全基因组:基于第二代测序技术,本发明可以对全基因组范围进行染色体 CNV 分析, 不需依赖已知的探针和设计探针, 可发现新的染色体异常。
4) 高通量: 基于高通量测序技术, 本发明可以高通量地进行染色体 CNV分析, 通过 在每个样品上加上不同的标签序列, 可以一次地对大量样品进行分析。
5) 成本低: 随着测序技术的不断发展和测序成本的不断降低, 本发明对染色体 CNV 分析的成本也在不断下降。
附图说明
图 1、 本发明对染色体 CNV分析的简要流程图。
图 2、 SeqSeq算法流程示意图。
图 3、 样品 1 (A)、 样品 2 (B) 和样品 3 (C) 的染色体数字核型图, 染色体上重复、 缺失和正常区域, 相应位置和详细信息见表 2。
图 4、 样品 4 (A)、 样品 5 (B) 和样品 6 (C) 的染色体数字核型图, 染色体上重复、 缺失和正常区域, 相应位置和详细信息见表 4。
具体实施方式
在本发明说明书和权利要求书中, 读段 (reads) 是指测序获得的序列片段。
在本发明说明书和权利要求书中, 断点(breakpoint)是指染色体上发生拷贝数变异的 分界点。
本发明中, 获自受试者的基因组 DNA可以从受试者的血液、 组织或细胞获取。 所述 的血液可以来自父母的外周血或胎儿的脐带血; 所述的组织可以是胎盘组织或绒毛膜组 织; 所述的细胞可以是未培养或培养过的羊水细胞、 绒毛组细胞。 在本发明中, 待测受试 者和正常受试者是同一物种。
本发明中, 基因组 DNA的获取可以采用盐析法、 柱层析法、 磁珠法、 SDS法等常规 DNA提取方法, 优选采用磁珠法。所谓的磁珠法, 是指血液、 组织或细胞经过细胞裂解液 和蛋白酶 K的作用后得到裸露的 DNA分子, 利用特异性的磁珠对 DNA分子进行可逆性 的亲和吸附, 经漂洗液清洗除去蛋白质、 脂质等杂质后, 用纯化液将 DNA分子从磁珠上 洗脱下来。 磁珠法可以依照生产商提供的方案进行。
在本发明中, DNA分子的随机打断处理可以采用酶切、雾化、超声、或者 HydroShear 法。 优选地, 采用超声法, 例如, Covaris公司的 S-series基于 AFA技术, 当由传感器释 放的声能 /机械能通过 DNA样品时, 溶解气体形成气泡。 当能量移除后, 气泡破裂并产生 断裂 DNA分子的能力。通过设置一定的能量强度和时间间隔等条件(打断参数举例如下: Duty cycle 20%, Intensity 10, cycles/Burst 1000, Time 60s, Mode: power tracking) , 可 将 DNA分子打断至一定范围的大小 (例如, 200bp - 800bp不等) 。 具体原理和方法请参 见生产商提供的说明书, 将 DNA分子打断为比较集中的一定大小的片段。 在本发明的一 个实施方案中, DNA分子被打断至约 500bp的大小。
在本发明中, 所采用的测序方法可以为高通量测序方法 mumina/SoleXa、 ABI/SOLiD、 Roche/454 测序类型可以为 single-end (单向)测序和 Pair-end (双向)测序, 测序长度可 以为 50bp、 90bp、 或 100bp。 在本发明的一个实施方案中, 测序平台为 Illumina/Solexa, 测序类型为 Pair-end测序, 得到具有双向位置关系的 lOObp大小的 DNA序列分子。
本发明中, 测序深度可以是 〜 30 X, 即总数据量为人类基因组长度的 1 -30倍, 例如 在本发明的一个实施方案中, 测序深度为 2 X, 即 2倍 (6x l09bp) 。 具体的测序深度可以 依据检测的染色体变异片段大小确定, 测序深度越高, 检测的缺失和重复的片段越小。
当待测的 DNA分子来自多个受试样品时, 每个样品可以被加上不同的标签序列, 以 用于在测序过程中进行样品的区分【Micah Hamady, Jeffrey J Walker, J Kirk Harris et al. Error-correcting barcoded primers forpyrosequencing hundreds of samples in multiplex. Nature Methods, 2008, 5(3)】 , 从而实现同时对多个样品进行测序。
本发明中,基因组参考序列可以来自公共数据库。例如,人类基因组序列可以是 NCBI 数据库中的人类基因组参考序列。 在本发明的一个实施方案中, 所述人类基因组序列是 NCBI数据库中版本 36 ( hgl 8 ; NCBI Build 36 ) 的人类基因组参考序列。
序列比对可以通过任何一种序列比对程序, 例如本领域技术人员可获得的短寡核苷酸 分析包 (Short Oligonucleotide Analysis Package, SOAP) 和 BWA比对 ( Burrows- Wheeler Aligner) 进行, 将读段与参考基因组序列比对, 得到读段在参考基因组上的位置。 进行序 列比对可以使用程序提供的默认参数进行, 或者由本领域技术人员根据需要对参数进行选 择。 在本发明的一个实施方案中, 所采用的比对软件是 SOAPaligner/soap2。
本发明中, 将读段比对到染色体序列数据上的是 SOAP之类的软件; 基因组拷贝数变 异(copy number variation, CNV )的软件算法是一种由 Broad研究院开发的 Matlab脚本 (:群), 称为 Segseq软件算法。 见图 2。 它能够通过新一代测序技术产生的数据, 凭借癌变样品与 正常样品的比较,计算出拷贝片段的断点(breakpoint )以及拷贝数变异比率(tumor - normal copy ratio) , 同时可以估算出相应的 P _ value等统计数据, 在低测序深度( 10M PE: 32,36 读段) 的时候可检测出 50K左右的 CNV片段。
本发明中, 对待测样品寻找 CNV分析的断点, 是指利用改良的 Segseq软件算法, 以 正常样品为阴性对照, 在参考基因组序列上寻找待测样品和正常样品在其两侧拷贝数变异 比率差异符合条件的位点, 即断点。 所述断点的寻找包括两个步骤: 即 (1 ) 初始化, 目 的在于选出候选点; (2 ) 反复合并相邻片段, 降低假阳性率。 具体的原理及数学模型是: 在测序所得读段为来自基因组 DNA中的随机片段的前提 下, 在比对后落到一个区域的读段数量应服从泊松分布。 设全基因组中可比对区域长度为 A (^ί = 2.2χ109 ) , 正常样品和待测样品能比对到参考序列的读段条数分别为和 和 、 落在窗口(χΔ, c«)中的读段条数分别为 NO^^^nr^,^), 窗口大小 = χΛ-^+1, 则 N 和 Γ分别服从参数为 =·^和 的泊松分布, 且有 i^-rxax ^, α = ατΙαΝ
A A 贝数变异比率定义为 Χ Χ 'ατ , 在抽样很大的条件下, (; ^, )接近对数
N(xL,xR)/aN
正态分布。定义 Ζ)(Χ Λ:Λ) = log A:))— log <x〈 ^。那么,由于/ 接近对数正态分布, 则 £>(χΛ, )服从正态分布, 从而应用双侧 P-value ( p D(xL,xR)\> d)) 可检验某个位点两侧的拷贝数变异比率差异是否显著。
寻找断点的歩骤 (1) 中的初始化, 是指初选出候选点的流程。 具体的, 对于参考序 列上的位置 6 , 强制使其左右两侧的局部窗口包含 w条正常读段, 即满足 N(x,,b) = N(b,xR) = w, 则在这些位置中, 满足^^!^^ ^/^^,^;^的加入候选序列; 而 满足 A(^, ) = 0, 6- v</<6 + w的被易 ij除, 不列入候选点。 通过设定合适的; ¾ , 反复 进行以上歩骤直到所有 >(|£>( ,½)|)> Pbkp, 则得到适当数目的候选点。
在本发明中, W可以是大于 1的任意整数, 例如 5 - 5000, 优选 10 - 2000, 更优选为
100- 1000例如 300。
寻找断点的歩骤 (2) 中反复合并相邻片段, 是指通过极大似然处理, 使得之间拷贝 数变异比率差异较小的相邻片段得以合并, 从而降低假阳性率。 具体的, 设步骤 (1) 中 所得的候选点集合为 Bc, BH ,bN , 则候选点 *的左右两侧窗口分别为 (bw, -1) 和 ,去除该两窗口之间拷贝数变异比率差异较小的位点。即,删除 (¾_„¾+1)|) 最大的位点 A, 并更新合并区间 (^小!^+^的^7值, 通过设置/ ^^, 重复以上步骤, 直到所 / ^, 则剩余的位点即为满足寻找 CNV所需要求的位点。
Figure imgf000009_0001
本发明中, 在寻找候选点后进行 CNV分析, 是指根据该领域群体数据分析的经验值 将待测样品对于正常样品的 CNV比率 0.75和 1.25分别作为染色体拷贝数变异的检测 阈值, CNV比率 0.75即为染色体缺失, CNV比率 1.25为染色体重复。 根据分析得到 微缺失 /微重复结果绘制染色体数字核型图。 染色体数字核型是一种量化基因组上 DNA拷贝数变异的技术, 将全基因组上特定位 点的 DNA短序列分离列举出。 例如, 对于人染色体而言, 绘制染色体核型图通常是将一 个细胞中的染色体从最大 (第 1号染色体) 到最小的 (第 22号染色体) 排列, 性染色体 ( X和 /或 Y)显示在最后。 这是本领域中常用的表示方法, 在本领域普通技术人员的能力 范围内。例如可以参考文章【Tian-Li Wang et al. Digital karyotyping. PNAS, 2002, vol. 99, no. 25, 16156~16161.】、 【Henry Wood et al. Using next-generation sequencing for high resolution multiplex analysis of copy number variation from nanogram quantities of DNA from formalin-fixed paraffin-embedded specimens. Nucleic Acids Research, 2010, 38(14), doi: 10.1093/nar/gkq510.】或者本发明实施例来进行。
在本发明中, 其中/ 7 ρ可以被设定, 例如将侯选位点为 10、 100、 1000或 10000时最 小的 设定为 ρΜρ ; 也可以通过以下方式选择/ 将正常样品作为待测样品, 执行本发明的歩骤计算/? (|£>(^, )|),并将所有/ ?(|£·(¾,χ )|)进行错误发现率控制(False discovery rate control, FDR control ),并将最后一个突破 FDR阈值的 pfl ( ^,¾ )作为 pbkp。 例如, 在实施例中, 有异于癌症样品, 群体研究中不存在默认的对照样品(例如, 癌旁) , 所以我们利用了炎黄群体的数据 (45名南方汉族 +45名北方汉族) 的深度测序数据弥补由 此带来的不足。 我们将混合正常样品 (此处只出了炎黄一号之外的炎黄群体数据) 当做待 测样品, 分别执行本发明方法步骤 a)至 c) 的 H ) , 并将所有 ρ(|Ζ)( > ½)|)进行错误发现 率控制 (False discover rate control , FDR control ) , 并将最后一个突破 FDR 阈值的
Figure imgf000010_0001
在本发明中, 其中 可以被设定, 例如设定使剩余位点数目为原侯选位点数目的
1/2、 1/10、 1/100或 1/1000时最大的 ρ(|£>(^, )|)为 pmerge;也可以通过以下方式选择 pmerge: 将正常样品作为待测样品, 执行本发明方法步骤 a) 至 d), 使得合并后候选位点数量变为 最初位点数量的 1/2、 1/10、 1/100或 1/1000,其中最大的 /?(|/)(^, |)被选为 。例如, 在实施例中, 由于缺乏默认对照样品 (例如癌旁) , 我们无法通过合并默认对照的方法来 选定阈值。 我们将混合正常样品 (此处只出了炎黄一号之外的炎黄群体数据)执行本发明 的方法至合并步骤, 直到候选点集合中候选点数量变为最初的 1/100, 其中最大的 被选为 , 用到后面的分析。 在本发明中, 正态分布显著性检验 P值的计算方法可以使用本领域中公知的方法, 也 可以通过现有的大量软件算法进行计算, 这些算法是本领域普通技术人员可以获得的。 本发明中, 已有的 CNV与疾病数据库, 是指已有拷贝数变异与疾病关联信息的数据 库 。 在 本 发 明 的 一个 实施方案 中 , 所 使用 的 数据 库值 DECIPHER (https://decipher.sanger.ac.uk/svndromes), 该数据库列出的 58 种微缺失 /微重复综合征均为 缺失重复片段与疾病关系明确的内容。
在本发明的一个实施方案中, 针对绒毛组织进行染色体 CNV分析的具体方法包括以 下歩骤:
1、 DNA提取及测序: 按照磁珠法基因组 DNA提取试剂盒(例如 Tiangen DP329)操 作手册提取绒毛组织 DNA后, 按照 niumina/Solexa标准建库流程进行建库。 在这个过程 中,绒毛组织 DNA通过超声法随机打断为集中在 500bp左右的 DNA分子,两端加上测序 所用接头, 每个样品被加上不同的标签序列(index) , 从而在一次测序得到的数据中可以 使多个样品的数据区分开。
2、 比对及统计: 利用第二代测序方法 Illumina/Solexa 测序 (用其它测序方法如 ABI/SOLiD能达到相同或相近的效果) , 每个样品得到一定大小片段的 DNA序列, 即读 段, 将其与 NCBI数据库中的标准人类基因组参考序列进行 SOAP比对, 得到所测 DNA 序列定位于基因组相应位置的信息。 为避免重复序列对 CNV分析的干扰, 只选取与人类 基因组参考序列唯一比对的读段 (Unique reads) , 作为后续 CNV分析的有效数据, 并统 计其数目 。
3、 数据分析: 以己知正常样品作为阴性样品, 通过基于 SegSeq算法的 CNV分析, 寻找 CNV分析所需的断点以及计算待测样品相对正常样品的拷贝数变异比率, 通过设置 一定的检测闽值, 判断待测样品的染色体片段微缺失 /微重复情况, 并绘制染色体数字核型 图和进行对应的基因注释。 具体过程如下:
1 )初始化: 对于同一条染色体上, 对于一个位置为 6, 设置参数^使其左右两侧的局 部窗口包含 300条正常读段, 即 N(^,6) = N(6,xs) = >v = 300。 在待测样品的读段位置中, 满足 6 = m n /j(| ,χ )|)的加入候选序列,满足 A( ,¾) = 0, >— w < < 6 + w的被易 lj除。 设置/ 7Mp相关的参数为 1000, 使该初始化流程输出 1000个候选点。 反复进行上述剔除和 加入候选序列的步骤, 直到所有;^/)^^^)〉^^, 输出染色体 c上的候选点集合 ^,
2 ) 反复合并相邻片段: 初始化得到候选点集合中候选点 ;t的左右两侧窗口分别为
1)和( ,^+1), 设置; ;mge相关的参数为 10,使该反复合并流程输出至多 10个假阳 性片段结果。 通过反复合并之间拷贝数变异比率差异较小的相邻片段, 直到所有 ' 得到最终的分析 CNV所需的有效候选点, 即断点。
Figure imgf000012_0001
3 ) CNV分析: 统计上述最终断点, 设某两个断点之间窗口为 ( ,; ^) , 计算待测样品 相对正常样品的 CNV比率 i?0c,,½) = T(X X /ar 。 将所述 CNV比率 0.75和 1.25分
' N{x, , xR) l aN
别作为染色体片段缺失和重复的检测阈值,分析得到微缺失 /微重复结果后绘制染色体数字 核型图并进行基因注释。
本发的方法适用于对动物和人进行染色体 CNV分析, 特别是哺乳动物, 更特别是人。 本发明可以用于对适用人群进行染色体 CNV分析,所述染色体 CNV分析可以用于非 诊断用途, 例如作为对基因组进行研究的工具。 本发明还可以用于对适用人群进行染色体 CNV分析,有利于提供遗传咨询和提供临床决策依据;进行植入前诊断或产前诊断可有效 防止患儿出生。 本发明适用人群可以是常规染色体核型分析无异常、 但有以下临床表现的 人群-
1) 多次胚胎停育或自然流产的女性及其配偶;
2) 曾生育过畸形胎儿的女性及其配偶;
3) 男性无精少精不育症患者;
4) 原因不明的男性不育症患者;
上述适用人群举例仅用于说明本发明, 而不应为限定本发明的范围。 下面将结合实施例对本发明的实施方案进行详细描述, 但是本领域技术人员将会 理解, 下列实施例仅用于说明本发明, 而不应视为限定本发明的范围。 实施例中未注 明具体条件者, 按照常规条件或制造商建议的条件进行。 所用试剂或仪器未注明生产 厂商者, 均为可以通过市场获得的常规产品。 以下括号内为各个试剂或试剂盒的厂家 货号。 所使用的测序用的接头和标签序列来源于 IUumina公司的 Multiplexing Sample Preparation Oligonutide Kit。
实施例一、 对 3例组织进行染色体 CNV分析
1. DNA提取与测序
按照磁珠法基因组 DNA提取试剂盒 (TiangenDP329) 操作流程提取 3例因产前筛査 高风险(风险值 1/9)、 孕妇本身为平衡易位携带者且之前怀过一例异常胎儿而进行绒毛膜 穿刺术的胎儿组织样本 (以下简称样品 1、 样品 2和样品 3 , 共 2例绒毛及 1例胎盘组织 样品) 的 DNA, 用 Qubit ( Invitrogen, the Quant-iT*1 dsDNA HS Assay Kit) 定量, 所提取 的 DNA总量为约 500ng。
提取的组织 DNA是完整的基因组 DNA,按照 Illumina/Solexa标准建库流程进行建库。 简而言之, 在打断为集中于 500bp的 DNA分子两端被加上测序所用接头, 每个样品被加 上不同的标签序列 (index ) , 然后与芯片 (flowcell ) 表面互补接头杂交, 在一定条件下 使核酸分子成簇生长, 然后在 mUmina mSeq 2000上通过双末端测序, 得到具有位置关系 的成对的长度为 lOObp的 DNA片段序列。
随后, 将获自上述组织的约 500ng的 DNA使用 Covaris S-series随机打断至 500bp片 段后, 进行修改后的 Illumina/Solexa 标准流程建库, 具体流程参照现有技术 (参见 http://www.illumina.com/提供的 Illumina/Solexa 标准建库说明书)。 经 2100 Bioanalyzer (Agilent)确定 DNA文库大小及插入片段大小, QPCR精确定量后可上机测序。每个样品最 后得到的数据总量为 6x l09bp。
本实施例中, 对于获自上述 3 例组织的 DNA样品按照 Illumina/Solexa官方公布的 Cluster Station和 Hiseq 2000 (PE sequencing) 说明书进行操作。
2. 比对与统计
经步骤 1中所述进行测序后, 每个样品根据所述标签序列区分开并得到约 500bp的一 定大小片段的 DNA序列, 即读段。 利用比对软件 SOAPaligner/SOap2, 将测序所得读段与 NCBI数据库中版本 36 (hgl 8 ; NCBI Build 36 ) 的人类基因组参考序列进行比对, 得到所 测 DNA序列定位于基因组相应位置的信息。 只选取与人类基因组参考序列唯一比对的唯 一读段, 作为后续 CNV分析的有效数据, 并统计其数目 ^。
本实施例中, 已知正常样品选取炎黄基因组 DNA样品作为阴性样品对照【Jun Wang, et al. The diploid genome sequence of an Asian individual. Nature. 2008 Nov 6; 456(7218): 60 - 65】
取与待测样品相同的数据量经标准化后统计其有效读段数目 , = 68750810。 统 计上述样品 1、样品 2和样品 3的有效读段数目 ^分别为 25934245 , 34164361和 32085646。 3. 数据分析
1) 初始化: 运行 SegSeq算法, 对于一条染色体上的位置 6, 设置参数 w = 300使位置 6左右两侧的局部窗口包含 300条正常读段, 即 Λ^(χΛ,6) = (6,χΛ) = >ν = 300。 在待测样品 的读段位置中, 满足 6 = m n /7 (| , (^,^)|)的加入候选序列, 满足 (^,^) = 0、 6 - >V ' < 6 + M的被剔除。 设置 ρΜ/)相关的参数为 1000, 使该初始化流程输出 1000个候选 点。 反复进行上述剔除和加入候选序列的步骤,
Figure imgf000014_0001
, 输出染色体 c上的候选点集合 ^, Bc={b,b2,...,bN}.
2) 反复合并相邻片段: 初始化得到候选点集合, 设候选 ^ t的左右两侧窗口分别为 bk―、, b 和 φ , 设置 相关的参数为 10,使该反复合并流程输出至多 10个假阳 性片段结果。 去除两侧窗口之间拷贝数变异比率差异较小的位点, 直到所有
P Dbi (¾_„64+1)|) < Pmerge, 得到最终的分析 CNV所需的有效断点。
3) CNV分析: 统计上述最终断点, 设某两个断点之间窗口为 计算待测样品 相对正常样品的 CNV比率 ?(^,½)= T^'x^/ar 。 将所述 CNV比率 0.75和 1.25分
N{xL,xR)laN
别作为染色体片段缺失和重复的检测阈值,分析得到微缺失 /微重复结果后绘制染色体数字 核 型 图 , 与 arrayCGH ( The Fetal DNA Chip, http://www.fetalmedicine.hk/en/Fetal DNA Chip.asp ) 进行比较。 根据 DECIPHER数据库 进行疾病分类并进行基因注释。
4) CNV分析结果输出并绘制数字核型图。
阴性对照结果拷贝数均为正常, 3例样品的 CNV结果以及检测结果验证和主要基因分 别如下表 2和 3所示。
表 2
Figure imgf000014_0002
表 3
样品
区带 arrayCGH结果 比较 疾病类型或影响的基因 编号
5pl5.33-*pl3.2 5pl5.3~p 13.2(183931 ~36816731)xl 一致 猫叫综合征(Cri du Chat 样品 1
18ql2.3→q23 18pl2.3~q23(39086755~76067279)x3 一致 Syndrome),部分 18三体综合征
BIVM> C13orf27、 KDELCK 样品 2 13q32.2→q33.3 13q32~q33.3(97091318-106466788)x 1 一致
BIVM、 E CC5
2q36~q37.3(230369496~242444380 ) TRIP12, SLC19A3、 PIDK 样品 3 2q36.3→q37.3 一致
x3 NYGGF4 从上述结果可以看出: 高通量测序检测到得染色体微缺失和微重复区域与现有的 arrayCGH (The Fetal DNA Chip. http://www.fetalmedicine.hk/en/Fetal DNA Chip.asp )结果 一致, 具体数字核型图见图 3A-C。 实施例二、 对另外 3例绒毛组织进行染色体 CNV分析
3例绒毛组织 (以下简称样品 4、 样品 5和样品 6) 在经过与实施例一中同样的处理 方法和测序过程后获得上机数据, 结果与髙分辨率核型分析结果相比较。
本实施例的数据分析过程中,与实施例一相同, 已知正常样品选取炎黄基因组 DNA 样品作为阴性样品对照, 取与待测样品相约的数据量经标准化后统计其有效读段数目 , aN = 68750810。 统计上述样品 4、 样品 5和样品 6的有效读段数目 分别为 44797212, 44086450和 45374254。 其余数据分析的流程和相关参数设置均与实施例一中相同, 最后 分析得到微缺失 /微重复结果后绘制染色体数字核型图并进行基因注释。
阴性对照结果拷贝数均为正常, 3例样品的 CNV结果以及检测结果验证和主要基因分 别如下表 4和 5所示。
表 4
Figure imgf000015_0001
区 域 与 现 有 的 arrayCGH ( The Fetal DNA Chip, http://www.fetalmedicine.hk/en/Fetal DNA Chip.asp )结果一致,具体数字核型图见图 4A-C。
Figure imgf000015_0002
从上述结果可以看出: 3 例绒毛膜组织经高通量测序检测到得染色体微缺失和微重复 区域与现有的高分辨率核型分析结果一致。
尽管本发明的具体实施方式已经得到详细的描述, 本领域技术人员将会理解, 根据已 经公开的所有教导, 可以对那些细节进行各种修改和替换, 这些改变均在本发明的保护范 围之内。 本发明的全部范围由所附权利要求及其任何等同物给出。

Claims

权 利 要 求 书
1. 一种检测染色体拷贝数变异的方法, 其包括以下步骤:
a) 将获自待测受试者和正常受试者基因组 DNA分子随机打断, 得到 DNA片段, 并 对所述 DNA片段进行测序, 获得测序的读段;
b)将步骤 a中测定的 DNA序列与所述受试者的物种的基因组参考序列进行比对, 将 所测 DNA序列定位于参考序列上, 只选用在参考序列上有唯一位置的读段进行分析; c)寻找参考序列上符合以下条件的断点:待测受试者样品的比对结果与正常受试者样 品的比对结果相比, 在两侧拷贝数变异比率有差异的位点, 步骤如下:
i) 对于参考序列上每一个位点 b, 强制使其左右两侧的局部窗口包含 w条正常读段, 即满足 N(x»N(b, ) = w,其中 N(xt,; 为正常样品落在窗口 , )中的比对条数, w 为大于 1的整数;
ii) 在这些位置中, 筛选符合 ί> = η^ηρ(|£>,(;^,χΛ)|)的位点, 剔出符合 Α(^, ) = 0, b-w<i<b + w 的 位 点 , 其 中 D ( , = log -log (i?(x,^)) ,
R(x,,xR)= Τ Χ Χ /ατ , 其中正常样品读段和待测样品读段唯一比对到参考序列上的条 ' N{x,,xR)laN
数分别为和 和 α7.、 落在窗口(¾^«)中的唯一比对到参考序列的读段条数分别为 N(;c,,,xK)和 r(x,,xft), 通过对检验统计量 进行正态分布的双侧显著性检验, 得到 每个位点的; 7(|D ( , ¾)|); iii) 设置; >, 反复进行以上步骤直至得到所有符合 ρ(|Ζ?(^, )|)>ρ ^的位点, 得到 候选位点集合为 ^, 5C d) 对步骤 c中所得的候选位点集合 , ^- ,… ^中的每一个位点^ 其两侧 存在窗口: -1)和 去除该两窗口之间拷贝数变异比率差异较小的位点, 即 删除/ 7(|/ ( _,, +1)|)最大的位点 fc, 并更新合并区间 (1^, +1)的 值, 通过设置^^, 重复该步骤,直到所有位点满足 ^/^(^^ ^〈/^^, 则获得发生染色体拷贝数变异的 位点。
2. 根据权利要求 1的方法, 所述 w为 100- 1000之间的整数。
3. 根据权利要求 1或 2的方法, 其中 为侯选位点为 10、 100、 1000或 10000时最
Figure imgf000016_0001
或者通过以下方式选择; 将正常样品作为待测样品, 执行前述歩 骤 a) 至 c) 的 ii), 并将所有 /7(|Ζ^χΛ,¾ 通过错误发现率控制 (FDR) 进行过滤, 并将 过滤后的位点中最后一个突破 FDR阈值的 /?(|/)(^, )|)作为 pbkp '、进行错误发现率控制的 歩骤为:
将待检验的数据集按显著性 ( 值) 从小到大排序, 得到他们的秩 (r); 从上到下做检验, 直到最后一个满足 的位点 k停止, 其中 A为第 k个位置 的 P值, 为第 k个位置的秩, N为总位点个数, α为显著性水平, 如 0.01 ;
保留 k及其之前的所有位点, 去除之后的假阳性位点。
4. 根据权利要求 1 - 3任一项的方法, 其中/ 为使剩余位点数目为原侯选位点数目 的 1/2、 1/10、 1/100或 1/1000时的最大;? (|£>^, )|); 或者通过以下方式选择/ 7m 将 ιΗ常样品作为待测样品, 执行上述歩骤 a) 至 d), 使得合并后候选位点数量变为最初位点 数量的 1/2、 1/10、 1/100或 1/1000, 其中最大的 ?(|£>(^, )|)被选为 ge
5. 根据权利要求 1 - 4任一项的方法, 在得到发生染色体拷贝数变异的位点后, 进一 歩包括,
e)基于步骤 d) 中得到的发生染色体拷贝数变异的位点进行分析, 将待测样品对于正 常样品的 CNV 比率小于等于微缺失检测阈值的位点选择为微缺失位点, 将大于等于微重 复检测阈值的位点选择为微重复位点;
f)将所述微缺失位点和 /或微重复位点对照已有的 CNV和疾病数据库进行基因注释和 功能分析, 注出染色体微缺失和 /或微重复综合征疾病的类型。
6.根据权利要求 5的方法,所述微缺失检测阈值为 0.75,所述微重复检测阈值为 1.25。
7. 根据前述权利要求任一项的方法, 所述的样品来源于细胞、 血液或组织。
8. 根据前述权利要求任一项的方法, 所述将样品基因组 DNA分子随机打断的步骤是 采用化学或物理断裂方式进行的, 所述化学或物理断裂方式包括酶切打断, 雾化、 超声或 HydroShear法打断。
9. 根据前述权利要求任一项的方法, 所述 DNA片段测序步骤利用高通量测序技术进 行, 所述高通量测序技术包括 Illumina/Solexa、 ABI/SOLiD或 Roche/454测序。
10. 根据前述权利要求任一项的方法, 所述 DNA片段测序步骤釆取的测序深度范围 是卜 30 X。
11 . 根据权利要求 5或 6的方法, 还包括绘制染色体数字核型图的歩骤, 所述染色体 数字核型图根据拷贝数变异比率值绘制。
PCT/CN2011/001805 2011-10-28 2011-10-28 一种检测染色体微缺失和微重复的方法 WO2013059967A1 (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201180075188.0A CN104136628A (zh) 2011-10-28 2011-10-28 一种检测染色体微缺失和微重复的方法
US14/354,109 US20140274745A1 (en) 2011-10-28 2011-10-28 Method for detecting micro-deletion and micro-repetition of chromosome
PCT/CN2011/001805 WO2013059967A1 (zh) 2011-10-28 2011-10-28 一种检测染色体微缺失和微重复的方法
TW101139077A TW201317362A (zh) 2011-10-28 2012-10-23 一種檢測染色體拷貝數變異的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/001805 WO2013059967A1 (zh) 2011-10-28 2011-10-28 一种检测染色体微缺失和微重复的方法

Publications (1)

Publication Number Publication Date
WO2013059967A1 true WO2013059967A1 (zh) 2013-05-02

Family

ID=48167029

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2011/001805 WO2013059967A1 (zh) 2011-10-28 2011-10-28 一种检测染色体微缺失和微重复的方法

Country Status (4)

Country Link
US (1) US20140274745A1 (zh)
CN (1) CN104136628A (zh)
TW (1) TW201317362A (zh)
WO (1) WO2013059967A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104745718A (zh) * 2015-04-23 2015-07-01 北京嘉宝仁和医疗科技有限公司 一种检测人类胚胎染色体微缺失和微重复的方法
WO2016045106A1 (zh) * 2014-09-26 2016-03-31 深圳华大基因股份有限公司 单细胞染色体的cnv分析方法和检测装置
CN106778069A (zh) * 2017-02-17 2017-05-31 广州精科医学检验所有限公司 确定胎儿染色体中微缺失微重复的方法及设备
CN107408163A (zh) * 2015-06-24 2017-11-28 社会福祉法人三星生命公益财团 用于分析基因的方法及装置
CN108363903A (zh) * 2018-01-23 2018-08-03 和卓生物科技(上海)有限公司 一种适用于单细胞的染色体非整倍性检测系统及应用
CN110268044A (zh) * 2017-03-07 2019-09-20 深圳华大生命科学研究院 一种染色体变异的检测方法及装置
CN111326212A (zh) * 2020-02-18 2020-06-23 福建和瑞基因科技有限公司 一种结构变异的检测方法
CN113699225A (zh) * 2021-08-06 2021-11-26 菁良基因科技(深圳)有限公司 无创产前筛查微缺失或微重复非配对参考品及其制备和应用
CN114864000A (zh) * 2022-07-05 2022-08-05 北京大学第三医院(北京大学第三临床医学院) 一种动态鉴定人类单细胞染色体拷贝数的方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11094398B2 (en) 2014-10-10 2021-08-17 Life Technologies Corporation Methods for calculating corrected amplicon coverages
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
EP3377655A4 (en) * 2015-11-16 2018-11-21 Mayo Foundation for Medical Education and Research Detecting copy number variations
TWI603082B (zh) * 2016-09-30 2017-10-21 有勁生物科技股份有限公司 非侵入式胎兒性徵異常檢測系統及其方法與非侵入式胎兒性徵檢測系統及其方法
WO2018144449A1 (en) * 2017-01-31 2018-08-09 Counsyl, Inc. Systems and methods for identifying and quantifying gene copy number variations
TWI687937B (zh) * 2018-10-05 2020-03-11 中國醫藥大學附設醫院 染色體異常檢測模型之建立方法、染色體異常檢測系統及染色體異常檢測方法
CN111028888A (zh) * 2018-10-09 2020-04-17 北京贝瑞和康生物技术有限公司 一种全基因组拷贝数变异的检测方法及其应用
CN112863602B (zh) * 2021-02-22 2023-07-21 苏州贝康医疗器械有限公司 染色体异常的检测方法、装置、计算机设备和存储介质
CN114220481B (zh) * 2021-11-25 2023-09-08 深圳思勤医疗科技有限公司 基于全基因组测序完成待测样本的核型分析的方法、系统和计算机可读介质
CN114592056A (zh) * 2022-04-15 2022-06-07 常州市妇幼保健院 22q11微缺失和/或微重复检测引物组、引物探针组合物、试剂盒及其应用
CN116246704B (zh) * 2023-05-10 2023-08-15 广州精科生物技术有限公司 用于胎儿无创产前检测的系统
CN117012274B (zh) * 2023-10-07 2024-01-16 北京智因东方转化医学研究中心有限公司 基于高通量测序识别基因缺失的装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101555528B (zh) * 2008-09-28 2015-05-27 南京市妇幼保健院 一种染色体22q11.2区微缺失、微重复的测定方法
CN101575647B (zh) * 2009-06-19 2012-02-15 成都军区昆明总医院 一种y染色体微缺失的基因检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHIANG, D.Y. ET AL.: "High-resolution mapping of copy-number alterations with massively parallel sequencing", NAT METHODS., vol. 6, no. 1, 2009, pages 99 - 103, XP055065796 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016045106A1 (zh) * 2014-09-26 2016-03-31 深圳华大基因股份有限公司 单细胞染色体的cnv分析方法和检测装置
CN104745718A (zh) * 2015-04-23 2015-07-01 北京嘉宝仁和医疗科技有限公司 一种检测人类胚胎染色体微缺失和微重复的方法
CN107408163B (zh) * 2015-06-24 2021-03-05 吉尼努斯公司 用于分析基因的方法及装置
CN107408163A (zh) * 2015-06-24 2017-11-28 社会福祉法人三星生命公益财团 用于分析基因的方法及装置
CN106778069A (zh) * 2017-02-17 2017-05-31 广州精科医学检验所有限公司 确定胎儿染色体中微缺失微重复的方法及设备
CN106778069B (zh) * 2017-02-17 2020-02-14 广州精科医学检验所有限公司 确定胎儿染色体中微缺失微重复的方法及设备
CN110268044A (zh) * 2017-03-07 2019-09-20 深圳华大生命科学研究院 一种染色体变异的检测方法及装置
CN110268044B (zh) * 2017-03-07 2022-08-02 深圳华大生命科学研究院 一种染色体变异的检测方法及装置
CN108363903A (zh) * 2018-01-23 2018-08-03 和卓生物科技(上海)有限公司 一种适用于单细胞的染色体非整倍性检测系统及应用
CN108363903B (zh) * 2018-01-23 2022-03-04 和卓生物科技(上海)有限公司 一种适用于单细胞的染色体非整倍性检测系统及应用
CN111326212A (zh) * 2020-02-18 2020-06-23 福建和瑞基因科技有限公司 一种结构变异的检测方法
CN111326212B (zh) * 2020-02-18 2023-06-23 福建和瑞基因科技有限公司 一种结构变异的检测方法
CN113699225A (zh) * 2021-08-06 2021-11-26 菁良基因科技(深圳)有限公司 无创产前筛查微缺失或微重复非配对参考品及其制备和应用
CN113699225B (zh) * 2021-08-06 2023-11-21 菁良科技(深圳)有限公司 无创产前筛查微缺失或微重复非配对参考品及其制备和应用
CN114864000A (zh) * 2022-07-05 2022-08-05 北京大学第三医院(北京大学第三临床医学院) 一种动态鉴定人类单细胞染色体拷贝数的方法
CN114864000B (zh) * 2022-07-05 2022-09-09 北京大学第三医院(北京大学第三临床医学院) 一种动态鉴定人类单细胞染色体拷贝数的方法

Also Published As

Publication number Publication date
CN104136628A (zh) 2014-11-05
TW201317362A (zh) 2013-05-01
US20140274745A1 (en) 2014-09-18

Similar Documents

Publication Publication Date Title
WO2013059967A1 (zh) 一种检测染色体微缺失和微重复的方法
US20230420071A1 (en) Methods for non-invasive prenatal ploidy calling
US10590482B2 (en) Amplification of cell-free DNA using nested PCR
JP7321727B2 (ja) 卵子提供による妊娠での胎児異数性の非侵襲的検出
US20200350034A1 (en) Method for Non-Invasive Prenatal Testing Using Parental Mosaicism Data
US20240060124A1 (en) Methods for amplification of cell-free dna using ligated adaptors and universal and inner target-specific primers for multiplexed nested pcr
US20200190573A1 (en) Methods for non-invasive prenatal ploidy calling
US20190284623A1 (en) Methods for non-invasive prenatal ploidy calling
EP3187597B1 (en) Methods for non-invasive prenatal ploidy calling
JP2015534807A (ja) 胎児の染色体異数性を検出するための非侵襲的方法
AU2012385961A1 (en) Highly multiplex PCR methods and compositions
WO2013130848A1 (en) Informatics enhanced analysis of fetal samples subject to maternal contamination
JP2014530629A (ja) 染色体の微細欠失及び微細重複を検出する方法
WO2020119626A1 (zh) 一种无创产前检测胎儿是否患有遗传疾病的方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11874822

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 14354109

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2014537440

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11874822

Country of ref document: EP

Kind code of ref document: A1