WO2014075228A1 - 确定生物样本中染色体数目异常的方法、系统和计算机可读介质 - Google Patents

确定生物样本中染色体数目异常的方法、系统和计算机可读介质 Download PDF

Info

Publication number
WO2014075228A1
WO2014075228A1 PCT/CN2012/084547 CN2012084547W WO2014075228A1 WO 2014075228 A1 WO2014075228 A1 WO 2014075228A1 CN 2012084547 W CN2012084547 W CN 2012084547W WO 2014075228 A1 WO2014075228 A1 WO 2014075228A1
Authority
WO
WIPO (PCT)
Prior art keywords
chromosome
sequencing data
biological sample
chrn
predetermined chromosome
Prior art date
Application number
PCT/CN2012/084547
Other languages
English (en)
French (fr)
Inventor
谢伟伟
李旭超
陈芳
蒋浩君
汪建
王俊
杨焕明
张秀清
Original Assignee
深圳华大基因医学有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳华大基因医学有限公司 filed Critical 深圳华大基因医学有限公司
Priority to PCT/CN2012/084547 priority Critical patent/WO2014075228A1/zh
Priority to CN201280068310.6A priority patent/CN104093858B/zh
Publication of WO2014075228A1 publication Critical patent/WO2014075228A1/zh
Priority to HK14110577A priority patent/HK1197084A1/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Definitions

  • the present invention relates to the field of biomedicine, and in particular to the field of genetic variation testing, and more particularly, to a method, system and computer readable medium for determining abnormal chromosome numbers in a biological sample. Background technique
  • Spontaneous abortion is one of the most common complications of clinical pregnancy, accounting for about 10%-20%.
  • the causes can be roughly divided into embryonic factors, maternal factors and environmental factors.
  • the genetic abnormality of embryos is the main reason. It is reported that the number of chromosomes in early aborted embryos accounts for 50%-60%. It is necessary to detect the chromosome of aborted fetus and understand the cause of spontaneous abortion, which is of guiding significance for the next pregnancy.
  • karyotyping FISH (fluorescence in situ hybridization), CGH (comparative genomic hybridization), MLPA (multiple ligation probe amplification), STR-PCR (short tandem repeats combined with polymerase chain) Reaction technology) and the like.
  • FISH fluorescence in situ hybridization
  • CGH comparative genomic hybridization
  • MLPA multiple ligation probe amplification
  • STR-PCR short tandem repeats combined with polymerase chain Reaction technology
  • the FISH diagnostic technique applied to the clinic uses chromosome probes to perform in situ hybridization on uncultured villus tissue to diagnose abnormal chromosome numbers, which is fast and accurate.
  • the FISH probe is used. The part only involves chromosomes 13, 18, 21, X and Y, and not all chromosomes are detected at the same time.
  • the present invention aims to solve at least one of the technical problems existing in the prior art.
  • the invention proposes a method for efficiently determining abnormalities in the number of chromosomes in a biological sample.
  • the method according to an embodiment of the invention is used to determine the location on a chromosome.
  • the number of sequencing data can effectively determine whether the biological sample has an abnormal number of chromosomes for the chromosome.
  • the invention proposes a computer readable medium.
  • the computer readable medium is utilized to determine the location
  • the number of sequencing data on the chromosome can effectively determine whether the biological sample has an abnormal number of chromosomes for the chromosome.
  • the invention proposes a system for determining an abnormal number of chromosomes in a biological sample.
  • the system includes: a sequencing device for sequencing a genomic DNA of the biological sample to obtain a plurality of sequencing data; a comparison device, the comparison device and The sequencing device is coupled to compare the sequencing data with a reference genome sequence of the organism to obtain a unique alignment sequencing data set composed of a plurality of unique alignment sequencing data; an analysis device, the analysis The device is connected to the comparison device, and is configured to determine whether the biological sample has an abnormality in the number of chromosomes for a predetermined chromosome, wherein the analyzing device further comprises: a first calculating module, wherein the first calculating module is configured to determine The unique comparison of the number of unique alignment sequencing data included in the sequencing data set; a second calculation module, the second calculation module for determining the unique alignment of the unique alignment sequencing data set from a predetermined chromosome a number N of data; a third calculation
  • the total number of sequencing data on the chromosome is proportional to the length of the chromosome and the amount of the chromosome in the biological sample.
  • the biological sample can be effectively determined by determining the number of sequencing data mapped to a chromosome. Whether there is an abnormal number of chromosomes for the chromosome.
  • the invention proposes a system for determining an abnormal number of chromosomes in a biological sample.
  • the system comprises: a sequencing device for sequencing genomic DNA of the biological sample to obtain a plurality of sequencing data; and the computer readable medium described above.
  • the total number of sequencing data located on a chromosome is proportional to the length of the chromosome and the amount of the chromosome in the biological sample, the system is used to determine the location on a chromosome.
  • the number of sequencing data can be effectively determined whether the biological sample has an abnormal number of chromosomes for the chromosome.
  • Figure 1 shows a schematic flow diagram of a method for determining abnormalities in the number of chromosomes in a biological sample
  • Figure 2 shows a schematic structural diagram of a system for determining abnormalities in the number of chromosomes in a biological sample.
  • first and “second” are used for descriptive purposes only and are not to be construed as indicating or implying relative importance or implicitly indicating the number of technical features indicated. Thus, features defining “first”, “second” may explicitly or implicitly include one or more of the features. Further, in the description of the present invention, “multiple,” means two or more unless otherwise stated.
  • the invention proposes a method for determining an abnormal number of chromosomes in a biological sample.
  • the method includes:
  • the genomic DNA of the biological sample to be detected is first sequenced in order to obtain more Sequencing data.
  • the type of the biological sample that can be detected using the method of the present invention is not particularly limited.
  • the biological sample that can be used for detection is aborted tissue, wherein the villi of the fetal tissue is preferred, and the fresh fluff of the fetal tissue is more preferred. This is because the abortion organization mainly includes the fetal tissue and the mother's uterus tissue, and the object to be tested is a fetus, and the villi in the fetal tissue is a direct source of fetal DNA, and the DNA is intact and of good quality.
  • the fluff of the fetal tissue is The best biological sample of the method of the invention for determining abnormalities in the number of chromosomes in a biological sample is applied.
  • the fresh fluff of the fetal tissue should generally be selected as the biological sample.
  • the method of the present invention can effectively detect abnormalities in the number of chromosomes of aborted fetuses.
  • genomic DNA can be extracted from a biological sample by a conventional DNA extraction method such as a salting out method, a column-column method, and an SDS method, and preferably column chromatography is used.
  • a conventional DNA extraction method such as a salting out method, a column-column method, and an SDS method, and preferably column chromatography is used.
  • the principle of column chromatography is: the cell or tissue through the action of cell lysate and proteinase K to reveal exposed DNA molecules, which pass through a silica gel column that can bind to negatively charged DNA molecules, the genome in the system
  • the DNA is reversibly adsorbed, washed with a rinse solution to remove impurities such as proteins and lipids, and then eluted with a purification solution to obtain genomic DNA in cells or tissues.
  • the random interruption treatment can be carried out by using at least one of enzymatic cleavage, atomization, ultrasound, and HydroShear.
  • the HydroShear method is used.
  • the solution containing DNA passes through a small-area channel, the fluid accelerates, and the generated force causes the DNA to suddenly break.
  • the flow rate and channel size determine the size of the DNA fragment.
  • the company's HydroShear specification interrupts DNA molecules into a relatively large number of fragments of a certain size.
  • the randomly broken main band is distributed in the range of 200 to 300 bp, that is, the length of the preferred DNA fragment is 200 to 300 bp.
  • the type of sequencing device that can be employed is not particularly limited.
  • sequencing is performed by at least one selected from the group consisting of Roche/454 GS Junior, Illumina/MiSeq, and Life Tecnologies/Ion Torrent PGM, taking into account the advantages of instrument portability and high throughput performance.
  • the sequencing type can be single-end (one-way) sequencing or pair-end (two-way) sequencing.
  • the sequencing method is Illumina/MiSeq
  • the sequencing type is bidirectional sequencing
  • the result of the sequencing is a 150 bp fragment.
  • the method for constructing the sequencing library can include: First, the nucleic acid sample to be detected is subjected to fragmentation to obtain a DNA fragment;
  • the DNA fragment is blunted and the base is added at the end, and the linker is ligated to obtain a DNA fragment having the linker;
  • the DNA having the adaptor is amplified to obtain an amplification product, that is, a sequencing library.
  • a tag sequence can be introduced into a sequencing library during the process of constructing a sequencing library
  • the tag sequence that can be used is 4-12 bp in length, thereby not affecting other functions of the DNA molecule to which the tag sequence Index is added.
  • the resulting sequencing data is aligned with a reference genomic sequence of the detected biological species to obtain a unique aligned sequencing data set consisting of multiple unique aligned sequencing data.
  • the human reference genomic sequence used is a reference sequence obtained by masking the repeat sequence of the human genome sequence, for example, the latest in the NCBI database. Version of the Human Genome Reference Sequence.
  • the reference genomic sequence is the human genome reference sequence of version 37 (NCBI Build 37) in the NCBI database.
  • sequence alignment can be performed by any sequence alignment program, such as Short Oligonucleotide Analysis Package (SOAP) and BWA alignment (available by those skilled in the art) At least one of Burrows-Wheeler Aligner is performed to align the sequencing data with a reference genomic sequence to obtain the position of the sequencing data on the reference genome. Sequence alignment can be performed using default parameters provided by the program, or can be selected by those skilled in the art as needed. In a particular embodiment of the invention, the comparison software employed is SOAP aligner/soap2.
  • SOAP Short Oligonucleotide Analysis Package
  • BWA alignment available by those skilled in the art
  • At least one of Burrows-Wheeler Aligner is performed to align the sequencing data with a reference genomic sequence to obtain the position of the sequencing data on the reference genome. Sequence alignment can be performed using default parameters provided by the program, or can be selected by those skilled in the art as needed.
  • the comparison software employed is SOAP aligner/soap2.
  • the term "unique alignment sequencing data” refers to a sequence that has only a unique position on a reference genomic sequence when the sequencing data is aligned with a reference genomic sequence, as Unique reads.
  • Unique reads In an embodiment of the invention, in order to avoid interference from repetitive sequences, it is necessary to remove those DNA sequences that are located in tandem repeats and transposition repeat positions in the human genome reference sequence, and only those DNA sequences that can be mapped to unique positions in the genome are counted. That is, the only alignment of the sequencing data.
  • the unique alignment sequencing data maps the DNA sequences from the disrupted and sequenced DNA molecules from aborted tissues to specific chromosomes.
  • the predetermined chromosome to be detected may be all chromosomes of a biological species, specifically to a human sample such as a fetal abortion sample, and may be all autosomes and sex chromosomes.
  • the predetermined chromosome that can be detected is at least one selected from the group consisting of human chromosomes 21, 13, 18, X and Y, whereby most diseases associated with abnormal chromosome numbers can be detected. .
  • this step after obtaining the calculation ratio for the predetermined chromosome, it is possible to determine whether or not the biological sample has an abnormality in the number of chromosomes for the predetermined chromosome based on the calculation ratio ChrN% of the predetermined chromosome.
  • ChrN% is a value obtained by dividing the number of unique alignment sequencing data obtained on a predetermined chromosome by the number of unique alignment sequencing data included in the unique alignment sequencing data set, that is, normalized. This value is only related to the size of a particular chromosome, and is independent of the amount of sequencing data, so that each of the 46 chromosomes of a biological species such as a human can be analyzed with 01%.
  • chromosome 1 is the largest chromosome in the human genome (about 247M)
  • chromosome 21 is the smallest chromosome in the human genome (about 47M)
  • the sequencing results for normal human samples derived from humans are A certain amount of sequencing is approximately a fixed value.
  • ChrN% is not completely proportional to chromosome size under certain sequencing conditions and experimental conditions, it is basically a fixed value.
  • the calculated ratio ChrN% is a basic value for performing chromosome analysis in the present invention.
  • determining whether the biological sample has an abnormality in the number of chromosomes for the predetermined chromosome based on the calculated ratio ChrN% of the predetermined chromosome further includes:
  • a calculation ratio ChrN% of the predetermined chromosome and a characteristic ratio mean_ChrN of the predetermined chromosome are determined. / ratio, in order to obtain the relative copy rate CR_ChrN of the predetermined chromosome in the biological sample,
  • the relative copy rate CR_ChrN of the predetermined chromosome in the biological sample exceeds the normal copy rate range of the predetermined chromosome, it is determined that the biological sample has an abnormal chromosome number for the predetermined chromosome.
  • the characteristic ratio of the predetermined chromosome is determined by at least 30 normal samples, the normal copy rate range of the predetermined chromosome being calculated for at least 30 normal samples for the predetermined
  • the calculated ratio of the chromosome is determined by the 99% confidence interval of the ChrN% distribution.
  • a specific chromosome number in a biological sample such as an aborted tissue sample is different from a normal sample can be determined by a method of calculating a relative copy rate CR_ChrN, wherein an abnormal value located outside a range of a normal chromosome copy rate is corresponding Biological sample, identified as the difference between the number of chromosomes and the normal sample, that is, dyeing Color body aneuploidy.
  • a relative copy rate of the specific chromosome of the test sample CR_ChrN ChrN% I of the specific chromosome of the test sample, the specific chromosome mean_ChrN%.
  • the relative copy rate CR_ChrN of the specific chromosome of the tested sample is too large or too small, indicating that the number of chromosomes in the sample is deviated from the normal value. When it exceeds a certain range, the number of chromosomes may be considered to be significantly different from the normal sample.
  • the number of chromosomes is abnormal.
  • the normal sample refers to a sample in which no specific chromosomal abnormality exists. In one embodiment of the invention, the normal sample refers to a sample in which a specific chromosome multiple is not abnormal.
  • the ChrN% average value (ie, mean_ChrN%) of the specific chromosome from the normal sample may be from, for example, at least 10, such as at least 20, such as at least 30, such as at least 50, such as at least 100
  • the ChrN% of this chromosome of the normal sample was determined.
  • the specific chromosome copy rate range from a normal sample may be based on ChrN% of the chromosome from, for example, at least 10, for example at least 20, such as at least 30, such as at least 50, such as at least 100 normal samples. The 99% confidence interval for the distribution is determined.
  • CR_ChrN is too large or too small is determined by the following method: The data distribution of the CR value of each chromosome of the normal sample is calculated by the population control sample, and the CR value of the sample to be tested is calculated. The test (U-test double-sided test) is carried out. When it is significantly outlier, it can be judged that CR_ChrN is too large or too small according to the actual situation. Further, it can be determined that the number of stains of the sample to be tested is abnormal.
  • the number of the normal samples is 20 normal males and 10 normal females, which are numbered sequentially in the order of 1, 2...30, wherein 1-20 is a normal male sample, 21 ⁇ 30 is a normal female sample, then the average ChrN% of the normal sample (mean_ChrN) is calculated as follows:
  • Mean_ChrX (female) ⁇ ⁇ ChrX—M (M is a normal sample of women 21 to 30)
  • Mean_ChrY (female) ⁇ ⁇ ChrY—M (M is a normal sample of women 21 to 30)
  • a confidence interval (99% CI , CRL-CRR ) of the normal distribution is calculated based on the significance requirement of the normal distribution (for example, 1%), and is based on Chromosome analysis is performed on the sample to be tested in the case where the value of CR_ChrN differs from the confidence interval, as follows:
  • the sample When the value of CR_ChrN is between C and 0 ⁇ , then the sample has a 99% probability of being included in a normally distributed population, ie, the detected sample has no difference in chromosome number relative to the normal sample. ;
  • CR_ChrN When the value of CR_ChrN is less than CR L , the probability that the sample is greater than 99% is rejected in a normally distributed population, ie, an outlier sample, ie: the number of chromosomes of the sample being tested is relative to the normal sample. There is a deletion; when the value of CR_ChrN is greater than CR R , the probability that the sample is greater than 99% is rejected in a normally distributed population, ie, an outlier sample, ie: the number of chromosomes of the sample being tested is normal relative to normal There is an increase in the sample.
  • the abnormality of the chromosome number of the biological sample can be effectively analyzed.
  • high-throughput sequencing technology can be used to analyze the tissue sample of the abortion, and the detection of the abortion tissue can be used to analyze and diagnose the cause of abortion.
  • the method has high flux, high specificity and high accuracy.
  • the invention proposes a computer readable medium.
  • instructions are stored on the computer readable medium, the instructions being adapted to be executed by a processor to determine a method of abnormality in the number of chromosomes in a biological sample by the following steps:
  • the sequencing data is aligned with the reference genomic sequence of the organism to obtain a unique aligned sequencing data set consisting of multiple unique aligned sequencing data.
  • the reference genomic sequence is a human genome reference sequence of version 37 of the NCBI database.
  • the sequencing data is aligned with the reference genome sequence of the organism using at least one of SOAP and BWA.
  • determining whether the biological sample has an abnormality in the number of chromosomes for the predetermined chromosome based on a calculated ratio ChrN% of the predetermined chromosome further comprises: determining a calculated ratio of the predetermined chromosome by 01%% The characteristic ratio of the predetermined chromosome is mean_ChrN.
  • a ratio to obtain a relative copy rate CR_ChrN of the predetermined chromosome in the biological sample wherein if a relative copy rate CR_ChrN of the predetermined chromosome in the biological sample exceeds a normal copy rate range of the predetermined chromosome, determining The biological sample has an abnormal number of chromosomes for the predetermined chromosome.
  • the characteristic ratio of the predetermined chromosome! ⁇ & ⁇ 0 ⁇ % is determined by at least 30 normal samples.
  • the normal copy rate range of the predetermined chromosome is determined by calculating a 99% confidence interval for a calculated ratio ChrN% distribution of the predetermined chromosome for at least 30 normal samples.
  • the computer readable medium is utilized to determine the location
  • the number of sequencing data on the chromosome can effectively determine whether the biological sample has an abnormal number of chromosomes for the chromosome.
  • the invention proposes a system for determining an abnormal number of chromosomes in a biological sample.
  • the system includes: a sequencing device 100, a comparison device 200, and an analysis device 300.
  • the sequencing device 100 is configured to sequence the genomic DNA of the biological sample to obtain a plurality of sequencing data
  • the comparison device 200 is connected to the sequencing device 100 for using the sequencing data and the
  • the biological reference genomic sequences are aligned to obtain a unique aligned sequencing data set consisting of a plurality of unique aligned sequencing data
  • the analysis device 300 is coupled to the alignment device 200, and used to determine that the biological sample is for a predetermined stain Whether the color body has an abnormal number of chromosomes.
  • the reference genomic sequence is a human genome reference sequence of version 37 in the NCBI database.
  • the sequencing data is aligned with the reference genome sequence of the organism using at least one of SOAP and BWA.
  • the determining module 340 is adapted to calculate a ratio based on the predetermined chromosome by
  • ChrN% determining whether the biological sample has an abnormality in the number of chromosomes for the predetermined chromosome: determining a calculated ratio of the predetermined chromosome 01 ⁇ % and a characteristic ratio mean_ChrN of the predetermined chromosome. a ratio to obtain a relative copy rate CR_ChrN of the predetermined chromosome in the biological sample, wherein if a relative copy rate CR_ChrN of the predetermined chromosome in the biological sample exceeds a normal copy rate range of the predetermined chromosome, determining The biological sample has an abnormal number of chromosomes for the predetermined chromosome.
  • the characteristic ratio of the predetermined chromosome! ⁇ & ⁇ 0 ⁇ % is determined by at least 30 normal samples.
  • the normal copy rate range of the predetermined chromosome is determined by calculating a 99% confidence interval for a calculated ratio ChrN% distribution of the predetermined chromosome for at least 30 normal samples.
  • the system is used to determine the location on a chromosome.
  • the number of sequencing data can be effectively determined whether the biological sample has an abnormal number of chromosomes for the chromosome.
  • the invention further proposes a system for determining an abnormal number of chromosomes in a biological sample.
  • the system comprises: a sequencing device for sequencing genomic DNA of the biological sample to obtain a plurality of sequencing data; and the computer readable medium described above.
  • the total number of sequencing data located on a chromosome is proportional to the length of the chromosome and the amount of the chromosome in the biological sample, the system is used to determine the location on a chromosome. The number of sequencing data can be effectively determined whether the biological sample has an abnormal number of chromosomes for the chromosome.
  • the DNA of the above 40 aborted tissue samples (hereinafter referred to as Table 1) was extracted according to the operation procedure of Tiangen DP327-02 Kit.
  • the extracted DNA was constructed according to the modified Illumina/Solexa standard database construction process, and the extracted DNA was randomly selected.
  • the DNA fragment of the size range of 350 bp to 500 bp was selected, and the linker used for sequencing was added at both ends, and each sample was added with a different tag sequence, and then hybridized with a complementary junction of the flowcell surface.
  • a single-stranded primer is attached to the surface of the flowcell, and the DNA fragment becomes a single strand and is "fixed” on the chip by complementary to the primer base on the surface of the chip; the other end (5, or 3, ) is random and nearby One primer complements and is also "fixed, lived, formed” bridge, repeated 30 rounds of amplification, and each single molecule is amplified 1000-fold into a monoclonal DNA cluster. Then, by double-end sequencing on Illumina MiSeq, a DNA fragment sequence of 150 bp in length was obtained.
  • DNA obtained from the above aborted tissue samples was used to construct a modified Illumina/Solexa standard procedure, the specific procedure referring to the prior art (see http: ⁇ www.mumina.com/ provided by Illumina/ Solexa standard library specification).
  • the DNA library size and insert were determined to be about 250 bp by the 2100 Bioanalyzer (Agilent), and the QPCR was accurately quantified and sequenced.
  • Sequencing In this example, the DNA samples obtained from the above 40 abortion tissues were operated according to the Illumina/Solexa officially published Cluster Station and MiSeq (PE sequencing) instructions, so that each sample obtained about 100k data amount for the machine. Sequencing, each sample is differentiated according to the tag sequence. Using the alignment software SOAP2, the sequence of the sequenced DNA was compared with the human genome reference sequence of version 37 (hgl9; NCBI Build37) in the NCBI database, and the sequence of the sequenced DNA sequence on the genome was obtained.
  • PE sequencing Cluster Station and MiSeq
  • Chromosomes were calculated using standard control samples of the same sex. Also calculate a 99% confidence interval for each chromosome.
  • Relative copy number calculation Calculate the relative copy rate of each chromosome of the sample to be tested
  • Threshold and filtering Filter the calculated copy rate.
  • the upper limit of the confidence interval is the chromosome increase, and the lower limit of the confidence interval is the chromosome deletion.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

提供了用于确定生物样本中染色体数目异常的方法、计算机可读介质和系统。其中,用于确定生物样本中染色体数目异常的方法包括:针对该生物样本的基因组DNA进行测序,以便获得多个测序数据;将该测序数据与该生物的参照基因组序列进行比对,以便获得由多个唯一比对测序数据构成的唯一比对测序数据集;确定该唯一比对测序数据集中所包含的唯一比对测序数据的数目M;确定该唯一比对测序数据集中来源于预定染色体的唯一比对测序数据的数目N;基于公式ChrN%=N/M,确定该预定染色体的计算比率ChrN%;以及基于该预定染色体的计算比率ChrN%,确定该生物样本针对该预定染色体是否存在染色体数目异常。

Description

确定生物样本中染色体数目异常的方法、 系统和计算机可读介盾 优先权信息
无 技术领域
本发明涉及生物医学领域, 具体的, 涉及遗传变异检验领域, 更具体的, 本发明涉 及确定生物样本中染色体数目异常的方法、 系统和计算机可读介质。 背景技术
自然流产是临床妊娠最常见的并发症之一, 发生率约占 10%-20%。 其病因大致可 分为胚胎因素、 母体因素和环境因素。 其中胚胎的遗传物质异常为主要原因, 有报道称 早期流产胚胎中染色体数目异常占到了 50%-60%, 检测流产胎儿的染色体情况, 了解 自然流产原因, 对下一胎妊娠具有指导意义。
目前常用于诊断的方法有染色体核型分析、 FISH (荧光原位杂交) 、 CGH (比较 基因组杂交) 、 MLPA (多重连接探针扩增技术) 、 STR-PCR (短串联重复序列结合聚 合酶链反应技术)等。 目前, 染色体核型分析仍然是染色体疾病检测的 "金标准" , 可 以检出绝大部分的染色体数目异常, 但是流产的组织样本, 受标本陈旧、 易污染、 培养 过程中容易受母源性细胞的污染、 诊断周期较长、 染色体形态较差等因素的影响, 往往 导致细胞培养失败或漏诊、 误诊。 而近来应用于临床的 FISH诊断技术, 应用染色体探 针, 对未培养的绒毛组织进行原位杂交, 诊断染色体数目异常, 快速准确, 但目前国内 针对流产样本进行病因寻找时, 应用 FISH探针大部分仅涉及染色体 13、 18、 21、 X和 Y, 并没有同时对全部染色体进行检测。
因而, 目前的流产胎儿染色体异常检测仍有待改进。 发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
在本发明的第一方面, 本发明提出了一种能够有效确定生物样本中染色体数目异常 的方法。 根据本发明的实施例, 该方法包括: 针对所述生物样本的基因组 DNA进行测序, 以便获得多个测序数据; 将所述测序数据与所述生物的参照基因组序列进行比对, 以便获 得由多个唯一比对测序数据构成的唯一比对测序数据集; 确定所述唯一比对测序数据集中 所包含的唯一比对测序数据的数目 M; 确定所述唯一比对测序数据集中来源于预定染色体 的唯一比对测序数据的数目 N; 基于公式 ChrN%=N/M, 确定所述预定染色体的计算比率 ChrN%; 以及基于所述预定染色体的计算比率 ChrN%, 确定所述生物样本针对所述预定染 色体是否存在染色体数目异常。 由于理论上, 定位到某条染色体上的测序数据的总数与该 染色体的长度以及染色体在生物样本中的含量成比例, 因而, 利用根据本发明实施例的方 法, 通过确定定位到某条染色体上的测序数据的数目, 可以有效地确定该生物样本针对该 染色体是否存在染色体数目异常。
在本发明的第二方面, 本发明提出了一种计算机可读介质。 根据本发明的实施例, 该计 算机可读介质上存储有指令, 所述指令适于被处理器执行以便通过下列步骤确定生物样本 中染色体数目异常的方法: 获取所述生物样本的基因组 DNA的多个测序数据;将所述测序 数据与所述生物的参照基因组序列进行比对, 以便获得由多个唯一比对测序数据构成的唯 一比对测序数据集; 确定所述唯一比对测序数据集中所包含的唯一比对测序数据的数目 M; 确定所述唯一比对测序数据集中来源于预定染色体的唯一比对测序数据的数目 N; 基于公 式 ChrN%=N/M, 确定所述预定染色体的计算比率 ChrN%; 以及基于所述预定染色体的计 算比率 ChrN%, 确定所述生物样本针对所述预定染色体是否存在染色体数目异常。 如前所 述, 由于理论上, 定位到某条染色体上的测序数据的总数与该染色体的长度以及染色体在 生物样本中的含量成比例, 因而, 利用该计算机可读介质, 通过确定定位到某条染色体上 的测序数据的数目, 可以有效地确定该生物样本针对该染色体是否存在染色体数目异常。
在本发明的第三方面, 本发明提出了一种用于确定生物样本中染色体数目异常的系 统。 才艮据本发明的实施例, 该系统包括: 测序装置, 所述测序装置用于针对所述生物样本 的基因组 DNA进行测序, 以便获得多个测序数据; 比对装置, 所述比对装置与所述测序装 置相连, 用于将所述测序数据与所述生物的参照基因组序列进行比对, 以便获得由多个唯 一比对测序数据构成的唯一比对测序数据集; 分析装置, 所述分析装置与所述比对装置相 连, 并且用于确定所述生物样本针对预定染色体是否存在染色体数目异常, 其中, 所述分 析装置进一步包括: 第一计算模块, 所述第一计算模块用于确定所述唯一比对测序数据集 中所包含的唯一比对测序数据的数目 M; 第二计算模块, 所述第二计算模块用于确定所述 唯一比对测序数据集中来源于预定染色体的唯一比对测序数据的数目 N; 第三计算模块, 所述第三计算模块用于基于公式 ChrN%=N/M, 确定所述预定染色体的计算比率 ChrN%; 以及判断模块, 所述判断模块用于基于所述预定染色体的计算比率 ChrN%, 确定所述生物 样本针对所述预定染色体是否存在染色体数目异常。 如前所述, 由于理论上, 定位到某条 染色体上的测序数据的总数与该染色体的长度以及染色体在生物样本中的含量成比例, 因 而, 利用该系统, 通过确定定位到某条染色体上的测序数据的数目, 可以有效地确定该生 物样本针对该染色体是否存在染色体数目异常。
在本发明的第四方面, 本发明提出了用于确定生物样本中染色体数目异常的系统。 根据本发明的实施例, 该系统包括: 测序装置, 所述测序装置用于针对所述生物样本的 基因组 DNA进行测序, 以便获得多个测序数据; 以及前面所述的计算机可读介质。 如 前所述, 由于理论上, 定位到某条染色体上的测序数据的总数与该染色体的长度以及染色 体在生物样本中的含量成比例, 因而, 利用该系统, 通过确定定位到某条染色体上的测序 数据的数目, 可以有效地确定该生物样本针对该染色体是否具有染色体数目异常。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得 明显, 或通过本发明的实践了解到。 附图说明
本发明的上述和 /或附加的方面和优点从结合下面附图对实施例的描述中将变得明 显和容易理解, 其中:
图 1显示了用于确定生物样本中染色体数目异常的方法的流程示意图; 以及 图 2显示了用于确定生物样本中染色体数目异常的系统的结构示意图。 发明详细描述
下面详细描述本发明的实施例, 所述实施例的示例在附图中示出, 其中自始至终相 同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附 图描述的实施例是示例性的, 仅用于解释本发明, 而不能理解为对本发明的限制。
需要说明的是, 术语 "第一,, 、 "第二,, 仅用于描述目的, 而不能理解为指示或暗 示相对重要性或者隐含指明所指示的技术特征的数量。 由此, 限定有 "第一"、 "第二" 的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地,在本发明的描述中, 除非另有说明, "多个,, 的含义是两个或两个以上。
用于确定生物样本中染色体数目异常的方法
在本发明的第一方面, 本发明提出了一种用于确定生物样本中染色体数目异常的方法。 参考图 1 , 该方法包括:
S100: 基因组 DNA测序
在该步骤中, 首先针对需要进行检测的生物样本的基因组 DNA进行测序, 以便获得多 个测序数据。 根据本发明的实施例, 可以利用本发明的方法进行检测的生物样本的类型并 不受特别限制。 根据本发明的实施例, 可以用于检测的生物样本为流产组织, 其中, 优选 胎儿组织的绒毛, 更优选胎儿组织的新鲜绒毛。 这是因为, 流产组织主要包括胎儿组织和 母体的清宫组织, 而待检测对象为胎儿, 且胎儿组织中的绒毛是胎儿 DNA直接来源, 其 DNA完整、 质量较好, 因此, 胎儿组织的绒毛为应用本发明的用于确定生物样本中染色体 数目异常的方法的最佳生物样本。 此外, 因稽留流产的胎儿组织的 DNA质量较差, 且有母 源污染, 一般应选取胎儿组织的新鲜绒毛作为生物样本。 进而, 利用本发明的方法能够有 效地检测流产胎儿的染色体数目异常。
根据本发明的实施例, 进一步包括从生物样本提取基因组 DNA的步骤。 根据本发明的 实施例, 可以釆用盐析法、 过柱法和 SDS法等常规 DNA提取方法从生物样本提取基因组 DNA, 优选釆用柱层析法。 其中, 柱层析法的原理为: 细胞或组织经过细胞裂解液和蛋白 酶 K的作用后露出棵露的 DNA分子, 其经过能与带负电的 DNA分子结合的硅胶膜柱时, 体系中的基因组 DNA被可逆吸附, 经漂洗液清洗除去蛋白质、 脂质等杂质后, 用纯化液洗 脱获得细胞或组织中的基因组 DNA (具体原理和方法参考 Qiagen公司货号为 56304的产 品说明书和 Tiangen公司货号为 DP316的产品说明书)。
根据本发明的实施例,为了对所获得的基因组 DNA进行测序,可以对其进行随机打断。 才艮据本发明的实施例, 随机打断处理可以通过釆用酶切、 雾化、 超声和 HydroShear法的至 少之一进行。 优选地, 釆用 HydroShear法(当含有 DNA的溶液通过较小面积的通道时, 流体加速, 产生的力使 DNA突然断裂, 流速和通道大小决定 DNA片段的大小, 具体原理 和方法参见 Life Sciences Wiki公司的 HydroShear说明书), 将 DNA分子打断为比较集中的 一定大小的片段。 根据本发明的实施例, 经过随机打断的主带分布在 200 ~ 300bp范围内, 即优选 DNA片段的长度为 200~300bp。
根据本发明的实施例, 可以釆用的测序装置的类型并不受特别限制。 根据本发明的具 体实施例,考虑到仪器便携性的优势以及高通量性能,测序是通过选自 Roche/454 GS Junior, Illumina/MiSeq以及 Life Tecnologies/Ion Torrent PGM的至少之一进行的。 由此, 能够利用 这些测序装置的高通量、 深度测序的特点, 进一步提高确定染色体数目异常的效率。 测序 类型可以为 single-end (单向)测序或者 Pair-end (双向)测序。 在本发明的一个实施方案 中, 所述的测序方法为 Illumina/MiSeq, 测序类型为双向测序, 测序得到的结果为 150bp大 小的片段(reads )。 由此, 可以进一步提高后续分析的效率。
本领域技术人员可以根据所釆用的测序平台来选择适当的测序文库构建方法, 筒言之, 构建测序文库的方法可以包括: 首先, 将待检测的核酸样本进行片段后, 以便得到 DNA片段;
在得到 DNA片段之后, 对 DNA片段进行平端化处理和末端添加碱基 Α, 并连接接头, 以便得到具有接头的 DNA片段; 以及
对具有接头的 DNA进行扩增, 得到扩增产物即测序文库。
根据本发明的实施例, 可以在构建测序文库的过程中, 在测序文库中引入标签序列
Index, 例如可以在接头中引入 Index, 或者在扩增过程中引入标签序列 Index。 由此, 可以 通过针对不同的样本釆用不同的标签序列, 从而实现同时对多个检测样本进行测序。 根据 本发明的实施例, 可以釆用的标签序列长度为 4-12bp, 由此不会影响添加标签序列 Index 的 DNA分子的其他功能。
S200: 获得唯一比对测序数据集
在该步骤中, 将所得到的测序数据与所检测生物物种的参照基因组序列进行比对, 以便 获得由多个唯一比对测序数据构成的唯一比对测序数据集。
根据本发明的实施例, 本发明中, 在针对流产胎儿样品进行检测时, 所釆用的人类的参 照基因组序列是人类基因组序列经过屏蔽掉重复序列后所得到的参考序列,例如 NCBI数据 库中最新版本的人类基因组参考序列。 在本发明的具体实施例中, 参照基因组序列是 NCBI 数据库中版本 37 ( NCBI Build 37 ) 的人类基因组参考序列。
根据本发明的实施例, 可以通过任何一种序列比对程序进行序列比对, 例如本领域技术 人员可获得的短寡核苷酸分析包( Short Oligo nucleotide Analysis Package, SOAP )和 BWA 比对( Burrows- Wheeler Aligner )的至少之一进行, 将测序数据与参考基因组序列进行比对, 得到测序数据在参考基因组上的位置。 进行序列比对可以使用程序提供的默认参数进行, 或者由本领域技术人员根据需要对参数进行选择。 在本发明的具体实施例中, 所釆用的比 对软件是 SOAP aligner/soap2。
在本文中所使用的术语 "唯一比对测序数据"是指在将测序数据与参照基因组序列进行 比对时, 在参考基因组序列上仅有唯一位置的序列, 以 Unique reads表示。 在本发明的实施 例中, 为了避免重复序列的干扰, 需要去除那些定位于人类基因组参考序列中的串联重复 及转座重复位置的 DNA序列, 只统计那些可以定位到基因组唯一位置的 DNA序列, 即唯 一比对测序数据。唯一比对测序数据能够将来自流产组织的 DNA分子经打断并测序后的各 DNA序列定位于特定染色体。
S300: 确定预定染色体的计算比率 ChrN%
在获取唯一比对测序数据集之后, 可以计算定位于各染色体的唯一比对测序数据, 并 计算其与唯一比对测序数据集的计算比例 ChrN%。 具体地, 根据本发明的实施例, 该步骤进一步包括: 首先, 确定唯一比对测序数据集 中所包含的唯一比对测序数据的数目 M; 接下来, 确定唯一比对测序数据集中来源于预定 染色体的唯一比对测序数据的数目 N; 以及基于公式 ChrN%=N/M, 确定该预定染色体的计 算比率 ChrN%
根据本发明的实施例, 所检测的预定染色体可以为生物物种的所有染色体, 具体到人 类样品例如胎儿流产样品, 可以为所有常染色体和性染色体。 例如, 才艮据本发明的实施例, 可以检测的预定染色体为选自人 21、 13、 18号、 X和 Y染色体的至少之一, 由此, 可以检 测大多数与染色体数目异常相关的疾病。
S400: 判断是否存在染色体数目异常
在该步骤中, 在针对预定染色体获得其计算比率之后, 可以基于该预定染色体的计算 比率 ChrN%, 确定生物样本针对该预定染色体是否存在染色体数目异常。
根据本发明的实施例, ChrN%是将预定染色体上得到的唯一比对测序数据的数目除以 唯一比对测序数据集中所包含的唯一比对测序数据的数目即标准化后得到的数值, 因而, 该数值只与特定染色体的大小有关, 而与测序数据的量无关, 从而可以用 01^%对生物物 种例如人的 46条染色体各自的情况进行分析。 举例来说, 1号染色体是人类基因组中最大 的染色体(约 247M ), 而 21号染色体是人类基因组中最小的染色体(约 47M ), 因此对于 来源于人的正常生物样本所得到的测序结果在一定的测序总量下近似是一个定值。 尽管在 一定的测序条件和实验条件下, ChrN%并不完全与染色体大小成正比, 但基本上是定值。 由此, 计算比率 ChrN%是本发明中进行染色体分析的基础数值。
具体地, 根据本发明的实施例, 基于预定染色体的计算比率 ChrN%, 确定生物样本针 对该预定染色体是否存在染色体数目异常进一步包括:
确定该预定染色体的计算比率 ChrN%与该预定染色体的特征比率 mean_ChrN。/ 比值, 以便获得生物样本中该预定染色体的相对拷贝率 CR_ChrN,
其中, 如果该生物样本中预定染色体的相对拷贝率 CR_ChrN超出该预定染色体的正常 拷贝率范围, 则确定该生物样本针对该预定染色体存在染色体数目异常。
根据本发明的具体实施例, 该预定染色体的特征比率 1^&^01^%是由至少 30个正常 样本确定的, 该预定染色体的正常拷贝率范围是通过计算至少 30个正常样本针对该预定染 色体的计算比率 ChrN%分布的 99%置信区间而确定的。
由此, 根据本发明的实施例, 生物样本例如流产组织样本中特定染色体数量与正常样 本是否存在差异可以通过计算相对拷贝率 CR_ChrN的方法确定, 其中将位于超出正常染色 体拷贝率范围的异常值对应的生物样本, 认定为其染色体数量与正常样本存在差异, 即染 色体非整倍性。 具体地, 受检样本特定染色体的相对拷贝率 CR_ChrN = 受检样本特定染色 体的 ChrN% I特定染色体 mean_ChrN%。
其中, 受检样本特定染色体的相对拷贝率 CR_ChrN偏大或偏小, 说明该受检样本中染 色体数量偏离正常值, 当超出一定范围时, 可认为其染色体数量与正常样本存在明显差异, 即存在染色体数目异常。 在本发明中, 所述正常样本是指不存在特定染色体异常的样本。 在本发明的一个实施例中, 所述正常样本是指特定染色体倍数不存在异常的样本。 在本发 明中, 所述来自正常样本的特定染色体的 ChrN%平均值 (即 mean_ChrN% )可根据来自例 如至少 10个, 例如至少 20个, 例如至少 30个, 例如至少 50个, 例如至少 100个正常样 本的该染色体的 ChrN%确定。 本发明中, 所述来自正常样本的特定染色体拷贝率范围可根 据来自例如至少 10个, 例如至少 20个, 例如至少 30个, 例如至少 50个, 例如至少 100 个正常样本的该染色体的 ChrN%分布的 99%置信区间确定。 此外, 需要说明的是, 在本发 明中是通过下列方法判断 CR_ChrN是否偏大或偏小的: 以群体对照样本计算得到正常样本 每条染色体的 CR值的数据分布, 并对待测样本的 CR值进行检验 ( U-test双侧检验), 当其 显著离群时, 可以根据实际情况判定 CR_ChrN偏大或偏小。 进而, 可以判定该待测样本染 色体数目异常。
在本发明的一个实施例中,所述正常样本的个数为 20个正常男性和 10个正常女性, 按 顺序编号为 1、 2...30 , 其中 1 ~ 20为男性正常样本, 21 ~ 30为女性正常样本, 则正常样本 的 ChrN%平均值 ( mean_ChrN )计算如下:
1 30
Mean C rN=— Y ChrN M (其中 N为 1号~ 22号常染色体,M为 1 ~ 30号正常样本)) _ 30 i _
Mean_ChrX(男性) =— ^ ChrX_M ( M为 1 ~ 20号男性正常样本 )
20 m=i
Mean_ChrY (男性) = 一 ^ ChrY_M ( M为 1 ~ 20号男性正常样本 )
20 m=i
Mean_ChrX(女性) = ― ^ ChrX—M ( M为 21 ~ 30号女性正常样本 )
10
Mean_ChrY (女性) = ― ^ ChrY—M ( M为 21 ~ 30号女性正常样本 )
10
其中, 需要说明的是, 由于测序的波动性以及参考基因组序列的 Y染色体存在大量的缺口, 导致即使是正常的女性样本也会有少数 DNA序列比对到 Y染色体上,但与男性相比,女性 的 ChY°/ b男性要小很多,如实施例中女性的 01丫%为 0.004左右,而男性的 01丫%为 0.114 左右。
进一步, 能够获得每一个受检样本的 CR_ChrN , 其中, 计算公式分别为: CR C r = chrN/ l Τ
- / mean_ nrN
CR ChrX(男性) = C vX/
- 、 / mean_ChrX Male )
CR ChrY (男性) = ChrY/
- / mean_ ChrY ( Male )
CR_ChrX (女!■生) ( Female )
Figure imgf000009_0001
CR_ChrY (女!■生) tean— ChrY (Female) 由于男性比女性的染色体中缺少一条染色体 X, 取而代之的是染色体 Y, 而 X染色体 全长约 155M, 而染色体 Y仅为 59M, 因此在对性染色体进行检测时必须建立一套不同性 别的 ChrX%或 ChrY %正态分布样本集合,才能根据不同的性别正态分布数据对性染色体的 情况得出最准确的分析结果。
在本发明的一个实施例中, 取 30例正常样本进行染色体分析, 根据正态分布的显著 性要求(例如 1% )计算正态分布的置信区间 (99% CI , CRL-CRR ), 并基于 CR_ChrN的值 与置信区间不同关系的情形对待检样本进行染色体分析 , 具体如下:
当 CR_ChrN的值位于 C 与 0^之间时, 则该样本有 99%的可能性被包含于一个正 态分布的群体中, 即所检测的样本其染色体数量相对于正常样本而言不存在差异;
当 CR_ChrN的值小于 CRL时, 则该样本大于 99%的可能性被拒绝在一个正态分布的 群体中, 即为离群样本, 即: 所检测的样本其染色体数量相对于正常样本而言存在缺失; 当 CR_ChrN的值大于 CRR时, 则该样本大于 99%的可能性被拒绝在一个正态分布的 群体中, 即为离群样本, 即: 所检测的样本其染色体数量相对于正常样本而言存在增加。
至此, 通过本发明的实施例, 可以有效地对生物样本的染色体数目异常进行分析, 例 如可以利用高通量测序技术分析流产的组织样本, 通过流产组织遗产变异的检测来分析、 诊断流产原因的方法。 该方法通量高、 特异性高、 准确率高。 计算机可读介质
在本发明的第二方面, 本发明提出了一种计算机可读介质。 根据本发明的实施例, 该计 算机可读介质上存储有指令, 所述指令适于被处理器执行以便通过下列步骤确定生物样本 中染色体数目异常的方法:
首先, 获取所述生物样本的基因组 DNA的多个测序数据。 接下来, 将所述测序数据与所述生物的参照基因组序列进行比对, 以便获得由多个唯一 比对测序数据构成的唯一比对测序数据集。 根据本发明的实施例, 所述参照基因组序列为 NCBI数据库中版本 37的人类基因组参考序列。 根据本发明的具体实施例, 釆用 SOAP和 BWA的至少之一, 将所述测序数据与所述生物的参照基因组序列进行比对。
接着,确定所述唯一比对测序数据集中所包含的唯一比对测序数据的数目 M,确定所述 唯一比对测序数据集中来源于预定染色体的唯一比对测序数据的数目 N , 基于公式 ChrN%=N/M, 确定所述预定染色体的计算比率 ChrN%。
最后, 基于所述预定染色体的计算比率 ChrN%, 确定所述生物样本针对所述预定染色 体是否存在染色体数目异常。 根据本发明的实施例, 基于所述预定染色体的计算比率 ChrN%, 确定所述生物样本针对所述预定染色体是否存在染色体数目异常进一步包括: 确 定所述预定染色体的计算比率 01^%与所述预定染色体的特征比率 mean_ChrN。/ 比值, 以便获得所述生物样本中所述预定染色体的相对拷贝率 CR_ChrN, 其中, 如果所述生物样 本中所述预定染色体的相对拷贝率 CR_ChrN超出所述预定染色体的正常拷贝率范围, 则确 定所述生物样本针对所述预定染色体存在染色体数目异常。
根据本发明的实施例, 所述预定染色体的特征比率!^&^0^%是由至少 30个正常样 本确定的。 根据本发明的实施例, 所述预定染色体的正常拷贝率范围是通过计算至少 30个 正常样本针对所述预定染色体的计算比率 ChrN%分布的 99%置信区间而确定的。
如前所述, 由于理论上, 定位到某条染色体上的测序数据的总数与该染色体的长度以及 染色体在生物样本中的含量成比例, 因而, 利用该计算机可读介质, 通过确定定位到某条 染色体上的测序数据的数目, 可以有效地确定该生物样本针对该染色体是否具有染色体数 目异常。
需要说明的是, 前面针对确定生物样本中染色体数目异常的方法所进行的描述, 也适用 于该计算机可读介质, 在此不再赘述。 确定生物样本中染色体数目异常的系统
在本发明的第三方面, 本发明提出了一种用于确定生物样本中染色体数目异常的系 统。 才艮据本发明的实施例, 参照图 2, 该系统包括: 测序装置 100、 比对装置 200和分析装 置 300。 根据本发明的实施例, 测序装置 100用于针对所述生物样本的基因组 DNA进行测 序, 以便获得多个测序数据, 比对装置 200与测序装置 100相连, 用于将所述测序数据与 所述生物的参照基因组序列进行比对, 以便获得由多个唯一比对测序数据构成的唯一比对 测序数据集, 分析装置 300与比对装置 200相连, 并且用于确定所述生物样本针对预定染 色体是否存在染色体数目异常。根据本发明的实施例,所述参照基因组序列为 NCBI数据库 中版本 37的人类基因组参考序列。 根据本发明的具体实施例, 釆用 SOAP和 BWA的至少 之一, 将所述测序数据与所述生物的参照基因组序列进行比对。
根据本发明的实施例, 分析装置 300进一步包括: 第一计算模块 310, 用于确定所述唯 一比对测序数据集中所包含的唯一比对测序数据的数目 M; 第二计算模块 320用于确定所 述唯一比对测序数据集中来源于预定染色体的唯一比对测序数据的数目 N; 第三计算模块 330用于基于公式 ChrN%=N/M,确定所述预定染色体的特计算比率 ChrN%; 以及判断模块 340用于基于所述预定染色体的计算比率 ChrN%, 确定所述生物样本针对所述预定染色体 是否存在染色体数目异常。
根据本发明的实施例, 判断模块 340 适于通过下列, 基于所述预定染色体的计算比率
ChrN%, 确定所述生物样本针对所述预定染色体是否存在染色体数目异常: 确定所述预定 染色体的计算比率 01^%与所述预定染色体的特征比率 mean_ChrN。/ 比值, 以便获得所 述生物样本中所述预定染色体的相对拷贝率 CR_ChrN, 其中, 如果所述生物样本中所述预 定染色体的相对拷贝率 CR_ChrN超出所述预定染色体的正常拷贝率范围, 则确定所述生物 样本针对所述预定染色体存在染色体数目异常。
根据本发明的实施例, 所述预定染色体的特征比率!^&^0^%是由至少 30个正常样 本确定的。 根据本发明的实施例, 所述预定染色体的正常拷贝率范围是通过计算至少 30个 正常样本针对所述预定染色体的计算比率 ChrN%分布的 99%置信区间而确定的。
如前所述, 由于理论上, 定位到某条染色体上的测序数据的总数与该染色体的长度以 及染色体在生物样本中的含量成比例, 因而, 利用该系统, 通过确定定位到某条染色体上 的测序数据的数目, 可以有效地确定该生物样本针对该染色体是否具有染色体数目异常。
需要说明的是, 前面所述的比对装置和分析装置的功能可以由前面所述的计算机可读 介质来执行。 由此, 在本发明的第四方面, 本发明又提出了一种用于确定生物样本中染 色体数目异常的系统。 根据本发明的实施例, 该系统包括: 测序装置, 所述测序装置用 于针对所述生物样本的基因组 DNA进行测序, 以便获得多个测序数据; 以及前面所述 的计算机可读介质。 如前所述, 由于理论上, 定位到某条染色体上的测序数据的总数与该 染色体的长度以及染色体在生物样本中的含量成比例, 因而, 利用该系统, 通过确定定位 到某条染色体上的测序数据的数目, 可以有效地确定该生物样本针对该染色体是否具有染 色体数目异常。
需要说明的是, 前面针对用于确定生物样本中染色体数目异常的方法所进行的描述, 也适用于该确定生物样本中染色体数目异常的系统, 在此不再赘述。 下面将结合实施例对本发明的方案进行解释。 本领域技术人员将会理解, 下面的实施 例仅用于说明本发明, 而不应视为限定本发明的范围。 实施例中未注明具体技术或条件的, 按照本领域内的文献所描述的技术或条件(例如参考 J.萨姆布鲁克等著, 黄培堂等译的《分 子克隆实验指南》, 第三版, 科学出版社)或者按照产品说明书进行。 实施例中未注明具体 条件者, 按照常规条件或制造商建议的条件进行。 所用试剂或仪器未注明生产厂商者, 均 为可以通过市场获得的常规产品。 以下括号内为各个试剂或试剂盒的厂家货号。 所使用的 测序用的接头和标签序列来源于 Illumina公司的 Multiplexing Sample Preparation Oligonutide Kit0
实施例 1、 对 40例流产胎儿组织进行染色体非整倍性变异检测
1. DNA提取:
按照 TiangenDP327-02Kit操作流程提取上述 40例流产组织样品 (以下筒称, 如表 1 ) 的 DNA,所提取 DNA按照修改后的 Illumina/Solexa标准建库流程进行建库,将提取的 DNA 进行随机打断, 选取 350bp-500bp大小范围的 DNA片段, 并且在其两端被加上测序所用接 头, 每个样本被加上不同的标签序列, 然后与 flowcell表面互补接头杂交。 通过 flowcell表 面连接有一层单链引物, DNA片段变成单链后通过与芯片表面的引物碱基互补被一端 "固 定,, 在芯片上; 另外一端(5, 或 3, )随机和附近的另外一个引物互补, 也被 "固定,, 住, 形成 "桥(bridge) " , 反复 30轮扩增, 每个单分子得到了 1000倍扩增, 成为单克隆 DNA 簇。 然后在 Illumina MiSeq上通过双末端测序, 得到长度为 150bp的 DNA片段序列。
具体而言,将获自上述流产组织样品的约 100ng的 DNA,进行修改后的 Illumina/Solexa 标准流程建库 ,具体流程参照现有技术(参见 http:〃 www.mumina.com/提供的 Illumina/Solexa 标准建库说明书)。 经 2100Bioanalyzer (Agilent)确定 DNA文库大小及插入片段为约 250bp, QPCR精确定量后可上机测序。
2. 测序: 本实施例中, 对于获自上述 40例流产组织 DNA样本按照 Illumina/Solexa官 方公布的 Cluster Station和 MiSeq( PE sequencing )说明书进行操作 ,使每个样品得到约 100k 数据量进行上机测序, 每个样本根据所述标签序列区分。 利用比对软件 SOAP2, 将测序所 得 DNA序列与 NCBI数据库中版本 37 ( hgl9; NCBI Build37 )的人类基因组参考序列进行 不容错比对, 得到所测序 DNA序列在所述基因组上的定位。
3. 数据分析
a )基本统计: 统计每条染色体所落的唯一比对序列个数(即唯一比对的 reads数) 占基 因组序列个数的百分比, 记为 Chr_N%, N代表染色体编号。
b ) 对照集合计算: 计算对照数据集各条染色体的平均 Chr_N% , 即 0/rN_ , 下边 j代表对照样本编号, N代表染色体编号。 其中, 对于性
Figure imgf000013_0001
染色体分别用相同性别的标准对照样品进行计算。 同时计算每条染色体 99%的置信区间。
c ) 相对拷贝 数计算: 计算待测样本各条染 色体的相对拷贝 率 ,
Figure imgf000013_0002
d ) 阈值与过滤: 对计算得到的拷贝率进行过滤。 大于置信区间上限为染色体增加, 低 于置信区间下限为染色体缺失。
4. 结果统计
对于 40个样品, 详细的检测结果和验证结果如下表 1所示。 其中验证结果通过比较基 因组杂交( Comparative Genomic Hybridization, CGH )芯片得出。 实-险使用 Human Genome CGH Microarray Kit, ( Agilent Technologies Inc. ), 完全按照厂商的使用说明进行操作。 对 CGH芯片结果再利用荧光原位杂交技术设计相应的探针 (Fluorescence In Situ Hybridization, FISH), 本实验使用北京金普嘉生产的 FISHHER2试剂盒。
表 1. 40个样本的非整倍性检测结果
样本编号 测序结果 CGH结果 FISH结果
A350 2号三体 2号重复 2号三体
A749 3号三体 3号重复 3号三体
A221 3号三体 3号重复 3号三体
A1599 3号三体 3号重复 3号三体
A719 4号三体 4号重复 4号三体
A230 4号三体 4号重复 4号三体
A443 5号三体 5号重复 5号三体
A1773 5号三体 5号重复 5号三体
A1862 6号三体 6号重复 6号三体
A1554 6号三体 6号重复 6号三体
A520 7号三体 7号重复 7号三体
A1757 7号三体 7号重复 7号三体
A594 8号三体 8号重复 8号三体
A1858 8号三体 8号重复 8号三体
A1925 9号三体 9号重复 9号三体
A1932 10号 L体 10号重复 10号 L体
A385 10号 L体 10号重复 10号 L体
A570 11号 J二体 11号重复 11号 J二体
A382 12号 L体 12号重复 12号 L体
A422 12号 L体 12号重复 12号 L体
A352 13号 L体 13号重复 13号 L体 A2064 14号三体 14号重复 14号三体
A707 14号三体 14号重复 14号三体
A236 14号三体 14号重复 14号三体
A718 15号三体 15号重复 15号三体
A1942 16号三体 16号重复 16号三体
A233 16号三体 16号重复 16号三体
A751 17号三体 17号重复 17号三体
A240 17号三体 17号重复 17号三体
A1838 18号三体 18号重复 18号三体
A717 18号三体 18号重复 18号三体
A1682 20号三体 20号重复 20号三体
A225 21号三体 21号重复 21号三体
A237 21号三体 21号重复 21号三体
A254 22号三体 22号重复 22号三体
A242 22号三体 22号重复 22号三体
A2045 X单体 性染色体缺失 X单体
A2043 X单体 性染色体缺失 X单体
A1941 21号单体 21号缺失 21号单体
A1764 21号单体 21号缺失 21号单体
由此, 利用本发明的方法, 可以有效地确定生物样本即流产组织中的染色体数目异常。 工业实用性
本发明的技术方法, 可以有效地确定生物样本即流产组织中的染色体数目异常。 尽管本发明的具体实施方式已经得到详细的描述, 本领域技术人员将会理解。 根据已 经公开的所有教导, 可以对那些细节进行各种修改和替换, 这些改变均在本发明的保护范 围之内。 本发明的全部范围由所附权利要求及其任何等同物给出。
在本说明书的描述中, 参考术语 "一个实施例"、 "一些实施例"、 "示意性实施例"、 "示 例"、 "具体示例"、 或 "一些示例" 等的描述意指结合该实施例或示例描述的具体特征、 结 构、 材料或者特点包含于本发明的至少一个实施例或示例中。 在本说明书中, 对上述术语 的示意性表述不一定指的是相同的实施例或示例。 而且, 描述的具体特征、 结构、 材料或 者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

Claims

权利要求书
I、 一种用于确定生物样本中染色体数目异常的方法, 其特征在于, 所述方法包括: 针对所述生物样本的基因组 DNA进行测序, 以便获得多个测序数据;
将所述测序数据与所述生物的参照基因组序列进行比对,以便获得由多个唯一比对测序 数据构成的唯一比对测序数据集;
确定所述唯一比对测序数据集中所包含的唯一比对测序数据的数目 M;
确定所述唯一比对测序数据集中来源于预定染色体的唯一比对测序数据的数目 N; 基于公式 ChrN%=N/M, 确定所述预定染色体的计算比率 ChrN%; 以及
基于所述预定染色体的计算比率 ChrN%, 确定所述生物样本针对所述预定染色体是否 存在染色体数目异常。
2、 根据权利要求 1所述的方法, 其特征在于, 所述生物样本为流产组织。
3、 根据权利要求 2所述的方法, 其特征在于, 所述生物样本为胎儿组织的绒毛。
4、 根据权利要求 1所述的方法, 其特征在于, 进一步包括从所述生物样本提取基因组 DNA的步骤,
其中, 通过选自盐析法、 柱层析法和 SDS法的至少一种提取基因组 DNA。
5、根据权利要求 1所述的方法, 其特征在于, 在对所述生物样本的基因组 DNA进行测 序之前, 将所述基因组 DNA进行随机打断。
6、 根据权利要求 5所述的方法, 其特征在于, 所述随机打断是通过选自酶切法、 雾化 法、 超声处理和 Hydroshear的至少之一进行的。
7、 根据权利要求 5所述的方法, 其特征在于, 将所述基因组 DNA进行随机打断后, DNA片段的长度为 200~300bp。
8、 根据权利要求 1所述的方法, 其特征在于, 所述测序数据的长度为 150bp。
9、 根据权利要求 1所述的方法, 其特征在于, 所述参照基因组序列为 NCBI数据库中 版本 37的人类基因组参考序列。
10、 根据权利要求 1所述的方法, 其特征在于, 釆用 SOAP和 BWA的至少之一, 将所 述测序数据与所述生物的参照基因组序列进行比对。
II、根据权利要求 1所述的方法,其特征在于,基于所述预定染色体的计算比率 ChrN%, 确定所述生物样本针对所述预定染色体是否存在染色体数目异常进一步包括:
确定所述预定染色体的计算比率 01^%与所述预定染色体的特征比率 mean_ChrN°/ 比值, 以便获得所述生物样本中所述预定染色体的相对拷贝率 CR ChrN, 其中, 如果所述生物样本中所述预定染色体的相对拷贝率 CR_ChrN超出所述预定染色 体的正常拷贝率范围, 则确定所述生物样本针对所述预定染色体存在染色体数目异常。
12、根据权利要求 11所述的方法,其特征在于,所述预定染色体的特征比率 mean_ChrN% 是由至少 30个正常样本确定的, 所述预定染色体的正常拷贝率范围是通过计算至少 30个 正常样本针对所述预定染色体的计算比率 ChrN%分布的 99%置信区间而确定的。
13、根据权利要求 1所述的方法, 其特征在于, 所述预定染色体为选自人 21号、 13号、 18号、 X和 Y染色体的至少之一。
14、根据权利要求 1所述的方法,其特征在于,所述测序是通过选自 Roche/454 GS Junior, Illumina/MiSeq以及 Life Tecnologies/Ion Torrent PGM的至少之一进行的。
15、一种计算机可读介质, 其特征在于, 所述计算机可读介质上存储有指令, 所述指令 适于被处理器执行以便通过下列步骤确定生物样本中染色体数目异常:
获取所述生物样本的基因组 DNA的多个测序数据;
将所述测序数据与所述生物的参照基因组序列进行比对,以便获得由多个唯一比对测序 数据构成的唯一比对测序数据集;
确定所述唯一比对测序数据集中所包含的唯一比对测序数据的数目 M;
确定所述唯一比对测序数据集中来源于预定染色体的唯一比对测序数据的数目 N; 基于公式 ChrN%=N/M, 确定所述预定染色体的计算比率 ChrN%; 以及
基于所述预定染色体的计算比率 ChrN%, 确定所述生物样本针对所述预定染色体是否 存在染色体数目异常。
16、根据权利要求 15所述的计算机可读介质,其特征在于,所述参照基因组序列为 NCBI 数据库中版本 37的人类基因组参考序列。
17、 根据权利要求 15所述的计算机可读介质, 其特征在于, 釆用 SOAP和 BWA的至 少之一, 将所述测序数据与所述生物的参照基因组序列进行比对。
18、 根据权利要求 15所述的计算机可读介质, 其特征在于, 基于所述预定染色体的计 算比率 ChrN%, 确定所述生物样本针对所述预定染色体是否存在染色体数目异常进一步包 括:
确定所述预定染色体的计算比率 01^%与所述预定染色体的特征比率 mean_ChrN°/ 比值, 以便获得所述生物样本中所述预定染色体的相对拷贝率 CR_ChrN,
其中, 如果所述生物样本中所述预定染色体的相对拷贝率 CR_ChrN超出所述预定染色 体的正常拷贝率范围, 则确定所述生物样本针对所述预定染色体存在染色体数目异常。
19、 根据权利要求 18所述的计算机可读介质, 其特征在于, 所述预定染色体的特征比 率 1^&^01^%是由至少 30个正常样本确定的。
20、 根据权利要求 18所述的计算机可读介质, 其特征在于, 所述预定染色体的正常拷 贝率范围是通过计算至少 30个正常样本针对所述预定染色体的计算比率 ChrN%分布的 99% 置信区间而确定的。
21、 一种用于确定生物样本中染色体数目异常的系统, 其特征在于, 包括: 测序装置, 所述测序装置用于针对所述生物样本的基因组 DNA进行测序, 以便获得多 个测序数据;
比对装置, 所述比对装置与所述测序装置相连, 用于将所述测序数据与所述生物的参照 基因组序列进行比对, 以便获得由多个唯一比对测序数据构成的唯一比对测序数据集; 分析装置, 所述分析装置与所述比对装置相连, 并且用于确定所述生物样本针对预定染 色体是否存在染色体数目异常,
其中, 所述分析装置进一步包括:
第一计算模块,所述第一计算模块用于确定所述唯一比对测序数据集中所包含的唯一比 对测序数据的数目 M;
第二计算模块,所述第二计算模块用于确定所述唯一比对测序数据集中来源于预定染色 体的唯一比对测序数据的数目 N;
第三计算模块, 所述第三计算模块用于基于公式 ChrN%=N/M, 确定所述预定染色体的 计算比率 ChrN%; 以及
判断模块, 所述判断模块用于基于所述预定染色体的计算比率 ChrN%, 确定所述生物 样本针对所述预定染色体是否存在染色体数目异常。
22、 根据权利要求 21所述的系统, 其特征在于, 所述参照基因组序列为 NCBI数据库 中版本 37的人类基因组参考序列。
23、 根据权利要求 21所述的系统, 其特征在于, 所述比对装置釆用 SOAP和 BWA的 至少之一, 将所述测序数据与所述生物的参照基因组序列进行比对。
24、 根据权利要求 21所述的系统法, 其特征在于, 所述判断模块适于通过下列确定所 述生物样本针对所述预定染色体是否存在染色体数目异常:
确定所述预定染色体的计算比率 01^%与所述预定染色体的特征比率 mean_ChrN°/ 比值, 以便获得所述生物样本中所述预定染色体的相对拷贝率 CR_ChrN,
其中, 如果所述生物样本中所述预定染色体的相对拷贝率 CR_ChrN超出所述预定染色 体的正常拷贝率范围, 则确定所述生物样本针对所述预定染色体存在染色体数目异常。
25、根据权利要求 24所述的系统,其特征在于,所述预定染色体的特征比率 mean_ChrN% 是由至少 30个正常样本确定的, 所述预定染色体的正常拷贝率范围是通过计算至少 30个 正常样本针对所述预定染色体的计算比率 ChrN%分布的 99%置信区间而确定的。
26、 根据权利要求 21 所述的系统, 其特征在于, 所述测序装置是选自 Roche/454 GS Junior、 Illumina/MiSeq以及 Life Tecnologies/Ion Torrent PGM的至少之一。
27、 一种用于确定生物样本中染色体数目异常的系统, 其特征在于, 包括:
测序装置, 所述测序装置用于针对所述生物样本的基因组 DNA进行测序, 以便获得多 个测序数据; 以及
权利要求 15~20任一项所述的计算机可读介质。
PCT/CN2012/084547 2012-11-13 2012-11-13 确定生物样本中染色体数目异常的方法、系统和计算机可读介质 WO2014075228A1 (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/CN2012/084547 WO2014075228A1 (zh) 2012-11-13 2012-11-13 确定生物样本中染色体数目异常的方法、系统和计算机可读介质
CN201280068310.6A CN104093858B (zh) 2012-11-13 2012-11-13 确定生物样本中染色体数目异常的方法、系统和计算机可读介质
HK14110577A HK1197084A1 (zh) 2012-11-13 2014-10-23 確定生物樣本中染色體數目異常的方法、系統和計算機可讀介質

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2012/084547 WO2014075228A1 (zh) 2012-11-13 2012-11-13 确定生物样本中染色体数目异常的方法、系统和计算机可读介质

Publications (1)

Publication Number Publication Date
WO2014075228A1 true WO2014075228A1 (zh) 2014-05-22

Family

ID=50730462

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2012/084547 WO2014075228A1 (zh) 2012-11-13 2012-11-13 确定生物样本中染色体数目异常的方法、系统和计算机可读介质

Country Status (3)

Country Link
CN (1) CN104093858B (zh)
HK (1) HK1197084A1 (zh)
WO (1) WO2014075228A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105296606A (zh) * 2014-07-25 2016-02-03 深圳华大基因股份有限公司 确定生物样本中游离核酸比例的方法、装置及其用途
CN106011244A (zh) * 2016-05-31 2016-10-12 中国人民解放军军事医学科学院放射与辐射医学研究所 检测7q21.13区域SNP试剂的应用
CN112652359A (zh) * 2020-12-30 2021-04-13 安诺优达基因科技(北京)有限公司 染色体异常检测装置
CN112652359B (zh) * 2020-12-30 2024-05-28 安诺优达基因科技(北京)有限公司 染色体异常检测装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107077533B (zh) * 2014-12-10 2021-07-27 深圳华大生命科学研究院 测序数据处理装置和方法
CN109097457A (zh) * 2017-06-20 2018-12-28 深圳华大智造科技有限公司 确定核酸样本中预定位点突变类型的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101928775A (zh) * 2010-08-13 2010-12-29 深圳华大基因科技有限公司 一种细胞染色体分析方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101928775A (zh) * 2010-08-13 2010-12-29 深圳华大基因科技有限公司 一种细胞染色体分析方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105296606A (zh) * 2014-07-25 2016-02-03 深圳华大基因股份有限公司 确定生物样本中游离核酸比例的方法、装置及其用途
CN105296606B (zh) * 2014-07-25 2019-08-09 深圳华大基因股份有限公司 确定生物样本中游离核酸比例的方法、装置及其用途
CN106011244A (zh) * 2016-05-31 2016-10-12 中国人民解放军军事医学科学院放射与辐射医学研究所 检测7q21.13区域SNP试剂的应用
CN106011244B (zh) * 2016-05-31 2019-07-16 中国人民解放军军事医学科学院放射与辐射医学研究所 检测7q21.13区域SNP试剂的应用
CN112652359A (zh) * 2020-12-30 2021-04-13 安诺优达基因科技(北京)有限公司 染色体异常检测装置
CN112652359B (zh) * 2020-12-30 2024-05-28 安诺优达基因科技(北京)有限公司 染色体异常检测装置

Also Published As

Publication number Publication date
CN104093858B (zh) 2016-08-24
CN104093858A (zh) 2014-10-08
HK1197084A1 (zh) 2015-01-02

Similar Documents

Publication Publication Date Title
JP6585117B2 (ja) 胎児の染色体異数性の診断
JP6513622B2 (ja) 非侵襲的出生前診断に有用な母体試料由来の胎児核酸のメチル化に基づく富化のためのプロセスおよび組成物
JP6328934B2 (ja) 非侵襲性出生前親子鑑定法
WO2017084624A1 (zh) 一种同时完成基因位点、染色体及连锁分析的方法
WO2013053183A1 (zh) 对核酸样本中预定区域进行基因分型的方法和系统
WO2013107048A1 (zh) 确定样本基因组中是否存在拷贝数变异的方法、系统和计算机可读介质
EP3529377B1 (en) Gestational age assessment by methylation and size profiling of maternal plasma dna
WO2013149385A1 (zh) 一种拷贝数变异检测方法和系统
US20190338362A1 (en) Methods for non-invasive prenatal determination of aneuploidy using targeted next generation sequencing of biallelic snps
WO2015035555A1 (zh) 用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质
WO2013040773A1 (zh) 确定单细胞染色体非整倍性的方法和系统
TR201815541T4 (tr) Fetüslü gebe bir dişi denekten alınan bir biyolojik numunenin analiz yöntemi.
WO2015043278A1 (zh) 同时进行单体型分析和染色体非整倍性检测的方法和系统
WO2019051812A1 (zh) 确定预定染色体保守区域的方法、确定样本基因组中是否存在拷贝数变异的方法、系统和计算机可读介质
EP3662479A1 (en) A method for non-invasive prenatal detection of fetal sex chromosomal abnormalities and fetal sex determination for singleton and twin pregnancies
WO2014075228A1 (zh) 确定生物样本中染色体数目异常的方法、系统和计算机可读介质
WO2015089726A1 (zh) 一种染色体非整倍性检测方法及装置
US20180142300A1 (en) Universal haplotype-based noninvasive prenatal testing for single gene diseases
WO2014101126A1 (zh) 确定胎儿性别的方法、系统和计算机可读介质
WO2014153755A1 (zh) 确定胎儿染色体非整倍性的方法、系统和计算机可读介质
TWI564742B (zh) Methods for determining the aneuploidy of fetal chromosomes, systems and computer-readable media
WO2020119626A1 (zh) 一种无创产前检测胎儿是否患有遗传疾病的方法
TWI489305B (zh) 對胎兒遺傳異常的無創性檢測
JP2015517317A (ja) 双子の類型を鑑定する方法とシステム
WO2014101024A1 (zh) 确定双胞胎中胎儿性别的方法、系统和计算机可读介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12888612

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 22/092015)

122 Ep: pct application non-entry in european phase

Ref document number: 12888612

Country of ref document: EP

Kind code of ref document: A1