JP2014534507A - 遺伝的変異の非侵襲的評価のための方法およびプロセス - Google Patents
遺伝的変異の非侵襲的評価のための方法およびプロセス Download PDFInfo
- Publication number
- JP2014534507A JP2014534507A JP2014534806A JP2014534806A JP2014534507A JP 2014534507 A JP2014534507 A JP 2014534507A JP 2014534806 A JP2014534806 A JP 2014534806A JP 2014534806 A JP2014534806 A JP 2014534806A JP 2014534507 A JP2014534507 A JP 2014534507A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- count
- sequence
- genomic
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 506
- 230000007614 genetic variation Effects 0.000 title abstract description 164
- 239000012634 fragment Substances 0.000 claims abstract description 660
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 596
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 533
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 532
- 230000001605 fetal effect Effects 0.000 claims abstract description 526
- 238000012360 testing method Methods 0.000 claims abstract description 203
- 230000008569 process Effects 0.000 claims abstract description 136
- 208000036878 aneuploidy Diseases 0.000 claims abstract description 125
- 231100001075 aneuploidy Toxicity 0.000 claims abstract description 114
- 238000013507 mapping Methods 0.000 claims abstract description 94
- 230000002759 chromosomal effect Effects 0.000 claims abstract description 83
- 210000000349 chromosome Anatomy 0.000 claims description 288
- 238000012163 sequencing technique Methods 0.000 claims description 242
- 125000003729 nucleotide group Chemical group 0.000 claims description 115
- 239000002773 nucleotide Substances 0.000 claims description 112
- 210000003754 fetus Anatomy 0.000 claims description 76
- 208000037280 Trisomy Diseases 0.000 claims description 46
- 230000035945 sensitivity Effects 0.000 claims description 37
- 238000005259 measurement Methods 0.000 claims description 34
- 241000282414 Homo sapiens Species 0.000 claims description 27
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 25
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 24
- 230000002829 reductive effect Effects 0.000 claims description 15
- 229940104302 cytosine Drugs 0.000 claims description 11
- 238000012417 linear regression Methods 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 7
- 208000031404 Chromosome Aberrations Diseases 0.000 abstract description 20
- 230000002159 abnormal effect Effects 0.000 abstract description 20
- 231100000005 chromosome aberration Toxicity 0.000 abstract description 12
- 239000000523 sample Substances 0.000 description 320
- 230000008774 maternal effect Effects 0.000 description 205
- 238000010606 normalization Methods 0.000 description 157
- 238000012545 processing Methods 0.000 description 120
- 238000012217 deletion Methods 0.000 description 116
- 230000037430 deletion Effects 0.000 description 116
- 102000053602 DNA Human genes 0.000 description 112
- 108020004414 DNA Proteins 0.000 description 112
- 238000001914 filtration Methods 0.000 description 74
- 210000004027 cell Anatomy 0.000 description 70
- 239000002585 base Substances 0.000 description 62
- 108091028043 Nucleic acid sequence Proteins 0.000 description 55
- 238000004458 analytical method Methods 0.000 description 54
- 102000054765 polymorphisms of proteins Human genes 0.000 description 54
- 238000012546 transfer Methods 0.000 description 52
- 238000004422 calculation algorithm Methods 0.000 description 45
- 108090000623 proteins and genes Proteins 0.000 description 45
- 238000003860 storage Methods 0.000 description 45
- 210000004369 blood Anatomy 0.000 description 41
- 239000008280 blood Substances 0.000 description 41
- 238000004590 computer program Methods 0.000 description 40
- 230000005856 abnormality Effects 0.000 description 34
- 230000006870 function Effects 0.000 description 34
- 238000003780 insertion Methods 0.000 description 34
- 230000037431 insertion Effects 0.000 description 34
- 230000002068 genetic effect Effects 0.000 description 31
- 238000003752 polymerase chain reaction Methods 0.000 description 30
- 230000003321 amplification Effects 0.000 description 29
- 238000003199 nucleic acid amplification method Methods 0.000 description 29
- 230000002093 peripheral effect Effects 0.000 description 28
- 238000006243 chemical reaction Methods 0.000 description 27
- 238000003776 cleavage reaction Methods 0.000 description 25
- 230000011987 methylation Effects 0.000 description 24
- 238000007069 methylation reaction Methods 0.000 description 24
- 230000000630 rising effect Effects 0.000 description 24
- 230000033228 biological regulation Effects 0.000 description 23
- 230000000670 limiting effect Effects 0.000 description 23
- 239000000203 mixture Substances 0.000 description 23
- 239000000047 product Substances 0.000 description 23
- 230000001105 regulatory effect Effects 0.000 description 23
- 230000008520 organization Effects 0.000 description 22
- 229920002477 rna polymer Polymers 0.000 description 22
- 238000009826 distribution Methods 0.000 description 21
- 102000004169 proteins and genes Human genes 0.000 description 21
- 108700028369 Alleles Proteins 0.000 description 20
- 239000011324 bead Substances 0.000 description 20
- 230000007017 scission Effects 0.000 description 20
- 238000000926 separation method Methods 0.000 description 19
- 241000894007 species Species 0.000 description 18
- 201000010374 Down Syndrome Diseases 0.000 description 17
- 210000002381 plasma Anatomy 0.000 description 17
- 230000035772 mutation Effects 0.000 description 16
- 239000000126 substance Substances 0.000 description 16
- 206010044688 Trisomy 21 Diseases 0.000 description 15
- 238000007792 addition Methods 0.000 description 15
- 239000012530 fluid Substances 0.000 description 15
- 102000040430 polynucleotide Human genes 0.000 description 15
- 108091033319 polynucleotide Proteins 0.000 description 15
- 239000002157 polynucleotide Substances 0.000 description 15
- 239000013074 reference sample Substances 0.000 description 15
- 206010028980 Neoplasm Diseases 0.000 description 14
- 201000011510 cancer Diseases 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 14
- 208000011580 syndromic disease Diseases 0.000 description 14
- 241000282412 Homo Species 0.000 description 13
- 239000003795 chemical substances by application Substances 0.000 description 13
- 230000000295 complement effect Effects 0.000 description 13
- 238000001514 detection method Methods 0.000 description 13
- 238000003745 diagnosis Methods 0.000 description 13
- 210000002966 serum Anatomy 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 12
- 230000001186 cumulative effect Effects 0.000 description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 12
- 230000002441 reversible effect Effects 0.000 description 12
- 238000012896 Statistical algorithm Methods 0.000 description 11
- 230000003322 aneuploid effect Effects 0.000 description 11
- 238000003556 assay Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 11
- 230000007423 decrease Effects 0.000 description 11
- 108091008146 restriction endonucleases Proteins 0.000 description 11
- 108060002716 Exonuclease Proteins 0.000 description 10
- 230000001174 ascending effect Effects 0.000 description 10
- 230000001413 cellular effect Effects 0.000 description 10
- 239000003153 chemical reaction reagent Substances 0.000 description 10
- 201000010099 disease Diseases 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 102000013165 exonuclease Human genes 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 230000035935 pregnancy Effects 0.000 description 10
- 108091034117 Oligonucleotide Proteins 0.000 description 9
- 208000026487 Triploidy Diseases 0.000 description 9
- 210000001766 X chromosome Anatomy 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 238000007672 fourth generation sequencing Methods 0.000 description 8
- 150000002500 ions Chemical class 0.000 description 8
- 238000002493 microarray Methods 0.000 description 8
- 230000036961 partial effect Effects 0.000 description 8
- 210000003765 sex chromosome Anatomy 0.000 description 8
- 239000007858 starting material Substances 0.000 description 8
- 238000012353 t test Methods 0.000 description 8
- 210000001519 tissue Anatomy 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 7
- 108010047956 Nucleosomes Proteins 0.000 description 7
- 238000000692 Student's t-test Methods 0.000 description 7
- 210000002593 Y chromosome Anatomy 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000013467 fragmentation Methods 0.000 description 7
- 238000006062 fragmentation reaction Methods 0.000 description 7
- 230000036541 health Effects 0.000 description 7
- 210000001623 nucleosome Anatomy 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 239000007787 solid Substances 0.000 description 7
- 241001465754 Metazoa Species 0.000 description 6
- 239000002202 Polyethylene glycol Substances 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 210000001124 body fluid Anatomy 0.000 description 6
- 230000002255 enzymatic effect Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 238000012165 high-throughput sequencing Methods 0.000 description 6
- 238000010348 incorporation Methods 0.000 description 6
- 230000000873 masking effect Effects 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 6
- 229920001223 polyethylene glycol Polymers 0.000 description 6
- 238000012175 pyrosequencing Methods 0.000 description 6
- 238000011002 quantification Methods 0.000 description 6
- 230000009897 systematic effect Effects 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 108020004635 Complementary DNA Proteins 0.000 description 5
- 201000006360 Edwards syndrome Diseases 0.000 description 5
- 229910019142 PO4 Inorganic materials 0.000 description 5
- 208000020584 Polyploidy Diseases 0.000 description 5
- 108020004682 Single-Stranded DNA Proteins 0.000 description 5
- 208000007159 Trisomy 18 Syndrome Diseases 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 238000010804 cDNA synthesis Methods 0.000 description 5
- 108091092328 cellular RNA Proteins 0.000 description 5
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 5
- 239000000975 dye Substances 0.000 description 5
- 239000007850 fluorescent dye Substances 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 5
- 238000012384 transportation and delivery Methods 0.000 description 5
- 206010053884 trisomy 18 Diseases 0.000 description 5
- 108091093088 Amplicon Proteins 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 4
- 108020001738 DNA Glycosylase Proteins 0.000 description 4
- 102000028381 DNA glycosylase Human genes 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 101000702488 Rattus norvegicus High affinity cationic amino acid transporter 1 Proteins 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 239000000654 additive Substances 0.000 description 4
- 230000000996 additive effect Effects 0.000 description 4
- 238000002669 amniocentesis Methods 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 4
- 238000011978 dissolution method Methods 0.000 description 4
- 239000000839 emulsion Substances 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- -1 hydrogen ions Chemical class 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 4
- 239000011148 porous material Substances 0.000 description 4
- 238000010379 pull-down assay Methods 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- 108700024394 Exon Proteins 0.000 description 3
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- 108060001084 Luciferase Proteins 0.000 description 3
- 239000005089 Luciferase Substances 0.000 description 3
- 201000009928 Patau syndrome Diseases 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 206010044686 Trisomy 13 Diseases 0.000 description 3
- 208000006284 Trisomy 13 Syndrome Diseases 0.000 description 3
- 208000026928 Turner syndrome Diseases 0.000 description 3
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 3
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 3
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 3
- 239000012491 analyte Substances 0.000 description 3
- 239000010839 body fluid Substances 0.000 description 3
- 239000006227 byproduct Substances 0.000 description 3
- 210000002230 centromere Anatomy 0.000 description 3
- 230000003750 conditioning effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 238000007847 digital PCR Methods 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 238000001493 electron microscopy Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 238000007403 mPCR Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 3
- 201000011461 pre-eclampsia Diseases 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000004627 transmission electron microscopy Methods 0.000 description 3
- 238000012176 true single molecule sequencing Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical class NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000282832 Camelidae Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 201000003883 Cystic fibrosis Diseases 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 208000023105 Huntington disease Diseases 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 108091092724 Noncoding DNA Proteins 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 108091027568 Single-stranded nucleotide Proteins 0.000 description 2
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 2
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 238000001801 Z-test Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 230000029936 alkylation Effects 0.000 description 2
- 238000005804 alkylation reaction Methods 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 125000004429 atom Chemical group 0.000 description 2
- 238000004630 atomic force microscopy Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006287 biotinylation Effects 0.000 description 2
- 238000007413 biotinylation Methods 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 108091092240 circulating cell-free DNA Proteins 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 238000002425 crystallisation Methods 0.000 description 2
- 230000008025 crystallization Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010252 digital analysis Methods 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000004545 gene duplication Effects 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 210000002751 lymph Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 208000030454 monosomy Diseases 0.000 description 2
- 230000005257 nucleotidylation Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 239000013610 patient sample Substances 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 210000002826 placenta Anatomy 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000003793 prenatal diagnosis Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 210000003411 telomere Anatomy 0.000 description 2
- 102000055501 telomere Human genes 0.000 description 2
- 108091035539 telomere Proteins 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 230000036266 weeks of gestation Effects 0.000 description 2
- IYLGZMTXKJYONK-ACLXAEORSA-N (12s,15r)-15-hydroxy-11,16-dioxo-15,20-dihydrosenecionan-12-yl acetate Chemical compound O1C(=O)[C@](CC)(O)C[C@@H](C)[C@](C)(OC(C)=O)C(=O)OCC2=CCN3[C@H]2[C@H]1CC3 IYLGZMTXKJYONK-ACLXAEORSA-N 0.000 description 1
- WWJWZQKUDYKLTK-UHFFFAOYSA-N 1,n6-ethenoadenine Chemical compound C1=NC2=NC=N[C]2C2=NC=CN21 WWJWZQKUDYKLTK-UHFFFAOYSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- XHBSBNYEHDQRCP-UHFFFAOYSA-N 2-amino-3-methyl-3,7-dihydro-6H-purin-6-one Chemical compound O=C1NC(=N)N(C)C2=C1N=CN2 XHBSBNYEHDQRCP-UHFFFAOYSA-N 0.000 description 1
- ZPBYVFQJHWLTFB-UHFFFAOYSA-N 3-methyl-7H-purin-6-imine Chemical compound CN1C=NC(=N)C2=C1NC=N2 ZPBYVFQJHWLTFB-UHFFFAOYSA-N 0.000 description 1
- 108010034927 3-methyladenine-DNA glycosylase Proteins 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- 208000026817 47,XYY syndrome Diseases 0.000 description 1
- JDBGXEHEIRGOBU-UHFFFAOYSA-N 5-hydroxymethyluracil Chemical compound OCC1=CNC(=O)NC1=O JDBGXEHEIRGOBU-UHFFFAOYSA-N 0.000 description 1
- CLGFIVUFZRGQRP-UHFFFAOYSA-N 7,8-dihydro-8-oxoguanine Chemical compound O=C1NC(N)=NC2=C1NC(=O)N2 CLGFIVUFZRGQRP-UHFFFAOYSA-N 0.000 description 1
- 206010000234 Abortion spontaneous Diseases 0.000 description 1
- 102100038740 Activator of RNA decay Human genes 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 101710092462 Alpha-hemolysin Proteins 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 206010003210 Arteriosclerosis Diseases 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000283153 Cetacea Species 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 206010061764 Chromosomal deletion Diseases 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 241001125840 Coryphaenidae Species 0.000 description 1
- 206010067477 Cytogenetic abnormality Diseases 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010060616 DNA-3-methyladenine glycosidase II Proteins 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 108010000577 DNA-Formamidopyrimidine Glycosylase Proteins 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 108010046855 DNA-deoxyinosine glycosidase Proteins 0.000 description 1
- 208000034423 Delivery Diseases 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 108700034637 EC 3.2.-.- Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 238000001159 Fisher's combined probability test Methods 0.000 description 1
- 241000282575 Gorilla Species 0.000 description 1
- 241000691979 Halcyon Species 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 208000032843 Hemorrhage Diseases 0.000 description 1
- 102100039869 Histone H2B type F-S Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 201000006347 Intellectual Disability Diseases 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 208000016679 Monosomy X Diseases 0.000 description 1
- 101000878884 Mus musculus Flap endonuclease 1 Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 238000001430 Omnibus test Methods 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 208000005107 Premature Birth Diseases 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000001218 Rec A Recombinases Human genes 0.000 description 1
- 108010055016 Rec A Recombinases Proteins 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 241000282849 Ruminantia Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 206010040047 Sepsis Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 241000270295 Serpentes Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 241001416177 Vicugna pacos Species 0.000 description 1
- 206010056894 XYY syndrome Diseases 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- IRLPACMLTUPBCL-FCIPNVEPSA-N adenosine-5'-phosphosulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@@H](CO[P@](O)(=O)OS(O)(=O)=O)[C@H](O)[C@H]1O IRLPACMLTUPBCL-FCIPNVEPSA-N 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000012884 algebraic function Methods 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001413 amino acids Chemical group 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 208000011775 arteriosclerosis disease Diseases 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000000941 bile Anatomy 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000002459 blastocyst Anatomy 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- YTRQFSDWAXHJCC-UHFFFAOYSA-N chloroform;phenol Chemical compound ClC(Cl)Cl.OC1=CC=CC=C1 YTRQFSDWAXHJCC-UHFFFAOYSA-N 0.000 description 1
- 108091006090 chromatin-associated proteins Proteins 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000004163 cytometry Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000011304 droplet digital PCR Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 210000002308 embryonic cell Anatomy 0.000 description 1
- 230000007515 enzymatic degradation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 210000005002 female reproductive tract Anatomy 0.000 description 1
- 210000004700 fetal blood Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- LIYGYAHYXQDGEP-UHFFFAOYSA-N firefly oxyluciferin Natural products Oc1csc(n1)-c1nc2ccc(O)cc2s1 LIYGYAHYXQDGEP-UHFFFAOYSA-N 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- HDLHSPLHIYZZER-UHFFFAOYSA-N formamide;pyrimidine Chemical compound NC=O.C1=CN=CN=C1 HDLHSPLHIYZZER-UHFFFAOYSA-N 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 210000004251 human milk Anatomy 0.000 description 1
- 235000020256 human milk Nutrition 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 125000004356 hydroxy functional group Chemical group O* 0.000 description 1
- 239000000815 hypotonic solution Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 235000019689 luncheon sausage Nutrition 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000010197 meta-analysis Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 102000031635 methyl-CpG binding proteins Human genes 0.000 description 1
- 108091009877 methyl-CpG binding proteins Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000010208 microarray analysis Methods 0.000 description 1
- 239000011325 microbead Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 208000015994 miscarriage Diseases 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 239000011807 nanoball Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 210000001331 nose Anatomy 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 238000001921 nucleic acid quantification Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 201000003738 orofaciodigital syndrome VIII Diseases 0.000 description 1
- 229910000489 osmium tetroxide Inorganic materials 0.000 description 1
- 239000012285 osmium tetroxide Substances 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- JJVOROULKOMTKG-UHFFFAOYSA-N oxidized Photinus luciferin Chemical compound S1C2=CC(O)=CC=C2N=C1C1=NC(=O)CS1 JJVOROULKOMTKG-UHFFFAOYSA-N 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000032696 parturition Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 210000004303 peritoneum Anatomy 0.000 description 1
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000003169 placental effect Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- OIGNJSKKLXVSLS-VWUMJDOOSA-N prednisolone Chemical compound O=C1C=C[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 OIGNJSKKLXVSLS-VWUMJDOOSA-N 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 238000002214 protein ontology Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108090000589 ribonuclease E Proteins 0.000 description 1
- IYLGZMTXKJYONK-UHFFFAOYSA-N ruwenine Natural products O1C(=O)C(CC)(O)CC(C)C(C)(OC(C)=O)C(=O)OCC2=CCN3C2C1CC3 IYLGZMTXKJYONK-UHFFFAOYSA-N 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 230000020509 sex determination Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 208000000995 spontaneous abortion Diseases 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 108700010045 sry Genes Proteins 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 238000002636 symptomatic treatment Methods 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 238000009281 ultraviolet germicidal irradiation Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000009677 vaginal delivery Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Analytical Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
この特許出願は、代理人管理番号SEQ−6034−PV3によって指定される、発明者としてCosmin Deciu、Zeljko Dzakula、Mathias EhrichおよびSung Kyun Kimが挙げられる表題「METHODS AND PROCESSES FOR NON−INVASIVE ASSESSMENT OF GENETIC VARIATIONS」の2012年10月4日に出願された米国仮特許出願第61/709,899号の利益を主張し、代理人管理番号SEQ−6034−PV2によって指定される、発明者としてZeljko DzakulaおよびMathias Ehrichが挙げられる表題「METHODS AND PROCESSES FOR NON−INVASIVE ASSESSMENT OF GENETIC VARIATIONS」の2012年6月22日に出願された米国仮特許出願第61/663,477号の利益を主張し、代理人管理番号SEQ−6034−PVによって指定される、発明者としてZeljko DzakulaおよびMathias Ehrichが挙げられる表題「METHODS AND PROCESSES FOR NON−INVASIVE ASSESSMENT OF GENETIC VARIATIONS」の2011年10月6日に出願された米国仮特許出願第61/544,251号の利益を主張する。前述の仮出願の全体の内容(全ての本文、表および図面を含む)は、参考として本明細書に援用される。
に従い算出する。
式
式
ファイが所定の値未満またはこれより大きいかどうかを決定する(式中、ファイは正倍数体またはトリソミーの成果それぞれを仮定して評価した残差二乗和間の差を表し、fは参照中央カウントプロファイルを表し、エプシロンはカウント合計に対して正規化された測定カウントプロファイルを表し、Fは胎児画分を表し、Nはゲノム片の総数を表し、iは選択されたゲノム片を表し、シグマ(σ)は選択されたゲノム片におけるfと関連する不確定要素を表し、正倍数体または非正倍数体の決定は、ファイの数値に基づいた)。いくつかの実施形態において、胎児画分は測定された胎児画分である。特定の実施形態において、所定の値は0に等しい。いくつかの実施形態において、所定の値は0より大きい。特定の実施形態において、所定の値は0未満である。
式
式
Xが所定の値未満またはこれより大きいかどうかを決定する(式中、fは参照中央カウントプロファイルを表し、yはカウント合計に対して正規化された測定カウントプロファイルを表し、Fは胎児画分を表し、Nはゲノム片の総数を表し、iは選択されたゲノム片を表し、シグマ(σ)は、選択されたゲノム片においてfと関連する不確定要素を表し、エプシロンは正倍数体サンプルから3倍体を区別するカットオフとして使用される正の数であり、正倍数体または非正倍数体の決定は、Xの数値に基づき行われる)。特定の実施形態において、所定の値は(1+エプシロン)である。いくつかの実施形態において、Xは(1+エプシロン)より大きい。特定の実施形態において、Xは(1+エプシロン)未満である。いくつかの実施形態において、Xは(1+エプシロン)に等しい。
式
式
フィットさせた胎児画分と測定された胎児画分との間の差の絶対値が、測定された胎児画分の誤差における所定の値より大きいかどうかを決定する(式中、Fはフィットさせた胎児画分を表し、Foは測定された胎児画分を表し、デルタF(例えば、ΔF)は測定された胎児画分の誤差を表し、Sは計算を簡易にするために導入された補助変数を表し、fは参照中央カウントプロファイルを表し、エプシロンはカウント合計に対して正規化された測定カウントプロファイルを表し、Nはゲノム片の総数を表し、iは選択されたゲノム片を表し、シグマ(σ)は選択されたゲノム片においてfと関連する不確定要素を表し、正倍数体または非正倍数体の決定は、Xの数値に基づいて行われる)。いくつかの実施形態において、所定の値を、式|F−Fo|<ΔFを使用して算出する。特定の実施形態において、Xは|F−Fo|<ΔFより大きい。いくつかの実施形態において、Xは|F−Fo|<ΔF未満である。特定の実施形態において、Xは|F−Fo|<ΔFに等しい。
本明細書において、核酸を分析するための方法および組成物を提供する。いくつかの実施形態において、核酸フラグメントの混合物中の核酸フラグメントを分析する。核酸の混合物は、異なるヌクレオチド配列、異なるフラグメント長、異なる起源(例えば、ゲノム起源、胎児対母体起源、細胞または組織起源、サンプル起源、被験体起源など)またはその組み合わせを有する2つ以上の核酸フラグメント種を含むことができる。
核酸は、当技術分野において公知の方法により1つまたはそれより多い供給源(例えば、細胞、血清、血漿、バフィーコート、リンパ液、皮膚、便など)から得ることができる。細胞溶解法および試薬は当技術分野において公知であり、一般に化学的(例えば、界面活性剤、低張液、酵素による手法など、またはその組み合わせ)、物理的(例えば、フレンチプレス、超音波処理など)または電解溶解法により行われ得る。任意の適切な溶解法を利用することができる。例えば、化学的方法は、一般に、溶解剤を使用して、細胞を破壊し、細胞から核酸を抽出した後、カオトロピック塩で処理する。凍結/解凍後に粉砕などの物理的方法、つまり細胞圧迫などの使用も有用である。高塩溶解法も通常、使用される。例えば、アルカリ性溶解法が利用され得る。アルカリ性溶解法はこれまで、フェノール−クロロホルム溶液の使用が組み込まれ、代替えの3溶液を含むフェノール−クロロホルム非含有法を利用することができる。フェノール−クロロホルム非含有法において、第1の溶液は、15mMトリス、pH8.0、10mM EDTAおよび100μg/ml RnaseAを含有することができ、第2の溶液は、0.2N NaOHおよび1%SDSを含有することがき、第3の溶液は、3M KOAc、pH5.5を含有することができる。これらの方法は、Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.,6.3.1−6.3.6(1989)に見つけることができ、その全体を本明細書に組み込む。
いくつかの実施形態において、核酸内の胎児の核酸量(例えば、濃度、相対量、絶対量、コピー数など)を決定する。いくつかの例において、サンプル内の胎児の核酸量は、「胎児画分」と呼ばれる。「胎児画分」は、妊娠女性から得られたサンプル(例えば、血液サンプル、血清サンプル、血漿サンプル)内の循環無細胞核酸の胎児の核酸の画分を指すこともある。特定の実施形態において、胎児の核酸量を、男性胎児に特異的なマーカー(例えば、Y染色体STRマーカー(例えば、DYS19、DYS385、DYS392マーカー);RhD陰性女性のRhDマーカー)に従い、多型配列のアレル比に従い、または胎児の核酸に特異的で、かつ母体の核酸に特異的でない1つまたはそれより多いマーカー(例えば、母親および胎児間の分化エピジェネティックバイオマーカー(例えば、メチル化、以下にさらに詳細に説明)または母体の血漿中の胎児RNAマーカー(例えば、Lo,2005,Journal of Histochemistry and Cytochemistry53(3):293−296を参照のこと))に従い決定する。
いくつかの実施形態において、核酸(例えば、細胞外核酸)を核酸の部分集合または種において富化または相対的に富化する。核酸の部分集合は、例えば、胎児の核酸、母体の核酸、具体的な長さまたは長さの範囲のフラグメントを含む核酸、あるいは具体的なゲノム領域からの核酸(例えば、1本鎖の染色体、染色体のセット、および/または特定の染色体領域)を含むことができる。このような富化されたサンプルを、本明細書において提供される方法と合わせて使用することができる。したがって、特定の実施形態において、技術の方法は、サンプルの核酸の部分集合、例えば、胎児の核酸などにおいて富化するさらなるステップを含む。いくつかの例において、上記の胎児画分を決定する方法を使用し、胎児の核酸を富化することができる。特定の実施形態において、母体の核酸を、サンプルから選択的に(部分的に、実質的に、ほぼ完全にまたは完全に)除去することができる。いくつかの例において、具体的にコピー数種の少ない核酸(例えば、胎児の核酸)における富化は、定量的感受性を改善し得る。具体的な種の核酸におけるサンプルを富化する方法は、例えば、米国特許第6,927,028号、国際特許出願公開第WO2007/140417号、国際特許出願公開第WO2007/147063号、国際特許出願公開第WO2009/032779号、国際特許出願公開第WO2009/032781号、国際特許出願公開第WO2010/033639号、国際特許出願公開第WO2011/034631号、国際特許出願公開第WO2006/056480号、および国際特許出願公開第WO2011/143659号(これら全てを参照により本明細書に組み込む)に記載される。
いくつかの実施形態において、核酸(例えば、核酸フラグメント、サンプル核酸、細胞非含有核酸)をシークエンシングすることができる。いくつかの例において、完全または実質的に完全な配列を得、かつ部分的な配列を得ることもある。シークエンシング、マッピングおよび関連の分析方法は、当技術分野において公知である(例えば、米国特許出願公開第2009/0029377号、参照により組み込まれる)。このようなプロセスの特定の態様を以下に記載する。
シークエンシングすることおよびシークエンシングリードを得ることは、シークエンシングモジュールにより、またはシークエンシングモジュールを含む装置により提供されることができる。本明細書において使用される場合、「配列受信モジュール」は、「シークエンシングモジュール」と同じである。シークエンシングモジュールを含む装置は、当技術分野で公知のシークエンシング技術から核酸の配列を決定する任意の装置であってよい。特定の実施形態において、シークエンシングモジュールを含む装置は、当技術分野で公知のシークエンシング反応を行う。シークエンシングモジュールは一般に、シークエンシング反応からのデータ(例えば、シークエンシング装置から作製された信号)に従い、核酸配列リードを提供する。いくつかの実施形態において、シークエンシングモジュールまたはシークエンシングモジュールを含む装置は、シークエンシングリードを提供することを要求される。いくつかの実施形態において、シークエンシングモジュールを、別のシークエンシングモジュール、コンピュータ周辺機器、オペレータ、サーバー、ハードドライブ、装置から、または適切な供給源から配列リードを受信し、取得し、アクセスし、または回収することができる。シークエンシングモジュールは、配列リードを操作することができることもある。例えば、シークエンシングモジュールは、配列リードを整列、組み立て、フラグメント化、相補配列、逆相補配列、エラーチェックまたはエラー補正することができる。シークエンシングモジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、シークエンシングリードを、シークエンシングモジュールから1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、シークエンシングリードは、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含む装置により提供される。いくつかの実施形態において、シークエンシングモジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。シークエンシングモジュールは、別のモジュール、装置、周辺機器、コンポーネントまたは特別なコンポーネント(例えば、シークエンサー)からデータおよび/または情報を収集し、組み立て、かつ/または受信することもある。いくつかの実施形態において、シークエンシングリードは、以下の1つ以上を含む装置により提供される:1つまたはそれより多いフローセル、カメラ、光検出器、光電池、流体処理コンポーネント、プリンタ、ディスプレイ(例えば、LED、LCTまたはCRT)など。多くの場合、シークエンシングモジュールは、配列リードを受信し、収集し、かつ/または組み立てる。シークエンシングモジュールは、装置のオペレータから入力データおよび/または情報を承認し、収集する。例えば、装置のオペレータは、モジュールに命令、定数、閾値、式または所定の値を提供することもある。シークエンシングモジュールは、受信するデータおよび/または情報を連続核酸配列に変換することができることもある。いくつかの実施形態において、シークエンシングモジュールにより提供される核酸配列を印刷し、または表示する。いくつかの実施形態において、配列リードは、シークエンシングモジュールにより提供され、シークエンシングモジュールから装置または任意の適切な周辺機器、コンポーネントまたは特別なコンポーネントを含む装置に転送される。いくつかの実施形態において、データおよび/または情報は、シークエンシングモジュールから、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含む装置に提供される。いくつかの例において、配列リードに関連するデータおよび/または情報を、シークエンシングモジュールから、任意の他の適切なモジュールに転送することができる。いくつかの実施形態において、シークエンシングモジュールは、配列リードをマッピングモジュールまたはカウンティングモジュールに転送することができる。
ヌクレオチド配列リード(すなわち、物理的なゲノム位置がわかっていないフラグメントからの配列情報)をマッピングすることを、多くの方法で行うことができ、多くの場合、得られた配列リードと参照ゲノムの一致する配列とのアライメントを含む(例えば、Liら、“Mapping short DNA sequencing reads and calling variants using mapping quality score,”Genome Res.,2008 Aug 19.)。このようなアライメントにおいて、配列リードは一般に、参照配列および整列が「マッピング」または「配列タグ」であるとして表されているものに整列される。いくつかの例において、マッピングされた配列リードは、「ヒット」または「カウント」と呼ばれる。いくつかの実施形態において、マッピングされた配列リードは、種々のパラメータに従い、合わせてグループ化され、以下にさらに詳述される、具体的なゲノム片に割り当てられる。
配列リードを、マッピングモジュールにより、またはマッピングモジュールを含む装置によりマッピングすることができ、このマッピングモジュールは一般に、参照ゲノムまたはその断片に対するリードをマッピングする。マッピングモジュールは、当技術分野において公知の適切な方法によりシークエンシングリードをマッピングすることができる。いくつかの実施形態において、マッピングモジュールまたはマッピングモジュールを含む装置は、マッピングされた配列リードを提供することを要求される。マッピングモジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、マッピングされたシークエンシングリードは、マッピングモジュールから1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、シークエンシングリードを、マルチプロセッサ、例えば、並列に協動し、かつ作業するプロセッサを含む装置によりマッピングする。いくつかの実施形態において、マッピングモジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。装置は、マッピングモジュールおよびシークエンシングモジュールを含み得る。いくつかの実施形態において、配列リードを以下の1つ以上を含む装置によりマッピングし得る:1つまたはそれより多いフローセル、カメラ、流体処理コンポーネント、プリンタ、ディスプレイ(例えば、LED、LCTまたはCRT)など。いくつかの実施形態において、マッピングモジュールは、シークエンシングモジュールから配列リードを受信することができる。いくつかの実施形態において、マッピングされたシークエンシングリードを、マッピングモジュールから、カウンティングモジュールまたは正規化モジュールに転送することができる。
いくつかの実施形態において、マッピングされた配列リード(すなわち、配列タグ)を、種々のパラメータに従い、合わせてグループ化し、具体的なゲノム片に割り当てる。多くの場合、個々のマッピングされた配列リードを使用し、サンプルに存在するゲノム片の量を同定することができる。いくつかの実施形態において、ゲノム片の量は、サンプルの大きな配列(例えば、染色体)の量を示し得る。本明細書において、用語「ゲノム片」は、「配列ウィンドウ」、「片」、「ビン」、「遺伝子座」、「領域」、「区分」または「部分」とも呼ばれ得る。いくつかの実施形態において、ゲノム片は、染色体全体、染色体の断片、参照ゲノムのセグメント、複数の染色体部分、複数の染色体、複数の染色体からの部分、および/またはそれらの組み合わせである。ゲノム片は特定のパラメータに基づき予め定義されることもある。ゲノム片は、ゲノム(例えば、サイズにより区分されたもの、断片、連続領域、任意に定義されたサイズの連続領域など)の区分化に基づき任意に定義されることもある。いくつかの例において、ゲノム片を、例えば、長さもしくは具体的な特徴または配列の特徴を含む、1つまたはそれより多いパラメータに基づき明記される。ゲノム片を、当技術分野で公知の、または本明細書に記載の任意の適切な基準を使用して、選択し、フィルタリングし、かつ/または考慮に入れないことができる。いくつかの実施形態において、ゲノム片は、ゲノム配列の具体的な長さに基づく。いくつかの実施形態において、方法は、複数のゲノム片に対する複数のマッピングされた配列リードの分析を含むことができる。ゲノム片は、およそ同じ長さであってよく、またはゲノム片は異なる長さであってよい。ゲノム片は、大体等しい長さのものであることもある。いくつかの例において、異なる長さのゲノム片を調節し、または重み付けをする。いくつかの実施形態において、ゲノム片は約10キロ塩基(kb)〜約100kb、約20kb〜約80kb、約30kb〜約70kb、約40kb〜約60kbであり、約50kbであることもある。いくつかの実施形態において、ゲノム片は約10kb〜約20kbである。ゲノム片は配列の連続試行に限定されない。したがって、ゲノム片を、連続および/または非連続配列から作製することができる。ゲノム片は、単一の染色体に限定されない。いくつかの実施形態において、ゲノム片は、1つの染色体の全てもしくは部分、または2つ以上の染色体の全てもしくは部分を含む。いくつかの例において、ゲノム片は、1つ、2つ以上の染色体全体に及び得る。さらに、ゲノム片は、複数の染色体の接合または非接合部分に及び得る。
「配列タグ密度」は、配列タグ密度を、異なるサンプルの比較および次の分析のために使用する場合の定義されたゲノム片の配列タグまたはリードの正規化された値を指す。配列タグ密度の値は多くの場合、サンプル内で正規化される。いくつかの実施形態において、正規化を、各ゲノム片内にあるタグの数をカウントし、各染色体の配列タグカウント合計の中央値を得、常染色体値の全ての中央値を得、異なるサンプルにおいて得られた配列タグの合計数の差を考慮するために対して正規化定数としてこの値を使用することにより行うことができる。配列タグ密度は、2染色体において約1であることがある。配列タグ密度は、シークエンシングアーチファクト、最も顕著にはG/Cバイアスに従い変化することができ、これは、外部標準または内部参照(例えば、実質的に全ての配列タグ(ゲノム配列)に由来)の使用により補正されることができ、例えば、いくつかの実施形態において、単一の染色体または全ての常染色体から算出された値であり得る)。したがって、染色体または染色体領域の量的不均衡を、検体の他のマッピング可能なシークエンシングされたタグのうち、遺伝子座の表現の割合から推論することができる。それゆえ、具体的な染色体または染色体領域の量的不均衡を、定量的に決定し、正規化することができる。配列タグ密度の正規化および定量化の方法は、以下にさらに詳述される。
いくつかの実施形態において、選択された特徴または変数に基づきマッピングされ、または区分された配列リードを定量化し、ゲノム片(例えば、ビン、区分、ゲノム部分、参照ゲノムの部分、染色体の部分など)にマッピングされたリードの数を決定することができる。ゲノム片にマッピングされた配列リードの量は、カウント(例えば、1カウント)と呼ばれることもある。多くの場合、カウントは、ゲノム片に関連する。2つまたはそれより多いゲノム片のカウント(例えば、ゲノム片のセット)は、数学的に操作(例えば、平均化され、加算され、正規化されるなどまたはそれらの組み合わせ)されることもある。いくつかの実施形態において、カウントを、ゲノム片にマッピングされる(すなわち、関連する)配列リードの一部または全てから決定する。特定の実施形態において、カウントは、マッピングされた配列リードの予め定義されたサブセットから決定される。マッピングされた配列リードの予め定義されたサブセットを、任意の適切な特徴または変数を利用して定義または選択されることができる。いくつかの実施形態において、マッピングされた配列リードの予め定義されたサブセットは、1〜n個の配列リードを含むことができ、この場合、nは、試験被験体または参照被験体サンプルから作製された全ての配列リードの和に等しい数を表す。
カウントを、カウンティングモジュールにより、またはカウンティングモジュールを含む装置により提供することができる。カウンティングモジュールは、当技術分野で公知のカウント方法に従い、カウントを決定し、組み立て、かつ/または表示することができる。カウンティングモジュールは一般に、当技術分野において公知のカウント方法論に従い、カウントを決定し、または組み立てる。いくつかの実施形態において、カウンティングモジュールまたはカウンティングモジュールを含む装置は、カウントを提供することを要求される。カウンティングモジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、カウントは、カウンティングモジュールから1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、リードを、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含む装置によりカウントする。いくつかの実施形態において、カウンティングモジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。いくつかの実施形態において、リードを、以下の1つ以上を含む装置によりカウントする:シークエンシングモジュール、マッピングモジュール、1つまたはそれより多いフローセル、カメラ、流体処理コンポーネント、プリンタ、ディスプレイ(例えば、LED、LCTまたはCRT)など。カウンティングモジュールは、シークエンシングモジュールおよび/またはマッピングモジュールからデータおよび/または情報を受信し、データおよび/または情報を変換し、カウント(例えば、ゲノム片にマッピングされたカウント)を提供することができる。カウンティングモジュールは、マッピングモジュールからマッピングされた配列リードを受信することができる。カウンティングモジュールは、マッピングモジュールからまたは正規化モジュールから正規化されマッピングされた配列リードを受信することができる。カウンティングモジュールは、カウント(例えば、カウント、組み立てられたカウントおよび/またはカウントの表示)に関連するデータおよび/または情報を、任意の他の適切な装置、周辺機器、またはモジュールに転送することができる。カウントに関連するデータおよび/または情報を、カウンティングモジュールから、正規化モジュール、プロットモジュール、分類モジュールおよび/または成果モジュールに転送することがある。
カウントされているマッピングされた配列リードは、本明細書において、未処理データと呼ばれるが、それはデータが操作されていないカウント(例えば、未処理カウント)を表すためである。いくつかの実施形態において、データセット内の配列リードデータをさらに処理(例えば、数学的に、および/または統計的に操作)し、かつ/または表示し、成果の提供を容易にすることができる。特定の実施形態において、大きなデータセットを含むデータセットは、前処理を行うことで、さらに分析を容易にし得る。データセットの前処理は、冗長および/または無益のゲノム片またはビン(例えば、無益のデータのビン、冗長にマッピングされたリード、中央値カウントがゼロのゲノム片、またはビン、過剰表現された、または過小表現された配列)の除去を含むことがある。理論に限定されないが、データ処理および/または前処理は、(i)ノイズデータを除去し、(ii)無益のデータを除去し、(iii)冗長なデータを除去し、(iv)大きなデータセットの複雑性を減少させ、かつ/または(v)1つの形態から1つまたはそれより多い他の形態へのデータの変換を容易し得る。データまたはデータセットに対して利用される場合、用語「前処理する」および「処理する」は、本明細書において、「処理する」と総称する。いくつかの実施形態において、処理することは、さらなる分析をより行いやすいデータを与えることができ、成果を作製することができる。
GCバイアスを決定することを(例えば、参照ゲノム(例えば、ゲノム片)の各部分のそれぞれに対するGCバイアスを決定すること)、GCバイアスモジュールにより(例えば、GCバイアスモジュールを含む装置により)提供することができる。いくつかの実施形態において、GCバイアスモジュールは、GCバイアスの決定を提供することを要求される。GCバイアスモジュールは、参照ゲノムの各部分のそれぞれにマッピングされた配列リードのカウントと、各部分のGC含量とのフィットさせた関係(例えば、フィットさせた線形関係)からGCバイアスの決定を提供することもある。GCバイアスモジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、GCバイアスの決定(すなわち、GCバイアスデータ)は、GCバイアスモジュールからの1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、GCバイアスデータは、マルチプロセッサ、例えば、並列に協動し、作用するプロセッサを含む装置により提供される。いくつかの実施形態において、GCバイアスモジュールは、1つまたはそれより多い外部のプロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。いくつかの実施形態において、GCバイアスデータは、以下の1つ以上を含む装置により提供される:1つまたはそれより多いフローセル、カメラ、流体処理コンポーネント、プリンタ、ディスプレイ(例えば、LED、LCTまたはCRT)など。GCバイアスモジュールは、適切な装置またはモジュールからデータおよび/または情報を受信することができる。GCバイアスモジュールは、シークエンシングモジュール、正規化モジュール、重み付けモジュール、マッピングモジュールまたはカウンティングモジュールからデータおよび/または情報を受信することができることもある。GCバイアスモジュールは、正規化モジュール(例えば、PERUN正規化モジュール)の一部であることもある。いくつかの実施形態において、GCバイアスモジュールは、シークエンシングモジュールからシークエンシングリード、マッピングモジュールからマッピングされた配列リードおよび/またはカウンティングモジュールからカウントを受信することができる。多くの場合、GCバイアスは、ある装置または別のモジュール(例えば、カウンティングモジュール)からデータおよび/または情報を受信し、データおよび/または情報を変換し、GCバイアスデータおよび/または情報(例えば、GCバイアスの決定、フィットさせた線形関係など)を提供する。特定の実施形態において、GCバイアスデータおよび/または情報を、GCバイアスモジュールから、レベルモジュール、フィルタリングモジュール、比較モジュール、正規化モジュール、重み付けモジュール、範囲設定モジュール、調節モジュール、分類モジュール、および/または成果モジュールに転送することができる。
参照ゲノムの各部分に対してレベル(例えば、上昇)を決定すること、および/またはゲノム片レベル(例えば、ゲノム片の上昇)を算出することを、レベルモジュールにより(例えば、レベルモジュールを含む装置により)提供することができる。いくつかの実施形態において、レベルモジュールは、レベルまたは算出されたゲノム片レベルを提供することを要求される。レベルモジュールは、GCバイアスと、参照ゲノムの各部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係(例えば、フィットさせた線形関係)からレベルを提供することもある。レベルモジュールは、PERUNの一部としてゲノム片レベルを算出することもある。いくつかの実施形態において、レベルモジュールは、式Li=(mi−GiS)I−1(式中、GiはGCバイアスであり、miは参照ゲノムの各部分にマッピングされたカウント測定値であり、iはサンプルであり、Iは切片であり、SはGCバイアスと、参照ゲノムの各部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係(例えば、フィットさせた線形関係)の傾きである)に従い、ゲノム片レベル(すなわち、Li)を提供する。レベルモジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、レベルの決定(すなわち、レベルデータ)は、レベルモジュールからの1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、レベルデータは、マルチプロセッサ、例えば、並列に協動し、作業するプロセッサを含む装置により提供される。いくつかの実施形態において、レベルモジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。いくつかの実施形態において、レベルデータは、以下の1つ以上を含む装置により提供される:1つまたはそれより多いフローセル、カメラ、流体処理コンポーネント、プリンタ、ディスプレイ(例えば、LED、LCTまたはCRT)など。レベルモジュールは、適切な装置またはモジュールからデータおよび/または情報を受信することができる。レベルモジュールは、GCバイアスモジュール、シークエンシングモジュール、正規化モジュール、重み付けモジュール、マッピングモジュールまたはカウンティングモジュールからデータおよび/または情報を受信することができることもある。いくつかの実施形態において、レベルモジュールは、シークエンシングモジュールからシークエンシングリード、マッピングモジュールからマッピングされたシークエンシングリードおよび/またはカウンティングモジュールからカウントを受信することができる。レベルモジュールは、正規化モジュール(例えば、PERUN正規化モジュール)の一部であることもある。多くの場合、レベルモジュールは、ある装置または別のモジュール(例えば、GCバイアスモジュール)からデータおよび/または情報を受信し、データおよび/または情報を変換し、レベルデータおよび/または情報(例えば、レベルの決定、フィットさせた線形関係など)を提供する。特定の実施形態において、レベルデータおよび/または情報を、レベルモジュールから、比較モジュール、正規化モジュール、重み付けモジュール、範囲設定モジュール、調節モジュール、分類モジュール、正規化モジュールのモジュールおよび/または成果モジュールに転送することができる。
ゲノム片をフィルタリングすることを、フィルタリングモジュールにより(例えば、フィルタリングモジュールを含む装置により)提供することができる。いくつかの実施形態において、フィルタリングモジュールは、フィルタリングされたゲノム片データ(例えば、フィルタリングされたゲノム片)を提供し、かつ/またはゲノム片を考慮に入れないことを要求される。フィルタリングモジュールは、ゲノム片にマッピングされたカウントを考慮に入れないこともある。フィルタリングモジュールは、上昇またはプロファイルの決定からゲノム片にマッピングされたカウントを除去することもある。フィルタリングモジュールは、当技術分野において公知の、または本明細書に記載の1つまたはそれより多いフィルタリング法によりデータ(例えば、カウント、ゲノム片にマッピングされたカウント、ゲノム片、ゲノム片の上昇、正規化されたカウント、未処理カウントなど)をフィルタリングすることができる。フィルタリングモジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、フィルタリングされたデータは、フィルタリングモジュールからの1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、フィルタリングされたデータは、マルチプロセッサ、例えば、並列に協動し、作業するプロセッサを含む装置により提供される。いくつかの実施形態において、フィルタリングモジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。いくつかの実施形態において、フィルタリングされたデータは、以下の1つ以上を含む装置により提供される:1つまたはそれより多いフローセル、カメラ、流体処理コンポーネント、プリンタ、ディスプレイ(例えば、LED、LCTまたはCRT)など。フィルタリングモジュールは、適切な装置またはモジュールからデータおよび/または情報を受信することができる。フィルタリングモジュールは、シークエンシングモジュール、正規化モジュール、重み付けモジュール、マッピングモジュールまたはカウンティングモジュールからデータおよび/または情報を受信することができることもある。いくつかの実施形態において、フィルタリングモジュールは、シークエンシングモジュールからシークエンシングリード、マッピングモジュールからマッピングされたシークエンシングリードおよび/またはカウンティングモジュールからカウントを受信することができる。多くの場合、フィルタリングモジュールは、別の装置またはモジュールからデータおよび/または情報を受信し、データおよび/または情報を変換し、フィルタリングされたデータおよび/または情報(例えば、フィルタリングされたカウント、フィルタリングされた値、フィルタリングされたゲノム片など)を提供する。特定の実施形態において、フィルタリングされたデータおよび/または情報を、フィルタリングモジュールから、比較モジュール、正規化モジュール、重み付けモジュール、範囲設定モジュール、調節モジュール、分類モジュール、および/または成果モジュールに転送することができる。
ゲノム片を重み付けすることを、重み付けモジュールにより(例えば、重み付けモジュールを含む装置により)提供することができる。いくつかの実施形態において、重み付けモジュールは、ゲノム片を重み付けし、かつ/または重み付けされたゲノム片値を提供することを要求される。重み付けモジュールは、当技術分野において公知の、または本明細書に記載の1つまたはそれより多い重み付け方法により、ゲノム片を重み付けすることができる。重み付けモジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、重み付けされたゲノム片は、重み付けモジュールからの1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、重み付けされたゲノム片は、マルチプロセッサ、例えば、並列に協動し、作用するプロセッサを含む装置により提供される。いくつかの実施形態において、重み付けモジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。いくつかの実施形態において、重み付けされたゲノム片は、以下の1つ以上を含む装置により提供される:1つまたはそれより多いフローセル、カメラ、流体処理コンポーネント、プリンタ、ディスプレイ(例えば、LED、LCTまたはCRT)など。重み付けモジュールは、適切な装置またはモジュールからデータおよび/または情報を受信することができる。重み付けモジュールは、シークエンシングモジュール、正規化モジュール、フィルタリングモジュール、マッピングモジュールおよび/またはカウンティングモジュールからデータおよび/または情報を受信することができることもある。いくつかの実施形態において、重み付けモジュールは、シークエンシングモジュールからシークエンシングリード、マッピングモジュールからマッピングされたシークエンシングリードおよび/またはカウンティングモジュールからカウントを受信することができる。いくつかの実施形態において、重み付けモジュールは、別の装置またはモジュールからデータおよび/または情報を受信し、データおよび/または情報を変換し、データおよび/または情報(例えば、重み付けされたゲノム片、重み付けされた値など)を提供する。特定の実施形態において、重み付けされたゲノム片データおよび/または情報を、重み付けモジュールから、比較モジュール、正規化モジュール、フィルタリングモジュール、範囲設定モジュール、調節モジュール、分類モジュール、および/または成果モジュールに転送することができる。
正規化されたデータ(例えば、正規化されたカウント)を、正規化モジュールにより(例えば、正規化モジュールを含む装置により)提供することができる。いくつかの実施形態において、正規化モジュールは、シークエンシングリードから得られた正規化されたデータ(例えば、正規化されたカウント)を提供することを要求される。正規化モジュールは、当技術分野において公知の1つまたはそれより多い正規化方法により、データ(例えば、カウント、フィルタリングされたカウント、未処理のカウント)を正規化することができる。正規化モジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、正規化されたデータは、正規化モジュールからの1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、正規化されたデータは、マルチプロセッサ、例えば、並列に協動し、作用するプロセッサを含む装置により提供される。いくつかの実施形態において、正規化モジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。いくつかの実施形態において、正規化されたデータは、以下の1つ以上を含む装置により提供される:1つまたはそれより多いフローセル、カメラ、流体処理コンポーネント、プリンタ、ディスプレイ(例えば、LED、LCTまたはCRT)など。正規化モジュールは、適切な装置またはモジュールからデータおよび/または情報を受信することができる。正規化モジュールは、シークエンシングモジュール、正規化モジュール、マッピングモジュールまたはカウンティングモジュールからデータおよび/または情報を受信することができることもある。いくつかの実施形態において、正規化モジュールは、シークエンシングモジュールからシークエンシングリード、マッピングモジュールからマッピングされたシークエンシングリードおよび/またはカウンティングモジュールからカウントを受信することができる。多くの場合、正規化モジュールは、別の装置またはモジュールからデータおよび/または情報を受信し、データおよび/または情報を変換し、正規化されたデータおよび/または情報(例えば、正規化されたカウント、正規化された値、正規化された参照値(NRV)など)を提供する。特定の実施形態において、正規化されたデータおよび/または情報を、正規化モジュールから、比較モジュール、正規化モジュール、範囲設定モジュール、調節モジュール、分類モジュール、および/または成果モジュールに転送することができる。正規化されたカウント(例えば、正規化されマッピングされたカウント)を、正規化モジュールから期待される表示モジュールおよび/または実験の表示モジュールに転送することもある。
いくつかの実施形態において、処理ステップは、データセットの種々の態様またはその派生物からの1つまたはそれより多いプロファイル(例えば、プロファイルプロット)を作製することを含むことができる(例えば、当技術分野において公知の、および/または本明細書に記載の1つまたはそれより多い数学的および/または統計学的データ処理ステップの生成物)。
データセットプロファイルは、カウントされ、マッピングされた配列リードデータの1つまたはそれより多い操作により作製することができる。いくつかの実施形態は以下を含む。配列リードをマッピングし、各ゲノムビンにマッピングした配列タグの数を決定する(例えば、カウントする)。未処理のカウントプロファイルを、カウントされ、マッピングされた配列リードから作製する。特定の実施形態において、成果を、試験被験体からの未処理のカウントプロファイルを、遺伝的変異を保持しないことが知られている参照被験体のセットからの染色体、ゲノム片またはその断片に対する参照中央カウントプロファイルと比較することにより提供される。
いくつかの実施形態において、値は上昇(例えば、数)に割り当てる。上昇を、適切な方法、動作または数学的プロセスにより決定することができる(例えば、処理された上昇)。本明細書において使用される場合、用語「レベル」は、本明細書において使用される場合、用語「上昇」と同義である。上昇は、多くの場合、ゲノム片のセットにおけるカウントであり、またはそのカウントから得られる(例えば、正規化されたカウント)。ゲノム片の上昇は、ゲノム片にマッピングされたカウント(例えば、正規化されたカウント)の合計に実質的に等しいこともある。多くの場合、上昇を、当技術分野において公知の、適切な方法、動作または数学的プロセスにより処理され、変換され、または操作されるカウントから決定される。上昇は、処理されるカウントから得られることもあり、処理されるカウントの非限定的な例として、重み付け、除去、フィルタリング、正規化、調節、平均化された、平均値として得られた(例えば、上昇の平均値)、加算、減算、変換されたカウントまたはそれらの組み合わせがある。上昇は、正規化されるカウント(例えば、ゲノム片の正規化されたカウント)を含むこともある。上昇は、適切なプロセスにより正規化されたカウントのものであってよく、その非限定的な例として、ビンワイズ正規化、GC含量による正規化、線形および非線形の最小二乗回帰、GC LOESS、LOWESS、PERUN、RM、GCRM、cQnなど、および/またはそれらの組み合わせがある。上昇は、正規化されたカウントまたは相対量のカウントを含むことができる。上昇は、平均化される2つまたはそれより多いゲノム片のカウントまたは正規化されたカウントのものであることもあり、その上昇は、平均の上昇と呼ばれる。上昇は、上昇の平均値と呼ばれるカウントの平均値または正規化されたカウントの平均値を有するゲノム片のセットのものであることもある。上昇は、未処理のおよび/またはフィルタリングされたカウントを含むゲノム片において得られることもある。いくつかの実施形態において、上昇は、未処理であるカウントに基づく。上昇は、不確定値と関連することもある。ゲノム片における上昇または「ゲノム片の上昇」は、本明細書における「ゲノム片レベル」と同義である。
いくつかの実施形態において、正規化されたカウントのプロファイルは、プロファイル内の別の上昇(例えば、第2の上昇)と有意に異なる上昇(例えば、第1の上昇)を含む。第1の上昇は、第2の上昇より高くまたは低くなり得る。いくつかの実施形態において、第1の上昇は、コピー数多型(例えば、母体のコピー数多型、胎児のコピー数多型、または母体のコピー数多型および胎児のコピー数多型)を含む1つまたはそれより多いリードを含むゲノム片のセットに対するものであり、第2の上昇は、実質的にコピー数多型を有しないリードを含むゲノム片のセットに対するものである。いくつかの実施形態において、有意に異なるとは、観察可能な差を指す。有意に異なるとは、統計学的に異なること、または統計学的に有意な差を指すこともある。統計学的に有意な差は、観察された差の統計学的な評価であることもある。統計学的に有意な差を、当技術分野において適切な方法により評価することができる。任意の適切な閾または範囲を使用し、2つの上昇が有意に異なることを決定することができる。いくつかの例において、約0.01パーセント以上(例えば、上昇値の1つまたはいずれかの0.01パーセント)で異なる2つの上昇(例えば、上昇の平均値)は、有意に異なる。約0.1パーセント以上で異なる2つの上昇(例えば、上昇の平均値)は、有意に異なることもある。いくつかの例において、約0.5パーセント以上で異なる2つの上昇(例えば、上昇の平均値)は、有意に異なる。約0.5、0.75、1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5または約10%超で異なる2つの上昇(例えば、上昇の平均値)は、有意に異なることもある。2つの上昇(例えば、上昇の平均値)が有意に異なることもあり、いずれかの上昇においてオーバーラップはなく、1つまたは両方の上昇において算出された不確定値により定義された範囲においてオーバーラップはない。いくつかの例において、不確定値は、シグマとして表される標準偏差である。2つの上昇(例えば、上昇の平均値)が有意に異なることもあり、約1倍以上の不確定値(例えば、1シグマ)で異なることもある。2つの上昇(例えば、上昇の平均値)が有意に異なることもあり、約2倍以上の不確定値(例えば、2シグマ)、約3倍以上、約4倍以上、約5倍以上、約6倍以上、約7倍以上、約8倍以上、約9倍以上または約10倍以上の不確定値で異なることもある。2つの上昇(例えば、上昇の平均値)は、約1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、または4.0倍の不確定値以上で異なるときに有意に異なることもある。いくつかの実施形態において、信頼水準は、2つの上昇間の差が増加するにつれて、増加する。いくつかの例において、信頼水準は、2つの上昇間の差が低下にするにつれて、かつ/または不確定値が増加するにつれて低下する。例えば、信頼水準は、各上昇と、標準偏差(例えば、MAD)との差の比とともに増加することもある。
第1の上昇は、比較モジュールにより、または比較モジュールを含む装置により第2の上昇から有意に異なるとして同定することができる。いくつかの実施形態において、比較モジュールまたは比較モジュールを含む装置は、2つの上昇間の比較を提供することを要求される。比較モジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、上昇は、比較モジュールからの1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により有意に異なることが決定される。いくつかの実施形態において、上昇は、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含む装置により、有意に異なることが決定される。いくつかの実施形態において、比較モジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。いくつかの実施形態において、上昇は、以下の1つ以上を含む装置により有意に異なることが決定される:1つまたはそれより多いフローセル、カメラ、流体処理コンポーネント、プリンタ、ディスプレイ(例えば、LED、LCTまたはCRT)など。比較モジュールは、適切なモジュールからデータおよび/または情報を受信することができる。比較モジュールは、シークエンシングモジュール、マッピングモジュール、カウンティングモジュール、または正規化モジュールからデータおよび/または情報を受信することができる。比較モジュールは、正規化モジュールから正規化されたデータおよび/または情報を受信することができる。比較モジュールから得られ、または変換されたデータおよび/または情報を、比較モジュールから、範囲設定モジュール、プロットモジュール、調節モジュール、分類モジュールまたは成果モジュールに転送することができる。2つ以上の上昇間の比較および/または別の上昇と有意に異なる場合の上昇の同定を、比較モジュールから、分類モジュール、範囲設定モジュールまたは調節モジュールに転送(例えば、提供)することができる。
プロファイルは、参照上昇(例えば、参照として使用される上昇)を含むこともある。多くの場合、正規化されたカウントのプロファイルは、上昇の期待値および期待範囲を決定する参照上昇を、提供する(以下の上昇期待値および範囲の説明を参照のこと)。参照上昇は、多く場合、母親および胎児の両方からのマッピングされたリードを含むゲノム片の正規化されたカウントに対するのものである。参照上昇は、多くの場合、胎児および母親(例えば、妊娠女性)からのマッピングされたリードの正規化されたカウントの和である。参照上昇は、正倍数体の母親および/または正倍数体の胎児からのマッピングされたリードを含むゲノム片に対するのものであることもある。参照上昇は、胎児の遺伝的変異(例えば、異数性(例えば、トリソミー))を有するマッピングされたリードおよび/または母体の遺伝的変異(例えば、コピー数多型、挿入、欠失)を有するリードを含むゲノム片に対するのものであることもある。参照上昇は、実質的に母体および/または胎児のコピー数多型を含まないゲノム片に対するのものであることもある。第2の上昇を、参照上昇として使用することもある。いくつかの例において、プロファイルは、正規化されたカウントの第1の上昇、および正規化されたカウントの第2の上昇を含み、第1の上昇は、第2の上昇と有意に異なり、第2の上昇は参照上昇である。いくつかの例において、プロファイルは、ゲノム片の第1のセットにおける正規化されたカウントの第1の上昇、ゲノム片の第2のセットにおける正規化されたカウントの第2の上昇を含み、ゲノム片の第1のセットは、母体および/または胎児のコピー数多型を有するマッピングされたリードを含み、ゲノム片の第2のセットは、実質的に母体のコピー数多型および/または胎児のコピー数多型を有さないマッピングされたリードを含み、第2の上昇は参照上昇である。
上昇期待値は、予め定義された上昇(例えば、理論上の上昇、上昇予測値)であることもある。本明細書において「上昇期待値」は、「所定の上昇値」と呼ばれることもある。いくつかの実施形態において、上昇期待値は、コピー数多型を含むゲノム片のセットに対して正規化されたカウントの上昇において予測された値である。いくつかの例において、上昇期待値を、実質的にコピー数多型を含まないゲノム片のセットにおいて決定する。上昇期待値を、染色体倍数性(例えば、0、1、2(すなわち、2倍体)、3または4染色体)または微小倍数性(ホモ接合またはヘテロ接合の欠失、重複、挿入またはその非存在)に対して決定することができる。多くの場合、上昇期待値を、母体の微小倍数性(例えば、母体および/または胎児のコピー数多型)に対して決定する。
上昇期待定数を、適切な方法により決定することができる。上昇期待定数を任意に決定することもある。多くの場合、上昇期待定数を、経験的に決定する。上昇期待定数を、数学的操作に従い決定することもある。上昇期待定数を、参照(例えば、参照ゲノム、参照サンプル、参照試験データ)に従い決定することもある。いくつかの実施形態において、上昇期待定数を、遺伝的変異またはコピー数多型(例えば、重複、挿入または欠失)の有無を表す上昇に対して予め決定する。いくつかの実施形態において、上昇期待定数を、母体のコピー数多型、胎児のコピー数多型または母体のコピー数多型および胎児のコピー数多型の有無を表す上昇に対して予め決定する。コピー数多型に対する上昇期待定数は、任意の適切な定数または定数のセットであってよい。
遺伝的変異またはコピー数多型(例えば、母体のコピー数多型、胎児のコピー数多型または母体のコピー数多型および胎児のコピー数多型)の有無を、上昇期待範囲内または外にある上昇により決定することもある。上昇期待範囲は、多くの場合、上昇期待値に従い決定される。上昇期待範囲を、実質的に遺伝的変異を含まず、または実質的にコピー数多型を含まない上昇に対して決定することもある。適切な方法を使用し、上昇期待範囲を決定することができる。
式R:(上昇期待範囲)k=(上昇期待値)k+nσ
により定義することができることもある。
別の上昇(例えば、第2の上昇)と有意に異なる上昇(例えば、第1の上昇)は、多くの場合、上昇期待範囲に従い、コピー数多型(例えば、母体および/または胎児のコピー数多型、胎児のコピー数多型、欠失、重複、挿入)として分類されることができる。いくつかの実施形態において、コピー数多型の存在を、第1の上昇が第2の上昇と有意に異なり、第1の上昇がコピー数多型に対する上昇期待範囲にあるときに分類する。例えば、コピー数多型(例えば、母体および/または胎児のコピー数多型、胎児のコピー数多型)を、第1の上昇が第2の上昇と有意に異なり、第1の上昇がコピー数多型に対して上昇期待範囲内にあるときに分類することができる。ヘテロ接合重複(例えば、母体もしは胎児の、または母体および胎児のヘテロ接合重複)またはヘテロ接合欠失(例えば、母体もしくは胎児の、または母体および胎児のヘテロ接合欠失)を、第1の上昇が第2の上昇と有意に異なり、第1の上昇がヘテロ接合重複またはヘテロ接合欠失それぞれに対して上昇期待範囲内にあるときに分類することもある。ホモ接合重複またはホモ接合欠失を、第1の上昇が第2の上昇と有意に異なり、第1の上昇がホモ接合重複またはホモ接合欠失それぞれに対して上昇期待範囲内にあるときに分類することもある。
種々のコピー数多型(例えば、重複、挿入および/または欠失)に対する期待範囲(例えば、上昇期待範囲)またはコピー数多型の非存在に対する範囲を、範囲設定モジュールにより、または範囲設定モジュールを含む装置により提供することができる。いくつかの例において、上昇期待値は、範囲設定モジュールにより、または範囲設定モジュールを含む装置により提供される。いくつかの実施形態において、範囲設定モジュールまたは範囲設定モジュールを含む装置は、上昇期待値および/または範囲を提供することを要求される。範囲設定モジュールは、別のモジュールまたは装置からデータおよび/または情報を収集し、組み立て、かつ/または受信することもある。範囲設定モジュールまたは範囲設定モジュールを含む装置は、別のモジュールまたは装置にデータおよび/または情報を提供し、かつ/または転送することもある。範囲設定モジュールは、コンポーネントまたは周辺機器からデータおよび/または情報を承認し、収集することもある。多くの場合、範囲設定モジュールは、上昇、参照上昇、不確定値、および/または定数を収集し、かつ組み立てる。範囲設定モジュールは、装置のオペレータから入力データおよび/または情報を承認し、かつ収集することもある。例えば、装置のオペレータは、モジュールに定数、閾値、式、または所定の値を提供することもある。範囲設定モジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、上昇期待値および期待範囲は、範囲設定モジュールからの1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、期待範囲および上昇は、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含む装置により提供される。いくつかの実施形態において、範囲設定モジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。いくつかの実施形態において、期待範囲は、適切な周辺機器またはコンポーネントを含む装置により提供される。範囲設定モジュールは、正規化モジュールから正規化されたデータまたは比較モジュールから比較データを受信することができる。範囲設定モジュール(例えば、設定範囲、範囲限界、上昇期待範囲、閾、および/または閾範囲)から得られ、またはそれにより変換されたデータおよび/または情報を、範囲設定モジュールから、調節モジュール、成果モジュール、分類モジュール、プロットモジュールまたは他の適切な装置および/またはモジュールに転送することができる。
コピー数多型(例えば、母体および/または胎児のコピー数多型、胎児のコピー数多型、重複、挿入、欠失)を、分類モジュールにより、または分類モジュールを含む装置により分類することができる。コピー数多型(例えば、母体および/または胎児のコピー数多型)を、分類モジュールにより分類することもある。別の上昇(例えば、第2の上昇)と有意に異なると決定された上昇(例えば、第1の上昇)を、分類モジュールによりコピー数多型を表すものとして同定することもある。コピー数多型の非存在を、分類モジュールにより決定することもある。いくつかの実施形態において、コピー数多型の決定を、分類モジュールを含む装置により決定することができる。分類モジュールを、母体および/または胎児のコピー数多型、胎児のコピー数多型、重複、欠失もしくは挿入またはその欠如あるいは上記の組み合わせを分類するために特化することができる。例えば、母体の欠失を同定する分類モジュールは、胎児の重複を同定する分類モジュールと異なり、かつ/または区別することがきる。いくつかの実施形態において、分類モジュールまたは分類モジュールを含む装置は、コピー数多型またはコピー数多型を決定する成果を同定することを要求される。分類モジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、コピー数多型またはコピー数多型を決定する成果は、分類モジュールからの1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により分類される。いくつかの実施形態において、コピー数多型またはコピー数多型を決定する成果を、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含み得る装置により分類する。いくつかの実施形態において、分類モジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。分類モジュールは、コンポーネントまたは周辺機器に、またはそこからデータおよび/または情報を転送し、または受信し、かつ/または収集することもある。多くの場合、分類モジュールは、カウント、上昇、プロファイル、正規化されたデータおよび/または情報、参照上昇、上昇期待値、期待範囲、不確定値、調節、調節された上昇、プロット、比較および/または定数を受信し、収集し、かつ/または組み立てる。分類モジュールは、装置のオペレータから入力データおよび/または情報を承認し、収集することもある。例えば、装置のオペレータは、モジュールに定数、閾値、式または所定の値を提供することもある。いくつかの実施形態において、データおよび/または情報は、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含む装置により提供される。いくつかの実施形態において、コピー数多型またはコピー数多型を決定する成果の同定または分類は、適切な周辺機器またはコンポーネントを含む装置により提供される。分類モジュールは、別のモジュールまたは装置からデータおよび/または情報を収集し、組み立て、かつ/または受信することもある。分類モジュールは、正規化モジュールから正規化されたデータ、範囲設定モジュールから上昇期待値および/または範囲、比較モジュールから比較データ、プロットモジュールからプロット、および/または調節モジュールから調節データを受信することができる。分類モジュールは、受信するデータおよび/または情報を、コピー数多型の有無の決定に変換することができる。分類モジュールは、受信するデータおよび/または情報を、上昇がコピー数多型または特殊な種類のコピー数多型(例えば、母体のホモ接合欠失)を含むゲノム片を表す決定に変換することができる。コピー数多型またはコピー数多型を決定する成果に関連するデータおよび/または情報を、分類モジュールから、適切な装置および/またはモジュールに転送することができる。本明細書に記載の方法により分類されたコピー数多型またはコピー数多型を決定する成果を、さらなる試験(例えば、母体および/または胎児の核酸の標的化シークエンシング)により独立して検証することができる。
いくつかの実施形態において、胎児画分を母体および/または胎児のコピー数多型を表すものとして分類された上昇に従い決定する。例えば、胎児画分を決定することは、多くの場合、胎児画分の決定に利用される母体および/または胎児のコピー数多型に対する上昇期待値を評価することを含む。胎児画分を、同じ種類のコピー数多型に対して決定された上昇期待範囲に従い、コピー数多型を表すものとして分類された上昇(例えば、第1の上昇)に対して決定することもある。多くの場合、胎児画分を、上昇期待範囲内にある上昇観察値に従い決定し、それにより母体および/または胎児のコピー数多型として分類する。胎児画分を、母体および/または胎児のコピー数多型として分類された上昇観察値(例えば、第1の上昇)が同じ母体および/または胎児のコピー数多型に対して決定された上昇期待値と異なるときに決定することもある。
いくつかの実施形態において、1つまたはそれより多い上昇を調節する。上昇を調節する方法は、多くの場合、パディングと呼ばれる。いくつかの実施形態において、プロファイル(例えば、ゲノムのプロファイル、染色体プロファイル、染色体の部分または断片のプロファイル)の複数の上昇を調節する。プロファイルの約1〜約10,000以上の上昇を調節することもある。プロファイルの約1〜約1000、1〜約900、1〜約800、1〜約700、1〜約600、1〜約500、1〜約400、1〜約300、1〜約200、1〜約100、1〜約50、1〜約25、1〜約20、1〜約15、1〜約10、または1〜約5の上昇を調節することもある。1つの上昇を調節することもある。いくつかの実施形態において、第2の上昇と有意に異なる上昇(例えば、正規化されたカウントプロファイルの第1の上昇)を調節する。コピー数多型として分類された上昇を調節することもある。第2の上昇と有意に異なる上昇(例えば、正規化されたカウントプロファイルの第1の上昇)を、コピー数多型(例えば、コピー数多型、例えば、母体のコピー数多型)として分類し、調節することもある。いくつかの実施形態において、上昇(例えば、第1の上昇)は、母体のコピー数多型、胎児のコピー数多型、または母体のコピー数多型および胎児のコピー数多型の上昇期待範囲内にあり、上昇を調節する。1つまたはそれより多い上昇(例えば、プロファイルの上昇)を調節しないこともある。いくつかの実施形態において、上昇(例えば、第1の上昇)は、コピー数多型において上昇期待範囲外にあり、上昇を調節しない。多くの場合、コピー数多型の非存在において、上昇期待範囲内の上昇を調節しない。任意の適切な数の調節を、プロファイルの1つまたはそれより多い上昇に行うことができる。いくつかの実施形態において、1つまたはそれより多い上昇を調節する。2以上、3以上、5以上、6以上、7以上、8以上、9以上および10以上の上昇を調節することもある。
いくつかの実施形態において、第1の上昇の値を、第2の上昇の値に従い調節する。コピー数多型を表すものとして同定される第1の上昇を、第2の上昇が、多くの場合、コピー数多型と関連しない場合、第2の上昇の値に調節することもある。いくつかの例において、コピー数多型を表すものとして同定される第1の上昇の値を、第1の上昇の値が第2の上昇の値にほぼ等しくなるように調節する。
PAVk=(上昇期待値)k×(PAV係数)k 。
いくつかの実施形態において、調節(例えば、上昇またはプロファイルに対する調節)は、調節モジュールにより、または調節モジュールを含む装置によりなされる。いくつかの実施形態において、調節モジュールまたは調節モジュールを含む装置は、上昇を調節することを要求される。調節モジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、調節された上昇は、調節モジュールからの1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、上昇は、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含み得る装置により調節される。いくつかの実施形態において、調節モジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。調節モジュールを含む装置は、別のモジュールまたは装置からデータおよび/または情報を収集し、組み立て、かつ/または受信することもある。調節モジュールを含む装置は、別のモジュールまたは装置にデータおよび/または情報を提供し、かつ/または転送することもある。
いくつかの実施形態において、カウント、上昇、および/またはプロファイルをプロット(例えば、グラフ作成)する。プロット(例えば、グラフ)は、調節を含むこともある。プロットは、カウント、上昇、および/またはプロファイルの調節を含むこともある。カウント、上昇、および/またはプロファイルをプロットし、カウント、上昇、および/またはプロファイルは調節を含むこともある。多くの場合、カウント、上昇、および/またはプロファイルをプロットし、カウント、上昇、および/またはプロファイルを比較する。コピー数多型(例えば、異数性、コピー数多型)を、カウント、上昇、および/またはプロファイルのプロットから同定し、かつ/または分類することもある。成果を、カウント、上昇、および/またはプロファイルのプロットから決定することもある。いくつかの実施形態において、プロット(例えば、グラフ)を、プロットモジュールまたはプロットモジュールを含む装置により作られる(例えば、作製される)。いくつかの実施形態において、プロットモジュールまたはプロットモジュールを含む装置は、カウント、上昇またはプロファイルをプロットすることを要求される。プロットモジュールは、プロットを表示し、またはプロットをディスプレイ(例えば、表示モジュール)に送信することができる。プロットモジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、プロットは、プロットモジュールからの1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、プロットは、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含み得る装置により作られる。いくつかの実施形態において、プロットモジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。プロットモジュールを含む装置は、別のモジュールまたは装置からデータおよび/または情報を収集し、組み立て、かつ/または受信することもある。プロットモジュールは、コンポーネントまたは周辺機器からデータおよび/または情報を受信し、収集することもある。多くの場合、プロットモジュールは、配列リード、ゲノム片、マッピングされたリード、カウント、上昇、プロファイル、参照上昇、上昇期待値、上昇期待範囲、不確定値、比較、分類された上昇(例えば、コピー数多型として同定された上昇)および/または成果、調節ならびに/または定数を受信し、収集し、組み立て、かつ/またはプロットする。プロットモジュールは、装置のオペレータから入力データおよび/または情報を承認し、収集することもある。例えば、装置のオペレータは、定数、閾値、式または所定の値をプロットモジュールに提供することもある。いくつかの実施形態において、データおよび/または情報は、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含む装置により提供される。いくつかの実施形態において、カウント、上昇および/またはプロファイルを、適切な周辺機器またはコンポーネントを含む装置によりプロットする。プロットモジュールを含む装置は、正規化モジュールから正規化されたデータ、範囲設定モジュールから範囲、比較モジュールから比較データ、分類モジュールから分類データおよび/または調節モジュールから調節データを受信することができる。プロットモジュールは、データおよび/または情報を受信し、データおよび/または情報を変換することができ、プロットされたデータを提供した。プロットモジュールを含む装置は、データおよび/または情報を別のモジュールまたは装置に提供し、かつ/または転送することもある。プロットモジュールを含む装置は、カウント、上昇および/またはプロファイルをプロットし、プロットに関連するデータおよび/または情報を適切な装置および/またはモジュールに提供し、または転送することができる。多くの場合、プロットモジュールは、上昇(例えば、プロファイル、第1の上昇)を受信し、収集し、組み立て、かつ/またはプロットし、プロットされたデータおよび/または情報を調節モジュールおよび/または比較モジュールに転送し、かつそこから転送する。プロットされたデータおよび/または情報を、プロットモジュールから、分類モジュールおよび/または周辺機器(例えば、ディスプレイまたはプリンタ)に転送することもある。いくつかの実施形態において、プロットが分類され、および/または遺伝的変異(例えば、異数性)またはコピー数多型(例えば、母体および/または胎児のコピー数多型)を含むと決定される。本明細書に記載の方法によりプロットされたカウント、上昇および/またはプロファイルを、さらなる試験により(例えば、母体およびまたは(and or)胎児の核酸の標的化シークエンシングにより)、独立して検証し、かつ/または調節することができる。
本明細書に記載の方法は、サンプルの遺伝的変異(例えば、胎児異数性)の有無の決定を提供することができ、それにより成果を提供することができる(例えば、それにより、遺伝的変異(例えば、胎児異数性)の有無を決定する成果を提供する)。遺伝的変異は、多くの場合、参照に対する試験被験体のゲノムまたは遺伝情報の検出可能な変化を生ずる遺伝情報(例えば、染色体、染色体の断片、多型領域、転座領域、改変ヌクレオチド配列など、または上記の組み合わせ)の増加、減少および/または変更(例えば、重複、欠失、融合、挿入、突然変異、再構成、置換または異常なメチル化)を含む。遺伝的変異の有無は、ゲノム片(例えば、ゲノムビン)にマッピングされている配列リードを変換し、分析し、かつ/または操作することにより決定することができる。
遺伝的変異の有無(異数性、胎児異数性、コピー数多型)を、成果モジュールにより、または成果モジュールを含む装置により同定することができる。遺伝的変異を成果モジュールにより同定することもある。多くの場合、異数性の有無の決定を、成果モジュールにより同定する。いくつかの実施形態において、遺伝的変異(異数性、コピー数多型)を決定する成果を、成果モジュールにより、または成果モジュールを含む装置により同定することができる。成果モジュールを、特定の遺伝的変異(例えば、トリソミー、トリソミー21、トリソミー18)を決定するために特殊化することができる。例えば、トリソミー21を同定する成果モジュールは、トリソミー18を同定する成果モジュールと異なり、かつ/または区別され得る。いくつかの実施形態において、成果モジュールまたは成果モジュールを含む装置は、遺伝的変異または遺伝的変異を決定する成果(例えば、異数性、コピー数多型)を同定することを要求される。成果モジュールを含む装置は、少なくとも1つのプロセッサを含むことができる。いくつかの実施形態において、遺伝的変異または遺伝的変異を決定する成果は、成果モジュールから1つまたはそれより多い命令(例えば、プロセス、ルーティンおよび/またはサブルーティン)を行い、かつ/または実行することができるプロセッサ(例えば、1つまたはそれより多いプロセッサ)を含む装置により提供される。いくつかの実施形態において、遺伝的変異または遺伝的変異を決定する成果は、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含み得る装置により同定される。いくつかの実施形態において、成果モジュールは、1つまたはそれより多い外部プロセッサ(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))とともに動作する。成果モジュールを含む装置は、別のモジュールまたは装置からデータおよび/または情報を収集し、組み立て、かつ/または受信することもある。成果モジュールを含む装置は、別のモジュールまたは装置にデータおよび/または情報を提供し、かつ/または転送することもある。成果モジュールは、コンポーネントまたは周辺機器に、またはそこからデータおよび/または情報を転送し、受信し、または収集することもある。多くの場合、成果モジュールは、カウント、上昇、プロファイル、正規化されたデータおよび/または情報、参照上昇、上昇期待値、期待範囲、不確定値、調節、上昇調節値、プロット、分類された上昇、比較および/または定数を受信し、収集し、かつ/または組み立てる。成果モジュールは、装置のオペレータから入力データおよび/または情報を承認し、収集する。例えば、装置のオペレータは、定数、閾値、式または所定の値を、成果モジュールに提供することもある。いくつかの実施形態において、データおよび/または情報は、マルチプロセッサ、例えば、並列に協動し、かつ作用するプロセッサを含む装置により提供される。いくつかの実施形態において、遺伝的変異または遺伝的変異を決定する成果の同定は、適切な周辺機器またはコンポーネントを含む装置により提供される。成果モジュールを含む装置は、正規化モジュールからの正規化されたデータ、範囲設定モジュールからの上昇期待値および/または範囲、比較モジュールからの比較データ、分類モジュールからの分類された上昇、プロットモジュールからのプロットおよび/または調節モジュールからの調節データを受信することができる。成果モジュールは、データおよび/または情報を受信し、データおよび/または情報を変換し、成果を提供することができる。成果モジュールは、遺伝的変異または遺伝的変異を決定する成果に関連するデータおよび/または情報を、適切な装置および/またはモジュールに提供し、または転送することができる。本明細書に記載の方法により同定された遺伝的変異または遺伝的変異を決定する成果を、さらなる試験により(例えば、母体および/または胎児の核酸の標的化シークエンシングにより)独立して検証することができる。
遺伝的変異の有無を決定する1つまたはそれより多い成果を含むレポートを受け取る、医療専門家または他の有資格者は、レポート内に表示されたデータを使用し、試験被験体または患者の状態に関する呼び出しを作製することができる。いくつかの実施形態において、医療専門家は、提供された成果に基づき提言を作製することができる。いくつかの実施形態において、医療専門家または有資格者は、レポートに提供された成果値または各値および関連の信頼パラメータに基づき、遺伝的変異の有無に関する呼び出しまたはスコアを試験被験体または患者に提供することができる。特定の実施形態において、スコアまたは呼び出しを、提供されたレポートの目視観察を使用して、医療専門家または有資格者により手入力で作製する。特定の実施形態において、スコアまたは呼び出しを、ソフトウェアに組み込まれることもある自動ルーティンにより作製し、試験被験体または患者に情報を提供する前に精度を医療専門家または有資格者が再検討する。本明細書において使用される場合、用語「レポートを受け取る」は、医療専門家または他の有資格者が再検討した上で、試験被験体または患者の遺伝的変異の有無に関する決定を行うことを可能にする成果を含む、書面のおよび/またはグラフ表示を通信手段により得ることを指す。レポートを、コンピュータにより、またはヒトのデータ入力により作製することができ、電子手段により(例えば、インターネット上、コンピュータを介して、ファックスを介して、同じまたは異なる物理的な地域での1つのネットワークの場所から別の場所)またはデータを送受信する他の方法(メールサービス、宅配サービスなど)により通信することができる。いくつかの実施形態において、成果を、口頭、文書、またはファイル形態を含むが限定されない適切な媒体において医療専門家に伝送する。ファイルは、例えば、可聴ファイル、コンピュータ読み取り可能ファイル、紙面ファイル、実験室ファイルまたは医療記録ファイルであり得るが、それらに限定されない。
上記に記載のように、データを、ある形態から別の形態に変換することもある。本明細書において使用される場合、用語「変換した」、「変換」および文法的派生語またはその等価物は、物理的開始材料(例えば、試験被験体および/または参照被験体サンプル核酸)から、物理的開始材料(例えば、配列リードデータ)のデジタル表示へのデータの変更を指し、いくつかの実施形態において、成果を提供するために利用することができるデジタル表示の1つまたはそれより多い数値またはグラフ表示へのさらなる変換を含む。特定の実施形態において、デジタル表示されたデータの1つまたはそれより多い数値および/またはグラフ表示を利用し、試験被験体の物理的ゲノム(例えば、ゲノム挿入、重複または欠失の有無を仮想的に表し、または視覚的に表し、病状に関連する配列の物理量の分散の有無を表す)の様子を表すことができる。仮想的な表示は、開始材料のデジタル表示の1つまたはそれより多い数値またはグラフ表示にさらに変換されることもある。これらの方法は、物理的開始材料を、数値もしくはグラフ表示または試験被験体のゲノムの物理的な様子の表示に変換することができる。
特定の態様において、1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、メモリが、1つまたはそれより多いプロセッサにより実行可能な命令を含み、参照ゲノムのゲノム片にマッピングされた試験被験体からの血中細胞非含有サンプル核酸の配列リードのカウントを含み、1つまたはそれより多いプロセッサにより実行可能な命令を、(a)ゲノム片のそれぞれに対して配列リードのカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、(b)(a)のサンプル正規化されたカウントプロファイルから染色体異常断片もしくは胎児の異数性または両方の有無を決定するよう構成されるシステムを提供される。
特定の態様において、1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、メモリが、1つまたはそれより多いプロセッサにより実行可能な命令を含み、参照ゲノムの各部分にマッピングされた配列リードのカウントを含み、配列リードが、試験サンプルからの循環無細胞核酸のリードであり、1つまたはそれより多いプロセッサにより実行可能な命令が、(a)(i)参照ゲノムの各部分のそれぞれにマッピングされた配列リードのカウントと、(ii)各部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの各部分のそれぞれにグアニンおよびシトシン(GC)バイアスを決定し、(b)(i)GCバイアスと、(ii)参照ゲノムの各部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの各部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供することにより、参照ゲノムの各部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成されるシステムが提供される。
特定の態様において、1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、メモリが、1つまたはそれより多いプロセッサにより実行可能な命令を含み、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードが、妊娠女性からの循環無細胞核酸のリードであり、1つまたはそれより多いプロセッサにより実行可能な命令が、(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それによりゲノム片について正規化されたカウントのプロファイルを提供し、(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し(第1の上昇がゲノム片の第1のセットについてのものであり、第2の上昇がゲノム片の第2のセットについてのものである)、(c)ゲノムのセグメントについての不確定値に従いホモ接合およびヘテロ接合のコピー数多型の上昇期待範囲を決定し、(d)第1の上昇が上昇期待範囲の1つ内にあるときに所定の値により第1の上昇を調節し、それにより、第1の上昇を調節し、(e)(d)の調節を含むゲノム片の上昇に従い胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無を決定する成果を核酸配列リードから作製するよう構成されるシステムが提供される。
本明細書に記載の特定のプロセスおよび方法(例えば、配列リード、カウント、上昇(例えば、各上昇)および/またはプロファイルを定量し、マッピングし、正規化し、範囲設定し、調節し、分類し、カウントし、かつ/または決定する)は、多くの場合、コンピュータ、プロセッサ、ソフトウェア、モジュールまたは他の装置を用いずに行うことはできない。本明細書に記載の方法は、典型的に、コンピュータ実行方法であり、方法の1つまたはそれより多い部分が、1つまたはそれより多いプロセッサにより行われることもある。本明細書に記載の方法に関する実施形態は、一般に、本明細書に記載のシステム、装置およびコンピュータプログラム製品の命令により実行される同じまたは関連のプロセスに利用可能である。いくつかの実施形態において、本明細書に記載のプロセスおよび方法(例えば、配列リード、カウント、上昇および/またはプロファイルの定量、カウントおよび/または決定)を、自動化方法により行うことができる。いくつかの実施形態において、自動化方法は、配列リード、カウント、マッピング、マッピングされた配列タグ、上昇、プロファイル、正規化、比較、範囲設定、分類、調節、プロット、成果、変換および同定を決定するソフトウェア、モジュール、プロセッサ、周辺機器および/または同様のものを含む装置において具体化される。本明細書において使用される、ソフトウェアは、プロセッサにより実行されるときに、本明細書に記載のようにコンピュータ動作を行うコンピュータ読み取り可能プログラム命令を指す。
いくつかの実施形態において、コンピュータプログラム製品、例えば、コンピュータ読み取り可能なプログラムコードを中に具体化するコンピュータ利用な可能な媒体を含むコンピュータプログラム製品などを提供し、コンピュータ読み取り可能なプログラムコードは、以下を含む方法を実行するよう、実行に適応させた:(a)試験被験体からサンプル核酸の配列リードを得、(b)ゲノム片に分割されている既知のゲノムに(a)で得られた配列リードをマッピングし、(c)ゲノム片内にマッピングされた配列リードをカウントし、(d)(c)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、(e)(d)のサンプル正規化されたカウントプロファイルから遺伝的変異の有無を決定する。
遺伝的分散の有無を、本明細書に記載の方法または装置を使用して決定することができる。特定の実施形態において、1つまたはそれより多い遺伝的変異の有無を、本明細書に記載の方法および装置により提供される成果に従い決定する。遺伝的変異は、一般に、特定の個体に存在する具体的な遺伝表現型であり、多くの場合、遺伝的変異は、個体の統計学的有意な部分集合に存在する。いくつかの実施形態において、遺伝的変異は、染色体異常(例えば、異数性)、部分的染色体異常またはモザイクであり、これらのそれぞれを本明細書においてさらに詳細に説明する。遺伝的変異の非限定的な例として、1つまたはそれより多い欠失(例えば、微小欠失)、重複(例えば、微小重複)、挿入、突然変異、多型(例えば、一塩基多型)、融合、繰り返し(例えば、縦列型反復配列)、個別のメチル化部位、個別のメチル化パターンなど、およびそれらの組み合わせがある。挿入、繰り返し、欠失、重複、突然変異または多型は、任意の長さであってよく、いくつかの実施形態において、約1塩基または塩基対(bp)〜約250メガ塩基長(Mb)である。いくつかの実施形態において、挿入、繰り返し、欠失、重複、突然変異または多型は、約1塩基または塩基対(bp)〜約1,000キロ塩基長(例えば、約10bp、50bp、100bp、500bp、1kb、5kb、10kb、50kb、100kb、500kb、または1000kb長)である。
いくつかの実施形態において、胎児の性別または性関連障害(例えば、性染色体異数性)の予測を、本明細書に記載の方法または装置により決定することができる。性別決定は、一般に、性染色体に基づく。ヒトにおいて、性染色体は2つ、XおよびY染色体がある。Y染色体は、遺伝子、SRYを含有し、これは、男性としての胚発育を誘発する。ヒトおよび他の哺乳類動物のY染色体はまた、正常な精子産生に必要な他の遺伝子を含有する。XXの個体は女性であり、XYは男性であり、非限定的な多型は、多くの場合、性染色体異数性と呼ばれ、X0、XYY、XXXおよびXXYを含む。いくつかの例において、男性は、2本のX染色体および1本染色体(XXY;クラインフェルター症候群)または1本のX染色体および2本のY染色体(XYY症候群;ヤコブ症)を有し、一部の女性は、3本のX染色体(XXX;トリプルX症候群)または2本の代わりに1本のX染色体(X0;ターナー症候群)を有する。いくつかの例において、個体の細胞の一部のみが、モザイク(例えば、ターナーモザイク)と呼ばれ得る性染色体異数性により影響される。他の例は、SRYが損傷し(XY女性を生じる)またはXにコピーされる(XX男性を生じる)ものを含む。
いくつかの実施形態において、胎児染色体異常の有無を、本明細書に記載の方法または装置を使用することにより決定することができる。染色体異常は、染色体全体または1つまたはそれより多い遺伝子を含む染色体の領域の増加または消失を含むが限定されない。染色体異常は、不均衡転座により生じる欠失および重複を含む、モノソミー、トリソミー、ポリソミー、ヘテロ接合性の消失、1つまたはそれより多いヌクレオチド配列(例えば、1つまたはそれより多い遺伝子)の欠失および/または重複を含む。本明細書において使用される場合、用語「異数性」および「異数体」は、生体の細胞の異常な数の染色体を指す。異なる生体が広範囲の異なる染色体相補体を有する場合、用語「異数性」は、具体的な数の染色体を指さず、むしろ生体の所与の細胞または各細胞内の染色体含量が異常である状況を指す。いくつかの実施形態において、本明細書における用語「異数性」は、染色体全体または染色体の一部の消失または増加により生じた遺伝物質の不均衡さを指す。「異数性」は、染色体の断片の1つまたはそれより多い欠失および/または挿入を指し得る。
いくつかの実施形態において、妊娠高血圧腎症の有無を、本明細書に記載の方法または装置を使用することにより決定する。妊娠高血圧腎症は、高血圧が妊娠中に生じ(すなわち、妊娠誘発性高血圧)、かなりの量の尿タンパク質を伴う状態である。いくつかの例において、妊娠高血圧腎症はまた、細胞外核酸レベルの上昇および/またはメチル化パターンの変更を伴う。例えば、細胞外の胎児由来の高メチル化RASSF1Aレベルと、妊娠高血圧腎症の重症度との間に正の相関が認められている。特定の例において、DNAメチル化の増大が、正常な対照と比較して妊娠高血圧腎症の胎盤のH19遺伝子において認められている。
いくつかの実施形態において、病原性状態の有無を、本明細書に記載の方法または装置により決定する。病原性状態は、細菌、ウイルスまたは真菌を含むがそれらに限定されない病原による宿主の感染により生じ得る。病原は、典型的に、宿主の核酸と区別することができる核酸(例えば、ゲノムDNA、ゲノムRNA、mRNA)を保持するため、本明細書において提供される方法および装置を使用し、病原の有無を決定することができる。多くの場合、病原は、具体的な病原に特有の特質、例えば、エピジェネティック状態および/または1つまたはそれより多い配列の変異、重複および/または欠失を含む核酸を保持する。したがって、本明細書において提供される方法を使用し、具体的な病原または病原変異体(例えば、株)を同定することができる。
いくつかの実施形態において、細胞増殖障害(例えば、がん)の有無を、本明細書に記載の方法または装置により決定する。例えば、血清中の細胞非含有核酸のレベルは、健常な患者と比較して種々の種類のがん患者において上昇し得る。転移性疾患の患者は、例えば、非転移性患者のおよそ2倍高い血清DNAレベルを有し得ることもある。転移性疾患の患者はまた、がん特異的マーカーおよび/または特定の一塩基多型または縦列型反復配列などにより同定することができる。血中DNAの高値と正に相関し得るがんの種類の非限定的な例として、乳癌、結直腸癌、消化器癌、肝細胞癌、肺癌、悪性黒色腫、非ホジキンリンパ腫、白血病、多発性骨髄腫、膀胱癌、肝細胞癌、子宮頚部癌、食道癌、膵臓癌、および前立線癌がある。種々のがんは、非がん性の健常細胞からの核酸と区別可能な特質、例えば、エピジェネティック状態および/または配列の変異、重複および/または欠失を含む核酸を保持することができ、血中に放出することができることもある。このような特質は、例えば、具体的な種類のがんに特異的であり得る。したがって、本明細書において提供される方法を使用し、具体的な種類のがんを同定することができることをさらに考慮に入れる。
本明細書に記載の方法および基本的理論を利用し、遺伝的変異に関連する種々の状態を検出し、かつ遺伝的変異の有無を決定することができる。本明細書に記載の方法を用いて検出することができる遺伝的変異の非限定的な例として、染色体異常断片(例えば、欠失、重複)、異数性、性別、サンプル同定、遺伝的変異に関連する疾患状態など、または上記の組み合わせがある。
標的染色体のゲノム領域の情報量を、染色体位置の関数として、不確定要素の組み合わせにより正規化された、正倍数体とトリソミーのカウントとの間の平均分離の結果をプロットすることにより視覚化することができる。不確定要素の増加(図1を参照のこと)または3倍体と正倍数体(例えば、3倍体の妊娠および正倍数体の妊娠)との間のギャップの減少(図2を参照のこと)はともに、Zスコアの予測指数を低下させることもある、罹患症例におけるZ値の低下を生じる。
実施例1に記載のように、無益なビンをフィルタリングすることは、Z値の予測指数に対する所望の改善を提供しないこともある。実施例1に記載のように、第18番染色体のデータをフィルタリングし、無益なビンを除去するときに、Z値は、実質的に改善しなかった(図6を参照のこと)。実施例1に示される第21番染色体のカウントプロファイルでわかるように、第18番染色体のカウントプロファイルも、短距離ノイズに関わらず実質的に平行である。しかし、ビンワイズカウントの不確定要素を評価するために使用される2つの第18番染色体のサンプル(図6の下部を参照のこと)は、カウントプロファイルの一般的な平行から顕著に逸脱する。2つのトレースの中央のディップは、楕円により強調されているが、大きな欠失を表す。実験過程に試験した他のサンプルは、この欠失を示さなかった。欠失は、図7に示される楕円により図示された、第18番染色体におけるp値プロファイルのディップの位置と一致する。すなわち、第18番染色体におけるp値に観察されたディップは、第18番染色体のサンプルの欠失の存在により説明され、これは、罹患領域のカウントの分散の増加を生じる。カウントの分散は不規則ではないが、まれな事象を表し(例えば、第18番染色体の断片の欠失)、他のサンプルを含む場合、他のサンプルからの不規則な変動は、ビンフィルタリング方法の予測指数(the predictive power bin filtering procedure)を低下させる。
図11は、認識可能な特徴または形質(例えば、母体の重複、母体の欠失など、またはそれらの組み合わせ)を有する患者から、ビンワイズ正規化を使用して、複数のサンプルを分析した結果をグラフにより図示する。サンプルの同定は、多くの場合、それぞれの正規化されたカウントプロファイルを比較することにより決定することができる。図11に図示された実施例において、正規化されたプロファイルおよびその上昇ならびにその希少性におけるディップの位置は、両サンプルが同じ患者に由来することを示す。法医学的パネルデータを、多くの場合、これらの所見を立証するために使用することができる。
サンプルの異常の平均の上昇の比較に加え、比較された伸長の開始および終了も、統計学的分析に有用な情報を提供することができる。ピーク端の比較における分解能の上限を、多くの場合、ビンの大きさ(例えば、本明細書に記載の実施例の50kbp)により決定する。図21は、3つの考えられるピーク端のシナリオ;(a)1つのサンプルからのピークを、別のサンプルからの一致するピーク内に完全に含有することができ、(b)1つのサンプルからの端が別のサンプルからの端に部分的にオーバーラップすることができ、または(c)1つのサンプルからの主要な端は、別のサンプルの末端にほんのわずか接触し、またはオーバーラップすることができることを図示する。図22は、(c)に記載のシナリオの一例(and example)を図示する(例えば、中間のトレースの末端が上部のトレースの主要な末端にほんのわずか接触する、中間の薄灰色のトレースを参照のこと)。
正倍数体患者の標的染色体内の正規化された上昇中央値は、胎児画分に関わらず、1に近いままであることが期待される。しかし、図9および10に示されるように、トリソミー患者の上昇中央値は、胎児画分とともに増加する。この増加は、一般に、傾き0.5の実質的な線形である。実験測定値により、これらの期待値を確認する。図26は、86個の正倍数体のサンプル(図26の黒色で示す)における上昇中央値のヒストグラムを図示する。中央値は、1前後に緊密に集められている(中央値=1.0000、中央絶対偏差(MAD)=0.0042、平均値=0.9996、標準偏差(SD)=0.0046)。図26に示されるヒストグラムに示されるように、1.012を超える正倍数体の上昇中央値はない。対照的に、図26に示される35個のトリソミーサンプルの中から(灰色のサンプル)、1つを除いて全てが、正倍数体の範囲のかなり上の1.02を超える上昇中央値を有する。この例の2群の患者間のギャップは、正倍数体または異数体としての分類を可能にするのに十分大きいものである。
いくつかの実施形態において、胎児画分と、正倍数体(例えば、正倍数体の妊娠)における正規化されたカウントの中央値の分布の幅との間の比を使用し、正規化された上昇の中央値を使用して、分類の信頼性を決定することができる。正規化されたカウントの中央値ならびにZ値などの他の記述子は、比例定数0.5の胎児画分とともに線形に増加するため、胎児画分は、分類において95%の信頼度を得るため、正規化されたカウントの中央値の分布の4標準偏差または分類において99%の信頼度を得るため、6標準偏差を超える必要がある。特定の実施形態において、整列した配列タグの数を増加させることは、プロファイル測定値の誤差を減少させ、正規化された上昇の中央値の分布を急峻にするよう作用し得る。したがって、ますます正確な測定を行うことは、胎児画分と、正倍数体の正規化された上昇の中央値の分布の幅との間の比を改善することである。
正規化されたカウントの分布の中央値は、一般に、点推定値であり、それ自体は、多くの場合、積分推定値に比べ、あまり信頼性のない推定値、例えば、分布下面積(例えば、曲線下面積)である。高値の胎児画分を含有するサンプルは、点推定値を使用することにより影響される程ではないが、低値の胎児画分にて、不規則誤差によるわずかに増加した中央値カウントを有する正倍数体サンプルからの実際に上昇した正規化されたプロファイルを区別することが困難になる。胎児画分が相対的に低い(例えば、F=約7%、F(7%))トリソミー例からの正規化されたカウントの分布の中央値を図示するヒストグラムを、図27に示す。分布の中央値は、1+F/2=1.035から遠くない1.021である。しかし、分布の幅(MAD=0.054、SD=0.082)は、正倍数体値の1からの中央値の偏差をかなり超え、サンプルが異常であるという任意の主張は除外される。分布の視覚的に判断し、代替えの分析を提案する:ピークの右へのシフトは相対的に小さいが、1の正倍数体期待値から左への面積(濃灰色)と右への面積(薄灰色)との間の均衡をかなり摂動させる。したがって、2つの面積間の比は、積分推定値であり、分類が胎児画分の低値により困難である例において有利となり得る。曲線下の薄灰色および濃灰色の面積における積分推定値の計算を、以下にさらに詳細に説明する。
図29は、実質的には類似の現象と説明される、上昇中央値および面積比の相互関係および相互依存の両方を図示する。類似の関係として、上昇中央値および面積比を、他の分類基準、例えば、Zスコア、フィットさせた胎児画分、種々の残差二乗和およびベイジアンp値と関連付ける(図30を参照のこと)。個々の分類基準は、ギャップ領域の正倍数体分布とトリソミー分布との間の部分的オーバーラップから生じる曖昧さに苦しみ得るが、複数の基準の組み合わせにより、いずれかの曖昧さを減少させ、または排除することができる。いくつかの実施形態において、複数の次元に沿った信号の広がりは、オーバーラップするピークを、十分に定義された容易に同定可能なエンティティに分解する、異なるの核のNMR周波数を測定するのと同じ効果を有し得る。相互相関記述子を使用して、任意の理論的パラメータを定量的に予測する試みはなされていないため、異なる分類基準間に観察される相互相関は干渉されない。正倍数体が集合するのみの多次元空間の領域を定義することにより、その領域の特定の表面以外に配置される任意のサンプルの分類を可能にする。したがって、分類スキームを、正倍数体のコンセンサスな票に減少させる。
Z値統計および他の配列リードデータの統計分析は、多くの場合、胎児異数性に対する遺伝的変異の有無を決定する成果の決定または提供に適切であるが、いくつかの例において、胎児画分の寄与および倍数性の仮定に基づく追加の分析を含むことが有用であり得る。分類スキームに胎児画分の寄与を含むときに、既知の正倍数体(正倍数体の妊娠)のセットからの参照中央カウントプロファイルを、一般に比較のために利用する。参照中央カウントプロファイルを、ゲノム全体をNビンに分割することにより作製することができ、この場合、Nはビンの数である。各ビンiは、割り当てられた2つの数字:(i)参照カウントFiおよび(ii)ビン参照カウントの不確定要素(例えば、標準偏差、つまりσ)である。
1)胎児画分Fを測定し、2つの残差二乗和を形成する値を使用する。残差二乗和を算出するために、式(8)の右側(RHS)を左側(LHS)から減算し、その差を平方し、選択されたゲノムビンに対して合計し、またはこれらの実施形態において、全てのビン、つまり全てのビンに対する和を使用する。このプロセスを、2つの残差二乗和のそれぞれを算出するために行う。残差二乗和の1つを、胎児倍数性のセットを用いて1(例えば、X=1)に評価し、もう一方の残差二乗和を、胎児倍数性のセットを用いて3/2(例えば、X=3/2)に評価する。胎児試験被験体が正倍数性である場合、2つの残差二乗和の間の差は、負になり、さもなければ、差は正になる。
いくつかの実施形態において、胎児異数性を、2つの変数、胎児倍数性(例えば、X)および胎児核酸画分(例えば、胎児画分;F)を分析するモデルを使用して決定することができる。特定の実施形態において、胎児倍数性を、個別の値とすることができ、いくつかの実施形態において、胎児画分は、値の連続体であってよい。胎児画分を測定することができ、測定された値を使用し、胎児倍数性として考えられる各値に対する式(8)の結果を作製する。式(8)の結果を作製するために使用され得る胎児倍数性の値は、単胎の胎児妊娠において1および3/2を含み、双胎の胎児妊娠の例において、1例の胎児が罹患し、もう1例の胎児が罹患していない場合、5/4を使用することができる。いくつかの実施形態において、各胎児倍数性値に対して得られた残差二乗和により、その方法が測定値を再生する成功率を測定する。X=1(例えば、正倍数体の仮定値)にて式(8)を評価するときに、胎児画分を取り消し、以下の式により残差二乗和を得る:
特定の実施形態において、胎児異数性を、胎児画分をその測定値で固定し、倍数性を、残差二乗和を最適化するよう多様化させるモデルを使用して決定することができる。いくつかの実施形態において、得られたフィットさせた胎児画分を使用し、双胎の例において値が1、3/2、または5/4に近いかどうかに応じて、トリソミーまたは正倍数体として症例を分類することができる。
倍数性の最適値は、多くの場合、種々の誤差源により不正確である。誤差源の3つの、非限定的な例として、以下がある:参照ビンカウントfi、ビンカウントの測定値yiおよび胎児画分F。誤差の非限定的な例の寄与を、個別に試験する。
Y染色体にマッピングされた配列タグの数(例えば、Yカウント)に基づいた胎児画分の推定値は、FQA胎児画分値に対して相対的に大きな偏差を示すこともある(図34を参照のこと)。3倍体におけるZ値も、多くの場合、図35に示される斜線の周りに相対的な広がりを示す。図35の斜線は、トリソミー21の例における胎児画分の増加を伴う、第21番染色体における染色体表現の理論的増加の期待値を表す。胎児画分を、適切な方法を使用して評価することができる。胎児画分を推定するために利用することができる方法の非限定的な例は、胎児数量アッセイ(例えば、FQA)である。胎児画分を推定する他の方法は、当技術分野において公知である。胎児画分を推定するために利用される種々の方法も、図36〜39に示されるように中央斜線の周りに実質的に同様な広がりを示すこともある。図36において、偏差は、フィットさせた胎児画分において観察されるものと実質的に類似する(例えば、高値のF0において負)(式(33)を参照のこと)。いくつかの実施形態において、0%〜20%の範囲の平均の染色体Y(例えば、染色体Y)の胎児画分(図36の濃灰色の線を参照のこと)に対する線形の近似値の傾きは、約3/4である。特定の実施形態において、標準偏差に対する線形の近似値(図36、薄灰色の線を参照のこと)は、約2/3+F0/6である。いくつかの実施形態において、第21番染色体(例えば、第21番染色体)に基づく胎児画分の推定値は、胎児画分を当て嵌めることにより得られたものに実質的に類似する(図37を参照のこと)。性別に基づく胎児画分の推定値の別の定量的に類似のセットを、図38に示す。図39は、T21の例における正規化されたビンカウントの中央値を図示し、これは、線形の近似値が1+F0/2に実質的に類似する傾きを有すると期待される(図39のグラフにおける起点から上部の中間点までの灰色の線を参照のこと)。
a)1に等しくない傾き(Z値を除き、方法に応じて、1より大きいまたは1未満のいずれか)
b)大きな広がりの胎児画分の推定値および、
c)広がりの範囲が胎児画分とともに増加。
分析を簡略化するため、fiおよびyiが誤差がないと仮定する場合、胎児画分Fの測定値は、Fv(例えば、真の胎児画分)およびΔF(例えば、測定された胎児画分の誤差)からなる:
多くの場合、限定された数の既知の個別の値をとることができるフィットさせた倍数性とは反対に、倍数性をその考えられる値(例えば、正倍数体では1、シングルトン3倍体では3/2、双胎3倍体では5/4)の1つに固定させて、連続して変化する胎児画分を、多くの場合、最適化することができる。測定された胎児画分(F0)が既知である実施形態において、胎児画分の最適化を、フィットさせたFが、実験誤差(例えば、ΔF)内で、F0に近いままであるように制限することができる。いくつかの例において、胎児画分の観察値(例えば、測定値)F0は、式(22)〜(28)に記載の、胎児画分Fvと異なることもある。強固な誤差伝播分析は、F0とFvとの間で区別することを可能とするはずである。以下の微分を簡易化するために、胎児画分の観察値と真の胎児画分との間の差は、無視される。
正倍数体の例におけるいくつかの例において、式(32)のフィットさせたFがF0に等しく、X=1であった場合、正倍数体モデルの残差二乗和は、式(31)から追随する:
理想的には、ビンカウント参照値および測定値は、ゼロのシステムエラー(例えば、オフセット)を含有するものとするが、実際には、ビンカウントの参照値および測定値は、互いに対してシフトすることもある。いくつかの例において、互いに対するシフトの影響を、シフトΔが目的の染色体全体の定数であると仮定して、式(33)を使用して分析することができる。いくつかの実施形態において、正倍数体の例において、不規則誤差を無視する場合、以下の関係が成り立つ:
フィットさせた胎児画分における誤差の寄与は、多くの場合、2種類の誤差:1)測定された胎児画分からの誤差、および2)ビンカウント測定値および参照値からの誤差の1つにある。2種類の誤差を、異なる方法を使用して、個々に分析し、後に組み合わせて最終誤差範囲を作製する。測定された胎児画分からの伝播した誤差を、式(40)のF0をまずF0−2ΔF(例えば、下部の誤差境界において)と、次いでF0+2ΔF(例えば、上部の誤差境界において)と置き換えることにより評価することができる。特定の実施形態において、この相対的に簡易な方法は、95%の信頼区間にて定量的挙動を補正する。異なる所望の信頼水準において、より一般的な境界の組、F0−nΔFおよびF0+nΔFを利用することができる。上部および下部の誤差境界を作製するために使用される項は、ビンカウントの測定値および参照値の誤差からの寄与が、多くの場合、無視されるため、誤差全体を過小評価することもある。
正規化されたカウントプロファイルの認識可能な特徴(例えば、遺伝的変異の領域、コピー数多型の領域)の同定は、相対的に時間がかかり、かつ/または相対的に費用がかかるプロセスであることもある。認識可能な特徴を同定するプロセスは、多くの場合、ノイズデータおよび/または胎児核酸の寄与が低いことを含有するデータセットにより複雑化する。真性の遺伝的変異またはコピー数多型を表す認識可能な特徴の同定は、大きく、特徴のないゲノム領域の検索を回避するのに役に立ち得る。認識可能な特徴の同定を、検索および得られたデータセットから、残りのゲノム片から、非常に可変的なゲノム片を除去することにより、つまり所定の複数のプロファイル分散毎に、平均プロファイル上昇から逸脱するデータ点を除去することにより獲得することができる。
カウント測定値の分散性
理想的に、染色体上昇の測定値は、図62において見られるように、正倍数体において1の上昇の直線の水平線である。トリソミー妊娠において、染色体上昇の測定値の所望の挙動は、図63で15%に等しい胎児画分においてシミュレートしたように、胎児画分に比例した1からの偏差を用いた階段関数である。母体欠失/重複は除外されるが、これは1/2の倍数の大きさに基づく胎児異常から容易に認識され、区別される。
従来のGC正規化方法は、最適下により行うことができる。その理由の一部は、GCバイアスが唯一の変動源ではないことがあった。多くの個々の未処理のカウントプロファイルの積み重ねられたプロットは、異なるサンプル間の平行性を表す。いくつかのゲノム領域が一貫して過剰に表されるが、他では、480v2試験のトレースにより図示されるように(図6)、一貫して過小に表される。GCバイアスはサンプル間で異なるが、これらのプロファイルに観察される体系的、ビン特異的バイアスは、全てのサンプルにおいて同じパターンとなる。図6のプロファイル全ては、協調するようにジグザグであった。唯一の例外は、下部の2つのサンプルの中央部分であり、これは、母体欠失に由来することがわかった。このビン特異的バイアスを補正するために、参照プロファイルの中央値を使用した。参照プロファイルの中央値は、既知の正倍数体のセット(例えば、正倍数体妊娠)またはフローセルの全てのサンプルから構築された。方法は、参照サンプルのセットにおいて、ビン当たりの中央値カウントを評価することにより参照プロファイルを作製した。ビンと関連するMADが、ビンの信頼性を測定した。かなり変動可能なビンおよび一貫して表現が消失しているビンを、さらなる分析から除去した(図4)。次いで、試験データセットのカウント測定値を、図8に図示したように、参照プロファイルの中央値に対して正規化した。かなり可変なビンを正規化されたプロファイルから除去し、2倍体片においておよそ1、ヘテロ接合重複の領域において1.5、ヘテロ接合欠失の領域において0.5などとなるトレースを残した(図9)。得られた正規化されたプロファイルは、合理的に分散性を減少させ、母体欠失および重複の検出ならびにサンプル同一性のトレースを可能にした(図12、22、13、11)。カウントプロファイルの中央値に基づいた正規化は、成果を明確にすることができるが、GCバイアスはなお、このような方法において負の効果を有する。本明細書に記載のPERUN法を使用し、GCバイアスに対処し、より感受性および特異性の高い成果を提供することができる。
図11は、ビンワイズカウントがGC−LOESSまたはGCRM適用前(図64〜65)より適用後(図66〜67)にさらに変動するかについて図示した。LOESS GC補正は、回帰直線(直線、図70、上部パネル)で未処理カウントを除算することにより未処理カウント(図70、上部パネル)からの傾向変動を除去した。点を中央値カウントにより定義し、ゲノムGC含量の中央値を固定した。平均の、中央値カウントより下のカウントを、小さい数で除算するが、中央値カウントを超えるカウントは、大きい数で除算した。いずれの例においても、平均のカウントを拡大し、または縮小し、1に一致させた(図70、下部パネル)。カウントの増大に加え、小さいカウントの拡大縮小も、分散性を増大させた。GCゲノム含量の中央値から左の最終結果(図70、下部パネル)は、対応する未処理カウント(図70、上部パネル)よりかなりの広がりを示し、典型的な三角形の形状(図70、下部パネル、三角)を形成した。カウントの傾向変動を除去するため、GC LOESS/GCRMは精度をあきらめ、それゆえ、補正方法は一般に乗算法であり、加算法でない。PERUNにより提供された正規化は一般に、本来は加算法であり、乗算技法に対する精度を強化する。
代替えの方法は、ゲノム全体に総合的なGCバイアススケーリングを行う代わりに、個々の染色体に個別にLOESS補正を適用した。個々の染色体のスケーリングは、過剰表現された染色体からの信号を削除するため、正倍数体またはトリソミーとしてサンプルを分類するためには実用的ではなかった。しかし、この試験の結論では、PERUNアルゴリズムを開発するための媒介因子として最終的に有用であった。図71は、複数のサンプルからの同じ染色体において得られたLOESS曲線が、共通の交点(転換点)を共有することを図示する。
1)GC補正は、分散性を減少させるために、ゲノム全体によりむしろ、小さいゲノム片または断片に行われるべきである。片または断片が小さいほど、GC補正にさらに焦点が当てられ、残差誤差を最小にする。
多くの、異なるライブラリ作製の化学物質を使用して測定された未処理カウントプロファイル、クラスター環境、シークエンシング技術およびサンプルコホートを慎重に調査し、少なくとも2つの独立した体系的分散性源の存在を一貫して確認した:
1)全てのビンに、所与のサンプル内で同じように影響を与え、各サンプル間で変化する、GC含量に基づいたサンプル特異的バイアス、および
2)全てのサンプルに共通のビン特異的減衰パターン。
無益なビンを除去する多くの試みにより、ビン選択に分類を改善する可能性を有することが示されている。第1のこのような方法では、全ての480v2トリソミーの例におけるビン当たりの第21番染色体、第18番染色体、および第13番染色体のカウントの平均値を評価し、全ての480v2正倍数体におけるビン当たりのカウント平均値と比較した。罹患と非罹患例との間のギャップは、両グループにおいて測定されたビンカウントから得られたビンワイズ不確定要素の合成値を用いて拡大縮小した。得られたt統計値を使用し、図77に示されるように、ビンワイズp値プロファイルを評価した。第21番染色体の例において、方法は、36個の無益なビンを同定した(図77の楕円形で標識された中央パネル)。Zスコアの計算からこれらのビンを除外することにより、罹患例におけるZ値が顕著に増加したが、非罹患のZスコア(図78)を不規則に摂動させ、それにより、正倍数体とトリソミー21の例との間のギャップを増大させた。
結論として、無益なビンをフィルタリングするために使用される異なる基準は、データ処理が、ビンが分類に寄与する有用な情報の量に基づいたビン選択によって有益となることを明らかにした。
カウント測定値に見つかる異なる体系的バイアスを分解し、かつ排除するために、データ処理ワークフローが、「参照中央カウントプロファイルに対する正規化」と題した前述の節から「無益なバイアスの除去」と題した節までに記載の部分的方法を最適に組み合わせるために必要であった。第1のステップは、GCバイアス係数値に従い、異なるサンプルを順序付けた後、カウント対GC含量のプロットを重ねる。結果は、図82に概略的に示された、プロペラのようにねじれた3次元の面となる。
M:不必要な変動により混入した主要な情報を表すカウント測定値。
切片Iの意味を図86により図示する。グラフは、1つのLDTv2CEフローセルに3回の別個のシークエンシング試行を行ったときに得られる、技術的反復物のセットから抽出されたデータを含むビン切片の推定値と相関する。y軸は、これらの3つの測定値からのビンワイズカウントの中央値を含有する。これらの中央値は、概念上、参照プロファイルの中央値に関連し、これは既に「参照中央カウントプロファイルに対する正規化」と題した節に記載のようにプロファイルを正規化するために使用された。ビンワイズ切片をx軸に沿ってプロットする。2つの量間の著しい相関は、GCバイアスの非存在下において、ビン当たりのカウント期待値としての切片の本当の意味を表す。参照カウントプロファイルの中央値を含む問題は、GCバイアスを考慮しないことである(「参照中央カウントプロファイルに対する正規化」と題した節を参照のこと)。PERUNにおいて、理論に限定されないが、切片Iの課題は、ビン特異的減衰を扱うことであるが、GCバイアスは、他のモデルパラメータである傾きSの二の次となる。
モデルパラメータ値IおよびSが各ビンに利用可能であることを仮定し、新たな試験サンプルで採取された測定値Mを使用し、以下の式に従い染色体上昇を評価する:
「体系的ビンワイズバイアスからのGCバイアスの分離」と題した節で推論したように、IおよびSの評価に、既知の正倍数体の10%(図83の1093個のLDTv2のセット)を無作為に選択し、交差検証用に別においておく。残りの正倍数体の90%に適用した線形モデルは、選択されたビンに特異的なIおよびSパラメータ値を抽出する(L=1と仮定)。次いで、交差検証は、所与のビンにおけるIおよびSの推定値を使用し、ワークセットおよび残りの10%正倍数体の両方におけるG測定値から測定値Mを再び作製する(繰り返すが、L=1と仮定)。交差検証のサブセットの無作為の選択を、何回か繰り返す(図83において100回であるが、10回の繰り返しで十分である)。図83の100個の斜線は、100個の異なる90%ワークサブセット選択における線形モデルを表す。同じ方法を、ヒトゲノムの全てのビンに適用し、各ゲノム位置において、切片Iおよび傾きSのセットを生成する。
図90〜91は、それぞれ、ビンchr2_2404およびchr2_2345における交差検証誤差を示す。これらの、および他の多くのビンにおいて、誤差は決して6%を超えない。chr1_31などの一部のビン(図92)は、8%に近い交差検証誤差を有する。さらに他(図93〜95)では、100%を超えるかなり大きな交差検証誤差を有することもある(図93のchr1_10では40%、図94のchr1_9では350%、および図95のchr1_8では800%)。
「無益なビンの除去」と題した前述の節に記載の観察値に基づき(図78および図80〜81)、交差検証誤差を、ビンフィルタリングのための基準として使用した。選択方法として、7%を超える交差検証誤差を含む全てのビンを捨てる。フィルタリングはまた、一貫してゼロカウントを含有する全てのビンを排除する。残りのサブセットは、48956個の常染色体のビンを含有する。これらは、染色体表現を評価するため、かつ罹患または正倍数体のサンプルを分類するために使用されるビンである。7%のカットオフは、トリソミーのZスコアから正倍数体のZスコアを分離するギャップが、7%の交差検証誤差にて安定することにより正当化される(図98)。
図100〜101は、2つのビン(chr18_6およびchr18_8)のフィットさせた線形モデル(細い直線)の95%信頼区間(曲線)を示す。太い灰色の直線は、Sパラメータをこれらの2つのビンのGC含量と、第18番染色体のGC含量の中央値との間の差と置き換えることにより得られる。誤差範囲は、線形モデルにより報告されるように、これらの2つのビンにおけるモデルパラメータIおよびSの誤差に基づいて評価される。さらに、大きなGCバイアス係数も大きな誤差を含有する。極端に大きいGCバイアス係数に対応する大きな不確定要素は、改変されていないPERUNの適用性の範囲を適度のGCバイアス係数に限定することを示唆する。その範囲を超えて、残りのGCバイアスを除去するためにさらなる測定を行うことが必要とされる。幸いにも、ごく少量のサンプルが罹患しているにすぎない(LDTv2CE集団のおよそ10%)。
高値のGCバイアス係数は、PERUNモデルにより仮定された線形範囲を超え、PERUN正規化後のさらなるLOESS GC正規化ステップにより是正される。LOESS法の乗法の性質により、正規化されたカウントがすでにかなり1に近いため、分散性を大きく増大させない。代替えとして、LOESSを、残差を減算する追加の方法と置き換えることができる。任意選択の二次正規化は、多くの場合、少量のサンプルに対して必要とされるのみで利用される(およそ10%)。
図68〜69は、サイズおよび位置に応じて、偽陽性または偽陰性を作製する可能性のある多数の母体欠失および重複の存在を確認する。ホールパディングと呼ばれる任意選択の方法を考案し、これらの母体異常から干渉を排除した。この方法は、単に対して正規化プロファイルをパディングし、1.3を超えて、または0.7より下で逸脱するときに、1に近いままにする。LDTv2CEにおいて、ホールパディング(すなわち、パディング)は、分類に顕著に影響しなかった。しかし、図105は、第4番染色体の大きな欠失を含有するWIプロファイルを示す。ホールパディングは、そのプロファイルを、第13番染色体の偽陽性から第13番染色体の真性陰性に変換する。
この節では、トリソミー13、トリソミー18およびトリソミー21(それぞれ、T13、T18およびT21)、性別決定、および性別異数性におけるPERUNの結果について考察する。
図106は、PERUN正規化前後のビンワイズカウントプロファイルの標準偏差の分布を比較する。得られた正倍数体およびトリソミーの例における染色体表現の分布を、図107に示す。
図108〜111は、LDTv2CEのPERUN分類結果を、GCRMカウントを使用して得られたものと比較する。2つの第18番染色体偽陽性、2つの第18番染色体偽陰性、および2つの第21番染色体偽陰性を除去するのに加え、PERUNでは、高次のn乗の上昇がサンプル当たりのカウント数を減少させたことにも関わらず、正倍数体と罹患例とのギャップがほぼ2倍になる(ELANDデータ)。同様の結果を、LDTv2CE Elandデータに訓練させたPERUNパラメータを、WI測定値に適用するときに得る。Bowtieアライメントは、一部のビンの低マッピング性を考慮して、異なるパラメータのセットおよび追加のビンフィルタリングを必要とするが、その結果は、ELANDアライメントで見られたものに近づく。
誤差除去のパラメータ化および不偏正規化(PERUN)法の例は、実施例4に説明され、このような方法の追加の説明を実施例5に記載する。
いくつかの実施形態において、参照ゲノム全体を順序付けられたセットBのビンJに区分する:
モデルパラメータIおよびSを、正倍数体の妊娠として核型化されたサンプルにおいて採取されたNスケールの未処理カウントプロファイルのセットから評価する。Nは103桁のものである。拡大縮小されたGCバイアス係数Giは、各サンプル(i=1、...、N)において決定される。全てのサンプルを、これらのGi値のサイズおよび記号に従い少数のクラスに分離する。層化は、各シェル内のGi値を表す十分な数と十分に小さい範囲を含む相反する要求のバランスをとる。4層の妥協案として、陰性、ほぼゼロ、やや陽性、および極めて陽性のGCバイアスに調整し、ほぼゼロのシェルが最も密度が集中している。各層からのサンプルの画分(典型的には10%)を、無作為に選択し、交差検証のために取っておくことができる。残りのサンプルは、モデルの訓練に使用されるワークセットを作製する。訓練および続く交差検証はともに、ゲノム全体に沿って、全てのサンプルに母体および胎児欠失または重複が含まれないことを仮定する:
ワークセットから得られると、モデルパラメータIjおよびSjを使用し、拡大縮小した未処理カウントを拡大縮小したGCバイアス係数から式Nおよび仮定値Rを使用して逆算出する。記号pijは、サンプルiのビンbjにおける拡大縮小した未処理カウントの予測値を示す。さらに明細書内のインデックスWおよびCVは、それぞれワークサブセットおよび交差検証サブセットを表す。逆算出を全てのサンプルに、WおよびCVの両方から適用する。結晶学的構造の改善された法から取り入れたR因子(Brunger,Free R value:a novel statistical quantity for assessing the accuracy of crystal structures,Nature355,472−475(30 January 1992);doi:10.1038/355472a0)をサンプルの2つのサブセットにおいて個別に定義する:
ゼロのGC含量gj 0の全てのビンを、大量のサンプル全体に一貫してゼロカウントとなるビンのセット
いくつかの実施形態において、所与のサンプルiにおいて、ビン選択βに対応する染色体上昇lijを式Qに従い推定する。いくつかの実施形態において、第2の正規化を適用し、lij対GC含量の相関からの任意の曲率を除去する。いくつかの実施形態において、lijは、すでにほぼバイアスされておらず、第2の傾向変動を除去することは確実であり、誤差ブースティングに影響されない。いくつかの実施形態において、標準的なテキストブック法で十分である。
本明細書に記載の方法に使用することができる数学的および/または統計学的式の非限定的例を以下に記載する。
母体の欠失および重複は、多くの場合、プロファイルの第1の上昇として表されるが、T21、T18、またはT13を検出するときに分散性を減少させるためPERUNを用いて正規化されたカウントプロファイルから除去することができる。プロファイルからの欠失および重複の除去は、母体異常を由来とする染色体表現の測定値に見つかる分散性(例えば、生物学的分散性)を減少させることができる。
本明細書に記載の方法の際立った特徴は、胎児(例えば、正倍数体の胎児)を妊娠している妊娠女性の例において、母体異常(例えば、母体および/または胎児コピー数多型)を、胎児画分を確認するプローブとして使用することである。母体異常の検出および定量化は、典型的に、未処理カウントの正規化の助けを借りてなされている。本実施例において、未処理カウントを、PERUNを使用して正規化する。代替えとして、参照中央カウントプロファイルに対する正規化を、同じ方法で、および同じ目的において使用することができる。
a.PF ij=0、この場合、lij=0、および胎児画分は、欠失から評価することができない
b.PF ij=1/2、この場合、lij=fi/2、および胎児画分は、欠失内の平均上昇の2倍として評価される。
a.PF ij=0、この場合、lij=(1−fi)/2、および胎児画分は、1/2と、欠失内の平均上昇との差の2倍として評価される
b.PF ij=1/2、この場合、lij=1/2、および胎児画分は、欠失から評価することができない
c.PF ij=1、この場合、lij=(1+fi)/2、および胎児画分は、1/2と、欠失内の平均上昇との差の2倍として評価される。
a.PF ij=1、この場合、lij=(3−fi)/2、および胎児画分は、3/2と、重複内の平均上昇との差の2倍として評価される
b.PF ij=3/2、この場合、lij=3/2、および胎児画分は重複から評価することができない
c.PF ij=2、この場合、lij=(3+fi)/2、および胎児画分は、3/2と、重複内の平均上昇との差の2倍として評価される。
a.PF ij=2、この場合、lij=2、および胎児画分は、重複から評価することができない
b.PF ij=3/2、この場合、lij=2−fi/2、および胎児画分は、2と、重複内の平均上昇との差の2倍として評価される。
実施例9:実施形態の実施例
以降に、本技術の特定の実施形態の非限定的な例を挙げる。
(a)試験被験体から、循環無細胞核酸を含むサンプルを得、
(b)サンプルから細胞非含有サンプル核酸を単離し、
(c)細胞非含有サンプル核酸から配列リードを得、
(d)ゲノム片に分割されている既知のゲノムに、(c)で得られた配列リードをマッピングし、
(e)ゲノム片内にマッピングされた配列リードをカウントし、
(f)(e)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(g)(f)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定する。
(a)試験被験体から血中細胞非含有サンプル核酸の配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)で得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)(c)で得られたゲノム片におけるカウントを正規化することにより、サンプル正規化されたカウントプロファイルを作製し、
(e)(d)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定する。
(a)参照ゲノムのゲノム片にマッピングされた試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)ゲノム片について配列リードのカウントを正規化することにより、サンプル正規化されたカウントプロファイルを作製し、
(c)(b)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定する。
(i)複数の参照被験体からの血中細胞非含有参照サンプル核酸から、配列リードを得、
(ii)ゲノム片に分割されている既知のゲノムに(i)で得られた配列リードをマッピングし、
(iii)ゲノム片内にマッピングされた配列リードをカウントし、
(iv)(iii)のカウントから未処理カウントプロファイルを作製し、
(v)参照サンプルの中央値カウントがゼロのゲノム断片を除去し、
(vi)ゲノム断片における中央値カウントおよび不確定要素を決定し、この場合、(i)〜(vi)を行うことにより、参照中央カウントプロファイル、不確定要素プロファイルおよび/または断片識別子を作製する。
(iv)で作製されたプロファイルの標準偏差を算出し、
選択された信頼区間に等しい定数を、プロファイルの標準偏差に乗算し、
それにより、不確定要素のカットオフにおける値を作製する。
(iv)で作製されたプロファイルの中央絶対偏差を算出し、
選択された信頼区間に等しい定数を、プロファイルの中央絶対偏差に乗算し、
それにより不確定要素のカットオフにおける値を作製する。
ピークを含む、(iv)で作製された正規化されたカウントプロファイルを評価する信頼水準を選択し、
ピークを評価するゲノム断片長の最大値を選択し、
ゲノム内の位置の種々の長さのゲノム断片において、ピーク上昇および/またはピーク幅を評価し、
それにより、胎児の染色体異常断片もしくは胎児異数性または両方を検出する予測値を含むピークが、ゲノムの位置にて信頼水準を用いて検出される。
ゲノムの位置を選択し、
ピークを含むp値プロファイルを作製し、
選択された信頼水準以下のp値を含むゲノム断片を除去し、
異なる長さの冗長な、および/またはオーバーラップする断片を除去し、
ピーク端の位置およびそれらの関連の不確定要素を決定し、
無作為に選択されたサンプル間で共通して見つかるピークを同定し、場合により除去し、
それにより、胎児の染色体異常断片もしくは胎児異数性または両方を検出する予測値を含むピークを、ゲノムの位置内に検出する。
評価のためにゲノムの所望の位置を選択し、
所望のゲノム断片長を選択し、
ゲノムの位置における平均プロファイル上昇およびサンプル正規化されたカウントプロファイル内の平均値の関連誤差を評価し、
p値を、選択されたゲノム断片に割り当て、
それによりp値プロファイルが作製される。
(1)開始断片を選択し、
(2)ゲノムの選択された位置における平均の上昇および平均値の標準誤差を決定し、
(3)平均の断片上昇および平均値の対応する標準誤差を評価し、
(4)ゲノムの選択された位置における平均の上昇に対して、および/または所定の上昇値に対してZ値を評価し、
(5)1つまたはそれより多い開始断片および/または断片長において1〜4を繰り返し、
(6)選択された開始断片のそれぞれの断片長全体および/または各断片長に対してt検定を行い、
それにより、p値が選択されたゲノム断片に割り当てられる。
同じまたは同様の条件下において測定された複数のサンプルから、細胞非含有サンプル核酸リードを得、
試験サンプルのセットを選択し、
ピークを含む参照中央カウントプロファイルを作製し、
試験サンプルのセットのサンプル間に共通して見つかるピークを同定する。
ピークを含む参照中央カウントプロファイル、ピークを含むZ値プロファイル、ピークを含むp値プロファイル、またはそれらの組み合わせを比較し、
各サンプルにおいて共通して同定されたピークを同定する。
ピークを含むサンプル正規化されたカウントプロファイルおよび/またはピークを含む参照中央カウントプロファイルの1つまたはそれより多い領域を選択し、
正規化プロファイルの第1の導関数および/またはその指数を決定し、
ピーク導関数を特徴付け、
それにより、プロセスは、胎児の染色体異常断片もしくは胎児の異数性または両方を検出する予測値を含む、ピーク最大値の導関数およびピーク幅の導関数を作製する。
1つまたはそれより多いドナーのサンプルからの血中細胞非含有サンプル核酸から配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
ピークを含む正規化されたカウントプロファイルを作製し、
各サンプル内の予測値を含む正規化されたカウントプロファイルのピークを同定し、
1サンプルのピークと、別のサンプルのピークを比較し、
ピーク対の一致に基づき、結合確率を評価し、
サンプルが同じドナーからのものである確率を決定し、
それにより、サンプルが同じドナーからのものである確率に対して決定がなされる。
ピーク幅の導関数を使用して、ピークの端が、片側公差内で一致するかを決定し、
ピーク最大値の導関数を使用して、ピーク上昇が、平均値の標準誤差内で一致するかを決定し、
所与のピークの集団の広がりにおいてp値を調節し、
それにより、プロセスの1つ以上を行うことにより、サンプルが同じドナーからのものであるかを決定する。
循環無細胞核酸を含む試験被験体からサンプルを得、
サンプルから、細胞非含有サンプル核酸を単離し、
単離された細胞非含有サンプル核酸から、配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
カウントされ、マッピングされた配列リードから、ゲノム片上昇を選択したカウントプロファイルの中央値および関連の不確定要素を含む正規化されたカウントプロファイルを得、
評価のためのゲノムの位置を選択し、
ゲノムの位置におけるプロファイル上昇の中央値および関連の不確定要素を評価し、
上昇中央値が所定の値を顕著に超えるかどうかを決定し、
それにより、上昇中央値が所定の値を顕著に超えるかどうかを決定することにより、サンプルが正倍数体または異数体であるかを決定する。
循環無細胞核酸を含む試験被験体から、サンプルを得、
サンプルから、細胞非含有サンプル核酸を単離し、
単離された細胞非含有サンプル核酸から、配列リードを得、
ゲノム片に分割されている既知のゲノムに配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
選択されたゲノム片におけるカウントの分布を含む正規化されたカウントプロファイルを得、
評価のためのゲノムの位置を選択し、
予測値を含むピークのための選択された位置およびピークに関連の面積比を評価し、
ピークにおける面積比が所定の値に対して有意に異なるかどうかを決定し、
それにより、ピークにおける面積比が所定の値を顕著に超えるかどうかを決定することにより、サンプルが正倍数体または異数体であるかを決定する。
試験被験体および複数の既知の正倍数体参照被験体から、循環無細胞核酸を含むサンプルを得、
サンプルから、細胞非含有サンプル核酸を単離し、
単離された細胞非含有サンプル核酸から配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
試験および参照被験体におけるカウントから正規化されたカウントプロファイルを得、
評価のためのゲノムの位置を選択し、
複数の分類基準を使用して、正倍数体の参照のゲノムの選択された位置を評価し、
正倍数体が分布するのみの最小のN次元空間を決定し、
複数の分類基準を使用して試験被験体のゲノムの位置を評価し、
試験被験体のN次元点が、正倍数体が分布するのみの空間内にあるかどうかを決定し、
それにより、試験被験体のN次元点が、正倍数体が分布するのみの空間にあるかどうかを決定することにより、試験被験体が正倍数体または異数体であるかどうかを決定する。
(a)配列受信モジュールにより、試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)ロジック処理モジュールにより、(a)で得られた配列リードを、ゲノム片に分割されている既知のゲノムにマッピングし、
(c)ロジック処理モジュールにより、ゲノム片内にマッピングされた配列リードをカウントし、
(d)ロジック処理モジュールにより、(c)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(e)ロジック処理モジュールにより、(d)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定し、
(f)ロジック処理モジュールにより決定されたことに対してデータ表示組織化モジュールにより、染色体異常断片もしくは胎児異数性または両方の有無を示すデータ表示を組織化する。
(a)試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)で得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)(c)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(e)(d)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定する。
(a)試験被験体から、核酸を含むサンプルを得、
(b)サンプルから、サンプル核酸を単離し、
(c)サンプル核酸から、配列リードを得、
(d)ゲノム片に分割されている既知のゲノムに、(c)で得られた配列リードをマッピングし、
(e)ゲノム片内にマッピングされた配列リードをカウントし、
(f)(e)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(g)(f)のサンプル正規化されたカウントプロファイルから、遺伝的変異の有無を決定する。
(a)試験被験体から、サンプル核酸の配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)で得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)(c)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(e)(d)のサンプル正規化されたカウントプロファイルから、遺伝的変異の有無を決定する。
(a)参照ゲノムのゲノム片にマッピングされた試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)ゲノム片について配列リードのカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(c)(b)のサンプル正規化されたカウントプロファイルから、遺伝的変異の有無を決定する。
(i)複数の参照被験体からの参照サンプル核酸から、配列リードを得、
(ii)ゲノム片に分割されている既知のゲノムに、(i)で得られた配列リードをマッピングし、
(iii)ゲノム片内にマッピングされた配列リードをカウントし、
(iv)(iii)のカウントから、未処理カウントプロファイルを作製し、
(v)参照サンプルの中央値カウントがゼロであるゲノム断片を除去し、
(vii)ゲノム断片における中央値カウントおよび不確定要素を決定し、
(i)〜(vi)を行うことにより、参照中央カウントプロファイル、不確定要素プロファイルおよび/または断片識別子を作製する。
(iv)で作製されたプロファイルの標準偏差を算出し、
プロファイルの標準偏差に、選択された信頼区間に等しい定数を乗算し、
それにより、不確定要素のカットオフにおける値を作製する。
(iv)で作製されたプロファイルの中央絶対偏差を算出し、
プロファイルの中央絶対偏差に、選択された信頼区間に等しい定数を乗算し、
それにより、不確定要素のカットオフにおける値を作製する。
(iv)で作製された、ピークを含む正規化されたカウントプロファイルを評価する信頼水準を選択し、
ピークを評価するゲノム断片長の最大値を選択し、
ゲノムの位置の種々の長さのゲノム断片におけるピーク上昇および/またはピーク幅を評価し、
それにより、遺伝的変異を検出するための予測値を含むピークがゲノムの位置にて信頼水準を用いて検出される。
ゲノムの位置を選択し、
ピークを含むp値プロファイルを作製し、
選択された信頼水準より下のp値を含むゲノム断片を除去し、
異なる長さの冗長な、および/またはオーバーラップする断片を除去し、
ピーク端の位置およびそれらの関連の不確定要素を決定し、
無作為に選択されたサンプルに共通して見つかるピークを同定し、かつ場合により除去し、
それにより、遺伝的変異を検出するための予測値を含むピークがゲノムの位置内に検出される。
評価のためのゲノムの所望の位置を選択し、
所望のゲノム断片長を選択し、
ゲノムの位置における平均のプロファイル上昇およびサンプル正規化されたカウントプロファイルにおける平均値の関連の誤差を評価し、
選択されたゲノム断片にp値を割り当て、
それによりp値プロファイルが作製される。
(1)開始断片を選択し、
(2)ゲノムの選択された位置における平均の上昇および平均値の標準誤差を決定し、
(3)平均の断片上昇および対応する平均値の標準誤差を評価し、
(4)ゲノムの選択された位置における平均の上昇に対する、および/または所定の上昇期待値に対するZ値を評価し、
(5)1つまたはそれより多い開始断片および/または断片長において1〜4を繰り返し、
(6)選択された開始断片のそれぞれの断片長全体および/または各断片長に対してt検定を行い、
それにより、p値が1つまたはそれより多い選択されたゲノム断片に割り当てられる。
同じまたは同様の条件下において測定された複数のサンプルから細胞非含有サンプル核酸リードを得、
試験サンプルのセットを選択し、
ピークを含む参照中央カウントプロファイルを作製し、
試験サンプルのセットのサンプル間に共通して見つかるピークを同定する。
ピークを含む参照中央カウントプロファイル、ピークを含むZ値プロファイル、ピークを含むp値プロファイル、またはそれらの組み合わせを比較し、
各サンプルで共通して同定されたピークを同定する。
ピークを含むサンプル正規化されたカウントプロファイルおよび/またはピークを含む参照中央カウントプロファイルの1つまたはそれより多い領域を選択し、
正規化プロファイルの第1の導関数および/またはその指数を決定し、
ピーク導関数を特徴付け、
それにより、プロセスが、遺伝的変異を検出する予測値を含むピーク最大値の導関数およびピーク幅の導関数を作製する。
1つまたはそれより多いドナーのサンプルからの血中細胞非含有サンプル核酸から、配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
ピークを含む正規化されたカウントプロファイルを作製し、
各サンプルの予測値を含む正規化されたカウントプロファイルピークを同定し、
1サンプルのピークを別のサンプルからのピークと比較し、
一致するピーク対に基づき、結合確率を決定し、
サンプルが同じドナーからのものである確率を決定し、
それにより、サンプルが同じドナーからのものである確率に対して決定がなされる。
ピーク幅の導関数を使用して、ピークの端が片側公差内で一致するかどうかを決定し、
ピーク最大値の導関数を使用して、ピーク上昇が標準誤差内に一致するかどうかを決定し、
所与のピークの集団の広がりにおいてp値を調節し、
それにより、プロセスの1つ以上を行うことにより、サンプルが同じドナーからのものであるかどうかを決定する。
核酸を含む試験被験体から、サンプルを得、
サンプルからサンプル核酸を単離し、
単離されたサンプル核酸から、配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
カウントされ、マッピングされた配列リードから、選択されたゲノム片上昇における中央カウントプロファイルを含む正規化されたカウントプロファイルおよび関連の不確定要素を得、
評価のためのゲノムの位置を選択し、
ゲノムの位置において中央プロファイル上昇および関連の不確定要素を評価し、
上昇中央値が顕著に、所定の値に対して有意に異なるかどうかを決定し、
それにより、上昇中央値が所定の値に対して有意に異なるかどうかを決定することにより、遺伝的変異を有する場合のサンプルかどうかを決定する。
核酸を含む試験被験体からサンプルを得、
サンプルからサンプル核酸を単離し、
単離されたサンプル核酸から配列リードを得、
ゲノム片に分割されている既知のゲノムに配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
選択されたゲノム片におけるカウントの分布を含む正規化されたカウントプロファイルを得、
評価のためのゲノムの位置を選択し、
予測値を含むピークにおける選択された位置およびピークにおける関連の面積比を評価し、
ピークにおける面積比が所定の値に対して有意に異なるかどうかを決定し、
それにより、ピークにおける面積比が所定の値を顕著に超えるかどうかを決定することにより、サンプルが参照サンプルに対して遺伝的変異を有するかどうかを決定する。
試験被験体および複数の参照被験体から、核酸を含むサンプルを得、
サンプルから、サンプル核酸を単離し、
単離されたサンプル核酸から、配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
試験および参照被験体におけるカウントから、正規化されたカウントプロファイルを得、
評価のためにゲノムの位置を選択し、
複数の分類基準を使用して、参照サンプルのゲノムの選択された位置を評価し、
参照サンプルのみが分布する最小のN次元空間を決定し、
複数の分類基準を使用して、試験被験体のゲノムの位置を評価し、
試験被験体におけるN次元点が、参照サンプルのみが分布する空間内にあるかどうかを決定し、
それにより、試験被験体におけるN次元点が参照サンプルのみが分布する空間にあるかどうか決定することにより、試験被験体が遺伝的変異を有するか(is has)どうかを決定する。
(a)配列受信モジュールにより、試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)ロジック処理モジュールにより、ゲノム片に分割されている既知のゲノムに、(a)で得られた配列リードをマッピングし、
(c)ロジック処理モジュールにより、ゲノム片内にマッピングされた配列リードをカウントし、
(d)ロジック処理モジュールにより、(c)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(e)ロジック処理モジュールにより、(d)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定し、
(f)ロジック処理モジュールにより決定されたことに対してデータ表示組織化モジュールにより、遺伝的変異の有無を示すデータ表示を組織化する。
(a)試験被験体から、サンプル核酸の配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)で得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)(c)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(e)(d)のサンプル正規化されたカウントプロファイルから遺伝的変異の有無を決定する。
(a)試験被験体のサンプルから得られた循環無細胞核酸の配列リードに基づき、未処理のカウントプロファイルを作製し、
(b)1例以上の参照被験体のサンプルから得られた循環無細胞核酸の配列リードに基づき、参照中央カウントプロファイルを作製し、
(c)試験被験体の配列リードのカウント合計に対して、(a)から正規化されたカウントプロファイルを作製し、
(d)1例以上の参照被験体の配列リードのカウント合計に対して、(b)から正規化されたカウントプロファイルを作製し、
(e)一部、正規化されたカウントプロファイルおよび倍数性固定値または倍数性の最適値、および胎児画分の固定値または胎児画分の最適値から選択された1つまたはそれより多い仮定値に基づき、残差二乗和を算出し、
(f)(e)の残差二乗和に基づき胎児倍数性を決定する。
(i)試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(ii)ゲノム片に分割されている既知のゲノムに、(i)で得られた配列リードをマッピングし、
(iii)ゲノム片内にマッピングされた配列リードをカウントし、
(iv)ゲノムまたはその断片全体のカウント測定値の分布を表すサンプル測定カウントプロファイルを構築し、
(v)ゲノムまたはその断片全体の非冗長なマッピングされたカウントの合計数に対して、試験被験体サンプルからサンプル測定カウントプロファイルを正規化し、それによりサンプル未処理カウントプロファイルを作製する。
(1)正倍数体であることが知られている1例以上の参照被験体の血中細胞非含有参照サンプル核酸から配列リードを得、
(2)ゲノム片に分割されている既知のゲノムに、(1)で得られた配列リードをマッピングし、
(3)ゲノム片内にマッピングされた配列リードをカウントし、
(4)(2)のカウントから未処理カウントプロファイルを作製し、
(5)参照サンプルにおける中央値カウントがゼロであるゲノム断片を除去し、
(6)ゲノム片における中央値カウントおよび不確定要素を決定し、
(7)残りの片におけるカウント合計に対してカウントの中央値を正規化し、
(1)〜(7)を行うことにより、参照中央カウントプロファイル、不確定要素プロファイルおよび/または断片識別子を作製する。
(4)で作製されたプロファイルの標準偏差を算出し、
プロファイルの標準偏差に3を乗算し、
それにより、不確定要素のカットオフにおける値を作製する。
(4)で作製されたプロファイルの中央絶対偏差を算出し、
プロファイルの中央絶対偏差に3を乗算し、
それにより、不確定要素のカットオフにおける値を作製する。
対象から、循環無細胞核酸を含むサンプルを得、サンプルから細胞非含有サンプル核酸を単離し、
被験体から得られたサンプルが血液、血清、血漿またはそれらの組み合わせを含む。
式
式
式
ファイが所定の値未満またはそれより大きいかどうかを決定し、
式中、ファイはそれぞれ正倍数体またはトリソミーの成果を仮定して評価される残差二乗和間の差を表し、fは参照中央カウントプロファイルを表し、エプシロンはカウント合計に対して正規化された測定カウントプロファイルを表し、Fは胎児画分を表し、Nはゲノム片の合計数を表し、iは選択されたゲノム片を表し、シグマ(σ)は選択されたゲノム片におけるfと関連する不確定要素を表し、
正倍数体または非正倍数体の決定がファイの数値に基づく。
式
式
式
Xが所定の値未満またはそれより大きいかどうかを決定し、
式中、fは参照中央カウントプロファイルを表し、yはカウント合計に対して正規化された測定カウントプロファイルを表し、Fは胎児画分を表し、Nはゲノム片の合計数を表し、iは選択されたゲノム片を表し、シグマ(σ)は選択されたゲノム片におけるfと関連する不確定要素を表し、エプシロンは正倍数体サンプルから3倍体を区別するカットオフとして使用される正の数であり、
正倍数体または非正倍数体の決定は、Xの数値に基づきなされる。
式
式
倍数性(例えば、X)における成果値を、式
フィットさせた胎児画分と、測定された胎児画分との差の絶対値が、測定された胎児画分における誤差における所定の値より大きいかどうかを決定し、
式中、Fは、フィットさせた胎児画分を表し、F0は胎児画分の測定値を表し、デルタF(例えば、ΔF)は胎児画分の測定値の誤差を表し、Sは計算を簡易化するために導入された補助変数を表し、fは参照中央カウントプロファイルを表し、エプシロンはカウント合計に対して正規化された測定カウントプロファイルを表し、Nはゲノム片の合計数を表し、iは選択されたゲノム片を表し、シグマ(σ)は選択されたゲノム片においてfと関連する不確定要素を表し、
正倍数体または非正倍数体の決定は、Xの数値に基づいてなされる。
胎児画分を測定し、
胎児画分の最適値を得、
式
実施形態C12から得られた値を使用し、
ファイが所定の値未満またはそれより大きいかどうかを決定し、
式中、ファイはそれぞれ正倍数体またはトリソミーの成果を仮定して評価される残差二乗和間の差を表し、F0は測定された胎児画分を表し、デルタF(例えば、ΔF)は測定された胎児画分の誤差を表し、Sは計算を簡易化するために導入された補助変数を表し、fは参照中央カウントプロファイルを表し、yはカウント合計に対して正規化された測定カウントプロファイルを表し、
正倍数体または非正倍数体の決定がファイの数値に基づきなされる。
(a)ロジック処理モジュールにより、試験被験体のサンプルから配列受信モジュールにより得られた循環無細胞核酸の配列リードに基づき、未処理カウントプロファイルを作製し、
(b)ロジック処理モジュールにより、1例以上の参照被験体のサンプルから配列受信モジュールにより得られた循環無細胞核酸の配列リードに基づき、参照中央カウントプロファイルを作製し、
(c)ロジック処理モジュールにより、試験被験体の配列リードのカウント合計に対して(a)から正規化されたカウントプロファイルを作製し、
(d)ロジック処理モジュールにより、1例以上の参照被験体の配列リードのカウント合計に対して(b)から正規化されたカウントプロファイルを作製し、
(e)ロジック処理モジュールにより、一部、正規化されたカウントプロファイルおよび倍数性の固定値または倍数性の最適値および胎児画分の固定値または胎児画分の最適値から選択された1つまたはそれより多い仮定値に基づき、残差二乗和を算出し、
(f)ロジック処理モジュールにより、(e)の残差二乗和に基づき、胎児倍数性を決定し、
(g)ロジック処理モジュールにより決定されたことに対してデータ表示組織化モジュールにより、染色体異常断片もしくは胎児異数性または両方の有無を示すデータ表示を組織化する。
(a)試験被験体のサンプルから得られた循環無細胞核酸の配列リードに基づき、未処理カウントプロファイルを作製し、
(b)1例以上の参照被験体のサンプルから得られた循環無細胞核酸の配列リードに基づき、参照中央カウントプロファイルを作製し、
(c)試験被験体の配列リードのカウント合計に対して(a)から正規化されたカウントプロファイルを作製し、
(d)1例以上の参照被験体の配列リードのカウント合計に対して(b)から正規化されたカウントプロファイルを作製し、
(e)一部、正規化されたカウントプロファイルおよび倍数性の固定値または倍数性の最適値および胎児画分の固定値または胎児画分の最適値から選択される1つまたはそれより多い仮定値に基づき、残差二乗和を算出し、
(f)(e)の残差二乗和に基づき、胎児倍数性を決定する。
(a)試験被験体から、循環無細胞核酸を含むサンプルを得、
(b)サンプルから、細胞非含有サンプル核酸を単離し、
(c)細胞非含有サンプル核酸から、配列リードを得、
(d)ゲノム片に分割されている既知のゲノムに、(c)において得られた配列リードをマッピングし、
(e)ゲノム片内にマッピングされた配列リードをカウントし、
(f)スライディングウィンドウ正規化に基づき、(e)のカウントされ、マッピングされた配列リードを正規化し、
(g)(f)の正規化から染色体異常断片もしくは胎児異数性または両方を同定する成果を提供する。
(i)サンプル正規化されたカウントプロファイルを作製し、
(ii)ノイズゲノム片を除去し、
(iii)上昇平均値から顕著に逸脱するゲノム片を同定し、
(iv)(iii)において同定された孤立のデータ点を除去し、
(v)同じ方向に逸脱する隣り合うデータ点をグループ化し、
(vi)異常上昇および端を特徴付ける。
(a)参照ゲノムのゲノム片にマッピングされた試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)スライディングウィンドウ正規化に基づき、ゲノム片について配列リードのカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(c)(b)のサンプル正規化されたカウントプロファイルから、遺伝的変異、染色体異常断片または胎児異数性の有無を決定する。
(j)サンプル正規化されたカウントプロファイルを作製し、
(ii)ノイズゲノム片を除去し、
(iii)上昇平均値から顕著に逸脱するゲノム片を同定し、
(iv)(iii)において同定された孤立のデータ点を除去し、
(v)同じ方向に逸脱する隣り合うデータ点をグループ化し、
(vi)異常上昇および端を特徴付ける。
(1)候補異常の片側の選択されたゲノム片に線形回帰を行い、
(2)候補異常のもう一方の側の選択されたゲノム片に線形回帰を行い、
(3)候補異常の範囲内の上昇平均値および/または2本の線形回帰線をつなぐ線分の傾きを決定し、
(4)異常の範囲内の上昇平均値と組み合わせて、2本の線形回帰線の切片間の差を決定し、
(1)〜(4)を行うことにより、異常の幅を生成する。
(a)細胞非含有サンプル核酸から配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)において得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)スライディングウィンドウ正規化に基づき、(c)のカウントされ、マッピングされた配列リードを正規化し、
(e)(d)の正規化から染色体異常断片もしくは胎児異数性または両方を同定する成果を提供する。
(i)サンプル正規化されたカウントプロファイルを作製し、
(ii)ノイズゲノム片を除去し、
(iii)上昇平均値から顕著に逸脱するゲノム片を同定し、
(iv)(iii)において同定された孤立のデータ点を除去し、
(v)同じ方向に逸脱する隣り合うデータ点をグループ化し、
(vi)異常上昇および端を特徴付ける。
(1)候補異常の片側の選択されたゲノム片に線形回帰を行い、
(2)候補異常のもう一方の側の選択されたゲノム片に線形回帰を行い、
(3)候補異常の範囲内の上昇平均値および/または2本の線形回帰線をつなぐ線分の傾きを決定し、
(4)異常の範囲内の上昇平均値と組み合わせて、2本の線形回帰線の切片間の差を決定し、
(1)〜(4)を行うことにより、異常の幅を生成する。
(a)試験被験体から、循環無細胞核酸を含むサンプルを得、
(b)サンプルから細胞非含有サンプル核酸を単離し、
(c)細胞非含有サンプル核酸から配列リードを得、
(d)ゲノム片に分割されている既知のゲノムに、(c)において得られた配列リードをマッピングし、
(e)ゲノム片内にマッピングされた配列リードをカウントし、
(f)スライディングウィンドウ正規化に基づき、(e)のカウントされ、マッピングされた配列リードを正規化し、
(g)(f)の正規化から遺伝的変異を同定する成果を提供する。
(i)サンプル正規化されたカウントプロファイルを作製し、
(ii)ノイズゲノム片を除去し、
(iii)上昇平均値から顕著に逸脱するゲノム片を同定し、
(iv)(iii)において同定された孤立のデータ点を除去し、
(v)同じ方向に逸脱する隣り合うデータ点をグループ化し、
(vi)異常上昇および端を特徴付ける。
(1)候補異常の片側の選択されたゲノム片に線形回帰を行い、
(2)候補異常のもう一方の側の選択されたゲノム片に線形回帰を行い、
(3)候補異常の範囲内の上昇平均値および/または2本の線形回帰線をつなぐ線分の傾きを決定し、
(4)異常の範囲内の上昇平均値と組み合わせて、2本の線形回帰線の切片間の差を決定し、
(1)〜(4)を行うことにより、異常の幅を生成する。
(a)細胞非含有サンプル核酸から配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)において得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)スライディングウィンドウ正規化に基づき、(c)のカウントされ、マッピングされた配列リードを正規化し、
(e)(d)の正規化から遺伝的変異を同定する成果を提供する。
(i)サンプル正規化されたカウントプロファイルを作製し、
(ii)ノイズゲノム片を除去し、
(iii)上昇平均値から顕著に逸脱するゲノム片を同定し、
(iv)(iii)において同定された孤立のデータ点を除去し、
(v)同じ方向に逸脱する隣り合うデータ点をグループ化し、
(vi)異常上昇および端を特徴付ける。
(1)候補異常の片側の選択されたゲノム片に線形回帰を行い、
(2)候補異常のもう一方の側の選択されたゲノム片に線形回帰を行い、
(3)候補異常の範囲内の上昇平均値および/または2本の線形回帰線をつなぐ線分の傾きを決定し、
(4)異常の範囲内の上昇平均値と組み合わせて、2本の線形回帰線の切片間の差を決定し、
(1)〜(4)を行うことにより、異常の幅を生成する。
(a)細胞非含有サンプル核酸から、配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)において得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)(c)において得られたカウントおよび/またはその処理された派生物に基づき、表1Bに挙げる状態、症候群または異常の有無を決定する。
(a)試験サンプルからの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントを得、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(c)(i)GCバイアスと、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム選択レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルに減少する。
Li=(mi−GiS)I−1 式α
に従い参照ゲノムの部分のそれぞれにおいて決定され、式中、GiはGCバイアスであり、Iは(c)のフィットさせた関係の切片であり、Sは(c)の関係の傾きであり、miは参照ゲノムの各部分にマッピングされたカウントの測定値であり、iはサンプルである、実施形態G1〜G17のいずれか1つの方法。
(a)胎児を妊娠する妊娠女性からの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントを得、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(c)GCバイアスと、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供し、
(d)95%以上の感受性および95%以上の特異性の算出されたゲノム片レベルに従い、胎児における異数性の有無を同定する。
Li=(mi−GiS)I−1 式β
に従い参照ゲノム部分のそれぞれにおいて決定され、式中、GiはGCバイアスであり、Iは(c)のフィットさせた関係の切片であり、Sは(c)の関係の傾きであり、miは参照ゲノムの各部分にマッピングされたカウントの測定値であり、iはサンプルである、実施形態H1〜H17のいずれか1つの方法。
(a)試験サンプルからの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントを得、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるマッピング特徴とのフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのバイアス実験値を決定し、
(c)バイアス実験値と、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルで減少する。
Li=(mi−GiS)I−1 式γ
に従い参照ゲノム部分のそれぞれにおいて決定され、式中、Giはバイアス実験値であり、Iは(c)のフィットさせた関係の切片であり、Sは(c)の関係の傾きであり、miは参照ゲノムの各部分にマッピングされたカウント測定値であり、iはサンプルである、実施形態I1〜I17のいずれか1つの方法。
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それによりゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第1の上昇が上昇期待範囲のうちの1つにあるときに、所定の値により第1の上昇を調節し、それにより第1の上昇を調節し、
(f)(e)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無を決定する成果が、核酸配列リードから作製される。
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、ゲノム片において正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第1の上昇が上昇期待範囲内にあるときに所定の値により第1の上昇を調節し、それにより、第1の上昇を調節し、
(f)(e)の調節を含むゲノム片におけるゲノム片上昇に従い、胎児の染色体異数性の有無を決定し、それにより染色体異数性の有無を決定する成果が、偽陽性または偽陰性である尤度が減少した核酸配列リードから作製される。
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それによりゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)上昇期待範囲の1つに基づき、ゲノム片内の母体および/または胎児のコピー数多型を同定し、それにより母体および/または胎児のコピー数多型が核酸配列リードから同定される。
K13.上昇期待範囲が、範囲設定モジュールから調節モジュールに転送される、実施形態K9〜K12のいずれか1つの方法。
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それによりゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第2の上昇に従い第1の上昇を調節し、それにより第1の上昇を調節し、
(f)(e)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無を決定する成果が、核酸配列リードから作製される、。
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それによりゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第2の上昇に従い第1の上昇を調節し、それにより第1の上昇を調節し、
(f)(e)の調節を含むゲノム片のゲノム片上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無を決定する成果が、偽陽性または偽陰性である尤度が少ない核酸配列リードから作製される。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは試験サンプルからの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(b)(i)GCバイアスと、(ii)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される、システム。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは試験サンプルからの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(b)(i)GCバイアスと、(ii)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される、装置。
(a)試験サンプルからの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントにアクセスし、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(c)(i)GCバイアスと、(ii)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される命令を含む、コンピュータプログラム製品。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは胎児を妊娠する妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(b)GCバイアスと、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供し、
(c)95%以上の感受性および95%以上の特異性の算出されたゲノム片レベルに従い、胎児における異数性の有無を同定するよう構成される、システム。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは胎児を妊娠する妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(b)GCバイアスと、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供し、
(c)95%以上の感受性および95%以上の特異性の算出されたゲノム片レベルに従い、胎児における異数性の有無を同定するよう構成される、装置。
(a)胎児を妊娠する妊娠女性からの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントにアクセスし、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(c)GCバイアスと、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供し、
(d)95%以上の感受性および95%以上の特異性の算出されたゲノム片レベルに従い、胎児における異数性の有無を同定するよう構成される命令を含む、コンピュータプログラム製品。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは胎児を妊娠する妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるマッピング特徴とのフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのバイアス実験値を決定し、
(b)バイアス実験値と、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される、システム。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは胎児を妊娠する妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるマッピング特徴とのフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのバイアス実験値を決定し、
(b)バイアス実験値と、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される、装置。
(a)試験サンプルからの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントにアクセスし、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるマッピング特徴とのフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのバイアス実験値を決定し、
(c)バイアス実験値と、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される命令を含む、コンピュータプログラム製品。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)第1の上昇が上昇期待範囲のうちの1つにあるときに、所定の値により第1の上昇を調節し、それにより第1の上昇を調節し、
(e)(d)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される、システム。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇は、ゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)第1の上昇が上昇期待範囲のうちの1つにあるときに、所定の値により第1の上昇を調節し、それにより第1の上昇を調節し、
(e)(d)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される、装置。
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントにアクセスし、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第1の上昇が上昇期待範囲のうちの1つにあるときに、所定の値により第1の上昇を調節し、それにより第1の上昇を調節し、
(f)(e)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される命令を含む、コンピュータプログラム製品。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)上昇期待範囲の1つに基づくゲノム片内の母体および/または胎児のコピー数多型を同定し、それにより母体および/または胎児のコピー数多型が、核酸配列リードから同定されるよう構成される、システム。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この(第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)上昇期待範囲の1つに基づくゲノム片内の母体および/または胎児のコピー数多型を同定し、それにより母体および/または胎児のコピー数多型が、核酸配列リードから同定されるよう構成される、装置。
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントにアクセスし、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)上昇期待範囲の1つに基づくゲノム片内の母体および/または胎児のコピー数多型を同定し、それにより母体および/または胎児のコピー数多型が、核酸配列リードから同定されるよう構成される命令を含む、コンピュータプログラム製品。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)第2の上昇に従い第1の上昇を調節し、それにより、第1の上昇を調節し、
(e)(d)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される、システム。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)第2の上昇に従い第1の上昇を調節し、それにより、第1の上昇を調節し、
(e)(d)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される、装置。
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントにアクセスし、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第2の上昇に従い第1の上昇を調節し、それにより、第1の上昇を調節し、
(f)(e)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される命令を含む、コンピュータプログラム製品。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた試験被験体からの血中細胞非含有サンプル核酸の配列リードのカウントを含み、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)ゲノム片のそれぞれについて配列リードのカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(b)(a)のサンプル正規化されたカウントプロファイルから染色体異常断片もしくた胎児異数性または両方の有無を決定するよう構成される、システム。
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた試験被験体からの血中細胞非含有サンプル核酸の配列リードのカウントを含み、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)ゲノム片のそれぞれについて配列リードのカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(b)(a)のサンプル正規化されたカウントプロファイルから染色体異常断片もしくた胎児異数性または両方の有無を決定するよう構成される、装置。
(a)参照ゲノムのゲノム片にマッピングされた試験被験体からの血中細胞非含有サンプル核酸の配列リードのカウントにアクセスし、
(b)ゲノム片のそれぞれについて配列リードのカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(c)(b)のサンプル正規化されたカウントプロファイルから染色体異常断片もしくは胎児の異数性または両方の有無を決定するよう構成される命令を含む、コンピュータプログラム製品。
試験サンプルについて、バイアスゲノム片レベルの減少を用いて算出するための方法であって、上記方法は:
(a)参照ゲノムの部分にマッピングされた配列リードのカウントを得る工程であって、上記配列リードは、試験サンプルからの循環無細胞核酸のリードである、工程;
(b)(i)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントと、(ii)上記部分のそれぞれにおけるGC含量との間の、各サンプルについてフィットさせた関係から、複数のサンプルについての上記参照ゲノムの上記部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定する工程、
(c)(i)上記GCバイアスと、(ii)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントとの間のフィットさせた関係から上記参照ゲノムの上記部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供する工程であって、ここで上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントにおけるバイアスが、上記算出されたゲノム片レベルにおいて減少する、工程
を包含する、方法。
上記参照ゲノムの上記部分が染色体内にある、項目1に記載の方法。
上記参照ゲノムの上記部分が染色体の一部にある、項目1に記載の方法。
上記染色体が第21番染色体である、項目2または3の方法。
上記染色体が第18番染色体である、項目2または3の方法。
上記染色体が第13番染色体である、項目2または3の方法。
(b)の前に、上記参照ゲノムの上記部分の一部または全てにマッピングされた上記配列リードのカウントにおける誤差の測定値を算出する工程、および上記誤差の測定値の閾値に従い上記参照ゲノムの特定の部分について上記配列リードのカウントを除去するか、または重み付けする工程を含む、項目1〜6のいずれか1項に記載の方法。
上記閾値が、第1のゲノム片レベルと第2のゲノム片レベルとの間の、3.5またはそれより大きい標準偏差のギャップに従い選択される、項目7に記載の方法。
上記誤差の測定値がR因子である、項目7または8に記載の方法。
約7%〜約10%のR因子を有する上記参照ゲノムの上記部分についての上記配列リードのカウントが(b)の前に除去される、項目9に記載の方法。
(b)の上記フィットさせた関係がフィットさせた線形関係である、項目1〜10のいずれか1項に記載の方法。
上記関係の傾きが線形回帰により決定される、項目11に記載の方法。
各GCバイアスがGCバイアス係数であり、上記GCバイアス係数は、(i)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントと、(ii)上記部分のそれぞれにおける上記GC含量との間の上記線形関係の傾きである、項目11または12に記載の方法。
(b)の上記フィットさせた関係がフィットさせた非線形関係である、項目1〜10のいずれか1項に記載の方法。
各GCバイアスがGC曲率の推定値を含む、項目14に記載の方法。
(c)の上記フィットさせた関係が線形である、項目1〜15のいずれか1項に記載の方法。
上記関係の傾きが線形回帰により決定される、項目16に記載の方法。
(b)の上記フィットさせた関係が線形であり、(c)の上記フィットさせた関係が線形であり、上記ゲノム片レベルLiが、式α:
Li=(mi−GiS)I−1 式α
に従い、上記参照ゲノムの上記部分のそれぞれについて決定され、ここで式中、Giは上記GCバイアスであり、Iは(c)の上記フィットさせた関係の切片であり、Sは(c)の上記関係の傾きであり、miは上記参照ゲノムの各部分にマッピングされたカウント測定値であり、iはサンプルである、項目1〜17のいずれか1項に記載の方法。
上記参照ゲノムの上記部分の数が約40,000以上の部分である、項目1〜18のいずれか1項に記載の方法。
上記参照ゲノムの各部分が所定の長さのヌクレオチド配列を含む、項目1〜19のいずれか1項に記載の方法。
上記所定の長さが約50キロ塩基である、項目20に記載の方法。
(b)の上記GCバイアスがGCバイアスモジュールにより決定される、項目1〜21のいずれか1項に記載の方法。
(c)の上記ゲノム片レベルがレベルモジュールにより算出される、項目1〜22のいずれか1項に記載の方法。
上記(c)のゲノム片レベルが式αに従い上記レベルモジュールにより提供される、項目23に記載の方法。
上記レベルモジュールが上記GCモジュールからGCバイアスの決定を受信する、項目23または24の方法。
1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、
上記メモリは、上記1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ上記メモリは、参照ゲノムの部分にマッピングされた配列リードのカウントを含み、上記配列リードは、試験サンプルからの循環無細胞核酸のリードであり、
上記1つまたはそれより多いプロセッサにより実行可能な上記命令は、
(a)(i)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントと、(ii)上記部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から、複数のサンプルについての上記参照ゲノムの上記部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、かつ
(b)(i)上記GCバイアスと、(ii)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントとの間のフィットさせた関係から上記参照ゲノムの上記部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供するように構成され、ここで上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントにおけるバイアスが上記算出されたゲノム片レベルにおいて減少する、
システム。
1つまたはそれより多いプロセッサおよびメモリを含む装置であって、
上記メモリは、上記1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ上記メモリは、参照ゲノムの部分にマッピングされた配列リードのカウントを含み、上記配列リードは、試験サンプルからの循環無細胞核酸のリードであり、
上記1つまたはそれより多いプロセッサにより実行可能な上記命令は、
(a)(i)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントと、(ii)上記部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から、複数のサンプルについての上記参照ゲノムの上記部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(b)(i)上記GCバイアスと、(ii)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントとの間のフィットさせた関係から上記参照ゲノムの上記部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供するように構成され、ここで上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントにおけるバイアスが、上記算出されたゲノム片レベルにおいて減少する、
装置。
コンピュータ読み取り可能な媒体に組み込まれた有形のコンピュータプログラム製品であって、1つまたはそれより多いプロセッサにより実行されるときに、
(a)試験サンプルからの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントにアクセスし、
(b)(i)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントと、(ii)上記部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルについての上記参照ゲノムの上記部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、そして
(c)(i)上記GCバイアスと、(ii)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントとの間のフィットさせた関係から上記参照ゲノムの上記部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供するよう構成される命令を含み、ここで上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントにおけるバイアスが、上記算出されたゲノム片レベルにおいて減少する、
コンピュータプログラム製品。
胎児の染色体異数性の有無を決定するための方法であって、上記方法は:
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得る工程、
(b)上記参照ゲノムの上記ゲノム片にマッピングされた上記カウントを正規化し、それにより上記ゲノム片について正規化されたカウントのプロファイルを提供する工程、
(c)上記プロファイルの上記正規化されたカウントの第2の上昇と有意に異なる上記正規化されたカウントの第1の上昇を同定する工程であって、ここで、上記第1の上昇はゲノム片の第1のセットについてのものであり、かつ上記第2の上昇はゲノム片の第2のセットについてのものである、工程、
(d)上記ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定する工程、
(e)上記第1の上昇が上記上昇期待範囲のうちの1つにあるときに上記第1の上昇を調節し、それにより上記第1の上昇の調節を提供する工程、
(f)(e)の上記調節を含む上記のゲノム片の上昇に従い、上記胎児の染色体異数性の有無を決定する工程であって、ここで上記染色体異数性の有無を決定する成果が、上記核酸配列リードから作製される、工程
を包含する、方法。
上記ゲノム片の第1のセットにマッピングされた上記配列リードの上記カウントが、母体もしくは胎児、または母体および胎児の重複を含む、項目29に記載の方法。
上記レベル期待範囲が、母体もしくは胎児、または母体および胎児のホモ接合のコピー数多型、ならびに母体もしくは胎児、または母体および胎児のヘテロ接合のコピー数多型に関して決定される、項目29または30に記載の方法。
上記第1の上昇が、所定の値により(e)において調節される、項目29〜31のいずれか1項に記載の方法。
上記第1の上昇が、上記第2の上昇に対して(e)において調節される、項目29〜31のいずれか1項の方法。
上記第2のセットにマッピングされた上記リードの上記カウントが、実質的に母体および/または胎児のコピー数多型を含まない、項目29〜33のいずれか1項に記載の方法。
ゲノム全体またはゲノムのセグメントについて配列リードのカウントを得る工程を含む、項目29〜34のいずれか1項に記載の方法。
性染色体を除くゲノム全体について配列リードのカウントを得る工程を含む、項目29〜35のいずれか1項に記載の方法。
上記カウントが、GC含量、ビンワイズ正規化、GC LOESS、PERUN、GCRM、またはそれらの組み合わせにより(b)において正規化される、項目29〜36のいずれか1項に記載の方法。
(b)における上記正規化されたカウントが、正規化モジュールにより提供される、項目29〜37のいずれか1項に記載の方法。
上記第2の上昇と有意に異なる上記第1の上昇が、比較モジュールにより(c)において同定される、項目29〜38のいずれか1項に記載の方法。
上記上昇期待範囲が、範囲設定モジュールにより(d)において決定される、項目29〜39のいずれか1項に記載の方法。
(e)の上記調節が、調節モジュールにより行われる、項目29〜40のいずれか1項に記載の方法。
(f)の上記染色体異数性の有無の決定が、成果モジュールにより決定される、項目29〜41のいずれか1項に記載の方法。
上記ゲノム片のセットの上昇が、上記正規化モジュールから上記比較モジュールに転送される、項目39〜42のいずれか1項に記載の方法。
上記第1の上昇が、上記比較モジュールから上記調節モジュールに転送される、項目41〜43のいずれか1項に記載の方法。
上記上昇期待範囲が、上記範囲設定モジュールから上記調節モジュールに転送される、項目41〜44のいずれか1項に記載の方法。
上記調節が、上記調節モジュールから上記成果モジュールに転送される、項目42〜45のいずれか1項に記載の方法。
核酸配列リードを得る工程を含む、項目29〜46のいずれか1項に記載の方法。
上記核酸配列リードがシークエンシングモジュールにより作製される、項目47に記載の方法。
上記核酸配列リードが超並列シークエンシング(MPS)により作製される、項目47または48に記載の方法。
上記核酸配列リードを、上記参照ゲノムの上記ゲノム片に、または参照ゲノム全体にマッピングする工程を含む、項目47〜49のいずれか1項に記載の方法。
上記核酸配列リードがマッピングモジュールによりマッピングされる、項目50に記載の方法。
上記参照ゲノムの上記ゲノム片にマッピングされた上記核酸配列リードがカウンティングモジュールによりカウントされる、項目29〜51のいずれか1項に記載の方法。
上記配列リードが、上記シークエンシングモジュールから上記マッピングモジュールに転送される、項目51または52に記載の方法。
上記参照ゲノムの上記ゲノム片にマッピングされた上記核酸配列リードが、上記マッピングモジュールから上記カウンティングモジュールに転送される、項目52または53に記載の方法。
上記参照ゲノムの上記ゲノム片にマッピングされた上記核酸配列リードの上記カウントが、上記カウンティングモジュールから上記正規化モジュールに転送される、項目52〜54のいずれか1項に記載の方法。
装置は、上記シークエンシングモジュール、上記マッピングモジュール、上記カウンティングモジュール、上記正規化モジュール、上記比較モジュール、上記範囲設定モジュール、分類モジュール、上記調節モジュール、プロットモジュール、上記成果モジュール、データ表示組織化モジュールまたはロジック処理モジュールのうちの1つまたはそれより多くを含み、上記装置は、上記モジュールのうちの1つまたはそれより多くからの命令を実行することができるプロセッサを含むか、またはこれと通信する、項目53〜55のいずれか1項に記載の方法。
第1の装置は、上記正規化モジュール、上記比較モジュール、上記範囲設定モジュール、上記調節モジュール、および上記成果モジュールのうちの1つまたはそれより多くを含む、項目42〜56のいずれか1項に記載の方法。
第2の装置は、上記マッピングモジュールおよび上記カウンティングモジュールを含む、項目52〜57のいずれか1項に記載の方法。
第3の装置は、上記シークエンシングモジュールを含む、項目53〜58のいずれか1項に記載の方法。
(b)における上記正規化されたカウントが、未処理カウントである、項目29〜59のいずれか1項に記載の方法。
(b)における上記正規化されたカウントが、フィルタリングされる、項目29〜60のいずれか1項に記載の方法。
(b)における上記正規化されたカウントが、フィルタリングされない、項目29〜61のいずれか1項に記載の方法。
上記プロファイルの上記第1の上昇および上記第2の上昇が上昇中央値である、項目29〜62のいずれか1項に記載の方法。
上記第2の上昇が、染色体またはそのセグメントにおけるゲノム片のセットを含む、項目29〜63のいずれか1項に記載の方法。
第1のセット、第2のセットまたは上記第1のセットおよび上記第2のセットが2つまたはそれより多いゲノム片を含む、項目29〜64のいずれか1項に記載の方法。
各ゲノム片は、連続ヌクレオチドの長さがほぼ等しいものである、項目29〜65のいずれか1項に記載の方法。
各ゲノム片が約50kbである、項目29〜66のいずれか1項に記載の方法。
各セットが2つまたはそれより多いゲノム片を含む、項目29〜67のいずれか1項に記載の方法。
各セットが20〜40個のゲノム片を含む、項目29〜68のいずれか1項に記載の方法。
上記染色体異数性の有無の決定が、90%と等しいかそれより高い特異性および90%と等しいかそれより高い感度とともに提供される、項目29〜69のいずれか1項に記載の方法。
上記染色体異数性が染色体の欠失または付加である、項目29〜70のいずれか1項に記載の方法。
上記染色体異数性がトリソミーである、項目29〜71のいずれか1項に記載の方法。
上記トリソミーがトリソミー21、トリソミー18、またはトリソミー13である、項目72に記載の方法。
上記不確定値が平均絶対偏差または標準偏差である、項目29〜73のいずれか1項に記載の方法。
上記不確定値が上記第1の上昇から得られる、項目29〜74のいずれか1項に記載の方法。
上記不確定値が上記第2の上昇から得られる、項目29〜74のいずれか1項に記載の方法。
上記不確定値が上記第1の上昇および上記第2の上昇から得られる、項目29〜74のいずれか1項に記載の方法。
(d)の上記上昇期待範囲を決定する工程は、上記不確定値の3倍による、項目29〜77のいずれか1項に記載の方法。
上記ヘテロ接合のコピー数多型または上記ホモ接合のコピー数多型が、母体もしくは胎児、または母体および胎児の欠失、あるいは母体もしくは胎児、または母体および胎児の重複である、項目29〜78のいずれか1項に記載の方法。
上記第2の上昇が参照上昇である、項目29〜79のいずれか1項の方法。
上記第1の上昇および上記第2の上昇が上記参照上昇に対して正規化される、項目80に記載の方法。
正規化された参照値(NRV)が上記参照上昇に対して正規化される上記第2のレベルに従い決定される、項目81に記載の方法。
上記コピー数多型についての上昇期待値が、上記NRVと、上記コピー数多型の上昇期待定数に従い決定される、項目82に記載の方法。
上記NRVに上記上昇期待定数が乗算される、項目83に記載の方法。
ホモ接合重複についての上記上昇期待定数が2であり、ヘテロ接合重複についての上記上昇期待定数が1.5であり、ヘテロ接合欠失についての上記上昇期待定数が0.5であり、ホモ接合欠失についての上記上昇期待定数がゼロである、項目83または84に記載の方法。
母体および/または胎児のコピー数多型の非存在についての上記上昇期待定数が、1である、項目83〜85のいずれか1項に記載の方法。
上昇期待範囲が、上記コピー数多型についての上記上昇期待値および不確定値に従い決定される、項目83〜86のいずれか1項に記載の方法。
上記第1の上昇の上記調節が、上記第1の上昇から上記所定の値を減算することを含む、項目32〜87のいずれか1項に記載の方法。
上記第1の上昇の上記調節が、上記第1の上昇に上記所定の値を加算することを含む、項目32〜87のいずれか1項に記載の方法。
上記所定の値が、コピー数多型において予め決定される所定の調節値(PAV)である、項目32〜89のいずれか1項に記載の方法。
コピー数多型についての上記PAVが、上記コピー数多型についての上記上昇期待値と、上記コピー数多型についてのPAV係数に従い決定される、項目90に記載の方法。
ホモ接合重複についての上記PAV係数が−1であり、ヘテロ接合重複についての上記PAV係数が−0.5であり、ヘテロ接合欠失についての上記PAV係数が0.5であり、ホモ接合欠失についての上記PAV係数が1である、項目91に記載の方法。
上記PAV係数が上記PAV係数を乗算した上記PAVの積である、項目91または92に記載の方法。
上記ゲノム片の第1のセットにマッピングされた上記配列リードのうちの1つまたはそれより多くが、母体もしくは胎児、または母体および胎児の欠失を含む、項目29〜93のいずれか1項に記載の方法。
上記妊娠女性からの循環無細胞核酸の上記配列リードが、上記妊娠女性から得たサンプルからのものである、項目29〜94のいずれか1項に記載の方法。
上記サンプルが上記妊娠女性からの血液を含む、項目95に記載の方法。
上記サンプルが上記妊娠女性からの血漿を含む、項目95に記載の方法。
上記サンプルが上記妊娠女性からの血清を含む、項目95に記載の方法。
上記プロファイルが染色体またはそのセグメントのプロファイルである、項目29〜98のいずれか1項に記載の方法。
上記プロファイルが複数の第1の上昇を含む、項目29〜99のいずれか1項に記載の方法。
複数の第1の上昇に対して、(c)、(d)および(e)を繰り返すことを含む、項目29〜100のいずれか1項に記載の方法。
上記ゲノム片の第1のセットが、上記ゲノム片の第2のセットと異なり、かつ/または区別できる、項目29〜101のいずれか1項に記載の方法。
上記ゲノム片の第2のセットが、上記ゲノム片の第1のセットを含む、項目29〜101のいずれか1項に記載の方法。
上記第2の上昇が、上記ゲノム片の第2のセットについての上昇の平均値、中間値または中央値である、項目29〜103のいずれか1項に記載の方法。
上記不確定値が、上記第2の上昇の平均値、中間値または中央値から得られ、上記不確定値が標準偏差またはMADである、項目104に記載の方法。
上記第2の上昇が染色体全体を表し、上記第1の上昇が母体もしくは胎児、または母体および胎児のコピー数多型を表す、項目29〜105のいずれか1項に記載の方法。
1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、
上記メモリは、上記1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ上記メモリは、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、上記配列リードは、妊娠女性からの循環無細胞核酸のリードであり、
上記1つまたはそれより多いプロセッサにより実行可能な上記命令は、
(a)上記参照ゲノムの上記ゲノム片にマッピングされた上記カウントを正規化し、それにより上記ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)上記プロファイルの上記正規化されたカウントの第2の上昇と有意に異なる上記正規化されたカウントの第1の上昇を同定し、ここで上記第1の上昇がゲノム片の第1のセットについてのものであり、上記第2の上昇がゲノム片の第2のセットについてのものであり、
(c)上記ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型の上昇期待範囲を決定し、
(d)上記第1の上昇が上記上昇期待範囲のうちの1つにあるときに、所定の値により上記第1の上昇を調節し、それにより、上記第1の上昇の調節を提供し、そして
(e)(d)の上記調節を含む上記ゲノム片の上昇に従い、上記胎児の染色体異数性の有無を決定するよう構成され、ここで上記染色体異数性の有無の決定が、上記核酸配列リードから作製される、
システム。
1つまたはそれより多いプロセッサおよびメモリを含む装置であって、
上記メモリは、上記1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ上記メモリは、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、上記配列リードは、妊娠女性からの循環無細胞核酸のリードであり、
上記1つまたはそれより多いプロセッサにより実行可能な上記命令が、
(a)上記参照ゲノムの上記ゲノム片にマッピングされた上記カウントを正規化し、それにより上記ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)上記プロファイルの上記正規化されたカウントの第2の上昇と有意に異なる上記正規化されたカウントの第1の上昇を同定し、ここで上記第1の上昇がゲノム片の第1のセットについてのものであり、上記第2の上昇がゲノム片の第2のセットについてのものであり、
(c)上記ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型の上昇期待範囲を決定し、
(d)上記第1の上昇が上記上昇期待範囲のうちの1つにあるときに、所定の値により上記第1の上昇を調節し、それにより、上記第1の上昇の調節を提供し、そして
(e)(d)の上記調節を含む上記ゲノム片の上昇に従い、上記胎児の染色体異数性の有無を決定するよう構成され、ここで上記染色体異数性の有無の決定が、上記核酸配列リードから作製される、
装置。
コンピュータ読み取り可能な媒体に組み込まれた有形のコンピュータプログラム製品であって、1つまたはそれより多いプロセッサにより実行されるときに、
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントにアクセスし、
(b)上記参照ゲノムの上記ゲノム片にマッピングされた上記カウントを正規化し、それにより上記ゲノム片について正規化されたカウントのプロファイルを提供し、
(c)上記プロファイルの上記正規化されたカウントの第2の上昇と有意に異なる上記正規化されたカウントの第1の上昇を同定し、ここで上記第1の上昇がゲノム片の第1のセットについてのものであり、上記第2の上昇がゲノム片の第2のセットについてのものであり、
(d)上記ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型の上昇期待範囲を決定し、
(e)上記第1の上昇が上記上昇期待範囲のうちの1つにあるときに、所定の値により上記第1の上昇を調節し、それにより、上記第1の上昇の調節を提供し、
(f)(e)の上記調節を含む上記ゲノム片の上昇に従い、上記胎児の染色体異数性の有無を決定するよう構成される命令を含み、ここで上記染色体異数性の有無の決定が、上記核酸配列リードから作製される、
コンピュータプログラム製品。
Claims (52)
- メモリおよび1つまたはそれより多いマイクロプロセッサを含むシステムであって、前記1つまたはそれより多いマイクロプロセッサは、前記メモリ内の命令にしたがって、試験サンプルについて、バイアスゲノム片レベルの減少を用いて算出するためのプロセスを実行するように構成され、前記プロセスは:
(a)参照ゲノムの部分にマッピングされた配列リードのカウントを得る工程であって、前記配列リードは、試験サンプルからの循環無細胞核酸のリードである、工程;
(b)(i)前記部分のそれぞれにマッピングされた前記配列リードの前記カウントと、(ii)前記部分のそれぞれにおけるGC含量との間の、フィットさせた関係に基づいて、前記試験サンプルについてのグアニンおよびシトシン(GC)バイアス係数を決定する工程、
(c)(a)の前記カウント、(b)の前記GCバイアス係数、および(i)複数のサンプルのそれぞれについての前記GCバイアス係数と、(ii)前記複数のサンプルについての前記部分のそれぞれにマッピングされた前記配列リードの前記カウントとの間の、前記部分のそれぞれについてフィットさせた関係に基づいて、前記部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供する工程であって、ここで前記参照ゲノムの前記部分のそれぞれにマッピングされた前記配列リードの前記カウントにおけるバイアスが、前記算出されたゲノム片レベルにおいて減少する、工程
を包含する、システム。 - 前記GCバイアス係数が、線形フィットさせた関係の傾きまたは非線形フィットさせた関係の曲率の推定値である、請求項1に記載のシステム。
- (b)の前記フィットさせた関係および(c)の前記フィットさせた関係が線形のものである、請求項1または2に記載のシステム。
- (b)の前記フィットさせた関係および(c)の前記フィットさせた関係のそれぞれが、独立して線形回帰によりフィットされる、請求項1〜3のいずれか1項に記載のシステム。
- (c)(i)における前記複数のサンプルのそれぞれについての前記GCバイアス係数が、(i)前記部分のそれぞれにマッピングされた前記配列リードの前記カウントと、(ii)前記部分のそれぞれにおけるGC含量との間の、前記複数のサンプルのそれぞれについてフィットさせた線形関係の傾きである、請求項1〜4のいずれか1項に記載のシステム。
- 前記算出されたゲノム片レベルLが、式B:
L=(M−GS)/I 式B
に従い、前記参照ゲノムのそれぞれの部分に関して、前記試験サンプルについて決定され、ここで式中、Mは、前記試験サンプルについて前記部分にマッピングされた前記配列リードの前記カウントであり、Gは前記試験サンプルについての前記GCバイアス係数であり、Iは、前記部分について(c)の前記フィットさせた線形関係の切片であり、Sは、前記部分について(c)の前記フィットさせた線形関係の傾きである、請求項1〜5のいずれか1項に記載のシステム。 - (b)の前記フィットさせた関係が非線形のものである、請求項1または2に記載のシステム。
- 前記参照ゲノムの前記部分のそれぞれが、所定の長さのヌクレオチド配列を含む、請求項1〜7のいずれか1項に記載のシステム。
- 前記プロセスが、(a)の前に、前記試験サンプルから循環無細胞核酸をシークエンシングすることによって前記配列リードを決定する工程を含む、請求項1〜8のいずれか1項に記載のシステム。
- 前記プロセスが、(a)の前に、前記参照ゲノムの前記部分に前記配列リードをマッピングする工程を含む、請求項1〜9のいずれか1項に記載のシステム。
- 前記試験サンプルが、ヒト妊娠女性に由来し、かつ前記プロセスが、前記算出されたゲノム片レベルにしたがって、前記試験サンプルについて胎児の染色体異数性の有無を決定する工程を含む、請求項1〜10のいずれか1項に記載のシステム。
- 前記胎児の染色体異数性がトリソミーである、請求項11に記載のシステム。
- 前記トリソミーが、第21番染色体のトリソミー、第18番染色体のトリソミー、第13番染色体のトリソミーまたはこれらの組み合わせから選択される、請求項12に記載のシステム。
- 前記トリソミーの有無が、96%もしくはそれより高い感度または96%もしくはそれより高い特異性、あるいは96%もしくはそれより高い感度および96%もしくはそれより高い特異性で決定される、請求項12または13に記載のシステム。
- 前記プロセスが、(b)の前に、前記参照ゲノムの前記部分の一部または全てにマッピングされた前記配列リードのカウントにおける誤差の測定値を算出する工程、および前記誤差の測定値の閾値に従い前記参照ゲノムの特定の部分について前記配列リードのカウントを除去するか、または重み付けする工程を含む、請求項1〜14のいずれか1項に記載のシステム。
- 前記閾値が、第1のゲノム片レベルと第2のゲノム片レベルとの間の、3.5またはそれより大きい標準偏差のギャップに従い選択される、請求項15に記載のシステム。
- 前記誤差の測定値がR因子である、請求項15または16に記載のシステム。
- 約7%またはそれより大きいR因子を有する前記参照ゲノムの部分についての前記配列リードのカウントが(b)の前に除去される、請求項17に記載のシステム。
- 試験サンプルについて、バイアスゲノム片レベルの減少を用いて算出するための方法であって、前記方法は:
(a)参照ゲノムの部分にマッピングされた配列リードのカウントを得る工程であって、前記配列リードは、試験サンプルからの循環無細胞核酸のリードである、工程;
(b)(i)前記部分のそれぞれにマッピングされた前記配列リードの前記カウントと、(ii)前記部分のそれぞれにおけるGC含量との間の、フィットさせた関係に基づいて、前記試験サンプルについてのグアニンおよびシトシン(GC)バイアス係数を決定する工程;ならびに
(c)マイクロプロセッサを使用して、(a)の前記カウント、(b)の前記GCバイアス係数、および(i)複数のサンプルのそれぞれについての前記GCバイアス係数と、(ii)前記複数のサンプルについての前記部分のそれぞれにマッピングされた前記配列リードの前記カウントとの間の、前記部分のそれぞれについてフィットさせた関係に基づいて、前記部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供する工程であって、ここで前記参照ゲノムの前記部分のそれぞれにマッピングされた前記配列リードの前記カウントにおけるバイアスが、前記算出されたゲノム片レベルにおいて減少する、工程
を包含する、方法。 - 前記GCバイアス係数が、線形フィットさせた関係の傾きまたは非線形フィットさせた関係の曲率の推定値である、請求項19に記載の方法。
- (b)の前記フィットさせた関係および(c)の前記フィットさせた関係が線形のものである、請求項19または20に記載の方法。
- (b)の前記フィットさせた関係および(c)の前記フィットさせた関係のそれぞれが、独立して線形回帰によりフィットされる、請求項19〜21のいずれか1項に記載の方法。
- (c)(i)における前記複数のサンプルのそれぞれについての前記GCバイアス係数が、(i)前記部分のそれぞれにマッピングされた前記配列リードの前記カウントと、(ii)前記部分のそれぞれにおけるGC含量との間の、前記複数のサンプルのそれぞれについてフィットさせた線形関係の傾きである、請求項19〜22のいずれか1項に記載の方法。
- 前記算出されたゲノム片レベルLが、式B:
L=(M−GS)/I 式B
に従い、前記参照ゲノムのそれぞれの部分に関して、前記試験サンプルについて決定され、ここで式中、Mは、前記試験サンプルについて前記部分にマッピングされた前記配列リードの前記カウントであり、Gは前記試験サンプルについての前記GCバイアス係数であり、Iは、前記部分について(c)の前記フィットさせた線形関係の切片であり、Sは、前記部分について(c)の前記フィットさせた線形関係の傾きである、請求項19〜23のいずれか1項に記載の方法。 - (b)の前記フィットさせた関係が非線形のものである、請求項19または20に記載の方法。
- 前記参照ゲノムの前記部分のそれぞれが、所定の長さのヌクレオチド配列を含む、請求項19〜25のいずれか1項に記載の方法。
- (a)の前に、前記試験サンプルから循環無細胞核酸をシークエンシングすることによって前記配列リードを決定する工程を含む、請求項19〜26のいずれか1項に記載の方法。
- (a)の前に、前記参照ゲノムの前記部分に前記配列リードをマッピングする工程を含む、請求項19〜27のいずれか1項に記載の方法。
- 前記試験サンプルが、ヒト妊娠女性に由来し、かつ前記方法が、前記算出されたゲノム片レベルにしたがって、前記試験サンプルについて胎児の染色体異数性の有無を決定する工程を含む、請求項19〜28のいずれか1項に記載の方法。
- 前記胎児の染色体異数性がトリソミーである、請求項29に記載の方法。
- 前記トリソミーが、第21番染色体のトリソミー、第18番染色体のトリソミー、第13番染色体のトリソミーまたはこれらの組み合わせから選択される、請求項30に記載の方法。
- 前記トリソミーの有無が、96%もしくはそれより高い感度または96%もしくはそれより高い特異性、あるいは96%もしくはそれより高い感度および96%もしくはそれより高い特異性で決定される、請求項30または31に記載の方法。
- (b)の前に、前記参照ゲノムの前記部分の一部または全てにマッピングされた前記配列リードのカウントにおける誤差の測定値を算出する工程、および前記誤差の測定値の閾値に従い前記参照ゲノムの特定の部分について前記配列リードのカウントを除去するか、または重み付けする工程を含む、請求項19〜32のいずれか1項に記載の方法。
- 前記閾値が、第1のゲノム片レベルと第2のゲノム片レベルとの間の、3.5またはそれより大きい標準偏差のギャップに従い選択される、請求項33に記載の方法。
- 前記誤差の測定値がR因子である、請求項33または34に記載の方法。
- 約7%またはそれより大きいR因子を有する前記参照ゲノムの部分についての前記配列リードのカウントが(b)の前に除去される、請求項35に記載の方法。
- シークエンシング装置および1つまたはそれより多い演算装置を含むシステムであって、
前記シークエンシング装置は、前記シークエンシング装置にロードされた核酸のヌクレオチド塩基に対応するシグナルを生成するよう構成され、前記核酸は、胎児を有する妊娠したヒト女性からの試験サンプルに由来する循環無細胞核酸である、あるいは前記シークエンシング装置にロードされる前記循環無細胞核酸は、処理または改変され、そして
前記1つまたはそれより多い演算装置は、メモリおよび1つまたはそれより多いプロセッサを含み、前記メモリは、前記1つまたはそれより多いプロセッサによって実行可能な命令を含み、前記1つまたはそれより多いプロセッサによって実行可能な前記命令は、以下:
(a)前記シグナルから配列リードを生成して、前記配列リードを参照ゲノムにマッピングし;
(b)前記参照ゲノムの部分にマッピングされた配列リードのカウントを得;
(c)(i)前記部分のそれぞれにマッピングされた前記配列リードの前記カウントと、(ii)前記部分のそれぞれにおけるGC含量との間の、フィットさせた関係に基づいて、前記試験サンプルについてのグアニンおよびシトシン(GC)バイアス係数を決定し;そして
(d)(b)の前記カウント、(c)の前記GCバイアス係数、および(i)複数のサンプルのそれぞれについての前記GCバイアス係数と、(ii)前記複数のサンプルについての前記部分のそれぞれにマッピングされた前記配列リードの前記カウントとの間の、前記部分のそれぞれについてフィットさせた関係に基づいて、前記部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供するよう構成され、ここで前記参照ゲノムの前記部分のそれぞれにマッピングされた前記配列リードの前記カウントにおけるバイアスが、前記算出されたゲノム片レベルにおいて減少する、
システム。 - 前記GCバイアス係数が、線形フィットさせた関係の傾きまたは非線形フィットさせた関係の曲率の推定値である、請求項37に記載のシステム。
- (c)の前記フィットさせた関係および(d)の前記フィットさせた関係が線形のものである、請求項37または38に記載のシステム。
- (c)の前記フィットさせた関係および(d)の前記フィットさせた関係のそれぞれが、独立して線形回帰によりフィットされる、請求項37〜39のいずれか1項に記載のシステム。
- (d)(i)における前記複数のサンプルのそれぞれについての前記GCバイアス係数が、(i)前記部分のそれぞれにマッピングされた前記配列リードの前記カウントと、(ii)前記部分のそれぞれにおけるGC含量との間の、前記複数のサンプルのそれぞれについてフィットさせた線形関係の傾きである、請求項37〜40のいずれか1項に記載のシステム。
- 前記算出されたゲノム片レベルLが、式B:
L=(M−GS)/I 式B
に従い、前記参照ゲノムのそれぞれの部分に関して、前記試験サンプルについて決定され、ここで式中、Mは、前記試験サンプルについて前記部分にマッピングされた前記配列リードの前記カウントであり、Gは前記試験サンプルについての前記GCバイアス係数であり、Iは、前記部分について(d)の前記フィットさせた線形関係の切片であり、Sは、前記部分について(d)の前記フィットさせた線形関係の傾きである、請求項37〜41のいずれか1項に記載のシステム。 - (c)の前記フィットさせた関係が非線形のものである、請求項37または38に記載のシステム。
- 前記参照ゲノムの前記部分のそれぞれが、所定の長さのヌクレオチド配列を含む、請求項37〜43のいずれか1項に記載のシステム。
- 前記メモリが、前記算出されたゲノム片レベルにしたがって、前記試験サンプルについて胎児の染色体異数性の有無を決定するよう構成された命令を含む、請求項37〜44のいずれか1項に記載のシステム。
- 前記胎児の染色体異数性がトリソミーである、請求項45に記載のシステム。
- 前記トリソミーが、第21番染色体のトリソミー、第18番染色体のトリソミー、第13番染色体のトリソミーまたはこれらの組み合わせから選択される、請求項46に記載のシステム。
- 前記トリソミーの有無が、96%もしくはそれより高い感度または96%もしくはそれより高い特異性、あるいは96%もしくはそれより高い感度および96%もしくはそれより高い特異性で決定される、請求項46または47に記載のシステム。
- 前記メモリが、(c)の前に、前記参照ゲノムの前記部分の一部または全てにマッピングされた前記配列リードのカウントにおける誤差の測定値を算出し、そして前記誤差の測定値の閾値に従い前記参照ゲノムの特定の部分について前記配列リードのカウントを除去するか、または重み付けするよう構成された命令を含む、請求項37〜48のいずれか1項に記載のシステム。
- 前記閾値が、第1のゲノム片レベルと第2のゲノム片レベルとの間の、3.5またはそれより大きい標準偏差のギャップに従い選択される、請求項49に記載のシステム。
- 前記誤差の測定値がR因子である、請求項49または50に記載のシステム。
- 約7%またはそれより大きいR因子を有する前記参照ゲノムの部分についての前記配列リードのカウントが(c)の前に除去される、請求項51に記載のシステム。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161544251P | 2011-10-06 | 2011-10-06 | |
US61/544,251 | 2011-10-06 | ||
US201261663477P | 2012-06-22 | 2012-06-22 | |
US61/663,477 | 2012-06-22 | ||
US201261709899P | 2012-10-04 | 2012-10-04 | |
US61/709,899 | 2012-10-04 | ||
PCT/US2012/059123 WO2013052913A2 (en) | 2011-10-06 | 2012-10-05 | Methods and processes for non-invasive assessment of genetic variations |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016216922A Division JP6227095B2 (ja) | 2011-10-06 | 2016-11-07 | 遺伝的変異の非侵襲的評価のための方法およびプロセス |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2014534507A true JP2014534507A (ja) | 2014-12-18 |
JP2014534507A5 JP2014534507A5 (ja) | 2015-10-29 |
JP6073902B2 JP6073902B2 (ja) | 2017-02-01 |
Family
ID=47073532
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014534806A Active JP6073902B2 (ja) | 2011-10-06 | 2012-10-05 | 遺伝的変異の非侵襲的評価のための方法およびプロセス |
JP2016216922A Active JP6227095B2 (ja) | 2011-10-06 | 2016-11-07 | 遺伝的変異の非侵襲的評価のための方法およびプロセス |
JP2017045068A Withdrawn JP2017099419A (ja) | 2011-10-06 | 2017-03-09 | 遺伝的変異の非侵襲的評価のための方法およびプロセス |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016216922A Active JP6227095B2 (ja) | 2011-10-06 | 2016-11-07 | 遺伝的変異の非侵襲的評価のための方法およびプロセス |
JP2017045068A Withdrawn JP2017099419A (ja) | 2011-10-06 | 2017-03-09 | 遺伝的変異の非侵襲的評価のための方法およびプロセス |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230112134A1 (ja) |
EP (2) | EP3922731A3 (ja) |
JP (3) | JP6073902B2 (ja) |
AU (1) | AU2012318371B2 (ja) |
CA (1) | CA2850781C (ja) |
DK (1) | DK2764459T3 (ja) |
ES (1) | ES2886508T3 (ja) |
HK (1) | HK1200934A1 (ja) |
WO (1) | WO2013052913A2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015521482A (ja) * | 2012-06-22 | 2015-07-30 | セクエノム, インコーポレイテッド | 遺伝的変異の非侵襲的評価のための方法およびプロセス |
JP2018512048A (ja) * | 2015-02-10 | 2018-05-10 | ザ チャイニーズ ユニバーシティ オブ ホンコン | 癌スクリーニング及び胎児分析のための変異検出 |
US10633713B2 (en) | 2017-01-25 | 2020-04-28 | The Chinese University Of Hong Kong | Diagnostic applications using nucleic acid fragments |
US11261494B2 (en) | 2012-06-21 | 2022-03-01 | The Chinese University Of Hong Kong | Method of measuring a fractional concentration of tumor DNA |
US11437121B2 (en) | 2011-10-06 | 2022-09-06 | Sequenom, Inc. | Methods and processes for non-invasive detection of a microduplication or a microdeletion with reduced sequence read count error |
US11492659B2 (en) | 2011-10-06 | 2022-11-08 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US11560586B2 (en) | 2011-10-06 | 2023-01-24 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
JP2023504139A (ja) * | 2019-11-29 | 2023-02-01 | ジーシー ジェノム コーポレーション | 人工知能ベースの染色体異常検出方法 |
US11581063B2 (en) | 2015-07-23 | 2023-02-14 | The Chinese University Of Hong Kong | Analysis of fragmentation patterns of cell-free DNA |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8476013B2 (en) | 2008-09-16 | 2013-07-02 | Sequenom, Inc. | Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses |
US8962247B2 (en) | 2008-09-16 | 2015-02-24 | Sequenom, Inc. | Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses |
WO2011087760A2 (en) | 2009-12-22 | 2011-07-21 | Sequenom, Inc. | Processes and kits for identifying aneuploidy |
TWI611186B (zh) * | 2011-02-24 | 2018-01-11 | 香港中文大學 | 多重妊娠之分子檢驗 |
US20140235474A1 (en) | 2011-06-24 | 2014-08-21 | Sequenom, Inc. | Methods and processes for non invasive assessment of a genetic variation |
US20140242588A1 (en) | 2011-10-06 | 2014-08-28 | Sequenom, Inc | Methods and processes for non-invasive assessment of genetic variations |
US10424394B2 (en) | 2011-10-06 | 2019-09-24 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
EP2805280B1 (en) | 2012-01-20 | 2022-10-05 | Sequenom, Inc. | Diagnostic processes that factor experimental conditions |
ES2930180T3 (es) | 2012-03-02 | 2022-12-07 | Sequenom Inc | Métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica |
US10504613B2 (en) | 2012-12-20 | 2019-12-10 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
DK3663409T3 (da) | 2012-05-21 | 2021-12-13 | Sequenom Inc | Fremgangsmåder og processer til ikke-invasiv bedømmelse af genetiske variationer |
US9920361B2 (en) | 2012-05-21 | 2018-03-20 | Sequenom, Inc. | Methods and compositions for analyzing nucleic acid |
CA2878979C (en) | 2012-07-13 | 2021-09-14 | Sequenom, Inc. | Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses |
US10482994B2 (en) * | 2012-10-04 | 2019-11-19 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
CA3120521A1 (en) * | 2012-10-04 | 2014-04-10 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US20130309666A1 (en) | 2013-01-25 | 2013-11-21 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
CA2901460A1 (en) | 2013-02-20 | 2014-08-28 | Bionano Genomics, Inc. | Characterization of molecules in nanofluidics |
WO2015130696A1 (en) | 2014-02-25 | 2015-09-03 | Bionano Genomics, Inc. | Reduction of bias in genomic coverage measurements |
US10844424B2 (en) | 2013-02-20 | 2020-11-24 | Bionano Genomics, Inc. | Reduction of bias in genomic coverage measurements |
WO2014168711A1 (en) | 2013-03-13 | 2014-10-16 | Sequenom, Inc. | Primers for dna methylation analysis |
HUE061261T2 (hu) | 2013-04-03 | 2023-05-28 | Sequenom Inc | Eljárások és folyamatok genetikai variánsok nem invazív értékelésére |
JP6561046B2 (ja) * | 2013-05-24 | 2019-08-14 | セクエノム, インコーポレイテッド | 遺伝子の変動の非侵襲性評価のための方法および処理 |
US20160117440A1 (en) * | 2013-05-30 | 2016-04-28 | Memorial Sloan-Kettering Cancer Center | System and method for automated prediction of vulnerabilities in biological samples |
SI3011051T1 (sl) * | 2013-06-21 | 2019-05-31 | Sequenom, Inc. | Postopek za neinvazivno oceno genetskih variacij |
CN104450872A (zh) * | 2013-09-25 | 2015-03-25 | 上海市肿瘤研究所 | 一种高通量多样本多靶点单碱基分辨率的甲基化水平检测方法 |
IL289974B (en) * | 2013-10-04 | 2022-09-01 | Sequenom Inc | Methods and processes for non-invasive evaluation of genetic variations |
JP6680680B2 (ja) | 2013-10-07 | 2020-04-15 | セクエノム, インコーポレイテッド | 染色体変化の非侵襲性評価のための方法およびプロセス |
US10851414B2 (en) * | 2013-10-18 | 2020-12-01 | Good Start Genetics, Inc. | Methods for determining carrier status |
WO2015061359A1 (en) | 2013-10-21 | 2015-04-30 | Verinata Health, Inc. | Method for improving the sensitivity of detection in determining copy number variations |
CN103540672B (zh) * | 2013-10-29 | 2015-04-08 | 中国科学技术大学 | 一种亲和核酸分子的快速鉴定和分离方法 |
KR101516976B1 (ko) * | 2013-10-30 | 2015-05-04 | 에스케이텔레콤 주식회사 | 표적 염기 서열 해독에서의 바이어스 제거 방법 |
EP3736344A1 (en) | 2014-03-13 | 2020-11-11 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
WO2015183872A1 (en) * | 2014-05-30 | 2015-12-03 | Sequenom, Inc. | Chromosome representation determinations |
EP3175000B1 (en) | 2014-07-30 | 2020-07-29 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
JP2016042836A (ja) * | 2014-08-25 | 2016-04-04 | 富士フイルム株式会社 | 検査通知出力装置、検査通知出力方法、検査通知出力プログラム、及び遺伝子染色体検査システム |
CA2970501C (en) | 2014-12-12 | 2020-09-15 | Verinata Health, Inc. | Using cell-free dna fragment size to determine copy number variations |
WO2016100049A1 (en) | 2014-12-18 | 2016-06-23 | Edico Genome Corporation | Chemically-sensitive field effect transistor |
US9857328B2 (en) | 2014-12-18 | 2018-01-02 | Agilome, Inc. | Chemically-sensitive field effect transistors, systems and methods for manufacturing and using the same |
US10006910B2 (en) | 2014-12-18 | 2018-06-26 | Agilome, Inc. | Chemically-sensitive field effect transistors, systems, and methods for manufacturing and using the same |
US9618474B2 (en) | 2014-12-18 | 2017-04-11 | Edico Genome, Inc. | Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids |
US10020300B2 (en) | 2014-12-18 | 2018-07-10 | Agilome, Inc. | Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids |
US9859394B2 (en) | 2014-12-18 | 2018-01-02 | Agilome, Inc. | Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids |
RU2613021C1 (ru) * | 2015-11-20 | 2017-03-14 | Общество С Ограниченной Ответственностью "Стриж Телематика" | Способ кодирования и декодирования сообщений |
US10095831B2 (en) | 2016-02-03 | 2018-10-09 | Verinata Health, Inc. | Using cell-free DNA fragment size to determine copy number variations |
WO2017201081A1 (en) | 2016-05-16 | 2017-11-23 | Agilome, Inc. | Graphene fet devices, systems, and methods of using the same for sequencing nucleic acids |
WO2017205826A1 (en) | 2016-05-27 | 2017-11-30 | Sequenom, Inc. | Methods for detecting genetic variations |
SG11201811556RA (en) * | 2016-07-06 | 2019-01-30 | Guardant Health Inc | Methods for fragmentome profiling of cell-free nucleic acids |
US11200963B2 (en) | 2016-07-27 | 2021-12-14 | Sequenom, Inc. | Genetic copy number alteration classifications |
WO2018022906A1 (en) | 2016-07-27 | 2018-02-01 | Sequenom, Inc. | Methods for non-invasive assessment of genomic instability |
RU2768718C2 (ru) * | 2016-09-22 | 2022-03-24 | Иллумина, Инк. | Обнаружение соматического варьирования числа копий |
CA3049457C (en) | 2017-01-20 | 2023-05-16 | Sequenom, Inc. | Methods for non-invasive assessment of copy number alterations |
CA3049455C (en) | 2017-01-20 | 2023-06-13 | Sequenom, Inc. | Sequencing adapter manufacture and use |
US11929145B2 (en) | 2017-01-20 | 2024-03-12 | Sequenom, Inc | Methods for non-invasive assessment of genetic alterations |
JP7237003B2 (ja) | 2017-01-24 | 2023-03-10 | セクエノム, インコーポレイテッド | 遺伝子片の評価のための方法およびプロセス |
EP3998350A1 (en) | 2017-03-17 | 2022-05-18 | Sequenom, Inc. | Methods and processes for assessment of genetic mosaicism |
US11342047B2 (en) | 2017-04-21 | 2022-05-24 | Illumina, Inc. | Using cell-free DNA fragment size to detect tumor-associated variant |
CA3107467A1 (en) | 2018-09-07 | 2020-03-12 | Sequenom, Inc. | Methods, and systems to detect transplant rejection |
CA3128894A1 (en) | 2019-02-19 | 2020-08-27 | Sequenom, Inc. | Compositions, methods, and systems to detect hematopoietic stem cell transplantation status |
KR102452413B1 (ko) * | 2019-08-19 | 2022-10-11 | 주식회사 지씨지놈 | 핵산 단편간 거리 정보를 이용한 염색체 이상 검출 방법 |
AU2020333348B2 (en) * | 2019-08-19 | 2023-11-23 | Green Cross Genome Corporation | Method for detecting chromosomal abnormality by using information about distance between nucleic acid fragments |
EP4035161A1 (en) | 2019-09-23 | 2022-08-03 | Grail, LLC | Systems and methods for diagnosing a disease condition using on-target and off-target sequencing data |
EP4052259A1 (en) | 2019-10-31 | 2022-09-07 | Sequenom, Inc. | Application of mosaicism ratio in multifetal gestations and personalized risk assessment |
EP4022646A4 (en) * | 2019-12-25 | 2022-11-02 | Idea Teknoloji Çözümleri Bilgisayar Sanayi ve Ticaret Anonim Sirketi | PRIORITY AND RATING PROCEDURE |
US20230120825A1 (en) | 2020-02-28 | 2023-04-20 | Laboratory Corporation Of America Holdings | Compositions, Methods, and Systems for Paternity Determination |
WO2024186778A1 (en) | 2023-03-03 | 2024-09-12 | Laboratory Corporation Of America Holdings | Methods and systems for positive cfdna screening on genetic variations using mosaicism ratio |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110177517A1 (en) * | 2010-01-19 | 2011-07-21 | Artemis Health, Inc. | Partition defined detection methods |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6927028B2 (en) | 2001-08-31 | 2005-08-09 | Chinese University Of Hong Kong | Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA |
CA2497988C (en) | 2002-09-06 | 2011-03-29 | The Trustees Of Boston University | Quantification of gene expression |
CN1774511B (zh) | 2002-11-27 | 2013-08-21 | 斯昆诺有限公司 | 用于序列变异检测和发现的基于断裂的方法和系统 |
EP1641809B2 (en) | 2003-07-05 | 2018-10-03 | The Johns Hopkins University | Method and compositions for detection and enumeration of genetic variations |
CN101243191B (zh) | 2004-11-29 | 2014-04-16 | 塞昆纳姆股份有限公司 | 用于检测甲基化dna的手段和方法 |
US8679741B2 (en) | 2006-05-31 | 2014-03-25 | Sequenom, Inc. | Methods and compositions for the extraction and amplification of nucleic acid from a sample |
AU2007260750A1 (en) | 2006-06-16 | 2007-12-21 | Sequenom, Inc. | Methods and compositions for the amplification, detection and quantification of nucleic acid from a sample |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
EP3770275A1 (en) | 2007-07-23 | 2021-01-27 | The Chinese University of Hong Kong | Determining a fetal aneuploidy |
WO2009032779A2 (en) | 2007-08-29 | 2009-03-12 | Sequenom, Inc. | Methods and compositions for the size-specific seperation of nucleic acid from a sample |
US9404150B2 (en) | 2007-08-29 | 2016-08-02 | Sequenom, Inc. | Methods and compositions for universal size-specific PCR |
CN101889074A (zh) | 2007-10-04 | 2010-11-17 | 哈尔西恩莫尔丘勒公司 | 采用电子显微镜对核酸聚合物测序 |
CA2718137A1 (en) | 2008-03-26 | 2009-10-01 | Sequenom, Inc. | Restriction endonuclease enhanced polymorphic sequence detection |
CN102245760A (zh) | 2008-07-07 | 2011-11-16 | 牛津纳米孔技术有限公司 | 酶-孔构建体 |
US8476013B2 (en) | 2008-09-16 | 2013-07-02 | Sequenom, Inc. | Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses |
ES2599967T3 (es) | 2008-09-16 | 2017-02-06 | Sequenom, Inc. | Procedimientos y composiciones para el enriquecimiento basado en metilación de ácido nucleico fetal de una muestra materna útiles para diagnósticos prenatales no invasivos |
LT2562268T (lt) * | 2008-09-20 | 2017-04-25 | The Board Of Trustees Of The Leland Stanford Junior University | Neinvazinis fetalinės aneuploidijos diagnozavimas sekvenavimu |
EP3514244B1 (en) | 2009-04-03 | 2021-07-07 | Sequenom, Inc. | Nucleic acid preparation methods |
US8574842B2 (en) * | 2009-12-22 | 2013-11-05 | The Board Of Trustees Of The Leland Stanford Junior University | Direct molecular diagnosis of fetal aneuploidy |
ES2704701T3 (es) * | 2010-01-19 | 2019-03-19 | Verinata Health Inc | Nuevo protocolo de preparación de bibliotecas de secuenciación |
EP2569453B1 (en) | 2010-05-14 | 2015-12-16 | Fluidigm Corporation | Nucleic acid isolation methods |
-
2012
- 2012-10-05 JP JP2014534806A patent/JP6073902B2/ja active Active
- 2012-10-05 AU AU2012318371A patent/AU2012318371B2/en active Active
- 2012-10-05 EP EP21182355.4A patent/EP3922731A3/en active Pending
- 2012-10-05 EP EP12777999.9A patent/EP2764459B1/en active Active
- 2012-10-05 CA CA2850781A patent/CA2850781C/en active Active
- 2012-10-05 DK DK12777999.9T patent/DK2764459T3/da active
- 2012-10-05 ES ES12777999T patent/ES2886508T3/es active Active
- 2012-10-05 WO PCT/US2012/059123 patent/WO2013052913A2/en active Application Filing
-
2015
- 2015-02-04 HK HK15101188.3A patent/HK1200934A1/xx unknown
-
2016
- 2016-11-07 JP JP2016216922A patent/JP6227095B2/ja active Active
-
2017
- 2017-03-09 JP JP2017045068A patent/JP2017099419A/ja not_active Withdrawn
-
2022
- 2022-12-13 US US18/080,620 patent/US20230112134A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110177517A1 (en) * | 2010-01-19 | 2011-07-21 | Artemis Health, Inc. | Partition defined detection methods |
Non-Patent Citations (3)
Title |
---|
JPN6016030462; H. Christina Fan ET AL: 'Sensitivity of Noninvasive Prenatal Detection of Fetal Aneuploidy from Maternal Plasma Using Shotgun' PLOS ONE 2010 5(5) e10439 , 20100303, pp.1-7 * |
JPN6016030464; Can Alkan ET AL: 'Personalized copy number and segmental duplication maps using next-generation sequencing' Nature Genetics 41 , 20090830, pp.1061-1067 * |
JPN7016002330; T. CHU ET AL: 'Statistical model for whole genome sequencing and its application to minimally invasive diagnosis of' Bioinformatics (2009) 25 (10) , 20090323, pp.1244-1250 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11560586B2 (en) | 2011-10-06 | 2023-01-24 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US11492659B2 (en) | 2011-10-06 | 2022-11-08 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US11437121B2 (en) | 2011-10-06 | 2022-09-06 | Sequenom, Inc. | Methods and processes for non-invasive detection of a microduplication or a microdeletion with reduced sequence read count error |
US11261494B2 (en) | 2012-06-21 | 2022-03-01 | The Chinese University Of Hong Kong | Method of measuring a fractional concentration of tumor DNA |
JP2015521482A (ja) * | 2012-06-22 | 2015-07-30 | セクエノム, インコーポレイテッド | 遺伝的変異の非侵襲的評価のための方法およびプロセス |
US11168370B2 (en) | 2015-02-10 | 2021-11-09 | The Chinese University Of Hong Kong | Detecting mutations for cancer screening |
JP2021061861A (ja) * | 2015-02-10 | 2021-04-22 | ザ チャイニーズ ユニバーシティ オブ ホンコン | 癌スクリーニング及び胎児分析のための変異検出 |
JP7168247B2 (ja) | 2015-02-10 | 2022-11-09 | ザ チャイニーズ ユニバーシティ オブ ホンコン | 癌スクリーニング及び胎児分析のための変異検出 |
JP2022185149A (ja) * | 2015-02-10 | 2022-12-13 | ザ チャイニーズ ユニバーシティ オブ ホンコン | 癌スクリーニング及び胎児分析のための変異検出 |
JP2018512048A (ja) * | 2015-02-10 | 2018-05-10 | ザ チャイニーズ ユニバーシティ オブ ホンコン | 癌スクリーニング及び胎児分析のための変異検出 |
US11581063B2 (en) | 2015-07-23 | 2023-02-14 | The Chinese University Of Hong Kong | Analysis of fragmentation patterns of cell-free DNA |
US11605445B2 (en) | 2015-07-23 | 2023-03-14 | The Chinese University Of Hong Kong | Analysis of fragmentation patterns of cell-free DNA |
US11615865B2 (en) | 2015-07-23 | 2023-03-28 | The Chinese University Of Hong Kong | Analysis of fragmentation patterns of cell-free DNA |
US11479825B2 (en) | 2017-01-25 | 2022-10-25 | The Chinese University Of Hong Kong | Diagnostic applications using nucleic acid fragments |
US10633713B2 (en) | 2017-01-25 | 2020-04-28 | The Chinese University Of Hong Kong | Diagnostic applications using nucleic acid fragments |
JP2023504139A (ja) * | 2019-11-29 | 2023-02-01 | ジーシー ジェノム コーポレーション | 人工知能ベースの染色体異常検出方法 |
JP7539985B2 (ja) | 2019-11-29 | 2024-08-26 | ジーシー ジェノム コーポレーション | 人工知能ベースの染色体異常検出方法 |
Also Published As
Publication number | Publication date |
---|---|
HK1200934A1 (en) | 2015-08-14 |
JP6227095B2 (ja) | 2017-11-08 |
US20230112134A1 (en) | 2023-04-13 |
ES2886508T3 (es) | 2021-12-20 |
DK2764459T3 (da) | 2021-08-23 |
JP2017073144A (ja) | 2017-04-13 |
EP3922731A3 (en) | 2022-01-05 |
CA2850781A1 (en) | 2013-04-11 |
JP2017099419A (ja) | 2017-06-08 |
EP2764459A2 (en) | 2014-08-13 |
EP3922731A2 (en) | 2021-12-15 |
JP6073902B2 (ja) | 2017-02-01 |
CA2850781C (en) | 2020-09-01 |
WO2013052913A4 (en) | 2013-12-27 |
WO2013052913A2 (en) | 2013-04-11 |
WO2013052913A3 (en) | 2013-11-07 |
EP2764459B1 (en) | 2021-06-30 |
AU2012318371A1 (en) | 2014-04-17 |
AU2012318371B2 (en) | 2018-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6227095B2 (ja) | 遺伝的変異の非侵襲的評価のための方法およびプロセス | |
US11560586B2 (en) | Methods and processes for non-invasive assessment of genetic variations | |
JP6854272B2 (ja) | 遺伝子の変異の非侵襲的な評価のための方法および処理 | |
US11001884B2 (en) | Methods and processes for non-invasive assessment of genetic variations | |
US20200105372A1 (en) | Methods and processes for non-invasive assessment of genetic variations | |
US20200160934A1 (en) | Methods and processes for non-invasive assessment of genetic variations | |
US20200075126A1 (en) | Methods and processes for non-invasive assessment of genetic variations | |
JP6971845B2 (ja) | 遺伝子の変動の非侵襲的評価のための方法および処理 | |
JP6561046B2 (ja) | 遺伝子の変動の非侵襲性評価のための方法および処理 | |
DK2766496T3 (en) | METHODS AND PROCESSES FOR NON-INVASIVE ASSESSMENT OF GENETIC VARIATIONS | |
US8688388B2 (en) | Methods and processes for non-invasive assessment of genetic variations | |
EP2805280A1 (en) | Diagnostic processes that factor experimental conditions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150904 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150904 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6073902 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |