JP2017524374A - 胎児染色体部分異数性およびコピー数変動の検出 - Google Patents
胎児染色体部分異数性およびコピー数変動の検出 Download PDFInfo
- Publication number
- JP2017524374A JP2017524374A JP2017515036A JP2017515036A JP2017524374A JP 2017524374 A JP2017524374 A JP 2017524374A JP 2017515036 A JP2017515036 A JP 2017515036A JP 2017515036 A JP2017515036 A JP 2017515036A JP 2017524374 A JP2017524374 A JP 2017524374A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- coverage
- interest
- sample
- bin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001605 fetal effect Effects 0.000 title claims abstract description 138
- 210000000349 chromosome Anatomy 0.000 title claims description 592
- 208000036878 aneuploidy Diseases 0.000 title claims description 166
- 231100001075 aneuploidy Toxicity 0.000 title claims description 145
- 230000036961 partial effect Effects 0.000 title description 33
- 238000001514 detection method Methods 0.000 title description 27
- 238000000034 method Methods 0.000 claims abstract description 490
- 208000011580 syndromic disease Diseases 0.000 claims abstract description 291
- 238000012549 training Methods 0.000 claims abstract description 257
- 230000002759 chromosomal effect Effects 0.000 claims abstract description 173
- 230000008774 maternal effect Effects 0.000 claims abstract description 133
- 238000012360 testing method Methods 0.000 claims description 429
- 238000012163 sequencing technique Methods 0.000 claims description 291
- 150000007523 nucleic acids Chemical class 0.000 claims description 219
- 108020004414 DNA Proteins 0.000 claims description 207
- 102000039446 nucleic acids Human genes 0.000 claims description 200
- 108020004707 nucleic acids Proteins 0.000 claims description 200
- 210000004027 cell Anatomy 0.000 claims description 92
- 241000282414 Homo sapiens Species 0.000 claims description 54
- 239000000203 mixture Substances 0.000 claims description 52
- 230000002068 genetic effect Effects 0.000 claims description 42
- 230000006870 function Effects 0.000 claims description 38
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 22
- 230000000694 effects Effects 0.000 claims description 18
- 208000010543 22q11.2 deletion syndrome Diseases 0.000 claims description 17
- 208000000398 DiGeorge Syndrome Diseases 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 15
- 208000006254 Wolf-Hirschhorn Syndrome Diseases 0.000 claims description 14
- 208000009575 Angelman syndrome Diseases 0.000 claims description 13
- 206010011385 Cri-du-chat syndrome Diseases 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 201000004723 chromosome 1p36 deletion syndrome Diseases 0.000 claims description 10
- 241000894007 species Species 0.000 claims description 10
- 238000012886 linear function Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 9
- 208000026120 1p36 deletion syndrome Diseases 0.000 claims description 8
- 206010049644 Williams syndrome Diseases 0.000 claims description 8
- 238000007689 inspection Methods 0.000 claims description 5
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 2
- 230000035945 sensitivity Effects 0.000 abstract description 37
- 230000009897 systematic effect Effects 0.000 abstract description 29
- 238000011156 evaluation Methods 0.000 abstract description 10
- 238000007405 data analysis Methods 0.000 abstract description 6
- 239000000523 sample Substances 0.000 description 719
- 102000053602 DNA Human genes 0.000 description 200
- 230000008569 process Effects 0.000 description 140
- 238000004458 analytical method Methods 0.000 description 98
- 238000012217 deletion Methods 0.000 description 73
- 230000037430 deletion Effects 0.000 description 72
- NOIRDLRUNWIUMX-UHFFFAOYSA-N 2-amino-3,7-dihydropurin-6-one;6-amino-1h-pyrimidin-2-one Chemical compound NC=1C=CNC(=O)N=1.O=C1NC(N)=NC2=C1NC=N2 NOIRDLRUNWIUMX-UHFFFAOYSA-N 0.000 description 70
- 239000003550 marker Substances 0.000 description 68
- 238000012937 correction Methods 0.000 description 56
- 239000012634 fragment Substances 0.000 description 52
- 210000002593 Y chromosome Anatomy 0.000 description 46
- 238000012545 processing Methods 0.000 description 45
- 238000009826 distribution Methods 0.000 description 43
- 210000002381 plasma Anatomy 0.000 description 40
- 108090000623 proteins and genes Proteins 0.000 description 38
- 208000037280 Trisomy Diseases 0.000 description 37
- 210000003754 fetus Anatomy 0.000 description 37
- 239000002773 nucleotide Substances 0.000 description 35
- 125000003729 nucleotide group Chemical group 0.000 description 34
- 210000004369 blood Anatomy 0.000 description 32
- 239000008280 blood Substances 0.000 description 32
- 201000010374 Down Syndrome Diseases 0.000 description 29
- 230000003321 amplification Effects 0.000 description 29
- 238000003199 nucleic acid amplification method Methods 0.000 description 29
- 230000000875 corresponding effect Effects 0.000 description 27
- 230000001976 improved effect Effects 0.000 description 27
- 238000010606 normalization Methods 0.000 description 26
- 102000040430 polynucleotide Human genes 0.000 description 26
- 108091033319 polynucleotide Proteins 0.000 description 26
- 239000002157 polynucleotide Substances 0.000 description 26
- 238000012369 In process control Methods 0.000 description 25
- 239000012472 biological sample Substances 0.000 description 25
- 210000004544 dc2 Anatomy 0.000 description 25
- 238000004190 ion pair chromatography Methods 0.000 description 25
- 206010044688 Trisomy 21 Diseases 0.000 description 24
- 238000002360 preparation method Methods 0.000 description 23
- 239000013615 primer Substances 0.000 description 23
- 238000005516 engineering process Methods 0.000 description 22
- 238000013507 mapping Methods 0.000 description 22
- 230000000873 masking effect Effects 0.000 description 22
- 238000007481 next generation sequencing Methods 0.000 description 21
- 239000000047 product Substances 0.000 description 21
- 230000003322 aneuploid effect Effects 0.000 description 20
- 239000011324 bead Substances 0.000 description 20
- 238000003745 diagnosis Methods 0.000 description 20
- 208000031639 Chromosome Deletion Diseases 0.000 description 19
- 206010028980 Neoplasm Diseases 0.000 description 19
- 238000004422 calculation algorithm Methods 0.000 description 18
- 201000011510 cancer Diseases 0.000 description 18
- 239000003153 chemical reaction reagent Substances 0.000 description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 18
- 208000034790 Twin pregnancy Diseases 0.000 description 16
- 230000002559 cytogenic effect Effects 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 14
- 210000002966 serum Anatomy 0.000 description 14
- 238000013459 approach Methods 0.000 description 13
- 239000013060 biological fluid Substances 0.000 description 13
- 238000001914 filtration Methods 0.000 description 13
- 238000005259 measurement Methods 0.000 description 13
- 238000003793 prenatal diagnosis Methods 0.000 description 13
- 238000000746 purification Methods 0.000 description 13
- 210000001519 tissue Anatomy 0.000 description 13
- 208000026928 Turner syndrome Diseases 0.000 description 12
- 238000003556 assay Methods 0.000 description 12
- 201000010099 disease Diseases 0.000 description 12
- 238000013467 fragmentation Methods 0.000 description 12
- 238000006062 fragmentation reaction Methods 0.000 description 12
- 229920002477 rna polymer Polymers 0.000 description 12
- 201000006360 Edwards syndrome Diseases 0.000 description 11
- 208000007159 Trisomy 18 Syndrome Diseases 0.000 description 11
- 210000001766 X chromosome Anatomy 0.000 description 11
- 230000005856 abnormality Effects 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 11
- 239000012530 fluid Substances 0.000 description 11
- 230000000670 limiting effect Effects 0.000 description 11
- 208000030454 monosomy Diseases 0.000 description 11
- 230000035935 pregnancy Effects 0.000 description 11
- 206010053884 trisomy 18 Diseases 0.000 description 11
- 241000282326 Felis catus Species 0.000 description 10
- 206010036790 Productive cough Diseases 0.000 description 10
- 238000001574 biopsy Methods 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 150000002500 ions Chemical class 0.000 description 10
- 238000013439 planning Methods 0.000 description 10
- 238000012552 review Methods 0.000 description 10
- 210000003802 sputum Anatomy 0.000 description 10
- 208000024794 sputum Diseases 0.000 description 10
- 238000001712 DNA sequencing Methods 0.000 description 9
- 208000026350 Inborn Genetic disease Diseases 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 9
- 108091092356 cellular DNA Proteins 0.000 description 9
- 208000016361 genetic disease Diseases 0.000 description 9
- 230000001965 increasing effect Effects 0.000 description 9
- -1 nucleotide pentose Chemical class 0.000 description 9
- 210000005259 peripheral blood Anatomy 0.000 description 9
- 239000011886 peripheral blood Substances 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 210000002700 urine Anatomy 0.000 description 9
- 241000282412 Homo Species 0.000 description 8
- 208000016679 Monosomy X Diseases 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 201000009928 Patau syndrome Diseases 0.000 description 8
- 206010044686 Trisomy 13 Diseases 0.000 description 8
- 208000006284 Trisomy 13 Syndrome Diseases 0.000 description 8
- 230000008901 benefit Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000005119 centrifugation Methods 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 102000004594 DNA Polymerase I Human genes 0.000 description 7
- 108010017826 DNA Polymerase I Proteins 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 239000002299 complementary DNA Substances 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 7
- 230000001815 facial effect Effects 0.000 description 7
- 230000036541 health Effects 0.000 description 7
- 210000003917 human chromosome Anatomy 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- 208000031404 Chromosome Aberrations Diseases 0.000 description 6
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 6
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 108091093037 Peptide nucleic acid Proteins 0.000 description 6
- 238000004113 cell culture Methods 0.000 description 6
- 208000028831 congenital heart disease Diseases 0.000 description 6
- 230000002596 correlated effect Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 6
- 230000007547 defect Effects 0.000 description 6
- 238000009795 derivation Methods 0.000 description 6
- 238000010790 dilution Methods 0.000 description 6
- 239000012895 dilution Substances 0.000 description 6
- 208000035475 disorder Diseases 0.000 description 6
- 238000001962 electrophoresis Methods 0.000 description 6
- 238000010348 incorporation Methods 0.000 description 6
- 239000013610 patient sample Substances 0.000 description 6
- 210000003765 sex chromosome Anatomy 0.000 description 6
- 230000005945 translocation Effects 0.000 description 6
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 239000011248 coating agent Substances 0.000 description 5
- 238000000576 coating method Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 238000009223 counseling Methods 0.000 description 5
- 239000000975 dye Substances 0.000 description 5
- 230000007717 exclusion Effects 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 239000013641 positive control Substances 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 210000003296 saliva Anatomy 0.000 description 5
- 210000004243 sweat Anatomy 0.000 description 5
- 210000001138 tear Anatomy 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- 208000035075 17p11.2 microduplication syndrome Diseases 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 4
- 208000036626 Mental retardation Diseases 0.000 description 4
- 208000004780 Potocki-Lupski syndrome Diseases 0.000 description 4
- 201000010769 Prader-Willi syndrome Diseases 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 239000007850 fluorescent dye Substances 0.000 description 4
- 238000007672 fourth generation sequencing Methods 0.000 description 4
- 235000020256 human milk Nutrition 0.000 description 4
- 210000004251 human milk Anatomy 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000003902 lesion Effects 0.000 description 4
- 210000003205 muscle Anatomy 0.000 description 4
- 238000002203 pretreatment Methods 0.000 description 4
- 238000003908 quality control method Methods 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 208000026817 47,XYY syndrome Diseases 0.000 description 3
- 206010003445 Ascites Diseases 0.000 description 3
- 108010077544 Chromatin Proteins 0.000 description 3
- 208000002330 Congenital Heart Defects Diseases 0.000 description 3
- 206010012559 Developmental delay Diseases 0.000 description 3
- 201000006347 Intellectual Disability Diseases 0.000 description 3
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 3
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 3
- 201000001388 Smith-Magenis syndrome Diseases 0.000 description 3
- 206010053871 Trisomy 8 Diseases 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 210000001124 body fluid Anatomy 0.000 description 3
- 239000010839 body fluid Substances 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 210000003483 chromatin Anatomy 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000002405 diagnostic procedure Methods 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 210000001061 forehead Anatomy 0.000 description 3
- 238000012224 gene deletion Methods 0.000 description 3
- 238000013412 genome amplification Methods 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 230000036244 malformation Effects 0.000 description 3
- 230000003278 mimic effect Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 150000004713 phosphodiesters Chemical group 0.000 description 3
- 239000002987 primer (paints) Substances 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 208000000995 spontaneous abortion Diseases 0.000 description 3
- 208000002254 stillbirth Diseases 0.000 description 3
- 231100000537 stillbirth Toxicity 0.000 description 3
- 208000034298 trisomy chromosome 8 Diseases 0.000 description 3
- 238000012176 true single molecule sequencing Methods 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- 206010003805 Autism Diseases 0.000 description 2
- 208000020706 Autistic disease Diseases 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 208000011359 Chromosome disease Diseases 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 208000032170 Congenital Abnormalities Diseases 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 206010011469 Crying Diseases 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 206010021118 Hypotonia Diseases 0.000 description 2
- 208000004706 Jacobsen Distal 11q Deletion Syndrome Diseases 0.000 description 2
- 208000030979 Language Development disease Diseases 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 208000010961 Monosomy 21 Diseases 0.000 description 2
- 208000019209 Monosomy 22 Diseases 0.000 description 2
- 208000034702 Multiple pregnancies Diseases 0.000 description 2
- 208000007379 Muscle Hypotonia Diseases 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 2
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 101000757182 Saccharomyces cerevisiae Glucoamylase S2 Proteins 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 206010071547 Trisomy 9 Diseases 0.000 description 2
- 238000002669 amniocentesis Methods 0.000 description 2
- 210000004381 amniotic fluid Anatomy 0.000 description 2
- 230000036528 appetite Effects 0.000 description 2
- 235000019789 appetite Nutrition 0.000 description 2
- 238000004630 atomic force microscopy Methods 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 230000000747 cardiac effect Effects 0.000 description 2
- 210000002230 centromere Anatomy 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 210000004252 chorionic villi Anatomy 0.000 description 2
- 208000024971 chromosomal disease Diseases 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 238000004980 dosimetry Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 210000004709 eyebrow Anatomy 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 238000010448 genetic screening Methods 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000008821 health effect Effects 0.000 description 2
- 208000019622 heart disease Diseases 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 238000007901 in situ hybridization Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 210000002011 intestinal secretion Anatomy 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 231100000533 low birth weight Toxicity 0.000 description 2
- 208000018773 low birth weight Diseases 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000002663 nebulization Methods 0.000 description 2
- 238000013188 needle biopsy Methods 0.000 description 2
- 230000005257 nucleotidylation Effects 0.000 description 2
- 201000003738 orofaciodigital syndrome VIII Diseases 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 238000009598 prenatal testing Methods 0.000 description 2
- 235000018102 proteins Nutrition 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 230000001850 reproductive effect Effects 0.000 description 2
- 230000000241 respiratory effect Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 201000000980 schizophrenia Diseases 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000007841 sequencing by ligation Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000008093 supporting effect Effects 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 108091035539 telomere Proteins 0.000 description 2
- 102000055501 telomere Human genes 0.000 description 2
- 210000003411 telomere Anatomy 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000004627 transmission electron microscopy Methods 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 206010044689 trisomy 22 Diseases 0.000 description 2
- 208000026485 trisomy X Diseases 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- AZUYLZMQTIKGSC-UHFFFAOYSA-N 1-[6-[4-(5-chloro-6-methyl-1H-indazol-4-yl)-5-methyl-3-(1-methylindazol-5-yl)pyrazol-1-yl]-2-azaspiro[3.3]heptan-2-yl]prop-2-en-1-one Chemical compound ClC=1C(=C2C=NNC2=CC=1C)C=1C(=NN(C=1C)C1CC2(CN(C2)C(C=C)=O)C1)C=1C=C2C=NN(C2=CC=1)C AZUYLZMQTIKGSC-UHFFFAOYSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical compound NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 208000017976 8p23.1 duplication syndrome Diseases 0.000 description 1
- 206010000234 Abortion spontaneous Diseases 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 208000006096 Attention Deficit Disorder with Hyperactivity Diseases 0.000 description 1
- 208000036864 Attention deficit/hyperactivity disease Diseases 0.000 description 1
- 208000025637 Autosomal monosomy Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 208000002177 Cataract Diseases 0.000 description 1
- 208000010693 Charcot-Marie-Tooth Disease Diseases 0.000 description 1
- 206010061764 Chromosomal deletion Diseases 0.000 description 1
- 206010009269 Cleft palate Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 208000029767 Congenital, Hereditary, and Neonatal Diseases and Abnormalities Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 206010010904 Convulsion Diseases 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 208000035976 Developmental Disabilities Diseases 0.000 description 1
- 208000012239 Developmental disease Diseases 0.000 description 1
- 206010066054 Dysmorphism Diseases 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 101710181043 Endonuclease 2 Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 244000153665 Ficus glomerata Species 0.000 description 1
- 235000012571 Ficus glomerata Nutrition 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 238000006424 Flood reaction Methods 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 208000034951 Genetic Translocation Diseases 0.000 description 1
- 206010053759 Growth retardation Diseases 0.000 description 1
- 241000691979 Halcyon Species 0.000 description 1
- 208000036818 High risk pregnancy Diseases 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 208000029279 Jacobsen Syndrome Diseases 0.000 description 1
- 206010023230 Joint stiffness Diseases 0.000 description 1
- 208000017924 Klinefelter Syndrome Diseases 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 208000035752 Live birth Diseases 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 206010027543 Micrognathia Diseases 0.000 description 1
- 208000002598 Micrognathism Diseases 0.000 description 1
- 208000037699 Monosomy 18p Diseases 0.000 description 1
- 208000010610 Mosaic trisomy 8 Diseases 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 101150038744 PMP22 gene Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 208000002151 Pleural effusion Diseases 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 208000035415 Reinfection Diseases 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101000804877 Schizosaccharomyces pombe (strain 972 / ATCC 24843) 5'-3' exoribonuclease 1 Proteins 0.000 description 1
- 208000033712 Self injurious behaviour Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 208000036623 Severe mental retardation Diseases 0.000 description 1
- 208000020221 Short stature Diseases 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 101100388071 Thermococcus sp. (strain GE8) pol gene Proteins 0.000 description 1
- 206010062757 Trisomy 15 Diseases 0.000 description 1
- 208000021843 Trisomy 9p Diseases 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 201000001305 Williams-Beuren syndrome Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 206010056894 XYY syndrome Diseases 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- IRLPACMLTUPBCL-FCIPNVEPSA-N adenosine-5'-phosphosulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@@H](CO[P@](O)(=O)OS(O)(=O)=O)[C@H](O)[C@H]1O IRLPACMLTUPBCL-FCIPNVEPSA-N 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 208000029560 autism spectrum disease Diseases 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000003851 biochemical process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000007698 birth defect Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 150000003857 carboxamides Chemical class 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 208000015241 chromosome 13q trisomy Diseases 0.000 description 1
- 208000004664 chromosome 18p deletion syndrome Diseases 0.000 description 1
- 108091092240 circulating cell-free DNA Proteins 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 206010009259 cleft lip Diseases 0.000 description 1
- 208000035850 clinical syndrome Diseases 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 208000022734 developmental defect during embryogenesis Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 231100001129 embryonic lethality Toxicity 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N ethylene glycol Natural products OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 206010016165 failure to thrive Diseases 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 239000010408 film Substances 0.000 description 1
- LIYGYAHYXQDGEP-UHFFFAOYSA-N firefly oxyluciferin Natural products Oc1csc(n1)-c1nc2ccc(O)cc2s1 LIYGYAHYXQDGEP-UHFFFAOYSA-N 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 231100000001 growth retardation Toxicity 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 230000010370 hearing loss Effects 0.000 description 1
- 231100000888 hearing loss Toxicity 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 208000031169 hemorrhagic disease Diseases 0.000 description 1
- 238000007417 hierarchical cluster analysis Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 208000000509 infertility Diseases 0.000 description 1
- 231100000535 infertility Toxicity 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003426 interchromosomal effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 201000003723 learning disability Diseases 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000008376 long-term health Effects 0.000 description 1
- 235000019689 luncheon sausage Nutrition 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 210000004880 lymph fluid Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 208000004141 microcephaly Diseases 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 208000015994 miscarriage Diseases 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000003188 neurobehavioral effect Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000002232 neuromuscular Effects 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000027758 ovulation cycle Effects 0.000 description 1
- JJVOROULKOMTKG-UHFFFAOYSA-N oxidized Photinus luciferin Chemical compound S1C2=CC(O)=CC=C2N=C1C1=NC(=O)CS1 JJVOROULKOMTKG-UHFFFAOYSA-N 0.000 description 1
- 210000003254 palate Anatomy 0.000 description 1
- 230000001314 paroxysmal effect Effects 0.000 description 1
- 208000014689 partial deletion of chromosome 10 Diseases 0.000 description 1
- 208000014813 partial deletion of chromosome 18 Diseases 0.000 description 1
- 208000014690 partial deletion of chromosome 5 Diseases 0.000 description 1
- 208000034352 partial segmental duplication Diseases 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 208000036897 pentasomy Diseases 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 208000024335 physical disease Diseases 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 230000009596 postnatal growth Effects 0.000 description 1
- 238000009609 prenatal screening Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 230000031893 sensory processing Effects 0.000 description 1
- 238000011270 sentinel node biopsy Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 231100001055 skeletal defect Toxicity 0.000 description 1
- 210000003625 skull Anatomy 0.000 description 1
- 201000002859 sleep apnea Diseases 0.000 description 1
- 208000019116 sleep disease Diseases 0.000 description 1
- 108010062513 snake venom phosphodiesterase I Proteins 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010972 statistical evaluation Methods 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 208000011908 tetrasomy Diseases 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical group [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 206010043554 thrombocytopenia Diseases 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 208000015344 trisomy 17p Diseases 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 210000001215 vagina Anatomy 0.000 description 1
- 201000000866 velocardiofacial syndrome Diseases 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 239000002569 water oil cream Substances 0.000 description 1
- 230000036266 weeks of gestation Effects 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/16—Assays for determining copy number or wherein the copy number is of special importance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/165—Mathematical modelling, e.g. logarithm, ratio
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
Abstract
Description
本出願は、米国特許法第119条(e)の下で、DETECTING FETAL SUB-CHROMOSOMAL ANEUPLOIDIESと題され、2014年3月30日に提出された米国仮特許出願第62/005,877号に対する恩典を主張するものであり、それはすべての目的のために参照によりその全体として本明細書に組み入れられる。
ヒト医学研究における重大な試みの1つは、有害な健康上の影響をもたらす遺伝子異常の発見である。多くの場合、特異的な遺伝子および/または重大な診断マーカーが、異常なコピー数で存在している、ゲノムの一部分において同定されている。例えば、出生前診断において、染色体全体の余分なまたは欠損したコピーは、高頻度で起こる遺伝学的病変である。癌において、染色体全体または染色体セグメントのコピーの欠失または増倍、およびゲノムの特異的領域のより高レベルな増幅はよく見られることである。
さまざまな態様において、任意の胎児異数性のコピー数変動(CNV)、および多様な医学的状態と関連することが知られるまたは疑われるCNVを判定するための方法が提供される。該方法は、ゲノム配列のGCのゆらぎなど、関心対象のCNVに無関係のサンプル間での系統分散に関係したノイズおよび誤差を低下させるためのメカニズムを含む。本方法に従って判定され得るCNVには、第1〜22、X、およびY染色体のうちのいずれか1種または複数種のトリソミーおよびモノソミー、他の染色体ポリソミー、ならびに該染色体のうちのいずれか1つまたは複数のセグメントの欠失および/または重複が含まれる。
本明細書において言及される、これらの参考文献内に開示されるすべての配列を含む、すべての特許、特許出願、および他の刊行物は、あたかもそれぞれ個々の刊行物、特許、または特許出願が、参照により組み入れられることを具体的かつ個々に示されているのと同程度に、参照により本明細書に明示的に組み入れられる。関連部分において引用されるすべての文書は、本明細書におけるそれらの引用の文脈によって示される目的のために、参照によりそれらの全体として本明細書に組み入れられる。しかしながら、いかなる文書の引用も、それが本開示に対する先行技術であるという承認として解釈されるべきではない。
開示される態様は、胎児および母体の細胞フリー核酸を含む検査サンプルにおける、Y染色体のコピー数の評価のための方法、機器、およびシステムに関する。いくつかの態様において、関心対象の配列には、遺伝的状態または疾患状態と関連することが知られるまたは疑われる、例えばキロベース(kb)〜メガベース(Mb)から染色体全体に及ぶゲノムセグメント配列が含まれる。いくつかの態様において、Y染色体のコピー数を用いて、胎児の性別を判定する。いくつかの態様において、本方法に従って判定され得るCNVには、Y性染色体のモノソミーおよびトリソミー(例えば、47,XXYおよび47,XYY)、テトラソミーおよびペンタソミーなど、性染色体の他のポリソミー(例えば、XXXXYおよびXYYYY)、ならびに性染色体のうちのいずれか1つまたは複数のセグメントの欠失および/または重複が含まれる。関心対象の配列の他の例には、周知の異数性、例えばトリソミーXXX、トリソミー21と関連した染色体、および癌などの疾患において増倍している染色体のセグメント、例えば急性骨髄性白血病における部分的トリソミー8が含まれる。
本明細書において使用するとき、「a」、「an」、および「the」という単数形の用語は、文脈上はっきりと別様に示されない限り、複数形の指示対象(reference)を含む。
式中、
および
は、適格サンプルのセットにおける第j染色体量に対する、それぞれ、推定される平均および標準偏差であり、かつxijは、検査サンプルiに対する観察される第j染色体の割合(量)である、
として算出され得る。
式中、Mjは、同じフローセル上に配列された多重化サンプルのセットにおける第j染色体量に対する推定中央値であり;
は、1つまたは複数のフローセル上に配列された多重化サンプルの1つまたは複数のセットにおける第j染色体量に対する標準偏差であり;かつxiは、検査サンプルiに対する観察される第j染色体量である、
として、検査サンプルにおける関心対象の染色体の染色体量を、同じフローセル上に配列された多重化サンプルにおける対応する染色体量の中央値に関連付けすることによって、「オンザフライで(on the fly)」算出され得る。この態様において、検査サンプルiは、それからMjが決定される、同じフローセル上に配列された多重化サンプルの1つである。
様々な非侵襲的出生前診断(NIPD)法は、末梢血などの母体体液中において入手可能である胎児起源のcfDNAを利用する。多くのNIPD法は、母体末梢血からcfDNAを抽出し、シーケンシングし、かつアラインメントして、妊娠した母親の胎児由来のcfDNAが、疾患または表現型に関係する遺伝子配列においてコピー数変動を持するかどうかを判定する。抽出されかつシーケンシングされたcfDNAは、配列読み取りを提供し、それは次いで参照ゲノムにマッピングされる。参照ゲノム上の一意的な箇所または部位にマッピングされる配列読み取りを配列タグと呼ぶ。関心対象の配列にマッピングされた配列タグの数を用いて、関心対象の配列のコピー数またはコピー数変動を決定し得る。
CNVについての判定のための方法
本明細書において開示される方法によって提供される配列被覆率値を用いると、従来的方法によって獲得される配列被覆率値を用いるのと比べて、向上した感度、選択性、および/または効率で、配列、染色体、または染色体セグメントのコピー数およびCNVに関係した様々な遺伝的状態を判定することができる。例えば、いくつかの態様において、マスキングされた参照配列は、胎児および母体の核酸分子を含む母体検査サンプルにおける、任意の2種またはそれを上回る種類の異なる完全胎児染色体異数性の有無を判定するために用いられる。下記で提供される例示的な方法は、読み取りを参照配列(参照ゲノムを含む)にアラインメントする。アラインメントは、マスキングされていないまたはマスキングされた参照配列に対して実施され得、それによって、参照配列にマッピングされた配列タグがもたらされる。いくつかの態様において、参照配列のマスキングされていないセグメントに収まる配列タグのみを、コピー数変動を判定する考慮に入れる。
式中、
および
は、適格サンプルのセットにおける第j染色体量に対する、それぞれ、推定される平均および標準偏差であり、かつxijは、検査サンプルiに対する観察される第j染色体量である、
として、染色体量を適格サンプルのセットにおける対応する染色体量の平均に関連付けする。
式中、Mjは、同じフローセル上に配列された多重化サンプルのセットにおける第j染色体量に対する推定中央値であり;
は、1つまたは複数のフローセル上に配列された多重化サンプルの1つまたは複数のセットにおける第j染色体量に対する標準偏差であり;かつxiは、検査サンプルiに対する観察される第j染色体量である、
として、検査サンプルにおける関心対象の染色体の染色体量を、同じフローセル上に配列された多重化サンプルにおける対応する染色体量の中央値に関連付けすることによって、「即座に」算出され得る。この態様において、検査サンプルiは、それからMjが決定される、同じフローセル上に配列された多重化サンプルの1つである。
いくつかの態様において、関心対象の1種または複数種の染色体またはセグメントについての染色体量またはセグメント量を、図1に示される工程146に記載されるように、すべての適格サンプルにおいて決定し、かつ正規化染色体またはセグメントの配列を工程145で同定する。一部の正規化配列は、配列量が算出される前に提供されることに留意されたい。次いで、1種または複数種の正規化配列を、下記でさらに記載される様々な基準に従って同定する(工程145を参照されたい)。いくつかの態様において、例えば、同定された正規化配列は、すべての適格サンプルにわたって、関心対象の配列にについての配列量の最小の変動性をもたらす。
工程145において、正規化配列を、関心対象の配列について同定する。いくつかの態様において、例えば正規化配列は、例えばすべての適格トレーニングサンプルにわたって関心対象の配列についての配列量の最小の変動性をもたらす、算出された配列量に基づく配列である。方法は、同様の特徴を本質的に有しかつサンプル間およびシーケンシングラン間で同様の変動の傾向があり、かつ検査サンプルにおける配列量を決定するのに有用である配列を同定する。
適格サンプルにおける正規化配列の同定に基づき、関心対象の1種または複数種の配列の点で異なるゲノムに由来する核酸の混合物を含む検査サンプルにおいて、関心対象の配列について、配列量を決定する。
のように、関連する胎児画分とともに、
(式中、
および
は、適格サンプルのセットにおける第j染色体量に対する、それぞれ、推定される平均および標準偏差であり、かつxijは、検査サンプルiに対する観察される第j染色体量である)
に従って、NCVを用いる。
配列被覆率を決定するための一般的な過程
開示されるいくつかの態様は、低いノイズおよび高いシグナルを有する配列被覆分量を決定する方法を提供し、従来的方法によって獲得される配列被覆分量と比べて向上した感度、選択性、および/または効率で、コピー数およびCNVに関係した様々な遺伝的状態を判定するデータを提供する。ある特定の態様において、検査サンプル由来の配列を処理して、配列被覆分量を獲得する。
図3Aは、検査サンプルからの配列データにおけるノイズを低下させるための、過程301の例を提示している。図3B〜3Jは、該過程の様々な段階におけるデータ解析を提示している。図3Aに示されるように、描かれる過程は、1つまたは複数のサンプルからのcfDNAの抽出で始まる。ブロック303を参照されたい。適切な抽出過程および機器は、本明細書における他の箇所で記載されている。いくつかの態様において、2013年3月15日に提出された米国特許出願第61/801,126号(参照によりその全体として本明細書に組み入れられる)に記載される過程は、cfDNAを抽出する。いくつかの実践において、機器は、複数のサンプル由来のcfDNAを一緒に加工して、多重化ライブラリーおよび配列データを提供する。図3Aにおけるブロック305および307を参照されたい。いくつかの態様において、機器は、8個またはそれを上回る数の検査サンプル由来のcfDNAを並列して加工する。本明細書における他の箇所で記載されるように、シーケンシングシステムは、抽出されたcfDNAを加工して、コード化された(例えば、バーコード化された)cfDNAフラグメントのライブラリーを生成し得る。シーケンサーは、cfDNAのライブラリーをシーケンシングして、非常に多くの数の配列読み取りを生成する。サンプルコード化により、多重化サンプルにおける読み取りの多重分離が可能となる。8個またはそれを上回る数のサンプルのそれぞれは、数十万個または数百万個の読み取りを有し得る。過程は、図3Aにおける付加的作業の前に、読み取りをフィルタリングし得る。いくつかの態様において、読み取りのフィルタリングとは、誤った読み取りおよび低精度の読み取りをフィルター除去するために、シーケンサーにおいて実践されるソフトウェアプログラムによって可能となる精度フィルタリング過程である。例えば、Illumina製のSequencing Control Software(SCS)およびConsensus Assessment of Sequence and Variationソフトウェアプログラムは、シーケンシング反応によって作成された生の画像データを、強度スコア、塩基コール、精度スコア化されたアラインメント、および付加的形式に変えることによって、誤った読み取りおよび低精度の読み取りをフィルター除去して、下流の解析のための生物学的に関連する情報を提供する。
予測被覆率分量=サンプルの正規化されたビン被覆率/(傾き*包括的プロファイル+切片)−1
に従って算出される対応する予測で割ることによって実践され得る。
本明細書において開示されるいくつかの態様は、配列マスクを用いた、関心対象の配列上の非判別配列読み取りをフィルター除去する(またはマスキングする)ためのストラテジーを採用し、それは、CNV評価に用いられる被覆率値において、従来的方法によって算出される値と比べてより高いシグナルおよびより低いノイズにつながる。そのようなマスクは、様々な技法によって同定され得る。一態様において、マスクは、下記でさらに詳細に説明される図4A〜4Bに例証される技法を用いて同定される。
上記で記載される技法は、一般にCNVを検出するための被覆率を決定するために適用可能である。関心対象のより短い配列を伴ういくつかの態様において、CNV検出のためのシグナルはより低く、それは、症候群特異的バイアスを除去する付加的な処理を要する。下記で記載される過程を用いて、ゲノムの1つまたは複数の症候群特異的領域におけるビンに対して補正を判定し得る。図3Aの作業317において適用される包括的プロファイル補正と同様に、サンプルの加工、シーケンシング、および/またはゲノム構造からの体系的バイアスを除去するまたは低下させるために補正が必要とされるが、この場合、それは、ゲノムの症候群領域に導入されたバイアスに焦点を合わせる。補正は、検査サンプルに対して決定されたビン被覆率を補正するために用いられる値の1つまたは複数の「ウェーブ」の形態をとる。ウェーブは、影響なしのサンプルのクラスターから獲得された被覆率値から決定され得る。
予測ビン被覆率値=直線の傾き×(サンプルビン被覆率値)×直線の切片
などの表現を用い、サンプル被覆率値から予測被覆率値を獲得する。
本明細書において開示される過程は、染色体全体および染色体部分領域のCNVを判定するのに適している。上記で記載されるように、比較的短い染色体部分領域が遺伝的症候群に関係している場合、CNVとは無関係の症候群特異的プロファイルを除去して、検出感度を向上させ得る。
サンプル
CNV、例えば染色体異数性、部分的異数性などを判定するために用いられるサンプルには、関心対象の1種または複数種の配列に対するコピー数変動が判定される対象となる、任意の細胞、組織、または臓器から採取されたサンプルが含まれ得る。望ましくは、サンプルは、細胞内に存在している核酸、および/または「細胞フリー」である核酸(例えば、cfDNA)を含有する。
一態様において、本明細書において記載される方法は、単一シーケンシングランで、多数のサンプルが、ゲノム分子として個々に(すなわち、シングルプレックスシーケンシング)、または指標付きゲノム分子を含むプールされたサンプル(例えば、マルチプレックスシーケンシング)としてシーケンシングされるのを可能にする次世代シーケンシング技術(NGS)を利用し得る。これらの方法は、DNA配列の最高数億個の読み取りを生成し得る。様々な態様において、ゲノム核酸および/または指標付きゲノム核酸の配列は、例えば本明細書において記載される次世代シーケンシング技術(NGS)を用いて決定され得る。様々な態様において、NGSを用いて獲得された大量の配列データについての解析は、本明細書において記載されるように、1つまたは複数のプロセッサーを用いて実施され得る。
様々な態様において、サンプルの完全性の立証およびサンプル追跡は、サンプルゲノム核酸、例えばcfDNAおよび、例えば加工前に、サンプル中に導入されている付随するマーカー核酸の混合物をシーケンシングすることによって達成され得る。
様々な態様において、例えば上記で記載されるように、サンプル中に導入されるマーカー配列は、シーケンシング、ならびに後続の加工および解析の精度および有効性を立証する陽性対照として機能し得る。
上記で示されるように、調製されたサンプル(例えば、シーケンシングライブラリー)を、コピー数変動を同定するための手順の一部としてシーケンシングする。いくつかのシーケンシング技術のいずれかを利用することができる。
母体血中を循環している細胞フリーの胎児DNAおよびRNAを、妊娠管理のためにおよび生殖意思決定を支援するための両方に対して、増加する数の遺伝的状態についての早期の非侵襲的出生前診断(NIPD)に用いることができる。血流中を循環している細胞フリーDNAの存在は、50年間以上にわたって知られてきた。より近年には、少量の循環胎児DNAの存在が、妊娠中の母体血流中で発見された(Lo et al., Lancet 350:485-487 [1997])。死にゆく胎盤細胞に起因すると考えられ、細胞フリー胎児DNA(cfDNA)は、妊娠4週には早くも見分けられ得る(Illanes et al., Early Human Dev 83:563-566 [2007])典型的に長さが200bpよりも少ない短いフラグメントからなることが示されており(Chan et al., Clin Chem 50:88-92 [2004])、かつ分娩の数時間以内に母体循環から一掃されることが知られている(Lo et al., Am J Hum Genet 64:218-224 [1999])。cfDNAに加えて、胎児または胎盤において転写される遺伝子に起因する、細胞フリー胎児RNA(cfRNA)のフラグメントも母体血流中で見分けることができる。母体血液サンプル由来のこれらの胎児遺伝子要素の抽出および後続の解析は、NIPDに新規な機会を与える。
シーケンシングデータの解析およびそこから導き出される診断は、典型的に、様々なコンピューター実行アルゴリズムおよびプログラムを用いて実施される。したがって、ある特定の態様は、1つもしくは複数のコンピューターシステムまたは他の処理システムに保存されたまたはそこから移されたデータを伴う過程を採用する。本明細書において開示される態様は、これらの作業を実施するための機器にも関する。この機器は、必要とされる目的のために特別に構築され得、またはそれは、コンピュータープログラムおよび/もしくはコンピューターに保存されたデータ構造によって選択的に活性化されたもしくは再構成された汎用コンピューター(もしくはコンピューターの群)であり得る。いくつかの態様において、プロセッサーの群は、列挙された解析作業のいくつかまたはすべてを協調的に(例えば、ネットワークまたはクラウドコンピューティングを介して)かつ/または並列に実施する。本明細書において記載される方法を実施するためのプロセッサーまたはプロセッサーの群は、プログラマブル装置(例えば、CPLDおよびFPGA)、およびゲートアレイASICなどの非プログラマブル装置、または汎用マイクロプロセッサーなど、マイクロコントローラーおよびマイクロプロセッサーを含めた様々なタイプのものであり得る。
検査サンプルにおける核酸をシーケンシングすることによって得られた読み取り
読み取りを、参照ゲノムまたは他の1種または複数種の参照配列にアラインメントすることによって得られたタグ
参照ゲノムまたは参照配列
配列タグ密度−参照ゲノムまたは他の参照配列の2つまたはそれを上回る数の領域(典型的には、染色体または染色体セグメント)のそれぞれに対するタグの計数または数
関心対象の特定の染色体または染色体セグメントに対する正規化染色体または正規化染色体セグメントの素性
関心対象の染色体またはセグメント、および対応する正規化染色体または正規化セグメントから得られた、染色体または染色体セグメント(または他の領域)に対する量
影響あり、影響なし、またはコールなしのいずれかとして、染色体量をコールするための閾値
染色体量の実際のコール
診断(コールと関連した臨床的病状)
コールおよび/または診断から導き出されたさらなる検査の勧告
コールおよび/または診断から導き出された治療および/またはモニタリング計画
サンプル収集
シーケンシング前のサンプル加工
シーケンシング
配列データの解析および異数性コールの導出
診断
患者または健常なケア提供者への診断および/またはコールの報告
さらなる治療、検査、および/またはモニタリングの計画の立案
計画の実行
カウンセリング
(a)サンプルにおける胎児および母体の核酸についての配列情報を獲得するためのコード;
(b)該配列情報を用いて、第1〜22、X、およびY染色体より選択される関心対象のいずれか1種または複数種の染色体のそれぞれに対する、胎児および母体の核酸からの配列タグの数をコンピューターにより同定し、かつ関心対象のいずれか1種または複数種の染色体のそれぞれに対する少なくとも1種の正規化染色体配列または正規化染色体セグメント配列に対する配列タグの数を同定するためのコード;
(c)関心対象のいずれか1種または複数種の染色体のそれぞれに対して同定された配列タグの数、および各正規化染色体配列または正規化染色体セグメント配列に対して同定された配列タグの数を用いて、関心対象のいずれか1種または複数種の染色体のそれぞれに対する単一染色体量を算出するためのコード;ならびに
(d)関心対象のいずれか1種または複数種の染色体のそれぞれに対する単一染色体量のそれぞれと、関心対象のいずれか1種または複数種の染色体のそれぞれに対する対応する閾値の値とを比較し、それによって、サンプルにおけるいずれか1種または複数種の異なる完全胎児染色体異数性の有無を判定するためのコード
を含む。
(a)サンプルにおける胎児および母体の核酸についての配列情報を獲得するためのコード;
(b)該配列情報を用いて、第1〜22、X、およびY染色体より選択される関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数のセグメントのそれぞれに対する、胎児および母体の核酸からの配列タグの数をコンピューターにより同定し、かつ関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数のセグメントのそれぞれに対する少なくとも1種の正規化セグメント配列に対する配列タグの数を同定するためのコード;
(c)関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数のセグメントのそれぞれに対して同定された配列タグの数、および正規化セグメント配列に対して同定された配列タグの数を用いて、関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数のセグメントのそれぞれに対する単一染色体セグメント量を算出するためのコード;ならびに
(d)関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数のセグメントのそれぞれに対する単一染色体セグメント量のそれぞれと、関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数の染色体セグメントのそれぞれに対する対応する閾値の値とを比較し、それによって、サンプルにおけるいずれか1種または複数種の異なる部分的胎児染色体異数性の有無を判定するためのコード
を含む。
実施例1
一次および富化したシーケンシングライブラリーの調製およびシーケンシング
a. シーケンシングライブラリーの調製−簡略プロトコール(ABB)
すべてのシーケンシングライブラリー、すなわち一次および富化したライブラリーを、母体血漿から抽出されたおよそ2ngの精製cfDNAから調製した。Illumina(登録商標)用のNEBNext(商標)DNA Sample Prep DNA Reagent Set 1(品番E6000L;New England Biolabs, Ipswich, MA)を用いて、ライブラリー調製を以下のとおりに実施した。細胞フリー血漿DNAは天然にフラグメント化されているため、血漿DNAサンプルに対して、噴霧化または超音波処理によるさらなるフラグメント化は行わなかった。NEBNext(登録商標)End Repair Moduleに従って、1.5ml微量遠心(microfuge)チューブ中で、cfDNAと、NEBNext(商標)DNA Sample Prep DNA Reagent Set 1において提供されている5μlの10×リン酸化バッファー、2μlのデオキシヌクレオチド溶液ミックス(10mMの各dNTP)、1μlの1:5希釈のDNAポリメラーゼI、1μlのT4 DNAポリメラーゼ、および1μlのT4ポリヌクレオチドキナーゼとを20℃で15分間インキュベートすることによって、40μl中に含有されるおよそ2ngの精製cfDNAフラグメントの突出をリン酸化平滑末端に変換した。次いで、反応混合液を75℃で5分間インキュベートすることによって、酵素を熱不活性化した。混合液を4℃に冷却し、かつKlenowフラグメント(3'→5'exo−)(NEBNext(商標)DNA Sample Prep DNA Reagent Set 1)を含有する10μl のdAテーリングマスターミックスを用いかつ37℃で15分間インキュベートすることによって、平滑末端化DNAのdAテーリングを達成した。その後、反応混合液を75℃で5分間インキュベートすることによって、Klenowフラグメントを熱不活性化した。Klenowフラグメントの不活性化後、1μlの1:5希釈のIllumina製Genomic Adaptor Oligo Mix(品番1000521;Illumina Inc., Hayward, CA)を用い、NEBNext(商標)DNA Sample Prep DNA Reagent Set 1において提供されている4μlのT4 DNAリガーゼを用いて、反応混合液を25℃で15分間インキュベートすることによって、Illuminaアダプター(指標なしのYアダプター)を、dAテーリングされたDNAにライゲーションした。混合液を4℃に冷却し、かつアダプターがライゲーションされたcfDNAを、Agencourt AMPure XP PCR purification system(品番A63881;Beckman Coulter Genomics, Danvers, MA)において提供されている磁気ビーズを用いて、ライゲーションされていないアダプター、アダプターダイマー、および他の試薬から精製した。Phusion(登録商標)High-Fidelity Master Mix(25μl;Finnzymes, Woburn, MA)、およびアダプターに相補的なIllumina製PCRプライマー(それぞれ0.5μM)(品番1000537および1000537)を用い、18サイクルのPCRを実施して、アダプターがライゲーションされたcfDNAを選択的に富化した(25μl)。メーカーの指示書に従い、Illumina製ゲノム用PCRプライマー(品番100537および1000538)、およびNEBNext(商標)DNA Sample Prep DNA Reagent Set 1において提供されているPhusion HF PCR Master Mixを用いて、アダプターがライゲーションされたDNAをPCR(98℃30秒間;98℃10秒間、65℃30秒間、および72℃30の18サイクル;72℃5分間での最終伸長、ならびに4℃保持)に供した。www.beckmangenomics.com/products/AMPureXPProtocol_000387v001.pdfにて入手可能なメーカーの指示書に従い、Agencourt AMPure XP PCR purification system(Agencourt Bioscience Corporation, Beverly, MA)を用いて、増幅産物を精製した。精製された増幅産物を40μlのQiagen EB Buffer中に溶出し、かつ2100 Bioanalyzer(Agilent technologies Inc., Santa Clara, CA)用のAgilent DNA 1000 Kitを用いて、増幅ライブラリーの濃度およびサイズ分布を解析した。
ここに記載される全長プロトコールは、本質的に、Illuminaによって提供されている標準的プロトコールであり、増幅ライブラリーの精製の点でIlluminaプロトコールと異なるだけである。Illuminaプロトコールは、ゲル電気泳動を用いて増幅ライブラリーを精製するように指示しているが、一方で本明細書において記載されるプロトコールは、同じ精製工程に磁気ビーズを用いる。母体血漿から抽出されたおよそ2ngの精製cfDNAを用い、本質的にメーカーの指示書に従い、Illumina(登録商標)用のNEBNext(商標)DNA Sample Prep DNA Reagent Set 1(品番E6000L;New England Biolabs, Ipswich, MA)を用いて、一次シーケンシングライブラリーを調製した。精製カラムの代わりにAgencourtの磁気ビーズおよび試薬を用いて実施した、アダプターがライゲーションされた産物の最終精製を除くすべての工程を、Illumina(登録商標)GAIIを用いてシーケンシングされるゲノムDNAライブラリー用のサンプル調製のための、NEBNext(商標)試薬に添付しているプロトコールに従って実施した。NEBNext(商標)プロトコールは、本質的に、Illuminaによって提供されているものに従い、それは、grcf.jhml.edu/hts/protocols/11257047_ChIP_Sample_Prep.pdfにて入手可能である。
Bioanalyzerによって作成されたエレクトロフェログラムは、図9Aおよび9Bに示されている。図9Aは、(a)で記載される全長プロトコールを用いて、血漿サンプルM24228から精製されたcfDNAから調製されたライブラリーDNAのエレクトロフェログラムを示しており、図9Bは、(b)で記載される全長プロトコールを用いて、血漿サンプルM24228から精製されたcfDNAから調製されたライブラリーDNAのエレクトロフェログラムを示している。両方の図において、ピーク1および4は、それぞれ15bpの低量マーカー(Lower Marker)および1,500の高量マーカー(Upper Marker)を表し;ピークの上の数は、ライブラリーフラグメントに関する移動時間を示し;かつ水平線は、積分のための設定閾値を示す。図9Aにおけるエレクトロフェログラムは、187bpのフラグメントの小さなピークおよび263bpのフラグメントの大きなピークを示しており、一方で図9Bにおけるエレクトロフェログラムは、265bpにおける1つのピークのみを示している。ピークエリアの積分により、図9Aにおける187bpのピークのDNAに対して0.40ng/μlという算出濃度、図9Aにおける263bpのピークのDNAに対して7.34ng/μlという濃度、および図9Bにおける265bpのピークのDNAに対して14.72ng/μlという濃度がもたらされた。cfDNAにライゲーションされたIlluminaアダプターは92bpであることが知られており、それを265bpから差し引いた場合、cfDNAのピークサイズは173bpであることを示す。187bpにおける小さなピークは、端から端までライゲーションした2つのプライマーのフラグメントを表す。線状の2つのプライマーフラグメントは、簡略プロトコールが用いられる場合、最終ライブラリー産物から排除される。簡略プロトコールは、187bp未満のより小さな他のフラグメントも排除する。本実施例において、アダプターがライゲーションされた精製cfDNAの濃度は、全長プロトコールを用いて生成された、アダプターがライゲーションされたcfDNAのものの2倍である。アダプターがライゲーションされたcfDNAフラグメントの濃度は、全長プロトコールを用いて獲得されたものよりも常に大きかったことが留意される(データ示さず)。
双胎妊娠における正確な異数性検出
序論
全ゲノム超並列シーケンシングを用いた、全細胞フリーDNA(cfDNA)の非侵襲的出生前検査(NIPT)は、胎児染色体異数性を検出する非常に正確でかつロバストな方法であることが示されている。Bianchi DW, Platt LD, Goldberg JD, et al. Genome-wide fetal aneuploidy detection by maternal plasma DNA sequencing. Obstet Gynecol 2012;119:890-901;Fan HC, Blumenfeld YJ, Chitkara U, Hudgins L, Quake SR. Noninvasive diagnosis of fetal aneuploidy by shotgun sequencing DNA from maternal blood. Proc Natl Acad Sci U S A 2008;105:16266-71;Sehnert AJ, Rhees B, Comstock D, et al. Optimal detection of fetal chromosomal abnormalities by massively parallel DNA sequencing of cell-free fetal DNA from maternal blood. Clin Chem 2011;57:1042-9を参照されたい。本検査は、単一の母体血液サンプルからトリソミー21、18、13、および性染色体異数性を検出する。本検査は、現在、10+週における単胎妊娠を有しかつ胎児異数性の高いリスクがある妊娠女性に適応される。近年、米国産科婦人科学会(American College of Obstetricians and Gynecologists)(ACOG)、国際出生前診断学会(International Society for Prenatal Diagnosis)(ISPD)、米国臨床遺伝学ゲノム学学会(American College of Medical Genetics and Genomics)(ACMG)、および国立遺伝カウンセラー協会(National Society of Genetic Counselors)(NSGC)は、胎児異数性の高いリスクがある女性に対して、NIPTの使用を考慮することを勧告している。
高いリスクおよび平均的リスクの母体集団の両方を伴う2つの独立した臨床試験の一部として、サンプルを回収した。母体血液は胎児異数性を正確に診断するための供給源である調査(MatErnal BLood IS Source to Accurately Diagnose Fetal Aneuploidy study)(MELISSA;NCT01122524)を、高リスク妊娠における染色体全体の異数性を検出するように設計した。Bianchi DW, Platt LD, Goldberg JD, et al. Genome-wide fetal aneuploidy detection by maternal plasma DNA sequencing. Obstet Gynecol 2012;119:890-901。異数性リスク評価の比較試験(CARE;NCT01663350)を、平均的リスクの母体集団におけるトリソミー21およびトリソミー18に対する従来的出生前血清スクリーニング法と比較して、本検査の優れた特異性を実証するように設計した(発表のために提出された)。データセットについての詳細は、表2に示されている。臨床結果を、出生前の侵襲的手順からの核型によって、または新生児身体検査によって判定した。
本試験において、臨床的に規定された結果を有する118例の双胎妊娠からの母体血漿サンプルを調べた(表2)。第21、第18、および第13染色体に対する異数性分類を、試験におけるサンプルのすべてに対して作成し、1人または複数の異数性胎児を有する妊娠からの4つのサンプルが正しく同定された(図10)。これらのサンプルのうちの2つは、それぞれが、1人のT21影響ありの雄性胎児および1人の影響なしの雄性胎児(47,XY+21/46,XY)の二絨毛膜性双生児ペア由来であり;1つは、47,XY+18核型を有する単一絨毛膜性双生児サンプルであり;かつ1つのサンプルは、1人の双生児がモザイク核型47,XY+T21[7]/46,XY[11]を有する二絨毛膜性双生児であった。本試験において、臨床的に規定された影響なしのサンプル(N=114)のいずれも、異数性について影響ありと分類されなかった。
本試験は、双生児サンプルについて最も高感度な常染色体異数性検査を可能にする、向上した解析方法論を実証している。増強した解析法は、ゲノムフィルタリングの向上、体系的ノイズの低下、および向上した分類法を活用する。双生児における常染色体異数性およびY染色体の存在を検出するMPSの任意の検証において用いられた最大数のサンプルである、118例の双生児サンプルのセットに対して、向上した解析ワークフローの有用性が実証された(図11)。図11は、NIPT試験において解析された双生児サンプルを示している。市販のNIPT検査の性能を査定するために、様々な試験において用いられた双生児サンプルの数。Canick JA, Kloza EM, Lambert-Messerlian GM, et al. DNA sequencing of maternal plasma to identify Down syndrome and other trisomies in multiple gestations. Prenat Diagn 2012;32:730-4、Lau TK, Jiang F, Chan MK, Zhang H, Lo PSS, Wang W. Non-invasive prenatal screening of fetal Down syndrome by maternal plasma DNA sequencing in twin pregnancies. Journal of Maternal-Fetal and Neonatal Medicine 2013;26:434-7。向上した解析法は、いかなる偽陽性結果も生み出すことなく、トリソミー21に対してモザイクである影響ありの胎児を含めた、コホートにおけるすべてのトリソミー21およびトリソミー18のサンプルの存在を正しく検出することによって、正確に実施することが示された。加えて、向上した解析法は、少なくとも1人の雄性胎児を有するすべての双胎妊娠においてY染色体の存在を正しく検出し、かつ2人の雌性胎児を有する双胎妊娠のいずれにおいてもY染色体を検出しなかった。
序論
様々な非侵襲的出生前診断(NIPD)法は、末梢血などの母体体液中において入手可能である胎児起源のcfDNAを利用する。多くのNIPD法は、母体末梢血からcfDNAを抽出し、シーケンシングし、かつアラインメントして、妊娠した母親の胎児由来のcfDNAが、疾患または表現型に関係する遺伝子配列においてコピー数変動を持するかどうかを判定する。抽出されかつシーケンシングされたcfDNAは、配列読み取りを提供し、それは次いで参照ゲノムにマッピングされる。参照ゲノム上の一意的な箇所または部位にマッピングされる配列読み取りを配列タグと呼ぶ。関心対象の配列にマッピングされた配列タグの数を用いて、関心対象の配列のコピー数またはコピー数変動を決定し得る。
動機
染色体部分データの解析により、例えば同じ試薬ロットで加工される所定のフローセル/プレート、またはサンプルの収集物から生じるデータなど、データの種々の「バッチ」間の正規化された被覆率パターンの差異として呈示される体系的バイアスが明らかとなる。これらのサンプル依存的な、試薬依存的な、アッセイ依存的な実験上の変動によって導入される累積的エラーを「バッチ効果」と呼ぶ。これらのバイアスは、サンプル加工/シーケンシングの明白な差異、例えば試薬供給元の変化、またはシーケンシングランにおける無作為のサイクルエラーによって同定され得ることもある。しかしながら、対象内GCバイアス除去の後でさえ、正規化された被覆率変動は依然として残る。残りの変動の供給源は不明であり、無限であり、または単一モデルによって捉えるには複雑すぎる。それにもかかわらず、これらの不均一性の供給源を解析に組み入れ得ないことは、染色体部分検査の感度および特異性に対して幅広いかつ有害な効果を有し得る。
(I)各症候群に対して、症候群コンセンサス領域(コンセンサスゾーンとも呼ばれる)および症候群検索領域(検索ゾーンとも呼ばれる)を同定する。症候群コンセンサス領域とは、症候群に関する様々な既存のデータベースおよび文献に記載される大きな部分の配列にわたる共通領域である。症候群検索領域は、典型的に、データベースおよび文献に記載されるすべてのまたは多くの配列を含み、それは症候群コンセンサス領域よりも広い。
(I)症候群境界を同定する
症候群境界は、症候群コンセンサス領域および症候群検索領域を規定する。症候群コンセンサス領域とは、症候群に関する様々な既存のデータベースおよび文献に記載される多くの配列に共通している領域である。本実施例において、症候群コンセンサス領域は、症候群に関する研究されたデータベースおよび文献の少なくとも半分に共通する配列位置を含む。症候群検索領域は、典型的に、多くのデータベースまたは文献における調査に共通していないものを含めた、データベースおよび文献に記載されるすべてのまたは多くの配列を含む。症候群検索領域は、典型的に、症候群コンセンサス領域よりも広い。本実施例において、症候群検索領域は、少なくとも1つのデータベースまたは文献参照に開示されている配列を含む。当業者であれば、コンセンサスまたは検索領域を選択するための基準が調整され得ることを解する。
細胞遺伝学的位置:22q11.21
出現率:6,000件中1件(93%デノボ)
細胞遺伝学的位置:15q11.2-q13
出現率:12,000件中1件
細胞遺伝学的位置:5p-(5p15.2)
出現率:20,000〜50,000件中1件
細胞遺伝学的位置:7q11.2欠失
出現率:7,500件中1件〜20,000件中1件
細胞遺伝学的位置:4p16.3
出現率:50,000件中1件
細胞遺伝学的位置:1p36
出現率:5,000件中1件
症候群近隣ビン(SNB)とは、症候群コンセンサス領域におけるビンと高度に相関する、ロバストな染色体(例えば、第13、第18、および第21染色体を除く染色体)におけるビンである。症候群コンセンサス領域において観察された体系的可変性を共有する100kbビンを同定するために、トレーニングデータを用いて、コンセンサス領域における各ビンと、ロバストな染色体(すなわち、第13、第18、および第21染色体を除く)に属するすべての100kb常染色体ビンとの間のペアワイズ距離を表す距離行列を構築する。該距離は、コンセンサス領域におけるビンとロバストな染色体におけるビンとの間で、対象間変動がどのくらい類似しているかを表す。
影響なしのサンプルのトレーニングセットTを、それらのSNBセットデータを用いてクラスター形成し、それによってトレーニング部分集団S1を獲得する。トレーニング部分集団には、SNBセットにおいて同程度の可変性を有する影響なしのサンプルが含まれる。
1.分配:各クラスターにおける要素にPAMを適用する;
2.秩序化:PAMにより獲得された新たなクラスターを秩序化する;および
3.崩壊:場合によって、いくつかのクラスターを統合する。
式中、ajは、要素jとそのクラスターの他の要素との平均相違であり、かつbjは、要素jと、要素jが属しない任意の1つのクラスターの要素との最小平均相違である。
HOPACH-PAMによる最大クラスターが、影響なしのサンプルのトレーニングセットT全体の中でのトレーニング部分集団S1として選択された後、S1のサンプルは、症候群ウェーブプロファイルのw1プロファイルを、ゲノムにおけるあらゆるビンの正規化された被覆率値中央値として規定するデータを提供し、該中央値はS1サンプルにわたって取られる。いくつかの態様において、ここで本実施例にあるように、正規化された被覆率値は、ゲノム全体または正規化常染色体の染色体のセットなどの参照配列の被覆率に対して正規化されている。さらに、いくつかの態様において、被覆率は、本明細書における他の箇所で記載されている包括的ウェーブプロファイルと呼ばれる包括的分散に対して調整されており、該包括的ウェーブプロファイルは、トレーニングセットT全体から獲得される。
トレーニングセットTにおけるあらゆるサンプルに対して、Huber M推定量を用いて、被覆率〜w1プロファイルのロバストな線形適合を獲得する。次いで、あらゆるビンの被覆率から線形適合値を差し引くことによって、あらゆるサンプルに対する残差の正規化された被覆率を獲得し、それによって、除去された症候群ウェーブプロファイルを有する調整された被覆率が提供される。
ウェーブ#1に対して、1つの症候群ウェーブプロファイルw1プロファイルを除去した後、さらなる症候群ウェーブプロファイルを同様の様式で除去し得る。これは、作業Vから獲得されたSNBにおける残差を作業IIIのためのSNBセットデータとして用いて、作業III〜Vを繰り返し反復し、それによって付加的な症候群ウェーブプロファイル(w2プロファイル、w3プロファイルなど)を規定することによって実施され得る。ウェーブ#1が除去された後、残差の正規化された被覆率行列を、第2ラウンドの階層的クラスタリングに供し、最大クラスターの中央値プロファイルを再度抽出し、かつウェーブ#1に直交する構成要素をウェーブ#2として保存する。所望の数のウェーブが、種々のサンプルを検査するために適用され得る、症候群ウェーブプロファイルの定常セットの一部として蓄積されるまで、この繰り返しを続ける。
ウェーブプロファイルを獲得した後、それらを検査サンプルに繰り返し適用して、ゲノムにおけるビンの被覆率を調整し得る。検査サンプルの調整は、トレーニングサンプルからウェーブを獲得する場合のトレーニングサンプルへの調整と同じやり方で実施され得る。調整の繰り返しは、被覆率〜w#プロファイルのロバストな線形適合の残差を獲得する工程を含む。次いで、残差の正規化された被覆率を、調整の次の繰り返しにおけるインプットデータとして用いる。
あらゆる繰り返し工程におけるSSS-BERの効果を調査することにより、ウェーブの数がN=4を超えたときに、性能向上の急速な減退が明らかとなる、猫鳴きに対するCVに関する図21を参照されたい。ここでは、コンセンサス症候群比率を性能測定基準として確立するために、コンセンサス症候群領域における被覆率中央値が、症候群染色体の正規化された被覆率中央値によって正規化されている。
フローセル特異的包括的ウェーブプロファイル除去
いくつかの態様において、SSS-BER過程の前に、ビンの被覆率を、フローセルの包括的ウェーブプロファイルおよびGCプロファイルに対して調整する。
様々な態様において、上記で記載されるように、症候群特異的分散に対して調整する前に、被覆率をGC含有量バイアスに対して補正し得る。簡潔には、これは、検査サンプルのビン間のGC含有量レベルと被覆率との間の関係に基づき、被覆率を調整することによって実施され得る。いくつかの態様において、GC含有量レベルと被覆率との間の関係は、GC含有量と被覆率との間の非線形モデルによって表され得る。いくつかの態様において、調整は、被覆率から非線形適合値を差し引くことによって達成される。他の態様において、調整は、被覆率を非線形適合値で割ることによって達成され得る。いくつかのより単純な実践において、非線形適合を用いて調整値を獲得する代わりに、被覆率によって秩序化されたビンの平均または中央値の値を調整値として用い得る。
正規化された症候群値を獲得する
症候群領域に対して被覆率を獲得した後、該被覆率を該領域に対して組み合わせ得る。いくつかの態様において、領域は種々の検査サンプルに対して同じであり、その場合、組み合わせた被覆率値が、症候群領域を設けている染色体の被覆率によって割られ得る。次いで、被覆率値を用いて、影響なしのサンプルの被覆率値に基づく標準化されたスコアを提供し得る。標準化された値は、正規化された症候群値と呼ばれ得、
式中、
および
は、影響なしのサンプルのセットにおける第j症候群量に対する、それぞれ、推定される平均および標準偏差である。これらの態様において、NSVを、特定の信頼区画を有する判定基準に対応するzスコアと概念的に似ている判定閾値と比較する。
いくつかの態様において、上記で記載される症候群領域は、下記でさらに記載されるセグメント化ルーチンによって獲得された、症候群検索領域における症候群セグメントであり得る。いくつかの関係した態様において、上記の調整後の工程を、下記で記載される代替的方法によって置き換え得る。いくつかの態様において、解析は、症候群セグメントに対するNSVの代わりに、胎児画分(FF)またはそれから導き出された値を算出し、そのFFまたは導き出された値を判定基準と比較して、症候群セグメントにおいてCNVが存在するかどうかを判定する。判定過程および詳細な実施例についての高レベルな記載は、後で提供される。
所定のデータのセットに対して、影響ありおよび影響なしのサンプルを識別する所定の判定基準は、通常、偽陽性および偽陰性のコール間でトレードオフする。影響ありのサンプルが、影響なしのサンプルよりも高い平均を有する正常分布を有すると想定すると、基準がより低く設定された場合、感度は増加しかつ選択性は減少する。逆に、基準がより高く設定された場合、感度は減少しかつ選択性は増加する。繰り返して言うために、感度は、すべての実際に陽性の(例えば、影響ありまたは患者の)サンプルにわたる真陽性コールの比率であり、一方で選択性は、すべての実際に陰性の(例えば、影響なしまたは対照の)サンプルにわたる真陰性コールの比率である。本開示は、配列のCNVのコールについての感度および選択性の両方を増加させる方法を提供する。これは、その測定値が相対的に低い影響ありのサンプルにとって、およびその測定値が相対的に高い影響なしのサンプルにとってとりわけ役立つ。
(1)偽陽性率は、利用されるタグの数に依存せず、それは、サンプルを「検出された異数性」として分類するように選定されたカットオフにのみ依存する。例えば、「検出された異数性」が、
−3というzスコアカットオフで分類される場合、FP率は0.13%であり、
−2というzスコアカットオフで分類される場合、FP率は2.30%であり、
−1.65というzスコアカットオフで分類される場合、5%など;かつ
(2)偽陰性率は、3つの因子に依存する。
−利用されるタグの数
−サンプルを「検出された異数性」として分類するように選定されたカットオフ(zスコア)
−分類される特定の染色体に関する測定結果の相対的分散(CV−分散の係数)
・例えば、第21染色体に対するCVは約0.4%であり、一方で第18染色体に対するCVは約0.2%である。
−集団におけるcfDNA胎児画分分布
・胎児画分なしの測定結果を想定して、低い胎児画分を有するサンプルを排除する。
工程1
多くのサンプル/レーンを用いてシーケンシングし、かつ感度が>99.5%であるようにNCVカットオフを低く設定する。
・例えば、NCV=1.3、FP率は約10%である。
・5Mタグに対する検出率、T21に関して>99.3%、T18に関して>99.8%。
少ないサンプル/レーン(約8個)を用いて、第1のシーケンシングランからの10%の推定陽性をシーケンシングし、かつ特異性が>99.9%であるようにNCVカットオフを設定する。
・例えば、NCV=4、FP率は<<0.1%である。
・25Mタグに対する検出率、トリソミーに関して>99.9%。
いくつかの態様において、症候群検出は、症候群と関連したビンにおける観察される正規化された被覆率(Y)に対して、ヌルの仮説(M0)および代替的仮説(M1)を評価する。M0:欠失(または他のCNV)は存在しておらず、被覆率は、症候群と関連した領域における二倍体ゲノムの予想と合致する。M1:欠失は、ビン「s」から開始しかつビン「e」で終了する「ff」の胎児画分に存在している。
−−開始箇所「s」は、症候群の検索領域内にある。
−−欠失が「末端」として規定された場合、開始箇所は、常に染色体の開始に固定される。
−−終了箇所「e」は、症候群の検索領域内にある。
−−胎児画分「ff」は、母体血漿サンプルの胎児構成要素に対して予想される分布内にある。
−−欠失のサイズ(「e」〜「s」)は、少なくともコンセンサス領域のサイズに及ぶ。
考え得るすべての開始/終結箇所を、症候群境界に基づいて規定する。胎児画分分布を、事後算出に代入し得る。最小症候群領域を考慮して、正当な開始/終了箇所は確率が等しいと想定される。解析は、検索領域および胎児画分内にあるすべての妥当な症候群位置の下での尤度を評価する工程を伴う。症候群領域を規定するための疑似コードは、下記で提供される。疑似コードにおいて用いられるパラメーターは、表9に示されている。
if (slideStart){#非末端欠失
sseq=seq(start, (stop−minbins), minshift); #潜在的開始箇所
eseq=sseq+minbins#潜在的終結箇所
}else{#末端欠失
sseq=start; #潜在的開始箇所−常に固定
eseq=seq((start+minbins), (stop), minshift) #変動することを可能にされた潜在的終結箇所
}
gr=拡張.グリッド(sseq, eseq) #開始/終結のすべての組み合わせを検討する
gr=gr[gr[,2]>=gr[,1]+minbins, drop=FALSE] #最小.欠失領域を執行する
colnames(gr)=c("start","stop")
固定した開始/終結/ff値に対するlog尤度のためのインプット:y−症候群検索領域内にある所定のサンプルに対して観察される正規化された被覆率。theta (start、stop、alpha(胎児画分)); Params−症候群に対するt分布パラメーター。疑似コードが後に続く。
pyGivenSEA<−function (y, theta, params){
#欠失した領域
i1=c(theta$start: theta$end);
#非欠失領域
i2=setdiff(1:長さ(y), i1)
ll=
#欠失内の領域のlog-lik@胎児画分theta$alpha
sum(dt((y[i1]−params["m",i1]+0.5*theta$alpha)/params["s",i1], params["df",i1], prams["ncp",i1], log=TRUE), na.rm=TRUE)+#欠失の外側にある領域のlog-lik@正常な二倍体状態
sum(dt((y[i2]−params["m",i2])/params["s",i2], params["df",i2], params["ncp",i2], log=TRUE), na.rm=TRUE);
return (ll)
}
ll=array(NA, dim=c(長さ(alphaSeq), nrow(gr), ncol(bincov)));
for (1:ncol(bincov)におけるk)、{ #for各サンプル
ll[,,k]=sapply(1:nrow(gr), function(i){#for正当な潜在的開始/終了箇所の各組み合わせ
#alphaSeqベクトルにおいて規定された各潜在的胎児画分に対するlog-likを算出する
loglik=sapply(alphaSeq, function(a) pyGivenSEA(
bincov[,k],
list(start=gr$start[i], end=gr$end[i], alpha=a),
params
))
return (loglik)
})
}
欠失に対する推定される胎児画分を算出することによって解析は進行し(欠失が存在していない場合には0)、かつ欠失存在を支持するスコアを用いて、経験的に推定されるカットオフ値に基づいて分類を判定する。M0およびM1に対するスコアは、以下のように獲得され得る。そして、サンプルをコールするためのスコアは、2つの代替的仮説に対するスコアの比率であり得る。
式中、すべての開始および終了箇所は確率が等しいと推量され、かつM1に対するffは、影響なしの雄性トレーニングセットから推定される。
pAlpha=apply(ll, 3, apply, 1, function(x){v=max(x); v+log(sum(exp(x−v)))})
estFf=aphaSeq[unlist(apply(pAlpha, 2, which.max))] #欠失に対する最も可能性の高いffを推論する
比率=estFf
logスコアM0=apply(ll, 3, function(x){#M0下でのスコアを計算する(ゼロff(AlphaSeq))
y=x[which.min(abs(alphaSeq)),]
v=max(y)
v+log(sum(exp(y−v)))
})
logスコアM1=apply(ll, 3, function(x){#スコアM1を計算する
logPDGivenFF=apply(x, 1, function(y){
v=max(y)
v+log(sum(exp(y-v)))
})
z=max(logPDGivenFF)
z+log(sum(exp(logPDGivenFF−z)[−1]*pff))
})
logスコア=(logスコアM1−logスコアM0)/nrow(bincov)
1種または複数種のゲノムの核酸を含む検査サンプルにおける、関心対象の配列のコピー数の評価のための、1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムで実践される方法であって、該関心対象の配列は、コピー数変動が遺伝的症候群と関連している染色体部分ゲノム領域(sub-chromosomal genomic region)にあり、該方法は、
(a)検査サンプルにおける細胞フリーDNAをシーケンシングすることによって獲得された配列読み取りを受け取る工程;
(b)検査サンプルの配列読み取りを、関心対象の配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する工程であって、該参照ゲノムは複数のビンに分割されている、工程;
(c)関心対象の配列を含む参照ゲノムにおけるビンについて、検査配列タグの被覆率を決定する工程;
(d)検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた、影響なしのトレーニングサンプルのトレーニングセットの部分集団から獲得された予想被覆率を採用することによって、ビンにおける検査配列タグの被覆率を調整する工程であって、該予想被覆率は、関心対象の配列内にあるビンの被覆率と相関することが見出された、関心対象の配列の外側にあるビンの被覆率を用いて獲得された、工程;および
(e)(d)からの調整された被覆率に基づき、検査サンプルにおける関心対象の配列のコピー数を評価する工程
を含む、方法。
[本発明1002]
ゲノムのうちの1種または複数種が染色体異数性を有するかどうかを判定するために、検査サンプルにおける1種または複数種の染色体のコピー数を評価する工程をさらに含む、本発明1001の方法。
[本発明1003]
1種または複数種の染色体のコピー数を評価する工程は、(d)の後に実施される、本発明1002の方法。
[本発明1004]
(d)の前に、トレーニングセットから獲得された包括的ウェーブプロファイルを適用することによって検査配列タグの被覆率を調整する工程をさらに含み、該包括的ウェーブプロファイルは、トレーニングセットにわたって平均化された、参照ゲノムにおけるビンの被覆率を含む、前記本発明のいずれかの方法。
[本発明1005]
(d)の前に、検査サンプルのビン間のGC含有量レベルと被覆率との間の関係に基づき、検査配列タグの被覆率を調整する工程をさらに含む、本発明1004の方法。
[本発明1006]
1種または複数種の染色体のコピー数を評価する工程は、検査サンプルの1種または複数種の染色体のそれぞれに対して配列量(sequence dose)を算出する工程を含み、該配列量は、1種または複数種の染色体における検査配列タグの検査サンプル被覆率を、正規化配列における検査配列タグの被覆率で割ることによって算出される、本発明1002の方法。
[本発明1007]
配列量をトレーニングセットの配列量の標準偏差で割ることによって、正規化された配列値を獲得する工程をさらに含む、本発明1006の方法。
[本発明1008]
(c)においてビンに対する被覆率を決定する工程は、すべてのビンにわたる配列タグの総数に対して、ビンごとのタグの計数を正規化する工程を含み、かつ(d)において調整される被覆率は、正規化された被覆率である、本発明1001の方法。
[本発明1009]
(d)において用いられる、関心対象の配列の外側にあるビンは、第13、第18、および第21染色体以外のヒト常染色体におけるビンである、本発明1001の方法。
[本発明1010]
関心対象の配列の外側にあるビンは、関心対象の配列内にある検討中のビンにおける被覆率と、関心対象の配列の外側にあるビンにおける被覆率との間の相関距離を決定することによって同定される、本発明1001の方法。
[本発明1011]
相関距離は、トレーニングセットのサンプルから創出された、ビン被覆率のベクトル間の距離として算出される、本発明1010の方法。
[本発明1012]
(i)トレーニングセットの部分集団として、関心対象の配列の外側にあるビンにおけるそれらの被覆率において互いに相関する、トレーニングセット中のトレーニングサンプルを同定し、かつ(ii)該部分集団のビンにおける被覆率から予想被覆率を獲得することによって、予想被覆率を獲得した、本発明1001の方法。
[本発明1013]
サンプルの群を同定する工程は、該サンプルのクラスターを同定する工程を含む、本発明1012の方法。
[本発明1014]
予想被覆率を獲得する工程は、トレーニングサンプルの同定された群の被覆率の中心的傾向を判定する工程を含む、本発明1012の方法。
[本発明1015]
何回か繰り返して(d)を反復する工程をさらに含み、各繰り返しは、先行の繰り返しからの調整された被覆率を、最新の繰り返しにおいて調整される対象となる被覆率として用い、かつ各繰り返しは、影響なしのサンプルの異なる部分集団から獲得された予想被覆率を採用する、本発明1001の方法。
[本発明1016]
作業(d)においてビンの検査配列タグの被覆率を調整する工程は、
関数をデータ点に適合させる工程であって、各データ点は、予想被覆率を、ビンにおける検査サンプルに対する対応する被覆率に関連付けする、工程;
ビンにおける被覆率を該関数に適用することによって、関心対象の配列のビンにおける被覆率を調整する工程
を含む、本発明1001の方法。
[本発明1017]
関数は線形関数である、本発明1016の方法。
[本発明1018]
作業(d)において関心対象の配列のビンにおける検査配列タグの被覆率を調整する工程は、関心対象の配列のビンに対する測定された被覆率値から予想値を差し引く工程を含む、本発明1001〜1014のいずれかの方法。
[本発明1019]
関心対象の配列として、症候群特異的領域の開始点および終了点を決定するセグメント化を実施する工程をさらに含む、前記本発明のいずれかの方法。
[本発明1020]
検査サンプルは、2種の異なるゲノム由来の核酸の混合物を含む、前記本発明のいずれかの方法。
[本発明1021]
核酸はcfDNA分子である、前記本発明のいずれかの方法。
[本発明1022]
検査サンプルは、胎児および母体の細胞フリー核酸を含む、前記本発明のいずれかの方法。
[本発明1023]
検査サンプルは、同じ対象由来の癌性細胞および影響なしの細胞由来の核酸を含む、前記本発明のいずれかの方法。
[本発明1024]
複数の影響なしの個体および/または検査サンプルから細胞フリーDNAを抽出する工程をさらに含む、前記本発明のいずれかの方法。
[本発明1025]
シーケンサーを用いて検査サンプル由来の核酸をシーケンシングし、それによって検査サンプルの配列読み取りを生成する工程をさらに含む、前記本発明のいずれかの方法。
[本発明1026]
配列読み取りは、個体の全ゲノムにおけるいずれかの箇所由来の約20〜50bpの配列を含む、前記本発明のいずれかの方法。
[本発明1027]
配列読み取りは、バーコード化された25merを含む、前記本発明のいずれかの方法。
[本発明1028]
検査配列タグおよびトレーニング配列タグの被覆率は非除外部位計数(NES計数)として提供され、NES計数は、非除外部位にマッピングされた非冗長の配列タグの数である、前記本発明のいずれかの方法。
[本発明1029]
NES計数は、非除外部位にマッピングされた、一意的にアラインメントされた非冗長の配列タグの数である、本発明1028の方法。
[本発明1030]
ビンサイズが約1000bp〜1,000,000bpである、前記本発明のいずれかの方法。
[本発明1031]
ビンサイズが約100,000bpである、前記本発明のいずれかの方法。
[本発明1032]
検査サンプルの配列読み取りの数を用いた算出によってビンサイズを決定する工程をさらに含む、前記本発明のいずれかの方法。
[本発明1033]
シーケンシング読み取りは初回のマルチプレックスシーケンシングによって獲得され、
第1の閾値よりも高い、症候群分類またはコピー数変動をコールするための第1の値を有する検査サンプルを同定する工程;
初回のマルチプレックスシーケンシングよりも深いシーケンシング深度において、同定された検査サンプルを再シーケンシングして、再シーケンシングされたデータを獲得する工程;および
再シーケンシングされたデータを用いて症候群分類またはコピー数変動を判定する工程
をさらに含む、前記本発明のいずれかの方法。
[本発明1034]
再シーケンシングされたデータを用いて症候群分類またはコピー数変動を判定する工程は、
再シーケンシングされたデータから、症候群分類またはコピー数変動をコールするための第2の値を獲得する工程;および
該第2の値を第2の閾値と比較する工程であって、該第2の閾値は第1の閾値よりも高い、工程
を含む、本発明1033の方法。
[本発明1035]
前記同定された検査サンプルは、あらかじめ設定された値よりも低い第1の値を有し、該あらかじめ設定された値は第1の閾値よりも高く、かつ第1の閾値よりも低いサンプルは影響なしであると判定され、あらかじめ設定された値よりも高いサンプルは影響ありであると判定され、かつ第1の閾値からあらかじめ設定された値に及ぶサンプルは再シーケンシングについて同定される、本発明1033の方法。
前記同定された検査サンプルの第1の値は、公知の影響ありのサンプルと比較して相対的に低い、本発明1033の方法。
[本発明1036]
前記同定された検査サンプルの第1の値は、公知の影響ありのサンプルの約90%よりも低い、本発明1033の方法。
[本発明1037]
遺伝的症候群は、1p36欠失症候群、ウォルフ・ヒルシュホーン症候群、猫鳴き症候群、アンジェルマン症候群、ウィリアムズ症候群、およびディジョージ症候群からなる群より選択される、前記本発明のいずれかの方法。
[本発明1038]
コンピューターシステムの1つまたは複数のプロセッサーによって実行される場合に遺伝的症候群に関係した関心対象の配列のコピー数の評価のための方法を該コンピューターシステムに実践させるプログラムコードを保存している、非一時的な機械可読媒体を含むコンピュータープログラム製品であって、該プログラムコードは、
(a)検査サンプルにおける細胞フリーDNAをシーケンシングすることによって獲得された配列読み取りを受け取る工程;
(b)検査サンプルの配列読み取りを、関心対象の配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する工程であって、該参照ゲノムは複数のビンに分割されている、工程;
(c)関心対象の配列を含め、参照ゲノムにおけるビンについて、検査配列タグの被覆率を決定する工程;
(d)検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた、影響なしのトレーニングサンプルのトレーニングセットから獲得された予想被覆率を採用することによって、ビンにおける検査配列タグの被覆率を調整する工程であって、該予想被覆率は、関心対象の配列内にあるビンの被覆率と相関することが見出された、関心対象の配列の外側にあるビンの被覆率を用いて獲得された、工程;および
(e)(d)からの調整された被覆率に基づき、検査サンプルにおける関心対象の配列のコピー数をコンピューターシステムによって評価する工程
のためのコードを含む、コンピュータープログラム製品。
[本発明1039]
1種または複数種のゲノムの核酸を含む検査サンプルにおいてビン被覆率を調整することにおける使用のための、予想被覆率を同定する方法であって、該方法は、
(a)検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた、影響なしのトレーニングサンプルのトレーニングセットからデータを獲得する工程;および
(b)関心対象の配列の外側にあるビンの被覆率を用いて予想被覆率を決定する工程であって、関心対象の配列の外側にあるビンの被覆率は、関心対象の配列内にあるビンの被覆率と相関し、かつ関心対象の配列は、そのコピー数変動が遺伝的症候群と関連している染色体部分ゲノム領域である、工程
を含む、方法。
[本発明1040]
(d)において用いられる、関心対象の配列の外側にあるビンは、第13、第18、および第21染色体以外のヒト常染色体におけるビンである、本発明1039の方法。
[本発明1041]
各トレーニングサンプルに関して、
(i)トレーニングサンプルにおける細胞フリーDNAをシーケンシングすることによって獲得された配列読み取りを受け取る工程;
(ii)トレーニングサンプルの配列読み取りを、関心対象の配列を含む参照ゲノムにアラインメントし、それによってトレーニング配列タグを提供する工程であって、該参照ゲノムは複数のビンに分割されている、工程;および
(iii)関心対象の配列を含め、参照ゲノムにおけるビンについて、トレーニング配列タグの被覆率を決定する工程
をさらに含む、本発明1039の方法。
[本発明1042]
(iii)においてビンに対する被覆率を決定する工程は、すべてのビンにわたる配列タグの総数に対して、ビンごとのタグの計数を正規化する工程を含み、かつ(b)における予想被覆率は、正規化された被覆率である、本発明1041の方法。
[本発明1043]
関心対象の配列内にある検討中のビンにおける被覆率と、関心対象の配列の外側にあるビンにおける被覆率との間の相関距離を決定することによって、関心対象の配列内にあるビンにおける被覆率と相関する被覆率を有する、関心対象の配列の外側にあるビンを同定する工程をさらに含む、本発明1039の方法。
[本発明1044]
前記相関距離は、トレーニングセットのサンプルから創出された、ビン被覆率のベクトル間の距離として算出される、本発明1043の方法。
[本発明1045]
関心対象の配列の外側にあるビンの被覆率を用いて予想被覆率を決定する工程は、
(i)影響なしのトレーニングサンプルのトレーニングセットからトレーニング部分集団を同定する工程であって、該トレーニング部分集団のサンプルは、関心対象の配列の外側にあるビンにおけるそれらの被覆率において互いに相関する、工程、および
(ii)トレーニング部分集団のビンにおける被覆率から予想被覆率を獲得する工程
を含む、本発明1039の方法。
[本発明1046]
トレーニング部分集団を同定する工程は、トレーニングセットにおけるサンプルのクラスターを同定する工程を含む、本発明1045の方法。
[本発明1047]
予想被覆率を獲得する工程は、同定されたトレーニング部分集団の被覆率の中心的傾向を判定する工程を含む、本発明1045の方法。
[本発明1048]
関数をデータ点に適合させる工程であって、それぞれが、特定のビンにおけるトレーニング部分集団にわたる予想被覆率を、該特定のビンにおけるトレーニングサンプル配列に対する対応する観察された被覆率に関連付けする、工程;
該ビンにおける観察された被覆率を該関数に適用することによって、トレーニングサンプル配列のビンにおける被覆率を調整する工程
によって、トレーニングセットにおけるトレーニングサンプル配列の被覆率を調整する工程をさらに含む、本発明1045の方法。
[本発明1049]
前記関数は線形関数である、本発明1048の方法。
[本発明1050]
1種または複数種のゲノムの核酸を含む検査サンプルを用いた、遺伝的症候群に関係した関心対象の配列のコピー数の評価のためのシステムであって、該システムは、
サンプルからの核酸配列情報を提供する検査サンプル由来の核酸を受け取るためのシーケンサー;
(a)検査サンプルにおける細胞フリーDNAをシーケンシングすることによって獲得された配列読み取りを受け取る作業;
(b)検査サンプルの配列読み取りを、関心対象の配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する作業であって、該参照ゲノムは複数のビンに分割されている、作業;
(c)関心対象の配列を含む参照ゲノムにおけるビンに対して、検査配列タグの被覆率を決定する作業;
(d)検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた、影響なしのトレーニングサンプルのトレーニングセットから獲得された予想被覆率を採用することによって、ビンにおける検査配列タグの被覆率を調整する作業であって、該予想被覆率は、関心対象の配列内にあるビンの被覆率と相関することが見出された、関心対象の配列の外側にあるビンの被覆率を用いて獲得された、作業;および
(e)(d)からの調整された被覆率に基づき、検査サンプルにおける関心対象の配列のコピー数をコンピューターシステムによって評価する作業
を実行するまたは引き起こすように設計されたまたは構成された論理回路
を含む、システム。
[本発明1051]
前記論理回路は、プロセッサー;および前記作業の実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体を含む、本発明1050のシステム。
[本発明1052]
母体検査サンプルにおける胎児および母体の核酸からの少なくとも約10,000個の配列読み取りを受け取るためのインターフェースであって、該配列読み取りは、電子形式で提供される、インターフェース;ならびに
少なくとも一時的に、複数の該配列読み取りを保存するためのメモリー
をさらに含む、本発明1050〜1051のいずれかのシステム。
[本発明1053]
母体検査サンプルから細胞フリーDNAを抽出するための機器をさらに含む、本発明1050〜1052のいずれかのシステム。
[本発明1054]
細胞フリーDNAを抽出するための機器はシーケンサーと同じ設備内に位置し、かつ母体検査サンプルを採取するための機器は遠隔設備に位置する、本発明1053のシステム。
[本発明1055]
前記論理回路は、ゲノムのうちの1種または複数種が染色体異数性を有するかどうかを判定するために、検査サンプルにおける1種または複数種の染色体のコピー数を評価する作業を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1050〜1054のいずれかのシステム。
[本発明1056]
前記論理回路は、(d)の後に、1種または複数種の染色体のコピー数を評価する工程を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1055のシステム。
[本発明1057]
前記論理回路は、
(d)の前に、トレーニングセットから獲得された包括的ウェーブプロファイルを適用することによって、検査配列タグの被覆率を調整する作業であって、該包括的ウェーブプロファイルは、トレーニングセットにわたって平均化された、参照ゲノムにおけるビンの被覆率を含む、作業
を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1050〜1056のいずれかのシステム。
[本発明1058]
前記論理回路は、(d)の前に、検査サンプルのビン間のGC含有量レベルと被覆率との間の関係に基づき、検査配列タグの被覆率を調整する作業を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1057のシステム。
[本発明1059]
前記論理回路は、
検査サンプルの1種または複数種の染色体のそれぞれについて配列量を算出することによって、1種または複数種の染色体のコピー数を評価する工程であって、該配列量は、1種または複数種の染色体における検査配列タグの検査サンプル被覆率を、正規化配列における検査配列タグの被覆率で割ることによって算出される、工程
を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1055のシステム。
[本発明1060]
前記論理回路は、配列量をトレーニングセットの配列量の標準偏差で割ることによって、正規化された配列値を獲得する工程を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1059のシステム。
[本発明1061]
前記論理回路は、すべてのビンにわたる配列タグの総数に対して、ビンごとのタグの計数を正規化することによって、(c)においてビンに対する被覆率を決定する工程を実行するまたは引き起こすようにさらに設計されるまたは構成され、かつ(d)において調整された被覆率は、正規化された被覆率である、本発明1050〜1060のいずれかのシステム。
[本発明1062]
(d)において用いられる、関心対象の配列の外側にあるビンは、第13、第18、および第21染色体以外のヒト常染色体におけるビンである、本発明1050〜1061のいずれかのシステム。
[本発明1063]
前記論理回路は、関心対象の配列内にある検討中のビンにおける被覆率と、関心対象の配列の外側にあるビンにおける被覆率との間の相関距離を決定することによって、関心対象の配列の外側にあるビンを同定する工程を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1050〜1062のいずれかのシステム。
[本発明1064]
前記論理回路は、トレーニングセットのサンプルから創出された、ビン被覆率のベクトル間の距離を算出することによって相関距離を算出する工程を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1063のシステム。
[本発明1065]
(i)トレーニングセットの部分集団として、関心対象の配列の外側にあるビンにおけるそれらの被覆率において互いに相関する、トレーニングセット中のトレーニングサンプルを同定する工程、および(ii)該部分集団のビンにおける被覆率から予想被覆率を獲得する工程によって、予想被覆率を獲得した、本発明1050〜1064のいずれかのシステム。
[本発明1066]
サンプルの群を同定する工程は、該サンプルのクラスターを同定する工程を含む、本発明1065のシステム。
[本発明1067]
予想被覆率を獲得する工程は、トレーニングサンプルの同定された群の被覆率の中心的傾向を判定する工程を含む、本発明1066のシステム。
[本発明1068]
作業(d)においてビンの検査配列タグの被覆率を調整する工程は、
関数をデータ点に適合させる工程であって、各データ点が、予想被覆率を、ビンにおける検査サンプルに対する対応する被覆率に関連付けする、工程;
該ビンにおける被覆率を該関数に適用することによって、関心対象の配列のビンにおける被覆率を調整する工程
を含む、本発明1050のシステム。
[本発明1069]
前記関数は線形関数である、本発明1068のシステム。
[本発明1070]
前記論理回路は、関心対象の配列のビンに対する測定された被覆率値から予想値を差し引くことによって、作業(d)において関心対象の配列のビンにおける検査配列タグの被覆率を調整する工程を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1050〜1068のいずれかのシステム。
[本発明1071]
前記論理回路は、以下の作業:関心対象の配列として、症候群特異的領域の開始点および終了点を決定するセグメント化を実施する作業を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1050〜1070のいずれかのシステム。
[本発明1072]
前記検査サンプルは、2種の異なるゲノム由来の核酸の混合物を含む、本発明1050〜1071のいずれかのシステム。
[本発明1073]
前記核酸はcfDNA分子である、本発明1050〜1072のいずれかのシステム。
[本発明1074]
前記検査サンプルは、胎児および母体の細胞フリー核酸を含む、本発明1050〜1073のいずれかのシステム。
[本発明1075]
前記検査サンプルは、同じ対象由来の癌性細胞および影響なしの細胞由来の核酸を含む、本発明1050〜1074のいずれかのシステム。
[本発明1076]
前記配列読み取りは、個体の全ゲノムにおけるいずれかの箇所由来の約20〜50bpの配列を含む、本発明1050〜1075のいずれかのシステム。
[本発明1077]
前記配列読み取りは、バーコード化された25merを含む、本発明1050〜1076のいずれかのシステム。
[本発明1078]
前記論理回路は、
検査配列タグの被覆率を非除外部位計数(NES計数)として提供する作業であって、NES計数は、非除外部位にマッピングされた非冗長の配列タグの数である、作業
を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1050〜1077のいずれかのシステム。
[本発明1079]
NES計数は、非除外部位にマッピングされた、一意的にアラインメントされた非冗長の配列タグの数である、本発明1078のシステム。
[本発明1080]
ビンサイズが約1000bp〜1,000,000bpである、本発明1050〜1079のいずれかのシステム。
[本発明1081]
ビンサイズが約100,000bpである、本発明1050〜1080のいずれかのシステム。
[本発明1082]
前記論理回路は、検査サンプルの配列読み取りの数を用いた算出によってビンサイズを決定する作業を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1050〜1081のいずれかのシステム。
[本発明1083]
前記シーケンシング読み取りは初回のマルチプレックスシーケンシングによって獲得され、かつ前記論理回路は、
第1の閾値よりも高い、症候群分類またはコピー数変動をコールするための第1の値を有する検査サンプルを同定する作業;
初回のマルチプレックスシーケンシングよりも深いシーケンシング深度において、同定された検査サンプルを再シーケンシングして、再シーケンシングされたデータを獲得する作業;および
再シーケンシングされたデータを用いて症候群分類またはコピー数変動を判定する作業
を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1050〜1082のいずれかのシステム。
[本発明1084]
前記論理回路は、
再シーケンシングされたデータから、症候群分類またはコピー数変動をコールするための第2の値を獲得する作業;および
該第2の値を第2の閾値と比較する作業であって、該第2の閾値は第1の閾値よりも高い、作業
によって、再シーケンシングされたデータを用いて症候群分類またはコピー数変動を判定する作業を実行するまたは引き起こすようにさらに設計されるまたは構成される、本発明1083のシステム。
[本発明1085]
遺伝的症候群は、1p36欠失症候群、ウォルフ・ヒルシュホーン症候群、猫鳴き症候群、アンジェルマン症候群、ウィリアムズ症候群、およびディジョージ症候群からなる群より選択される、本発明1050〜1084のいずれかのシステム。
本明細書における例はヒトに関し、かつ言葉は主にヒトゲノムに向けられているが、本明細書において記載される概念は、任意の植物または動物由来のゲノムに適用可能である。本開示のこれらおよび他の目的および特質は、以下の記載および添付の特許請求の範囲からより十分に明らかになるであろう、または以降に明記される本開示の履行によって習得され得る。
Claims (85)
(a)検査サンプルにおける細胞フリーDNAをシーケンシングすることによって獲得された配列読み取りを受け取る工程;
(b)検査サンプルの配列読み取りを、関心対象の配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する工程であって、該参照ゲノムは複数のビンに分割されている、工程;
(c)関心対象の配列を含む参照ゲノムにおけるビンについて、検査配列タグの被覆率を決定する工程;
(d)検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた、影響なしのトレーニングサンプルのトレーニングセットの部分集団から獲得された予想被覆率を採用することによって、ビンにおける検査配列タグの被覆率を調整する工程であって、該予想被覆率は、関心対象の配列内にあるビンの被覆率と相関することが見出された、関心対象の配列の外側にあるビンの被覆率を用いて獲得された、工程;および
(e)(d)からの調整された被覆率に基づき、検査サンプルにおける関心対象の配列のコピー数を評価する工程
を含む、方法。
関数をデータ点に適合させる工程であって、各データ点は、予想被覆率を、ビンにおける検査サンプルに対する対応する被覆率に関連付けする、工程;
ビンにおける被覆率を該関数に適用することによって、関心対象の配列のビンにおける被覆率を調整する工程
を含む、請求項1記載の方法。
第1の閾値よりも高い、症候群分類またはコピー数変動をコールするための第1の値を有する検査サンプルを同定する工程;
初回のマルチプレックスシーケンシングよりも深いシーケンシング深度において、同定された検査サンプルを再シーケンシングして、再シーケンシングされたデータを獲得する工程;および
再シーケンシングされたデータを用いて症候群分類またはコピー数変動を判定する工程
をさらに含む、前記請求項のいずれか一項記載の方法。
再シーケンシングされたデータから、症候群分類またはコピー数変動をコールするための第2の値を獲得する工程;および
該第2の値を第2の閾値と比較する工程であって、該第2の閾値は第1の閾値よりも高い、工程
を含む、請求項33記載の方法。
前記同定された検査サンプルの第1の値は、公知の影響ありのサンプルと比較して相対的に低い、請求項33記載の方法。
(a)検査サンプルにおける細胞フリーDNAをシーケンシングすることによって獲得された配列読み取りを受け取る工程;
(b)検査サンプルの配列読み取りを、関心対象の配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する工程であって、該参照ゲノムは複数のビンに分割されている、工程;
(c)関心対象の配列を含め、参照ゲノムにおけるビンについて、検査配列タグの被覆率を決定する工程;
(d)検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた、影響なしのトレーニングサンプルのトレーニングセットから獲得された予想被覆率を採用することによって、ビンにおける検査配列タグの被覆率を調整する工程であって、該予想被覆率は、関心対象の配列内にあるビンの被覆率と相関することが見出された、関心対象の配列の外側にあるビンの被覆率を用いて獲得された、工程;および
(e)(d)からの調整された被覆率に基づき、検査サンプルにおける関心対象の配列のコピー数をコンピューターシステムによって評価する工程
のためのコードを含む、コンピュータープログラム製品。
(a)検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた、影響なしのトレーニングサンプルのトレーニングセットからデータを獲得する工程;および
(b)関心対象の配列の外側にあるビンの被覆率を用いて予想被覆率を決定する工程であって、関心対象の配列の外側にあるビンの被覆率は、関心対象の配列内にあるビンの被覆率と相関し、かつ関心対象の配列は、そのコピー数変動が遺伝的症候群と関連している染色体部分ゲノム領域である、工程
を含む、方法。
(i)トレーニングサンプルにおける細胞フリーDNAをシーケンシングすることによって獲得された配列読み取りを受け取る工程;
(ii)トレーニングサンプルの配列読み取りを、関心対象の配列を含む参照ゲノムにアラインメントし、それによってトレーニング配列タグを提供する工程であって、該参照ゲノムは複数のビンに分割されている、工程;および
(iii)関心対象の配列を含め、参照ゲノムにおけるビンについて、トレーニング配列タグの被覆率を決定する工程
をさらに含む、請求項39記載の方法。
(i)影響なしのトレーニングサンプルのトレーニングセットからトレーニング部分集団を同定する工程であって、該トレーニング部分集団のサンプルは、関心対象の配列の外側にあるビンにおけるそれらの被覆率において互いに相関する、工程、および
(ii)トレーニング部分集団のビンにおける被覆率から予想被覆率を獲得する工程
を含む、請求項39記載の方法。
該ビンにおける観察された被覆率を該関数に適用することによって、トレーニングサンプル配列のビンにおける被覆率を調整する工程
によって、トレーニングセットにおけるトレーニングサンプル配列の被覆率を調整する工程をさらに含む、請求項45記載の方法。
サンプルからの核酸配列情報を提供する検査サンプル由来の核酸を受け取るためのシーケンサー;
(a)検査サンプルにおける細胞フリーDNAをシーケンシングすることによって獲得された配列読み取りを受け取る作業;
(b)検査サンプルの配列読み取りを、関心対象の配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する作業であって、該参照ゲノムは複数のビンに分割されている、作業;
(c)関心対象の配列を含む参照ゲノムにおけるビンに対して、検査配列タグの被覆率を決定する作業;
(d)検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた、影響なしのトレーニングサンプルのトレーニングセットから獲得された予想被覆率を採用することによって、ビンにおける検査配列タグの被覆率を調整する作業であって、該予想被覆率は、関心対象の配列内にあるビンの被覆率と相関することが見出された、関心対象の配列の外側にあるビンの被覆率を用いて獲得された、作業;および
(e)(d)からの調整された被覆率に基づき、検査サンプルにおける関心対象の配列のコピー数をコンピューターシステムによって評価する作業
を実行するまたは引き起こすように設計されたまたは構成された論理回路
を含む、システム。
少なくとも一時的に、複数の該配列読み取りを保存するためのメモリー
をさらに含む、請求項50〜51のいずれか一項記載のシステム。
(d)の前に、トレーニングセットから獲得された包括的ウェーブプロファイルを適用することによって、検査配列タグの被覆率を調整する作業であって、該包括的ウェーブプロファイルは、トレーニングセットにわたって平均化された、参照ゲノムにおけるビンの被覆率を含む、作業
を実行するまたは引き起こすようにさらに設計されるまたは構成される、請求項50〜56のいずれか一項記載のシステム。
検査サンプルの1種または複数種の染色体のそれぞれについて配列量を算出することによって、1種または複数種の染色体のコピー数を評価する工程であって、該配列量は、1種または複数種の染色体における検査配列タグの検査サンプル被覆率を、正規化配列における検査配列タグの被覆率で割ることによって算出される、工程
を実行するまたは引き起こすようにさらに設計されるまたは構成される、請求項55記載のシステム。
関数をデータ点に適合させる工程であって、各データ点が、予想被覆率を、ビンにおける検査サンプルに対する対応する被覆率に関連付けする、工程;
該ビンにおける被覆率を該関数に適用することによって、関心対象の配列のビンにおける被覆率を調整する工程
を含む、請求項50記載のシステム。
検査配列タグの被覆率を非除外部位計数(NES計数)として提供する作業であって、NES計数は、非除外部位にマッピングされた非冗長の配列タグの数である、作業
を実行するまたは引き起こすようにさらに設計されるまたは構成される、請求項50〜77のいずれか一項記載のシステム。
第1の閾値よりも高い、症候群分類またはコピー数変動をコールするための第1の値を有する検査サンプルを同定する作業;
初回のマルチプレックスシーケンシングよりも深いシーケンシング深度において、同定された検査サンプルを再シーケンシングして、再シーケンシングされたデータを獲得する作業;および
再シーケンシングされたデータを用いて症候群分類またはコピー数変動を判定する作業
を実行するまたは引き起こすようにさらに設計されるまたは構成される、請求項50〜82のいずれか一項記載のシステム。
再シーケンシングされたデータから、症候群分類またはコピー数変動をコールするための第2の値を獲得する作業;および
該第2の値を第2の閾値と比較する作業であって、該第2の閾値は第1の閾値よりも高い、作業
によって、再シーケンシングされたデータを用いて症候群分類またはコピー数変動を判定する作業を実行するまたは引き起こすようにさらに設計されるまたは構成される、請求項83記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462005877P | 2014-05-30 | 2014-05-30 | |
US62/005,877 | 2014-05-30 | ||
PCT/US2015/033403 WO2015184404A1 (en) | 2014-05-30 | 2015-05-29 | Detecting fetal sub-chromosomal aneuploidies and copy number variations |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017524374A true JP2017524374A (ja) | 2017-08-31 |
JP2017524374A5 JP2017524374A5 (ja) | 2018-07-05 |
JP6659672B2 JP6659672B2 (ja) | 2020-03-04 |
Family
ID=53373661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017515036A Active JP6659672B2 (ja) | 2014-05-30 | 2015-05-29 | 胎児染色体部分異数性およびコピー数変動の検出 |
Country Status (10)
Country | Link |
---|---|
US (2) | US10318704B2 (ja) |
EP (2) | EP3690061A1 (ja) |
JP (1) | JP6659672B2 (ja) |
KR (1) | KR102566176B1 (ja) |
CN (1) | CN106795558B (ja) |
AU (1) | AU2015266665C1 (ja) |
BR (1) | BR112016027848A2 (ja) |
CA (1) | CA2950596C (ja) |
IL (1) | IL249095B2 (ja) |
WO (1) | WO2015184404A1 (ja) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9892230B2 (en) | 2012-03-08 | 2018-02-13 | The Chinese University Of Hong Kong | Size-based analysis of fetal or tumor DNA fraction in plasma |
EP3061021B1 (en) | 2013-10-21 | 2023-05-10 | Verinata Health, Inc. | Method for improving the sensitivity of detection in determining copy number variations |
IL249095B2 (en) | 2014-05-30 | 2023-10-01 | Verinata Health Inc | Detection of subchromosomal aneuploidy in the fetus and variations in the number of copies |
CN117402950A (zh) * | 2014-07-25 | 2024-01-16 | 华盛顿大学 | 确定导致无细胞dna的产生的组织和/或细胞类型的方法以及使用其鉴定疾病或紊乱的方法 |
CN107750277B (zh) * | 2014-12-12 | 2021-11-09 | 维里纳塔健康股份有限公司 | 使用无细胞dna片段大小来确定拷贝数变化 |
US10364467B2 (en) * | 2015-01-13 | 2019-07-30 | The Chinese University Of Hong Kong | Using size and number aberrations in plasma DNA for detecting cancer |
US10395759B2 (en) | 2015-05-18 | 2019-08-27 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
BE1023266B1 (nl) * | 2015-07-13 | 2017-01-17 | Cartagenia N.V. | Systeem en methodologie voor de analyse van genomische gegevens die zijn verkregen van een onderwerp |
AU2016321204B2 (en) | 2015-09-08 | 2022-12-01 | Cold Spring Harbor Laboratory | Genetic copy number determination using high throughput multiplex sequencing of smashed nucleotides |
CN108603228B (zh) * | 2015-12-17 | 2023-09-01 | 夸登特健康公司 | 通过分析无细胞dna确定肿瘤基因拷贝数的方法 |
US10095831B2 (en) * | 2016-02-03 | 2018-10-09 | Verinata Health, Inc. | Using cell-free DNA fragment size to determine copy number variations |
CN108885648A (zh) * | 2016-02-09 | 2018-11-23 | 托马生物科学公司 | 用于分析核酸的系统和方法 |
SG11201806812SA (en) * | 2016-02-12 | 2018-09-27 | Regeneron Pharma | Methods and systems for detection of abnormal karyotypes |
US20190287645A1 (en) * | 2016-07-06 | 2019-09-19 | Guardant Health, Inc. | Methods for fragmentome profiling of cell-free nucleic acids |
BR112019000296A2 (pt) * | 2016-07-06 | 2019-04-16 | Guardant Health, Inc. | métodos para a determinação de perfil de fragmentome de ácidos nucleicos livres de célula |
KR20220098812A (ko) * | 2016-09-22 | 2022-07-12 | 일루미나, 인코포레이티드 | 체세포 복제수 변이 검출 |
US11342047B2 (en) | 2017-04-21 | 2022-05-24 | Illumina, Inc. | Using cell-free DNA fragment size to detect tumor-associated variant |
WO2018227211A1 (en) * | 2017-06-09 | 2018-12-13 | Bellwether Bio, Inc. | Diagnosis of cancer or other physiological condition using circulating nucleic acid fragment sentinel endpoints |
EP3635133A4 (en) * | 2017-06-09 | 2021-03-03 | Bellwether Bio, Inc. | DETERMINATION OF THE TYPE OF CANCER IN A SUBJECT BY PROBABILISTIC MODELING OF END POINTS OF CIRCULATING NUCLEIC ACID FRAGMENT |
AU2018289410B2 (en) * | 2017-06-19 | 2024-06-13 | Invitae Corporation | Interpretation of genetic and genomic variants via an integrated computational and experimental deep mutational learning framework |
CN111094591A (zh) * | 2017-08-18 | 2020-05-01 | 皇家飞利浦有限公司 | 用于对生物分子进行测序的方法 |
WO2019046804A1 (en) * | 2017-09-01 | 2019-03-07 | Grail, Inc. | IDENTIFICATION OF FALSE POSITIVE VARIANTS USING A MODEL OF IMPORTANCE |
CN108733982B (zh) * | 2017-09-26 | 2021-02-19 | 上海凡迪基因科技有限公司 | 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备 |
US11728007B2 (en) * | 2017-11-30 | 2023-08-15 | Grail, Llc | Methods and systems for analyzing nucleic acid sequences using mappability analysis and de novo sequence assembly |
US20190295684A1 (en) * | 2018-03-22 | 2019-09-26 | The Regents Of The University Of Michigan | Method and apparatus for analysis of chromatin interaction data |
WO2019209884A1 (en) * | 2018-04-23 | 2019-10-31 | Grail, Inc. | Methods and systems for screening for conditions |
US20210130888A1 (en) * | 2018-05-07 | 2021-05-06 | Genemind Biosciences Company Limited | Method, apparatus, and system for detecting chromosome aneuploidy |
CN109030801B (zh) * | 2018-06-02 | 2021-08-20 | 宏葵生物(中国)股份有限公司 | 一种临床样本自动生化分析仪 |
CN109117703B (zh) * | 2018-06-13 | 2022-03-22 | 中山大学中山眼科中心 | 一种基于细粒度识别的混杂细胞种类鉴定方法 |
DE102018219483A1 (de) * | 2018-11-15 | 2020-05-20 | Robert Bosch Gmbh | Verfahren und Vorrichtung zur Analyse von biologischem Material |
KR102287096B1 (ko) * | 2019-01-04 | 2021-08-09 | 테라젠지놈케어 주식회사 | 모체 시료 중 태아 분획을 결정하는 방법 |
WO2020150258A1 (en) * | 2019-01-15 | 2020-07-23 | Luminist, Inc. | Methods and systems for detecting liver disease |
EP3987525A1 (en) * | 2019-06-21 | 2022-04-27 | CooperSurgical, Inc. | System and method for determining genetic relationships between a sperm provider, oocyte provider, and the respective conceptus |
EP4058185A4 (en) * | 2019-11-14 | 2023-11-29 | Bio-Rad Laboratories, Inc. | PARTITION-BASED DETERMINATION OF A TARGET COPY NUMBER FOR INDIVIDUAL CELLS BY AMPLIFICATION WITHOUT ENDPOINT |
US20240185955A1 (en) * | 2021-11-23 | 2024-06-06 | Chromatintech Beijing Co, Ltd | Method for generating an enhanced hi-c matrix, non-transitory computer readable medium storing a program for generating an enhanced hi-c matrix, method for identifying a structural chromatin aberration in an enhanced hi-c matrix, and methods for diagnosing and treating a medical condition or disease |
WO2023129936A1 (en) * | 2021-12-29 | 2023-07-06 | AiOnco, Inc. | System and method for text-based biological information processing with analysis refinement |
CN117331850B (zh) * | 2023-12-01 | 2024-03-15 | 云筑信息科技(成都)有限公司 | 一种将功能测试和接口自动化测试结合的测试方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130029852A1 (en) * | 2010-01-19 | 2013-01-31 | Verinata Health, Inc. | Detecting and classifying copy number variation |
WO2013109981A1 (en) * | 2012-01-20 | 2013-07-25 | Sequenom, Inc. | Diagnostic processes that factor experimental conditions |
JP2016539630A (ja) * | 2013-10-21 | 2016-12-22 | ベリナタ ヘルス インコーポレイテッド | コピー数変動を決定することにおける検出の感度を向上させるための方法 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100216153A1 (en) | 2004-02-27 | 2010-08-26 | Helicos Biosciences Corporation | Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities |
EP1910537A1 (en) | 2005-06-06 | 2008-04-16 | 454 Life Sciences Corporation | Paired end sequencing |
WO2008045505A2 (en) | 2006-10-10 | 2008-04-17 | Xenomics, Inc. | Compositions, methods and kits for isolating nucleic acids from body fluids using anion exchange media |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
JP2010539991A (ja) | 2007-10-04 | 2010-12-24 | ハルシオン モレキュラー | 電子顕微鏡を用いた核酸ポリマーの配列決定 |
WO2009051842A2 (en) | 2007-10-18 | 2009-04-23 | The Johns Hopkins University | Detection of cancer by measuring genomic copy number and strand length in cell-free dna |
CA3069077C (en) | 2008-09-20 | 2022-03-22 | The Board Of Trustees Of The Leland Stanford Junior University | Noninvasive diagnosis of fetal aneuploidy by sequencing |
EP3406737B1 (en) | 2009-11-06 | 2023-05-31 | The Chinese University of Hong Kong | Size-based genomic analysis |
EP2591433A4 (en) | 2010-07-06 | 2017-05-17 | Life Technologies Corporation | Systems and methods to detect copy number variation |
US9029103B2 (en) | 2010-08-27 | 2015-05-12 | Illumina Cambridge Limited | Methods for sequencing polynucleotides |
US8725422B2 (en) | 2010-10-13 | 2014-05-13 | Complete Genomics, Inc. | Methods for estimating genome-wide copy number variations |
US9411937B2 (en) | 2011-04-15 | 2016-08-09 | Verinata Health, Inc. | Detecting and classifying copy number variation |
WO2012162884A1 (zh) | 2011-05-31 | 2012-12-06 | 北京贝瑞和康生物技术有限公司 | 检测胚胎或肿瘤染色体拷贝数的试剂盒、装置和方法 |
KR101489568B1 (ko) | 2011-06-29 | 2015-02-03 | 비지아이 헬스 서비스 코포레이션 리미티드 | 태아 유전학적 이상의 비침습성 검출 |
AU2011373694A1 (en) * | 2011-07-26 | 2013-05-02 | Verinata Health, Inc. | Method for determining the presence or absence of different aneuploidies in a sample |
US9367663B2 (en) | 2011-10-06 | 2016-06-14 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
DK2772549T3 (da) * | 2011-12-31 | 2019-08-19 | Bgi Genomics Co Ltd | Fremgangsmåde til detektering af genetisk variation |
US9892230B2 (en) | 2012-03-08 | 2018-02-13 | The Chinese University Of Hong Kong | Size-based analysis of fetal or tumor DNA fraction in plasma |
CN103374518B (zh) * | 2012-04-12 | 2018-03-27 | 维里纳塔健康公司 | 拷贝数变异的检测和分类 |
US10504613B2 (en) | 2012-12-20 | 2019-12-10 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US9920361B2 (en) | 2012-05-21 | 2018-03-20 | Sequenom, Inc. | Methods and compositions for analyzing nucleic acid |
EP2877594B1 (en) | 2012-07-20 | 2019-12-04 | Verinata Health, Inc. | Detecting and classifying copy number variation in a fetal genome |
PT2893040T (pt) | 2012-09-04 | 2019-04-01 | Guardant Health Inc | Métodos para deteção de mutações raras e de variação do número de cópias |
EP3882362B1 (en) | 2013-03-15 | 2024-05-08 | Guardant Health, Inc. | Methods for sequencing of cell free polynucleotides |
US10415083B2 (en) | 2013-10-28 | 2019-09-17 | The Translational Genomics Research Institute | Long insert-based whole genome sequencing |
IL249095B2 (en) | 2014-05-30 | 2023-10-01 | Verinata Health Inc | Detection of subchromosomal aneuploidy in the fetus and variations in the number of copies |
CN107750277B (zh) | 2014-12-12 | 2021-11-09 | 维里纳塔健康股份有限公司 | 使用无细胞dna片段大小来确定拷贝数变化 |
US10095831B2 (en) | 2016-02-03 | 2018-10-09 | Verinata Health, Inc. | Using cell-free DNA fragment size to determine copy number variations |
-
2015
- 2015-05-29 IL IL249095A patent/IL249095B2/en unknown
- 2015-05-29 EP EP20164915.9A patent/EP3690061A1/en active Pending
- 2015-05-29 AU AU2015266665A patent/AU2015266665C1/en active Active
- 2015-05-29 KR KR1020167036900A patent/KR102566176B1/ko active IP Right Grant
- 2015-05-29 CA CA2950596A patent/CA2950596C/en active Active
- 2015-05-29 BR BR112016027848A patent/BR112016027848A2/pt not_active Application Discontinuation
- 2015-05-29 CN CN201580041925.3A patent/CN106795558B/zh active Active
- 2015-05-29 EP EP15728356.5A patent/EP3149199B1/en active Active
- 2015-05-29 JP JP2017515036A patent/JP6659672B2/ja active Active
- 2015-05-29 US US14/726,183 patent/US10318704B2/en active Active
- 2015-05-29 WO PCT/US2015/033403 patent/WO2015184404A1/en active Application Filing
-
2019
- 2019-04-25 US US16/395,066 patent/US20190318805A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130029852A1 (en) * | 2010-01-19 | 2013-01-31 | Verinata Health, Inc. | Detecting and classifying copy number variation |
WO2013109981A1 (en) * | 2012-01-20 | 2013-07-25 | Sequenom, Inc. | Diagnostic processes that factor experimental conditions |
JP2016539630A (ja) * | 2013-10-21 | 2016-12-22 | ベリナタ ヘルス インコーポレイテッド | コピー数変動を決定することにおける検出の感度を向上させるための方法 |
Also Published As
Publication number | Publication date |
---|---|
CA2950596A1 (en) | 2015-12-03 |
KR102566176B1 (ko) | 2023-08-10 |
CN106795558A (zh) | 2017-05-31 |
WO2015184404A1 (en) | 2015-12-03 |
AU2015266665A1 (en) | 2016-12-22 |
EP3690061A1 (en) | 2020-08-05 |
AU2015266665C1 (en) | 2021-12-23 |
CA2950596C (en) | 2023-10-31 |
IL249095A0 (en) | 2017-01-31 |
EP3149199B1 (en) | 2020-03-25 |
US20190318805A1 (en) | 2019-10-17 |
KR20170016393A (ko) | 2017-02-13 |
JP6659672B2 (ja) | 2020-03-04 |
US10318704B2 (en) | 2019-06-11 |
BR112016027848A2 (pt) | 2017-08-22 |
AU2015266665B2 (en) | 2021-08-19 |
EP3149199A1 (en) | 2017-04-05 |
US20160019338A1 (en) | 2016-01-21 |
IL249095B2 (en) | 2023-10-01 |
IL249095B1 (en) | 2023-06-01 |
CN106795558B (zh) | 2020-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020200728B2 (en) | Method for improving the sensitivity of detection in determining copy number variations | |
JP6659672B2 (ja) | 胎児染色体部分異数性およびコピー数変動の検出 | |
JP7021148B2 (ja) | 性染色体におけるコピー数変異を判定するための方法 | |
KR102184868B1 (ko) | 카피수 변이를 판정하기 위한 dna 단편 크기의 사용 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170106 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180523 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190418 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190716 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6659672 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |