JP6534191B2 - コピー数変動を決定することにおける検出の感度を向上させるための方法 - Google Patents
コピー数変動を決定することにおける検出の感度を向上させるための方法 Download PDFInfo
- Publication number
- JP6534191B2 JP6534191B2 JP2016525007A JP2016525007A JP6534191B2 JP 6534191 B2 JP6534191 B2 JP 6534191B2 JP 2016525007 A JP2016525007 A JP 2016525007A JP 2016525007 A JP2016525007 A JP 2016525007A JP 6534191 B2 JP6534191 B2 JP 6534191B2
- Authority
- JP
- Japan
- Prior art keywords
- coverage
- sequence
- sample
- interest
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 403
- 230000035945 sensitivity Effects 0.000 title description 18
- 238000001514 detection method Methods 0.000 title description 16
- 210000000349 chromosome Anatomy 0.000 claims description 523
- 238000012360 testing method Methods 0.000 claims description 376
- 150000007523 nucleic acids Chemical group 0.000 claims description 311
- 238000012549 training Methods 0.000 claims description 231
- 238000012163 sequencing technique Methods 0.000 claims description 224
- 102000039446 nucleic acids Human genes 0.000 claims description 206
- 108020004707 nucleic acids Proteins 0.000 claims description 206
- 108020004414 DNA Proteins 0.000 claims description 195
- 238000012937 correction Methods 0.000 claims description 147
- 230000001605 fetal effect Effects 0.000 claims description 119
- 230000008774 maternal effect Effects 0.000 claims description 117
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 104
- 210000004027 cell Anatomy 0.000 claims description 104
- 230000008569 process Effects 0.000 claims description 101
- 239000000203 mixture Substances 0.000 claims description 48
- 230000000873 masking effect Effects 0.000 claims description 46
- 238000009826 distribution Methods 0.000 claims description 44
- 238000013507 mapping Methods 0.000 claims description 28
- 238000011156 evaluation Methods 0.000 claims description 15
- 230000000694 effects Effects 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000007620 mathematical function Methods 0.000 claims description 10
- 238000007689 inspection Methods 0.000 claims description 8
- 230000015654 memory Effects 0.000 claims description 7
- 238000012417 linear regression Methods 0.000 claims description 5
- 230000014759 maintenance of location Effects 0.000 claims description 2
- 239000000523 sample Substances 0.000 description 675
- 102000053602 DNA Human genes 0.000 description 192
- 230000002759 chromosomal effect Effects 0.000 description 165
- 208000036878 aneuploidy Diseases 0.000 description 156
- 231100001075 aneuploidy Toxicity 0.000 description 150
- NOIRDLRUNWIUMX-UHFFFAOYSA-N 2-amino-3,7-dihydropurin-6-one;6-amino-1h-pyrimidin-2-one Chemical compound NC=1C=CNC(=O)N=1.O=C1NC(N)=NC2=C1NC=N2 NOIRDLRUNWIUMX-UHFFFAOYSA-N 0.000 description 122
- 239000003550 marker Substances 0.000 description 69
- 238000004458 analytical method Methods 0.000 description 59
- 239000012634 fragment Substances 0.000 description 52
- 238000012217 deletion Methods 0.000 description 45
- 230000037430 deletion Effects 0.000 description 45
- 210000002381 plasma Anatomy 0.000 description 45
- 241000282414 Homo sapiens Species 0.000 description 42
- 208000037280 Trisomy Diseases 0.000 description 40
- 210000002593 Y chromosome Anatomy 0.000 description 40
- 238000010606 normalization Methods 0.000 description 39
- 238000012545 processing Methods 0.000 description 39
- 239000002773 nucleotide Substances 0.000 description 35
- 125000003729 nucleotide group Chemical group 0.000 description 35
- 210000003754 fetus Anatomy 0.000 description 33
- 230000036961 partial effect Effects 0.000 description 33
- 210000004369 blood Anatomy 0.000 description 31
- 239000008280 blood Substances 0.000 description 31
- 201000010374 Down Syndrome Diseases 0.000 description 30
- 108090000623 proteins and genes Proteins 0.000 description 30
- 230000003321 amplification Effects 0.000 description 28
- 238000003199 nucleic acid amplification method Methods 0.000 description 28
- 102000040430 polynucleotide Human genes 0.000 description 27
- 108091033319 polynucleotide Proteins 0.000 description 27
- 239000002157 polynucleotide Substances 0.000 description 27
- 208000011580 syndromic disease Diseases 0.000 description 27
- 206010044688 Trisomy 21 Diseases 0.000 description 26
- 238000002360 preparation method Methods 0.000 description 26
- 238000012369 In process control Methods 0.000 description 25
- 239000012472 biological sample Substances 0.000 description 25
- 210000004544 dc2 Anatomy 0.000 description 25
- 238000004190 ion pair chromatography Methods 0.000 description 25
- 230000001976 improved effect Effects 0.000 description 24
- 238000007481 next generation sequencing Methods 0.000 description 23
- 238000003745 diagnosis Methods 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 22
- 239000011324 bead Substances 0.000 description 20
- 239000000047 product Substances 0.000 description 20
- 208000031639 Chromosome Deletion Diseases 0.000 description 18
- 206010028980 Neoplasm Diseases 0.000 description 18
- 230000002068 genetic effect Effects 0.000 description 18
- 208000034790 Twin pregnancy Diseases 0.000 description 17
- 201000011510 cancer Diseases 0.000 description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 17
- 239000003153 chemical reaction reagent Substances 0.000 description 15
- 210000002966 serum Anatomy 0.000 description 15
- 230000035772 mutation Effects 0.000 description 14
- 239000013060 biological fluid Substances 0.000 description 13
- 238000013467 fragmentation Methods 0.000 description 13
- 238000006062 fragmentation reaction Methods 0.000 description 13
- 229920002477 rna polymer Polymers 0.000 description 13
- 210000001519 tissue Anatomy 0.000 description 13
- 208000026928 Turner syndrome Diseases 0.000 description 12
- 230000005856 abnormality Effects 0.000 description 12
- 238000000746 purification Methods 0.000 description 12
- 238000001712 DNA sequencing Methods 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 11
- 239000012530 fluid Substances 0.000 description 11
- 150000002500 ions Chemical class 0.000 description 11
- 208000030454 monosomy Diseases 0.000 description 11
- 230000035935 pregnancy Effects 0.000 description 11
- 230000009897 systematic effect Effects 0.000 description 11
- 206010053884 trisomy 18 Diseases 0.000 description 11
- 210000002700 urine Anatomy 0.000 description 11
- 201000006360 Edwards syndrome Diseases 0.000 description 10
- 206010036790 Productive cough Diseases 0.000 description 10
- 208000007159 Trisomy 18 Syndrome Diseases 0.000 description 10
- 238000001574 biopsy Methods 0.000 description 10
- 201000010099 disease Diseases 0.000 description 10
- 238000001914 filtration Methods 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 210000003802 sputum Anatomy 0.000 description 10
- 208000024794 sputum Diseases 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 210000001766 X chromosome Anatomy 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 9
- 108091092356 cellular DNA Proteins 0.000 description 9
- 230000007717 exclusion Effects 0.000 description 9
- 230000036541 health Effects 0.000 description 9
- 230000000670 limiting effect Effects 0.000 description 9
- 238000003793 prenatal diagnosis Methods 0.000 description 9
- 210000001138 tear Anatomy 0.000 description 9
- 208000016679 Monosomy X Diseases 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 201000009928 Patau syndrome Diseases 0.000 description 8
- 108091093037 Peptide nucleic acid Proteins 0.000 description 8
- 206010044686 Trisomy 13 Diseases 0.000 description 8
- 208000006284 Trisomy 13 Syndrome Diseases 0.000 description 8
- 238000005119 centrifugation Methods 0.000 description 8
- -1 morpholino nucleic acid Chemical class 0.000 description 8
- 238000013439 planning Methods 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 102000004594 DNA Polymerase I Human genes 0.000 description 7
- 108010017826 DNA Polymerase I Proteins 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 7
- 230000002559 cytogenic effect Effects 0.000 description 7
- 238000009795 derivation Methods 0.000 description 7
- 208000035475 disorder Diseases 0.000 description 7
- 238000010348 incorporation Methods 0.000 description 7
- 210000003296 saliva Anatomy 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 6
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 6
- 208000031404 Chromosome Aberrations Diseases 0.000 description 6
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 6
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 230000003322 aneuploid effect Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 238000004113 cell culture Methods 0.000 description 6
- 239000002299 complementary DNA Substances 0.000 description 6
- 239000000975 dye Substances 0.000 description 6
- 238000001962 electrophoresis Methods 0.000 description 6
- 210000003917 human chromosome Anatomy 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 239000013610 patient sample Substances 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 210000003765 sex chromosome Anatomy 0.000 description 6
- 230000005945 translocation Effects 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 208000026350 Inborn Genetic disease Diseases 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000009223 counseling Methods 0.000 description 5
- 238000007405 data analysis Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 5
- 238000010790 dilution Methods 0.000 description 5
- 239000012895 dilution Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 208000016361 genetic disease Diseases 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 210000005259 peripheral blood Anatomy 0.000 description 5
- 239000011886 peripheral blood Substances 0.000 description 5
- 239000013641 positive control Substances 0.000 description 5
- 210000004243 sweat Anatomy 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 208000010543 22q11.2 deletion syndrome Diseases 0.000 description 4
- 208000000398 DiGeorge Syndrome Diseases 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- 208000036626 Mental retardation Diseases 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 208000028831 congenital heart disease Diseases 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 239000007850 fluorescent dye Substances 0.000 description 4
- 238000007672 fourth generation sequencing Methods 0.000 description 4
- 235000020256 human milk Nutrition 0.000 description 4
- 210000004251 human milk Anatomy 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 210000003734 kidney Anatomy 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000003278 mimic effect Effects 0.000 description 4
- 210000003205 muscle Anatomy 0.000 description 4
- 238000002203 pretreatment Methods 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000007841 sequencing by ligation Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 208000026817 47,XYY syndrome Diseases 0.000 description 3
- 206010003445 Ascites Diseases 0.000 description 3
- 208000002330 Congenital Heart Defects Diseases 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- 206010019280 Heart failures Diseases 0.000 description 3
- 201000006347 Intellectual Disability Diseases 0.000 description 3
- 208000034702 Multiple pregnancies Diseases 0.000 description 3
- 201000001388 Smith-Magenis syndrome Diseases 0.000 description 3
- 206010053871 Trisomy 8 Diseases 0.000 description 3
- 206010071547 Trisomy 9 Diseases 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 210000001061 forehead Anatomy 0.000 description 3
- 238000012224 gene deletion Methods 0.000 description 3
- 238000013412 genome amplification Methods 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 230000003902 lesion Effects 0.000 description 3
- 230000036244 malformation Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 208000002254 stillbirth Diseases 0.000 description 3
- 231100000537 stillbirth Toxicity 0.000 description 3
- 230000008093 supporting effect Effects 0.000 description 3
- 230000031068 symbiosis, encompassing mutualism through parasitism Effects 0.000 description 3
- 208000034298 trisomy chromosome 8 Diseases 0.000 description 3
- 238000012176 true single molecule sequencing Methods 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- 208000009575 Angelman syndrome Diseases 0.000 description 2
- 206010003805 Autism Diseases 0.000 description 2
- 208000020706 Autistic disease Diseases 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 208000011359 Chromosome disease Diseases 0.000 description 2
- 208000032170 Congenital Abnormalities Diseases 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 206010012559 Developmental delay Diseases 0.000 description 2
- 208000012239 Developmental disease Diseases 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- 238000006424 Flood reaction Methods 0.000 description 2
- 206010021118 Hypotonia Diseases 0.000 description 2
- 208000004706 Jacobsen Distal 11q Deletion Syndrome Diseases 0.000 description 2
- 208000030979 Language Development disease Diseases 0.000 description 2
- 208000010961 Monosomy 21 Diseases 0.000 description 2
- 208000019209 Monosomy 22 Diseases 0.000 description 2
- 208000007379 Muscle Hypotonia Diseases 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 206010068786 Overlap syndrome Diseases 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 2
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 2
- 201000010769 Prader-Willi syndrome Diseases 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 101000757182 Saccharomyces cerevisiae Glucoamylase S2 Proteins 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 230000001594 aberrant effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 238000002669 amniocentesis Methods 0.000 description 2
- 210000004381 amniotic fluid Anatomy 0.000 description 2
- 230000036528 appetite Effects 0.000 description 2
- 235000019789 appetite Nutrition 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000004630 atomic force microscopy Methods 0.000 description 2
- 238000000889 atomisation Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000007698 birth defect Effects 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 210000002230 centromere Anatomy 0.000 description 2
- 210000004252 chorionic villi Anatomy 0.000 description 2
- 208000024971 chromosomal disease Diseases 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 210000000744 eyelid Anatomy 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 238000010448 genetic screening Methods 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 238000007901 in situ hybridization Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 210000002011 intestinal secretion Anatomy 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 231100000533 low birth weight Toxicity 0.000 description 2
- 208000018773 low birth weight Diseases 0.000 description 2
- 210000002751 lymph Anatomy 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000013188 needle biopsy Methods 0.000 description 2
- 230000005257 nucleotidylation Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 150000002972 pentoses Chemical group 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 150000004713 phosphodiesters Chemical group 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 238000009598 prenatal testing Methods 0.000 description 2
- 235000018102 proteins Nutrition 0.000 description 2
- 230000001850 reproductive effect Effects 0.000 description 2
- 230000000241 respiratory effect Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 201000000980 schizophrenia Diseases 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 208000000995 spontaneous abortion Diseases 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 108091035539 telomere Proteins 0.000 description 2
- 102000055501 telomere Human genes 0.000 description 2
- 210000003411 telomere Anatomy 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000004627 transmission electron microscopy Methods 0.000 description 2
- 206010044689 trisomy 22 Diseases 0.000 description 2
- 208000026485 trisomy X Diseases 0.000 description 2
- 210000003954 umbilical cord Anatomy 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- AZUYLZMQTIKGSC-UHFFFAOYSA-N 1-[6-[4-(5-chloro-6-methyl-1H-indazol-4-yl)-5-methyl-3-(1-methylindazol-5-yl)pyrazol-1-yl]-2-azaspiro[3.3]heptan-2-yl]prop-2-en-1-one Chemical compound ClC=1C(=C2C=NNC2=CC=1C)C=1C(=NN(C=1C)C1CC2(CN(C2)C(C=C)=O)C1)C=1C=C2C=NN(C2=CC=1)C AZUYLZMQTIKGSC-UHFFFAOYSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical compound NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- IRLPACMLTUPBCL-KQYNXXCUSA-N 5'-adenylyl sulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OS(O)(=O)=O)[C@@H](O)[C@H]1O IRLPACMLTUPBCL-KQYNXXCUSA-N 0.000 description 1
- 208000017976 8p23.1 duplication syndrome Diseases 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 208000006096 Attention Deficit Disorder with Hyperactivity Diseases 0.000 description 1
- 208000036864 Attention deficit/hyperactivity disease Diseases 0.000 description 1
- 208000025637 Autosomal monosomy Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 208000002177 Cataract Diseases 0.000 description 1
- 208000010693 Charcot-Marie-Tooth Disease Diseases 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 206010009269 Cleft palate Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 208000029767 Congenital, Hereditary, and Neonatal Diseases and Abnormalities Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 206010010904 Convulsion Diseases 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 206010066054 Dysmorphism Diseases 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 101710181043 Endonuclease 2 Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 208000034951 Genetic Translocation Diseases 0.000 description 1
- 108091093094 Glycol nucleic acid Proteins 0.000 description 1
- 241000691979 Halcyon Species 0.000 description 1
- 208000036818 High risk pregnancy Diseases 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 208000029279 Jacobsen Syndrome Diseases 0.000 description 1
- 208000030653 Jaw disease Diseases 0.000 description 1
- 206010023230 Joint stiffness Diseases 0.000 description 1
- 208000017924 Klinefelter Syndrome Diseases 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 208000035752 Live birth Diseases 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 208000037699 Monosomy 18p Diseases 0.000 description 1
- 208000010610 Mosaic trisomy 8 Diseases 0.000 description 1
- 101100113998 Mus musculus Cnbd2 gene Proteins 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 208000003019 Neurofibromatosis 1 Diseases 0.000 description 1
- 208000024834 Neurofibromatosis type 1 Diseases 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 101150038744 PMP22 gene Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 208000002151 Pleural effusion Diseases 0.000 description 1
- 208000032236 Predisposition to disease Diseases 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 208000035415 Reinfection Diseases 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101000804877 Schizosaccharomyces pombe (strain 972 / ATCC 24843) 5'-3' exoribonuclease 1 Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 208000036623 Severe mental retardation Diseases 0.000 description 1
- 208000020221 Short stature Diseases 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 208000020741 Tetrasomy 12p Diseases 0.000 description 1
- 101100388071 Thermococcus sp. (strain GE8) pol gene Proteins 0.000 description 1
- 108091046915 Threose nucleic acid Proteins 0.000 description 1
- 206010062757 Trisomy 15 Diseases 0.000 description 1
- 206010053925 Trisomy 17 Diseases 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 208000000260 Warts Diseases 0.000 description 1
- 206010049644 Williams syndrome Diseases 0.000 description 1
- 208000006254 Wolf-Hirschhorn Syndrome Diseases 0.000 description 1
- 206010056894 XYY syndrome Diseases 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 208000029560 autism spectrum disease Diseases 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000003851 biochemical process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 150000003857 carboxamides Chemical class 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 208000015241 chromosome 13q trisomy Diseases 0.000 description 1
- 208000004664 chromosome 18p deletion syndrome Diseases 0.000 description 1
- 108091092240 circulating cell-free DNA Proteins 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 206010009259 cleft lip Diseases 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- QTCANKDTWWSCMR-UHFFFAOYSA-N costic aldehyde Natural products C1CCC(=C)C2CC(C(=C)C=O)CCC21C QTCANKDTWWSCMR-UHFFFAOYSA-N 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 208000022734 developmental defect during embryogenesis Diseases 0.000 description 1
- 231100000020 developmental retardation Toxicity 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 231100001129 embryonic lethality Toxicity 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N ethylene glycol Natural products OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000002550 fecal effect Effects 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- LIYGYAHYXQDGEP-UHFFFAOYSA-N firefly oxyluciferin Natural products Oc1csc(n1)-c1nc2ccc(O)cc2s1 LIYGYAHYXQDGEP-UHFFFAOYSA-N 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 230000010370 hearing loss Effects 0.000 description 1
- 231100000888 hearing loss Toxicity 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 208000031169 hemorrhagic disease Diseases 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 208000000509 infertility Diseases 0.000 description 1
- 231100000535 infertility Toxicity 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003426 interchromosomal effect Effects 0.000 description 1
- 230000003601 intercostal effect Effects 0.000 description 1
- ISTFUJWTQAMRGA-UHFFFAOYSA-N iso-beta-costal Natural products C1C(C(=C)C=O)CCC2(C)CCCC(C)=C21 ISTFUJWTQAMRGA-UHFFFAOYSA-N 0.000 description 1
- 201000003723 learning disability Diseases 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000008376 long-term health Effects 0.000 description 1
- 235000019689 luncheon sausage Nutrition 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 208000004141 microcephaly Diseases 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000003188 neurobehavioral effect Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000002232 neuromuscular Effects 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 201000003738 orofaciodigital syndrome VIII Diseases 0.000 description 1
- 230000027758 ovulation cycle Effects 0.000 description 1
- JJVOROULKOMTKG-UHFFFAOYSA-N oxidized Photinus luciferin Chemical compound S1C2=CC(O)=CC=C2N=C1C1=NC(=O)CS1 JJVOROULKOMTKG-UHFFFAOYSA-N 0.000 description 1
- 210000003254 palate Anatomy 0.000 description 1
- 230000001314 paroxysmal effect Effects 0.000 description 1
- 208000014689 partial deletion of chromosome 10 Diseases 0.000 description 1
- 208000014813 partial deletion of chromosome 18 Diseases 0.000 description 1
- 208000014690 partial deletion of chromosome 5 Diseases 0.000 description 1
- 208000011306 partial deletion of the short arm of chromosome 10 Diseases 0.000 description 1
- 208000034352 partial segmental duplication Diseases 0.000 description 1
- 230000032696 parturition Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 208000036897 pentasomy Diseases 0.000 description 1
- 208000024335 physical disease Diseases 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 230000003169 placental effect Effects 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 230000031893 sensory processing Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 231100001055 skeletal defect Toxicity 0.000 description 1
- 201000010153 skin papilloma Diseases 0.000 description 1
- 210000003625 skull Anatomy 0.000 description 1
- 201000002859 sleep apnea Diseases 0.000 description 1
- 208000019116 sleep disease Diseases 0.000 description 1
- 108010062513 snake venom phosphodiesterase I Proteins 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010972 statistical evaluation Methods 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 208000011908 tetrasomy Diseases 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical group [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 206010043554 thrombocytopenia Diseases 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 210000001215 vagina Anatomy 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 239000002569 water oil cream Substances 0.000 description 1
- 230000036266 weeks of gestation Effects 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Public Health (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Organic Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Description
本出願は、米国特許法第119条(e)の下で、METHOD FOR IMPROVING THE SENSITIVITY OF DETECTION IN DETERMINING COPY NUMBER VARIATIONSと題され、2013年10月21日に提出された米国仮特許出願第61/893,830号に対する恩典を主張するものであり、それはすべての目的のために参照によりその全体として本明細書に組み入れられる。
ヒト医学研究における重大な試みの1つは、有害な健康上の影響をもたらす遺伝子異常の発見である。多くの場合、特異的な遺伝子および/または重大な診断マーカーが、異常なコピー数で存在している、ゲノムの一部分において同定されている。例えば、出生前診断において、染色体全体の余分なまたは欠損したコピーは、高頻度で起こる遺伝学的病変である。癌において、染色体全体または染色体セグメントのコピーの欠失または増倍、およびゲノムの特異的領域のより高レベルな増幅はよく見られることである。
いくつかの態様において、任意の胎児異数性のコピー数変動(CNV)、および多様な医学的状態と関連することが知られるまたは疑われるCNVを判定するための方法が提供される。該方法は、ゲノム配列のGCのゆらぎに関係したノイズおよび誤差を低下させるためのメカニズムを含む。本方法に従って判定され得るCNVには、第1〜22、X、およびY染色体のうちのいずれか1種または複数種のトリソミーおよびモノソミー、他の染色体ポリソミー、ならびに該染色体のうちのいずれか1つまたは複数のセグメントの欠失および/または重複が含まれる。
ya=切片+傾き*gwpa
式中、yaは、1種または複数種のロバストな染色体または領域における検査サンプルに対するビンaの被覆率であり、かつgwpaは、影響なしのトレーニングサンプルに対するビンaに対しての全体プロファイルである。次いで、過程は、
zb=yb/(切片+傾き*gwpb)−1
式中、ybは、関心対象の配列(ロバストな染色体または領域の外側にあり得る)における検査サンプルに対するビンbの観察される被覆率であり、かつgwpbは、影響なしのトレーニングサンプルに対するビンbに対しての全体プロファイルである、
として、関心対象の配列または領域に対する全体プロファイル補正被覆率zbを計算する。分母(切片+傾き*gwpb)は、影響なしの検査サンプルにおいて観察されるはずである、ビンbに対する被覆率である。コピー数変動を持する関心対象の配列の場合、観察される被覆率、およびそれゆえビンbに対する全体プロファイル補正被覆率値は、影響なしのサンプルの被覆率から有意に逸脱すると考えられる。例えば、補正された被覆率zbは、影響ありの染色体上のビンに関してトリソミーサンプルの場合、胎児画分に比例すると考えられる。この過程は、ロバストな染色体に関する切片および傾きを計算することによってサンプル内で正規化し、次いで、標的染色体(または他の関心対象の配列)が、同じサンプル内のロバストな染色体に対して保たれる関係性(傾きおよび切片によって記載される)からどれくらい逸脱するかを評価する。
[本発明1001]
検査サンプルにおける関心対象の核酸配列のコピー数についての評価のための、1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムで実践される方法であって、
(a)コンピューターシステムで、検査サンプルから核酸シーケンサーによって獲得された配列読み取りを提供する工程であって、検査サンプルは、1種または複数種のゲノム由来の核酸分子を含む、工程;
(b)コンピューターシステムによって、検査サンプルの配列読み取りを、関心対象の核酸配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する工程;
(c)コンピューターシステムによって、各ビンに位置する検査配列タグの被覆率を決定する工程であって、参照ゲノムが複数のビンに分割されており、かつ該被覆率はビンにおける配列タグの存在度を示す、工程;
(d)コンピューターシステムによって、関心対象の核酸配列に対して全体プロファイルを提供する工程であって、該全体プロファイルは、各ビンにおける予想被覆率を含み、かつ該予想被覆率は、検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた核酸分子を含む、影響なしのトレーニングサンプルのトレーニングセットから獲得され、該予想被覆率はビンごとに変動を呈する、工程;
(e)コンピューターシステムによって、少なくとも関心対象の核酸配列の各ビンにおける予想被覆率を用いて、検査配列タグの被覆率を調整し、それによって関心対象の核酸配列に対する全体プロファイル補正被覆率を獲得する工程;
(f)コンピューターシステムによって、GC含有量レベルと全体プロファイル補正被覆率との間の関係に基づき、全体プロファイル補正被覆率を調整し、それによって関心対象の核酸配列に対するサンプルGC補正被覆率を獲得する工程;および
(g)コンピューターシステムによって、サンプルGC補正被覆率に基づき、検査サンプルにおける関心対象の核酸配列のコピー数を評価する工程であって、該サンプルGC補正被覆率は、関心対象の核酸配列のコピー数を決定するためのシグナルレベルを向上させかつ/またはノイズレベルを低下させる、工程
を含む、方法。
[本発明1002]
配列読み取りを提供する工程の前に、シーケンサーを用いて検査サンプル由来の核酸をシーケンシングし、それによって配列読み取りを生成する工程をさらに含む、前記本発明の方法。
[本発明1003]
核酸をシーケンシングする前に、マーカー核酸と検査サンプルとを組み合わせる工程をさらに含む、本発明1002の方法。
[本発明1004]
マーカー核酸は、天然に存在するデオキシリボ核酸、天然に存在するリボ核酸、ペプチド核酸(PNA)、モルフォリノ核酸、ロックド核酸、グリコール核酸、トレオース核酸、およびそれらの任意の組み合わせからなる群より選択される、本発明1003の方法。
[本発明1005]
配列読み取りを、妊娠女性の細胞フリーDNAおよび該妊娠女性によって保持された胎児の細胞フリーDNAの配列から獲得する、本発明1001の方法。
[本発明1006]
マスキングされたビンにおける被覆率を検討から除外する配列マスクを適用する工程をさらに含む、本発明1001の方法。
[本発明1007]
配列マスクを、
コンピューターシステムで、複数の影響なしのトレーニングサンプルからの配列読み取りを含むトレーニングセットを提供する工程;
コンピューターシステムによって、トレーニングセットの配列読み取りを参照ゲノムにアラインメントし、それによってトレーニングサンプルに対してトレーニング配列タグを提供する工程;
コンピューターシステムによって、参照ゲノムを複数のビンに分割する工程;
コンピューターシステムによって、各トレーニングサンプルに対して各ビンにおけるトレーニング配列タグの被覆率を決定する工程;ならびに
コンピューターシステムによって、マスキングされていないおよびマスキングされたビンを含む配列マスクを創出する工程であって、マスキングされた各ビンは、マスキング閾値を超える分布指標を有し、該分布指標はトレーニングサンプルの被覆率の分布に関係している、工程
を含む方法によって獲得する、本発明1006の方法。
[本発明1008]
配列マスクを創出する前に、各ビンにおける予想被覆率に従ってトレーニング配列タグの被覆率を調整し、それによってビンにおけるトレーニング配列タグの全体プロファイル補正被覆率を獲得し、次いでそれを用いて配列マスクを創出する工程をさらに含む、本発明1007の方法。
[本発明1009]
分布指標はトレーニングサンプルの被覆率の分散に数学的に関係している、本発明1007の方法。
[本発明1010]
分布指標は変動係数である、本発明1009の方法。
[本発明1011]
関心対象の核酸配列上のマスキングされたビンは第1のマスキング閾値を有し、かつ正規化配列上のマスキングされたビンは第2のマスキング閾値を有する、本発明1006の方法。
[本発明1012]
第1のマスキング閾値と第2のマスキング閾値との組み合わせは、他の閾値を用いて獲得される配列マスクよりも、影響なしのサンプルにおける関心対象の配列を含む領域にわたる被覆率のより低い変動をもたらす配列マスクを提供する、本発明1011の方法。
[本発明1013]
配列マスクは、ビン内のトレーニングサンプルにわたるマッピング精度スコアの分布によって規定される、マスキングされたビンおよびマスキングされていないビンを含み、該マッピング精度スコアは、複数の影響なしのトレーニングサンプルの配列読み取りを参照ゲノムにアラインメントすることにより導き出される、本発明1006の方法。
[本発明1014]
作業(g)において検査サンプルにおける関心対象の核酸配列のコピー数を評価する工程は、正規化配列の被覆率情報を用いて、検査サンプルに対して関心対象の核酸配列の配列用量を算出する工程を含む、前記本発明のいずれかの方法。
[本発明1015]
配列用量を算出する工程は、関心対象の核酸配列における検査配列タグのサンプルGC補正被覆率を、正規化配列における検査配列タグのサンプルGC補正被覆率で割る工程を含む、本発明1014の方法。
[本発明1016]
正規化配列は、1つまたは複数のロバストな常染色体配列またはそのセグメントを含む、本発明1015の方法。
[本発明1017]
作業(g)において検査サンプルにおける関心対象の核酸配列のコピー数を評価する工程は、正規化配列の被覆率情報を用いて、検査サンプルに対して、関心対象の核酸配列の正規化された染色体値または正規化されたセグメント値を算出する工程を含む、前記本発明のいずれかの方法。
[本発明1018]
検査サンプルは、2種の異なるゲノム由来の核酸の混合物を含む、前記本発明のいずれかの方法。
[本発明1019]
核酸は細胞フリーDNA分子を含む、本発明1018の方法。
[本発明1020]
検査サンプルは、胎児および母体の細胞フリー核酸を含む、前記本発明のいずれかの方法。
[本発明1021]
検査サンプルは、2人またはそれを上回る数の胎児由来の胎児細胞フリー核酸を含む、前記本発明のいずれかの方法。
[本発明1022]
検査サンプルは、同じ対象由来の癌性細胞および影響なしの細胞由来の核酸を含む、前記本発明のいずれかの方法。
[本発明1023]
検査サンプルにおける関心対象の核酸配列のコピー数を評価する工程は、完全なまたは部分的な胎児異数性の有無を決定する工程を含む、前記本発明のいずれかの方法。
[本発明1024]
作業(f)の後に、コピー数変動についての評価における検討から、サンプルGC補正被覆率の外れ値のビンを除去する工程をさらに含む、前記本発明のいずれかの方法。
[本発明1025]
外れ値のビンは、そのサンプルGC補正被覆率中央値が、すべてのビンの中央値から約1を上回る中央値絶対偏差であるビンを含む、本発明1024の方法。
[本発明1026]
各ビンにおける予想被覆率は、トレーニングサンプルの被覆率の中央値または平均を含み、かつ作業(e)において検査配列タグの被覆率を調整することは、各ビンに対する検査配列タグの被覆率を、対応するビンからのトレーニングサンプルの被覆率の中央値または平均で割る工程を含む、前記本発明のいずれかの方法。
[本発明1027]
作業(e)において検査配列タグの被覆率を調整することは、(i)1種または複数種のロバストな染色体または領域における複数のビンにおいて、検査配列タグの被覆率対予想被覆率の間の関係を獲得する工程;および(ii)数学的関係を、関心対象の配列におけるビンに適用して、全体プロファイル補正被覆率を獲得する工程を含む、前記本発明のいずれかの方法。
[本発明1028]
(i)における関係は、線形回帰:
y a =切片+傾き * gwp a
式中、y a は、1種または複数種のロバストな染色体または領域における検査サンプルに対するビンaの被覆率であり、かつgwp a は、影響なしのトレーニングサンプルに対するビンaに対しての全体プロファイルである、
によって獲得され;かつ
(ii)において全体プロファイル補正被覆率を獲得する工程は、
z b =y b /(切片+傾き * gwp b )−1
式中、y b は、関心対象の配列における検査サンプルに対するビンbの観察される被覆率であり、かつgwp b は、影響なしのトレーニングサンプルに対するビンbに対しての全体プロファイルである、
として全体プロファイル補正被覆率z b を獲得する工程を含む、本発明1027の方法。
[本発明1029]
(e)からの検査配列タグの全体プロファイル補正被覆率は、関心対象の核酸配列におけるビンの全体プロファイル補正被覆率、および正規化配列におけるビンの全体プロファイル補正被覆率を含む、前記本発明のいずれかの方法。
[本発明1030]
作業(f)において全体プロファイル補正被覆率を調整することは、
参照ゲノムにおけるビンを複数のGC群にグループ化する工程であって、各GC群は複数のビンを含み、該複数のビンは検査配列タグを含有しかつ同程度のGC含有量を有する、工程;
複数種のロバストな常染色体に対して、各GC群に対する全体プロファイル補正被覆率の予想値を決定する工程;および
同じGC群の決定された予想値に基づき、各GC群に対して検査配列タグの全体プロファイル補正被覆率を調整し、それによって関心対象の核酸配列上の検査配列タグのサンプルGC補正被覆率を獲得する工程
を含む、前記本発明のいずれかの方法。
[本発明1031]
全体プロファイル補正被覆率の予想値は、複数種のロバストな常染色体のGC群に対する被覆率の平均または中央値である、本発明1030の方法。
[本発明1032]
検査配列タグの全体プロファイル補正被覆率を調整することは、全体プロファイル補正被覆率から予想値を差し引く工程を含む、本発明1030の方法。
[本発明1033]
作業(f)において全体プロファイル補正被覆率を調整することは、
線形または非線形の数学的関数を、複数種のロバストな常染色体からのデータ点に適合させる工程であって、各データ点は被覆率値をGC含有量値に関連付けする、工程;
検討中のビンのGC含有量値における数学的関数の被覆率値に等しい、各ビンに対する被覆率の予想値に基づき、各ビンにおける検査配列タグの全体プロファイル補正被覆率を調整する工程
を含む、前記本発明のいずれかの方法。
[本発明1034]
検査配列タグの全体プロファイル補正被覆率を調整する工程は、全体プロファイル補正被覆率から予想値を差し引く工程を含む、本発明1033の方法。
[本発明1035]
ロバストな常染色体は、関心対象の染色体を除いたすべての常染色体を含む、本発明1030〜1034のいずれかの方法。
[本発明1036]
ロバストな常染色体は、X、Y、第13、第18、および第21染色体を除いたすべての常染色体を含む、本発明1030〜1034のいずれかの方法。
[本発明1037]
ロバストな常染色体は、検査サンプルから正常な二倍体状態から逸脱していると決定されたものを除いたすべての常染色体を含む、本発明1030〜1034のいずれかの方法。
[本発明1038]
複数の影響なしの個体および/または検査サンプルから細胞フリーDNAを抽出する工程をさらに含む、前記本発明のいずれかの方法。
[本発明1039]
配列読み取りは、個体の全ゲノムにおけるいずれかの箇所由来の約20〜50bpの配列を含む、前記本発明のいずれかの方法。
[本発明1040]
(a)の配列読み取りは、バーコード化された25merを含む、前記本発明のいずれかの方法。
[本発明1041]
検査配列タグおよびトレーニング配列タグの被覆率は、非除外部位計数(NES計数)に基づき、NES計数は、非除外部位にマッピングされた非冗長の配列タグの数である、前記本発明のいずれかの方法。
[本発明1042]
NES計数は、非除外部位にマッピングされた、一意的にアラインメントされた非冗長の配列タグの数である、本発明1041の方法。
[本発明1043]
ビンサイズは約1000bp〜1,000,000bpである、前記本発明のいずれかの方法。
[本発明1044]
ビンサイズは約100,000bpである、前記本発明のいずれかの方法。
[本発明1045]
検査サンプルの配列読み取りの数を用いた算出によってビンサイズを決定する工程をさらに含む、前記本発明のいずれかの方法。
[本発明1046]
各ビンにおける配列タグの数は少なくとも約1000bpである、本発明1045の方法。
[本発明1047]
関心対象の核酸配列のコピー数についての評価のための配列マスクを創出するための、1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムで実践される方法であって、
(a)コンピューターシステムで、複数の影響なしのトレーニングサンプルからの配列読み取りを含むトレーニングセットを提供する工程;
(b)コンピューターシステムによって、トレーニングセットの配列読み取りを、関心対象の核酸配列を含む参照ゲノムにアラインメントし、それによってトレーニングサンプルに対してトレーニング配列タグを提供する工程;
(c)コンピューターシステムによって、参照ゲノムを複数のビンに分割する工程;
(d)コンピューターシステムによって、影響なしの各トレーニングサンプルに対して、各トレーニングサンプルに対する、各ビンにおけるトレーニング配列タグの被覆率を決定する工程であって、該被覆率はビンにおける配列タグの存在度を示す、工程;
(e)各ビンに対して、すべてのトレーニングサンプルにわたるトレーニング配列タグの予想被覆率を決定する工程;
(f)コンピューターシステムによって、各ビンにおける予想被覆率に従って、各トレーニングサンプルに対して各ビンにおけるトレーニング配列タグの被覆率を調整し、それによって各トレーニングサンプルに対してビンにおけるトレーニング配列タグの全体プロファイル補正被覆率を獲得する工程;
(g)コンピューターシステムによって、各ビンにおけるトレーニングサンプルにわたる全体プロファイル補正被覆率の変動に基づき、参照ゲノムにわたる、マスキングされていないおよびマスキングされたビンを含む配列マスクを創出する工程
を含む、方法。
[本発明1048]
各ビンに対して(e)において決定された予想被覆率は、トレーニングサンプルの被覆率の中央値または平均を含む、本発明1047の方法。
[本発明1049]
作業(f)においてトレーニング配列タグの被覆率を調整することは、各ビンに対するトレーニング配列タグに関する各トレーニングサンプルの被覆率から中央値または平均を差し引く工程を含む、本発明1048の方法。
[本発明1050]
作業(f)においてトレーニング配列タグの被覆率を調整することは、各ビンに対するトレーニング配列タグに関する各トレーニングサンプルの被覆率を中央値または平均で割る工程を含む、本発明1048の方法。
[本発明1051]
関心対象の核酸配列上のマスキングされたビンは第1のマスキング閾値を有し、かつ正規化配列上のマスキングされたビンは第2のマスキング閾値を有する、本発明1047の方法。
[本発明1052]
第1のマスキング閾値と第2のマスキング閾値との組み合わせは、他の閾値を用いて獲得される配列マスクよりも、影響なしのサンプルにおける関心対象の配列を含む領域にわたる被覆率のより低い変動をもたらす配列マスクを提供する、本発明1051の方法。
[本発明1053]
(f)の後かつ(g)の前に、コンピューターシステムによって、各トレーニングサンプルに存在する、GC含有量レベルと全体プロファイル補正被覆率との間の関係に基づき、各トレーニングサンプルのビンに対する全体プロファイル補正被覆率を調整し、それによって各トレーニングサンプルに対してトレーニング配列タグのサンプルGC補正被覆率を獲得する工程をさらに含む、本発明1047の方法。
[本発明1054]
各トレーニングサンプルに対する全体プロファイル補正被覆率を調整することは、
参照ゲノムにおけるすべてのビンを複数のGC群にグループ化する工程であって、各GC群は、同程度のGC含有量を有する複数のビンを含む、工程;
複数種のロバストな常染色体に対して、各GC群に対する全体プロファイル補正被覆率の予想値を決定する工程;および
同じGC群の決定された予想値に基づき、各GC群に対してトレーニング配列タグの全体プロファイル補正被覆率を調整し、それによって関心対象の核酸配列上のトレーニング配列タグのサンプルGC補正被覆率を獲得する工程
を含む、本発明1053の方法。
[本発明1055]
全体プロファイル補正被覆率の予想値は、複数種のロバストな常染色体のGC群に対する被覆率の平均または中央値である、本発明1054の方法。
[本発明1056]
トレーニング配列タグの全体プロファイル補正被覆率を調整することは、全体プロファイル補正被覆率から予想値を差し引く工程を含む、本発明1054の方法。
[本発明1057]
各トレーニングサンプルに対する全体プロファイル補正被覆率を調整することは、
線形または非線形の数学的関数を、複数種のロバストな常染色体からのデータ点に適合させる工程であって、各データ点は被覆率値をGC含有量値に関連付けする、工程;
ビンのGC含有量値における数学的関数の被覆率値に等しい、各ビンに対する被覆率の予想値に基づき、各ビンにおけるトレーニング配列タグの全体プロファイル補正被覆率を調整する工程
を含む、本発明1053の方法。
[本発明1058]
トレーニング配列タグの全体プロファイル補正被覆率を調整することは、全体プロファイル補正被覆率から予想値を差し引く工程を含む、本発明1057の方法。
[本発明1059]
サンプルは、血液サンプル、尿サンプル、または唾液サンプルである、前記本発明のいずれかの方法。
[本発明1060]
サンプルは血漿サンプルである、前記本発明のいずれかの方法。
[本発明1061]
関心対象の核酸配列のそれぞれに対して同定される配列タグの数は少なくとも約10,000個である、前記本発明のいずれかの方法。
[本発明1062]
検査サンプルにおける関心対象の核酸配列のコピー数についての評価のためのシステムであって、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー;
プロセッサー;ならびに
(a)コンピューターシステムで、検査サンプルの配列読み取りを提供する工程;
(b)コンピューターシステムによって、検査サンプルの配列読み取りを、関心対象の核酸配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する工程;
(c)コンピューターシステムによって、各ビンに位置する検査配列タグの被覆率を決定する工程であって、参照ゲノムが複数のビンに分割されている、工程;
(d)コンピューターシステムによって、関心対象の核酸配列に対して全体プロファイルを提供する工程であって、該全体プロファイルは、各ビンにおける予想被覆率を含み、かつ該予想被覆率は、検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた、影響なしのトレーニングサンプルのトレーニングセットから獲得され、該予想被覆率はビンごとに変動を呈する、工程;
(e)コンピューターシステムによって、各ビンにおける予想被覆率に従って、検査配列タグの被覆率を調整し、それによって検査配列タグの各ビンにおける全体プロファイル補正被覆率を獲得する工程;
(f)コンピューターシステムによって、検査配列タグのビンに関するGC含有量レベルと全体プロファイル補正被覆率との間の関係に基づき、全体プロファイル補正被覆率を調整し、それによって関心対象の核酸配列上の検査配列タグのサンプルGC補正被覆率を獲得する工程;および
(g)コンピューターシステムによって、サンプルGC補正被覆率に基づき、検査サンプルにおける関心対象の核酸配列のコピー数を評価する工程
を含む方法を用いて、検査サンプルにおけるコピー数を評価する、該プロセッサーへの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含む、システム。
[本発明1063]
コンピューターシステムの1つまたは複数のプロセッサーによって実行される場合、胎児および母体の細胞フリー核酸を含む検査サンプルにおける関心対象の染色体または核酸配列のコピー数についての評価のための方法を該コンピューターシステムに実践させる、コンピューター実行可能な命令をそこに保存している1つまたは複数の非一時的なコンピューター可読記憶媒体を含むコンピュータープログラム製品であって、該方法は、
(a)コンピューターシステムで、検査サンプルから核酸シーケンサーによって獲得された配列読み取りを提供する工程であって、検査サンプルは、1種または複数種のゲノム由来の核酸分子を含む、工程;
(b)コンピューターシステムによって、検査サンプルの配列読み取りを、関心対象の核酸配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する工程;
(c)コンピューターシステムによって、各ビンに位置する検査配列タグの被覆率を決定する工程であって、参照ゲノムが複数のビンに分割されており、かつ該被覆率はビンにおける配列タグの存在度を示す、工程;
(d)コンピューターシステムによって、関心対象の核酸配列に対して全体プロファイルを提供する工程であって、該全体プロファイルは、各ビンにおける予想被覆率を含み、かつ該予想被覆率は、検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた核酸分子を含む、影響なしのトレーニングサンプルのトレーニングセットから獲得され、該予想被覆率はビンごとに変動を呈する、工程;
(e)コンピューターシステムによって、少なくとも関心対象の核酸配列の各ビンにおける予想被覆率を用いて、検査配列タグの被覆率を調整し、それによって関心対象の核酸配列に対する全体プロファイル補正被覆率を獲得する工程;
(f)コンピューターシステムによって、GC含有量レベルと全体プロファイル補正被覆率との間の関係に基づき、全体プロファイル補正被覆率を調整し、それによって関心対象の核酸配列に対するサンプルGC補正被覆率を獲得する工程;および
(g)コンピューターシステムによって、サンプルGC補正被覆率に基づき、検査サンプルにおける関心対象の核酸配列のコピー数を評価する工程であって、該サンプルGC補正被覆率は、関心対象の核酸配列のコピー数を決定するためのシグナルレベルを向上させかつ/またはノイズレベルを低下させる、工程
を含む、コンピュータープログラム製品。
本明細書において言及される、これらの参考文献内に開示されるすべての配列を含む、すべての特許、特許出願、および他の刊行物は、あたかもそれぞれ個々の刊行物、特許、または特許出願が、参照により組み入れられることを具体的かつ個々に示されているのと同程度に、参照により本明細書に明示的に組み入れられる。関連部分において引用されるすべての文書は、本明細書におけるそれらの引用の文脈によって示される目的のために、参照によりそれらの全体として本明細書に組み入れられる。しかしながら、いかなる文書の引用も、それが本開示に対する先行技術であるという承認として解釈されるべきではない。
開示される態様は、胎児および母体の細胞フリー核酸を含む検査サンプルにおける、Y染色体のコピー数についての評価のための方法、機器、およびシステムに関する。いくつかの態様において、関心対象の配列には、遺伝的状態または疾患状態と関連することが知られるまたは疑われる、例えばキロベース(kb)〜メガベース(Mb)から染色体全体に及ぶゲノムセグメント配列が含まれる。いくつかの態様において、Y染色体のコピー数を用いて、胎児の性別を判定する。いくつかの態様において、本方法に従って判定され得るCNVには、Y性染色体のモノソミーおよびトリソミー(例えば、47,XXYおよび47,XYY)、テトラソミーおよびペンタソミーなど、性染色体の他のポリソミー(例えば、XXXXYおよびXYYYY)、ならびに性染色体のうちのいずれか1つまたは複数のセグメントの欠失および/または重複が含まれる。関心対象の配列の他の例には、周知の異数性、例えばトリソミーXXX、トリソミー21と関連した染色体、および癌などの疾患において増倍している染色体のセグメント、例えば急性骨髄性白血病における部分的トリソミー8が含まれる。
本明細書において使用するとき、「a」、「an」、および「the」という単数形の用語は、文脈上はっきりと別様に示されない限り、複数形の指示対象(reference)を含む。
式中、
および
は、適格サンプルのセットにおける第j染色体用量に対する、それぞれ、推定される平均および標準偏差であり、かつxijは、検査サンプルiに対する観察される第j染色体の割合(用量)である、
として算出され得る。
式中、Mjは、同じフローセル上に配列された多重化サンプルのセットにおける第j染色体用量に対する推定中央値であり;
は、1つまたは複数のフローセル上に配列された多重化サンプルの1つまたは複数のセットにおける第j染色体用量に対する標準偏差であり;かつxiは、検査サンプルiに対する観察される第j染色体用量である、
として、検査サンプルにおける関心対象の染色体の染色体用量を、同じフローセル上に配列された多重化サンプルにおける対応する染色体用量の中央値に関連付けすることによって、「オンザフライで(on the fly)」算出され得る。この態様において、検査サンプルiは、それからMjが決定される、同じフローセル上に配列された多重化サンプルの1つである。
2種以上の異なるゲノムに由来する核酸の混合物を含み、かつ関心対象の1種または複数種の配列の量が異なることが知られるまたは疑われる検査サンプルにおける、関心対象の種々の配列のコピー数およびコピー数変異(CNV)を判定するための、方法、機器、およびシステムが本明細書において開示される。本明細書において開示される方法および機器によって判定されるコピー数変異には、染色体全体の増大または損失、顕微鏡で見える非常に大きな染色体セグメントを伴う変更、およびサイズが単一ヌクレオチドからキロベース(kb)に、メガベース(Mb)に及ぶDNAセグメントの多数の超顕微鏡的(sub-microscopic)コピー数変異が含まれる。
CNVについての判定のための方法
本明細書において開示される方法によって提供される配列被覆率値を用いると、従来的方法によって獲得される配列被覆率値を用いるのと比べて、向上した感度、選択性、および/または効率で、配列、染色体、または染色体セグメントのコピー数およびCNVに関係した様々な遺伝的状態を判定することができる。例えば、いくつかの態様において、マスキングされた参照配列は、胎児および母体の核酸分子を含む母体検査サンプルにおける、任意の2種またはそれを上回る種類の異なる完全胎児染色体異数性の有無を判定するために用いられる。下記で提供される例示的な方法は、読み取りを参照配列(参照ゲノムを含む)にアラインメントする。アラインメントは、マスキングされていないまたはマスキングされた参照配列に対して実施され得、それによって、参照配列にマッピングされた配列タグがもたらされる。いくつかの態様において、参照配列のマスキングされていないセグメントに収まる配列タグのみを、コピー数変動を判定する考慮に入れる。
式中、
および
は、適格サンプルのセットにおける第j染色体用量に対する、それぞれ、推定される平均および標準偏差であり、かつxijは、検査サンプルiに対する観察される第j染色体用量である、
として、染色体用量を適格サンプルのセットにおける対応する染色体用量の平均に関連付けする。
式中、Mjは、同じフローセル上に配列された多重化サンプルのセットにおける第j染色体用量に対する推定中央値であり;
は、1つまたは複数のフローセル上に配列された多重化サンプルの1つまたは複数のセットにおける第j染色体用量に対する標準偏差であり;かつxiは、検査サンプルiに対する観察される第j染色体用量である、
として、検査サンプルにおける関心対象の染色体の染色体用量を、同じフローセル上に配列された多重化サンプルにおける対応する染色体用量の中央値に関連付けすることによって、「即座に」算出され得る。この態様において、検査サンプルiは、それからMjが決定される、同じフローセル上に配列された多重化サンプルの1つである。
いくつかの態様において、関心対象の1種または複数種の染色体またはセグメントについての染色体量またはセグメント量を、図1に示される工程146に記載されるように、すべての適格サンプルにおいて決定し、かつ正規化染色体またはセグメントの配列を工程145で同定する。一部の正規化配列は、配列量が算出される前に提供されることに留意されたい。次いで、1種または複数種の正規化配列を、下記でさらに記載される様々な基準に従って同定する(工程145を参照されたい)。いくつかの態様において、例えば、同定された正規化配列は、すべての適格サンプルにわたって、関心対象の配列にについての配列量の最小の変動性をもたらす。
工程145において、正規化配列を、関心対象の配列について同定する。いくつかの態様において、例えば正規化配列は、例えばすべての適格トレーニングサンプルにわたって関心対象の配列についての配列量の最小の変動性をもたらす、算出された配列量に基づく配列である。方法は、同様の特徴を本質的に有しかつサンプル間およびシーケンシングラン間で同様の変動の傾向があり、かつ検査サンプルにおける配列量を決定するのに有用である配列を同定する。
適格サンプルにおける正規化配列の同定に基づき、関心対象の1種または複数種の配列の点で異なるゲノムに由来する核酸の混合物を含む検査サンプルにおいて、関心対象の配列について、配列量を決定する。
(式中、
および
は、適格サンプルのセットにおける第j染色体用量に対する、それぞれ、推定される平均および標準偏差であり、かつxijは、検査サンプルiに対する観察される第j染色体用量である)
に従って、NCVを用いる。
配列被覆率を決定するための一般的な過程
開示されるいくつかの態様は、低いノイズおよび高いシグナルを有する配列被覆分量を決定する方法を提供し、従来的方法によって獲得される配列被覆分量と比べて向上した感度、選択性、および/または効率で、コピー数およびCNVに関係した様々な遺伝的状態を判定するデータを提供する。ある特定の態様において、検査サンプル由来の配列を処理して、配列被覆分量を獲得する。
図3Aは、検査サンプルからの配列データにおけるノイズを低下させるための、過程301の例を提示している。図3B〜3Jは、該過程の様々な段階におけるデータ解析を提示している。図3Aに示されるように、描かれる過程は、1つまたは複数のサンプルからのcfDNAの抽出で始まる。ブロック303を参照されたい。適切な抽出過程および機器は、本明細書における他の箇所で記載されている。いくつかの態様において、2013年3月15日に提出された米国特許出願第61/801,126号(参照によりその全体として本明細書に組み入れられる)に記載される過程は、cfDNAを抽出する。いくつかの実践において、機器は、複数のサンプル由来のcfDNAを一緒に加工して、多重化ライブラリーおよび配列データを提供する。図3Aにおけるブロック305および307を参照されたい。いくつかの態様において、機器は、8個またはそれを上回る数の検査サンプル由来のcfDNAを並列して加工する。本明細書における他の箇所で記載されるように、シーケンシングシステムは、抽出されたcfDNAを加工して、コード化された(例えば、バーコード化された)cfDNAフラグメントのライブラリーを生成し得る。シーケンサーは、cfDNAのライブラリーをシーケンシングして、非常に多くの数の配列読み取りを生成する。サンプルコード化により、多重化サンプルにおける読み取りの多重分離が可能となる。8個またはそれを上回る数のサンプルのそれぞれは、数十万個または数百万個の読み取りを有し得る。過程は、図3Aにおける付加的作業の前に、読み取りをフィルタリングし得る。いくつかの態様において、読み取りのフィルタリングとは、誤った読み取りおよび低精度の読み取りをフィルター除去するために、シーケンサーにおいて実践されるソフトウェアプログラムによって可能となる精度フィルタリング過程である。例えば、Illumina製のSequencing Control Software(SCS)およびConsensus Assessment of Sequence and Variationソフトウェアプログラムは、シーケンシング反応によって作成された生の画像データを、強度スコア、塩基コール、精度スコア化されたアラインメント、および付加的形式に変えることによって、誤った読み取りおよび低精度の読み取りをフィルター除去して、下流の解析のための生物学的に関連する情報を提供する。
ya=切片+傾き*gwpa
式中、yaは、1種または複数種のロバストな染色体または領域における検査サンプルに対するビンaの被覆率であり、かつgwpaは、影響なしのトレーニングサンプルに対するビンaに対しての全体プロファイルである。次いで、過程は、
zb=yb/(切片+傾き*gwpb)−1
式中、ybは、関心対象の配列における検査サンプルに対するビンbの観察される被覆率であり(ロバストな染色体または領域の外側にあり得る)、かつgwpbは、影響なしのトレーニングサンプルに対するビンbに対しての全体プロファイルである、
として、関心対象の配列または領域に対する全体プロファイル補正被覆率zbを計算する。分母(切片+傾き*gwpb)は、ゲノムのロバストな領域から推定される関係性に基づき影響なしの検査サンプルにおいて観察されると予測される、ビンbに対する被覆率である。コピー数変動を持する関心対象の配列の場合、観察される被覆率、およびそれゆえビンbに対する全体プロファイル補正被覆率値は、影響なしのサンプルの被覆率から有意に逸脱すると考えられる。例えば、補正された被覆率zbは、影響ありの染色体上のビンに関してトリソミーサンプルの場合、胎児画分に比例すると考えられる。この過程は、ロバストな染色体に関する切片および傾きを計算することによってサンプル内で正規化し、次いで、関心対象のゲノム領域が、同じサンプル内のロバストな染色体に対して保たれる関係性(傾きおよび切片によって記載される)からどれくらい逸脱するかを評価する。
本明細書において開示されるいくつかの態様は、配列マスクを用いた、関心対象の配列上の非判別配列読み取りをフィルター除去する(またはマスキングする)ためのストラテジーを採用し、それは、CNV評価に用いられる被覆率値において、従来的方法によって算出される値と比べてより高いシグナルおよびより低いノイズにつながる。そのようなマスクは、様々な技法によって同定され得る。一態様において、マスクは、下記でさらに詳細に説明される図4A〜4Bに例証される技法を用いて同定される。
サンプル
CNV、例えば染色体異数性、部分的異数性などを判定するために用いられるサンプルには、関心対象の1種または複数種の配列に対するコピー数変異が判定される対象となる、任意の細胞、組織、または臓器から採取されたサンプルが含まれ得る。望ましくは、サンプルは、細胞内に存在している核酸、および/または「細胞フリー」である核酸(例えば、cfDNA)を含有する。
一態様において、本明細書において記載される方法は、単一シーケンシングランで、多数のサンプルが、ゲノム分子として個々に(すなわち、シングルプレックスシーケンシング)、または指標付きゲノム分子を含むプールされたサンプル(例えば、マルチプレックスシーケンシング)としてシーケンシングされるのを可能にする次世代シーケンシング技術(NGS)を利用し得る。これらの方法は、DNA配列の最高数億個の読み取りを生成し得る。様々な態様において、ゲノム核酸および/または指標付きゲノム核酸の配列は、例えば本明細書において記載される次世代シーケンシング技術(NGS)を用いて決定され得る。様々な態様において、NGSを用いて獲得された大量の配列データについての解析は、本明細書において記載されるように、1つまたは複数のプロセッサーを用いて実施され得る。
様々な態様において、サンプルの完全性の立証およびサンプル追跡は、サンプルゲノム核酸、例えばcfDNAおよび、例えば加工前に、サンプル中に導入されている付随するマーカー核酸の混合物をシーケンシングすることによって達成され得る。
様々な態様において、例えば上記で記載されるように、サンプル中に導入されるマーカー配列は、シーケンシング、ならびに後続の加工および解析の精度および有効性を立証する陽性対照として機能し得る。
上記で示されるように、調製されたサンプル(例えば、シーケンシングライブラリー)を、コピー数変異を同定するための手順の一部としてシーケンシングする。いくつかのシーケンシング技術のいずれかを利用することができる。
母体血中を循環している細胞フリーの胎児DNAおよびRNAを、妊娠管理のためにおよび生殖意思決定を支援するための両方に対して、増加する数の遺伝的状態についての早期の非侵襲的出生前診断(NIPD)に用いることができる。血流中を循環している細胞フリーDNAの存在は、50年間以上にわたって知られてきた。より近年には、少量の循環胎児DNAの存在が、妊娠中の母体血流中で発見された(Lo et al., Lancet 350:485-487 [1997])。死にゆく胎盤細胞に起因すると考えられ、細胞フリー胎児DNA(cfDNA)は、妊娠4週には早くも見分けられ得る(Illanes et al., Early Human Dev 83:563-566 [2007])典型的に長さが200bpよりも少ない短いフラグメントからなることが示されており(Chan et al., Clin Chem 50:88-92 [2004])、かつ分娩の数時間以内に母体循環から一掃されることが知られている(Lo et al., Am J Hum Genet 64:218-224 [1999])。cfDNAに加えて、胎児または胎盤において転写される遺伝子に起因する、細胞フリー胎児RNA(cfRNA)のフラグメントも母体血流中で見分けることができる。母体血液サンプル由来のこれらの胎児遺伝子要素の抽出および後続の解析は、NIPDに新規な機会を与える。
シーケンシングデータの解析およびそこから導き出される診断は、典型的に、様々なコンピューター実行アルゴリズムおよびプログラムを用いて実施される。したがって、ある特定の態様は、1つもしくは複数のコンピューターシステムまたは他の処理システムに保存されたまたはそこから移されたデータを伴う過程を採用する。本明細書において開示される態様は、これらの作業を実施するための機器にも関する。この機器は、必要とされる目的のために特別に構築され得、またはそれは、コンピュータープログラムおよび/もしくはコンピューターに保存されたデータ構造によって選択的に活性化されたもしくは再構成された汎用コンピューター(もしくはコンピューターの群)であり得る。いくつかの態様において、プロセッサーの群は、列挙された解析作業のいくつかまたはすべてを協調的に(例えば、ネットワークまたはクラウドコンピューティングを介して)かつ/または並列に実施する。本明細書において記載される方法を実施するためのプロセッサーまたはプロセッサーの群は、プログラマブル装置(例えば、CPLDおよびFPGA)、およびゲートアレイASICなどの非プログラマブル装置、または汎用マイクロプロセッサーなど、マイクロコントローラーおよびマイクロプロセッサーを含めた様々なタイプのものであり得る。
検査サンプルにおける核酸をシーケンシングすることによって得られた読み取り
読み取りを、参照ゲノムまたは他の1種または複数種の参照配列にアラインメントすることによって得られたタグ
参照ゲノムまたは参照配列
配列タグ密度−参照ゲノムまたは他の参照配列の2つまたはそれを上回る数の領域(典型的には、染色体または染色体セグメント)のそれぞれに対するタグの計数または数
関心対象の特定の染色体または染色体セグメントに対する正規化染色体または正規化染色体セグメントの素性
関心対象の染色体またはセグメント、および対応する正規化染色体または正規化セグメントから得られた、染色体または染色体セグメント(または他の領域)に対する量
影響あり、影響なし、またはコールなしのいずれかとして、染色体量をコールするための閾値
染色体量の実際のコール
診断(コールと関連した臨床的病状)
コールおよび/または診断から導き出されたさらなる検査の勧告
コールおよび/または診断から導き出された治療および/またはモニタリング計画
サンプル収集
シーケンシング前のサンプル加工
シーケンシング
配列データの解析および異数性コールの導出
診断
患者または健常なケア提供者への診断および/またはコールの報告
さらなる治療、検査、および/またはモニタリングの計画の立案
計画の実行
カウンセリング
(a)サンプルにおける胎児および母体の核酸についての配列情報を獲得するためのコード;
(b)該配列情報を用いて、第1〜22、X、およびY染色体より選択される関心対象のいずれか1種または複数種の染色体のそれぞれに対する、胎児および母体の核酸からの配列タグの数をコンピューターにより同定し、かつ関心対象のいずれか1種または複数種の染色体のそれぞれに対する少なくとも1種の正規化染色体配列または正規化染色体セグメント配列に対する配列タグの数を同定するためのコード;
(c)関心対象のいずれか1種または複数種の染色体のそれぞれに対して同定された配列タグの数、および各正規化染色体配列または正規化染色体セグメント配列に対して同定された配列タグの数を用いて、関心対象のいずれか1種または複数種の染色体のそれぞれに対する単一染色体量を算出するためのコード;ならびに
(d)関心対象のいずれか1種または複数種の染色体のそれぞれに対する単一染色体量のそれぞれと、関心対象のいずれか1種または複数種の染色体のそれぞれに対する対応する閾値の値とを比較し、それによって、サンプルにおけるいずれか1種または複数種の異なる完全胎児染色体異数性の有無を判定するためのコード
を含む。
(a)サンプルにおける胎児および母体の核酸についての配列情報を獲得するためのコード;
(b)該配列情報を用いて、第1〜22、X、およびY染色体より選択される関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数のセグメントのそれぞれに対する、胎児および母体の核酸からの配列タグの数をコンピューターにより同定し、かつ関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数のセグメントのそれぞれに対する少なくとも1種の正規化セグメント配列に対する配列タグの数を同定するためのコード;
(c)関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数のセグメントのそれぞれに対して同定された配列タグの数、および正規化セグメント配列に対して同定された配列タグの数を用いて、関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数のセグメントのそれぞれに対する単一染色体セグメント量を算出するためのコード;ならびに
(d)関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数のセグメントのそれぞれに対する単一染色体セグメント量のそれぞれと、関心対象のいずれか1種または複数種の染色体のいずれか1つまたは複数の染色体セグメントのそれぞれに対する対応する閾値の値とを比較し、それによって、サンプルにおけるいずれか1種または複数種の異なる部分的胎児染色体異数性の有無を判定するためのコード
を含む。
実施例1
一次および富化したシーケンシングライブラリーの調製およびシーケンシング
a. シーケンシングライブラリーの調製−簡略プロトコール(ABB)
すべてのシーケンシングライブラリー、すなわち一次および富化したライブラリーを、母体血漿から抽出されたおよそ2ngの精製cfDNAから調製した。Illumina(登録商標)用のNEBNext(商標)DNA Sample Prep DNA Reagent Set 1(品番E6000L;New England Biolabs, Ipswich, MA)を用いて、ライブラリー調製を以下のとおりに実施した。細胞フリー血漿DNAは天然にフラグメント化されているため、血漿DNAサンプルに対して、噴霧化または超音波処理によるさらなるフラグメント化は行わなかった。NEBNext(登録商標)End Repair Moduleに従って、1.5ml微量遠心(microfuge)チューブ中で、cfDNAと、NEBNext(商標)DNA Sample Prep DNA Reagent Set 1において提供されている5μlの10×リン酸化バッファー、2μlのデオキシヌクレオチド溶液ミックス(10mMの各dNTP)、1μlの1:5希釈のDNAポリメラーゼI、1μlのT4 DNAポリメラーゼ、および1μlのT4ポリヌクレオチドキナーゼとを20℃で15分間インキュベートすることによって、40μl中に含有されるおよそ2ngの精製cfDNAフラグメントの突出をリン酸化平滑末端に変換した。次いで、反応混合液を75℃で5分間インキュベートすることによって、酵素を熱不活性化した。混合液を4℃に冷却し、かつKlenowフラグメント(3'→5'exo−)(NEBNext(商標)DNA Sample Prep DNA Reagent Set 1)を含有する10μl のdAテーリングマスターミックスを用いかつ37℃で15分間インキュベートすることによって、平滑末端化DNAのdAテーリングを達成した。その後、反応混合液を75℃で5分間インキュベートすることによって、Klenowフラグメントを熱不活性化した。Klenowフラグメントの不活性化後、1μlの1:5希釈のIllumina製Genomic Adaptor Oligo Mix(品番1000521;Illumina Inc., Hayward, CA)を用い、NEBNext(商標)DNA Sample Prep DNA Reagent Set 1において提供されている4μlのT4 DNAリガーゼを用いて、反応混合液を25℃で15分間インキュベートすることによって、Illuminaアダプター(指標なしのYアダプター)を、dAテーリングされたDNAにライゲーションした。混合液を4℃に冷却し、かつアダプターがライゲーションされたcfDNAを、Agencourt AMPure XP PCR purification system(品番A63881;Beckman Coulter Genomics, Danvers, MA)において提供されている磁気ビーズを用いて、ライゲーションされていないアダプター、アダプターダイマー、および他の試薬から精製した。Phusion(登録商標)High-Fidelity Master Mix(25μl;Finnzymes, Woburn, MA)、およびアダプターに相補的なIllumina製PCRプライマー(それぞれ0.5μM)(品番1000537および1000537)を用い、18サイクルのPCRを実施して、アダプターがライゲーションされたcfDNAを選択的に富化した(25μl)。メーカーの指示書に従い、Illumina製ゲノム用PCRプライマー(品番100537および1000538)、およびNEBNext(商標)DNA Sample Prep DNA Reagent Set 1において提供されているPhusion HF PCR Master Mixを用いて、アダプターがライゲーションされたDNAをPCR(98℃30秒間;98℃10秒間、65℃30秒間、および72℃30の18サイクル;72℃5分間での最終伸長、ならびに4℃保持)に供した。www.beckmangenomics.com/products/AMPureXPProtocol_000387v001.pdfにて入手可能なメーカーの指示書に従い、Agencourt AMPure XP PCR purification system(Agencourt Bioscience Corporation, Beverly, MA)を用いて、増幅産物を精製した。精製された増幅産物を40μlのQiagen EB Buffer中に溶出し、かつ2100 Bioanalyzer(Agilent technologies Inc., Santa Clara, CA)用のAgilent DNA 1000 Kitを用いて、増幅ライブラリーの濃度およびサイズ分布を解析した。
ここに記載される全長プロトコールは、本質的に、Illuminaによって提供されている標準的プロトコールであり、増幅ライブラリーの精製の点でIlluminaプロトコールと異なるだけである。Illuminaプロトコールは、ゲル電気泳動を用いて増幅ライブラリーを精製するように指示しているが、一方で本明細書において記載されるプロトコールは、同じ精製工程に磁気ビーズを用いる。母体血漿から抽出されたおよそ2ngの精製cfDNAを用い、本質的にメーカーの指示書に従い、Illumina(登録商標)用のNEBNext(商標)DNA Sample Prep DNA Reagent Set 1(品番E6000L;New England Biolabs, Ipswich, MA)を用いて、一次シーケンシングライブラリーを調製した。精製カラムの代わりにAgencourtの磁気ビーズおよび試薬を用いて実施した、アダプターがライゲーションされた産物の最終精製を除くすべての工程を、Illumina(登録商標)GAIIを用いてシーケンシングされるゲノムDNAライブラリー用のサンプル調製のための、NEBNext(商標)試薬に添付しているプロトコールに従って実施した。NEBNext(商標)プロトコールは、本質的に、Illuminaによって提供されているものに従い、それは、grcf.jhml.edu/hts/protocols/11257047_ChIP_Sample_Prep.pdfにて入手可能である。
Bioanalyzerによって作成されたエレクトロフェログラムは、図7Aおよび7Bに示されている。図7Aは、(a)で記載される全長プロトコールを用いて、血漿サンプルM24228から精製されたcfDNAから調製されたライブラリーDNAのエレクトロフェログラムを示しており、図7Bは、(b)で記載される全長プロトコールを用いて、血漿サンプルM24228から精製されたcfDNAから調製されたライブラリーDNAのエレクトロフェログラムを示している。両方の図において、ピーク1および4は、それぞれ15bpの低量マーカー(Lower Marker)および1,500の高量マーカー(Upper Marker)を表し;ピークの上の数は、ライブラリーフラグメントに関する移動時間を示し;かつ水平線は、積分のための設定閾値を示す。図7Aにおけるエレクトロフェログラムは、187bpのフラグメントの小さなピークおよび263bpのフラグメントの大きなピークを示しており、一方で図7Bにおけるエレクトロフェログラムは、265bpにおける1つのピークのみを示している。ピークエリアの積分により、図7Aにおける187bpのピークのDNAに対して0.40ng/μlという算出濃度、図7Aにおける263bpのピークのDNAに対して7.34ng/μlという濃度、および図7Bにおける265bpのピークのDNAに対して14.72ng/μlという濃度がもたらされた。cfDNAにライゲーションされたIlluminaアダプターは92bpであることが知られており、それを265bpから差し引いた場合、cfDNAのピークサイズは173bpであることを示す。187bpにおける小さなピークは、端から端までライゲーションした2つのプライマーのフラグメントを表す。線状の2つのプライマーフラグメントは、簡略プロトコールが用いられる場合、最終ライブラリー産物から排除される。簡略プロトコールは、187bp未満のより小さな他のフラグメントも排除する。本実施例において、アダプターがライゲーションされた精製cfDNAの濃度は、全長プロトコールを用いて生成された、アダプターがライゲーションされたcfDNAのものの2倍である。アダプターがライゲーションされたcfDNAフラグメントの濃度は、全長プロトコールを用いて獲得されたものよりも常に大きかったことが留意される(データ示さず)。
双胎妊娠における正確な異数性検出
序論
全ゲノム超並列シーケンシングを用いた、全細胞フリーDNA(cfDNA)の非侵襲的出生前検査(NIPT)は、胎児染色体異数性を検出する非常に正確でかつロバストな方法であることが示されている。Bianchi DW, Platt LD, Goldberg JD, et al. Genome-wide fetal aneuploidy detection by maternal plasma DNA sequencing. Obstet Gynecol 2012;119:890-901;Fan HC, Blumenfeld YJ, Chitkara U, Hudgins L, Quake SR. Noninvasive diagnosis of fetal aneuploidy by shotgun sequencing DNA from maternal blood. Proc Natl Acad Sci U S A 2008;105:16266-71;Sehnert AJ, Rhees B, Comstock D, et al. Optimal detection of fetal chromosomal abnormalities by massively parallel DNA sequencing of cell-free fetal DNA from maternal blood. Clin Chem 2011;57:1042-9を参照されたい。本検査は、単一の母体血液サンプルからトリソミー21、18、13、および性染色体異数性を検出する。本検査は、現在、10+週における単胎妊娠を有しかつ胎児異数性の高いリスクがある妊娠女性に適応される。近年、米国産科婦人科学会(American College of Obstetricians and Gynecologists)(ACOG)、国際出生前診断学会(International Society for Prenatal Diagnosis)(ISPD)、米国臨床遺伝学ゲノム学学会(American College of Medical Genetics and Genomics)(ACMG)、および国立遺伝カウンセラー協会(National Society of Genetic Counselors)(NSGC)は、胎児異数性の高いリスクがある女性に対して、NIPTの使用を考慮することを勧告している。
高いリスクおよび平均的リスクの母体集団の両方を伴う2つの独立した臨床試験の一部として、サンプルを回収した。母体血液は胎児異数性を正確に診断するための供給源である調査(MatErnal BLood IS Source to Accurately Diagnose Fetal Aneuploidy study)(MELISSA;NCT01122524)を、高リスク妊娠における染色体全体の異数性を検出するように設計した。Bianchi DW, Platt LD, Goldberg JD, et al. Genome-wide fetal aneuploidy detection by maternal plasma DNA sequencing. Obstet Gynecol 2012;119:890-901。異数性リスク評価の比較試験(CARE;NCT01663350)を、平均的リスクの母体集団におけるトリソミー21およびトリソミー18に対する従来的出生前血清スクリーニング法と比較して、本検査の優れた特異性を実証するように設計した(発表のために提出された)。データセットについての詳細は、表3に示されている。臨床結果を、出生前の侵襲的手順からの核型によって、または新生児身体検査によって判定した。
本試験において、臨床的に規定された結果を有する118例の双胎妊娠からの母体血漿サンプルを調べた(表3)。第21、第18、および第13染色体に対する異数性分類を、試験におけるサンプルのすべてに対して作成し、1人または複数の異数性胎児を有する妊娠からの4つのサンプルが正しく同定された(図8)。これらのサンプルのうちの2つは、それぞれが、1人のT21影響ありの雄性胎児および1人の影響なしの雄性胎児(47,XY+21/46,XY)の二絨毛膜性双生児ペア由来であり;1つは、47,XY+18核型を有する単一絨毛膜性双生児サンプルであり;かつ1つのサンプルは、1人の双生児がモザイク核型47,XY+T21[7]/46,XY[11]を有する二絨毛膜性双生児であった。本試験において、臨床的に規定された影響なしのサンプル(N=114)のいずれも、異数性について影響ありと分類されなかった。
本試験は、双生児サンプルについて最も高感度な常染色体異数性検査を可能にする、向上した解析方法論を実証している。増強した解析法は、ゲノムフィルタリングの向上、体系的ノイズの低下、および向上した分類法を活用する。双生児における常染色体異数性およびY染色体の存在を検出するMPSの任意の検証において用いられた最大数のサンプルである、118例の双生児サンプルのセットに対して、向上した解析ワークフローの有用性が実証された(図9)。図9は、NIPT試験において解析された双生児サンプルを示している。市販のNIPT検査の性能を査定するために、様々な試験において用いられた双生児サンプルの数。Canick JA, Kloza EM, Lambert-Messerlian GM, et al. DNA sequencing of maternal plasma to identify Down syndrome and other trisomies in multiple gestations. Prenat Diagn 2012;32:730-4、Lau TK, Jiang F, Chan MK, Zhang H, Lo PSS, Wang W. Non-invasive prenatal screening of fetal Down syndrome by maternal plasma DNA sequencing in twin pregnancies. Journal of Maternal-Fetal and Neonatal Medicine 2013;26:434-7。向上した解析法は、いかなる偽陽性結果も生み出すことなく、トリソミー21に対してモザイクである影響ありの胎児を含めた、コホートにおけるすべてのトリソミー21およびトリソミー18のサンプルの存在を正しく検出することによって、正確に実施することが示された。加えて、向上した解析法は、少なくとも1人の雄性胎児を有するすべての双胎妊娠においてY染色体の存在を正しく検出し、かつ2人の雌性胎児を有する双胎妊娠のいずれにおいてもY染色体を検出しなかった。
Claims (25)
- 検査サンプルにおける関心対象の核酸配列のコピー数についての評価のための、1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムで実践される方法であって、
(a)コンピューターシステムで、検査サンプルから核酸シーケンサーによって獲得された配列読み取りを提供する工程であって、検査サンプルは、1種または複数種のゲノム由来の核酸分子を含む、工程;
(b)コンピューターシステムによって、検査サンプルの配列読み取りを、関心対象の核酸配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する工程;
(c)コンピューターシステムによって、複数のビンに位置する検査配列タグの複数の被覆率を決定する工程であって、参照ゲノムが該複数のビンに分割されており、かつ該被覆率はビンにおける配列タグの存在度を示す、工程;
(d)コンピューターシステムによって、関心対象の核酸配列に対して全体プロファイルを提供する工程であって、該全体プロファイルは、該複数のビンにおける複数の予想被覆率を含み、かつ該複数の予想被覆率は、検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた核酸分子を含む、影響なしのトレーニングサンプルのトレーニングセットから獲得され、該複数の予想被覆率はビンごとに変動を呈する、工程;
(e)コンピューターシステムによって、該複数の予想被覆率を用いて、検査配列タグの複数の被覆率を調整し、それによって関心対象の核酸配列に対する全体プロファイル補正被覆率を獲得する工程;
(f)コンピューターシステムによって、検査サンプルのGC含有量レベルと検査サンプルの全体プロファイル補正被覆率との間の関係に基づき、関心対象の核酸配列に対する全体プロファイル補正被覆率を調整し、それによって関心対象の核酸配列に対するサンプルGC補正被覆率を獲得する工程;および
(g)コンピューターシステムによって、サンプルGC補正被覆率に基づき、検査サンプルにおける関心対象の核酸配列のコピー数を評価する工程であって、該サンプルGC補正被覆率は、関心対象の核酸配列のコピー数を決定するためのシグナルレベルを向上させかつ/またはノイズレベルを低下させる、工程
を含む、方法。 - 配列読み取りを、妊娠女性の細胞フリーDNAおよび該妊娠女性によって保持された胎児の細胞フリーDNAの配列から獲得する、請求項1記載の方法。
- マスキングされたビンにおける被覆率を検討から除外する配列マスクを適用する工程をさらに含む、請求項1記載の方法。
- 配列マスクを、
コンピューターシステムで、複数の影響なしのトレーニングサンプルからの配列読み取りを含むトレーニングセットを提供する工程;
コンピューターシステムによって、トレーニングセットの配列読み取りを参照ゲノムにアラインメントし、それによってトレーニングサンプルに対してトレーニング配列タグを提供する工程;
コンピューターシステムによって、参照ゲノムを複数のビンに分割する工程;
コンピューターシステムによって、各トレーニングサンプルに対して各ビンにおけるトレーニング配列タグの被覆率を決定する工程;ならびに
コンピューターシステムによって、マスキングされていないおよびマスキングされたビンを含む配列マスクを創出する工程であって、マスキングされた各ビンは、マスキング閾値を超える分布指標を有し、該分布指標はトレーニングサンプルの被覆率の分布に関係している、工程
を含む方法によって獲得する、請求項3記載の方法。 - 配列マスクは、ビン内のトレーニングサンプルにわたるマッピング精度スコアの分布によって規定される、マスキングされたビンおよびマスキングされていないビンを含み、該マッピング精度スコアは、複数の影響なしのトレーニングサンプルの配列読み取りを参照ゲノムにアラインメントすることにより導き出される、請求項3記載の方法。
- 検査サンプルは、2種の異なるゲノム由来の核酸の混合物を含む、請求項1〜5のいずれか一項記載の方法。
- 核酸は細胞フリーDNA分子を含む、請求項6記載の方法。
- 検査サンプルは、胎児および母体の細胞フリー核酸を含む、請求項1〜7のいずれか一項記載の方法。
- 検査サンプルは、同じ対象由来の癌性細胞および影響なしの細胞由来の核酸を含む、請求項1〜8のいずれか一項記載の方法。
- 各ビンにおける予想被覆率は、トレーニングサンプルの被覆率の中央値または平均を含み、かつ作業(e)において検査配列タグの被覆率を調整することは、各ビンに対する検査配列タグの被覆率を、ビンからのトレーニングサンプルの被覆率の中央値または平均で割る工程を含む、請求項1〜9のいずれか一項記載の方法。
- 作業(e)において検査配列タグの被覆率を調整することは、(i)1種または複数種のロバストな染色体または領域における複数のビンにおいて、検査配列タグの被覆率対予想被覆率の間の関係を獲得する工程;および(ii)該関係を、関心対象の配列におけるビンに適用して、全体プロファイル補正被覆率を獲得する工程を含む、請求項1〜10のいずれか一項記載の方法。
- (i)における関係は、線形回帰:
ya=切片+傾き*gwpa
式中、yaは、1種または複数種のロバストな染色体または領域における検査サンプルに対するビンaの被覆率であり、かつgwpaは、影響なしのトレーニングサンプルに対するビンaに対しての全体プロファイルである、
によって獲得され;かつ
(ii)において全体プロファイル補正被覆率を獲得する工程は、
zb=yb/(切片+傾き*gwpb)−1
式中、ybは、関心対象の配列における検査サンプルに対するビンbの観察される被覆率であり、かつgwpbは、影響なしのトレーニングサンプルに対するビンbに対しての全体プロファイルである、
として全体プロファイル補正被覆率zbを獲得する工程を含む、請求項11記載の方法。 - 作業(f)において全体プロファイル補正被覆率を調整することは、
参照ゲノムにおけるビンを複数のGC群にグループ化する工程であって、各GC群は複数のビンを含み、該複数のビンは検査配列タグを含有しかつ検査サンプルにおいて同程度のGC含有量を有する、工程;
複数種のロバストな常染色体に対して、各GC群に対する全体プロファイル補正被覆率の予想値を決定する工程;および
同じGC群の決定された予想値に基づき、各GC群に対して関心対象の核酸配列における各ビンにおける検査配列タグの全体プロファイル補正被覆率を調整し、それによって関心対象の核酸配列における各ビンにおける検査配列タグのサンプルGC補正被覆率を獲得する工程
を含む、請求項1〜12のいずれか一項記載の方法。 - 全体プロファイル補正被覆率の予想値は、複数種のロバストな常染色体のGC群に対する被覆率の平均または中央値である、請求項13記載の方法。
- 検査配列タグの全体プロファイル補正被覆率を調整することは、全体プロファイル補正被覆率から予想値を差し引く工程を含む、請求項13記載の方法。
- 作業(f)において全体プロファイル補正被覆率を調整することは、
線形または非線形の数学的関数を、複数種のロバストな常染色体からのデータ点に適合させる工程であって、各データ点は検査サンプルの全体プロファイル補正被覆率値を検査サンプルのGC含有量値に関連付けする、工程;
検討中のビンのGC含有量値における数学的関数の被覆率値に等しい、各ビンに対する被覆率の予想値に基づき、関心対象の核酸配列における各ビンにおける検査配列タグの全体プロファイル補正被覆率を調整する工程
を含む、請求項1〜15のいずれか一項記載の方法。 - 検査配列タグの全体プロファイル補正被覆率を調整する工程は、全体プロファイル補正被覆率から予想値を差し引く工程を含む、請求項16記載の方法。
- ロバストな常染色体は、関心対象の染色体を除いたすべての常染色体を含む、請求項13〜17のいずれか一項記載の方法。
- ロバストな常染色体は、X、Y、第13、第18、および第21染色体を除いたすべての常染色体を含む、請求項13〜17のいずれか一項記載の方法。
- 関心対象の核酸配列のコピー数についての評価のための配列マスクを創出するための、1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムで実践される方法であって、
(a)コンピューターシステムで、複数の影響なしのトレーニングサンプルからの配列読み取りを含むトレーニングセットを提供する工程;
(b)コンピューターシステムによって、トレーニングセットの配列読み取りを、関心対象の核酸配列を含む参照ゲノムにアラインメントし、それによってトレーニングサンプルに対してトレーニング配列タグを提供する工程;
(c)コンピューターシステムによって、参照ゲノムを複数のビンに分割する工程;
(d)コンピューターシステムによって、影響なしの各トレーニングサンプルに対して、各トレーニングサンプルに対する、各ビンにおけるトレーニング配列タグの被覆率を決定する工程であって、該被覆率はビンにおける配列タグの存在度を示す、工程;
(e)複数のビンにおけるトレーニング配列タグの複数の被覆率に基づき、該複数のビンにおける複数の予想被覆率を決定する工程;
(f)コンピューターシステムによって、複数のビンにおける複数の予想被覆率に従って、各トレーニングサンプルに対して該複数のビンにおけるトレーニング配列タグの複数の被覆率を調整し、それによって各トレーニングサンプルに対してビンにおけるトレーニング配列タグの全体プロファイル補正被覆率を獲得する工程;
(g)コンピューターシステムによって、参照ゲノムにわたる、マスキングされていないおよびマスキングされたビンを含む配列マスクを創出する工程であって、マスキングされた各ビンがマスキング閾値を超える分布指標を有し、該分布指標は各ビンにおけるトレーニングサンプルにわたる全体プロファイル補正被覆率の分布に関係している、工程
を含む、方法。 - 各ビンに対して(e)において決定された予想被覆率は、トレーニングサンプルの被覆率の中央値または平均を含む、請求項20記載の方法。
- 作業(f)においてトレーニング配列タグの被覆率を調整することは、各ビンに対するトレーニング配列タグに関する各トレーニングサンプルの被覆率から中央値または平均を差し引く工程を含む、請求項21記載の方法。
- 作業(f)においてトレーニング配列タグの被覆率を調整することは、各ビンに対するトレーニング配列タグに関する各トレーニングサンプルの被覆率を中央値または平均で割る工程を含む、請求項21記載の方法。
- 検査サンプルにおける関心対象の核酸配列のコピー数についての評価のためのシステムであって、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー;
1つまたは複数のプロセッサー;ならびに
(a)該システムで、検査サンプルの配列読み取りを提供する工程;
(b)該1つまたは複数のプロセッサーによって、検査サンプルの配列読み取りを、関心対象の核酸配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する工程;
(c)該1つまたは複数のプロセッサーによって、複数のビンに位置する検査配列タグの複数の被覆率を決定する工程であって、参照ゲノムが該複数のビンに分割されている、工程;
(d)該1つまたは複数のプロセッサーによって、関心対象の核酸配列に対して全体プロファイルを提供する工程であって、該全体プロファイルは、複数のビンにおける複数の予想被覆率を含み、かつ該複数の予想被覆率は、検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた、影響なしのトレーニングサンプルのトレーニングセットから獲得され、該複数の予想被覆率はビンごとに変動を呈する、工程;
(e)該1つまたは複数のプロセッサーによって、該複数の予想被覆率に従って、検査配列タグの複数の被覆率を調整し、それによって全体プロファイル補正被覆率を獲得する工程;
(f)該1つまたは複数のプロセッサーによって、検査配列タグのビンに関する検査サンプルのGC含有量レベルと検査サンプルの全体プロファイル補正被覆率との間の関係に基づき、全体プロファイル補正被覆率を調整し、それによって関心対象の核酸配列上の検査配列タグのサンプルGC補正被覆率を獲得する工程;および
(g)該1つまたは複数のプロセッサーによって、サンプルGC補正被覆率に基づき、検査サンプルにおける関心対象の核酸配列のコピー数を評価する工程
を含む方法を用いて、検査サンプルにおけるコピー数を評価する、該プロセッサーへの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含む、システム。 - コンピューターシステムの1つまたは複数のプロセッサーによって実行される場合、胎児および母体の細胞フリー核酸を含む検査サンプルにおける関心対象の染色体または核酸配列のコピー数についての評価のための方法を該コンピューターシステムに実践させる、コンピューター実行可能な命令をそこに保存している1つまたは複数の非一時的なコンピューター可読記憶媒体を含むコンピュータープログラム製品であって、該方法は、
(a)コンピューターシステムで、検査サンプルから核酸シーケンサーによって獲得された配列読み取りを提供する工程であって、検査サンプルは、1種または複数種のゲノム由来の核酸分子を含む、工程;
(b)コンピューターシステムによって、検査サンプルの配列読み取りを、関心対象の核酸配列を含む参照ゲノムにアラインメントし、それによって検査配列タグを提供する工程;
(c)コンピューターシステムによって、複数のビンに位置する検査配列タグの複数の被覆率を決定する工程であって、参照ゲノムが該複数のビンに分割されており、かつ該被覆率はビンにおける配列タグの存在度を示す、工程;
(d)コンピューターシステムによって、関心対象の核酸配列に対して全体プロファイルを提供する工程であって、該全体プロファイルは、該複数のビンにおける複数の予想被覆率を含み、かつ該複数の予想被覆率は、検査サンプルと実質的に同じ様式でシーケンシングされかつアラインメントされた核酸分子を含む、影響なしのトレーニングサンプルのトレーニングセットから獲得され、該複数の予想被覆率はビンごとに変動を呈する、工程;
(e)コンピューターシステムによって、該複数の予想被覆率を用いて、検査配列タグの複数の被覆率を調整し、それによって関心対象の核酸配列に対する全体プロファイル補正被覆率を獲得する工程;
(f)コンピューターシステムによって、検査サンプルのGC含有量レベルと検査サンプルの全体プロファイル補正被覆率との間の関係に基づき、全体プロファイル補正被覆率を調整し、それによって関心対象の核酸配列に対するサンプルGC補正被覆率を獲得する工程;および
(g)コンピューターシステムによって、サンプルGC補正被覆率に基づき、検査サンプルにおける関心対象の核酸配列のコピー数を評価する工程であって、該サンプルGC補正被覆率は、関心対象の核酸配列のコピー数を決定するためのシグナルレベルを向上させかつ/またはノイズレベルを低下させる、工程
を含む、コンピュータープログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361893830P | 2013-10-21 | 2013-10-21 | |
US61/893,830 | 2013-10-21 | ||
PCT/US2014/061635 WO2015061359A1 (en) | 2013-10-21 | 2014-10-21 | Method for improving the sensitivity of detection in determining copy number variations |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016539630A JP2016539630A (ja) | 2016-12-22 |
JP2016539630A5 JP2016539630A5 (ja) | 2017-11-24 |
JP6534191B2 true JP6534191B2 (ja) | 2019-06-26 |
Family
ID=51894216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016525007A Active JP6534191B2 (ja) | 2013-10-21 | 2014-10-21 | コピー数変動を決定することにおける検出の感度を向上させるための方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US10741269B2 (ja) |
EP (2) | EP3061021B1 (ja) |
JP (1) | JP6534191B2 (ja) |
KR (2) | KR102373647B1 (ja) |
CN (1) | CN105830077B (ja) |
AU (2) | AU2014340239B2 (ja) |
CA (1) | CA2928185C (ja) |
IL (1) | IL245177B (ja) |
WO (1) | WO2015061359A1 (ja) |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2930180T3 (es) | 2012-03-02 | 2022-12-07 | Sequenom Inc | Métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica |
US9892230B2 (en) | 2012-03-08 | 2018-02-13 | The Chinese University Of Hong Kong | Size-based analysis of fetal or tumor DNA fraction in plasma |
US9128861B2 (en) | 2013-01-17 | 2015-09-08 | Personalis, Inc. | Methods and systems for genetic analysis |
WO2014168711A1 (en) | 2013-03-13 | 2014-10-16 | Sequenom, Inc. | Primers for dna methylation analysis |
WO2015061359A1 (en) | 2013-10-21 | 2015-04-30 | Verinata Health, Inc. | Method for improving the sensitivity of detection in determining copy number variations |
EP3736344A1 (en) | 2014-03-13 | 2020-11-11 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US10318704B2 (en) | 2014-05-30 | 2019-06-11 | Verinata Health, Inc. | Detecting fetal sub-chromosomal aneuploidies |
EP3169813B1 (en) | 2014-07-18 | 2019-06-12 | The Chinese University Of Hong Kong | Methylation pattern analysis of tissues in dna mixture |
EP3204512B1 (en) * | 2014-10-10 | 2020-05-06 | Sequenom, Inc. | Methods for partitioning of genomic sequences |
EP4026913A1 (en) | 2014-10-30 | 2022-07-13 | Personalis, Inc. | Methods for using mosaicism in nucleic acids sampled distal to their origin |
WO2016081712A1 (en) * | 2014-11-19 | 2016-05-26 | Bigdatabio, Llc | Systems and methods for genomic manipulations and analysis |
CA2970501C (en) | 2014-12-12 | 2020-09-15 | Verinata Health, Inc. | Using cell-free dna fragment size to determine copy number variations |
US10364467B2 (en) | 2015-01-13 | 2019-07-30 | The Chinese University Of Hong Kong | Using size and number aberrations in plasma DNA for detecting cancer |
US10733476B1 (en) * | 2015-04-20 | 2020-08-04 | Color Genomics, Inc. | Communication generation using sparse indicators and sensor data |
BE1023266B1 (nl) * | 2015-07-13 | 2017-01-17 | Cartagenia N.V. | Systeem en methodologie voor de analyse van genomische gegevens die zijn verkregen van een onderwerp |
EP3118324A1 (en) * | 2015-07-13 | 2017-01-18 | Cartagenia N.V. | Method for analyzing copy number variation in the detection of cancer |
BE1023267B1 (nl) * | 2015-07-13 | 2017-01-17 | Cartagenia N.V. | Werkwijze voor het analyseren van kopienummervariatie bij de detectie van kanker |
US10095831B2 (en) | 2016-02-03 | 2018-10-09 | Verinata Health, Inc. | Using cell-free DNA fragment size to determine copy number variations |
US11299783B2 (en) | 2016-05-27 | 2022-04-12 | Personalis, Inc. | Methods and systems for genetic analysis |
US20190287645A1 (en) * | 2016-07-06 | 2019-09-19 | Guardant Health, Inc. | Methods for fragmentome profiling of cell-free nucleic acids |
RU2768718C2 (ru) * | 2016-09-22 | 2022-03-24 | Иллумина, Инк. | Обнаружение соматического варьирования числа копий |
CA3037366A1 (en) | 2016-09-29 | 2018-04-05 | Myriad Women's Health, Inc. | Noninvasive prenatal screening using dynamic iterative depth optimization |
IL315032A (en) | 2016-11-30 | 2024-10-01 | The Chinese Univ Of Hong Kong | Analysis of cell-free DNA in urine and other samples |
KR20190095410A (ko) | 2016-12-22 | 2019-08-14 | 가던트 헬쓰, 인크. | 핵산 분자를 분석하기 위한 방법 및 시스템 |
EP3559841A1 (en) * | 2016-12-22 | 2019-10-30 | Grail, Inc. | Base coverage normalization and use thereof in detecting copy number variation |
CA3049457C (en) * | 2017-01-20 | 2023-05-16 | Sequenom, Inc. | Methods for non-invasive assessment of copy number alterations |
KR101957909B1 (ko) | 2017-02-24 | 2019-03-15 | 에스디지노믹스 주식회사 | 복제수 변이 후보 우선순위 연산 방법 |
WO2018170443A1 (en) * | 2017-03-16 | 2018-09-20 | Counsyl, Inc. | Multi-dimensional sample-dependent and batch-dependent quality control |
US11342047B2 (en) * | 2017-04-21 | 2022-05-24 | Illumina, Inc. | Using cell-free DNA fragment size to detect tumor-associated variant |
CN108733982B (zh) * | 2017-09-26 | 2021-02-19 | 上海凡迪基因科技有限公司 | 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备 |
EP3765633A4 (en) * | 2018-03-13 | 2021-12-01 | Grail, Inc. | PROCESS AND SYSTEM FOR THE SELECTION, ADMINISTRATION AND ANALYSIS OF HIGH DIMENSIONAL DATA |
WO2019195268A2 (en) | 2018-04-02 | 2019-10-10 | Grail, Inc. | Methylation markers and targeted methylation probe panels |
CN108647492B (zh) * | 2018-05-02 | 2019-04-16 | 中国人民解放军军事科学院军事医学研究院 | 一种染色质拓扑相关结构域的表征方法及装置 |
US11814750B2 (en) | 2018-05-31 | 2023-11-14 | Personalis, Inc. | Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples |
US10801064B2 (en) | 2018-05-31 | 2020-10-13 | Personalis, Inc. | Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples |
WO2020069350A1 (en) | 2018-09-27 | 2020-04-02 | Grail, Inc. | Methylation markers and targeted methylation probe panel |
GB2577548B (en) * | 2018-09-28 | 2022-10-26 | Siemens Healthcare Gmbh | Method for determining a subject's genetic copy number value |
KR102215151B1 (ko) | 2018-09-28 | 2021-02-10 | 한양대학교 산학협력단 | 다중 참조 유전체에 기반한 유전체 구조변이 검출 방법 및 구조변이 검출 장치 |
CN111028888B (zh) * | 2018-10-09 | 2024-07-16 | 北京贝瑞和康生物技术有限公司 | 一种全基因组拷贝数变异的检测方法及其应用 |
EP3884502B1 (en) | 2018-11-19 | 2022-11-09 | Sistemas Genómicos, S.L. | Method and computer program product for analysis of fetal dna by massive sequencing |
CN109754845B (zh) * | 2018-12-29 | 2020-02-28 | 浙江安诺优达生物科技有限公司 | 模拟目标疾病仿真测序文库的方法及其应用 |
CN109887546B (zh) * | 2019-01-15 | 2019-12-27 | 明码(上海)生物科技有限公司 | 基于二代测序的单基因或多基因拷贝数检测系统及方法 |
CA3115513A1 (en) * | 2019-06-03 | 2020-12-10 | Illumina, Inc. | Limit of detection based quality control metric |
EP4035161A1 (en) | 2019-09-23 | 2022-08-03 | Grail, LLC | Systems and methods for diagnosing a disease condition using on-target and off-target sequencing data |
WO2021067484A1 (en) | 2019-09-30 | 2021-04-08 | Guardant Health, Inc. | Compositions and methods for analyzing cell-free dna in methylation partitioning assays |
US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
CN117524301B (zh) * | 2024-01-04 | 2024-04-09 | 北京泛生子基因科技有限公司 | 一种拷贝数变异的检测方法、装置以及计算机可读介质 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100216153A1 (en) | 2004-02-27 | 2010-08-26 | Helicos Biosciences Corporation | Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities |
WO2007145612A1 (en) | 2005-06-06 | 2007-12-21 | 454 Life Sciences Corporation | Paired end sequencing |
WO2008045505A2 (en) | 2006-10-10 | 2008-04-17 | Xenomics, Inc. | Compositions, methods and kits for isolating nucleic acids from body fluids using anion exchange media |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
EP3770275A1 (en) * | 2007-07-23 | 2021-01-27 | The Chinese University of Hong Kong | Determining a fetal aneuploidy |
CN101889074A (zh) | 2007-10-04 | 2010-11-17 | 哈尔西恩莫尔丘勒公司 | 采用电子显微镜对核酸聚合物测序 |
WO2009051842A2 (en) | 2007-10-18 | 2009-04-23 | The Johns Hopkins University | Detection of cancer by measuring genomic copy number and strand length in cell-free dna |
LT2562268T (lt) | 2008-09-20 | 2017-04-25 | The Board Of Trustees Of The Leland Stanford Junior University | Neinvazinis fetalinės aneuploidijos diagnozavimas sekvenavimu |
US8620593B2 (en) * | 2009-11-06 | 2013-12-31 | The Chinese University Of Hong Kong | Size-based genomic analysis |
EP2526415B1 (en) | 2010-01-19 | 2017-05-03 | Verinata Health, Inc | Partition defined detection methods |
US9260745B2 (en) | 2010-01-19 | 2016-02-16 | Verinata Health, Inc. | Detecting and classifying copy number variation |
EP2591433A4 (en) | 2010-07-06 | 2017-05-17 | Life Technologies Corporation | Systems and methods to detect copy number variation |
US9029103B2 (en) | 2010-08-27 | 2015-05-12 | Illumina Cambridge Limited | Methods for sequencing polynucleotides |
US8725422B2 (en) | 2010-10-13 | 2014-05-13 | Complete Genomics, Inc. | Methods for estimating genome-wide copy number variations |
MX349568B (es) | 2010-11-30 | 2017-08-03 | Univ Hong Kong Chinese | Deteccion de aberraciones geneticas o moleculares asociadas con el cancer. |
AU2011365507A1 (en) * | 2011-04-14 | 2013-05-02 | Verinata Health, Inc. | Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies |
US9411937B2 (en) | 2011-04-15 | 2016-08-09 | Verinata Health, Inc. | Detecting and classifying copy number variation |
ES2605372T3 (es) | 2011-05-31 | 2017-03-14 | Berry Genomics Co., Ltd. | Un dispositivo para detectar el número de copias de cromosomas fetales o cromosomas de células tumorales |
PL2561103T3 (pl) | 2011-06-29 | 2015-02-27 | Bgi Diagnosis Co Ltd | Nieinwazyjna detekcja anomalii genetycznych płodu |
EP2563937A1 (en) | 2011-07-26 | 2013-03-06 | Verinata Health, Inc | Method for determining the presence or absence of different aneuploidies in a sample |
JP6073902B2 (ja) | 2011-10-06 | 2017-02-01 | セクエノム, インコーポレイテッド | 遺伝的変異の非侵襲的評価のための方法およびプロセス |
US9367663B2 (en) | 2011-10-06 | 2016-06-14 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
ES2741966T3 (es) | 2011-12-31 | 2020-02-12 | Bgi Genomics Co Ltd | Método para detectar una variación genética |
EP2805280B1 (en) | 2012-01-20 | 2022-10-05 | Sequenom, Inc. | Diagnostic processes that factor experimental conditions |
US9892230B2 (en) | 2012-03-08 | 2018-02-13 | The Chinese University Of Hong Kong | Size-based analysis of fetal or tumor DNA fraction in plasma |
EP3573066B1 (en) | 2012-03-13 | 2023-09-27 | The Chinese University Of Hong Kong | Methods for analyzing massively parallel sequencing data for noninvasive prenatal diagnosis |
US10504613B2 (en) | 2012-12-20 | 2019-12-10 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US9920361B2 (en) | 2012-05-21 | 2018-03-20 | Sequenom, Inc. | Methods and compositions for analyzing nucleic acid |
EP2875149B1 (en) | 2012-07-20 | 2019-12-04 | Verinata Health, Inc. | Detecting and classifying copy number variation in a cancer genome |
WO2014039556A1 (en) | 2012-09-04 | 2014-03-13 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
EP2900835A4 (en) | 2012-09-27 | 2016-05-11 | Population Diagnotics Inc | METHODS AND COMPOSITIONS FOR DETECTING AND TREATING DEVELOPMENTAL DISORDERS |
CN105408496A (zh) | 2013-03-15 | 2016-03-16 | 夸登特健康公司 | 检测稀有突变和拷贝数变异的系统和方法 |
CA2915626A1 (en) | 2013-06-17 | 2014-12-24 | Verinata Health, Inc. | Method for determining copy number variations in sex chromosomes |
SI3011051T1 (sl) | 2013-06-21 | 2019-05-31 | Sequenom, Inc. | Postopek za neinvazivno oceno genetskih variacij |
WO2015061359A1 (en) | 2013-10-21 | 2015-04-30 | Verinata Health, Inc. | Method for improving the sensitivity of detection in determining copy number variations |
US10415083B2 (en) | 2013-10-28 | 2019-09-17 | The Translational Genomics Research Institute | Long insert-based whole genome sequencing |
US10318704B2 (en) | 2014-05-30 | 2019-06-11 | Verinata Health, Inc. | Detecting fetal sub-chromosomal aneuploidies |
CA2970501C (en) | 2014-12-12 | 2020-09-15 | Verinata Health, Inc. | Using cell-free dna fragment size to determine copy number variations |
WO2016134452A1 (en) | 2015-02-26 | 2016-09-01 | Titan Medical Inc. | Method and apparatus for providing access for a surgical procedure |
US10095831B2 (en) | 2016-02-03 | 2018-10-09 | Verinata Health, Inc. | Using cell-free DNA fragment size to determine copy number variations |
US11342047B2 (en) | 2017-04-21 | 2022-05-24 | Illumina, Inc. | Using cell-free DNA fragment size to detect tumor-associated variant |
-
2014
- 2014-10-21 WO PCT/US2014/061635 patent/WO2015061359A1/en active Application Filing
- 2014-10-21 US US15/031,246 patent/US10741269B2/en active Active
- 2014-10-21 KR KR1020167013043A patent/KR102373647B1/ko active IP Right Grant
- 2014-10-21 KR KR1020227007542A patent/KR102429186B1/ko active IP Right Grant
- 2014-10-21 EP EP14796611.3A patent/EP3061021B1/en active Active
- 2014-10-21 CN CN201480070158.4A patent/CN105830077B/zh active Active
- 2014-10-21 AU AU2014340239A patent/AU2014340239B2/en active Active
- 2014-10-21 CA CA2928185A patent/CA2928185C/en active Active
- 2014-10-21 EP EP23168928.2A patent/EP4227947A1/en active Pending
- 2014-10-21 JP JP2016525007A patent/JP6534191B2/ja active Active
-
2016
- 2016-04-18 IL IL24517716A patent/IL245177B/en active IP Right Grant
-
2020
- 2020-01-31 AU AU2020200728A patent/AU2020200728C1/en active Active
Also Published As
Publication number | Publication date |
---|---|
AU2014340239A1 (en) | 2016-05-12 |
EP4227947A1 (en) | 2023-08-16 |
US10741269B2 (en) | 2020-08-11 |
KR102373647B1 (ko) | 2022-03-11 |
AU2014340239B2 (en) | 2019-11-28 |
KR20160073405A (ko) | 2016-06-24 |
AU2020200728C1 (en) | 2021-09-09 |
US20160239604A1 (en) | 2016-08-18 |
EP3061021A1 (en) | 2016-08-31 |
EP3061021B1 (en) | 2023-05-10 |
IL245177A0 (en) | 2016-06-30 |
IL245177B (en) | 2019-11-28 |
CA2928185C (en) | 2024-01-30 |
JP2016539630A (ja) | 2016-12-22 |
CA2928185A1 (en) | 2015-04-30 |
WO2015061359A1 (en) | 2015-04-30 |
AU2020200728A1 (en) | 2020-02-20 |
KR102429186B1 (ko) | 2022-08-03 |
CN105830077A (zh) | 2016-08-03 |
KR20220034929A (ko) | 2022-03-18 |
AU2020200728B2 (en) | 2021-05-27 |
CN105830077B (zh) | 2019-07-09 |
BR112016008870A8 (pt) | 2020-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020200728B2 (en) | Method for improving the sensitivity of detection in determining copy number variations | |
JP7021148B2 (ja) | 性染色体におけるコピー数変異を判定するための方法 | |
JP6659672B2 (ja) | 胎児染色体部分異数性およびコピー数変動の検出 | |
BR112016008870B1 (pt) | Método e sistema para avaliação de número de cópias de uma sequência de ácidos nucleicos de interesse em uma amostra de teste, e, método para criar um mascarador de sequência |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171012 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171012 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190522 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6534191 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |