JP2015534807A - 胎児の染色体異数性を検出するための非侵襲的方法 - Google Patents
胎児の染色体異数性を検出するための非侵襲的方法 Download PDFInfo
- Publication number
- JP2015534807A JP2015534807A JP2015538513A JP2015538513A JP2015534807A JP 2015534807 A JP2015534807 A JP 2015534807A JP 2015538513 A JP2015538513 A JP 2015538513A JP 2015538513 A JP2015538513 A JP 2015538513A JP 2015534807 A JP2015534807 A JP 2015534807A
- Authority
- JP
- Japan
- Prior art keywords
- sample
- samples
- chromosome
- dna
- sequencing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 163
- 208000036878 aneuploidy Diseases 0.000 title claims abstract description 120
- 230000001605 fetal effect Effects 0.000 title claims abstract description 112
- 231100001075 aneuploidy Toxicity 0.000 title claims abstract description 93
- 230000002759 chromosomal effect Effects 0.000 title claims abstract description 56
- 239000000523 sample Substances 0.000 claims abstract description 237
- 210000000349 chromosome Anatomy 0.000 claims abstract description 203
- 238000012163 sequencing technique Methods 0.000 claims abstract description 116
- 230000008774 maternal effect Effects 0.000 claims abstract description 62
- 239000012472 biological sample Substances 0.000 claims abstract description 53
- 238000013507 mapping Methods 0.000 claims abstract description 26
- 210000003754 fetus Anatomy 0.000 claims abstract description 25
- 238000003745 diagnosis Methods 0.000 claims abstract description 17
- 238000012360 testing method Methods 0.000 claims description 109
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 claims description 44
- 239000000203 mixture Substances 0.000 claims description 44
- 239000013074 reference sample Substances 0.000 claims description 29
- 230000003322 aneuploid effect Effects 0.000 claims description 27
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 claims description 26
- 238000002360 preparation method Methods 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 22
- 239000008346 aqueous phase Substances 0.000 claims description 21
- 238000001574 biopsy Methods 0.000 claims description 13
- 238000002156 mixing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 230000001376 precipitating effect Effects 0.000 claims description 8
- 238000007689 inspection Methods 0.000 claims description 3
- 108020004414 DNA Proteins 0.000 description 197
- 208000037280 Trisomy Diseases 0.000 description 65
- 238000001514 detection method Methods 0.000 description 57
- 238000012217 deletion Methods 0.000 description 41
- 230000037430 deletion Effects 0.000 description 41
- 238000010187 selection method Methods 0.000 description 26
- 210000002381 plasma Anatomy 0.000 description 24
- 210000004369 blood Anatomy 0.000 description 21
- 239000008280 blood Substances 0.000 description 21
- 238000007481 next generation sequencing Methods 0.000 description 21
- 102000053602 DNA Human genes 0.000 description 20
- 208000011580 syndromic disease Diseases 0.000 description 19
- 239000012634 fragment Substances 0.000 description 18
- 238000007400 DNA extraction Methods 0.000 description 15
- 201000010374 Down Syndrome Diseases 0.000 description 15
- 239000011324 bead Substances 0.000 description 14
- 206010044688 Trisomy 21 Diseases 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000002405 diagnostic procedure Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 12
- 238000003752 polymerase chain reaction Methods 0.000 description 11
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 10
- 230000003321 amplification Effects 0.000 description 10
- 210000004027 cell Anatomy 0.000 description 10
- 238000003199 nucleic acid amplification method Methods 0.000 description 10
- 239000004065 semiconductor Substances 0.000 description 10
- 201000006360 Edwards syndrome Diseases 0.000 description 8
- 208000007159 Trisomy 18 Syndrome Diseases 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 206010053884 trisomy 18 Diseases 0.000 description 8
- 239000000872 buffer Substances 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 230000035935 pregnancy Effects 0.000 description 6
- 238000003793 prenatal diagnosis Methods 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 238000002205 phenol-chloroform extraction Methods 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- 206010011385 Cri-du-chat syndrome Diseases 0.000 description 4
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 4
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 4
- 201000009928 Patau syndrome Diseases 0.000 description 4
- 102100023361 SAP domain-containing ribonucleoprotein Human genes 0.000 description 4
- 102100022978 Sex-determining region Y protein Human genes 0.000 description 4
- 101710139423 THO complex subunit 1 Proteins 0.000 description 4
- 206010044686 Trisomy 13 Diseases 0.000 description 4
- 208000006284 Trisomy 13 Syndrome Diseases 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000002669 amniocentesis Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000005251 capillar electrophoresis Methods 0.000 description 4
- 208000035475 disorder Diseases 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 210000004700 fetal blood Anatomy 0.000 description 4
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 150000007523 nucleic acids Chemical class 0.000 description 4
- 238000003908 quality control method Methods 0.000 description 4
- 108010067770 Endopeptidase K Proteins 0.000 description 3
- 108091092878 Microsatellite Proteins 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- 206010049644 Williams syndrome Diseases 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 238000010241 blood sampling Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 208000009575 Angelman syndrome Diseases 0.000 description 2
- 238000001353 Chip-sequencing Methods 0.000 description 2
- 208000031639 Chromosome Deletion Diseases 0.000 description 2
- 229920002527 Glycogen Polymers 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 102100030680 SH3 and multiple ankyrin repeat domains protein 2 Human genes 0.000 description 2
- 101710067890 SHANK2 Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000002509 fluorescent in situ hybridization Methods 0.000 description 2
- 229940096919 glycogen Drugs 0.000 description 2
- 239000013628 high molecular weight specie Substances 0.000 description 2
- 210000004251 human milk Anatomy 0.000 description 2
- 235000020256 human milk Nutrition 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 108010034760 mannosyl-3-phosphoglycerate synthase Proteins 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 208000030454 monosomy Diseases 0.000 description 2
- 230000003169 placental effect Effects 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 208000026120 1p36 deletion syndrome Diseases 0.000 description 1
- 208000010543 22q11.2 deletion syndrome Diseases 0.000 description 1
- DEXFNLNNUZKHNO-UHFFFAOYSA-N 6-[3-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperidin-1-yl]-3-oxopropyl]-3H-1,3-benzoxazol-2-one Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1CCN(CC1)C(CCC1=CC2=C(NC(O2)=O)C=C1)=O DEXFNLNNUZKHNO-UHFFFAOYSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 206010000234 Abortion spontaneous Diseases 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 206010066470 Amniorrhoea Diseases 0.000 description 1
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 208000026292 Cystic Kidney disease Diseases 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 208000000398 DiGeorge Syndrome Diseases 0.000 description 1
- 101100258093 Drosophila melanogaster stum gene Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 208000011514 Familial renal glucosuria Diseases 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 208000022471 Fetal disease Diseases 0.000 description 1
- 208000004706 Jacobsen Distal 11q Deletion Syndrome Diseases 0.000 description 1
- 208000029279 Jacobsen Syndrome Diseases 0.000 description 1
- 208000031541 Monosomy 18q Diseases 0.000 description 1
- 101100258095 Mus musculus Stum gene Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- ZYFVNVRFVHJEIU-UHFFFAOYSA-N PicoGreen Chemical compound CN(C)CCCN(CCCN(C)C)C1=CC(=CC2=[N+](C3=CC=CC=C3S2)C)C2=CC=CC=C2N1C1=CC=CC=C1 ZYFVNVRFVHJEIU-UHFFFAOYSA-N 0.000 description 1
- 208000005107 Premature Birth Diseases 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 206010038423 Renal cyst Diseases 0.000 description 1
- 101150059736 SRY gene Proteins 0.000 description 1
- 201000001388 Smith-Magenis syndrome Diseases 0.000 description 1
- 201000003696 Sotos syndrome Diseases 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 210000002593 Y chromosome Anatomy 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 239000003150 biochemical marker Substances 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004252 chorionic villi Anatomy 0.000 description 1
- 201000004694 chromosome 18q deletion syndrome Diseases 0.000 description 1
- 201000004723 chromosome 1p36 deletion syndrome Diseases 0.000 description 1
- 208000014360 chromosome 4 short arm deletion Diseases 0.000 description 1
- 108091092240 circulating cell-free DNA Proteins 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002380 cytological effect Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000000890 drug combination Substances 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 210000001182 human Y chromosome Anatomy 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000002032 lab-on-a-chip Methods 0.000 description 1
- 239000013627 low molecular weight specie Substances 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005541 medical transmission Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 208000015994 miscarriage Diseases 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 239000012074 organic phase Substances 0.000 description 1
- 201000003738 orofaciodigital syndrome VIII Diseases 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000010833 quantitative mass spectrometry Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 208000007278 renal glycosuria Diseases 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 208000000995 spontaneous abortion Diseases 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 206010044689 trisomy 22 Diseases 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 230000036266 weeks of gestation Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/166—Oligonucleotides used as internal standards, controls or normalisation probes
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本発明は、無細胞DNAを含む母体生体試料から、胎児の異数性診断用参照試料のセット及び/又は参照パラメータのセットを得るための方法であって、正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセットから無細胞DNAを抽出するステップと;抽出ステップの後、各試料中のDNA分子のサイズ分布を分析して、前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップと;サイズ選択された各試料のDNAの大量並行シーケンシングを実施するステップと;試料ごとに得られた配列をヒトゲノムにマッピングするステップと;参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;参照試料のセット及び/又は参照パラメータのセットを得るステップとを含む方法に関する。【選択図】なし
Description
本発明は、無細胞DNA、特にサイズ選択無細胞DNAを使用する、胎児の異数性の非侵襲的出生前診断に関する。より詳細には、本発明は、極めて向上した感受性及び特異性を提供する外部参照試料のセットを用いることを特徴とする、胎児の異数性の診断方法に関する。本発明は、胎児の異数性の診断に用いられる参照試料並びに参照試料及び/又は参照パラメータのセットを含むキットを得るための方法にも関する。
胎児の染色体異数性の検出は、出生前診断で重要な処置である。いくつかの主要な疾患、例えばダウン症候群(21トリソミーとも呼ばれる)、18トリソミー、13トリソミーは染色体異数性によって引き起こされ、胎児がこれらの異常の1つによる影響を受けているかどうかできるだけ早く予測することが最も重要である。さらに、胎児が異数性に罹る危険は、母体の年齢と共に一般に増加する。したがって、ほとんどの先進国での妊娠女性の平均年齢の上昇は、胎児の染色体異数性を検出するための強力で安全な診断法の必要性をさらに高める。
胎児の染色体異数性の検出は、漿膜絨毛試料採取、羊水穿刺又は臍帯血試料採取などの侵襲的処置を通して一般に実施される。これらの方法は、核型分析のために必要な胎児の細胞を得るために、胎児の生体材料(羊水、絨毛膜絨毛、臍帯血)の収集物に頼ることにおいて共通する。これらの方法は、長い間日常的に実践されている。しかし、それらの侵襲性のために、それらは胎児及び母体にとって危険がないとは限らない。最も頻度の高い危険は流産の可能性であり、羊水穿刺の場合は1%近くである。他の危険、例えば感染症の危険、母体から胎児への疾患の伝染(例えばAIDS又はB型肝炎)、羊水漏出又は早産などが、これらの侵襲的処置と関連している。
超音波スキャン又は母体の血清生化学的マーカーの検出に基づく非侵襲的方法も開発されているが、これらの方法は随伴現象の検出に主に制限され、染色体異常の核心的病理を検出することに対する臨床有用性は限定されている。
1997年における母体血漿中の無細胞胎児核酸の発見は、新しい可能性を開いた。胎児の染色体量を評価するためのこれらの核酸を使用する第1の戦略は、SNPの対立遺伝子比率分析による胎児染色体量の評価に基づく、標的核酸(胎盤特異的DNAメチル化サインを有する胎盤mRNA及びDNA分子)でのSNPの対立遺伝子の比の分析をベースとしていた。ごく近年では、デジタルPCRを使用して、別の戦略が開発された(Loら、2007)。この技術は、母体血漿中の潜在的な異数性染色体(例えば第21染色体)の上の特定座位の全量を測定し、この量を参照染色体上のそれと比較することからなる。
2008年に、Chiuらは、母体血漿で胎児の21トリソミーを診断する方法において大量並行シーケンシングに成功した(Chiuら、2008)。彼らの方法は、血漿試料から抽出されたDNAで大量並行シーケンシングを実行することからなる。MPGSステップから得られた配列をヒトゲノムの参照配列と次に整列させ、ミスマッチなしでヒトゲノムの上に位置に固有にマッピングされた配列の数を各染色体について数え、MPGSの間に得られた配列の総数と比較する。この比は、母体血漿試料で見出されるDNA分子の「染色体表示」の指標を提供する。正倍数体として既知の参照試料セットと比較して、所与の試料での第21染色体の過剰表示は、胎児の21トリソミーの指標である。
ほぼ同時に、Fanらは、無細胞血漿のショットガンシーケンシングを使用して、胎児の21トリソミーの診断のための別の方法の開発に成功を収めた(Fanら、2008)。母体血漿試料から抽出された無細胞DNAを大規模にシーケンシングした後に、Fanらは、各配列をヒトゲノムにマッピングした。次にヒトゲノムの各染色体を50kbビンに分け、各ビンにつき、多くても1つのミスマッチを有するヒトゲノムに固有にマッピングされた配列タグの数を数えた。次にFanらは、各染色体にわたる配列タグのこのカウントの中間値を計算した。最後に、Fanらは、21トリソミーに罹った胎児を妊娠している母体に由来する血漿の第21染色体配列のタグ密度を、正倍数性の胎児を妊娠している母体に由来する血漿のそれと比較し、彼らは、21トリソミー配列タグ密度が99%信頼レベルで正倍数性試料のそれより高いことに気がついた。
これらの技術はいずれも、正倍数性参照試料と比較した所与の染色体の過剰表示の検出に依存する。それらは有益な「概念実証」を提供し、胎児の異数性の診断での次世代のシーケンシング技術の効率的利用のための道を開いた。しかし、日常の臨床場面でのその方法の実行は、先行技術で現在記載されているものより高いレベルの感度及び特異性を必要とする。
全ゲノム次世代シーケンシング(WG−NGS)で胎児の異数性を検出する非侵襲的出生前診断の感度は、母体血漿中の胎児DNAの割合及びシーケンシングの深度に依存する。胎児DNAの割合は一連のほぼ固有の生物学的変数に依存するが、実験上の改変を受ける技術的変数には、i)DNA抽出手順の効率、ii)NGSの精度及び処理量、すなわち、シーケンシングされたゲノムと整列させることができる固有の正確な一致を有する配列タグ(「ミスマッチのない固有同一配列(unique exact sequences)」又は「UES」と呼ばれる)の割合、及びシーケンシングされた分子の総数、iii)バイオインフォマティクアルゴリズムの性質、並びにiv)参照セットを提供する正常な胎児核型をもつ妊娠女性からの試料の対照群が含まれる。各単一の染色体についての個々の分子計数は全ての常染色体の中間配列タグ密度で標準化されるので、後者が最も重要である(Fanら、2008)。
本発明は、非侵襲的出生前診断のためにこれまで使用されておらず、標準方法より5倍大きな収率を有するDNA抽出法を、公表された参照より全体的に25〜30%多くのUES及び現行の標準より3倍高い15×106を超えるUESの平均総カウントによる厳しく品質管理されたNGSワークフローと一緒に実行する。試験の最終読み出しは、頑健な臨床試験の必要条件、すなわち主要な胎児の異数性について100%の感度及び100%の特異性に適合する。この手法は、例えば、偶然に誤った結果をもたらす≦1.1×10−5の事前確率で、21トリソミー又はダウン症候群を正常な雄及び雌の核型と区別する。基準は≦2.7×10−3なので、それは2桁の向上を表す。本発明は配列の高品質の参照セットの構築を可能にする方法の組合せを提供し、それはNGS手法の性能を規定するための鍵となるステップである。
したがって、本発明の第1の態様は、母体生体試料、好ましくは血液試料から、胎児の異数性診断用参照試料のセット及び/又は参照パラメータのセットを得るための方法であって、
正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料、好ましくは血液試料のセットから無細胞DNAを抽出するステップと;
各試料のDNAの大量並行シーケンシングを実施するステップと;
試料ごとに得られた配列をヒトゲノムにマッピングするステップと;
任意選択で参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
参照試料のセット及び/又は参照パラメータのセットを得るステップと
を含む方法に関し、前記方法は以下の追加のステップ/機構の少なくとも1つを含む:
各生体試料からの無細胞DNAの抽出は、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと;
沈殿したDNAを任意選択で収集するステップとを含む。
抽出ステップの後、各試料中のDNA分子のサイズ分布を分析して、前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップ;
抽出ステップ又はDNA分子のサイズ分布に基づく選択ステップの後、各試料のDNAをプレシーケンスし、得られた配列をヒトゲノムにマッピングし、ヒトゲノムにマッピングした固有同一配列の量に基づいて試料のセットを選択するステップ;
大量並行シーケンシングから得られた配列をマッピングするステップの後、ヒトゲノムにマッピングした固有同一配列の数に基づいて試料のセットを選択するステップ。
正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料、好ましくは血液試料のセットから無細胞DNAを抽出するステップと;
各試料のDNAの大量並行シーケンシングを実施するステップと;
試料ごとに得られた配列をヒトゲノムにマッピングするステップと;
任意選択で参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
参照試料のセット及び/又は参照パラメータのセットを得るステップと
を含む方法に関し、前記方法は以下の追加のステップ/機構の少なくとも1つを含む:
各生体試料からの無細胞DNAの抽出は、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと;
沈殿したDNAを任意選択で収集するステップとを含む。
抽出ステップの後、各試料中のDNA分子のサイズ分布を分析して、前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップ;
抽出ステップ又はDNA分子のサイズ分布に基づく選択ステップの後、各試料のDNAをプレシーケンスし、得られた配列をヒトゲノムにマッピングし、ヒトゲノムにマッピングした固有同一配列の量に基づいて試料のセットを選択するステップ;
大量並行シーケンシングから得られた配列をマッピングするステップの後、ヒトゲノムにマッピングした固有同一配列の数に基づいて試料のセットを選択するステップ。
本方法は、これらの追加のステップ若しくは機構のいずれか1つ、これらの追加のステップ若しくは機構の2つか3つの任意の組合せ、又は4つの追加のステップ及び機構を含むことができる。
本発明の方法は、特に抽出ステップの直後及び大量並行シーケンシングの前に、無細胞DNAのサイズ選択のステップを含むことが好ましい。この実施形態により、本発明は、無細胞DNAを含む母体生体試料から、胎児の異数性診断用参照試料のセット及び/又は参照パラメータのセットを得るための方法であって、
正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセットから無細胞DNAを抽出するステップと;
抽出ステップの後、各試料中のDNA分子のサイズ分布を分析して、前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップと;
サイズ選択された各試料のDNAの大量並行シーケンシングを実施するステップと;
試料ごとに得られた配列をヒトゲノムにマッピングするステップと;
参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
参照試料のセット及び/又は参照パラメータのセットを得るステップと
を含む方法に関する。
正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセットから無細胞DNAを抽出するステップと;
抽出ステップの後、各試料中のDNA分子のサイズ分布を分析して、前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップと;
サイズ選択された各試料のDNAの大量並行シーケンシングを実施するステップと;
試料ごとに得られた配列をヒトゲノムにマッピングするステップと;
参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
参照試料のセット及び/又は参照パラメータのセットを得るステップと
を含む方法に関する。
サイズ選択ステップを含む参照試料のセットを得るためのそのような方法の好ましい例は、
a)正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセット、及び任意選択で異数性胎児を妊娠している正倍数性妊娠女性から得られたさらなる生体試料のセットから無細胞DNAを抽出するステップと;
b)特に200bpを超えるサイズを有する無細胞DNA分子を除去するために、抽出された無細胞DNAの試料をサイズ選択ステップにかけるステップと;
c)シーケンシングライブラリーの調製のために、ステップ(b)で得られたサイズ選択された抽出されたDNA試料を、例えばDNA分子の末端修復及びシーケンシングアダプターのライゲート、それに続き任意選択でアダプターをライゲートした断片の増幅によって処理するステップと;
d)(c)で得られたサイズ選択された各試料のDNAの大量並行シーケンシングを実施するステップと;
e)試料ごとにステップ(d)で得られた配列をヒトゲノムにマッピングするステップと;
f)参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
g)参照試料のセット及び/又は参照パラメータのセットを得るステップと
を含む。
a)正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセット、及び任意選択で異数性胎児を妊娠している正倍数性妊娠女性から得られたさらなる生体試料のセットから無細胞DNAを抽出するステップと;
b)特に200bpを超えるサイズを有する無細胞DNA分子を除去するために、抽出された無細胞DNAの試料をサイズ選択ステップにかけるステップと;
c)シーケンシングライブラリーの調製のために、ステップ(b)で得られたサイズ選択された抽出されたDNA試料を、例えばDNA分子の末端修復及びシーケンシングアダプターのライゲート、それに続き任意選択でアダプターをライゲートした断片の増幅によって処理するステップと;
d)(c)で得られたサイズ選択された各試料のDNAの大量並行シーケンシングを実施するステップと;
e)試料ごとにステップ(d)で得られた配列をヒトゲノムにマッピングするステップと;
f)参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
g)参照試料のセット及び/又は参照パラメータのセットを得るステップと
を含む。
試料の参照セットを得ることにおいて、無細胞DNAを抽出する生体試料のセットは、異数性胎児を妊娠している正倍数性の妊娠女性から得られた試料をさらに含むことが特に好ましい。この方法で、参照セットは、正倍数性と異数性の両方の試料の参照値を提供する。
代替実施形態では、無細胞DNAを含有する母体生体試料から胎児の異数性診断用参照試料のセットを得る方法は、大量並行シーケンシングの前に、サイズ選択された試料のサブセットのプレシーケンス及びマッピングのステップを含む。この代替実施形態により、本方法は、
(i)正倍数性胎児を妊娠している正倍数性妊娠女性のセットから得られた生体試料、好ましくは血液試料のセットから無細胞DNAを抽出するステップと;
(ii)各試料中のDNA分子のサイズ分布を分析するステップと;
(iii)前記試料中のDNA分子のサイズ分布に基づいて試料の第1のセットを選択するステップと;
(iv)試料の前記第1のセットからの各試料のDNAをプレシーケンスするステップと;
(v)ステップ(iv)で得られた配列をヒトゲノムにマッピングするステップと;
(vi)ステップ(v)でヒトゲノムにマッピングされた固有同一配列の量に基づいて試料の第2のセットを選択するステップと;
(vii)試料の前記第2のセットからの各試料のDNAを大量並行シーケンシングするステップと;
(viii)ステップ(vii)で得られた配列をヒトゲノムにマッピングするステップと;
(ix)ステップ(viii)でヒトゲノムにマッピングされた固有同一配列の数に基づいて参照試料のセットを選択するステップと
を含む。
(i)正倍数性胎児を妊娠している正倍数性妊娠女性のセットから得られた生体試料、好ましくは血液試料のセットから無細胞DNAを抽出するステップと;
(ii)各試料中のDNA分子のサイズ分布を分析するステップと;
(iii)前記試料中のDNA分子のサイズ分布に基づいて試料の第1のセットを選択するステップと;
(iv)試料の前記第1のセットからの各試料のDNAをプレシーケンスするステップと;
(v)ステップ(iv)で得られた配列をヒトゲノムにマッピングするステップと;
(vi)ステップ(v)でヒトゲノムにマッピングされた固有同一配列の量に基づいて試料の第2のセットを選択するステップと;
(vii)試料の前記第2のセットからの各試料のDNAを大量並行シーケンシングするステップと;
(viii)ステップ(vii)で得られた配列をヒトゲノムにマッピングするステップと;
(ix)ステップ(viii)でヒトゲノムにマッピングされた固有同一配列の数に基づいて参照試料のセットを選択するステップと
を含む。
具体的な実施形態では、ステップ(iii)は、DNA分子の少なくとも90重量%、好ましくは95重量%より多くが156bp〜176bpのサイズを有する試料を選択するステップを含む。
別の実施形態では、ステップ(iii)は、少なくとも0.88ng/μlの、サイズが156bp〜176bpのDNA分子を有する試料を選択するステップを含む。
別の実施形態では、ステップ(iv)は、各試料中の1000〜100000個の配列をシーケンシングするステップを含む。
別の実施形態では、ステップ(vi)は、ステップ(iv)で得られた配列の総数に対して少なくとも70%の固有同一配列を有する試料を選択するステップを含む。
別の実施形態では、ステップ(vii)は、試料ごとに少なくとも25,000,000個の配列をシーケンシングするステップを含む。別の実施形態では、ステップ(vii)は、試料ごとに少なくとも25,000,000個のフィルターを通過するリードを得るステップを含む。
別の実施形態では、ステップ(ix)は、15,000,000個を超える固有同一配列のリードを有する試料を選択するステップを含む。
本発明は、母体生体検査試料、好ましくは血液試料から胎児の異数性を診断する方法であって、
(a)妊娠女性から得られた母体生体検査試料から無細胞DNAを抽出するステップと;
(b)前記検査試料から抽出される無細胞DNAを大量並行シーケンシングするステップと;
(c)ステップ(b)で得られた配列をヒトゲノムにマッピングするステップと;
(d)対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータを計算するステップと;
(e)参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、参照試料のセット、例えば正倍数性参照試料のセット、例えば本発明により得られたセットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
(f)ステップ(d)で計算された前記検査パラメータをステップ(e)で計算された参照パラメータの前記セットと比較するステップと;
(g)比較に基づいて胎児の異数性を診断するステップと
を含む方法にも関する。
(a)妊娠女性から得られた母体生体検査試料から無細胞DNAを抽出するステップと;
(b)前記検査試料から抽出される無細胞DNAを大量並行シーケンシングするステップと;
(c)ステップ(b)で得られた配列をヒトゲノムにマッピングするステップと;
(d)対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータを計算するステップと;
(e)参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、参照試料のセット、例えば正倍数性参照試料のセット、例えば本発明により得られたセットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
(f)ステップ(d)で計算された前記検査パラメータをステップ(e)で計算された参照パラメータの前記セットと比較するステップと;
(g)比較に基づいて胎児の異数性を診断するステップと
を含む方法にも関する。
胎児の異数性の診断の好ましい方法は、抽出ステップの後、前記試料中のDNA分子のサイズに基づくサイズ選択ステップが実施される、上記方法を含む。サイズ選択ステップは、サイズが200bpを超えるDNA分子を検査試料から実質的に排除する。このステップは、シーケンシングライブラリーの調製の前に実行されることが好ましい。この診断方法は、上記の無細胞DNAサイズ選択ステップも受けた参照試料と併用することが特に好ましい。実際、本発明により、検査試料が参照試料と同じ方法で処理されることが好ましい。
この好ましい実施形態により、母体生体検査試料、好ましくは血液試料から胎児の異数性を診断する方法は、
(a)妊娠女性から得られた血液などの母体生体検査試料から無細胞DNAを抽出するステップと;
(b)サイズが200bpを超えるDNA分子が試料から実質的に排除されるように、抽出された無細胞DNAに対してサイズ選択ステップを実施するステップと;
(c)シーケンシングライブラリーの調製のために、サイズ選択された抽出された無細胞DNAを、例えばDNA分子の末端修復及びシーケンシングアダプターのライゲート、それに続き任意選択でアダプターをライゲートした断片の増幅によって処理するステップと;
(d)ステップ(c)で得られた無細胞DNAを大量並行シーケンシングするステップと;
(e)ステップ(d)で得られた配列をヒトゲノムにマッピングするステップと;
(f)対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータを計算するステップと;
(g)参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、参照試料のセット、例えば本発明のサイズ選択法により得られた正倍数性参照試料のセットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
(h)ステップ(f)で計算された前記検査パラメータをステップ(g)で計算された参照パラメータの前記セットと比較するステップと;
(i)比較に基づいて胎児の異数性を診断するステップと
を含む。
(a)妊娠女性から得られた血液などの母体生体検査試料から無細胞DNAを抽出するステップと;
(b)サイズが200bpを超えるDNA分子が試料から実質的に排除されるように、抽出された無細胞DNAに対してサイズ選択ステップを実施するステップと;
(c)シーケンシングライブラリーの調製のために、サイズ選択された抽出された無細胞DNAを、例えばDNA分子の末端修復及びシーケンシングアダプターのライゲート、それに続き任意選択でアダプターをライゲートした断片の増幅によって処理するステップと;
(d)ステップ(c)で得られた無細胞DNAを大量並行シーケンシングするステップと;
(e)ステップ(d)で得られた配列をヒトゲノムにマッピングするステップと;
(f)対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータを計算するステップと;
(g)参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、参照試料のセット、例えば本発明のサイズ選択法により得られた正倍数性参照試料のセットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
(h)ステップ(f)で計算された前記検査パラメータをステップ(g)で計算された参照パラメータの前記セットと比較するステップと;
(i)比較に基づいて胎児の異数性を診断するステップと
を含む。
母体生体検査試料からの無細胞DNAの抽出は、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと;
沈殿したDNAを任意選択で収集するステップと
を含むことが好ましい。
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと;
沈殿したDNAを任意選択で収集するステップと
を含むことが好ましい。
具体的な実施形態では、前記検査パラメータは、全ての常染色体の中間固有同一配列タグ密度に標準化した対象の染色体又は染色体領域の固有の配列タグ密度である。
別の実施形態では、前記検査パラメータは、全ての染色体にマッピングされた固有同一配列の総数に対する、又は全ての常染色体にマッピングされた固有同一配列の総数に対する、前記染色体又は染色体領域にマッピングされた固有同一配列の百分率である。
別の実施形態では、ステップ(f)の比較は、参照パラメータのセットに対する前記検査パラメータのzスコアの計算によって実行される。
別の実施形態では、検査パラメータは、対象の染色体若しくは染色体領域の絶対同一配列カウント、又は対象の染色体若しくは染色体領域の平均同一配列カウントである。
さらなる実施形態では、ステップ(f)の比較は、対象の染色体若しくは染色体領域の固有同一配列カウント、又は対象の染色体若しくは染色体領域の平均同一配列カウントが、参照セットの対象の染色体の固有同一配列カウントの正規分布に属する確率の計算によって実施される。
別の実施形態では、対象の染色体は、第21染色体、第18染色体、第16染色体、第11染色体又は第13染色体である。
別の実施形態では、対象の染色体は第21染色体であり、21トリソミー試料のzスコアは少なくとも4.4であるが、第21染色体の正倍数性試料のzスコアの絶対値は4.4未満である。
本発明は、胎児と母体の無細胞DNAを含有する母体生体試料から無細胞DNAを抽出する方法であって、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと;
沈殿したDNAを任意選択で収集するステップと
を含む方法にも関する。
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと;
沈殿したDNAを任意選択で収集するステップと
を含む方法にも関する。
本発明は、胎児と母体の無細胞DNAを含有する母体生体試料から無細胞DNAを抽出するための、クロロホルム及びフェノール、好ましくはクロロホルム及びフェノールを含む組成物の使用にも関する。具体的な態様では、前記使用は、母体生体試料から胎児の異数性診断用参照試料のセットを得る方法におけるものである。
別の態様では、前記使用は、母体生体検査試料から胎児の異数性を診断するための方法におけるものである。
本発明は、本発明の方法により入手可能な参照試料のセットにも関する。
本発明は、母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の1つ又は複数のステップを実行するための、コンピュータプログラム製品にも関する。
本発明は、母体生体検査試料から胎児の異数性を診断するための方法の1つ又は複数のステップ、例えばステップ(d)から(g)の1つ又は複数を実行するための、コンピュータプログラム製品にも関する。
本発明は、
無細胞DNAを抽出するための、例えばフェノール及びクロロホルムを含む組成物を含む、1つ又は複数の組成物及び/又はキット;
本発明の方法により入手可能な参照試料のセット;
コンピュータ可読媒体などの物理的支持体に任意選択で含まれる、本発明による方法で入手できる参照パラメータのセット;
母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品;
母体生体検査試料から胎児の異数性を診断するための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品
の1つ又は複数を含むキットにも関する。
無細胞DNAを抽出するための、例えばフェノール及びクロロホルムを含む組成物を含む、1つ又は複数の組成物及び/又はキット;
本発明の方法により入手可能な参照試料のセット;
コンピュータ可読媒体などの物理的支持体に任意選択で含まれる、本発明による方法で入手できる参照パラメータのセット;
母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品;
母体生体検査試料から胎児の異数性を診断するための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品
の1つ又は複数を含むキットにも関する。
好ましい実施形態により、胎児の異数性の診断のためのキットは、
本発明の方法により入手可能な参照試料のセット、例えばサイズが≦200bpの無細胞DNAのために試料を濃縮するためにサイズ選択を受け、200bpを超えるDNA分子を排除し、正倍数性胎児を妊娠している正倍数性妊娠女性からの試料に加えて異数性胎児を妊娠している正倍数性妊娠女性からの試料も含む試料のセット、
及び/又は参照パラメータのセットであって、ここで各参照パラメータは、任意選択で物理的支持体に含まれる本発明の方法により入手可能な参照セットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、参照パラメータのセットを含み、
そのようなキットは、
無細胞DNAを抽出するための、フェノール及びクロロホルムを含む組成物などの、1つ又は複数の組成物及び/又はキット;
母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品;
母体生体検査試料から胎児の異数性を診断するための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品
の少なくとも1つをさらに含むことができる。
本発明の方法により入手可能な参照試料のセット、例えばサイズが≦200bpの無細胞DNAのために試料を濃縮するためにサイズ選択を受け、200bpを超えるDNA分子を排除し、正倍数性胎児を妊娠している正倍数性妊娠女性からの試料に加えて異数性胎児を妊娠している正倍数性妊娠女性からの試料も含む試料のセット、
及び/又は参照パラメータのセットであって、ここで各参照パラメータは、任意選択で物理的支持体に含まれる本発明の方法により入手可能な参照セットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、参照パラメータのセットを含み、
そのようなキットは、
無細胞DNAを抽出するための、フェノール及びクロロホルムを含む組成物などの、1つ又は複数の組成物及び/又はキット;
母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品;
母体生体検査試料から胎児の異数性を診断するための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品
の少なくとも1つをさらに含むことができる。
定義
本明細書で用いるように、用語「次世代シーケンシング」(NGS)又は「大量並行シーケンシング」は同義語であり、何十万ものシーケンシング工程が並行実施されるハイスループットシーケンシング方法を指す。次世代シーケンシング方法は、一回の実行で数百万の配列を得るために有益である。これらの方法には、単一分子リアルタイムシーケンシング、イオン半導体シーケンシング、ピロシーケンシング、合成によるシーケンシング、ライゲーションによるシーケンシングが含まれる。
本明細書で用いるように、用語「次世代シーケンシング」(NGS)又は「大量並行シーケンシング」は同義語であり、何十万ものシーケンシング工程が並行実施されるハイスループットシーケンシング方法を指す。次世代シーケンシング方法は、一回の実行で数百万の配列を得るために有益である。これらの方法には、単一分子リアルタイムシーケンシング、イオン半導体シーケンシング、ピロシーケンシング、合成によるシーケンシング、ライゲーションによるシーケンシングが含まれる。
本明細書で用いるように、用語「無細胞DNA」は、生体試料、例えば血液中で自由に循環するDNA分子又はDNA分子のセットを指す。同義語は、「循環DNA」である。無細胞DNAは細胞外にあり、この用語は、例えば細胞の核又はミトコンドリアで見出すことができる細胞内DNAと対照的に使用される。
本明細書で用いるように、異数性という用語は、1つの染色体の定量的量が二倍体ゲノムの定量的量と変動していることを指す。変動は、増加又は損失であってもよい。それは、染色体全体に関連する場合もあるし、又はその一部だけに関連する場合もあり、例えば染色体の所定領域のみに関連する場合もある。異数性は、モノソミー(1つの染色体の欠如)、部分的モノソミー(染色体の一部の転位又は欠失)、トリソミー(1つの余分の染色体の増加)、部分的トリソミー(染色体の一部の増加及び/又は重複)を含むことができる。本明細書において、正倍数性は異数性の反対を意味するために使用され、すなわち正倍数性試料は二倍体のゲノム、染色体又は染色体の一部を指す。例えば、第21染色体についての個々の正倍数体は、第21染色体の2つのコピーを有する。
モノソミー又は部分的モノソミーの例には、ウルフ−ハーシュホーン症候群、ネコ鳴き症候群、5q欠失症候群、ウィリアムズ症候群、ヤコブセン症候群、アンゲルマン症候群、プラダー−ビリ症候群、ミラー−ジーカー症候群、スミス−マゲニス症候群、18q欠失症候群、ディジョージ症候群が含まれる。
トリソミーの例には、1トリソミー、2トリソミー、3トリソミー、4トリソミー、5トリソミー、6トリソミー、7トリソミー、8トリソミー(ワーカニー症候群)、9トリソミー、10トリソミー、11トリソミー、12トリソミー、13トリソミー(パトー症候群)、14トリソミー、15トリソミー、16トリソミー、17トリソミー、18トリソミー(エドワーズ症候群)、19トリソミー、20トリソミー、21トリソミー(ダウン症候群)、22トリソミーが含まれる。1つ又はいくつかの染色体領域の損失(欠失)が関与する障害の他の例には、1p36欠失症候群、TAR欠失、1q21.1欠失、2q11.2欠失、2q11.2q13欠失、2q13欠失、2q37欠失、3q29欠失、ウルフ−ハーシュホーン欠失、ソトス症候群欠失、6q16欠失、ウィリアムズ症候群欠失、WBS遠位欠失、8p23.1欠失、9q34欠失、10q23欠失、ポトキ−シェーファー症候群、SHANK2 FGF欠失、12q14欠失症候群、13q12欠失、15q11.2欠失、プラダー−ビリ/アンゲルマン症候群、15q13.3欠失、15q24 BP0−BP1欠失、15q24 BP0−BP1欠失、15q24 BP2−BP3欠失、15q25.2欠失、ルービンスタイン−テービ症候群、16p13.11欠失、16p11.2p12.1欠失、16p12.1欠失、16p11.2遠位欠失、16p11.2欠失、17p13.3欠失、17p13.3欠失、HNPP、スミス−マゲニス症候群欠失、NF1欠失症候群、RCAD(腎嚢胞及び糖尿病)、17q21.31欠失、ディジョージ/VCFS欠失、22q11.2遠位欠失、フェラン−マクダーミド症候群が含まれる。
1つ又はいくつかの染色体領域の増加(重複)が関与する障害の他の例には、1p36重複、1q21.1重複、2q11.2重複、2q11.2q13重複、2q13重複、2q37重複、3q29重複、ウルフ−ハーシュホーン領域重複、5q35重複、6q16重複、ウィリアムズ症候群重複、WBS遠位重複、8p23.1重複、9q34重複、10q23重複、11p11.2重複、SHANK2 FGF重複、12q14重複、13q12重複、15q11.2重複、プラダー−ビリ/アンゲルマン領域重複、15q13.3重複、15q24 BP0−BP1重複、15q24 BP2−BP3重複、15q25.2重複、ルービンスタイン−テービ領域重複、16p13.11重複、16p11.2p12.1重複、16p12.1重複、16p11.2遠位重複、16p11.2重複、17p13.3重複、17p13.3重複、17p13.3重複、CMT1A、ポトキ−ルプスキ症候群、NF1重複、17q12重複、17q21.31重複、22q11.2重複、22q11.2遠位重複、22q13重複が含まれる。
10Mb未満の染色体の一部のコピー数変動が関与する異数性関連のゲノム障害の包括的レビューと一緒に、これらの障害に関する参考文献は、本明細書に参照により組み込まれているCooperら、2011、に見出すことができる。
本明細書で用いるように、用語「正倍数性試料」は、正倍数性の胎児を妊娠している正倍数性の母体から得られた試料を指す。用語「正倍数性」は相対的な意味で、すなわち対象の特定の染色体又は染色体領域に関して使用することができる。或いは、用語「正倍数性」は、絶対的な意味で、すなわち全ゲノムに関して使用することができる。この場合には、正倍数性試料は、その全ゲノムにわたっていかなる異数性によっても冒されない。
本明細書で用いるように、用語「異数性試料」は、異数性の胎児を妊娠している正倍数性の母体から得られた試料を指す。「正倍数性」と同様に、用語「異数性」は、対象の特定の染色体若しくは染色体領域に関して、又は全ゲノムに関して使用することができる。
本明細書で用いるように、用語「固有同一配列」は、いかなるミスマッチもなくヒトゲノムに固有にマッピングされた配列を指す。言い換えると、配列はヒトゲノムの単一の位置で整列しており、前記位置と正確に同じ配列を有し、すなわち、ヒトゲノムの前記位置で見出される配列に関していかなる欠失、付加又は突然変異もない。固有同一配列は、20〜100bp、好ましくは40〜70bp、さらに好ましくは50bpの長さを一般に有する。本明細書において、用語「固有同一配列」(UES)は、用語「固有の正確な一致」(UEM:unique exact match)と同義的に使用される。
本明細書で用いるように、「母体生体試料」などでの「母体試料」は、妊娠女性から得られた試料である。
本明細書で用いるように、「生体試料」は、好ましくは無細胞DNAを含有する生体試料を指し、より好ましくは全血、血漿、血清、尿又は母乳試料を指す。
本発明の第1の態様は、正倍数性の参照生体試料のセット、又は正倍数性と異数性の両方の参照試料のセットの構築に関し、ここで各参照試料は、胎児の異数性診断方法の統計的信頼度を高めるように慎重に選択される。この選択工程のワークフローは、いくつかの重要な選択ステップを含む:
試料中のDNAのサイズ分布に基づく選択(ステップ(ii)及び(iii));
試料をプレシーケンシングして、得られた配列をヒトゲノムにマッピングすることによって得られた固有同一配列の量に基づく選択(ステップ(iv)〜(vi));
試料のシーケンシングを実施し、得られた配列をヒトゲノムにマッピングすることによって得られた固有同一配列の量に基づく選択(ステップ(vii)〜(ix));
本発明による方法は、3つの前述の選択ステップのいずれかを含むことができる。しかし、好ましい実施形態では、3つの選択ステップの全てが実施され、このように、参照試料の最終セットの品質を向上させる。
試料中のDNAのサイズ分布に基づく選択(ステップ(ii)及び(iii));
試料をプレシーケンシングして、得られた配列をヒトゲノムにマッピングすることによって得られた固有同一配列の量に基づく選択(ステップ(iv)〜(vi));
試料のシーケンシングを実施し、得られた配列をヒトゲノムにマッピングすることによって得られた固有同一配列の量に基づく選択(ステップ(vii)〜(ix));
本発明による方法は、3つの前述の選択ステップのいずれかを含むことができる。しかし、好ましい実施形態では、3つの選択ステップの全てが実施され、このように、参照試料の最終セットの品質を向上させる。
生体試料収集物
本発明による方法は、無細胞DNA、特に胎児と母体の無細胞DNAを見出すことができる任意の生体試料で一般に実施することができる。生体試料は、特に血液、尿、母乳などの体液であってもよい。血液試料が好ましい。本明細書で言及される場合、血液試料は全血試料、血漿試料又は血清試料を指す。生体試料は妊娠中の任意のときに回収されてもよいが、好ましくは妊娠7週以降、例えば妊娠7週〜20週、好ましくは妊娠7〜14週、なお好ましくは妊娠7〜10週に回収される。妊娠7週のように早く実施される診断は、妊娠を中絶する決定がとられる場合により多くの医療選択肢を保留する利点を提供する(例えば、国内法令に従い薬物又は薬物の組合せの使用を通しての中絶を可能にすることができる)。
本発明による方法は、無細胞DNA、特に胎児と母体の無細胞DNAを見出すことができる任意の生体試料で一般に実施することができる。生体試料は、特に血液、尿、母乳などの体液であってもよい。血液試料が好ましい。本明細書で言及される場合、血液試料は全血試料、血漿試料又は血清試料を指す。生体試料は妊娠中の任意のときに回収されてもよいが、好ましくは妊娠7週以降、例えば妊娠7週〜20週、好ましくは妊娠7〜14週、なお好ましくは妊娠7〜10週に回収される。妊娠7週のように早く実施される診断は、妊娠を中絶する決定がとられる場合により多くの医療選択肢を保留する利点を提供する(例えば、国内法令に従い薬物又は薬物の組合せの使用を通しての中絶を可能にすることができる)。
生体試料は、漿膜絨毛試料採取、羊水穿刺又は臍帯血試料採取などの侵襲的出生前処置の後に収集することができる。それらは、侵襲的処置の後の任意の時間に、例えば侵襲的処置の少なくとも10分、20分又は30分後に収集することができる。生体試料は、侵襲的処置の少なくとも1日又は複数日後に、例えば侵襲的処置の2〜5日後にも収集することもできる。
或いは、生体試料は、侵襲的出生前処置をまだ受けていない女性から収集することができる。本方法の利点はまさにあらゆる侵襲的処置を回避することにあるので、この状況は診断される生体試料にとって好ましい。
参照セットの形成を意図する試料での胎児の異数性状態は、本発明による方法とは別に診断されてもよい。このことは、試料の参照セットを形成するために使用される試料が実際に正倍数性試料であること、言い換えると正倍数性の胎児を妊娠している正倍数性の母体から得られた試料であることを確かめるために有益であると予想される。試料の参照セットを得るために使用される正倍数性試料は、好ましくは上述した用語の「絶対的」定義に従って正倍数性であり、すなわち、それらは対象の特定の染色体についてだけでなくゲノム全体にわたり正倍数性である。上に示すように、本発明の好ましい変異形により、参照試料を構築する予定の試料は、異数性胎児、例えば21、18又は13トリソミーを有する胎児を妊娠している正倍数性の母体からの試料をさらに含むことができる。前と同じように、そのような試料での胎児の異数性状態は、本発明による方法とは別に診断されてもよい。
胎児の異数性状態を評価するための方法は、侵襲的出生前診断処置、例えば羊水穿刺、漿膜絨毛試料採取又は臍帯血試料採取によって母体から胎児の細胞材料を収集することを含むことができる。胎児の異数性状態は、以下の技術のいずれかによって次に評価することができる:核型分析、蛍光In Situハイブリダイゼーション(FISH)、ショートタンデムリピートの定量的ポリメラーゼ連鎖反応(PCR)、定量的蛍光PCR(QF−PCR)、定量的リアルタイムPCR(RT−PCR)量分析、一塩基多型の定量的質量分析及び比較ゲノムハイブリダイゼーション(CGH)。
ほとんどの場合、ほとんどの異数性関連の疾患は症候性なので、母体の異数性状態は既知である。しかし、必要ならば、母体の異数性状態は、母体から得られた細胞材料を用いて評価することもできる。前記の技術のいずれかを用いることができる。
無細胞DNA抽出
本発明による方法の重要なパラメータは、母体生体試料からの効率的なDNA抽出である。無細胞DNA抽出は、フェノール−クロロホルム抽出のプロトコルを通して実施されることが好ましい。抽出プロトコルは、一般的に以下のステップを含む:
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップ;
前記混合物から水相を抽出するステップ;
前記水相から無細胞DNAを沈殿させるステップ;
任意選択で無細胞DNAを収集するステップ。
本発明による方法の重要なパラメータは、母体生体試料からの効率的なDNA抽出である。無細胞DNA抽出は、フェノール−クロロホルム抽出のプロトコルを通して実施されることが好ましい。抽出プロトコルは、一般的に以下のステップを含む:
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップ;
前記混合物から水相を抽出するステップ;
前記水相から無細胞DNAを沈殿させるステップ;
任意選択で無細胞DNAを収集するステップ。
本発明は、生体試料、好ましくは血漿試料などの血液試料から無細胞DNAを抽出するための、フェノール/クロロホルムの使用を包含する。この方法は、既存の方法より頑健な胎児DNAシグナルを与えるので、入り混じった胎児及び母体の無細胞DNAを母体生体試料から抽出するために特に評価できる。本発明により、用語「フェノール/クロロホルム」は、フェノールとクロロホルムの混合物を指し、すなわちフェノール及びクロロホルムを含む組成物を指す。前記組成物は好ましくは水溶液であり、好ましくはイソアミルアルコールも含む。組成物のpHは、好ましくは7〜9、なお好ましくは7.8〜8.2である。好ましい組成物は、pHが7.8〜8.2のフェノール:クロロホルム:イソアミルアルコールの25:24:1の混合物である。組成物は、1つ又は複数の添加剤、例えば1つ又は複数の抗酸化剤及び/又は安定剤を含むことができる。
具体的な実施形態では、抽出方法は、プロテイナーゼKなどの1つ又は複数のプロテアーゼで生体試料を前処理するステップを含む。
水相の抽出は、クロロホルム及びフェノールと混合した生体試料を遠心分離し、水相を収集することを含むことができる。遠心分離は、主にフェノール、タンパク質又はタンパク質細片を含む下部の有機相、及び核酸を含む上部の水相への混合した生体試料の分離を提供する。
一実施形態では、水相からの無細胞DNAの沈殿は、以下のステップを含む:
少なくとも1つの沈殿剤を水相と混合するステップ;
前記混合された水相を遠心分離するステップ;及び
遠心分離ペレットを収集するステップ。
少なくとも1つの沈殿剤を水相と混合するステップ;
前記混合された水相を遠心分離するステップ;及び
遠心分離ペレットを収集するステップ。
沈殿剤は、グリコーゲン、低級アルコール、例えばイソプロパノール若しくはエタノール、又はそれらの混合物から選択されることが好ましい。DNAを含有する遠心分離ペレットは、次に例えばエタノール及び/又はエーテルで、1回又は複数回洗浄することができる。最後に、懸濁緩衝液、例えばトリス緩衝液にDNAを再懸濁することができる。
フェノール−クロロホルム抽出プロトコルは、大量並行シーケンシングを使用する胎児の異数性の検出のために従来用いられてきたカラム方法の5倍の量のDNAを産出する(Chiuら、2008、Fanら、2008)。このプロトコルはさらに、より高い割合の156〜176bpのサイズのDNA、すなわち母体と胎児の無細胞DNAも与える。したがって、このプロトコルは、胎児DNAを起源とする配列リードの数を増加させるための重要なツールである。
シーケンシングライブラリーの調製
無細胞DNA抽出の後、抽出されたDNAを含有する試料は、シーケンシングライブラリーを調製するために任意選択で処理する。そのような処理は無細胞DNAの抽出直後に実施してもよく、又は、好ましくは、抽出された無細胞DNAのサイズ選択のステップの後に実施してもよい。
無細胞DNA抽出の後、抽出されたDNAを含有する試料は、シーケンシングライブラリーを調製するために任意選択で処理する。そのような処理は無細胞DNAの抽出直後に実施してもよく、又は、好ましくは、抽出された無細胞DNAのサイズ選択のステップの後に実施してもよい。
ライブラリー調製は、1つ又は複数の増幅ステップ、1つ又は複数のシーケンシングアダプターによるライゲート、及び/又はDNA分子のバーコード化を含むことができる。シーケンシングライブラリー調製の一般的なワークフローは、1つ又は複数のバーコード配列に任意選択で連結される1つ又は複数のアダプター配列の、試料中のDNA分子へのライゲートのステップ、続くアダプター/バーコードにライゲートされたDNA分子の増幅を含む。
シーケンシングアダプターは、現代のシーケンシング技術で一般的に使用される短いヌクレオチド配列である。アダプターは、シーケンシングをするDNA分子を固体表面、例えばフローセルに固着させるために使用される。したがって、これらのアダプターは、固体表面に連結される標的オリゴヌクレオチドとハイブリダイズするように設計される。アダプターのライゲートは、DNA分子の末端を修復することによって、すなわち、例えば1つ又は複数のエキソヌクレアーゼ及び/又はポリメラーゼの作用を通して抽出されたDNA分子のオーバーハングを取り去るか埋め合わせるかして、平滑末端のDNA分子を得ることによって実施することが好ましい。次に任意選択で、平滑末端のDNA分子の3’末端に、1つ又は複数の「A」塩基のオーバーハングを付加してもよい。次にそれらの3’末端に1つ又は複数の「T」塩基のオーバーハングを含有するアダプターを付加して、DNA分子の3’末端の1つ又は複数の「A」塩基のオーバーハングにライゲートする。アダプターは、平滑面でライゲートされてもよい。
試料中のDNA断片は、バーコード化されてもよい。バーコード化は、試料のDNA分子への、試料特異的タグのライゲートを指す。バーコード化は、1回のシーケンシング実行での数種の試料のシーケンシングを可能にすることから、時間及び資源が節約される。
試料中のDNA断片は、例えばPCRによる1つ又は複数の増幅サイクルにかけることもできる。10〜25の増幅サイクル、例えば18増幅サイクルを実行することができる。増幅は、DNA分子へのアダプター配列のライゲートの後に実行することが好ましい。PCR増幅はアダプター配列に対するプライマーを使用することが好ましく、このように、アダプターにライゲートした断片にライブラリーを濃縮する。
無細胞DNAのサイズ分布分析及び選択
無細胞DNA抽出の後に、各試料中のDNA分子のサイズ分布を分析することができる。この分析は、キャピラリー電気泳動によって実施することが好ましい。例えばそれは、市販のlab−on−a−chipキャピラリー電気泳動システムを用いて実行される。サイズ分布分析は、シーケンシングライブラリーの調製の前後に実行することができる。しかし、それはシーケンシングライブラリーの調製の前に実施することが好ましい。
無細胞DNA抽出の後に、各試料中のDNA分子のサイズ分布を分析することができる。この分析は、キャピラリー電気泳動によって実施することが好ましい。例えばそれは、市販のlab−on−a−chipキャピラリー電気泳動システムを用いて実行される。サイズ分布分析は、シーケンシングライブラリーの調製の前後に実行することができる。しかし、それはシーケンシングライブラリーの調製の前に実施することが好ましい。
本発明者らは、等しい総量の投入DNAに対して、NGSの後の未処理リードの総数に予想外の変動性があることを立証した。未処理の抽出物をキャピラリー電気泳動したところ、これの1つの可能な説明は、NGSに利用できる対象の胎児DNAを含有する低分子量画分の相対量を減少させる、高分子量(MW)DNA種(>1000bp)の存在であるかもしれないことが明らかになった。無細胞DNA抽出の直後及びライブラリー調製の前に高分子量種を除去するために実施した実験から、低分子量種(<200bp、特に150〜200bp)のサイズ選択及び高分子量種の除外がNGSの後に得られた未処理リードの数の変動性をほとんど除去することが確認された(図16を参照)。この技術ステップは、サイズ選択された分子だけがシーケンシングライブラリー調製のために処理され、大規模にシーケンシングされるという事実から生じるその経済的利益に加えて、アッセイの頑健性及び分解能も向上させる。具体的には、サイズ選択のこの処置は胎児画分、すなわち循環無細胞DNAの全量に占める無細胞循環胎児DNAの割合を増加させ、その使用を低い胎児画分の場合でのアッセイの頑健性のために決定的にする。ライブラリー調製の前のサイズ選択によってもたらされる胎児画分の増加は、トリソミーを確実に検出するために必要とされるリードの数を減少させる効果を有する。
サイズが200bpを超える無細胞DNA分子を除去するステップは、当技術分野で公知の任意の技術によって実行することができる。磁気ビーズ、例えば下の実施例に記載のAMPure XP(登録商標)ビーズの使用が特に好ましい。ゲル電気泳動を使用することもできる。本発明者は、本発明によるサイズ選択の有益効果は、大量並行シーケンシングステップのために使用される特定の技術にかかわりなく達成されることを実証した。例えば、それは、合成によるシーケンシング方法、並びに半導体ベースの次世代配列技術を使用して達成される。検査試料及び参照セットのために同じ大量並行シーケンシングプラットホームを使用することが最適であるが、それにもかかわらず、信頼できる結果は異なるプラットホームが試料及び参照セットに適用されるときに達成されることも実証された。
さらに、正倍数性の試料のセットでDNA分子のサイズ分布を分析することによって、本出願の発明者は、シーケンシングライブラリーの調製のために処理した無細胞DNA、すなわちアダプターにライゲートされた無細胞DNAのサイズ分布が、約298bpにサイズピークを有することを見出した(図1)。アダプター/バーコード配列の132bpのサイズを減算した後、ピークサイズは166bpに相当する。この値は、Fanら、2008、によって以前に提供されたデータと、及び無細胞DNAの主にモノヌクレオソーム起源の仮説とも一致する。
本発明により、試料中のDNAのサイズ分布は、胎児の異数性診断用参照試料の適切なセットを構成する過程において基準として使用することができる。この基準は、高レベルの無細胞DNAを有する試料の選択、及び低レベルの無細胞DNAを有する試料の排除を可能にする。
選択基準は、約166bpでのサイズピークの発生に存することができる。本明細書で用いるように、用語「約166bp」は、「151〜181bp」、又は「156〜176bp」、又は「161〜171bp」、又は「163〜169bp」、又は「165〜167bp」の意味を有し得る。或いは、この用語は「正確に166bp」の意味を有し得る。
適切な参照試料を選択するための別の基準は、ピークの高さが約166bpであること、又は言い換えればサイズが約166bpのDNA分子の画分に存する場合もある。したがって、具体的な実施形態では、ステップ(iii)は、試料を選択するサブステップであって、ここで試料中のDNA分子の少なくとも80重量%、なお好ましくは少なくとも90重量%、好ましくは少なくとも95重量%、なお好ましくは少なくとも97重量%が約166bp、好ましくは156〜176bpのサイズを有する、サブステップを含む。
その代わりに、又はそれに加えて、ステップ(iii)は、試料を選択するサブステップであって、ここでサイズが約166bp、好ましくは156〜176bpのDNA分子の濃度が、少なくとも0.88ng/μl、好ましくは少なくとも0.90ng/μl、なお好ましくは少なくとも0.95ng/μl、又は少なくとも1.00ng/μl、又は少なくとも1.05ng/μl、又は少なくとも1.10ng/μlである、サブステップを含む。
その代わりに、又はそれに加えて、ステップ(iii)は、試料を選択するサブステップであって、ここでサイズが約166bp、好ましくは156〜176bpのDNA分子の量が、少なくとも13ng、好ましくは少なくとも13.5ng、なお好ましくは少なくとも14.25ng、又は少なくとも15ng、又は少なくとも15.75ng、又は少なくとも16.5ngである、サブステップを含む。
ステップ(iii)で選択される試料のセットの中で、サイズが約166bp、好ましくは156〜176bpの抽出されるDNA分子の平均濃度は、少なくとも0.88ng/μl、好ましくは少なくとも0.90ng/μl、なお好ましくは少なくとも0.95ng/μl、又は少なくとも1.00ng/μl、又は少なくとも1.05ng/μl、又は少なくとも1.10ng/μlであることが好ましい。
ステップ(iii)で選択される試料のセットの中で、サイズが約166bp、好ましくは156〜176bpのDNA分子の平均量は、少なくとも13ng、好ましくは少なくとも13.5ng、なお好ましくは少なくとも14.25ng、又は少なくとも15ng、又は少なくとも15.75ng、又は少なくとも16.5ngであることが好ましい。
濃度及び/又は量は、シーケンシングステップのために調製されるDNAライブラリーで測定することができ、例えば、それはアダプター/バーコードとライゲートされるDNA分子、例えば132bpアダプター/バーコードとライゲートされるDNA分子で測定することができる。DNA分子はアダプター/バーコードのライゲートの後、18増幅サイクルを受けていることが好ましい。濃度及び/又は量は、投入材料として20ngのDNAを使用してIlluminaのChIPシーケンシングプロトコルを使用して調製されるDNAライブラリーで測定することがなお好ましい。濃度及び/又は量は、DNAライブラリーの調製の前に測定することもできる。
興味深いことに、本出願の発明者は、母体血漿試料中のDNA分子が約133〜143bpにより小さいサイズのショルダーを示すことも発見した(図1、右パネル)。このショルダーは胎児DNAを反映する可能性があり、胎児DNAの濃縮画分を有する試料の選択のための追加又は代替の品質管理基準として使用することができる。したがって、ステップ(iii)は、そのDNAサイズ分布が133〜143bpの間でピーク又はショルダーを明らかにする試料を選択することを含むこともできる。
上に示したサイズ値(166bpのピーク及び関連する値)は、アダプター又はバーコードにライゲートしていないDNA分子、すなわち母体血液に見出されるDNA分子に相当する。必要な場合は、アダプター、バーコード又はDNA分子の片方若しくは両方の末端の任意の配列タグの存在を考慮するために、これらの値を適合させることができる。
本明細書で用いるように、ピークは、試料中のDNA分子のサイズ分布を表す曲線での局所最大値を指す。ショルダーは、この曲線中の屈折点を指す。
プレシーケンシング
本発明により、プレシーケンシングは、より大きな規模の次世代シーケンシングの前に任意選択で実施することができる、小規模シーケンシングを指す。したがって、先行技術の方法に反して、本発明のこの変異形は、参照セットの各試料で連続して実施される2つのシーケンシングステップによって特徴付けられる。したがって、「プレシーケンシング」は、「第1のシーケンシング」と称することもできる。同様に、「大量並行シーケンシング」は「第2のシーケンシング」と称することができる。配列の小さいライブラリー中の固有同一配列の割合は、次世代のシーケンシングによって得られたフルスケールライブラリー中の固有同一配列の割合を代表すると発明者は仮定した。したがって、初期段階でDNA試料の小規模シーケンシングを実行することによって、不十分な量の固有同一配列しか有しない試料を早期に排除することが可能である。このプレシーケンシングステップは、その後実施される大量並行シーケンシングよりずっと少ない時間及び費用しか消費しない。したがって、本発明は、不十分な品質の試料を排除し、それによって向上した品質の参照セットを与えつつ、時間及び資源の節約を可能にする。
本発明により、プレシーケンシングは、より大きな規模の次世代シーケンシングの前に任意選択で実施することができる、小規模シーケンシングを指す。したがって、先行技術の方法に反して、本発明のこの変異形は、参照セットの各試料で連続して実施される2つのシーケンシングステップによって特徴付けられる。したがって、「プレシーケンシング」は、「第1のシーケンシング」と称することもできる。同様に、「大量並行シーケンシング」は「第2のシーケンシング」と称することができる。配列の小さいライブラリー中の固有同一配列の割合は、次世代のシーケンシングによって得られたフルスケールライブラリー中の固有同一配列の割合を代表すると発明者は仮定した。したがって、初期段階でDNA試料の小規模シーケンシングを実行することによって、不十分な量の固有同一配列しか有しない試料を早期に排除することが可能である。このプレシーケンシングステップは、その後実施される大量並行シーケンシングよりずっと少ない時間及び費用しか消費しない。したがって、本発明は、不十分な品質の試料を排除し、それによって向上した品質の参照セットを与えつつ、時間及び資源の節約を可能にする。
プレシーケンシングステップは、1試料につき1000〜100,000個の配列、なお好ましくは1試料につき5000〜50000個の配列のシーケンシングを含むことが好ましい。
各配列リードのサイズは、好ましくは20bp〜100bp、なお好ましくは40〜70bp、例えば50bpである。これらのサイズ、特に50bpは、ヒトゲノムの複数の位置にマッピングする可能性がより高い短すぎるリードと、配列中にSNPを有する可能性をもたらす長すぎるリードの間の優れた妥協である。
無細胞DNA抽出の後、及びライブラリー調製の前に上記のサイズ選択ステップが実行される場合は、プレシーケンシングのステップは通例必要でない。
配列マッピング
ヒトゲノムの上での配列のアラインメントは、例えばChiuら、2008又はFanら、2008に記載される任意の標準のアラインメントソフトウェアを用いて実行することができる。マッピングのために使用されるヒトゲノム配列は、NBCI(http://www.ncbi.nlm.nih.gov/assembly/2758/)又はUCSC(http://hgdownload.cse.ucsc.edu/downloads.html#human)によって確立された配列などの参照配列であることが好ましい。参照配列は、hg19とも称される2009年2月(hg19、GRCh37)であることが好ましい。
ヒトゲノムの上での配列のアラインメントは、例えばChiuら、2008又はFanら、2008に記載される任意の標準のアラインメントソフトウェアを用いて実行することができる。マッピングのために使用されるヒトゲノム配列は、NBCI(http://www.ncbi.nlm.nih.gov/assembly/2758/)又はUCSC(http://hgdownload.cse.ucsc.edu/downloads.html#human)によって確立された配列などの参照配列であることが好ましい。参照配列は、hg19とも称される2009年2月(hg19、GRCh37)であることが好ましい。
本発明による方法が2つのシーケンシングステップ(任意選択の変異形として)を含む場合は、それは2つのマッピングステップも含む:プレシーケンシングステップで得られた配列のマッピング、及び大量並行シーケンシングステップで得られた配列のマッピング。2つのマッピングステップは同じ方法で、すなわち同じヒトゲノム配列及び/又は同じアラインメントソフトウェアを用いて実施することが好ましい。
両方のマッピングステップは、ヒトゲノムの全配列にわたって、例えば全hg19参照配列にわたって行うことができる。
或いは、アラインメントは、ヒトゲノムの一部だけで、言い換えるとヒトゲノムの部分配列について行うことができる。一般的に言って、スコア計算で使用されるヒトゲノムの部分配列は、ヒトゲノムの所定の領域をマスキングすることによって得られる。マスキングされる領域は、以下を含むいくつかの異なるパラメータに基づいて選択することができる:領域のより低い品質のシーケンシング(これらの領域は「注釈不良領域」としても知られる);領域中での多数の反復の発生;ヒトゲノム内での領域の重複;複合体構造を有する領域。したがって、マスキングされる領域は、ヒトゲノムの注釈不良領域、ヒトゲノムの多コピー反復領域、ヒトゲノムの重複領域又は複合体構造を有する領域から選択されることが好ましい。
例えば、より低い品質のシーケンシングを有する領域又は「注釈不良」領域は、46,395,641未満の足場N50及び/又は38,508,932未満のコンティグN50及び/又は239,845,127/3,137,144,693を超える全アセンブリーギャップ長及び/又は少なくとも90%、好ましくは少なくとも95%のゲノムカバレージを有する領域である(Yandellら、2012)。注釈不良領域の例は、テロメア下領域及び動原体周囲領域である。
ゲノムアセンブリーは、足場及びコンティグで構成される。コンティグは、重複するリードの集合から得られた連続したコンセンサス配列である。足場は、シーケンシングリードのメイト対によってお互いに連結され、順序づけら、方向づけられるコンティグのセットである。コンティグN50は、先ず最も長いものから最も短いものにかけて、長さによってあらゆるコンティグを順序づけることによって計算される。次に、最も長いコンティグから出発して、この連続の合計がアセンブリー中の全てのコンティグの全長の2分の1に等しくなるまで、各コンティグの長さを合計する。アセンブリーのコンティグN50は、このリストで最も短いコンティグの長さである。足場N50は、コンティグではなく足場を使用すること以外は同じ方法で計算される。約800bpより短いコンティグ及び足場と同様に、単一のリード又はリード対−しばしば「シングルトン」と呼ばれる−だけを含む足場及びコンティグはこれらの計算から排除することができる。
ゲノムカバレージは、サイズ予想に基づくアセンブリーに含まれるゲノムの百分率を指し、これらは、細胞学的技術に通常基づく。例えば、複合構造を有する領域は、高度に変異した領域、例えば多数のCNV(コピー数変異形)及び/又はSNV(単一ヌクレオチド変異形)を有する領域である(Frazerら、2009)。例えば、ヒトゲノムの5%の推定値は、コピー数変異である。
プレシーケンシング後の固有同一配列の量に基づく品質管理
本発明による方法の任意選択のステップ(vi)は、前記試料で得られた固有同一配列の量に基づいて試料セットを選択することに存する。したがって、ステップ(vi)は、固有同一配列の最小限の量より多くを有する試料を選択すること、又は他の用語では、固有同一配列の最小限の量より少なく有する試料を排除することに存する。
本発明による方法の任意選択のステップ(vi)は、前記試料で得られた固有同一配列の量に基づいて試料セットを選択することに存する。したがって、ステップ(vi)は、固有同一配列の最小限の量より多くを有する試料を選択すること、又は他の用語では、固有同一配列の最小限の量より少なく有する試料を排除することに存する。
本明細書で用いるように、用語「量」は、固有同一配列の絶対数、又は比を指すことができる。比は、プレシーケンシングステップで得られた配列リードの総数に対して計算することができる。しかし、比は、フィルターを通過するリードの数に対して計算することが好ましい。
フィルタリングは、アダプター配列に少なくとも部分的にマッピングされた配列を排除することに存することができる。フィルターを通過するリードの数は、アダプター配列に少なくとも部分的にマッピングされた配列リードの数を配列リードの総数から引いたものである。
好ましい実施形態では、ステップ(v)は、前記試料のプレシーケンシングステップで得られた配列リードの総数に対して少なくとも70%の固有同一配列、好ましくは少なくとも72%の固有同一配列、なお好ましくは少なくとも75%、又はなお好ましくは少なくとも77%、又はなお好ましくは少なくとも80%の固有同一配列を有する試料を選択することを含む。
無細胞DNA抽出の後、及びライブラリー調製の前に上記のサイズ選択ステップが実行される場合は、プレシーケンシングステップ及び続く前記試料で得られた固有同一配列の量に基づく試料セットの選択は通例必要でない。
大量並行シーケンシング
様々な大量並行シーケンシング技術及びプラットホームを、本発明で用いることができる。
様々な大量並行シーケンシング技術及びプラットホームを、本発明で用いることができる。
例えば、大量並行シーケンシングプラットホームは、IlluminaのHiSeq2000プラットホームなどの「合成によるシーケンシング」システムに存することができる。このプラットホームは、成長するDNA鎖に単独塩基が組み込まれるときにそれらを検出する、可逆的ターミネーターベースの方法を使用する。「合成によるシーケンシング」システムでのシーケンシングワークフローは、3つの段階に要約することができる:
第1に、DNAライブラリーの調製:このステップは既に記載されており、上で指摘した通り、それは正倍数性の適切な参照試料を選択する全過程又は診断過程の初期に実行することができる。それは例えばDNA抽出の直後、又は抽出された無細胞DNAのサイズ選択の直後に実施される。この段階で、DNA分子は両末端でアダプターにライゲートされる。さらに、それらは、PCRによってライブラリーを増幅し、それをシーケンシングするために使用されるプライマー部位を含有する。
第2に、クラスター生成:この段階で、DNA分子はフローセル内の固体表面に連結されるオリゴヌクレオチドプローブとハイブリダイズされる。各DNA分子は固相ブリッジ増幅によって増幅され、同一の配列を有する分子のクラスターを形成する。
第3に、「合成によるシーケンシング」段階。各々蛍光標識ターミネーターを含有する4つのヌクレオチドの混合物をフローセルに導入する。各dNTPが成長するDNA鎖に組み込まれるときに蛍光標識ターミネーターを画像化し、次に切断して次の塩基の組込みを可能にする。全4つの可逆的ターミネーター結合dNTPが各シーケンシングサイクルに存在するので、天然の競合が組込みバイアスを最小にする。各サイクルで、強度シグナル測定からベースコールが直接実行される。
或いは、大量並行シーケンシングプラットホームは、例えば半導体をベースとした次世代配列技術に存することができる。
具体的な実施形態では、大量並行シーケンシングステップは、1試料につき少なくとも10,000,000個、好ましくは少なくとも20,000,000個、なお好ましくは少なくとも30,000,000個の配列をシーケンシングすることに存する。
その代わりに、又はそれに加えて、1試料につき少なくとも6,000,000個、好ましくは少なくとも8,000,000個、なお好ましくは少なくとも10,000,000個、又は少なくとも12,000,000個、又は少なくとも14,000,000個、又は少なくとも15,000,000個の固有同一配列がマッピングステップ(例えばステップ(viii))で得られる。その代わりに、又はそれに加えて、1試料につき少なくとも12,000,000個、好ましくは少なくとも15,000,000個、なお好ましくは少なくとも20,000,000個の平均数の固有同一配列がマッピングステップ(例えばステップ(viii))で得られる。
配列の総数及び/又は大量並行シーケンシングステップで得られた固有同一配列の数は、参照試料セットを形成する試料を選択する工程で品質管理基準として使用することもできる。
具体的な実施形態では、本発明による正倍数性の参照試料のセット又は正倍数性及び異数性の参照試料のセットを得る方法は、1試料につき少なくとも10,000,000個、好ましくは少なくとも20,000,000個、なお好ましくは少なくとも30,000,000個の総数の配列を有する試料を選択することを含む。
その代わりに、又はそれに加えて、本発明による正倍数性の参照試料のセット、又は正倍数性及び異数性の参照試料のセットを得る方法は、少なくとも6,000,000個、好ましくは少なくとも8,000,000個、なお好ましくは少なくとも10,000,000個、又は少なくとも12,000,000個、又は少なくとも14,000,000個、又は少なくとも15,000,000個の固有同一配列を有する試料を選択することを含む。正倍数性及び異数性の参照試料中の10,000,000〜12,500,000個の固有同一配列が特に好ましい。
その代わりに、又はそれに加えて、参照試料のセットは、大量並行シーケンシングステップで得られた少なくとも20,000,000個、好ましくは少なくとも25,000,000個、なお好ましくは少なくとも27,000,000個の平均総数の配列を有する。用語「配列総数」は、シーケンシングステップで得られた非フィルタリングリードの総数、又はシーケンシングプラットホームがフィルタリングを含む場合はフィルターを通過するリードの総数を指すことができる。そのような場合、用語「配列総数」は、好ましくはフィルターを通過するリードの総数を指す。
その代わりに、又はそれに加えて、参照試料セットは、少なくとも12,000,000個、好ましくは少なくとも15,000,000個、なお好ましくは少なくとも20,000,000個の平均数の固有同一配列を有する。
診断方法
本発明の第2の主要な態様は、母体生体試料から胎児の異数性を診断する方法に存し、診断する試料を上記の参照試料セットを得る方法で得られた試料の参照セットと比較することを特徴とする。
本発明の第2の主要な態様は、母体生体試料から胎児の異数性を診断する方法に存し、診断する試料を上記の参照試料セットを得る方法で得られた試料の参照セットと比較することを特徴とする。
簡潔には、この方法のワークフローは以下の通りに要約することができる:
生体試料からの無細胞DNAの抽出;
抽出したDNA分子のNGS(大規模並行)シーケンシング;
ヒトゲノムに配列をマッピングすること;
前記試料について対象の染色体又は染色体領域のスコアを計算すること;
前記スコアを参照試料セットの同じ染色体又は染色体領域で得られたスコアのセットと比較すること;
比較の結果に基づいて胎児の染色体の異数性の有無を診断すること。
生体試料からの無細胞DNAの抽出;
抽出したDNA分子のNGS(大規模並行)シーケンシング;
ヒトゲノムに配列をマッピングすること;
前記試料について対象の染色体又は染色体領域のスコアを計算すること;
前記スコアを参照試料セットの同じ染色体又は染色体領域で得られたスコアのセットと比較すること;
比較の結果に基づいて胎児の染色体の異数性の有無を診断すること。
したがって、参照試料セットを得る方法の上記の実施形態と比較して、診断方法のワークフローは、ステップ(ii)、(iii)、(iv)、(v)及び(vi)、すなわちサイズ分布に基づく選択及びプレシーケンシング結果に基づく選択を必ずしも含むとは限らない。当然ながら、これは、診断する試料でサイズ分布分析/選択又はプレシーケンシングを実施することができないことを意味しない。実際、サイズが200bpを超えるDNA分子を排除するサイズ選択ステップを、検査試料からの無細胞DNAの抽出の後、及び大量並行シーケンシングの前、より詳細にはライブラリー調製の前に実施することが特に好ましい。
一般的に言って、参照試料セットを選択する方法での特定のステップに関する上記の特色及び実施形態は、胎児の異数性の診断方法での対応するステップにも適用される。
スコアリングアルゴリズム
所与の染色体又は染色体領域について計算したスコアは、所与の試料について前記染色体又は染色体領域にマッピングされた固有同一配列(UES又はUEM)カウントの指標であるパラメータである。スコアは、全ヒトゲノム配列について、又はヒトゲノムの部分配列について、又は他の用語では、一部の領域がマスキングされている配列について計算することができる。
所与の染色体又は染色体領域について計算したスコアは、所与の試料について前記染色体又は染色体領域にマッピングされた固有同一配列(UES又はUEM)カウントの指標であるパラメータである。スコアは、全ヒトゲノム配列について、又はヒトゲノムの部分配列について、又は他の用語では、一部の領域がマスキングされている配列について計算することができる。
ヒトゲノムの慎重に選択された一部だけについてスコアを計算することは、診断方法の統計的信頼度を高くする方法である。一般的に言って、スコア計算で使用されるヒトゲノムの部分配列は、ヒトゲノムの所定の領域をマスキングすることによって得られる。マスキングする領域を規定するために、領域のより低い品質のシーケンシング(他の用語では注釈不良領域とも規定される)、領域中での多数の反復の発生、ヒトゲノム内での領域の重複、複合体構造を有する領域を含む、いくつかのパラメータを考慮することができる。したがって、マスキングされる領域は、ヒトゲノムの注釈不良領域、ヒトゲノムの多コピー反復領域、ヒトゲノムの重複領域又は複合体構造を有する領域から選択されることが好ましい。
各染色体のスコアは、各染色体を所定の長さのビン、例えば50kbビンに分けることによって計算することができる。分割は、全ヒトゲノム配列で、又は部分的ヒトゲノム配列で、すなわち上で説明されるように一部の領域がマスキングされたヒトゲノム配列で実行することができる。所与のビンにマッピングされた固有同一配列(UES)の数を次にカウントし、各ビンのUESカウントを得る。
具体的な実施形態では、各ビンのUESカウントはバイアス修正され、すなわち、それはシーケンシング工程に関連するバイアスを考慮するように修正される。公知のバイアスは、ゲノム全体でのGC分布の変動によって引き起こされる。Fanら、2010、が記すように、ゲノム全体での配列タグの分布は均一でない。実際、染色体領域のGC含有量と前記領域にマッピングされた配列の数の間に正の相関が存在し、そのことは、GCに富む領域を起源とする配列がGC欠乏領域を起源とする配列よりも多く配列ライブラリーに現れる理由を説明する。このバイアスは、例えば前記ビンでのGC含有量に反比例する重みで各ビンでのUESカウントを重み付けすることによって補償することができる。
対象の染色体又は染色体領域での全てのビンの中間UESカウント値を、次に計算する。この値は染色体又は染色体領域全体でのUESカウントの代表であり、染色体又は染色体領域の配列タグ密度と称される。この中間値は、非加重UESカウントを使用することにより、又は、上に示すように各UESカウントをバイアス補正係数で重み付けすることによって計算することができる。別の実施形態では、染色体全体でのUESカウントを表すために中間値以外の他の値、例えば染色体中の全てのビンのUESカウントの合計が選択される。
最後に、対象の染色体又は染色体領域の配列タグ密度を、全ての染色体の中間配列タグ密度に標準化することができる。或いは、全ての常染色体の中間配列タグ密度にそれを標準化することができる。なお代わりに、所定の染色体セットの中間配列タグ密度にそれを標準化することができる。本明細書で用いるように、「染色体セット」は、第1染色体から第22染色体並びにX染色体及びY染色体から選択される染色体の任意の組合せを指す。なお代わりに、所定の染色体領域セットの中間配列タグ密度にそれを標準化することができる。なお代わりに、全ての染色体、又は全ての常染色体、又は所定の染色体セット、又は所定の染色体領域セットの配列タグ密度の合計にそれを標準化することができる。
染色体又は染色体領域の標準化配列タグ密度は、所与の試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標であるパラメータとして使用することができる。しかし、このパラメータは、他の値によって表すことができる:
対象の染色体又は染色体領域の配列タグ密度;
対象の前記染色体又は染色体領域にマッピングされたUESの数;
試料のUESの総数で標準化される対象の前記染色体又は染色体領域にマッピングされたUESの数;
染色体又は染色体領域の所定のセットにマッピングされたUESの総数で標準化される対象の前記染色体又は染色体領域にマッピングされたUESの数。
対象の染色体又は染色体領域の配列タグ密度;
対象の前記染色体又は染色体領域にマッピングされたUESの数;
試料のUESの総数で標準化される対象の前記染色体又は染色体領域にマッピングされたUESの数;
染色体又は染色体領域の所定のセットにマッピングされたUESの総数で標準化される対象の前記染色体又は染色体領域にマッピングされたUESの数。
図6〜13に例示されるように、異数性試料を正倍数性試料と区別し、このようにして対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である他のパラメータを得るために、他のスコアリングアルゴリズムを使用することができる。
対象の染色体は第21染色体であり、及び/又は胎児の異数性は21トリソミーであることが好ましい。或いは、対象の染色体は第18染色体であり、及び/又は胎児の異数性は18トリソミーである。或いは、対象の染色体は第13染色体であり、及び/又は胎児の異数性は13トリソミーである。或いは、対象の染色体は第22染色体であり、及び/又は胎児の異数性は22トリソミーである。或いは、対象の染色体は第4染色体であり、及び/又は胎児の異数性はウルフ−ハーシュホーン症候群である。
或いは、対象の染色体領域は、ウルフ−ハーシュホーン症候群の欠失領域を含む第4染色体の一部である。或いは、対象の染色体は第5染色体であり、及び/又は胎児の異数性はネコ鳴き症候群である。或いは、対象の染色体領域は、ネコ鳴き症候群の欠失及び/又は重複領域を含む第5染色体の一部であり、及び/又は胎児の異数性はネコ鳴き症候群である。或いは、対象の染色体は第19染色体である。或いは、対象の染色体は第1染色体である。前記の染色体又は染色体領域の任意の組合せを、具体的な実施形態として選択することもできる。
対象の染色体は第21染色体、第18染色体又は第13染色体であることがより好ましく、対象の染色体は第21染色体又は第18染色体であることがなお好ましい。
検査試料と参照試料セットの比較
検査試料の対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標として選択される検査パラメータがなんであれ、試料の参照セットの各試料について同じパラメータを計算し、このようにして参照パラメータのセットを得る(「同じパラメータ」は、検査試料のために使用したのと同じ方法を用いてパラメータが計算されるが、検査試料で得られるものの代わりに参照試料で得られたシーケンシングデータに適用されることを意味する)。
検査試料の対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標として選択される検査パラメータがなんであれ、試料の参照セットの各試料について同じパラメータを計算し、このようにして参照パラメータのセットを得る(「同じパラメータ」は、検査試料のために使用したのと同じ方法を用いてパラメータが計算されるが、検査試料で得られるものの代わりに参照試料で得られたシーケンシングデータに適用されることを意味する)。
次に、検査試料で得られた検査パラメータを、参照試料で得られた参照パラメータのセットと比較する。
第1の方法では、式:
zスコア=(Ptest−平均(Pref))/(SD(Pref))
によって検査試料のzスコアを計算することによって比較を行うことができ、上式で、
Ptestは、検査試料から計算される対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータであり、
平均(Pref)及びSD(Pref)は、それぞれ、参照試料セットから計算される対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である参照パラメータのセットの平均及び標準偏差である。
zスコア=(Ptest−平均(Pref))/(SD(Pref))
によって検査試料のzスコアを計算することによって比較を行うことができ、上式で、
Ptestは、検査試料から計算される対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータであり、
平均(Pref)及びSD(Pref)は、それぞれ、参照試料セットから計算される対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である参照パラメータのセットの平均及び標準偏差である。
対象の染色体又は染色体領域について異数性である試料のzスコアの絶対値は、4より上、なお好ましくは4.4より上であることが好ましい。
対象の染色体又は染色体領域について正倍数性である試料のzスコアの絶対値は、4.4より下、なお好ましくは4より下であることが好ましい。
参照試料セットの各試料のzスコアの絶対値は、4.4より下、なお好ましくは4より下であることが好ましい。
図4及び5に例示されるように、本発明による方法を使用することによる参照試料の適切なセットの選択は、4.4のzスコアをカットオフ値として、正倍数性試料からの21トリソミー及び18トリソミー試料の識別を可能にする。このzスコアは、偶然に誤った結果をもたらす≦1.1×10−5の事前確率に対応し、それは先行技術の対応するデータより極めて低い。
第2の方法では、確率に基づく計算を使用して、好ましくは正倍数性と異数性(トリソミー)の試料を含む参照セットを使用して比較を行うことができる。この方法により、工程は2つのステップを同様に含む。第1は、参照ヒトゲノムでの検査試料から得られた配列のアラインメントを含み、第2は、検査試料の各染色体で得られた結果を、参照セットの試料の対応する染色体で得られた結果と比較することを含む:
検証されたトリソミーを有する試料セットの所与の染色体についてのUESカウントから得られた値を、正常な参照試料のセットの同じ所与の染色体についてのUESカウントから得られた値と一緒にグラフに表す;
参照セットの正常な試料は、確率的に千に1つの正常な試料だけが超えるはずである値の区間を決定するために使用される。この区間を、グラフに示す。したがって、1染色体につき1つの「参照グラフ」が確立される。
次に、検査試料の所与の染色体についてUESカウントから得られた値も、臨床評価の基準として役立つ対応する参照グラフに示す。少なくとも50個、好ましくは少なくとも75個の参照試料を各々含む複数の参照セット、例えば少なくとも4つ、好ましくは6つの参照セット(例えば、図17〜38に例示する参照セットN1、N、B1、B2、A1及びA2)を、診断を確立するのに一貫して使用することにより、診断の確証を得る。
検証されたトリソミーを有する試料セットの所与の染色体についてのUESカウントから得られた値を、正常な参照試料のセットの同じ所与の染色体についてのUESカウントから得られた値と一緒にグラフに表す;
参照セットの正常な試料は、確率的に千に1つの正常な試料だけが超えるはずである値の区間を決定するために使用される。この区間を、グラフに示す。したがって、1染色体につき1つの「参照グラフ」が確立される。
次に、検査試料の所与の染色体についてUESカウントから得られた値も、臨床評価の基準として役立つ対応する参照グラフに示す。少なくとも50個、好ましくは少なくとも75個の参照試料を各々含む複数の参照セット、例えば少なくとも4つ、好ましくは6つの参照セット(例えば、図17〜38に例示する参照セットN1、N、B1、B2、A1及びA2)を、診断を確立するのに一貫して使用することにより、診断の確証を得る。
実施例1
母体血液からのDNA抽出及び品質管理アッセイ
地域の倫理委員会による承認が係属中の前向き臨床試験の状況で、100人の妊娠女性から血液試料を収集した。母体の妊娠年齢は、14.63±4.00週であった。
母体血液からのDNA抽出及び品質管理アッセイ
地域の倫理委員会による承認が係属中の前向き臨床試験の状況で、100人の妊娠女性から血液試料を収集した。母体の妊娠年齢は、14.63±4.00週であった。
侵襲的出生前診断の30分後に、2つの7.5ml管(BDバキュテーナー採血管、Beckton Dickinson、NJ USA 07417、又はBCT管、Streck,Inc.、Omaha、NE 68128)を収集した。記載の通りに血漿を精製し(Chiuら2008;Fanら2008)、−20℃で直ちに冷凍した。ヌクレオスピン(nucleospin)血漿キット(Macherely Nagel、下記の通りに製造業者の指示による)、又は以下の通りのフェノール−クロロホルム方法による無細胞DNA抽出のために、2mlの一定分量の血漿を使用した。
ヌクレオスピン血漿キット(製造業者の指示による)
20μlのプロテイナーゼKを2mlの一定分量の血漿に加え、混合液を(撹拌せずに)37℃で10分の間加熱した。混合液血漿−プロテイナーゼKを5mL管に移し、次に緩衝液BBを加え(1.5×血漿容量)、それらを倒置により管を3回混合し、3秒間撹拌した。混合液をいくつかのカラムに加え(600μl/カラム)、2000g(320rpm)で30秒間、次に11000g(9600rpm)で5秒間遠心分離した。次に、カラムを1回目は500μlの緩衝液WBで洗浄して、11000g(9600rpm)で30秒間遠心分離し、2回目は250μlの緩衝液WBで洗浄して11000g(9600rpm)で3分の間遠心分離した。最後に、20μlの溶出緩衝液をカラムに加え、それを次に11000g(9600rpm)で30秒間遠心分離した。得られたDNA抽出物を単一の2mL管にプールした。
20μlのプロテイナーゼKを2mlの一定分量の血漿に加え、混合液を(撹拌せずに)37℃で10分の間加熱した。混合液血漿−プロテイナーゼKを5mL管に移し、次に緩衝液BBを加え(1.5×血漿容量)、それらを倒置により管を3回混合し、3秒間撹拌した。混合液をいくつかのカラムに加え(600μl/カラム)、2000g(320rpm)で30秒間、次に11000g(9600rpm)で5秒間遠心分離した。次に、カラムを1回目は500μlの緩衝液WBで洗浄して、11000g(9600rpm)で30秒間遠心分離し、2回目は250μlの緩衝液WBで洗浄して11000g(9600rpm)で3分の間遠心分離した。最後に、20μlの溶出緩衝液をカラムに加え、それを次に11000g(9600rpm)で30秒間遠心分離した。得られたDNA抽出物を単一の2mL管にプールした。
フェノール−クロロホルム方法
200μlの10%SDS、40μlの0.5M EDTA及び25μlのプロテイナーゼKを加えて、試料を58℃で2時間インキュベートした。室温で平衡化した2mlのビオフェノール(biophenol)を加えて試料を撹拌し、4000rpmで10分間遠心分離した。水相(1800ml)を新しい5ml管に移し、DNAを20μlのグリコーゲン/GlycoBlue、1/9容量の3M NaAc、及び0.7容の氷冷イソプロパノールで沈殿させた。激しく撹拌した後、2mlを新しい管に移し、最大速度の微量遠心管で10分の間遠心分離した。上清をデカントし、残りの量を加え、同じ条件下で管を遠心分離した。DNAペレットを先ず600μlのエタノール70%で、続いて600μlのエーテルで洗浄し、20μlの0.5mMトリスpH8.2に懸濁した。
200μlの10%SDS、40μlの0.5M EDTA及び25μlのプロテイナーゼKを加えて、試料を58℃で2時間インキュベートした。室温で平衡化した2mlのビオフェノール(biophenol)を加えて試料を撹拌し、4000rpmで10分間遠心分離した。水相(1800ml)を新しい5ml管に移し、DNAを20μlのグリコーゲン/GlycoBlue、1/9容量の3M NaAc、及び0.7容の氷冷イソプロパノールで沈殿させた。激しく撹拌した後、2mlを新しい管に移し、最大速度の微量遠心管で10分の間遠心分離した。上清をデカントし、残りの量を加え、同じ条件下で管を遠心分離した。DNAペレットを先ず600μlのエタノール70%で、続いて600μlのエーテルで洗浄し、20μlの0.5mMトリスpH8.2に懸濁した。
PicoGreenでDNA濃度を測定し、雄胎児に対応する試料でTHO1及びSRYのqPCRアッセイを実施した。これらのアッセイの原理は、以下を数量化することである:
ヒトY染色体に存在するSRY遺伝子の137bp配列を増幅することによる雄DNA、すなわち胎児DNA;
ヒトY染色体に存在するSRY遺伝子の137bp配列を増幅することによる雄DNA、すなわち胎児DNA;
ヒト第11染色体に存在するTHO1 STR(ショートタンデムリピート)を含む162bp配列を増幅することによる全ヒトDNA、すなわち胎児+母体のDNA。
マウス遺伝子GALTを内部対照として用いた。簡潔には、試料ごとに、12.5μlの絶対QPCRミックス(AB−1133/A、ABGene)、2.5μlのプライマー/プローブSRY/THO1/GALT混合物、及び0.4μlのAmpliTag Gold 5U/μl(N8080249、Applied Biosystems)を含有するマスターミックスを調製した。各々以下:H2Oに増幅する5μlのDNA試料、5μlのStd Galt10コピー/μl(GALTの標準配列)、15μlのマスターミックスを含有する25μlのPCRミックスを調製した。
各系列は、標準(10μl標準、細胞数200/10μl)を含む。50サイクルのRT−PCR(95℃/15秒;60℃/60秒)をRotorGene qPCR機器(Qiagen)で実行し、60℃でチャネルSRY(緑色)、THO1(黄色)、GALT(赤色)での獲得であった。
表1は、2つの方法、カラム及びフェノールに基づく方法で並行して抽出された雄胎児を妊娠している妊娠女性からの9つの血漿試料の比較結果を示す。見られるとおり、収量はフェノールに基づく抽出で有意により高く(p=2.2×10−5)、フェノールに基づく処置は、約5倍多くのDNA、及び最も重要なことにSRY、すなわち胎児DNAのより一貫して、より頑健なシグナルを与える(p<0.05)。表1では、「細胞数/μl」の値は標準を参照して計算され、6pgゲノムDNA/細胞の仮定に基づく細胞数でのゲノムDNAの量の等価を指す。
実施例2
染色質−免疫沈降(ChIP)に基づくショットガンシーケンシングNGSプロトコル
方法
ChIPシーケンシングプロトコル(Illumina)を指示通りに実施した。ライブラリー構築のために、20ngの無細胞DNAを使用した。全ライブラリー容量の1/15に相当する各ライブラリーの1μlを、サイズ分布分析及びピーク濃度の決定のために2100バイオアナライザー(Agilent)に流した。5個のライブラリーごとに、MiSeq(Illumina)でプレシーケンシングした。50bpの単一のリード及び50+7サイクルでライブラリーをHiSeq2000(Illumina)でシーケンシングをし、このように、指示(Illumina)に従ってTruSeq SBS v3キットを用いて1試料につき30×106個のリードをもたらした。
染色質−免疫沈降(ChIP)に基づくショットガンシーケンシングNGSプロトコル
方法
ChIPシーケンシングプロトコル(Illumina)を指示通りに実施した。ライブラリー構築のために、20ngの無細胞DNAを使用した。全ライブラリー容量の1/15に相当する各ライブラリーの1μlを、サイズ分布分析及びピーク濃度の決定のために2100バイオアナライザー(Agilent)に流した。5個のライブラリーごとに、MiSeq(Illumina)でプレシーケンシングした。50bpの単一のリード及び50+7サイクルでライブラリーをHiSeq2000(Illumina)でシーケンシングをし、このように、指示(Illumina)に従ってTruSeq SBS v3キットを用いて1試料につき30×106個のリードをもたらした。
50個の試料で、上記の通り2つの抽出プロトコル(カラム抽出及びフェノール/クロロホルム抽出)を並行して実施した。残りの試料は、フェノール/クロロホルム方法だけで抽出した。
結果
無細胞DNAのサイズ決定は、アダプター/バーコード配列サイズの減算の後、ピークサイズはほぼ完全に予測された166bpのサイズの範囲内にあることを示す(図1;Loら2010)。ピークサイズ分布は、分析した全91個の試料で均一であり、1〜2bpの変動があった。右パネルで見られるより小さいサイズのショルダーは、胎児DNAをおそらく反映し、それは133〜143bpのピークサイズを有する。
無細胞DNAのサイズ決定は、アダプター/バーコード配列サイズの減算の後、ピークサイズはほぼ完全に予測された166bpのサイズの範囲内にあることを示す(図1;Loら2010)。ピークサイズ分布は、分析した全91個の試料で均一であり、1〜2bpの変動があった。右パネルで見られるより小さいサイズのショルダーは、胎児DNAをおそらく反映し、それは133〜143bpのピークサイズを有する。
フェノール/クロロホルム抽出プロトコルは、約166bpのピークサイズを有するDNA分子の極めてより高い濃度を与え、カラムライブラリーとフェノール/クロロホルムライブラリーの間に統計的有意差があった(p<10−25;表2、各抽出方法につき50個のライブラリーで測定したときのサイズが156bp〜176bpのDNA分子画分の濃度を示す)。
30個のプレシーケンシングライブラリー(表3)、及び91個の試料の最終出力配列(表4及び図2)の固有同一配列は、フィルターを通過するリードの75〜80%であった。
全体として、UESの中間数は20,000,000より多く、それは公表された異数性検査のための基準として使用されるそれぞれの数より4倍を超えて高い(Fanら、2008、Chiuら、2008、Stummら2012)。
各染色体を50kbビンに分け、各ビンにつき、前記ビンにマッピングされたUESの数をカウントした。ビンあたりのUESカウントの中間値を各染色体について計算し、全ての常染色体について配列タグ密度値を得た。
全91個の正倍数性及び異数性試料について図4に示すように、第21染色体の配列タグ密度を全ての常染色体の配列タグの中間密度に標準化し、このようにして、第21染色体の標準化配列タグ密度を得た。この値は、第21染色体に由来する胎児と母体のDNA断片の割合の指標である。
単一の染色体カウントを標準化するための基準を提供する参照セットを構築するために、正常な核型の試料を使用した。そのような参照セットで、本発明による診断方法は、4.4のzスコアを使用して非21トリソミー症例から21トリソミー症例を完全に識別することが可能である(図3)。
同様に、この研究で分析した全91個の正倍数性及び異数性試料について図5に示すように、第18染色体の配列タグ密度を全ての常染色体の配列タグの中間密度に標準化し、このようにして標準化配列タグ密度を得た。
図5から明らかなように、本発明による診断方法は、66個の正倍数性試料の同じ参照セットを用い、4.4のzスコアを使用することにより、非18トリソミー症例から18トリソミー症例を識別することも可能である。
全体として、本発明による方法は、偶然に誤った結果をもたらす≦1.1×10−5の事前確率で、第1世代アッセイ(Chiuら2008、Fanら2008、Stummら2012)の約2桁上のよりストリンジェントな識別を可能にする。
最後に、91個の試料から得られたデータを処理するために、別のアルゴリズムが使用されている。結果を、図6〜13に示す。この第2のアルゴリズム及び本発明の方法によって選択された参照試料のセットを用いることにより、診断方法は、偶然に誤った結果をもたらす≦1.1×10−11の事前確率で、正倍数性の試料から21トリソミー試料、13トリソミー試料、18トリソミー試料、22トリソミー試料、4p微小欠失試料、5p微小欠失−重複試料を識別することを可能にする。
実施例3:無細胞DNAのサイズ選択:
以前の研究は、血液中に存在する無細胞胎児DNAは200bpより小さく、平均でおよそ150bpであることが示されている。
以前の研究は、血液中に存在する無細胞胎児DNAは200bpより小さく、平均でおよそ150bpであることが示されている。
規定量の血液から抽出されるDNAの量は、数ナノグラムから1マイクログラムを超える量(平均で血漿2mlに10〜50ng)まで変動することがある。DNAの分析は、おそらく細胞溶解、したがって母体起源の結果である大きなDNA断片(≧1kb)の有無によってこの変動性の大部分が引き起こされることを示している。
本発明者は、抽出した無細胞DNA試料から大きなDNA断片を排除し、このようにして胎児DNAを含有する小さいDNA断片(200bp以下)を「濃縮」し、それによって非侵襲的出生前診断検査の質を向上させたプロトコルを考案した。サイズ選択処置は、シーケンシングライブラリー調製などのいかなるさらなる処理の前に粗DNA抽出物で実行される。
サイズ選択のために、磁気ビーズ(AMPure(登録商標)Beckman Coulter)を使用した。この技術により、DNA断片を磁気ビーズに結合し、その後磁場を加えることによって汚染物質から分離する。結合したDNAをエタノールで洗浄し、その後磁気粒子から溶出させる。
実験及び結果
それらのサイズ分布を検査するために、いくつかの粗抽出無細胞DNA試料を高感度バイオアナライザーによって分析した。3つの粗DNA抽出物(GWX−351、GWX−352及びGWX−353と呼ぶ)からのDNAサイズ分布の例を、図16A(左パネル)に示す。
それらのサイズ分布を検査するために、いくつかの粗抽出無細胞DNA試料を高感度バイオアナライザーによって分析した。3つの粗DNA抽出物(GWX−351、GWX−352及びGWX−353と呼ぶ)からのDNAサイズ分布の例を、図16A(左パネル)に示す。
精製(サイズ選択)のために、20μLのDNA溶液(10ng)を試料GWX−351、−352及び−353から調製した。10μLのAMPureビーズを加え、試料を室温で数分インキュベートした。次に磁気スタンドでビーズを混合液から分離し、上清を新しい管に移した。
ビーズの分離をさらに数回実行した。最終回の精製の後、ビーズを再懸濁せずに、200μLの新鮮な80%エタノールでビーズを二回洗浄した。ビーズを次に10分間乾燥させ、10μLのEB緩衝液に再懸濁させた。
図16B(右パネル)は、AMPureビーズによる数回の連続した精製の後、試料GWX−351、−352及び−353についてのバイオアナライザーによる分析により得られた結果を示す。大分子量ピークは精製工程によって排除され、150〜200bpのより低い分子量のピークは保持される。他の試料でも、同等の結果が得られた。結果は、ビーズを使用することによって高分子量画分を除去することができ、およそ200bp以下のサイズの画分を生成することを確認する。
実施例4:サイズ選択された無細胞DNA試料での異数性の検出(1)
a)DNA抽出
血液試料を48人の妊娠女性から収集し、実施例1に記載のフェノール−クロロホルム方法で無細胞DNAを抽出した。
a)DNA抽出
血液試料を48人の妊娠女性から収集し、実施例1に記載のフェノール−クロロホルム方法で無細胞DNAを抽出した。
b)サイズが200bp未満の無細胞DNA断片の濃縮:サイズ選択
血液から抽出した無細胞DNAを、実施例3に記載の磁気ビーズ(AMPure XP(登録商標)、Beckman Coulter)でのサイズ選択の連続ステップにかけた。サイズ選択の有る無しでの異数性検出アッセイの感度の比較を可能にするために、試料の一部はサイズ選択処置にかけなかった。
血液から抽出した無細胞DNAを、実施例3に記載の磁気ビーズ(AMPure XP(登録商標)、Beckman Coulter)でのサイズ選択の連続ステップにかけた。サイズ選択の有る無しでの異数性検出アッセイの感度の比較を可能にするために、試料の一部はサイズ選択処置にかけなかった。
c)ライブラリー調製(合成によるシーケンシング技術による大量並行シーケンシングのため)
i)末端修復:
この工程は、末端修復ミックスを使用して、dsDNAの断片化からもたらされるオーバーハングを平滑末端に変換する。このミックスの3’から5’へのエキソヌクレアーゼ活性は3’オーバーハングを除去し、ポリメラーゼ活性は5’オーバーハングを埋める。
i)末端修復:
この工程は、末端修復ミックスを使用して、dsDNAの断片化からもたらされるオーバーハングを平滑末端に変換する。このミックスの3’から5’へのエキソヌクレアーゼ活性は3’オーバーハングを除去し、ポリメラーゼ活性は5’オーバーハングを埋める。
試料DNAを含有するプレートの各ウェルに20μLの末端修復ミックス(ERP)を加え、混合液を十分に混ぜて短時間遠心分離した。次に、製造業者の指示に従ってプレートをサーマルサイクラーでインキュベートした。
試料をサーマルサイクラーから取り出し、精製ステップにかけた。
ii)アデニレート3’末端の付加
アダプターライゲート反応の過程でそれらがお互いにライゲートするのを防ぐために、及び、その3’末端に対応する単一のヌクレオチドを有する断片にアダプターをその後ライゲートするための相補的なオーバーハングを提供するために、単一の「A」ヌクレオチドを平滑dsDNA断片の3’末端に加えた。この戦略は、キメラ(連結された鋳型)形成率の低下を確かなものにする。
アダプターライゲート反応の過程でそれらがお互いにライゲートするのを防ぐために、及び、その3’末端に対応する単一のヌクレオチドを有する断片にアダプターをその後ライゲートするための相補的なオーバーハングを提供するために、単一の「A」ヌクレオチドを平滑dsDNA断片の3’末端に加えた。この戦略は、キメラ(連結された鋳型)形成率の低下を確かなものにする。
平滑DNA断片を含有するプレートの各ウェルに、12.5μLのAテーリングミックス(ATL)を加えた。混合と短時間の遠心分離の後、製造業者の指示に従ってプレートをサーマルサイクラーでインキュベートした。
iii)アダプターのライゲート
iii)アダプターのライゲート
アデニレート3’末端の付加の直後に、PCR増幅を可能にする、Illuminaによって市販されるものなどの対末端アダプターをdsDNAの末端にライゲートする。
Aテーリングプレートの各ウェルに5μLのアダプタープレミックスを、続いて2.5μLのライゲートミックスを加えた。製造業者の指示に従ってプレートを短時間遠心分離し、サーマルサイクラーでインキュベートした。次に、ライゲートを不活性化するために、5μLの停止ライゲート緩衝液を各ウェルに加えた。精製ステップを次に実行した。
iv)DNA断片の濃縮
工程のこのステップは、各試料に特定のVINCI指数を加え、アダプター配列を完成させてフローセルでの以降のハイブリダイゼーションを可能にしつつ、両末端にアダプター分子を有するDNA断片を選択的に濃縮するためにPCRを使用する。アダプターを欠く断片はフローセルで表面結合プライマーとハイブリダイズすることができず、片方の末端だけにアダプターを有する断片は表面結合プライマーとハイブリダイズすることができるが、クラスターを形成することができない。
工程のこのステップは、各試料に特定のVINCI指数を加え、アダプター配列を完成させてフローセルでの以降のハイブリダイゼーションを可能にしつつ、両末端にアダプター分子を有するDNA断片を選択的に濃縮するためにPCRを使用する。アダプターを欠く断片はフローセルで表面結合プライマーとハイブリダイズすることができず、片方の末端だけにアダプターを有する断片は表面結合プライマーとハイブリダイズすることができるが、クラスターを形成することができない。
PCRプレートの各ウェルに34μLのPCRプレミックスを加え、続いて1μLの解凍したPCR P7指数プライマー(25μΜ)を加えた。PCRプレートの各ウェルに15μLの試料を移し、試料プレートの空のウェルに陰性対照として15μLの水を加えた。
以下のPCRプログラムを使用して、プレートをサーマルサイクラーでインキュベートした:
98℃で30秒間
以下を15サイクル:
98℃で10秒間
65℃で30秒間
72℃で30秒間
72℃で5分間
10℃で保持
98℃で30秒間
以下を15サイクル:
98℃で10秒間
65℃で30秒間
72℃で30秒間
72℃で5分間
10℃で保持
増幅は、およそ280bpを中心とするスミアを生成した。約120bpでバンドを生成したあらゆる空のアダプターを、以降のAMPure精製ステップで除去した。
d)大量並行シーケンシング及びマッピング
実施例2に記載のHiSeq 2000(Illumina)でライブラリーをシーケンシングし、ヒトゲノムにマッピングした。
実施例2に記載のHiSeq 2000(Illumina)でライブラリーをシーケンシングし、ヒトゲノムにマッピングした。
e)結果
各検査試料の各常染色体の固有同一配列(UES、UEMとも呼ぶ)カウントを決定し、確率スケールを用いて第1の参照セットの各試料の対応する染色体の値と比較した。この操作をさらなる5つの参照セットで繰り返し、合計6つの参照セット(A1、A2、B1、B2、N1、N2と命名)を得た。全ての参照セットは、検証された正倍数性及びトリソミーの試料を含み、上記の通り、≦200bpのDNA分子のサイズ選択ステップを含む本発明の方法に従って得られた。参照セットA1及びA2は合計267個の試料を含み;セットN1及びN2は合計167個の試料を含み:セットB1及びB2は合計100個の試料を含んだ。
各検査試料の各常染色体の固有同一配列(UES、UEMとも呼ぶ)カウントを決定し、確率スケールを用いて第1の参照セットの各試料の対応する染色体の値と比較した。この操作をさらなる5つの参照セットで繰り返し、合計6つの参照セット(A1、A2、B1、B2、N1、N2と命名)を得た。全ての参照セットは、検証された正倍数性及びトリソミーの試料を含み、上記の通り、≦200bpのDNA分子のサイズ選択ステップを含む本発明の方法に従って得られた。参照セットA1及びA2は合計267個の試料を含み;セットN1及びN2は合計167個の試料を含み:セットB1及びB2は合計100個の試料を含んだ。
具体的には、検証されたトリソミー及び検証された正倍数性を有する参照試料の第1のセット(例えば参照セットN1)中の所与の染色体のUESカウントから得られた値を、グラフにプロットした。確率的に千に1つの正常な試料だけが超えるはずである値の区間を決定するために、参照セットの正常な(正倍数性)試料を使用した。この区間を、グラフに示した。
このように、1参照セット及び1染色体につき1つの「参照グラフ」が確立された(すなわち1染色体につき6つの参照グラフ)。参照セットA1の第13、16、18及び21染色体のための「参照グラフ」は、それぞれ図39a〜39dで見ることができる(灰色のスポット)。確率区間も示す。類似の参照グラフ(灰色のスポット)は、それぞれ参照セットN1の第13、16、18及び21染色体について図40a〜40dで見ることができる。図39及び40では、内部の微細な点線は1/1000の確率閾値を表し、外部のより太い点線は1/10000の確率閾値を表す
各染色体及び各参照セットについて参照グラフが確立されたら、各検査試料の所与の染色体についてUESカウントから得られた値を、対応する参照グラフにプロットした。図39では、単一の検査試料の第13、16、18及び21染色体の値を、参照グラフにおいて円形黒点で示す。図40では、4つの異なる検査試料の第13、16、18及び21染色体の値を、参照グラフにおいて円形黒点で示す。全48個の検査試料について、この操作を全ての染色体及び全ての参照セットで実行した。
結果は、本発明の検査が胎児の異数性の検出を顕著な信頼性で可能にすることを明らかに確認した。図39a〜39dは、GWX−1137と命名された試料は第13、16、18及び21染色体が正常であることを示す。図40a〜40dは、GWX−1196、GWX−1420、GWX−1421及びGWX−1470と命名された試料は、それぞれ第13、16、18及び21染色体が正常である可能性が10000に1つ未満であることを示す。
サイズ選択処置で得られた結果、及びサイズ選択なしで得られた結果の比較は、サイズ選択が胎児画分を効果的に濃縮し、その結果、ほとんど常に存在する増加したシグナル強度が示す通り、特に低い胎児画分のより頑健な検出をもたらすことを明白に示した。全ての常染色体についてシグナル強度を評価した。全ての常染色体の比較を図17〜38に示すが、x軸「GWX」はサイズ選択なしであり、y軸「TPR」はサイズ選択ありである。サイズ選択の後のシグナル強度は、41/48又は85%の場合により強く、7/48又は15%の場合にはサイズ選択のない試料と同等であった。サイズ選択の後にシグナル強度が悪化した例は全くなかった。サイズ選択によって付与されたこの改善されたシグナル強度は、統計値を計算するために使用されたより少ないUESの存在下でさえ測定可能だった。実際、対応するサイズ選択されていない試料より少ないUESのサイズ選択された試料の25%の中で、より高いシグナル強度を有する画分はなお83%であった。シグナル強度比較の第13、16、18及び21染色体のパネルに示す通り、特に低い胎児画分で異数性はより頑健に検出された(図29、32、34及び37)。後者の実験は、サイズ選択処置によって常染色体の検出でバイアスが導入されないことも示した。
サイズ選択処置は、潜在的に偽陽性の結果も減少させた。使用した48個の試料のうち、9個は当初病的であると疑われた:7個は核型分析によって最終的に検証され、2個の境界例はサイズ選択後に正常な結果を有することがわかった。
全体として、サイズ選択処置は全般的にシグナル強度を改善することがわかり、それは、低い胎児画分を有するリスクのある試料に特に有益な、胎児画分のより頑健な検出につながった。
実施例5:サイズ選択された無細胞DNA試料での異数性の検出(2)
合成によるシーケンシングプラットホームの代わりに半導体ベースのNGSプラットホームでの使用のために、48個の検査試料を再び使用して、実施例4に記載されるプロトコルを構成した。サイズ選択及び半導体ベースのNGSプラットホームの使用を含む、検査試料の分析のために使用したのと同じ方法を使用して、6つの新しい参照セットを生成した。このプラットホームのためのライブラリー調製は、平滑末端アダプターライゲートを使用しており、dAテーリングは含まない。さらに、より少数のPCRサイクルを使用した(15回の代わりに8回)。サイズ選択ステップは、実施例4に記載のものと同一であった。
合成によるシーケンシングプラットホームの代わりに半導体ベースのNGSプラットホームでの使用のために、48個の検査試料を再び使用して、実施例4に記載されるプロトコルを構成した。サイズ選択及び半導体ベースのNGSプラットホームの使用を含む、検査試料の分析のために使用したのと同じ方法を使用して、6つの新しい参照セットを生成した。このプラットホームのためのライブラリー調製は、平滑末端アダプターライゲートを使用しており、dAテーリングは含まない。さらに、より少数のPCRサイクルを使用した(15回の代わりに8回)。サイズ選択ステップは、実施例4に記載のものと同一であった。
合成によるシーケンシングプラットホームを使用して生成された参照試料と一緒に、48個の試料に対して、半導体ベースのNGSプラットホームを使用した検査も実施した。この検査では、2つの実験群の間で参照試料の調製のために使用したシーケンシングプラットホームが唯一の違いであった。
3つの試料の結果を、図41a、b及びcに示す。太く黒いバーは、検査試料及び参照試料を同一のプロトコルを使用して調製したときに得られた結果を示す。より小さく細いバーは、試料を調製するために使用したシーケンシングプラットホームが参照セットを調製するために使用したものと異なったときに得られた結果を表す。検査試料及び参照セットを同じシーケンシングプラットホームで処理したときに最適な結果が得られるが、それにもかかわらず、検査試料のために使用したプラットホームが参照セットのために使用したものと異なるときにも結果が有益であり識別することがわかる。全体として、半導体技術による結果は、本発明による無細胞DNAのサイズ選択がより頑健なアッセイを提供することをさらに確認した。この実施例は、サイズ選択処置によってもたらされる利点が、大量並行シーケンシングプラットホームのタイプと無関係であることも確認する。
参考文献
Chiu RW, Chan KC, Gao Y, Lau VY, Zheng W,Leung TY, Foo CH, Xie B, Tsui NB, Lun
FM, Zee BC, Lau TK, Cantor CR, Lo YM.Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massivelyparallel genomic sequencing of DNA in maternal plasma. Proc Natl Acad Sci U SA. 2008 Dec 23;105(51 ):20458-63.
Cooper GM, Coe BP, Girirajan S, RosenfeldJA, Vu TH, Baker C, Williams C, Stalker H, Hamid R, Hannig V, Abdel-Hamid H,Bader P, McCracken E, Niyazov D, Leppig K, Thiese H, Hummel M, Alexander N,Gorski J, Kussmann J, Shashi V, Johnson K, Rehder C, Ballif BC, Shaffer LG,Eichler EE. A copy number variation morbidity map of developmental delay, NatGenet. 201 1 Aug 14;43(9):838-46
Fan HC, Blumenfeld YJ, Chitkara U, HudginsL, Quake SR. Noninvasive diagnosis of fetal aneuploidy by shotgun sequencingDNA from maternal blood. Proc Natl Acad Sci U S A. 2008 Oct 21 ; 105(42):16266-71
Frazer KA, Murray SS, Schork NJ, Topol EJ.Human genetic variation and its contribution to complex traits. Nat Rev Genet.2009 Apr; 10(4):241-51.
Lo YM, Lun FM, Chan KC, Tsui NB, Chong KC,Lau TK, Leung TY, Zee BC, Cantor CR, Chiu RW. Digital PCR for the moleculardetection of fetal chromosomal aneuploidy. Proc Natl Acad Sci U S A. 2007 Aug7; 104(32):131 16-21.
Lo YM, Chan KC, Sun H, Chen EZ, Jiang P,Lun FM, Zheng YW, Leung TY, Lau TK, Cantor CR, Chiu RW. Maternal plasma DNAsequencing reveals the genome-wide genetic and mutational profile of the fetus.Sci Transl Med. 2010 Dec 8;2(61 ):61 ra91
Stumm M, Entezami M, Trunk N, Beck M,Locherbach J, Wegner RD, Hagen A, Becker R, Hofmann W. Noninvasive prenataldetection of chromosomal aneuploidies using different next generationsequencing strategies and algorithms. Prenat Diagn. 2012 Jun;32(6):569-77.
Yandell M, Ence D. A beginner's guide toeukaryotic genome annotation. Nat Rev Genet. 2012 Apr 18; 13(5):329-42.
Chiu RW, Chan KC, Gao Y, Lau VY, Zheng W,Leung TY, Foo CH, Xie B, Tsui NB, Lun
FM, Zee BC, Lau TK, Cantor CR, Lo YM.Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massivelyparallel genomic sequencing of DNA in maternal plasma. Proc Natl Acad Sci U SA. 2008 Dec 23;105(51 ):20458-63.
Cooper GM, Coe BP, Girirajan S, RosenfeldJA, Vu TH, Baker C, Williams C, Stalker H, Hamid R, Hannig V, Abdel-Hamid H,Bader P, McCracken E, Niyazov D, Leppig K, Thiese H, Hummel M, Alexander N,Gorski J, Kussmann J, Shashi V, Johnson K, Rehder C, Ballif BC, Shaffer LG,Eichler EE. A copy number variation morbidity map of developmental delay, NatGenet. 201 1 Aug 14;43(9):838-46
Fan HC, Blumenfeld YJ, Chitkara U, HudginsL, Quake SR. Noninvasive diagnosis of fetal aneuploidy by shotgun sequencingDNA from maternal blood. Proc Natl Acad Sci U S A. 2008 Oct 21 ; 105(42):16266-71
Frazer KA, Murray SS, Schork NJ, Topol EJ.Human genetic variation and its contribution to complex traits. Nat Rev Genet.2009 Apr; 10(4):241-51.
Lo YM, Lun FM, Chan KC, Tsui NB, Chong KC,Lau TK, Leung TY, Zee BC, Cantor CR, Chiu RW. Digital PCR for the moleculardetection of fetal chromosomal aneuploidy. Proc Natl Acad Sci U S A. 2007 Aug7; 104(32):131 16-21.
Lo YM, Chan KC, Sun H, Chen EZ, Jiang P,Lun FM, Zheng YW, Leung TY, Lau TK, Cantor CR, Chiu RW. Maternal plasma DNAsequencing reveals the genome-wide genetic and mutational profile of the fetus.Sci Transl Med. 2010 Dec 8;2(61 ):61 ra91
Stumm M, Entezami M, Trunk N, Beck M,Locherbach J, Wegner RD, Hagen A, Becker R, Hofmann W. Noninvasive prenataldetection of chromosomal aneuploidies using different next generationsequencing strategies and algorithms. Prenat Diagn. 2012 Jun;32(6):569-77.
Yandell M, Ence D. A beginner's guide toeukaryotic genome annotation. Nat Rev Genet. 2012 Apr 18; 13(5):329-42.
Claims (25)
- 無細胞DNAを含む母体生体試料から、胎児の異数性診断用参照試料のセット及び/又は参照パラメータのセットを得るための方法であって、
正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセットから無細胞DNAを抽出するステップと;
抽出ステップの後、各試料中のDNA分子のサイズ分布を分析して、前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップと;
サイズ選択された各試料のDNAの大量並行シーケンシングを実施するステップと;
試料ごとに得られた配列をヒトゲノムにマッピングするステップと;
参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
参照試料のセット及び/又は参照パラメータのセットを得るステップと
を含む方法。 - (i)正倍数性胎児を妊娠している正倍数性妊娠女性のセットから得られた生体試料のセットから無細胞DNAを抽出するステップと;
(ii)各試料中のDNA分子のサイズ分布を分析するステップと;
(iii)前記試料中のDNA分子のサイズ分布に基づいて試料の第1のセットを選択するステップと;
(iv)試料の前記第1のセットからの各試料のDNAをプレシーケンシングするステップと;
(v)ステップ(vi)で得られた配列をヒトゲノムにマッピングするステップと;
(vi)ステップ(v)でヒトゲノムにマッピングされた固有同一配列の量に基づいて試料の第2のセットを選択するステップと;
(vii)試料の前記第2のセットからの各試料のDNAを大量並行シーケンシングするステップと;
(viii)ステップ(vii)で得られた配列をヒトゲノムにマッピングするステップと;
(ix)ステップ(viii)でヒトゲノムにマッピングされた固有同一配列の数に基づいて参照試料のセットを選択するステップと
を含む、請求項1に記載の方法。 - 生体試料のセットの各試料からの無細胞DNAの抽出が、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと
を含む、請求項1又は2に記載の方法。 - DNA分子のサイズ分布に基づいて試料のセットを選択するステップが、試料からサイズが200bpを超えるDNA分子を排除するステップを含む、請求項1〜3のいずれか一項に記載の方法。
- 前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップが、DNA分子の少なくとも90重量%、好ましくは95重量%より多くが200bp未満、好ましくは156bp〜176bpのサイズを有する試料を選択するステップを含む、請求項1〜3のいずれか一項に記載の方法。
- 前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップが、少なくとも0.88ng/μLの、サイズが200bp未満、好ましくは156bp〜176bpのDNA分子を有する試料を選択するステップを含む、請求項1〜3のいずれか一項に記載の方法。
- サイズ選択がシーケンシングライブラリーの調製の前に実行される、請求項1〜6のいずれか一項に記載の方法。
- 参照試料のセットが10,000,000個を超える固有同一配列のリードを有する試料を含む、請求項1に記載の方法。
- ステップ(vi)が、ステップ(iv)で得られた配列の総数に対して少なくとも70%の固有同一配列を有する試料を選択するステップを含む、請求項2〜6のいずれか一項に記載の方法。
- ステップ(vii)が、各試料について少なくとも25,000,000個の配列をシーケンシングするステップを含む、請求項2〜6のいずれか一項に記載の方法。
- ステップ(ix)が、15,000,000個を超える固有同一配列のリードを有する試料を選択するステップを含む、請求項2〜6、8及び9のいずれか一項に記載の方法。
- 無細胞DNAを抽出する生体試料のセットが、異数性胎児を妊娠している正倍数性の妊娠女性から得られた試料をさらに含む、請求項1〜11のいずれか一項に記載の方法。
- 母体生体検査試料から胎児の異数性を診断する方法であって、
(a)妊娠女性から得られた母体生体検査試料から無細胞DNAを抽出するステップと;
(b)前記検査試料から抽出された無細胞DNAを大量並行シーケンシングするステップと;
(c)ステップ(b)で得られた配列をヒトゲノムにマッピングするステップと;
(d)対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータを計算するステップと;
(e)参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、請求項1〜11で得られた参照試料のセットの試料の、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
(f)ステップ(d)で計算された前記検査パラメータをステップ(e)で計算された参照パラメータの前記セットと比較するステップと;
(g)比較に基づいて胎児の異数性を診断するステップと
を含む方法。 - 抽出ステップの後、前記試料中のDNA分子のサイズ分布に基づいてサイズ選択ステップを実行する、請求項13に記載の方法。
- サイズ選択がシーケンシングライブラリーの調製の前に実行される、請求項14に記載の方法。
- サイズ選択が、試料からサイズが200bpを超えるDNA分子を排除するステップを含む、請求項14又は15に記載の方法。
- 母体生体検査試料からの無細胞DNAの抽出が、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと
を含む、請求項13〜16のいずれか一項に記載の方法。 - 前記検査パラメータが、全ての常染色体の中間固有同一配列タグ密度に標準化した対象の染色体又は染色体領域の固有の配列タグ密度である、請求項13に記載の方法。
- ステップ(f)の比較が、参照パラメータのセットに対する前記検査パラメータのzスコアの計算によって実施される、請求項13に記載の方法。
- 前記検査パラメータが、対象の染色体若しくは染色体領域の絶対同一配列カウント、又は対象の染色体若しくは染色体領域の平均同一配列カウントである、請求項14〜16のいずれか一項に記載の方法。
- ステップ(f)の比較が、対象の染色体若しくは染色体領域の固有同一配列カウント、又は対象の染色体若しくは染色体領域の同一配列の平均カウントが、参照セットの対象の染色体の固有同一配列カウントの正規分布に属する確率の計算によって実施される、請求項20に記載の方法。
- 対象の染色体が、第21染色体、第16染色体、第18染色体、第13染色体又は第11染色体である、請求項13〜21のいずれか一項に記載の方法。
- 胎児と母体の無細胞DNAを含有する母体生体試料から無細胞DNAを抽出する方法であって、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと
を含む方法。 - 胎児の異数性の診断のためのキットであって、
請求項1〜12のいずれか一項に記載の方法により入手可能な参照試料のセット;
及び/又は参照パラメータのセットであって、ここで各参照パラメータは、任意選択で物理的支持体に含まれる請求項1〜11のいずれか一項に記載の方法により入手可能な参照セットの試料の、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、参照パラメータのセット
を含むキット。 - 無細胞DNAを抽出するための、フェノール及びクロロホルムを含む組成物を含む、1つ又は複数の組成物及び/又はキット;
母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の1つ又は複数のステップを実施するためのコンピュータプログラム製品;
母体生体検査試料から胎児の異数性を診断するための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品
の少なくとも1つをさらに含む、請求項24に記載のキット。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12190844.6 | 2012-10-31 | ||
EP12190844.6A EP2728014B1 (en) | 2012-10-31 | 2012-10-31 | Non-invasive method for detecting a fetal chromosomal aneuploidy |
PCT/EP2013/072848 WO2014068075A1 (en) | 2012-10-31 | 2013-10-31 | Non-invasive method for detecting a fetal chromosomal aneuploidy |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015534807A true JP2015534807A (ja) | 2015-12-07 |
Family
ID=47172444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015538513A Pending JP2015534807A (ja) | 2012-10-31 | 2013-10-31 | 胎児の染色体異数性を検出するための非侵襲的方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20150275290A1 (ja) |
EP (3) | EP3026124A1 (ja) |
JP (1) | JP2015534807A (ja) |
CN (1) | CN105074004A (ja) |
AU (1) | AU2013340795A1 (ja) |
CA (1) | CA2888906A1 (ja) |
DK (1) | DK2728014T3 (ja) |
HK (1) | HK1208708A1 (ja) |
IL (1) | IL238426A0 (ja) |
WO (1) | WO2014068075A1 (ja) |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11111544B2 (en) | 2005-07-29 | 2021-09-07 | Natera, Inc. | System and method for cleaning noisy genetic data and determining chromosome copy number |
US11111543B2 (en) | 2005-07-29 | 2021-09-07 | Natera, Inc. | System and method for cleaning noisy genetic data and determining chromosome copy number |
US9424392B2 (en) | 2005-11-26 | 2016-08-23 | Natera, Inc. | System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals |
US11326208B2 (en) | 2010-05-18 | 2022-05-10 | Natera, Inc. | Methods for nested PCR amplification of cell-free DNA |
US11339429B2 (en) | 2010-05-18 | 2022-05-24 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US11408031B2 (en) | 2010-05-18 | 2022-08-09 | Natera, Inc. | Methods for non-invasive prenatal paternity testing |
US11332793B2 (en) | 2010-05-18 | 2022-05-17 | Natera, Inc. | Methods for simultaneous amplification of target loci |
EP2854057B1 (en) | 2010-05-18 | 2018-03-07 | Natera, Inc. | Methods for non-invasive pre-natal ploidy calling |
US11332785B2 (en) | 2010-05-18 | 2022-05-17 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US20190010543A1 (en) | 2010-05-18 | 2019-01-10 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US11322224B2 (en) | 2010-05-18 | 2022-05-03 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US11939634B2 (en) | 2010-05-18 | 2024-03-26 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US10316362B2 (en) | 2010-05-18 | 2019-06-11 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US9677118B2 (en) | 2014-04-21 | 2017-06-13 | Natera, Inc. | Methods for simultaneous amplification of target loci |
JP6153874B2 (ja) | 2011-02-09 | 2017-06-28 | ナテラ, インコーポレイテッド | 非侵襲的出生前倍数性呼び出しのための方法 |
US20140100126A1 (en) | 2012-08-17 | 2014-04-10 | Natera, Inc. | Method for Non-Invasive Prenatal Testing Using Parental Mosaicism Data |
JP7451070B2 (ja) | 2013-11-07 | 2024-03-18 | ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー | ヒトミクロビオームおよびその成分の分析のための無細胞核酸 |
CN106460070B (zh) | 2014-04-21 | 2021-10-08 | 纳特拉公司 | 检测染色体片段中的突变和倍性 |
RU2699728C2 (ru) * | 2014-07-25 | 2019-09-09 | БиДжиАй Дженомикс Ко., Лтд. | Способ и устройство для определения фракции внеклеточных нуклеиновых кислот в биологическом образце и их применение |
EP3018213A1 (en) | 2014-11-04 | 2016-05-11 | Genesupport SA | Method for determining the presence of a biological condition by determining total and relative amounts of two different nucleic acids |
EP4428863A2 (en) | 2015-05-11 | 2024-09-11 | Natera, Inc. | Methods and compositions for determining ploidy |
CA2986036C (en) | 2015-05-18 | 2022-07-26 | Karius, Inc. | Compositions and methods for enriching populations of nucleic acids |
WO2017093561A1 (en) | 2015-12-04 | 2017-06-08 | Genesupport Sa | Method for non-invasive prenatal testing |
SG11201804651XA (en) * | 2015-12-04 | 2018-07-30 | Green Cross Genome Corp | Method for determining copy-number variation in sample comprising mixture of nucleic acids |
GB201522665D0 (en) * | 2015-12-22 | 2016-02-03 | Premaitha Ltd | Detection of chromosome abnormalities |
BR112018069557A2 (pt) | 2016-03-25 | 2019-01-29 | Karius Inc | spike-ins de ácido nucléico sintético |
US11485996B2 (en) | 2016-10-04 | 2022-11-01 | Natera, Inc. | Methods for characterizing copy number variation using proximity-litigation sequencing |
US10011870B2 (en) | 2016-12-07 | 2018-07-03 | Natera, Inc. | Compositions and methods for identifying nucleic acid molecules |
WO2018137496A1 (zh) * | 2017-01-24 | 2018-08-02 | 深圳华大基因股份有限公司 | 确定生物样本中预定来源的游离核酸比例的方法及装置 |
US10697008B2 (en) | 2017-04-12 | 2020-06-30 | Karius, Inc. | Sample preparation methods, systems and compositions |
CN108342455B (zh) * | 2017-06-25 | 2021-11-30 | 北京新羿生物科技有限公司 | 一种从母体外周血检测胎儿非整倍体染色体的方法及其试剂盒 |
EP4026915B1 (en) * | 2017-09-28 | 2023-10-25 | Grail, LLC | Enrichment of short nucleic acid fragments in sequencing library preparation |
US12084720B2 (en) | 2017-12-14 | 2024-09-10 | Natera, Inc. | Assessing graft suitability for transplantation |
WO2019178157A1 (en) | 2018-03-16 | 2019-09-19 | Karius, Inc. | Sample series to differentiate target nucleic acids from contaminant nucleic acids |
CA3090426A1 (en) | 2018-04-14 | 2019-10-17 | Natera, Inc. | Methods for cancer detection and monitoring by means of personalized detection of circulating tumor dna |
CN112292458A (zh) * | 2018-05-03 | 2021-01-29 | 香港中文大学 | 测量无细胞混合物特性的尺寸标记的优选末端和识别方向的分析 |
WO2019227420A1 (zh) * | 2018-05-31 | 2019-12-05 | 深圳华大临床检验中心 | 确定男性待测样本是否存在三倍体的方法、系统和计算机可读介质 |
US11525159B2 (en) | 2018-07-03 | 2022-12-13 | Natera, Inc. | Methods for detection of donor-derived cell-free DNA |
CN109584963A (zh) * | 2018-09-30 | 2019-04-05 | 南京派森诺基因科技有限公司 | 一种高通量测序数据的多样化抽取方法 |
WO2020214547A1 (en) * | 2019-04-15 | 2020-10-22 | Natera, Inc. | Improved liquid biopsy using size selection |
RU2717023C1 (ru) * | 2019-04-24 | 2020-03-17 | Общество с ограниченной ответственностью "ГЕНОТЕК ИТ" | Способ определения кариотипа плода беременной женщины на основании секвенирования гибридных прочтений, состоящих из коротких фрагментов внеклеточной ДНК |
WO2022035670A1 (en) * | 2020-08-09 | 2022-02-17 | Myriad Women's Health, Inc. | Bayesian sex caller |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005508619A (ja) * | 2001-08-03 | 2005-04-07 | ディヴァーサ コーポレイション | エポキシドヒドロラーゼ、それらをコードした核酸及びそれらの作製法と利用法 |
JP2007508017A (ja) * | 2003-10-08 | 2007-04-05 | ザ トラスティーズ オブ ボストン ユニバーシティ | 染色体異常の出生前診断のための方法 |
JP2007515947A (ja) * | 2003-10-30 | 2007-06-21 | タフツ−ニュー イングランド メディカル センター | 羊水中の無細胞胎児dnaを使用する出生前診断 |
JP2010534069A (ja) * | 2007-07-23 | 2010-11-04 | ザ チャイニーズ ユニバーシティー オブ ホンコン | ゲノム配列決定を使用する胎児染色体異数性の診断 |
WO2011090556A1 (en) * | 2010-01-19 | 2011-07-28 | Verinata Health, Inc. | Methods for determining fraction of fetal nucleic acid in maternal samples |
US20120270739A1 (en) * | 2010-01-19 | 2012-10-25 | Verinata Health, Inc. | Method for sample analysis of aneuploidies in maternal samples |
-
2012
- 2012-10-31 EP EP15188289.1A patent/EP3026124A1/en not_active Withdrawn
- 2012-10-31 DK DK12190844.6T patent/DK2728014T3/en active
- 2012-10-31 EP EP12190844.6A patent/EP2728014B1/en active Active
-
2013
- 2013-10-31 AU AU2013340795A patent/AU2013340795A1/en not_active Abandoned
- 2013-10-31 EP EP13786650.5A patent/EP2914738A1/en not_active Withdrawn
- 2013-10-31 WO PCT/EP2013/072848 patent/WO2014068075A1/en active Application Filing
- 2013-10-31 JP JP2015538513A patent/JP2015534807A/ja active Pending
- 2013-10-31 CN CN201380068714.XA patent/CN105074004A/zh active Pending
- 2013-10-31 US US14/439,579 patent/US20150275290A1/en not_active Abandoned
- 2013-10-31 CA CA2888906A patent/CA2888906A1/en not_active Abandoned
-
2015
- 2015-04-22 IL IL238426A patent/IL238426A0/en unknown
- 2015-09-18 HK HK15109158.2A patent/HK1208708A1/xx unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005508619A (ja) * | 2001-08-03 | 2005-04-07 | ディヴァーサ コーポレイション | エポキシドヒドロラーゼ、それらをコードした核酸及びそれらの作製法と利用法 |
JP2007508017A (ja) * | 2003-10-08 | 2007-04-05 | ザ トラスティーズ オブ ボストン ユニバーシティ | 染色体異常の出生前診断のための方法 |
JP2007515947A (ja) * | 2003-10-30 | 2007-06-21 | タフツ−ニュー イングランド メディカル センター | 羊水中の無細胞胎児dnaを使用する出生前診断 |
JP2010534069A (ja) * | 2007-07-23 | 2010-11-04 | ザ チャイニーズ ユニバーシティー オブ ホンコン | ゲノム配列決定を使用する胎児染色体異数性の診断 |
WO2011090556A1 (en) * | 2010-01-19 | 2011-07-28 | Verinata Health, Inc. | Methods for determining fraction of fetal nucleic acid in maternal samples |
US20120270739A1 (en) * | 2010-01-19 | 2012-10-25 | Verinata Health, Inc. | Method for sample analysis of aneuploidies in maternal samples |
Non-Patent Citations (10)
Title |
---|
AMERICAN JOURNAL OF OBSTETRICS & GYNECOLOGY, vol. V204 N3, JPN5015011418, 28 December 2010 (2010-12-28), pages 205 - 1, ISSN: 0003624246 * |
ANNALS OF BIOLOGICAL RESEARCH [ONLINE], vol. V2 N6, JPN5015011414, 1 January 2011 (2011-01-01), pages 155 - 164, ISSN: 0003772967 * |
BMJ, vol. 339, JPN6017031671, 18 July 2009 (2009-07-18), pages 161 - 165, ISSN: 0003624248 * |
BMJ, vol. V342 N JAN11 1, JPN5015011416, 11 January 2011 (2011-01-11), pages 7401 - 1, ISSN: 0003624244 * |
CLINICA CHIMICA ACTA, vol. 404, no. 2, JPN6017031670, 27 June 2009 (2009-06-27), pages 100 - 104, ISSN: 0003624247 * |
EURASIAN JOURNAL OF BIOSCIENCES, vol. V5, JPN5015011413, 1 November 2011 (2011-11-01), pages 119 - 126, ISSN: 0003772966 * |
PLOS ONE, vol. V6 N7, JPN5015011417, 6 July 2011 (2011-07-06), pages 21791 - 1, ISSN: 0003624245 * |
PNAS, vol. V105 N42, JPN5015011419, 21 October 2008 (2008-10-21), pages 16266 - 16271, ISSN: 0003772969 * |
PNAS, vol. V105 N51, JPN5015011415, 23 December 2008 (2008-12-23), pages 20458 - 20463, ISSN: 0003772968 * |
SCIENCE TRANSLATIONAL MEDICINE, vol. V2 N61ra91, P1-13, JPN5015011420, 8 December 2010 (2010-12-08), US, ISSN: 0003772970 * |
Also Published As
Publication number | Publication date |
---|---|
CN105074004A (zh) | 2015-11-18 |
EP3026124A1 (en) | 2016-06-01 |
EP2728014A1 (en) | 2014-05-07 |
IL238426A0 (en) | 2015-06-30 |
AU2013340795A1 (en) | 2015-05-14 |
US20150275290A1 (en) | 2015-10-01 |
EP2914738A1 (en) | 2015-09-09 |
WO2014068075A1 (en) | 2014-05-08 |
DK2728014T3 (en) | 2016-01-25 |
HK1208708A1 (en) | 2016-04-15 |
EP2728014B1 (en) | 2015-10-07 |
CA2888906A1 (en) | 2014-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2015534807A (ja) | 胎児の染色体異数性を検出するための非侵襲的方法 | |
JP7490219B2 (ja) | ゲノム配列決定を使用する胎児染色体異数性の診断 | |
JP7021148B2 (ja) | 性染色体におけるコピー数変異を判定するための方法 | |
JP6513622B2 (ja) | 非侵襲的出生前診断に有用な母体試料由来の胎児核酸のメチル化に基づく富化のためのプロセスおよび組成物 | |
KR102184868B1 (ko) | 카피수 변이를 판정하기 위한 dna 단편 크기의 사용 | |
JP6328934B2 (ja) | 非侵襲性出生前親子鑑定法 | |
JP6830094B2 (ja) | 染色体異常を検出するための核酸及び方法 | |
CN110800063B (zh) | 使用无细胞dna片段大小检测肿瘤相关变体 | |
JP6161607B2 (ja) | サンプルにおける異なる異数性の有無を決定する方法 | |
JP2017176181A (ja) | 胎児の染色体異数性の診断 | |
EP3018213A1 (en) | Method for determining the presence of a biological condition by determining total and relative amounts of two different nucleic acids | |
JP2017506908A (ja) | 対象シークエンスを有する核酸の量の減少または増加の検出方法 | |
EP3666902B1 (en) | Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing | |
EP3662479A1 (en) | A method for non-invasive prenatal detection of fetal sex chromosomal abnormalities and fetal sex determination for singleton and twin pregnancies | |
CN106029899A (zh) | 确定染色体预定区域中snp信息的方法、系统和计算机可读介质 | |
CN111321210B (zh) | 一种无创产前检测胎儿是否患有遗传疾病的方法 | |
WO2015042649A1 (en) | A quantitative assay for target dna in a mixed sample comprising target and non-target dna | |
EP3149202A1 (en) | Method of prenatal diagnosis | |
WO2024076469A1 (en) | Non-invasive methods of assessing transplant rejection in pregnant transplant recipients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161018 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170822 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180410 |