JP2016000046A - 遺伝マーカーを評価するための方法および組成物 - Google Patents
遺伝マーカーを評価するための方法および組成物 Download PDFInfo
- Publication number
- JP2016000046A JP2016000046A JP2015164811A JP2015164811A JP2016000046A JP 2016000046 A JP2016000046 A JP 2016000046A JP 2015164811 A JP2015164811 A JP 2015164811A JP 2015164811 A JP2015164811 A JP 2015164811A JP 2016000046 A JP2016000046 A JP 2016000046A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- sequence
- target
- probe
- capture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title abstract description 304
- 239000000203 mixture Substances 0.000 title abstract description 32
- 230000002068 genetic effect Effects 0.000 title abstract description 25
- 150000007523 nucleic acids Chemical group 0.000 abstract description 550
- 102000039446 nucleic acids Human genes 0.000 abstract description 490
- 108020004707 nucleic acids Proteins 0.000 abstract description 490
- 239000000523 sample Substances 0.000 abstract description 421
- 238000004458 analytical method Methods 0.000 abstract description 59
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 40
- 238000012300 Sequence Analysis Methods 0.000 abstract description 6
- 238000002360 preparation method Methods 0.000 description 139
- 230000008685 targeting Effects 0.000 description 115
- 238000006243 chemical reaction Methods 0.000 description 101
- 238000012163 sequencing technique Methods 0.000 description 99
- 230000003321 amplification Effects 0.000 description 90
- 238000003199 nucleic acid amplification method Methods 0.000 description 90
- 238000009396 hybridization Methods 0.000 description 71
- 239000000047 product Substances 0.000 description 67
- 108700028369 Alleles Proteins 0.000 description 63
- 239000012472 biological sample Substances 0.000 description 61
- 238000001514 detection method Methods 0.000 description 58
- 239000013615 primer Substances 0.000 description 50
- 238000003556 assay Methods 0.000 description 47
- 238000012217 deletion Methods 0.000 description 47
- 230000037430 deletion Effects 0.000 description 47
- 238000003780 insertion Methods 0.000 description 46
- 230000037431 insertion Effects 0.000 description 46
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 44
- 108020004414 DNA Proteins 0.000 description 42
- 230000035772 mutation Effects 0.000 description 40
- 238000013459 approach Methods 0.000 description 37
- 201000010099 disease Diseases 0.000 description 34
- 230000000295 complement effect Effects 0.000 description 32
- 239000002773 nucleotide Substances 0.000 description 32
- 125000003729 nucleotide group Chemical group 0.000 description 32
- 238000003205 genotyping method Methods 0.000 description 31
- 230000000670 limiting effect Effects 0.000 description 30
- 230000035945 sensitivity Effects 0.000 description 28
- 108091093037 Peptide nucleic acid Proteins 0.000 description 20
- 239000013610 patient sample Substances 0.000 description 20
- 102000054765 polymorphisms of proteins Human genes 0.000 description 20
- 230000009897 systematic effect Effects 0.000 description 19
- 238000007481 next generation sequencing Methods 0.000 description 16
- 230000036961 partial effect Effects 0.000 description 16
- 230000002159 abnormal effect Effects 0.000 description 15
- 230000001965 increasing effect Effects 0.000 description 15
- 108090000623 proteins and genes Proteins 0.000 description 14
- 206010028980 Neoplasm Diseases 0.000 description 13
- 239000000872 buffer Substances 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 239000011541 reaction mixture Substances 0.000 description 12
- 108060002716 Exonuclease Proteins 0.000 description 11
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- 102000013165 exonuclease Human genes 0.000 description 11
- 238000002955 isolation Methods 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 108091093088 Amplicon Proteins 0.000 description 10
- 108091034117 Oligonucleotide Proteins 0.000 description 10
- 208000035475 disorder Diseases 0.000 description 10
- 238000012252 genetic analysis Methods 0.000 description 10
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 9
- 238000013461 design Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 8
- 102100029075 Exonuclease 1 Human genes 0.000 description 8
- 208000026350 Inborn Genetic disease Diseases 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000011049 filling Methods 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 238000005259 measurement Methods 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- 208000016361 genetic disease Diseases 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 7
- 230000003252 repetitive effect Effects 0.000 description 7
- 230000001850 reproductive effect Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 238000004088 simulation Methods 0.000 description 7
- 235000000346 sugar Nutrition 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 238000002405 diagnostic procedure Methods 0.000 description 6
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 5
- 108700024394 Exon Proteins 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 239000007795 chemical reaction product Substances 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000009223 counseling Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 244000052769 pathogen Species 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 238000004393 prognosis Methods 0.000 description 5
- -1 rRNA Proteins 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 208000001914 Fragile X syndrome Diseases 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 208000010206 X-Linked Mental Retardation Diseases 0.000 description 4
- 230000001351 cycling effect Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 239000000975 dye Substances 0.000 description 4
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 230000008774 maternal effect Effects 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 239000011535 reaction buffer Substances 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000008080 stochastic effect Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 208000031906 susceptibility to X-linked 2 autism Diseases 0.000 description 4
- 238000005382 thermal cycling Methods 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 208000027472 Galactosemias Diseases 0.000 description 3
- 101000828537 Homo sapiens Synaptic functional regulator FMR1 Proteins 0.000 description 3
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 102100023532 Synaptic functional regulator FMR1 Human genes 0.000 description 3
- 150000001413 amino acids Chemical group 0.000 description 3
- 210000004381 amniotic fluid Anatomy 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 210000002459 blastocyst Anatomy 0.000 description 3
- 238000011088 calibration curve Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000001605 fetal effect Effects 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 238000002513 implantation Methods 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 238000007837 multiplex assay Methods 0.000 description 3
- 239000006199 nebulizer Substances 0.000 description 3
- 239000002751 oligonucleotide probe Substances 0.000 description 3
- 238000002515 oligonucleotide synthesis Methods 0.000 description 3
- 150000007530 organic bases Chemical class 0.000 description 3
- 230000008775 paternal effect Effects 0.000 description 3
- 230000037452 priming Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000010008 shearing Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 208000011580 syndromic disease Diseases 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 2
- 208000022526 Canavan disease Diseases 0.000 description 2
- 241000938605 Crocodylia Species 0.000 description 2
- 201000003883 Cystic fibrosis Diseases 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 102100024108 Dystrophin Human genes 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102100037156 Gap junction beta-2 protein Human genes 0.000 description 2
- 208000015872 Gaucher disease Diseases 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000954092 Homo sapiens Gap junction beta-2 protein Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 208000032818 Microsatellite Instability Diseases 0.000 description 2
- 208000035544 Nonketotic hyperglycinaemia Diseases 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 201000011252 Phenylketonuria Diseases 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 238000001369 bisulfite sequencing Methods 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 230000001488 breeding effect Effects 0.000 description 2
- 230000004640 cellular pathway Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 229940079920 digestives acid preparations Drugs 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000013412 genome amplification Methods 0.000 description 2
- 201000011205 glycine encephalopathy Diseases 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000003100 immobilizing effect Effects 0.000 description 2
- 238000009830 intercalation Methods 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 235000019689 luncheon sausage Nutrition 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 238000011880 melting curve analysis Methods 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 239000011325 microbead Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 201000006790 nonsyndromic deafness Diseases 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 108090000765 processed proteins & peptides Chemical group 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004043 responsiveness Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000007363 ring formation reaction Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 208000001392 short chain acyl-CoA dehydrogenase deficiency Diseases 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- BHKKSKOHRFHHIN-MRVPVSSYSA-N 1-[[2-[(1R)-1-aminoethyl]-4-chlorophenyl]methyl]-2-sulfanylidene-5H-pyrrolo[3,2-d]pyrimidin-4-one Chemical compound N[C@H](C)C1=C(CN2C(NC(C3=C2C=CN3)=O)=S)C=CC(=C1)Cl BHKKSKOHRFHHIN-MRVPVSSYSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 108700020831 3-Hydroxyacyl-CoA Dehydrogenase Proteins 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- RYYIULNRIVUMTQ-UHFFFAOYSA-N 6-chloroguanine Chemical compound NC1=NC(Cl)=C2N=CNC2=N1 RYYIULNRIVUMTQ-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 102100024645 ATP-binding cassette sub-family C member 8 Human genes 0.000 description 1
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical class CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 1
- 208000005676 Adrenogenital syndrome Diseases 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 102100022146 Arylsulfatase A Human genes 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 206010061666 Autonomic neuropathy Diseases 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 208000033258 Bifunctional enzyme deficiency Diseases 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 1
- 208000005692 Bloom Syndrome Diseases 0.000 description 1
- QCMYYKRYFNMIEC-UHFFFAOYSA-N COP(O)=O Chemical class COP(O)=O QCMYYKRYFNMIEC-UHFFFAOYSA-N 0.000 description 1
- 108010036867 Cerebroside-Sulfatase Proteins 0.000 description 1
- 208000011835 Classic galactosemia Diseases 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 208000008448 Congenital adrenal hyperplasia Diseases 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 108010069091 Dystrophin Proteins 0.000 description 1
- 108700006770 Glutaric Acidemia I Proteins 0.000 description 1
- 208000021097 Glutaryl-CoA dehydrogenase deficiency Diseases 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- 101000760570 Homo sapiens ATP-binding cassette sub-family C member 8 Proteins 0.000 description 1
- 101000986595 Homo sapiens Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 101000617738 Homo sapiens Survival motor neuron protein Proteins 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 208000008498 Infantile Refsum disease Diseases 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 208000035752 Live birth Diseases 0.000 description 1
- 208000030162 Maple syrup disease Diseases 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 201000011442 Metachromatic leukodystrophy Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 208000008955 Mucolipidoses Diseases 0.000 description 1
- 101100013186 Mus musculus Fmr1 gene Proteins 0.000 description 1
- 208000021642 Muscular disease Diseases 0.000 description 1
- 201000009623 Myopathy Diseases 0.000 description 1
- UKXVJQOJYPGJQF-UHFFFAOYSA-N N[N].NCC(O)=O Chemical compound N[N].NCC(O)=O UKXVJQOJYPGJQF-UHFFFAOYSA-N 0.000 description 1
- 208000018909 Neonatal adrenoleukodystrophy Diseases 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 208000000599 Ornithine Carbamoyltransferase Deficiency Disease Diseases 0.000 description 1
- 206010052450 Ornithine transcarbamoylase deficiency Diseases 0.000 description 1
- 208000035903 Ornithine transcarbamylase deficiency Diseases 0.000 description 1
- 102100028200 Ornithine transcarbamylase, mitochondrial Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 102000009125 Peroxisomal Bifunctional Enzyme Human genes 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 102000014169 Steroid 21-Hydroxylase Human genes 0.000 description 1
- 108010011732 Steroid 21-Hydroxylase Proteins 0.000 description 1
- 208000003028 Stuttering Diseases 0.000 description 1
- 102100021947 Survival motor neuron protein Human genes 0.000 description 1
- 208000022292 Tay-Sachs disease Diseases 0.000 description 1
- 208000007824 Type A Niemann-Pick Disease Diseases 0.000 description 1
- 208000014769 Usher Syndromes Diseases 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 201000004525 Zellweger Syndrome Diseases 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 239000003570 air Substances 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 201000006288 alpha thalassemia Diseases 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 208000031514 autosomal recessive nonsyndromic hearing loss 1A Diseases 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 206010071434 biotinidase deficiency Diseases 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 125000002057 carboxymethyl group Chemical group [H]OC(=O)C([H])([H])[*] 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 208000016617 citrullinemia type I Diseases 0.000 description 1
- 239000005516 coenzyme A Substances 0.000 description 1
- 229940093530 coenzyme a Drugs 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- BOKOVLFWCAFYHP-UHFFFAOYSA-N dihydroxy-methoxy-sulfanylidene-$l^{5}-phosphane Chemical class COP(O)(O)=S BOKOVLFWCAFYHP-UHFFFAOYSA-N 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 201000007412 galactokinase deficiency Diseases 0.000 description 1
- 208000011836 galactose epimerase deficiency Diseases 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 208000011460 glycogen storage disease due to glucose-6-phosphatase deficiency type IA Diseases 0.000 description 1
- 231100000888 hearing loss Toxicity 0.000 description 1
- 230000010370 hearing loss Effects 0.000 description 1
- 238000012203 high throughput assay Methods 0.000 description 1
- 201000001082 holocarboxylase synthetase deficiency Diseases 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 201000008980 hyperinsulinism Diseases 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 125000001921 locked nucleotide group Chemical group 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 208000024393 maple syrup urine disease Diseases 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 208000005548 medium chain acyl-CoA dehydrogenase deficiency Diseases 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 201000003694 methylmalonic acidemia Diseases 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000004766 neurogenesis Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007826 nucleic acid assay Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 125000000962 organic group Chemical group 0.000 description 1
- 201000011278 ornithine carbamoyltransferase deficiency Diseases 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 208000020930 peroxisome biogenesis disorder 1B Diseases 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 150000003014 phosphoric acid esters Chemical class 0.000 description 1
- 229920001184 polypeptide Chemical group 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 201000004012 propionic acidemia Diseases 0.000 description 1
- MWWATHDPGQKSAR-UHFFFAOYSA-N propyne Chemical compound CC#C MWWATHDPGQKSAR-UHFFFAOYSA-N 0.000 description 1
- NQLVQOSNDJXLKG-UHFFFAOYSA-N prosulfocarb Chemical compound CCCN(CCC)C(=O)SCC1=CC=CC=C1 NQLVQOSNDJXLKG-UHFFFAOYSA-N 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 150000003290 ribose derivatives Chemical group 0.000 description 1
- 238000005464 sample preparation method Methods 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000011896 sensitive detection Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- ZEMGGZBWXRYJHK-UHFFFAOYSA-N thiouracil Chemical compound O=C1C=CNC(=S)N1 ZEMGGZBWXRYJHK-UHFFFAOYSA-N 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
【課題】遺伝マーカーを評価するための方法および組成物の提供。【解決手段】本発明の局面は、遺伝子座の多重分析のバイアスを減少させるためおよび遺伝子座の多重分析の再現性を高めるために有用な方法および組成物に関する。いくつかの形態では、所定の調製工程および/または核酸配列分析法が、複数のサンプル中の複数の遺伝子座に対する多重分析において用いられる。一局面において、複数の遺伝子座を分析する方法が提供され、該方法は:複数の標的核酸の各々をプローブセットと接触させる工程、複数の核酸を単離する工程、ならびに該単離された核酸を分析する工程を包含する。【選択図】図1
Description
関連出願
この出願は、米国特許法§119(e)の下、2009年4月30日に出願された米国仮出願第61/174,470号、2009年5月15日に出願された米国仮出願第61/178,923号、2009年5月18日に出願された米国仮出願第61/179,358号および2009年5月28日に出願された米国仮出願第61/182,089号(各々の全体の内容は、参考として本明細書に援用される)の利益を主張する。
この出願は、米国特許法§119(e)の下、2009年4月30日に出願された米国仮出願第61/174,470号、2009年5月15日に出願された米国仮出願第61/178,923号、2009年5月18日に出願された米国仮出願第61/179,358号および2009年5月28日に出願された米国仮出願第61/182,089号(各々の全体の内容は、参考として本明細書に援用される)の利益を主張する。
発明の背景
本発明は、患者サンプル中の遺伝子型を決定するための方法および組成物に関する。
本発明は、患者サンプル中の遺伝子型を決定するための方法および組成物に関する。
発明の背景
被験体の遺伝子型に関する情報は、多くの疾患、障害および生理学的特徴に対する遺伝的根拠がさらに解明されるにつれて、一連の健康管理の判断にとってますます重要になり、かつそのような判断に直接関係してくる。医学的な助言は、次第に個人向けになってきており、個別の判断および勧告は、特定の遺伝情報に基づく。1つ以上の遺伝子座における対立遺伝子の型および数に関する情報は、健康管理について考慮すべき他の事柄の中でも疾患リスク、予後、治療法の選択肢および遺伝カウンセリングに影響を及ぼす。
被験体の遺伝子型に関する情報は、多くの疾患、障害および生理学的特徴に対する遺伝的根拠がさらに解明されるにつれて、一連の健康管理の判断にとってますます重要になり、かつそのような判断に直接関係してくる。医学的な助言は、次第に個人向けになってきており、個別の判断および勧告は、特定の遺伝情報に基づく。1つ以上の遺伝子座における対立遺伝子の型および数に関する情報は、健康管理について考慮すべき他の事柄の中でも疾患リスク、予後、治療法の選択肢および遺伝カウンセリングに影響を及ぼす。
費用効果が高く、かつ信頼できる医学的カウンセリングおよび生殖カウンセリングを大規模に行うためには、多くの被験体の多くの異なる遺伝子座についての対立遺伝子の状態を正確かつ明白に同定できることが重要である。
生物学的サンプルから核酸配列を検出するためおよび分析するために、数多くの技術が開発されている。これらの技術を用いることにより、被験体の遺伝子タイピングを行うことおよび目的の任意の遺伝子座の対立遺伝子の状態を決定することができる。しかしながら、多数の患者の多くの遺伝子座の信頼できるハイスループット分析にむけてスケールアップするには、それらの技術は、十分に頑強ではなく、費用効果の高いものではない。現在の技術は、不正確またはあいまいなコール(call)の頻度が高すぎて、不確かさを解消するためおよびアウトプット情報の信頼性を提供するために高価かつ時間のかかる工程を要さずに多数の患者サンプルを管理することはできない。
発明の要旨
本発明の局面は、遺伝子型を評価するため、特に、被験体の1つ以上の遺伝子座の対立遺伝子の同一性(または二倍体生物における同一性)を決定するための、調製および分析の方法および組成物に関する。
本発明の局面は、遺伝子型を評価するため、特に、被験体の1つ以上の遺伝子座の対立遺伝子の同一性(または二倍体生物における同一性)を決定するための、調製および分析の方法および組成物に関する。
本発明の局面は、遺伝分析におけるあいまいさおよびエラーの種々の起源の同定に部分的に基づき、また、遺伝分析の種々の段階におけるこれらのエラーおよびあいまいさを回避するため、減少させるため、認識するため、および/または解消するための1つ以上のアプローチの同定に部分的に基づく。
本発明の局面によると、ある特定のタイプの遺伝情報は、調製段階(例えば、捕捉、増幅など)、決定段階(例えば、対立遺伝子特異的検出、配列決定など)、データ解釈段階(例えば、アッセイ情報が被験体をホモ接合またはヘテロ接合と同定するのに十分であるか否かを決定する段階)および/または他の段階のいずれかにおける、確率的変動と系統誤差(systematic bias)との組み合わせに起因して、遺伝分析において提示不足であり得るかまたは提示過剰であり得る。
本発明の局面によると、エラーまたはあいまいさは、遺伝分析において明らかであり得るが、追加のサンプリングまたはより高価なアッセイを行わずに容易に解決されることはない(例えば、アレイベースのアッセイは、ノイズの多いシグナル/低レベルのシグナルに起因してコールなし(no−call)を報告し得る)。本発明のさらなる局面によると、エラーまたはあいまいさは、遺伝分析において説明されないかもしれず、不正確なベースコール(base call)は、それらについての証拠が限られているときおよび/または統計学的に有意でないときでさえ、生じ得る(例えば、次世代シークエンシング技術は、それらについての証拠が統計学的に有意でない場合でさえ、ベースコールを報告し得る)。本発明のさらなる局面によると、エラーまたはあいまいさは、明らかであるが、分析の1つ以上の工程では容易に解決されず、また、分析の他の工程では明らかでないかまたは説明されないので、多段階の遺伝分析にとって問題となり得る。
いくつかの実施形態において、1つ以上の工程におけるエラーおよびあいまいさの起源は、生成される遺伝情報の複雑度および/または忠実度に影響を及ぼし得る任意の系統誤差または確率的影響を克服するように設計された重複プローブの1つ以上のセットを用いて目的の各標的遺伝子座を捕捉することおよび/または調べることによって対処され得る。
いくつかの実施形態において、1つ以上の工程におけるエラーおよびあいまいさの起源は、少なくとも1セットのプローブを用いて目的の各標的遺伝子座を捕捉することおよび/または調べることによって対処され得、ここで、種々のプローブは、アッセイ反応を追跡するため、および生成される情報においてある特定のタイプの遺伝情報が提示不足であるかまたは提示過剰であるかを決定するために使用され得る種々の識別子で標識されている。
いくつかの実施形態において、多数の配列リピートを含む領域の分析に関連するエラーおよびあいまいさは、アッセイの特定の段階(例えば、捕捉、シークエンシングまたは検出の段階)においてある特定の核酸の出現頻度を体系的に分析することによって対処される。そのような手法は、多くの異なる遺伝子座を、各遺伝子座に対して異なるアッセイ手順を必要とすることなく並行して評価できるように設計された標準化プロトコルにおいて特に有用であり得ることが認識されるだろう。いくつかの実施形態において、複数のタイプの遺伝子病変(例えば、点変異、挿入/欠失、長さの多型)をアッセイするために単一の検出様式(例えば、シークエンシング)を使用することは、臨床の状況において都合がよい。本発明のいくつかの実施形態において、並行した複数のサンプル調製工程の使用を促進する方法が提供され、その方法には、配列検出の後に複数の分析プロセスが連結される。よって、本発明のいくつかの実施形態において、複数の患者の複数の遺伝子座にわたって種々のタイプの遺伝子病変を同時にアッセイするときのエラーおよび不確かさを減少させる改善されたワークフローが提供される。
いくつかの実施形態において、本発明の局面は、2つ以上の手法(各々が、異なるバイアス(bias)(例えば、1つ以上のタイプの配列の提示不足または提示過剰に向かう公知のバイアス)を有する)を組み合わせ、そして得られたデータを用いることにより、より高い信頼性で被験体に対する遺伝的コール(genetic call)を決定することによって、調製および/または分析のバイアスを克服するための方法を提供する。
いくつかの実施形態において、本発明の局面は、多重診断方法(multiplex diagnostic method)に関することが認識されるだろう。いくつかの実施形態において、多重診断方法は、複数の遺伝子座(例えば、表1からの1つ以上の遺伝子座)を並行して捕捉する工程を包含する。いくつかの実施形態において、それらの遺伝子座は、1つ以上の多型(例えば、表2からの1つ以上の多型)を有し、その遺伝子型は、疾患を引き起こす対立遺伝子に対応する。したがって、いくつかの実施形態において、本開示は、複数の遺伝性障害を並行して評価するための方法を提供する。いくつかの実施形態において、着床前、出生前、出生時または出生後の段階において複数の遺伝性障害を並行して診断するための方法が提供される。いくつかの実施形態において、本開示は、患者サンプル(例えば、血液、着床前胚、絨毛または羊水サンプル)から、または本発明の局面はこの点に限定されないので、他のサンプル(例えば、他の生体液または組織サンプル、例えば、生検サンプル)から複数の遺伝子座(例えば、表1から選択される複数の標的核酸)を分析するための方法を提供する。
他のサンプルとしては、腫瘍組織または循環腫瘍細胞が挙げられ得る。いくつかの実施形態において、患者サンプル(例えば、腫瘍組織サンプルまたは腫瘍細胞サンプル)は、目的の1つ以上の変異に対する寄せ集めであるので、生殖細胞系列における変異の分析に必要な感度よりも高い感度を必要とし得る。いくつかの実施形態において、サンプルは、宿主生物に由来しない細胞(例えば、ヒト被験体内の細菌感染物またはウイルス感染物)または環境モニタリング用のサンプル(例えば、土壌、水または大気サンプルの細菌、ウイルス、真菌の組成物)を含む。
したがって、いくつかの実施形態において、本明細書中に開示される方法の局面は、標的核酸の多型の遺伝子タイピングに関する。いくつかの実施形態において、遺伝子タイピングは、標的核酸の1つ以上の対立遺伝子がヘテロ接合であるかまたはホモ接合であるかを決定することを包含し得る。さらなる実施形態において、遺伝子タイピングは、多型の配列を決定すること、およびその配列を、疾患リスクを示唆するコントロール配列と比較することを包含し得る。いくつかの実施形態において、多型は、表1または表2における遺伝子座から選択される。しかしながら、目的の疾患または状態に関連する任意の遺伝子座が使用され得ることが認識されるだろう。
いくつかの実施形態において、被験体の1つ以上の遺伝子座において決定された遺伝子型に基づいて(例えば、被験体から得られた生物学的サンプルの分析に基づいて)、診断、予後または疾患リスクの評価が、その被験体に対して提供される。いくつかの実施形態において、1つ以上の遺伝子座における夫婦のそれぞれの遺伝子型に基づいて、ある疾患または状態に関連する遺伝子型(例えば、ある疾患または状態に関連するホモ接合またはヘテロ接合の遺伝子型)を有する1人以上の小児を有するリスクに関する評価がその夫婦に提供される。いくつかの実施形態において、被験体または夫婦は、本発明の実施形態に従って決定された遺伝子型に関連して遺伝カウンセリングまたは生殖カウンセリングを求め得る。いくつかの実施形態において、腫瘍または循環腫瘍細胞からの遺伝情報は、予後を決定するためおよび適切な薬物/処置の選択を導くために使用される。
本明細書中に記載される任意の方法または組成物は、本明細書中に記載されるような1つ以上の遺伝子座に関連する任意の医学的評価と組み合わせて使用され得ることが認識されるだろう。
いくつかの実施形態において、本発明の局面は、多重的なゲノムの捕捉および/または分析(配列決定分析を含む)における系統誤差(バイアス)および/または確率的影響に関連する課題を克服するために有効な方法を提供する。いくつかの実施形態において、本発明の局面は、1つ以上のサンプリング工程および/または分析工程におけるばらつきを回避するため、減少させるためおよび/または説明するために有用である。例えば、いくつかの実施形態において、標的核酸の提示のばらつきおよび捕捉された標的核酸プール内のヘテロ接合性対立遺伝子の不均等なサンプリングが、克服され得る。
したがって、いくつかの実施形態において、本開示は、多重捕捉方法における標的核酸の検出においてばらつきを減少させる方法を提供する。他の実施形態において、その方法は、捕捉プールにおける対立遺伝子の提示を改善し、ゆえに、相違する検出結果を改善する。ある特定の実施形態において、本開示は、従来技術の方法と比べて、捕捉プール内の標的核酸(例えば、遺伝子座)のより均一な提示を達成するための、標的核酸の重複領域を捕捉する複数のプローブ(例えば、分子反転プローブ(molecular inversion probes)MIPs)の種々のセットの使用を含む、標的核酸を捕捉するための調製方法を提供する。他の実施形態において、その方法は、例えば、診断目的での、遺伝子座の大規模な並行捕捉に関連するバイアスまたはバイアスのリスクを低下させる。他の実施形態において、複数の遺伝子座の並行検出の再現性を高めるための(例えば、標的核酸の捕捉に対する多型の影響を低下させることによって)方法が提供される。さらなる実施形態において、複数の遺伝子座の並行した分析に対する、プローブ合成および/またはプローブ増幅のばらつきの影響を減少させるための方法が提供される。
いくつかの局面によると、複数の遺伝子座を分析する方法が提供される。いくつかの実施形態において、その方法は、複数の標的核酸の各々をプローブセットと接触させる工程(ここで、各プローブセットは、複数の異なるプローブを含み、各プローブは、標的核酸の複数の部分領域のうちの1つの同じ鎖に隣接する核酸と相補的な5’領域および3’領域に隣接する中央領域を有し、ここで、その標的核酸の部分領域は、異なり、各部分領域は、少なくとも1つの他の部分領域と重複する)、複数の核酸(各々、複数の標的核酸の各々に関して異なる部分領域の核酸配列を有する)を単離する工程、ならびに単離された核酸を分析する工程を包含する。
他の実施形態において、方法は、複数の標的核酸の各々をプローブセットと接触させる工程(ここで、各プローブセットは、複数の異なるプローブを含み、各プローブは、標的核酸の複数の部分領域のうちの1つの同じ鎖に隣接する核酸と相補的な5’領域および3’領域に隣接する中央領域を有し、ここで、その標的核酸の部分領域は、異なり、プローブの5’領域の一部および3’領域の一部は、それぞれ、異なるプローブの5’領域の配列および3’領域の配列を有する)、複数の核酸(各々、複数の標的核酸の各々に関して異なる部分領域の核酸配列を有する)を単離する工程、ならびに単離された核酸を分析する工程を包含する。
本開示の局面は、ゲノムの捕捉、増幅およびシークエンシングの方法における系統誤差および偶然誤差(バイアス)、すなわち、核酸の捕捉および増幅、ならびにシークエンシングライブラリー内のヘテロ接合対立遺伝子の不均衡な提示における大きなばらつきに関連する問題を克服するための方法の発見に部分的に基づく。したがって、いくつかの実施形態において、本開示は、核酸の捕捉および増幅におけるばらつきに関連するエラーを減少させる方法を提供する。他の実施形態において、その方法は、シークエンシングライブラリー内の対立遺伝子の提示を改善し、ゆえに、相違する検出結果を改善する。ある特定の実施形態において、本開示は、個別の核酸分子を独特にタグ化する識別タグ配列(differentiator tag sequence)の使用を含む、標的核酸(例えば、遺伝子座)を捕捉するための調製方法を提供する。いくつかの実施形態において、その識別タグ配列のおかげで、シークエンシング反応において観察される識別タグ配列と標的配列との組み合わせの出現に基づいたバイアスの検出が可能になる。他の実施形態において、その方法は、例えば、診断目的での、遺伝子座の捕捉、増幅およびシークエンシングに関連するバイアスによって引き起こされるエラー、またはバイアスのリスクを減少させる。
本発明の局面は、アッセイにおいて同定された標的核酸配列が独立して単離された標的核酸に由来するかまたは複数のコピー数の同じ標的核酸分子に由来するかを決定する(例えば、調製工程、例えば、増幅におけるバイアスに起因して)ために有用である配列タグ(識別タグと呼ばれる)を提供することに関する。この情報は、信頼できる配列情報を得るために、生物学的サンプルから独立して単離された閾値数(threshold number)の標的核酸の分析を助けるために使用され得、また、所望の程度の信頼度で遺伝子型の結論(例えば、コール)をもたらすために使用され得る。この情報は、1つ以上の核酸調製工程におけるバイアスを検出するためにも使用され得る。
いくつかの実施形態において、本明細書中に開示される方法は、例えば、ゲノムの単離、増幅、シークエンシングに関連する、バイアスを減少させることが重要な任意の用途にとって有用である。例えば、不均一な組織サンプルにおける癌変異の検出、母体に循環する胎児DNAにおける変異の検出、および着床前遺伝子診断法において単離された細胞における変異の検出。
したがって、いくつかの局面において、被験体の遺伝子タイピングを行う方法が提供される。いくつかの実施形態において、その方法は、独立して単離された少なくとも閾値数の核酸の配列を決定する工程を包含し、ここで、単離された各核酸の配列は、標的核酸配列および識別タグ配列を含み、閾値数は、標的核酸配列と識別タグ配列との独特の組み合わせの数であり、単離された核酸は、標的核酸配列と識別タグ配列との独特の組み合わせを含む場合、独立して単離されたと同定され、ここで、標的核酸配列は、被験体のゲノム遺伝子座の配列である。
いくつかの実施形態において、単離された核酸は、環状化選択(circularization selection)ベースの調製方法の産物、例えば、分子反転プローブによる捕捉産物である。他の実施形態において、単離された核酸は、増幅ベースの調製方法の産物である。他の実施形態において、単離された核酸は、ハイブリダイゼーションベースの調製方法の産物である。
環状化選択ベースの調製方法は、目的の領域(標的核酸)を共有結合的に閉じた環状分子に選択的に変換し、次いでその環状分子を、代表的には、任意の環状化されていない直鎖状核酸の除去(通常、例えばエキソヌクレアーゼを用いた、酵素的な除去)によって単離する。目的の領域(標的核酸)に隣接する末端および必要に応じてプライマー部位、例えば、シークエンシングプライマー部位を有するオリゴヌクレオチドプローブ(例えば、分子反転プローブ)を設計する。それらのプローブは、ゲノム標的にハイブリダイズすることができ、酵素を用いることにより、第1に(必要に応じて)プローブの末端間の任意のギャップが埋められ、第2に、プローブが閉じてライゲートされる。環状化の後、代表的には、任意の残りの(非標的)直鎖状核酸が除去され、標的核酸が単離(捕捉)される。環状化選択ベースの調製方法には、分子反転プローブによる捕捉反応および「セレクター(selector)」による捕捉反応が含まれる。いくつかの実施形態において、分子反転プローブによる標的核酸の捕捉は、標的核酸における多型の存在を示す。
増幅ベース(例えば、PCRベースまたはLCRベースなど)の調製方法において、ゲノム遺伝子座(標的核酸)は、1つ以上のオリゴヌクレオチドプライマーを用いて各遺伝子座を選択的に増幅するポリメラーゼ連鎖反応またはリガーゼ連鎖反応(または他の増幅方法)を用いて直接単離される。プライマーは、標的核酸とハイブリダイズするのに十分かつ標的核酸の増幅をプライミングするのに十分、標的配列と相補的であることが理解されるべきである。様々な分野において公知の方法のいずれか1つが、プライマーの設計および合成のために利用され得る。1つ以上のプライマーが、標的配列と完全に相補的であり得る。縮重プライマーもまた使用され得る。プライマーは、標的配列と相補的でないが下流の用途を容易にする追加の核酸(例えば、制限酵素認識部位および識別タグ配列を含む)も含み得る。増幅ベースの方法は、単一標的核酸の増幅および多重増幅(複数の標的核酸の並行した増幅)を含む。
ハイブリダイゼーションベースの調製方法は、さらなる操作のために標的核酸を選択的に固定化する工程を包含し得る。識別タグ配列を含み、かつ15〜170ヌクレオチド長であり得る1つ以上のオリゴヌクレオチド(固定化オリゴヌクレオチド)が使用され、そのオリゴヌクレオチドが、遺伝子座の標的領域にわたってハイブリダイズすることにより、その標的領域が固定化されることが理解されるべきである。いくつかの実施形態において、固定化オリゴヌクレオチドは、ハイブリダイゼーションが行われる前に固定化されるか(例えば、Roche/Nimblegen「配列捕捉」)、または例えば、ストレプトアビジンでコーティングされたマイクロビーズに結合することによってハイブリダイゼーションの後に標的核酸を選択的に固定化するために使用され得る部分(例えば、ビオチン)を含むように調製される(例えば、Agilent「SureSelect」)。
本明細書中に記載される環状化、増幅および/またはハイブリダイゼーションベースの方法のいずれかが、本明細書中に記載されるタイリング(tiling)/スタガリング(staggering)、タギング、サイズ検出および/または感度増強アルゴリズムのうちの1つ以上に関連して使用され得ることが認識されるだろう。
いくつかの実施形態において、本明細書中に開示される方法は、分子反転プローブによる捕捉産物(各捕捉産物は、分子反転プローブおよび標的核酸を含む)の配列を決定する工程(ここで、その分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含み、標的核酸は、被験体の捕捉されるゲノム遺伝子座である)および分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との少なくとも閾値数の独特の組み合わせの配列に基づいて、捕捉されたゲノム遺伝子座において被験体の遺伝子タイピングを行う工程を包含する。
いくつかの実施形態において、本明細書中に開示される方法は、分子反転プローブによる捕捉産物(各捕捉産物は、分子反転プローブおよび標的核酸を含む)を得る工程(ここで、その分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含み、ここで、標的核酸は、被験体の捕捉されるゲノム遺伝子座である)、分子反転プローブによる捕捉産物を増幅する工程、ならびに各標的核酸について、分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との少なくとも閾値数の独特の組み合わせの配列を決定することによって被験体の遺伝子タイピングを行う工程を包含する。ある特定の実施形態において、上記の得る工程は、分子反転プローブ(各々が独特の識別タグ配列を含む)を用いて被験体のゲノムサンプルから標的核酸を捕捉する工程を包含する。特定の実施形態において、捕捉工程は、標的配列と識別タグ配列との同一の組み合わせを用いて2つ以上の分子反転プローブによる捕捉産物が得られる尤度が所定の値と等しいかまたはそれ未満であり、必要に応じてその所定の値が約0.05である条件下で行われる。
1つの実施形態において、特定の標的核酸配列に対する閾値数は、その遺伝子型に対する所望の統計学的信頼度に基づいて選択される。いくつかの実施形態において、上記方法は、標的核酸配列と識別タグ配列との独特の組み合わせの数に基づいて、遺伝子型に対する統計学的信頼度を決定する工程をさらに包含する。
いくつかの局面によると、複数の遺伝子座を分析する方法が提供される。いくつかの実施形態において、その方法は、分子反転プローブによる複数の捕捉産物(各々、分子反転プローブおよび標的核酸を含む)を得る工程(ここで、その分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列(例えば、シークエンシング用または他の伸長反応用のプライマーとして使用される核酸の配列と相補的である配列)を含む)、その分子反転プローブによる複数の捕捉産物を増幅する工程、増幅された複数のものにおける、分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との組み合わせの出現数を測定する工程、ならびに標的核酸配列と識別タグ配列との特定の組み合わせの出現数が、所定の値を超える場合、その特定の組み合わせを含む分子反転プローブの増幅におけるバイアスを検出する工程を包含する。いくつかの実施形態において、その方法は、その複数のものにおける標的配列の遺伝子タイピングを行う工程をさらに包含し、ここで、その遺伝子タイピングは、バイアスが検出された場合にそのバイアスを補正する工程を包含する。
いくつかの実施形態において、標的核酸は、表1から選択される遺伝子(またはその一部)である。いくつかの実施形態において、遺伝子タイピングは、被験体のゲノム(二倍体ゲノム)の1つ以上(両方)の対立遺伝子における標的核酸(例えば、多型配列)の配列を決定することを含む。ある特定の実施形態において、遺伝子タイピングは、被験体の二倍体ゲノムの両方の対立遺伝子における標的核酸の配列を決定することを含み、ここで、その標的核酸は、表1、表2の配列または他の目的の遺伝子座を含むか、またはそれらからなる。
いくつかの実施形態において、本発明の局面は、目的のゲノム領域のヌクレオチド配列を決定することなく、これらの領域における核酸の挿入または欠失を同定するための方法および組成物を提供する。本発明の局面は、核酸配列リピート(例えば、ジヌクレオチドリピートまたはトリヌクレオチドリピート)を含むゲノム領域において核酸の挿入または欠失を検出するために特に有用である。しかしながら、本発明は、核酸リピートを分析することに限定されず、任意の目的の標的核酸における挿入または欠失を検出するためにも使用され得る。本発明の局面は、多重アッセイにおいて複数の遺伝子座を分析するために特に有用である。
いくつかの実施形態において、本発明の局面は、ゲノム捕捉アッセイにおいて捕捉される標的核酸の量が、予想よりも多いまたは少ないことを決定することに関する。いくつかの実施形態において、予想される量からの統計学的に有意な偏差(例えば、多いまたは少ない)は、目的のゲノム領域における核酸の挿入または欠失の存在を示す。いくつかの実施形態において、その量は、捕捉される核酸分子の数である。いくつかの実施形態において、その量は、サンプル中の独立して捕捉された核酸分子の数である。捕捉される核酸は、サンプルから文字通り捕捉されてもよいし、それらの配列は、サンプル中の元の核酸を実際に捕捉することなく捕捉されてもよいことが認識されるだろう。例えば、核酸配列は、サンプル中の、目的の領域を有する鋳型ベースの核酸伸長を含むアッセイにおいて捕捉され得る。
本発明の局面は、ある特定の捕捉手法の効率が、捕捉される核酸の長さに影響されるという認識に基づく。したがって、標的核酸の長さが長くなることまたは短くなること(例えば、反復配列の挿入または欠失に起因して)によって、その核酸の捕捉効率が変化し得る。いくつかの実施形態において、標的核酸の捕捉効率の差(例えば、捕捉効率の統計学的に有意な差)は、標的核酸における挿入または欠失を示唆する。標的核酸に対する捕捉効率は、コントロールの量に対する(例えば、捕捉されたコントロール核酸の量に基づく)、捕捉された核酸の量(例えば、捕捉された核酸分子の数)に基づいて評価され得ることが認識されるだろう。しかしながら、本発明は、この点に限定されず、捕捉効率を評価するための他の手法を使用してもよい。
本発明の局面によると、リピート領域全体の配列を決定することに対立するものとして捕捉効率を評価することは、リピート領域のシークエンシングに関連するエラーを減少させる。リピート配列は、種々の条件下において複数のシークエンシング反応を行うことなくおよび結果を慎重に分析することなく標的領域内のリピートの数を正確に決定することを困難にするスタッター(stutter)またはスキップをシークエンシング反応において引き起こすことが多い。そのような手順は、煩わしく、標的核酸のハイスループット分析と一致する様式として容易に拡張できない。いくつかの実施形態において、リピート領域は、個別の配列リード(read)の長さよりも長いことがあり、単一のリードに基づいた長さの決定を不可能にする。例えば、次世代シークエンシングを用いるとき、リピート領域は、個別の配列リードの長さよりも長いことがあり、単一のリードに基づいた長さの決定を不可能にする。したがって、本発明の局面は、標的領域、特に、反復配列を含む標的領域における挿入または欠失を検出する感度を高めるために有用である。
いくつかの実施形態において、本発明の局面は、分子反転プローブ(例えば、MIPまたはパドロックプローブ)法を用いてゲノム核酸配列を捕捉すること、および捕捉された配列の量(例えば、数)が予想よりも多いまたは少ないことを決定することに関する。いくつかの実施形態において、捕捉された配列の量(例えば、数)は、コントロールアッセイにおいて捕捉された配列の量(例えば、数)と比較される。そのコントロールアッセイは、既知の配列長(例えば、既知の核酸リピート数)を有する同じ遺伝子座由来の核酸を含むコントロールサンプルを分析することを含み得る。しかしながら、コントロールは、いかなる挿入または欠失も含むと予想されない第2の(例えば、異なる)遺伝子座を分析することを含み得る。その第2の遺伝子座は、調べられている遺伝子座と同じサンプルまたはその長さが予め測定されている異なるサンプルにおいて分析され得る。その第2の遺伝子座は、核酸リピートの存在を特徴としない(ゆえに、リピート配列の挿入または欠失を含むと予想されない)遺伝子座であり得る。
いくつかの実施形態において、評価されている標的核酸領域は、標的領域(またはその配列)を捕捉するために設計されたプローブの標的化アーム(targeting arm)の同一性によって決定され得る。例えば、MIPプローブの標的化アームは、挿入または欠失を含むと疑われる標的領域に隣接するゲノム領域に対して相補的(例えば、選択的なハイブリダイゼーションおよび//またはポリメラーゼ伸長および/またはライゲーションにとって十分に相補的)であるように設計され得る。2つの標的化アームが、ゲノム核酸の一方の鎖において配列リピートの領域のすぐ隣(例えば、それぞれすぐ5’および3’)である2つの隣接領域に対して相補的(例えば、選択的なハイブリダイゼーションおよび/またはポリメラーゼ伸長および/またはライゲーションにとって十分に相補的)であるように設計され得ることが認識されるだろう。しかしながら、一方または両方の標的化アームは、捕捉される配列が、リピート領域の片側または両側に独特のゲノム配列の領域を含むように、リピート領域から数塩基(例えば、1〜5、5〜10、10〜25、25〜50またはそれ以上)上流または下流とハイブリダイズするように設計され得る。次いで、この独特の領域を用いることにより、捕捉された標的を同定することができる(例えば、配列情報またはハイブリダイゼーション情報に基づいて)。
いくつかの実施形態において、2つ以上(例えば、2、3、4、5、6、7、8、9、10個またはそれ以上)の異なる遺伝子座が、単一アッセイ(例えば、多重アッセイ)において並行して調べられ得る。いくつかの実施形態において、各遺伝子座に対する捕捉された核酸の比を用いることにより、核酸の挿入または欠失が、他の遺伝子座と比べて1つの遺伝子座に存在するか否かが決定され得る。例えば、その比は、コントロール配列(例えば、正常である配列またはそれらの遺伝子座について健常表現型に関連すると知られている配列)と比べて挿入または欠失を有しないときの2つの遺伝子座を代表するコントロール比と比較され得る。しかしながら、捕捉された核酸の量は、本明細書中で述べられるような任意の適当なコントロールと比較されてもよい。
捕捉された配列の遺伝子座は、欠失または挿入を含むと疑われる標的核酸内のリピート領域に対して5’および/または3’の独特の配列の一部を決定することによって同定され得る。これは、捕捉されたリピート領域自体のシークエンシングを必要としない。しかしながら、本発明の局面は、この点に限定されないので、リピート領域の一部または全部が配列決定され得る。
本発明の局面は、1つ以上の配列ベースのアッセイ(例えば、SNP検出アッセイ)と組み合わせる(例えば多重形式で)ことにより、被験体の1つ以上の領域の遺伝子型を決定し得る。
いくつかの実施形態において、生物学的サンプル中の核酸において多型を検出する方法が提供される。いくつかの実施形態において、その方法は、1つ以上の遺伝子座における捕捉の効率を評価する工程、ならびにその遺伝子座における一方または両方の対立遺伝子がコントロール遺伝子座(例えば、健常表現型に関連するリピート配列の長さを示す遺伝子座)と比べて挿入または欠失を含むか否かを決定する工程を包含する。
したがって、本発明の局面は、被験体由来の生物学的サンプル中の標的核酸の捕捉効率を評価することによって、標的核酸が異常な長さを有するか否かを決定するための方法に関し、ここで、基準となる捕捉効率と異なる捕捉効率は、生物学的サンプル中の異常な長さを有する標的核酸の存在を示す。用語「異常な」は、「正常な」長さとの比較に基づく相対的な用語であることが認識されるだろう。いくつかの実施形態において、正常な長さは、正常(例えば、健常者または非保因者の表現型)に関連する長さである。したがって、異常な長さは、正常な長さよりも短いかまたは長い長さである。いくつかの実施形態において、異常な長さの存在は、その遺伝子座が疾患または疾患保因者表現型に関連する高いリスクを示唆する。いくつかの実施形態において、異常な長さは、その被験体が、ある疾患もしくは状態を有するか、またはある疾患もしくは状態(例えば、その遺伝子座に関連するもの)の保因者であることを示唆する。しかしながら、異常な長さの存在を検出することに関する実施形態の記載は、予想される長さまたはコントロールの長さと異なる長さの存在を検出することも支持することが認識されるだろう。
いくつかの実施形態において、本発明の局面は、標的核酸(例えば、標的核酸内のサブターゲット(sub−target)領域)の長さを推定することに関する。いくつかの実施形態において、本発明の局面は、標的核酸に対する検出プローブのハイブリダイゼーションを可能にする条件下で複数の検出プローブと標的核酸を接触させること(ここで、各検出プローブは、標的核酸の第1の領域にハイブリダイズする第1のアームおよび標的核酸の第2の領域にハイブリダイズする第2のアームを含むポリヌクレオチドであり、ここで、第1の領域および第2の領域は、標的核酸の共通の鎖に存在し、第1の領域の5’末端と第2の領域の3’末端との間の標的のヌクレオチド配列は、サブターゲット核酸のヌクレオチド配列である);および複数の検出プローブとハイブリダイズした複数のサブターゲット核酸を捕捉すること;および複数のサブターゲット核酸におけるあるサブターゲット核酸の出現頻度を測定すること(ここで、複数のサブターゲット核酸におけるあるサブターゲット核酸の出現頻度は、サブターゲット核酸の長さを示す)によって、標的核酸の長さを推定するための方法に関する。核酸の長さを推定するための方法は、標的核酸領域が、既知のコントロール長よりも短いか、中間であるか、または長いかを決定するために、既知の核酸の長さに対する2つ以上の基準となる効率と、標的核酸領域に対する捕捉効率を比較する工程を包含し得ることが認識されるだろう。いくつかの実施形態において、異なる既知の長さの一連の核酸を用いることにより、目的の標的核酸領域の長さを評価するための検量線が提供され得る。
いくつかの実施形態において、欠失または挿入を有すると疑われる標的領域の捕捉効率は、その捕捉効率を、正常の捕捉効率を示す参照と比較することによって測定される。いくつかの実施形態において、捕捉効率は、基準となる捕捉効率よりも低い。いくつかの実施形態において、被験体は、標的領域に挿入を有すると同定される。いくつかの実施形態において、捕捉効率は、基準となる捕捉効率よりも高い。いくつかの実施形態において、被験体は、標的領域に欠失を有すると同定される。いくつかの実施形態において、被験体は、挿入についてヘテロ接合であると同定される。いくつかの実施形態において、被験体は、欠失についてヘテロ接合であると同定される。
本明細書中に記載される方法(例えば、タイリング/スタガリング、タギング、サイズ検出および/または感度増強)のいずれかのいくつかの実施形態において、本発明の局面は、サブターゲット核酸(またはサブターゲット核酸の配列)を捕捉することに関する。いくつかの実施形態において、分子反転プローブの手法が用いられる。いくつかの実施形態において、分子反転プローブは、その5’末端に第1の標的化アームを含み、その3’末端に第2の標的化アームを含む核酸の直鎖状の一本鎖であり、ここで、その第1の標的化アームは、サブターゲット核酸の一方の末端に隣接する第1の領域と特異的にハイブリダイズすることができ、第2の標的化アームは、標的核酸の同じ鎖におけるサブターゲット核酸の他方の末端に隣接する第2の領域と特異的にハイブリダイズすることができる。いくつかの実施形態において、第1および第2の標的化アームは、約10〜約100ヌクレオチド長である。いくつかの実施形態において、第1および第2の標的化アームは、約10〜20、20〜30、30〜40または40〜50ヌクレオチド長である。いくつかの実施形態において、第1および第2の標的化アームは、約20ヌクレオチド長である。いくつかの実施形態において、第1および第2の標的化アームは、同じ長さを有する。いくつかの実施形態において、第1および第2の標的化アームは、異なる長さを有する。いくつかの実施形態において、プローブセットにおける第1の標的化アームと第2の標的化アームとの各対は、同じ長さを有する。したがって、一方の標的化アームのほうが長い場合、他方は、対応してより短い。これにより、いくつかの実施形態における精度管理工程が、捕捉されたすべてのプローブ/標的配列産物が多重化された複数の捕捉反応の後に同じ長さを有することを保証することが可能になる。いくつかの実施形態において、介在領域が、第1および第2の標的化アームの一方または両方の長さの任意の差異を吸収する(accommodate)ように変更される場合、プローブセットは、同じ長さを有するように設計され得る。
いくつかの実施形態において、第1および第2の標的化アームのハイブリダイゼーションTmは、同様のものである。いくつかの実施形態において、第1および第2の標的化アームのハイブリダイゼーションTmは、互いの2〜5℃以内である。いくつかの実施形態において、第1および第2の標的化アームのハイブリダイゼーションTmは、同一である。いくつかの実施形態において、第1および第2の標的化アームのハイブリダイゼーションTmは、経験的に決定される最適条件に近いが、必ずしも同一でない。
いくつかの実施形態において、分子反転プローブの第1および第2の標的化アームは、異なるTmを有する。例えば、第1の標的化アーム(分子反転プローブの5’末端におけるもの)のTmは、第2の標的化アーム(分子反転プローブの3’末端におけるもの)のTmよりも高いことがある。本発明の局面によると、理論に拘束するつもりはないが、第1の標的化アームに対するTmが相対的に高いことにより、第1の標的化アームが、第2の標的化アームの3’末端の伸長産物によってハイブリダイゼーション後に置き換えられることを回避するかまたは防ぐのが助けられ得る。本明細書中で使用されるような標的化アームのTmに対する参照は、相補的配列(例えば、標的化アームの配列と相補的である配列を有する標的核酸の領域)を有する核酸に対する標的化アームのハイブリダイゼーションTmに関するものであることが認識されるだろう。また、本明細書中に記載される標的化アームのTmは、任意の適切な方法を用いて計算され得ることも認識されるだろう。例えば、いくつかの実施形態において、ある実験方法(例えば、ゲルシフトアッセイ、ハイブリダイゼーションアッセイ、融解曲線分析法、例えば、インターカレート色素(例えば、二本鎖DNAに結合した色素など)からのシグナルレベルをモニタリングしつつ温度勾配(temperature ramp)を行うことによるSYBR色素を用いるPCR機器における融解曲線分析法)を用いることにより、1つ以上のTmが経験的に測定され得る。いくつかの実施形態において、最適なTmは、形成された産物の数を評価すること(例えば、複数のMIPプローブの各々について)、および最適なTmを、すべての標的化アームに対するTmのヒストグラムにおける中心点として決定することによって、決定され得る。いくつかの実施形態において、予測アルゴリズムを用いることにより、Tmが理論的に決定され得る。いくつかの実施形態において、配列がその標的とハイブリダイズするときのG/CおよびA/T塩基対の数ならびに/またはハイブリダイズ産物の長さに基づいた比較的単純な予測アルゴリズムが用いられ得る(例えば、例えば、64.9+41*([G+C]−16.4)/(A+T+G+C)、例えば、Wallace,R.B.,Shaffer,J.,Murphy,R.F.,Bonner,J.,Hirose,T.,and Itakura,K.(1979)Nucleic Acids Res 6:3543−3557を参照のこと)。いくつかの実施形態において、より複雑なアルゴリズムを用いることにより、塩基のスタッキングのエントロピーおよびエンタルピー、イオン濃度ならびにプライマー濃度の作用が説明され得る(例えば、SantaLucia J(1998),Proc Natl Acad Sci USA,95:1460−5を参照のこと)。いくつかの実施形態において、アルゴリズムは、改変パラメータ(例えば、塩基対のエントロピー/エンタルピー値に対する最近接パラメータ)を使用し得る。本発明の局面は、この点に限定されないので、任意の適当なアルゴリズムを使用してもよいことが認識されるだろう。しかしながら、種々の方法によって、同じ配列に対して異なるTmの計算値または予測値がもたらされ得ることも認識されるだろう。したがって、いくつかの実施形態において、異なるTmについて所定の類似度または差異を有するプローブのセットを設計するとき、Tmの決定または予測における任意の体系的な差異の負の影響を回避するように、プローブセットに対する種々の配列のTmを決定するために同じ経験的な方法および/または理論的な方法が用いられる。
いくつかの実施形態において、第1の標的化アームのTmは、第2の標的化アームのTmよりも約1℃、約2℃、約3℃、約4℃、約5℃高いかまたは約5℃超高いことがある。いくつかの実施形態において、複数のプローブにおける各プローブ(例えば、5〜10個の異なるプローブのセットにおける各プローブ、少なくとも10個の異なるプローブのセットにおける各プローブ、10〜50個の異なるプローブのセットにおける各プローブ、50〜100個の異なるプローブのセットにおける各プローブ、100〜500個の異なるプローブのセットにおける各プローブ、500〜1,000個の異なるプローブのセットにおける各プローブ、1,000〜1,500個の異なるプローブのセットにおける各プローブ、1,500〜2,000個の異なるプローブのセットにおける各プローブ、2,000〜3,000個の異なるプローブのセットにおける各プローブ、3,000〜5,000個の異なるプローブのセットにおける各プローブ、5,000〜10,000個の異なるプローブのセットにおける各プローブまたは少なくとも5,000個の異なるプローブのセットにおける各プローブ)は、独特の第1の標的化アーム(例えば、それらすべてが異なる配列を有する)および独特の第2の標的化アーム(例えば、それらすべてが異なる配列を有する)を有する。いくつかの実施形態において、プローブの少なくとも10%(例えば、プローブの少なくとも25%、25%〜50%、50%〜75%、75%〜90%、90%〜95%もしくは95%超またはすべて)について、第1の標的化アームは、第2の標的化アームの相補的配列に対する第2の標的化アームのTmよりも高い(例えば、約1℃、約2℃、約3℃、約4℃、約5℃高いかまたは約5℃超高い)第1の標的化アームの相補的配列に対するTmを有する。いくつかの実施形態において、第1の標的化アームの各々は、それらのそれぞれの相補的配列に対する同様または同一のTmを有し、第2の標的化アームの各々は、それらのそれぞれの相補的配列に対する同様または同一のTmを有する(そして、第1の標的化アームは、第2の標的化アームよりも高いTmを有する)。例えば、いくつかの実施形態において、第1のアームのTmは、約58℃であり得、第2のアームのTmは、約56℃であり得る。いくつかの実施形態において、第1のアームのTmは、約68℃であり得、第2のアームのTmは、約65℃であり得る。いくつかの実施形態において、異なる標的化アームに対するTmの類似度(例えば、1℃、2℃、3℃、4℃、5℃の範囲内)または同一性は、各アームに対して経験的なデータに基づくべきであるか、または各アームに対して同じ予測アルゴリズム(例えば、Wallace,R.B.,Shaffer,J.,Murphy,R.F.,Bonner,J.,Hirose,T.,and Itakura,K.(1979)Nucleic Acids Res 6:3543−3557,SantaLucia J(1998),Proc Natl Acad Sci USA,95:1460−5または他のアルゴリズム)に基づくべきであることが認識されるだろう。
いくつかの実施形態において、分子反転プローブの第1の標的化アーム(分子反転プローブの5’末端におけるもの)のTmは、標的核酸におけるその相補的配列からの第1の標的化アームの置き換えを防ぐのに十分に安定であるように選択される。いくつかの実施形態において、第1の標的化アームのTmは、50〜55℃、少なくとも55℃、55〜60℃、少なくとも60℃、60〜65℃、少なくとも65℃、少なくとも70℃、少なくとも75℃または少なくとも80℃である。上で考察されたように、特定の標的化アームが経験的または理論的に決定され得ることが認識されるだろう。種々の理論モデルを用いることにより、Tmが決定され得、また、特定の配列に対して予想されるTmは、その予測に使用されるアルゴリズムに応じて異なり得ることが認識されるだろう。いくつかの実施形態において、複数のプローブ中の各プローブ(例えば、5〜10個の異なるプローブのセットにおける各プローブ、少なくとも10個の異なるプローブのセットにおける各プローブ、10〜50個の異なるプローブのセットにおける各プローブ、50〜100個のセット異なるプローブにおける各プローブ、100〜500個の異なるプローブのセットにおける各プローブ、または少なくとも500個の異なるプローブのセットにおける各プローブ)は、異なる第1の標的化アーム(例えば、異なる配列)を有するが、異なる第1の標的化アームの各々は、標的核酸におけるその相補的配列に対する同様または同一のTmを有する。いくつかの実施形態において、異なる標的化アームに対するTmの類似度(例えば、1℃、2℃、3℃、4℃、5℃の範囲内)または同一性は、各アームに対して経験的なデータに基づくべきであるか、または各アームに対して同じ予測アルゴリズム(例えば、Wallace,R.B.,Shaffer,J.,Murphy,R.F.,Bonner,J.,Hirose,T.,and Itakura,K.(1979)Nucleic Acids Res 6:3543−3557,SantaLucia
J(1998),Proc Natl Acad Sci USA,95:1460−5または他のアルゴリズム)に基づくべきであることが認識されるだろう。
J(1998),Proc Natl Acad Sci USA,95:1460−5または他のアルゴリズム)に基づくべきであることが認識されるだろう。
いくつかの実施形態において、サブターゲット核酸は、核酸リピートを含む。いくつかの実施形態において、核酸リピートは、ジヌクレオチドまたはトリヌクレオチドリピートである。いくつかの実施形態において、サブターゲット核酸は、核酸リピートの異常な増加または減少の非存在下において10〜100コピーの核酸リピートを含む。いくつかの実施形態において、サブターゲット核酸は、核酸リピートを含む脆弱X遺伝子座の領域である。いくつかの実施形態において、一方または両方の標的化アームは、核酸リピートの領域のすぐ隣の標的核酸における領域とハイブリダイズする。いくつかの実施形態において、一方または両方の標的化アームは、任意の核酸リピートを含まない領域によって核酸リピートの領域から分離された標的核酸における領域とハイブリダイズする。いくつかの実施形態において、分子反転プローブは、捕捉されるサブターゲット核酸ならびに必要に応じて第1の標的化アームおよび/または第2の標的化アームを配列決定するために使用され得るプライマー結合領域をさらに含む。
いくつかの実施形態において、本発明の局面は、生物学的サンプル中の複数の異なる標的核酸の長さを評価することに関する。いくつかの実施形態において、その複数の標的核酸は、複数の異なる分子反転プローブを用いて分析される。いくつかの実施形態において、異なる分子反転プローブの各々は、3’および5’末端の各々に第1の標的化アームと第2の標的化アームとの異なる対を含む。いくつかの実施形態において、異なる分子反転プローブの各々は、同じプライマー結合配列を含む。
いくつかの実施形態において、本発明の局面は、被験体から得られた生物学的サンプル由来の核酸を分析することに関する。いくつかの実施形態において、その生物学的サンプルは、血液サンプルである。いくつかの実施形態において、その生物学的サンプルは、組織サンプル、特定の細胞集団、腫瘍サンプル、循環腫瘍細胞または環境サンプルである。いくつかの実施形態において、生物学的サンプルは、単一の細胞である。いくつかの実施形態において、核酸は、複数の異なる被験体から得られた生物学的サンプルにおいて分析される。いくつかの実施形態において、生物学的サンプル由来の核酸は、多重反応において分析される。生物学的サンプルは、サンプル中の複数の細胞から得られた複数のコピー数のゲノムを含むことが認識されるだろう。したがって、サンプルは、複数の独立したコピー数の目的の標的核酸領域を含み得、その標的核酸領域の捕捉効率は、本明細書中に記載されるようにそのサイズを評価するために使用され得る。
いくつかの実施形態において、本発明の局面は、捕捉された標的核酸の量(例えば、捕捉されたサブターゲット核酸配列の量)を測定することによって核酸の捕捉効率を評価することに関する。いくつかの実施形態において、捕捉された標的核酸の量は、独立して捕捉された標的核酸分子の数(例えば、サブターゲット領域の配列を有する独立して捕捉された分子の量)を測定することによって測定される。いくつかの実施形態において、捕捉された標的核酸の量は、捕捉された核酸の基準となる量と比較される。いくつかの実施形態において、基準となる量は、基準となる核酸の独立して捕捉された分子の数を測定することによって測定される。いくつかの実施形態において、基準となる核酸は、欠失または挿入を含むと疑われない生物学的サンプル中の異なる遺伝子座の核酸である。いくつかの実施形態において、基準となる核酸は、捕捉反応に加えられる、既知サイズおよび既知量の核酸である。本明細書中に記載されるように、独立して捕捉された核酸配列の数は、核酸サンプルをプローブの調製物(例えば、本明細書中に記載されるようなMIPプローブ)と接触させることによって測定され得る。その調製物は、複数のコピー数の同じプローブを含み得、よって、複数の独立したコピー数の標的領域が、異なるプローブ分子によって捕捉され得ることが認識されるだろう。配列を実際に捕捉するプローブ分子の数は、捕捉された分子の量または数を、任意の適当な手法を用いて測定することによって評価され得る。この数は、サンプル中の標的分子の数と、それらの標的分子の捕捉効率の両方を反映するものであり、それは、本明細書中に記載されるような標的分子のサイズに関する。したがって、捕捉効率は、標的核酸の存在量について照らし合わせることによって、例えば、捕捉された標的分子の数または量を適切なコントロール(例えば、コントロール核酸の既知のサイズおよび量、または生物学的サンプル中に同じ量で存在するはずであり、いずれの挿入もしくは欠失も含まないと予想される、異なる遺伝子座)と比較することによって、評価され得る。他の因子(例えば、領域の配列、GC含有量、二次構造の存在など)も、特定の標的核酸領域の捕捉効率に影響し得ることが認識されるだろう。しかしながら、これらの因子は、適切なコントロール(例えば、同様の特性を有する公知の配列、同じ配列、同じ頻度で生物学的サンプル中に存在すると予想される他のゲノム配列など、またはそれらの任意の組み合わせ)を用いることによっても説明され得る。
いくつかの実施形態において、本発明の局面は、ある遺伝子座に対する捕捉効率が、基準となる捕捉効率と統計学的に有意に異なる場合に、その遺伝子座の1つ以上の対立遺伝子に挿入または欠失を有すると被験体を同定することに関する。
本明細書中に記載される捕捉手法のいずれか(例えば、MIPによる捕捉手法)のために用いられるハイブリダイゼーション条件は、公知のハイブリダイゼーション緩衝液およびハイブリダイゼーション条件に基づき得ることが認識されるだろう。
いくつかの実施形態において、本明細書中に開示される方法は、欠失または挿入の検出が重要である任意の用途にとって有用である。
いくつかの実施形態において、本発明の局面は、核酸配列の分析を、サンプリングされる核酸のタイプで異なる系統誤差を有する2つ以上の異なる核酸調製手法からの結果に基づかせることに関する。本発明によると、体系的であり、かつ単純に核酸の捕捉中または増幅中の確率的影響に起因しない、種々の配列バイアスを種々の手法は有する。したがって、核酸調製における変動を克服するために必要な過剰サンプリングの程度は、そのバイアスを克服するのに十分であること(例えば、2〜5倍、5〜10倍、5〜15倍、15〜20倍、20〜30倍、30〜50倍またはその中間からそれより高い倍数の過剰サンプリング)が必要である。
いくつかの実施形態によると、種々の手法は、種々の特徴的なバイアスまたは系統誤差を有する。例えば、1つの手法は、サンプル分析を目的の遺伝子座における1つの特定の対立遺伝子に偏らせ得るのに対し、別の手法は、サンプル分析を同じ遺伝子座の別の対立遺伝子に偏らせ得る。したがって、同じサンプルが、配列分析にむけて核酸を調製するために使用される手法のタイプに応じて、異なると同定され得る。各手法が、目的の多型配列に対して異なる相対的な感度を有するので、これは、感度の限界を効率的に表す。
本発明の局面によると、核酸分析の感度は、異なる核酸調製工程からの配列を組み合わせ、組み合わされた配列情報を診断アッセイのために(例えば、被験体が目的の遺伝子座においてホモ接合であるかまたはヘテロ接合であるかに関するコールを生成するために)用いることによって、高められ得る。
いくつかの実施形態において、本発明は、生物学的サンプルに対して第1の調製方法を用いて標的核酸の第1の調製物を得て、生物学的サンプルに対して第2の調製方法を用いて標的核酸の第2の調製物を得て、第1の核酸調製物と第2の核酸調製物との両方において得られた配列をアッセイして、そして第1の核酸調製物と第2の核酸調製物との両方からの配列情報を用いることにより、生物学的サンプル中の標的核酸の遺伝子型を決定することによって、核酸検出アッセイの感度を高める方法を提供し、ここで、その第1の調製方法および第2の調製方法は、異なる体系的な配列バイアスを有する。いくつかの実施形態において、第1の核酸調製物および第2の核酸調製物は、配列アッセイを行う前に組み合わされる。いくつかの実施形態において、別個の配列アッセイが、第1の核酸調製物および第2の核酸調製物において行われ、両方のアッセイからの配列情報が、組み合わされることにより、生物学的サンプル中の標的核酸の遺伝子型が決定される。いくつかの実施形態において、第1の調製方法は、増幅ベース、ハイブリダイゼーションベース、または環状プローブベースの調製方法である。いくつかの実施形態において、第2の方法は、増幅ベース、ハイブリダイゼーションベース、または環状プローブベースの調製方法である。いくつかの実施形態において、第1および第2の方法は、異なるタイプの方法である(例えば、それらのうちの一方だけが、増幅ベース、ハイブリダイゼーションベース、または環状プローブベースの調製方法であり、他方の方法は、他の2つのタイプの方法のうちの1つである)。したがって、いくつかの実施形態において、第2の調製方法は、増幅ベース、ハイブリダイゼーションベース、または環状プローブベースの調製方法であるが、但し、第2の方法は、第1の方法と異なる。しかしながら、いくつかの実施形態において、両方の方法が、異なる方法であるならば(例えば、両方ともが、増幅ベースまたはハイブリダイゼーションベースの方法であるが、異なるタイプの増幅方法またはハイブリダイゼーション方法、例えば、異なる相対的なバイアスを有する方法であるならば)、それらの両方の方法は、同じタイプの方法であってもよい。
増幅ベース(例えば、PCRベースまたはLCRベースなど)の調製方法において、ゲノム遺伝子座(標的核酸)は、オリゴヌクレオチドプライマー対を用いて各遺伝子座を選択的に増幅するポリメラーゼ連鎖反応またはリガーゼ連鎖反応(または他の増幅方法)を用いて直接単離される。プライマーは、標的核酸とハイブリダイズするのに十分、および標的核酸の増幅をプライミングするのに十分、標的配列と相補的であることが理解されるべきである。様々な分野において公知の方法のいずれか1つが、プライマーの設計および合成のために利用され得る。プライマーの一方または両方が、標的配列と完全に相補的であり得る。縮重プライマーも使用され得る。プライマーは、標的配列と相補的でないが下流の用途を容易にする追加の核酸(例えば、制限酵素認識部位および識別配列(例えば、ソース配列)を含む)も含み得る。PCRベースの方法には、単一の標的核酸の増幅および多重増幅(複数の標的核酸の並行した増幅)が含まれ得る。
ハイブリダイゼーションベースの調製方法は、さらなる操作のために標的核酸を選択的に固定化する工程を包含し得る。いくつかの実施形態において10〜200ヌクレオチド長であり得る1つ以上のオリゴヌクレオチド(固定化オリゴヌクレオチド)が使用され、そのオリゴヌクレオチドは、遺伝子座の標的領域にわたってハイブリダイズすることにより、その標的領域が固定化されることが理解されるべきである。いくつかの実施形態において、固定化オリゴヌクレオチドは、ハイブリダイゼーションが行われる前に固定化されるか(例えば、Roche/Nimblegen「配列捕捉」)、または例えば、ストレプトアビジンでコーティングされたマイクロビーズに結合することによってハイブリダイゼーションの後に標的核酸を選択的に固定化するために使用され得る部分(例えば、ビオチン)を含むように調製される(例えば、Agilent「SureSelect」)。
環状化選択ベースの調製方法は、目的の各領域を共有結合的に閉じた環状分子に選択的に変換し、次いで、その環状分子は、任意の環状化されていない直鎖状核酸を除去すること(通常、例えばエキソヌクレアーゼを用いた、酵素的な除去)によって単離される。目的の領域に隣接する末端を有するオリゴヌクレオチドプローブが設計される。それらのプローブは、ゲノム標的へのハイブリダイズを可能にし、酵素を用いることにより、第1に(必要に応じて)、プローブ末端間の任意のギャップを埋め、第2に、閉じたプローブをライゲートする。いくつかの実施形態において、環状化の後、任意の残りの(非標的)直鎖状核酸が除去されることにより、標的核酸の単離(捕捉)が生じ得る。環状化選択ベースの調製方法は、分子反転プローブによる捕捉反応および「セレクター」による捕捉反応を含む。しかしながら、本発明の局面は、この点に限定されないので、他の手法を使用してもよい。いくつかの実施形態において、標的核酸の分子反転プローブによる捕捉は、標的核酸における多型の存在を示す。
各調製手法のバイアスプロファイルを評価するためおよび比較するために、様々な方法が使用され得る。次世代シークエンシングを用いることにより、ある特定の調製方法から得られた単離された各標的核酸の存在量が定量的に測定され得る。この存在量は、コントロール存在量の値(例えば、標的核酸の既知の出発存在量)および/または代替の調製方法を使用することによって測定された存在量と比較され得る。例えば、標的核酸のセットは、3つの調製方法のうちの1つ以上によって単離され得る;その標的核酸は、増幅法を用いてx回、ハイブリダイゼーション濃縮(hybridization enrichment)法を用いてy回、および環状化選択法を用いてz回、観察され得る。ペアワイズ相関係数(pairwise correlation coefficient)は、各存在量の値の間(例えば、xとy、xとzおよびyとzとの間)についてコンピュータで計算されることにより、調製方法の対の間の核酸単離におけるバイアスが評価され得る。単離のメカニズムが各アプローチにおいて異なるので、存在量は、通常、互いに異なるものであり、大部分は互いに相関関係がない。
いくつかの実施形態において、本発明は、生物学的サンプル中の標的核酸を代表する核酸調製物を得る方法を提供し、その方法は、生物学的サンプルに対して第1の調製方法を用いて標的核酸の第1調製物を得て、生物学的サンプルに対して第2の調製方法を用いて標的核酸の第2の調製物を得て、そしてその第1の核酸調製物および第2の核酸調製物を混合することにより、その生物学的サンプル中の標的核酸を代表する混合された調製物を得ることによる、方法である。
本明細書中に記載されるいずれかの方法のいくつかの実施形態において、標的核酸の第3の調製物が、第1の調製方法および第2の調製方法とは異なる第3の調製方法を用いて得られ、ここで、第1、第2および第3の調製方法のすべてが、異なる体系的な配列バイアスを有する。本明細書中に記載されるいずれかの方法のいくつかの実施形態において、異なる調製方法が、多重核酸分析の感度を高めるために生物学的サンプル中の複数の異なる遺伝子座に対して用いられる。いくつかの実施形態において、標的核酸は、表1から選択される遺伝子の配列を有する。
しかしながら、本発明の遺伝子タイピング方法は、いくつかの工程を含み得、それらの各々は、独立して、本明細書中に記載される1つ以上の異なる調製手法を含み得ることが認識されるだろう。いくつかの実施形態において、核酸調製物は、本明細書中に記載される1つ以上の(例えば、2、3、4、5つまたはそれ以上の)異なる手法(例えば、増幅、ハイブリダイゼーションによる捕捉、環状プローブによる捕捉など、またはそれらの任意の組み合わせ)を用いて得られ得、その核酸調製物は、最初の調製物に対して用いられた手法とは独立して選択される1つ以上の異なる手法(例えば、増幅、ハイブリダイゼーションによる捕捉、環状プローブによる捕捉など、またはそれらの任意の組み合わせ)を用いて分析され得る。
いくつかの実施形態において、本発明の局面は、核酸アッセイの感度を高めるための組成物、キット、デバイスおよび分析方法も提供する。本発明の局面は、遺伝子タイピング分析の信頼水準を高めるために特に有用である。しかしながら、本発明の局面は、任意の適当な核酸分析(例えば、2つ以上の配列バリアントがサンプル中に存在するか否かを決定するように設計された核酸分析であるがこれに限定されない)において使用され得る。
いくつかの実施形態において、本発明の局面は、複数の核酸プローブ(例えば、10〜50個、50〜100個、100〜250個、250〜500個、500〜1,000個、1,000〜2,000個、2,000〜5,000個、5,000〜7,500個、7,500〜10,000個またはそれより少ないか、それより多いか、もしくは中間の数の異なるプローブ)に関する。いくつかの実施形態において、各プローブ、またはプローブの各サブセット(例えば、10〜25%、25〜50%、50〜75%、75〜90%または90〜99%)は、異なる第1の標的化アームを有する。いくつかの実施形態において、各プローブ、またはプローブのサブセットの各プローブ(例えば、10〜25%、25〜50%、50〜75%、75〜90%または90〜99%)は、異なる第2の標的化アームを有する。いくつかの実施形態において、第1および第2の標的化アームは、同じ介在配列によって分断される。いくつかの実施形態において、第1および第2の標的化アームは、それぞれの標的核酸(例えば、ゲノム遺伝子座)において同じ長さまたは類似の長さ(例えば、核酸の数、例えば、0〜25、25〜50、50〜100、100〜250、250〜500、500〜1,000、1,000〜2,500またはそれより長いかもしくは中間の数のヌクレオチド)によって分断される標的核酸配列と相補的である。いくつかの実施形態において、各プローブ、またはプローブのサブセット(例えば、10〜25%、25〜50%、50〜75%、75〜90%または90〜99%)は、第1のプライマー結合配列を含む。いくつかの実施形態において、そのプライマー結合配列は、同じである(例えば、それは、シークエンシング反応または他の伸長反応をプライミングするために使用され得る)。いくつかの実施形態において、各プローブ、またはプローブのサブセット(例えば、10〜25%、25〜50%、50〜75%、75〜90%または90〜99%)は、独特の識別配列タグ(例えば、予め決められており、各プローブを識別するために使用することができる、識別配列タグ)を含む。
いくつかの実施形態において、本明細書中に開示される方法は、感度が重要な任意の用途にとって有用である。例えば、不均一な組織サンプルにおける癌変異の検出、母体に循環する胎児DNAにおける変異の検出、および着床前遺伝子診断法において単離された細胞における変異の検出。
本発明のいくつかの局面によると、生物学的サンプル中の核酸における多型を検出する方法が提供される。いくつかの実施形態において、その方法は、生物学的サンプルに対してある調製方法(例えば、本明細書中に開示される調製方法のいずれか)を用いて核酸調製物を得る工程、ならびにその核酸調製物に対して分子反転プローブ捕捉反応を行う工程を包含し、ここで、その核酸調製物の標的核酸の分子反転プローブによる捕捉(例えば、変異検出MIPを用いる捕捉)は、標的核酸における変異(多型)の存在を示唆し、ここで、必要に応じてその多型は、表2から選択される。
本発明のいくつかの局面によると、生物学的サンプル中の核酸の遺伝子タイピングを行う方法が提供される。いくつかの実施形態において、その方法は、生物学的サンプルに対してある調製方法を用いて核酸調製物を得る工程、その核酸調製物の標的核酸をシークエンシングする工程、ならびに生物学的サンプルに対して分子反転プローブによる捕捉反応を行う工程(ここで、生物学的サンプル中の標的核酸の分子反転プローブによる捕捉は、標的核酸における多型の存在を示す)、そのシークエンシング反応および捕捉反応の結果に基づいて標的核酸の遺伝子タイピングを行う工程を包含する。
本明細書中に開示される方法のいくつかの実施形態において、標的核酸は、表1から選択される遺伝子の配列を有する。
本明細書中に記載される任意の1つ以上の実施形態は、複数の遺伝マーカーを並行して評価するために使用され得ることが認識されるだろう。したがって、いくつかの実施形態において、本発明の局面は、複数の異なる遺伝子座における1つ以上のマーカー(例えば、1つ以上の対立遺伝子)の存在を並行して決定することに関する。したがって、複数の遺伝性障害のリスクまたは存在が、並行して評価され得る。いくつかの実施形態において、1つ以上の遺伝性障害を有する出生児を有するリスクが評価され得る。いくつかの実施形態において、親または子の生物学的サンプル(例えば、着床前、出生前、出生時または出生後の段階におけるサンプル)に対して評価が行われ得る。いくつかの実施形態において、本開示は、患者サンプル(例えば、血液、着床前胚、絨毛または羊水サンプル)から複数の遺伝子座(例えば、表1または2から選択される複数の標的核酸)を分析するための方法を提供する。患者または被験体は、ヒトであり得る。しかしながら、本発明の局面がこの点に限定されないので、本発明の局面は、ヒトに限定されず、他の種(例えば、哺乳動物、鳥類、爬虫類、他の脊椎動物または無脊椎動物)にも適用され得る。被験体または患者は、男性(雄)または女性(雌)であり得る。いくつかの実施形態において、生殖遺伝カウンセリングに関連して、夫婦の男性メンバーおよび女性メンバー由来のサンプルが分析され得る。いくつかの実施形態において、例えば、動物育種プログラムに関連して、適合する繁殖パートナーもしくは最適な繁殖パートナーを決定するためか、または特定の形質に対するストラテジーを決定するため、あるいは1つ以上の疾患または状態を回避するために、複数の雄および雌の被験体由来のサンプルが分析され得る。したがって、1つ以上の本発明の実施形態から得られた情報に基づいて、生殖リスクが決定され得、そして/または生殖に関するアドバイスが提供され得る。
しかしながら、本発明の局面は、目的の遺伝子座における1つ以上の対立遺伝子の存在が医学的判断(例えば、疾患のリスクまたは検出、疾患の予後、治療の選択、治療のモニタリングなど)と関連がある任意の医学的評価に関連して使用され得ることが認識されるだろう。本発明のさらなる局面は、腫瘍組織もしくは循環腫瘍細胞における、癌を引き起こす細胞経路内もしくは処置レジメンの有効性を予測する細胞経路内の変異の検出、または環境内もしくは被験体、例えば、ヒト被験体から得られたサンプル中の病原生物の検出および同定に関連して使用され得る。
本発明の好ましい実施形態では、例えば以下が提供される:
(項目1)
複数の遺伝子座を分析する方法であって、該方法は:
複数の標的核酸の各々をプローブセットと接触させる工程であって、
ここで、各プローブセットは、複数の異なるプローブを含み、各プローブは、該標的核酸の複数の部分領域のうちの1つの同じ鎖に隣接する核酸と相補的である、5’領域および3’領域に隣接する中央領域を有し、ここで、該標的核酸の部分領域は、異なるものであり、各部分領域は、少なくとも1つの他の部分領域と重複している、工程、
複数の核酸を単離する工程であって、該複数の核酸の各々は、該複数の標的核酸の各々に関して異なる部分領域の核酸配列を有する、工程、ならびに
該単離された核酸を分析する工程
を包含する、方法。
(項目2)
少なくとも1つの部分領域が、少なくとも1つの他の部分領域と完全に重複する、項目1に記載の方法。
(項目3)
各プローブの前記5’領域および前記3’領域の配列が、それぞれ、他の各プローブの5’領域および3’領域の配列と重複していない、項目1に記載の方法。
(項目4)
各プローブの前記5’領域および前記3’領域の配列が、それぞれ、他の各プローブの5’領域および3’領域の配列と異なる、項目1に記載の方法。
(項目5)
複数の遺伝子座を分析する方法であって、該方法は:
複数の標的核酸の各々をプローブセットと接触させる工程であって、
ここで、各プローブセットは、複数の異なるプローブを含み、各プローブは、該標的核酸の複数の部分領域のうちの1つの同じ鎖に隣接する核酸と相補的である、5’領域および3’領域に隣接する中央領域を有し、ここで、該標的核酸の部分領域は、異なるものであり、プローブの該5’領域の一部および該3’領域の一部は、それぞれ、異なるプローブの5’領域および3’領域の配列を有する、工程、
複数の核酸を単離する工程であって、該複数の核酸の各々は、該複数の標的核酸の各々に関して異なる部分領域の核酸配列を有する、工程、ならびに
該単離された核酸を分析する工程
を包含する、方法。
(項目6)
前記標的核酸が、表1から選択される、項目1または5に記載の方法。
(項目7)
前記分析工程が、前記標的核酸の多型の遺伝子タイピングを行う工程を包含する、項目1または5に記載の方法。
(項目8)
前記多型が、表2から選択される、項目7に記載の方法。
(項目9)
被験体の遺伝子タイピングを行う方法であって、該方法は:
独立して単離された少なくとも閾値数の核酸の配列を決定する工程を包含し、ここで、単離された核酸の各々の配列は、標的核酸配列および識別タグ配列を含み、
ここで、該閾値数は、標的核酸配列と識別タグ配列との独特の組み合わせの数であり、ここで、該単離された核酸は、標的核酸配列と識別タグ配列との独特の組み合わせを含む場合、独立して単離されたと同定され、ここで、該標的核酸配列は、被験体のゲノム遺伝子座の配列である、方法。
(項目10)
前記単離された核酸が、分子反転プローブによる捕捉産物である、項目9に記載の方法。
(項目11)
被験体の遺伝子タイピングを行う方法であって、該方法は:
分子反転プローブによる捕捉産物の配列を決定する工程であって、該分子反転プローブによる捕捉産物の各々は、分子反転プローブおよび標的核酸を含み、該分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含み、該標的核酸は、被験体の捕捉されたゲノム遺伝子座である、工程、ならびに
分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との少なくとも閾値数の独特の組み合わせの配列に基づいて、該捕捉されたゲノム遺伝子座について該被験体の遺伝子タイピングを行う工程
を包含する、方法。
(項目12)
被験体の遺伝子タイピングを行う方法であって、該方法は:
分子反転プローブによる捕捉産物を得る工程であって、各捕捉産物は、分子反転プローブおよび標的核酸を含み、ここで、該分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含み、ここで、該標的核酸は、該被験体の捕捉されるゲノム遺伝子座である、工程、
該分子反転プローブによる捕捉産物を増幅する工程、ならびに
各標的核酸について、分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との少なくとも閾値数の独特の組み合わせの配列を決定することによって該被験体の遺伝子タイピングを行う工程を包含する、方法。
(項目13)
前記得る工程は、分子反転プローブを用いて前記被験体のゲノムサンプルから標的核酸を捕捉する工程を包含し、該分子反転プローブの各々は、独特の識別タグ配列を含む、項目12に記載の方法。
(項目14)
前記捕捉工程が、標的と識別タグ配列との同一の組み合わせを用いて2つ以上の分子反転プローブによる捕捉産物を得る尤度が所定の値と等しいかまたはそれ未満である条件下で行われ、必要に応じて該所定の値が約0.05である、項目12または13に記載の方法。
(項目15)
特定の標的核酸配列に対する前記閾値数が、遺伝子型に対する所望の統計学的信頼度に基づいて選択される、項目12〜14のいずれか1項に記載の方法。
(項目16)
標的核酸配列と識別タグ配列との独特の組み合わせの数に基づいて、遺伝子型に対する統計学的信頼度を決定する工程をさらに包含する、項目12〜14のいずれか1項に記載の方法。
(項目17)
複数の遺伝子座を分析する方法であって、該方法は:
分子反転プローブによる複数の捕捉産物を得る工程であって、該複数の捕捉産物の各々は、分子反転プローブおよび標的核酸を含み、ここで、該分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含む、工程、
該分子反転プローブによる複数の捕捉産物を増幅する工程、
増幅された複数のものにおける、分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との組み合わせの出現数を測定する工程、ならびに
標的核酸配列と識別タグ配列との特定の組み合わせの出現数が、所定の値を超える場合、該特定の組み合わせを含む該分子反転プローブの増幅におけるバイアスを検出する工程
を包含する、方法。
(項目18)
前記複数のものにおける標的配列の遺伝子タイピングを行う工程をさらに包含し、ここで、該遺伝子タイピング工程は、バイアスが検出された場合に該バイアスを補正する工程を包含する、項目17に記載の方法。
(項目19)
前記標的核酸配列が、表1から選択される遺伝子の配列である、項目9〜18のいずれかに記載の方法。
(項目20)
標的核酸が異常な長さを有するか否かを決定するための方法であって、該方法は、被験体由来の生物学的サンプル中の標的核酸の捕捉効率を評価する工程を包含し、ここで、基準となる捕捉効率と異なる捕捉効率は、該生物学的サンプル中の異常な長さを有する標的核酸の存在を示す、方法。
(項目21)
欠失または挿入を有すると疑われる標的領域の捕捉効率を測定する工程、ならびに該捕捉効率を、正常な捕捉効率を示す参照と比較する工程を包含する、項目20に記載の方法。
(項目22)
前記捕捉効率が、前記基準となる捕捉効率よりも低い、項目20〜21に記載の方法。
(項目23)
前記被験体が、前記標的領域に挿入を有すると同定される、項目22に記載の方法。
(項目24)
前記捕捉効率が、前記基準となる捕捉効率よりも高い、項目20〜21に記載の方法。
(項目25)
前記被験体が、前記標的領域に欠失を有すると同定される、項目24に記載の方法。
(項目26)
前記被験体が、前記挿入についてヘテロ接合であると同定される、項目23に記載の方法。
(項目27)
前記被験体が、前記欠失についてヘテロ接合であると同定される、項目25に記載の方法。
(項目28)
サブターゲット核酸が、分子反転プローブを用いて前記標的核酸から捕捉される、前述のいずれかの項目に記載の方法。
(項目29)
前記分子反転プローブが、その5’末端に第1の標的化アームを含み、その3’末端に第2の標的化アームを含み、ここで、該第1の標的化アームは、前記サブターゲット核酸の一方の末端に隣接する第1の領域と特異的にハイブリダイズすることができ、該第2の標的化アームは、該標的核酸の同じ鎖における該サブターゲット核酸の他方の末端に隣接する第2の領域と特異的にハイブリダイズすることができる、項目28に記載の方法。
(項目30)
前記第1の標的化アームおよび前記第2の標的化アームが、約10から約100ヌクレオチド長である、項目29に記載の方法。
(項目31)
前記第1の標的化アームおよび前記第2の標的化アームが、約10〜20、20〜30、30〜40または40〜50ヌクレオチド長である、項目30に記載の方法。
(項目32)
前記第1の標的化アームおよび前記第2の標的化アームが、約20ヌクレオチド長である、項目31に記載の方法。
(項目33)
前記第1の標的化アームおよび前記第2の標的化アームが、同じ長さを有する、項目29〜31のいずれか1項に記載の方法。
(項目34)
前記第1の標的化アームおよび前記第2の標的化アームのハイブリダイゼーションTmが、同様のものである、項目29〜33のいずれか1項に記載の方法。
(項目35)
前記第1の標的化アームおよび前記第2の標的化アームのハイブリダイゼーションTmが、互いの2〜5℃以内である、項目34に記載の方法。
(項目36)
前記第1の標的化アームおよび前記第2の標的化アームのハイブリダイゼーションTmが、同一である、項目34に記載の方法。
(項目37)
前記サブターゲット核酸が、核酸リピートを含む、項目28〜36のいずれか1項に記載の方法。
(項目38)
前記核酸リピートが、ジヌクレオチドリピートまたはトリヌクレオチドリピートである、項目37に記載の方法。
(項目39)
前記サブターゲット核酸が、核酸リピートの異常な増加または減少の非存在下において、10〜100コピーの前記核酸リピートを含む、項目37に記載の方法。
(項目40)
前記サブターゲット核酸が、核酸リピートを含む脆弱X遺伝子座の領域である、項目37に記載の方法。
(項目41)
一方または両方の標的化アームが、核酸リピートの領域のすぐ隣である、前記標的核酸における領域とハイブリダイズする、項目29〜36のいずれか1項に記載の方法。
(項目42)
一方または両方の標的化アームが、任意の核酸リピートを含まない領域によって核酸リピートの領域から分離された前記標的核酸における領域とハイブリダイズする、項目29〜36のいずれか1項に記載の方法。
(項目43)
前記分子反転プローブが、捕捉された前記サブターゲット核酸ならびに必要に応じて前記第1の標的化アームおよび/または前記第2の標的化アームを配列決定するために使用され得るプライマー結合領域をさらに含む、項目29〜36のいずれか1項に記載の方法。
(項目44)
生物学的サンプル中の複数の異なる標的核酸が分析される、前述の項目のいずれかに記載の方法。
(項目45)
前記複数の標的核酸が、複数の異なる分子反転プローブを用いて分析される、項目44に記載の方法。
(項目46)
異なる分子反転プローブの各々が、3’および5’末端の各々に第1の標的化アームと第2の標的化アームとの異なる対を含む、項目45に記載の方法。
(項目47)
異なる分子反転プローブの各々が、同じプライマー結合配列を含む、項目46に記載の方法。
(項目48)
前記生物学的サンプルが、血液サンプルである、前述のいずれかの項目に記載の方法。
(項目49)
前記生物学的サンプルが、組織サンプルである、前述のいずれかの項目に記載の方法。
(項目50)
前記捕捉効率が、捕捉された標的核酸の量を測定することによって評価される、前述のいずれかの項目に記載の方法。
(項目51)
捕捉された標的核酸の前記量が、独立して捕捉された標的核酸分子の数を測定することによって測定される、項目50に記載の方法。
(項目52)
捕捉された標的核酸の前記量が、捕捉された核酸の基準となる量と比較される、項目50〜51に記載の方法。
(項目53)
前記基準となる量が、独立して捕捉された基準となる核酸の分子の数を測定することによって測定される、項目52に記載の方法。
(項目54)
前記基準となる核酸が、欠失または挿入を含むとは疑われない生物学的サンプル中の異なる遺伝子座の核酸である、項目53に記載の方法。
(項目55)
前記基準となる核酸が、捕捉反応に加えられる、既知サイズおよび既知量の核酸である、項目53に記載の方法。
(項目56)
前記捕捉効率が、前記基準となる捕捉効率と統計学的に有意に異なる場合、被験体は、前記遺伝子座の1つ以上の対立遺伝子に挿入または欠失を有すると同定される、前述のいずれかの項目に記載の方法。
(項目57)
標的核酸の長さを推定するための方法であって、該方法は:
(i)該標的核酸に対する検出プローブのハイブリダイゼーションを可能にする条件下で複数の該検出プローブと該標的核酸を接触させる工程であって、
ここで、各検出プローブは、該標的核酸の第1の領域にハイブリダイズする第1のアームおよび該標的核酸の第2の領域にハイブリダイズする第2のアームを含むポリヌクレオチドであり、
ここで、該第1の領域および該第2の領域は、該標的核酸の共通の鎖に存在し、
ここで、該第1の領域の5’末端と該第2の領域の3’末端との間のヌクレオチド配列は、サブターゲット核酸のヌクレオチド配列である、工程;ならびに
(ii)複数の該検出プローブとハイブリダイズした複数のサブターゲット核酸を捕捉する工程;ならびに
(iii)該複数のサブターゲット核酸におけるあるサブターゲット核酸の出現頻度を測定する工程であって、ここで、該複数のサブターゲット核酸における該サブターゲット核酸の出現頻度は、該サブターゲット核酸の長さを示す、工程
を包含する、方法。
(項目58)
核酸検出アッセイの感度を高める方法であって、該方法は:
生物学的サンプルに対して第1の調製方法を用いて標的核酸の第1の調製物を得る工程、該生物学的サンプルに対して第2の調製方法を用いて標的核酸の第2の調製物を得る工程、
第1の核酸調製物と第2の核酸調製物との両方において得られた配列をアッセイする工程、
第1の核酸調製物と第2の核酸調製物との両方からの配列情報を用いることにより、該生物学的サンプル中の該標的核酸の遺伝子型を決定する工程
を包含し、ここで、該第1の調製方法および該第2の調製方法は、異なる体系的な配列バイアスを有する、方法。
(項目59)
前記第1の核酸調製物および前記第2の核酸調製物が、配列アッセイを行う前に混合される、項目58に記載の方法。
(項目60)
別個の配列アッセイが、前記第1の核酸調製物および前記第2の核酸調製物において行われ、両方のアッセイからの配列情報が、組み合わされることにより、前記生物学的サンプル中の前記標的核酸の遺伝子型が決定される、項目58に記載の方法。
(項目61)
前記第1の調製方法が、PCRベース、ハイブリダイゼーションベースまたは環状プローブベースの調製方法である、項目58に記載の方法。
(項目62)
前記第2の調製方法は、PCRベース、ハイブリダイゼーションベースまたは環状プローブベースの調製方法であるが、但し、該第2の調製方法は、前記第1の方法と異なる、項目61に記載の方法。
(項目63)
生物学的サンプル中の核酸を代表する核酸調製物を得る方法であって、該方法は、
生物学的サンプルに対して第1の調製方法を用いて第1の標的核酸調製物を得る工程、
該生物学的サンプルに対して第2の調製方法を用いて第2の核酸調製物を得る工程、ならびに
該第1の核酸調製物および該第2の核酸調製物を混合することにより、該生物学的サンプル中の核酸を代表する混合された調製物を得る工程
を包含する、方法。
(項目64)
第1の調製方法および第2の調製方法と異なる第3の調製方法を用いて第3の核酸調製を行う工程をさらに包含し、ここで、該第1の調製方法、該第2の調製方法および該第3の調製方法のすべてが、異なる体系的な配列バイアスを有する、項目1または6に記載の方法。
(項目65)
前記異なる調製方法が、前記生物学的サンプル中の複数の異なる遺伝子座に対して用いられることにより、多重核酸分析の感度が高められる、前述の項目のいずれかの項目に記載の方法。
(項目66)
生物学的サンプル中の核酸の遺伝子タイピングを行う方法であって、該方法は:
生物学的サンプルに対してある調製方法を用いて核酸調製物を得る工程、
該核酸調製物の標的核酸をシークエンシングする工程、ならびに
該生物学的サンプルに対して分子反転プローブによる捕捉反応を行う工程であって、ここで、該生物学的サンプル中の該標的核酸の分子反転プローブによる捕捉は、該標的核酸における多型の存在を示す、工程、
該シークエンシングおよび該捕捉反応の結果に基づいて該標的核酸を遺伝子タイピングする工程
を包含する、方法。
(項目67)
前記標的核酸が、表1から選択される遺伝子の配列を有する、前述の項目のいずれかに記載の方法。
本発明の好ましい実施形態では、例えば以下が提供される:
(項目1)
複数の遺伝子座を分析する方法であって、該方法は:
複数の標的核酸の各々をプローブセットと接触させる工程であって、
ここで、各プローブセットは、複数の異なるプローブを含み、各プローブは、該標的核酸の複数の部分領域のうちの1つの同じ鎖に隣接する核酸と相補的である、5’領域および3’領域に隣接する中央領域を有し、ここで、該標的核酸の部分領域は、異なるものであり、各部分領域は、少なくとも1つの他の部分領域と重複している、工程、
複数の核酸を単離する工程であって、該複数の核酸の各々は、該複数の標的核酸の各々に関して異なる部分領域の核酸配列を有する、工程、ならびに
該単離された核酸を分析する工程
を包含する、方法。
(項目2)
少なくとも1つの部分領域が、少なくとも1つの他の部分領域と完全に重複する、項目1に記載の方法。
(項目3)
各プローブの前記5’領域および前記3’領域の配列が、それぞれ、他の各プローブの5’領域および3’領域の配列と重複していない、項目1に記載の方法。
(項目4)
各プローブの前記5’領域および前記3’領域の配列が、それぞれ、他の各プローブの5’領域および3’領域の配列と異なる、項目1に記載の方法。
(項目5)
複数の遺伝子座を分析する方法であって、該方法は:
複数の標的核酸の各々をプローブセットと接触させる工程であって、
ここで、各プローブセットは、複数の異なるプローブを含み、各プローブは、該標的核酸の複数の部分領域のうちの1つの同じ鎖に隣接する核酸と相補的である、5’領域および3’領域に隣接する中央領域を有し、ここで、該標的核酸の部分領域は、異なるものであり、プローブの該5’領域の一部および該3’領域の一部は、それぞれ、異なるプローブの5’領域および3’領域の配列を有する、工程、
複数の核酸を単離する工程であって、該複数の核酸の各々は、該複数の標的核酸の各々に関して異なる部分領域の核酸配列を有する、工程、ならびに
該単離された核酸を分析する工程
を包含する、方法。
(項目6)
前記標的核酸が、表1から選択される、項目1または5に記載の方法。
(項目7)
前記分析工程が、前記標的核酸の多型の遺伝子タイピングを行う工程を包含する、項目1または5に記載の方法。
(項目8)
前記多型が、表2から選択される、項目7に記載の方法。
(項目9)
被験体の遺伝子タイピングを行う方法であって、該方法は:
独立して単離された少なくとも閾値数の核酸の配列を決定する工程を包含し、ここで、単離された核酸の各々の配列は、標的核酸配列および識別タグ配列を含み、
ここで、該閾値数は、標的核酸配列と識別タグ配列との独特の組み合わせの数であり、ここで、該単離された核酸は、標的核酸配列と識別タグ配列との独特の組み合わせを含む場合、独立して単離されたと同定され、ここで、該標的核酸配列は、被験体のゲノム遺伝子座の配列である、方法。
(項目10)
前記単離された核酸が、分子反転プローブによる捕捉産物である、項目9に記載の方法。
(項目11)
被験体の遺伝子タイピングを行う方法であって、該方法は:
分子反転プローブによる捕捉産物の配列を決定する工程であって、該分子反転プローブによる捕捉産物の各々は、分子反転プローブおよび標的核酸を含み、該分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含み、該標的核酸は、被験体の捕捉されたゲノム遺伝子座である、工程、ならびに
分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との少なくとも閾値数の独特の組み合わせの配列に基づいて、該捕捉されたゲノム遺伝子座について該被験体の遺伝子タイピングを行う工程
を包含する、方法。
(項目12)
被験体の遺伝子タイピングを行う方法であって、該方法は:
分子反転プローブによる捕捉産物を得る工程であって、各捕捉産物は、分子反転プローブおよび標的核酸を含み、ここで、該分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含み、ここで、該標的核酸は、該被験体の捕捉されるゲノム遺伝子座である、工程、
該分子反転プローブによる捕捉産物を増幅する工程、ならびに
各標的核酸について、分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との少なくとも閾値数の独特の組み合わせの配列を決定することによって該被験体の遺伝子タイピングを行う工程を包含する、方法。
(項目13)
前記得る工程は、分子反転プローブを用いて前記被験体のゲノムサンプルから標的核酸を捕捉する工程を包含し、該分子反転プローブの各々は、独特の識別タグ配列を含む、項目12に記載の方法。
(項目14)
前記捕捉工程が、標的と識別タグ配列との同一の組み合わせを用いて2つ以上の分子反転プローブによる捕捉産物を得る尤度が所定の値と等しいかまたはそれ未満である条件下で行われ、必要に応じて該所定の値が約0.05である、項目12または13に記載の方法。
(項目15)
特定の標的核酸配列に対する前記閾値数が、遺伝子型に対する所望の統計学的信頼度に基づいて選択される、項目12〜14のいずれか1項に記載の方法。
(項目16)
標的核酸配列と識別タグ配列との独特の組み合わせの数に基づいて、遺伝子型に対する統計学的信頼度を決定する工程をさらに包含する、項目12〜14のいずれか1項に記載の方法。
(項目17)
複数の遺伝子座を分析する方法であって、該方法は:
分子反転プローブによる複数の捕捉産物を得る工程であって、該複数の捕捉産物の各々は、分子反転プローブおよび標的核酸を含み、ここで、該分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含む、工程、
該分子反転プローブによる複数の捕捉産物を増幅する工程、
増幅された複数のものにおける、分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との組み合わせの出現数を測定する工程、ならびに
標的核酸配列と識別タグ配列との特定の組み合わせの出現数が、所定の値を超える場合、該特定の組み合わせを含む該分子反転プローブの増幅におけるバイアスを検出する工程
を包含する、方法。
(項目18)
前記複数のものにおける標的配列の遺伝子タイピングを行う工程をさらに包含し、ここで、該遺伝子タイピング工程は、バイアスが検出された場合に該バイアスを補正する工程を包含する、項目17に記載の方法。
(項目19)
前記標的核酸配列が、表1から選択される遺伝子の配列である、項目9〜18のいずれかに記載の方法。
(項目20)
標的核酸が異常な長さを有するか否かを決定するための方法であって、該方法は、被験体由来の生物学的サンプル中の標的核酸の捕捉効率を評価する工程を包含し、ここで、基準となる捕捉効率と異なる捕捉効率は、該生物学的サンプル中の異常な長さを有する標的核酸の存在を示す、方法。
(項目21)
欠失または挿入を有すると疑われる標的領域の捕捉効率を測定する工程、ならびに該捕捉効率を、正常な捕捉効率を示す参照と比較する工程を包含する、項目20に記載の方法。
(項目22)
前記捕捉効率が、前記基準となる捕捉効率よりも低い、項目20〜21に記載の方法。
(項目23)
前記被験体が、前記標的領域に挿入を有すると同定される、項目22に記載の方法。
(項目24)
前記捕捉効率が、前記基準となる捕捉効率よりも高い、項目20〜21に記載の方法。
(項目25)
前記被験体が、前記標的領域に欠失を有すると同定される、項目24に記載の方法。
(項目26)
前記被験体が、前記挿入についてヘテロ接合であると同定される、項目23に記載の方法。
(項目27)
前記被験体が、前記欠失についてヘテロ接合であると同定される、項目25に記載の方法。
(項目28)
サブターゲット核酸が、分子反転プローブを用いて前記標的核酸から捕捉される、前述のいずれかの項目に記載の方法。
(項目29)
前記分子反転プローブが、その5’末端に第1の標的化アームを含み、その3’末端に第2の標的化アームを含み、ここで、該第1の標的化アームは、前記サブターゲット核酸の一方の末端に隣接する第1の領域と特異的にハイブリダイズすることができ、該第2の標的化アームは、該標的核酸の同じ鎖における該サブターゲット核酸の他方の末端に隣接する第2の領域と特異的にハイブリダイズすることができる、項目28に記載の方法。
(項目30)
前記第1の標的化アームおよび前記第2の標的化アームが、約10から約100ヌクレオチド長である、項目29に記載の方法。
(項目31)
前記第1の標的化アームおよび前記第2の標的化アームが、約10〜20、20〜30、30〜40または40〜50ヌクレオチド長である、項目30に記載の方法。
(項目32)
前記第1の標的化アームおよび前記第2の標的化アームが、約20ヌクレオチド長である、項目31に記載の方法。
(項目33)
前記第1の標的化アームおよび前記第2の標的化アームが、同じ長さを有する、項目29〜31のいずれか1項に記載の方法。
(項目34)
前記第1の標的化アームおよび前記第2の標的化アームのハイブリダイゼーションTmが、同様のものである、項目29〜33のいずれか1項に記載の方法。
(項目35)
前記第1の標的化アームおよび前記第2の標的化アームのハイブリダイゼーションTmが、互いの2〜5℃以内である、項目34に記載の方法。
(項目36)
前記第1の標的化アームおよび前記第2の標的化アームのハイブリダイゼーションTmが、同一である、項目34に記載の方法。
(項目37)
前記サブターゲット核酸が、核酸リピートを含む、項目28〜36のいずれか1項に記載の方法。
(項目38)
前記核酸リピートが、ジヌクレオチドリピートまたはトリヌクレオチドリピートである、項目37に記載の方法。
(項目39)
前記サブターゲット核酸が、核酸リピートの異常な増加または減少の非存在下において、10〜100コピーの前記核酸リピートを含む、項目37に記載の方法。
(項目40)
前記サブターゲット核酸が、核酸リピートを含む脆弱X遺伝子座の領域である、項目37に記載の方法。
(項目41)
一方または両方の標的化アームが、核酸リピートの領域のすぐ隣である、前記標的核酸における領域とハイブリダイズする、項目29〜36のいずれか1項に記載の方法。
(項目42)
一方または両方の標的化アームが、任意の核酸リピートを含まない領域によって核酸リピートの領域から分離された前記標的核酸における領域とハイブリダイズする、項目29〜36のいずれか1項に記載の方法。
(項目43)
前記分子反転プローブが、捕捉された前記サブターゲット核酸ならびに必要に応じて前記第1の標的化アームおよび/または前記第2の標的化アームを配列決定するために使用され得るプライマー結合領域をさらに含む、項目29〜36のいずれか1項に記載の方法。
(項目44)
生物学的サンプル中の複数の異なる標的核酸が分析される、前述の項目のいずれかに記載の方法。
(項目45)
前記複数の標的核酸が、複数の異なる分子反転プローブを用いて分析される、項目44に記載の方法。
(項目46)
異なる分子反転プローブの各々が、3’および5’末端の各々に第1の標的化アームと第2の標的化アームとの異なる対を含む、項目45に記載の方法。
(項目47)
異なる分子反転プローブの各々が、同じプライマー結合配列を含む、項目46に記載の方法。
(項目48)
前記生物学的サンプルが、血液サンプルである、前述のいずれかの項目に記載の方法。
(項目49)
前記生物学的サンプルが、組織サンプルである、前述のいずれかの項目に記載の方法。
(項目50)
前記捕捉効率が、捕捉された標的核酸の量を測定することによって評価される、前述のいずれかの項目に記載の方法。
(項目51)
捕捉された標的核酸の前記量が、独立して捕捉された標的核酸分子の数を測定することによって測定される、項目50に記載の方法。
(項目52)
捕捉された標的核酸の前記量が、捕捉された核酸の基準となる量と比較される、項目50〜51に記載の方法。
(項目53)
前記基準となる量が、独立して捕捉された基準となる核酸の分子の数を測定することによって測定される、項目52に記載の方法。
(項目54)
前記基準となる核酸が、欠失または挿入を含むとは疑われない生物学的サンプル中の異なる遺伝子座の核酸である、項目53に記載の方法。
(項目55)
前記基準となる核酸が、捕捉反応に加えられる、既知サイズおよび既知量の核酸である、項目53に記載の方法。
(項目56)
前記捕捉効率が、前記基準となる捕捉効率と統計学的に有意に異なる場合、被験体は、前記遺伝子座の1つ以上の対立遺伝子に挿入または欠失を有すると同定される、前述のいずれかの項目に記載の方法。
(項目57)
標的核酸の長さを推定するための方法であって、該方法は:
(i)該標的核酸に対する検出プローブのハイブリダイゼーションを可能にする条件下で複数の該検出プローブと該標的核酸を接触させる工程であって、
ここで、各検出プローブは、該標的核酸の第1の領域にハイブリダイズする第1のアームおよび該標的核酸の第2の領域にハイブリダイズする第2のアームを含むポリヌクレオチドであり、
ここで、該第1の領域および該第2の領域は、該標的核酸の共通の鎖に存在し、
ここで、該第1の領域の5’末端と該第2の領域の3’末端との間のヌクレオチド配列は、サブターゲット核酸のヌクレオチド配列である、工程;ならびに
(ii)複数の該検出プローブとハイブリダイズした複数のサブターゲット核酸を捕捉する工程;ならびに
(iii)該複数のサブターゲット核酸におけるあるサブターゲット核酸の出現頻度を測定する工程であって、ここで、該複数のサブターゲット核酸における該サブターゲット核酸の出現頻度は、該サブターゲット核酸の長さを示す、工程
を包含する、方法。
(項目58)
核酸検出アッセイの感度を高める方法であって、該方法は:
生物学的サンプルに対して第1の調製方法を用いて標的核酸の第1の調製物を得る工程、該生物学的サンプルに対して第2の調製方法を用いて標的核酸の第2の調製物を得る工程、
第1の核酸調製物と第2の核酸調製物との両方において得られた配列をアッセイする工程、
第1の核酸調製物と第2の核酸調製物との両方からの配列情報を用いることにより、該生物学的サンプル中の該標的核酸の遺伝子型を決定する工程
を包含し、ここで、該第1の調製方法および該第2の調製方法は、異なる体系的な配列バイアスを有する、方法。
(項目59)
前記第1の核酸調製物および前記第2の核酸調製物が、配列アッセイを行う前に混合される、項目58に記載の方法。
(項目60)
別個の配列アッセイが、前記第1の核酸調製物および前記第2の核酸調製物において行われ、両方のアッセイからの配列情報が、組み合わされることにより、前記生物学的サンプル中の前記標的核酸の遺伝子型が決定される、項目58に記載の方法。
(項目61)
前記第1の調製方法が、PCRベース、ハイブリダイゼーションベースまたは環状プローブベースの調製方法である、項目58に記載の方法。
(項目62)
前記第2の調製方法は、PCRベース、ハイブリダイゼーションベースまたは環状プローブベースの調製方法であるが、但し、該第2の調製方法は、前記第1の方法と異なる、項目61に記載の方法。
(項目63)
生物学的サンプル中の核酸を代表する核酸調製物を得る方法であって、該方法は、
生物学的サンプルに対して第1の調製方法を用いて第1の標的核酸調製物を得る工程、
該生物学的サンプルに対して第2の調製方法を用いて第2の核酸調製物を得る工程、ならびに
該第1の核酸調製物および該第2の核酸調製物を混合することにより、該生物学的サンプル中の核酸を代表する混合された調製物を得る工程
を包含する、方法。
(項目64)
第1の調製方法および第2の調製方法と異なる第3の調製方法を用いて第3の核酸調製を行う工程をさらに包含し、ここで、該第1の調製方法、該第2の調製方法および該第3の調製方法のすべてが、異なる体系的な配列バイアスを有する、項目1または6に記載の方法。
(項目65)
前記異なる調製方法が、前記生物学的サンプル中の複数の異なる遺伝子座に対して用いられることにより、多重核酸分析の感度が高められる、前述の項目のいずれかの項目に記載の方法。
(項目66)
生物学的サンプル中の核酸の遺伝子タイピングを行う方法であって、該方法は:
生物学的サンプルに対してある調製方法を用いて核酸調製物を得る工程、
該核酸調製物の標的核酸をシークエンシングする工程、ならびに
該生物学的サンプルに対して分子反転プローブによる捕捉反応を行う工程であって、ここで、該生物学的サンプル中の該標的核酸の分子反転プローブによる捕捉は、該標的核酸における多型の存在を示す、工程、
該シークエンシングおよび該捕捉反応の結果に基づいて該標的核酸を遺伝子タイピングする工程
を包含する、方法。
(項目67)
前記標的核酸が、表1から選択される遺伝子の配列を有する、前述の項目のいずれかに記載の方法。
これらおよび他の本発明の局面は、以下の説明ならびに非限定的な実施例および図面においてより詳細に説明される。
詳細な説明
本発明の局面は、遺伝子型を評価するため、特に、被験体の1つ以上の遺伝子座の対立遺伝子の同一性(または二倍体生物の同一性)を決定するための、調製および分析の方法および組成物に関する。本発明の局面は、遺伝分析におけるあいまいさおよびエラーの種々の起源の特定に部分的に基づき、また、遺伝分析の種々の段階におけるこれらのエラーおよびあいまいさを回避するため、減少させるため、認識するため、および/または解決するための1つ以上のアプローチの特定に部分的に基づく。本発明の局面は、核酸評価技術の1つ以上の調製工程および/または分析工程に関連するバイアスおよび/または確率的変動に対処するための方法および組成物に関する。いくつかの実施形態において、調製方法は、遺伝分析の結果を歪めるバイアスのリスクを回避するかまたは減少させるように適合され得る。いくつかの実施形態において、分析方法は、誤解釈を引き起こし得るデータの変動(例えば、不正確なコール(例えば、被験体が実際にはヘテロ接合であるときのホモ接合のコールまたは被験体が実際にはホモ接合であるときのヘテロ接合のコール))を認識するようにおよび補正するように適合され得る。本発明の方法は、任意のタイプの変異、例えば、一塩基の変更(例えば、挿入、欠失、トランスバージョンまたはトランジションなど)、複数の塩基の挿入、欠失、重複、逆位および/もしくは他の任意の変更、またはそれらの組み合わせに対して使用され得る。
本発明の局面は、遺伝子型を評価するため、特に、被験体の1つ以上の遺伝子座の対立遺伝子の同一性(または二倍体生物の同一性)を決定するための、調製および分析の方法および組成物に関する。本発明の局面は、遺伝分析におけるあいまいさおよびエラーの種々の起源の特定に部分的に基づき、また、遺伝分析の種々の段階におけるこれらのエラーおよびあいまいさを回避するため、減少させるため、認識するため、および/または解決するための1つ以上のアプローチの特定に部分的に基づく。本発明の局面は、核酸評価技術の1つ以上の調製工程および/または分析工程に関連するバイアスおよび/または確率的変動に対処するための方法および組成物に関する。いくつかの実施形態において、調製方法は、遺伝分析の結果を歪めるバイアスのリスクを回避するかまたは減少させるように適合され得る。いくつかの実施形態において、分析方法は、誤解釈を引き起こし得るデータの変動(例えば、不正確なコール(例えば、被験体が実際にはヘテロ接合であるときのホモ接合のコールまたは被験体が実際にはホモ接合であるときのヘテロ接合のコール))を認識するようにおよび補正するように適合され得る。本発明の方法は、任意のタイプの変異、例えば、一塩基の変更(例えば、挿入、欠失、トランスバージョンまたはトランジションなど)、複数の塩基の挿入、欠失、重複、逆位および/もしくは他の任意の変更、またはそれらの組み合わせに対して使用され得る。
いくつかの実施形態において、代表的なシークエンシングリードよりもコア配列のリピートの長さが長く、それにより、1つ以上のコア配列単位の欠失または重複が生じているか否かをもっぱら配列リードに基づいて決定することが困難である場合、さらなる手法または代替の手法を用いて、そのコア配列の複数のリピートを特徴とする遺伝子座が扱われ得る。
いくつかの実施形態において、アッセイ結果の高い信頼度は、i)異なるバイアスを有する(例えば、異なるバイアスを有すると知られている)2つ以上の異なる調製手法および/もしくは分析手法を選択すること、ii)2つ以上の異なる手法を用いて患者サンプルを評価すること、iii)2つ以上の異なる手法からの結果を比較すること、ならびに/またはiv)それらの結果がその2つ以上の異なる手法に対して矛盾がないか否かを決定することによって得られ得る。いくつかの実施形態において、工程(iv)における決定が、それらの結果に矛盾がない(例えば、同じである)ことを示唆する場合、そのアッセイ結果の高い信頼度が得られる。他の実施形態において、工程(iv)における決定が、それらの結果に矛盾がある(例えば、それらの結果があいまいである)ことを示唆する場合、工程(i)において選択された2つ以上の異なる調製手法および/または分析手法と比べて異なるバイアスを有する(例えば、異なるバイアスを有すると知られている)1つ以上のさらなる調製手法および/または分析手法を用いることにより患者サンプルが評価され、そしてその1つ以上のさらなる調製手法および/または分析手法の結果を、工程(ii)からの結果と比較することにより、矛盾が解消される。
いくつかの実施形態において、2つ以上の独立したサンプルが、被験体から得られ得、独立して分析され得る。いくつかの実施形態において、2つ以上の独立したサンプルは、ほぼ同時に得られる。いくつかの実施形態において、2つ以上の独立したサンプルは、複数の異なる時点において得られる。いくつかの実施形態において、2つ以上の独立したサンプルを使用することにより、確率的な測定ノイズの排除、正規化および/または定量化が促進される。2つ以上の独立したサンプルが、本明細書中に開示される方法のいずれか(例えば、ヒトまたは他の動物被験体における病原体のプロファイリング、腫瘍の進行/後退のモニタリング、循環腫瘍細胞の分析、母体循環系中の胎児細胞の分析、および環境内の病原体の分析/モニタリング/プロファイリングのための方法を含む)に関して得られ得ることが認識されるべきである。
いくつかの実施形態において、本明細書中に記載される手法の1つ以上が、複数の患者サンプルを並行して評価するために単一のアッセイプロトコルにおいて組み合わされ得る。
本発明の局面は、複数の患者サンプルの、費用効果は高いが信頼できるハイスループットの遺伝子タイピング(例えば、並行して行われるもの、例えば、多重反応におけるもの)にとって有用であることが認識されるだろう。いくつかの実施形態において、本発明の局面は、多重分析におけるエラーの頻度を低下させるために有用である。ある特定の実施形態は、複数の反応(例えば、複数の遺伝子座および/または複数の患者サンプル)が処理されている場合に、特に有用であり得る。例えば、10〜25、25〜50、50〜75、75〜100個またはそれ以上の遺伝子座が、並行して処理され得る任意の数の被験体サンプル(例えば、1〜25、25〜50、50〜100、100〜500、500〜1,000、1,000〜2,500、2,500〜5,000個またはそれ以上もしくは中間の数の患者サンプル)から、各被験体に対して評価され得る。本発明の種々の実施形態は、2つ以上の標的捕捉反応および/または2つ以上の患者サンプル分析を単一の多重反応において並行して行うことを含み得ることが認識されるだろう。例えば、いくつかの実施形態において、複数の捕捉反応(例えば、異なる標的遺伝子座に対して異なる捕捉プローブを用いる反応)が、単一の患者サンプルに対する単一の多重反応において行われ得る。いくつかの実施形態において、複数の患者サンプルのうちの各1つから捕捉された複数の核酸が、単一の多重分析反応において組み合わされ得る。いくつかの実施形態において、異なる被験体からのサンプルは、被験体特異的(例えば、患者特異的)タグ(例えば、独特の配列タグ)でタグ化され、各産物からの情報は、同定された被験体に対して割り当てられ得る。いくつかの実施形態において、各患者サンプルに対して用いられる異なる捕捉プローブの各々は、共通の患者特異的タグを有する。いくつかの実施形態において、捕捉プローブは、患者特異的タグを有しないが、各被験体からの捕捉された産物は、患者特異的タグで標識された1つの増幅プライマーまたは増幅プライマーの対を用いて増幅され得る。本発明の局面は、この点に限定されないので、単一の患者サンプルからの捕捉された産物と患者特異的タグを関連づけるための他の手法を使用してもよい。本明細書中で使用される患者特異的タグは、特定のアッセイにおいて、同定された患者に割り当てられる独特のタグのことを指し得ることが認識されるだろう。同じタグが、異なる患者サンプルセット(例えば、異なる患者からのサンプル)(その各々は、それらのタグのうちの1つに割り当てられる)を用いた別個の多重分析において使用され得る。いくつかの実施形態において、1つのアッセイから次のアッセイへの汚染のリスクを低下させるため、および特定のアッセイに存在すると予想されないタグの存在に基づいて汚染の検出を可能にするために、独特のタグの種々のセットが、連続的な(例えば、交互の)多重反応において使用され得る。
本発明の実施形態は、いくつかの異なる状況:生殖の状況、疾患スクリーニング、癌を有する被験体の同定、ある疾患に対して高リスクを有する被験体の同定、いくつかの因子の1つ以上に従う被験体の集団の層別化、例えば、特定の薬物に対する応答性、特定の薬物に対する有害反応(または、ゆえにリスク)を欠くかもしくは欠かないこと、および/または医学的記録のための情報の提供(例えば、1つ以上の遺伝子座におけるホモ接合性、ヘテロ接合性)のいずれかに対して使用され得る。本発明は、患者サンプルのゲノム分析に限定されないことが認識されるだろう。例えば、本発明の局面は、病原体を検出するための環境サンプルのハイスループット遺伝分析にとって有用であり得る。
いくつかの実施形態において、本明細書中に開示される方法は、1つ以上の遺伝性障害の診断にとって有用である。いくつかの実施形態において、本明細書中に開示される方法を用いて診断され得る遺伝性障害は、Ashkenazi Jewish集団に蔓延している遺伝性障害である。いくつかの実施形態において、それらの遺伝性障害は:21−ヒドロキシラーゼ欠損の(Defiocient)先天性副腎過形成;ABCC8関連の高インスリン症;アルファ−サラセミア(Constant SpringおよびMR関連を含む);アリールスルファターゼA欠損の異染性白質ジストロフィ(Metyachromatic Leukodystrophy);ビオチニダーゼ欠損症−ホロカルボキシラーゼ合成酵素欠損症;ブルーム症候群;カナバン病;CFTR関連障害−嚢胞性線維症;シトルリン血症I型;複合MMA&ホモシスチン尿症−dblC;ジストロフィン異常症(DMD&BMD);家族性自律神経障害;ファンコニー貧血−FANCC;古典的ガラクトース血症:ガラクトキナーゼ欠損症(Defiency)およびガラクトースエピメラーゼ欠損症;ゴーシェ病;GJB2関連DFNB1非症候性難聴および聴覚消失;グルタル酸血症1型;異常ヘモグロビン症ベータ鎖障害;糖原病IA型;メープルシロップ尿症;IA、IB、2、3型;中鎖アシル−コエンザイムA;デヒドロゲナーゼ欠損−MCADD;メチルマロン酸血症;ムコリピドーシスIV;ネマリンミオパシー;ニーマン・ピック(Nieman−Pick)A型−酸性スフィンゴミエリナーゼ欠損症;非ケトーシス型高グリシン血症−グリシン脳症;オルニチントランスカルバミラーゼ欠損症;PKUフェニルアラニンヒドロキシラーゼ欠損症;プロピオン酸血症;短鎖アシル−CoAデヒドロゲナーゼ欠損症−SCADD;スミス・レムリ・オピッツ症候群;脊髄性筋萎縮症(SMN1)−SMA;テイ・サックス−HexA欠損症;アッシャー症候群(Usher Synbdrome)I型(IB型、IC型、ID型、IF型、IG型);X連鎖精神遅滞ARX関連障害;小脳形成不全(Cerebellar Cypoplasia)および特有の(sistinctive)顔貌を伴うX連鎖精神遅滞;X連鎖精神遅滞;9、21、30、46、58、63、88、89を含む;X連鎖精神遅滞:FM1関連障害−FRXA、脆弱X MR;X連鎖SMR:レンペニング症候群1;Zellweger Spectrum障害−Zellweger、NALDおよび/または乳児レフサム病を含むペルオキシソームの二機能性酵素欠損症から選択される。しかしながら、これらのすべて、これらのサブセット、他の遺伝子またはそれらの組み合わせが、使用され得る。
いくつかの局面によると、本開示は、多重診断方法に関する。いくつかの実施形態において、多重診断方法は、複数の遺伝子座(例えば、表1の遺伝子座)を並行して捕捉する工程を包含する。いくつかの実施形態において、遺伝子座は、1つ以上の多型(例えば、表2の多型)を有し、それらの遺伝子型は、疾患を引き起こす対立遺伝子に対応する。したがって、いくつかの実施形態において、本開示は、複数の遺伝性障害を並行して評価するための方法を提供する。
いくつかの実施形態において、着床前、出生前、出生時または出生後の段階において複数の遺伝性障害を並行して診断するための方法が提供される。いくつかの実施形態において、本開示は、患者サンプル(例えば、血液、着床前胚、絨毛または羊水サンプル)から複数の遺伝子座(例えば、表1から選択される複数の標的核酸)を分析するための方法を提供する。患者または被験体は、ヒトであり得る。しかしながら、本発明の局面は、この点に限定されないので、本発明の局面は、ヒトに限定されず、他の種(例えば、哺乳動物、鳥類、爬虫類、他の脊椎動物または無脊椎動物)にも適用され得る。被験体または患者は、男性(雄)または女性(雌)であり得る。いくつかの実施形態において、生殖遺伝カウンセリングに関連して、夫婦の男性メンバーおよび女性メンバー由来のサンプルが分析され得る。いくつかの実施形態において、例えば、動物育種プログラムに関連して、適合する繁殖パートナーもしくは最適な繁殖パートナーを決定するためか、または特定の形質に対するストラテジーを決定するため、あるいは1つ以上の疾患または状態を回避するために、複数の雄および雌の被験体由来のサンプルが分析され得る。
しかしながら、他の任意の疾患、および/または疾患もしくは障害(アレルギー、処置に対する応答性、処置および予後に対する癌腫瘍のプロファイリング、患者の感染のモニタリングおよび同定、ならびに環境内の病原体のモニタリングが挙げられるがこれらに限定されない)に対する危険因子も研究され得ることが認識されるだろう。
1.多重増幅反応における提示のバイアスの減少:
いくつかの実施形態において、本発明の局面は、例えば診断目的での、遺伝子座の多重検出において、バイアスを減少させる方法および再現性を高める方法に関する。
いくつかの実施形態において、本発明の局面は、例えば診断目的での、遺伝子座の多重検出において、バイアスを減少させる方法および再現性を高める方法に関する。
潜在的に複雑な混合物中の特定の核酸配列を検出するためまたは増幅するために、分子反転プローブ技術が使用される。分子反転プローブの使用は、単一ヌクレオチド多型の検出(Hardenbolら、2005 Genome Res 15:269−75)およびエキソンの大きなセットの調製増幅(Porrecaら、2007 Nat Methods 4:931−6,Krishnakumarら、2008 Proc Natl Acad Sci USA 105:9296−301)について証明されている。一般に数千の標的が、数千のプローブを含む単一反応において捕捉され得るので、上記方法の主要な利点の1つは、高い多重化の程度に対して能力がある点である。しかしながら、例えば、増幅効率に関連する課題(例えば、Turner EHら、Nat Methods.2009 Apr 6:1−2を参照のこと)のせいで、研究および診断における上記方法の実際の有用性は限定されている。
本開示の局面は、多重的なゲノム捕捉方法およびシークエンシング方法における系統誤差(バイアス)、すなわち、標的核酸の提示の大きなばらつき、および捕捉された標的核酸(例えば、生物学的サンプルから単離された標的核酸)のプール内のヘテロ接合性対立遺伝子の不均等なサンプリングに関連する課題を克服するための有効な方法の発見に部分的に基づく。したがって、いくつかの実施形態において、本開示は、多重捕捉方法における標的核酸の検出におけるばらつきを減少させる方法を提供する。他の実施形態において、方法は、捕捉プールにおける対立遺伝子の提示を改善し、ゆえに、相違する検出結果を改善する。ある特定の実施形態において、本開示は、標的核酸(例えば、遺伝子座)を捕捉するための調製方法を提供し、その方法は、標的核酸の重複した領域を捕捉する複数のプローブ(例えば、分子反転プローブMIP)の種々のセットの使用を含み、従来技術の方法と比べて、捕捉プール内の標的核酸のより均一な提示を達成する。他の実施形態において、方法は、例えば、診断目的での、遺伝子座の大規模な並行捕捉に関連するバイアスまたはバイアスのリスクを低下させる。他の実施形態において、複数の遺伝子座の並行した検出の再現性を高めるための(例えば、標的核酸の捕捉に対する多型の影響を減少させることによって)方法が提供される。さらなる実施形態において、複数の遺伝子座の並行した分析に対する、プローブの合成および/またはプローブの増幅のばらつきの影響を減少させるための方法が提供される。
いくつかの局面において、本開示は、複数の異なるプローブを含むプローブセットを提供する。本明細書中で使用されるとき、「プローブ」は、標的核酸またはその部分領域の同じ鎖に隣接する核酸と相補的である5’領域および3’領域に隣接した中央領域を有する核酸である。例示的なプローブは、分子反転プローブ(MIP)である。「標的核酸」は、遺伝子座であり得る。例示的な遺伝子座は、本明細書中の表1(RefSeq遺伝子の欄)に開示されている。
プローブは、代表的には、捕捉効率/増幅効率に部分的に影響すると知られているある特定の制約(例えば、融解温度、G/C含有量など)を満たすように設計されているが(Ballら(2009)Nat Biotech 27:361−8およびDengら(2009)Nat Biotech 27:353−60)、広く均一であるかまたは高度に再現性のある捕捉効率/増幅効率を確実にするのに十分な制約のセットは、以前に得られていない。本明細書中に開示されるように、均一性および再現性は、標的内の各塩基が2つ以上のプローブによって捕捉されるように標的1つあたり複数のプローブを設計することによって高められ得る。いくつかの実施形態において、本開示は、捕捉される標的1つあたり複数のMIPを提供し、ここで、所与の標的核酸に対して設計されるセット内の各MIPは、中央領域、ならびに標的核酸内の(少なくとも部分的に)異なる核酸にハイブリダイズする5’領域および3’領域(「標的化アーム」)(標的核酸の部分領域とすぐ隣接する)を有する。よって、種々の標的化アームと充填(fill−in)配列との間の効率の差は、単一の標的に対して複数のMIPにわたって平均され得、より均一かつ再現性のある捕捉効率がもたらされる。
いくつかの実施形態において、上記方法は、各標的に対して単一のプローブを設計する工程を包含する(標的は、一塩基ほど小さいか、またはキロベースもしくはそれより大きい連続した配列ほど大きいことがある)。
場合によっては、1〜200bpの範囲内の長さを有する分子(例えば、標的核酸またはその部分領域)を捕捉するプローブを設計することが好ましいことがある(本明細書中で使用されるとき、bpとは、二本鎖核酸における塩基対のことを指すが、しかしながら、長さがbpで示される場合、塩基対とは対照的に、同じ数の塩基長を有する一本鎖核酸も本発明によって企図されることが認識されるだろう)。しかしながら、プローブの設計は、そのように限定されない。例えば、プローブは、場合によっては、最大10、20、30、40、50、60、70、80、90、100、200、300、400、500、1000bpまたはそれ以上のbpの範囲の長さを有する標的を捕捉するように設計され得る。
捕捉分子(例えば、標的核酸またはその部分領域)の長さは、複数の考慮すべき事柄に基づいて選択されることが認識されるべきである。例えば、標的の分析が、シークエンシング、例えば、次世代の配列決定装置を用いたシークエンシングを含む場合、その標的の長さは、ショットガンライブラリーの構築が必要ないように、代表的にはシークエンシングのリード長とマッチするべきである。しかしながら、本発明の局面は、この点に限定されないので、捕捉された核酸は、任意の適当なシークエンシング手法を用いて配列決定され得ることが認識されるだろう。
いくつかの標的核酸は、1つのプローブで捕捉されるには大きすぎることも認識されるべきである。その結果として、標的全体を分析するために、標的核酸の複数の部分領域を捕捉することが必要な場合がある。
いくつかの実施形態において、標的核酸の部分領域は、少なくとも1bpである。他の実施形態において、標的核酸の部分領域は、少なくとも10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000bpまたはそれ以上である。他の実施形態において、標的核酸の部分領域は、標的核酸長の最大10%、20%、30%、40%、50%、60%、70%、80%、90%、95%またはそれ以上のパーセントである長さを有する。
当業者はまた、MIPの設計において、プローブの長さと標的の長さとの関係性が考慮されることも認識するだろう。いくつかの実施形態において、MIPは、対応する標的(例えば、標的核酸の部分領域、標的核酸)よりも数百塩基対(例えば、最大100、200、300、400、500、600、700、800、900、1000bpまたはそれ以上)長いように設計される。
いくつかの実施形態において、標的核酸の部分領域の長さは、異なってよい。例えば、標的核酸が、プローブハイブリダイゼーションが不可能であるかまたは非効率的である領域を含む場合、問題のある核酸とのハイブリダイゼーションを回避するため、および完全な標的核酸を含む核酸を捕捉するために、1つ以上の異なる長さの部分領域を捕捉するプローブを使用することが必要であり得る。
本発明の局面は、各標的核酸を増幅するために、複数のプローブ、例えば、MIPを使用することを含む。いくつかの実施形態において、所与の標的に対するプローブのセットが、標的全体にわたって「タイル張り」するように設計され得、一連のより短いサブターゲットとして標的が捕捉される。いくつかの実施形態において、所与の標的に対するプローブのセットが、その標的全体にわたって「タイル張り」するように設計される場合、そのセット内のいくつかのプローブは、隣接する非標的配列を捕捉する。あるいは、そのセットは、標的に隣接するハイブリダイゼーション領域の正確な位置を「ずらす」ように設計され得、種々の標的化アームを有する複数のプローブによって標的全体が捕捉され(および場合によっては、隣接する非標的配列が捕捉され)、タイリングの必要性がなくなる。選択される特定のアプローチは、標的セットの性質に左右され得る。例えば、小さい領域が捕捉される場合、末端がずらされたアプローチが、適切であり得る一方、より長い領域が望まれる場合は、タイリングが選択され得る。すべての場合において、病理学的遺伝子座を標的にするプローブに対するバイアス許容度の量は、所与の分子を捕捉するために使用される種々のMIPの数を変更することによって調節(「調整」)され得る。
いくつかの実施形態において、「カバー率(coverage factor)」すなわち、1つの分子において1つの塩基対を捕捉するために使用されるプローブの数は、条件を指定するための重要なパラメータである。タイリングアプローチ(例えば、図1を参照のこと)を用いるかまたはずらしアプローチ(staggered approach)の1つ(例えば、図2または3を参照のこと)を用いるかに応じて、標的1つあたりのプローブの種々の数が示される。
図1は、単一の標的にわたってタイリングされている10個の捕捉されたサブターゲットを示しているタイリングプローブのレイアウトの非限定的な実施形態を図示している。標的内の各位置は、3つのサブターゲットによってカバーされており、1塩基対あたりのMIPの性能は、3つのプローブに対して平均される。
図2は、3つのMIPのセットによって捕捉されている標的を示している、ずらされたプローブのレイアウトの非限定的な実施形態を図示している。各MIPは、黒色で示されている標的全体に加えて、(場合によっては)灰色で示されている追加的な標的外の配列を捕捉し、各MIPの標的化アームは、異なる配列に当たっている。標的内の各位置は、3つのサブターゲットによってカバーされており、1塩基対あたりのMIPの性能は、3つのプローブに対して平均される。標的化アームは、示される黒色または灰色の領域のすぐ隣を捕らえる。いくつかの実施形態において、標的化アーム(図示せず)は、互いと重複しないように設計され得ることが認識されるだろう。
図3は、3つのMIPのセットによって捕捉されている標的を示している、交互にずらされたプローブのレイアウトの非限定的な実施形態を図示している。各MIPは、黒色で示されている標的全体に加えて、(場合によっては)灰色で示されている追加的な標的外の配列を捕捉し、各MIPの標的化アームは、異なる配列に当たっている。標的内の各位置は、3つのサブターゲットによってカバーされており、1塩基対あたりのMIPの性能は、3つのプローブに対して平均される。標的化アームは、示される黒色または灰色の領域のすぐ隣を捕らえる。
任意のレイアウトに対して、隣接するタイリングプローブまたはずらしプローブにおける標的化アームは、重複するように、重複しないように、またはプローブのサブセットだけに対して重複するように、設計され得ることが認識されるだろう。
任意のレイアウトに対するある特定の実施形態において、約3〜約10というカバー率が使用される。しかしながら、これらの方法はそのように限定されず、最大2、3、4、5、6、7、8、9、10、20またはそれ以上のカバー率が使用され得る。選択されるカバー率は、使用されるプローブのレイアウトに依存し得ることが認識されるべきである。例えば、タイリングアプローチでは、所望のカバー率のために、標的1つあたりのプローブの数は、代表的には、標的の長さ、サブターゲットの長さおよび隣接するサブターゲットの開始位置との間隔(刻み幅)の関数である。例えば、3という所望のカバー率の場合、20bpという開始部位の隔たりおよび60bpというサブターゲットの長さによって、200bpの標的が12個のMIPでカバーされ得る(図1)。よって、標的核酸1つあたりのプローブの数および捕捉される分子の長さを変更することによって、特定のカバー率が達成され得る。ずらしアプローチでは、一定の長さの標的核酸が、いくつかの部分領域または「超標的(super−target)」として捕捉される(それらは、標的核酸および追加の隣接する核酸を含む分子であり、それらは、様々な長さであり得る)。例えば、50bpの標的は、「ずらされた」配置(図2)または「交互にずらされた」配置(図3)において3つのプローブを用いて3というカバー率で捕捉され得る。
カバー率は、検出バイアスが容認できる程度に動かされ得る。一部の例では、バイアス許容度が小さい場合、おそらくはより高いカバー率を用いて、標的核酸のより多くの部分領域を標的にすることが望ましいことがある。いくつかの実施形態において、カバー率は、最大2、3、4、5、6、7、8、9、10またはそれ以上である。
いくつかの実施形態において、タイリングプローブのレイアウトが用いられ、標的の長さが1bpより長く、かつ刻み幅(標的の5’末端と、隣接する標的の5’末端との間の距離)が標的またはその部分領域の長さより短いとき、プローブ数=T/(S/C)+(C−1)であるような標的の長さ(T)、サブターゲットの長さ(S)およびカバー率(C)に基づいて特定の標的に対するプローブの数をコンピュータで計算することが可能である。
いくつかの局面において、本開示は、複数の分子が並行して増幅されるときの増幅効率の均一性を高める方法;増幅効率の再現性を高める方法;増幅効率に対する、標的とするプローブのばらつきの関与を低減させる方法;所与の標的核酸に対する、プローブハイブリダイゼーション領域内の多型の影響を減少させる方法;および/またはMIPによる多重増幅が核酸シークエンシングによる分析用の調製工程として使用されるときに下流のワークフローを単純化する方法を提供する。
標的に隣接する領域下の標的核酸内の多型は、ハイブリダイゼーション、ポリメラーゼによる充填および/またはライゲーションを干渉し得る。さらに、これは、ただ1つの対立遺伝子に対して生じ得、対立遺伝子の脱落をもたらし、最終的には下流のシークエンシングの正確度を低下させる。いくつかの実施形態において、任意の所与の標的を捕捉するための複数のハイブリダイゼーション部位を有するMIPのセットを用いるとき、MIPのセット内のすべての標的化アームが変異の位置をカバーするわけではないので、多型が原因の損失の確率は、実質的に低下する。
多数の配列が必要とされるので、MIP捕捉反応用のプローブは、プログラム可能なマイクロアレイにおいて合成され得る。これらの方法の合成収量は少ないので、MIP増幅反応用の十分なプローブを生成するために、その後、増幅工程が必要である。多重オリゴヌクレオチド合成とプールされたものの増幅との組み合わせにより、一様でない合成エラー率および提示のバイアスがもたらされる。所与の標的に対するすべてのプローブが同じエラー率およびバイアスを有するわけではないので、各標的に対して複数のプローブを合成することによって、これらの起源による変動が平均され得る。
本明細書中に開示される多重増幅ストラテジーは、SNPの検出におけるように分析的に用いられ得るか、またはしばしば、次世代シークエンシングもしくは他のシークエンシング手法に対して調製的に用いられ得る。調製的な状況において、増幅反応のアウトプットは、通常、ショットガンライブラリープロトコルへのインプットであり、それはその後、シークエンシングプラットフォームへのインプットになる。次世代シークエンシングは、エキソンなどのアンプリコンよりも著しく短いリードをもたらすので、ショットガンライブラリーが部分的に必要である。本明細書中に記載されるマルチタイリング(multi−tiled)アプローチによってもたらされるバイアスの減少に加えて、タイリングは、ショットガンライブラリーの調製に対する必要性もなくす。プローブ、例えば、MIPを設計するとき、捕捉分子の長さを指定することができるので、その捕捉分子は、配列決定装置のリード長にマッチするように選択することができる。このように、リードは、エキソンに対するプローブセット内の各捕捉分子の開始位置のおかげでそのエキソンに沿って「歩く」ことができる。
2.核酸調製におけるバイアスに関連する分析のエラーの減少:
いくつかの実施形態において、本発明の局面は、バイアスを減少させ、かつ下流の定量的用途の信頼度および正確度を高める、DNAシークエンシング関連技術における調製工程に関する。
いくつかの実施形態において、本発明の局面は、バイアスを減少させ、かつ下流の定量的用途の信頼度および正確度を高める、DNAシークエンシング関連技術における調製工程に関する。
現在、次世代(ポロニー(polony)ベースの)シークエンシング(とりわけ、ゲノムリシークエンシング、遺伝子発現についてのRNA−seq、メチル化についての亜硫酸水素塩シークエンシングおよびImmune−seqを含む)を利用してデータを生成する多くのゲノミクスアッセイが存在する。定量的測定(遺伝子型コールを含む)を行うために、これらの方法は、核酸の元のサンプルにおける配列の提示に対する代理として、所与のゲノム遺伝子座のシークエンシングリードの数を利用する。これらの手法の大部分は、目的のサンプルを代表するDNA分子の高複雑度ライブラリーを構築する調製工程を必要とする。これには、DNAの化学的または生化学的な処理(例えば、亜硫酸水素塩処理)、ゲノムの特定のサブセットの捕捉(例えば、パドロックプローブによる捕捉、溶液ハイブリダイゼーション)および様々な増幅法(例えば、ポリメラーゼ連鎖反応、全ゲノム増幅、ローリングサークル増幅)が含まれ得る。
系統誤差および偶然誤差は、ゲノム増幅法およびシークエンシングライブラリー構築法に関連する共通の問題である。例えば、ゲノムシークエンシングライブラリーは、ライブラリー構築プロセスのエラー(バイアス)の結果として、起源ゲノム由来の特定の配列の提示過剰または提示不足を含み得る。そのようなバイアスが、シークエンシングライブラリー内に存在しないゲノム由来の標的配列またはシークエンシングライブラリー内の検出不可能なゲノム由来の標的配列に生じるとき、特に問題であり得る。例えば、シークエンシングライブラリー内のゲノム由来の特定の対立遺伝子の配列(例えば、ヘテロ接合の対立遺伝子)の提示不足は、シークエンシングライブラリーにおいて明らかなホモ接合の提示をもたらし得る。最も下流のシークエンシングライブラリーの定量化手法は、確率論的なカウントプロセスに左右されるので、これらの問題は、代表的には、統計学的に有意な判断を行うために必要な最小数の観察結果を得るのに十分なサンプリング(過剰サンプリング)によって対処されている。しかしながら、過剰サンプリングというストラテジーは、通常、低カウントポアソンノイズ(low−count Poisson noise)の排除に限定され、そのアプローチは、リソースをむだにし、そのような実験を行うために必要とされる費用を高める。さらに、過剰サンプリングは、そのデータに基づくある特定の結論(例えば、診断コール)における統計学的信頼度の低下をもたらし得る。したがって、シークエンシングライブラリー調製方法におけるバイアスを克服するための新しいアプローチが必要とされている。
本開示の局面は、ゲノムの捕捉、増幅およびシークエンシングの方法における系統誤差および偶然誤差(バイアス)に関連する問題、すなわち、核酸の捕捉および増幅における大きなばらつきならびにシークエンシングライブラリーにおけるヘテロ接合対立遺伝子の不均衡な提示に関連する問題を克服するための方法の発見に部分的に基づく。したがって、いくつかの実施形態において、本開示は、核酸の捕捉および増幅におけるばらつきを減少させる方法を提供する。他の実施形態において、その方法は、シークエンシングライブラリーにおける対立遺伝子の提示を改善し、ゆえに、相違する検出結果を改善する。ある特定の実施形態において、本開示は、個別の核酸分子を独特にタグ化する識別タグ配列の使用を含む、標的核酸(例えば、遺伝子座)を捕捉するための調製方法を提供する。いくつかの実施形態において、その識別タグ配列のおかげで、識別タグ配列と標的配列との対がシークエンシング反応において観察される頻度に基づいたバイアスの検出が可能になる。他の実施形態において、その方法は、例えば診断目的での、遺伝子座の捕捉、増幅およびシークエンシングに関連する、バイアスによって引き起こされるエラー、またはバイアスのリスクを減少させる。
本発明の局面は、独立して捕捉されたおよび/または分析された(例えば、増幅の前、またはバイアスを導入し得る他のプロセスの前に)個別の標的分子と、独特の配列タグ(識別タグ配列と呼ばれる)を関連づけることに関する。これらのタグは、独立した標的分子を互いと識別するために有用であり、それによって、既知数の個別の標的分子に基づいた分析が可能になる。例えば、アッセイにおいて得られた複数の標的分子配列の各々が、異なる識別タグと関連する場合、それらの標的配列は、互いから独立していると考えられ得、遺伝子型の尤度は、この情報に基づいて決定され得る。対照的に、アッセイにおいて得られる複数の標的分子配列の各々が、同じ識別タグと関連する場合、それらの標的分子配列のおそらくすべてが、そのアッセイにおけるこの標的分子の提示過剰に起因して(例えば、偏った増幅に起因して)、同じ標的分子を起源とするものだろう。これは、各核酸が異なる識別タグに関連した状況よりも少ない情報しか提供しない。いくつかの実施形態において、独立して単離された閾値数の分子(例えば、識別タグと標的配列との独特の組み合わせ)が分析されることにより、被験体の遺伝子型が決定される。
いくつかの実施形態において、本発明は、調製核酸のプール(ライブラリー)を含む組成物に関し、そのプール内の調製核酸の各々は、バイアスの影響を検出するためおよび減少させるため、ならびに標的核酸配列の遺伝子タイピングを行うための「識別タグ配列」を含む。本明細書中で使用されるとき、「識別タグ配列」は、核酸(調製核酸)の配列であり、それは、複数の異なる単離された核酸の状況において、独立して単離された独特の核酸を同定するものである。代表的には、識別タグ配列は、核酸調製方法の1つ以上の段階において標的核酸の起源を同定するために使用される。例えば、多重核酸捕捉反応において、識別タグ配列は、複数の独立した標的核酸捕捉事象を識別するための根拠を提供する。また、多重核酸増幅反応において、識別タグ配列は、例えば、標的核酸の複数の独立した主要なアンプリコンを識別するための根拠を提供する。よって、ある調製方法に関する単離された核酸の標的核酸配列と識別タグ配列との組み合わせ(標的:識別タグ配列)は、独立して単離された独特の標的核酸を同定するための根拠を提供する。図4A〜Cは、識別タグ配列と標的配列とを組み合わせるための方法の様々な非限定的な例を表している。
識別タグが、当該分野で公知のいくつかの異なる方法のうちのいずれか1つを用いて合成され得ることは、当業者に明らかだろう。例えば、識別タグは、ランダムなヌクレオチド付加によって合成され得る。識別タグ配列は、代表的には、あらかじめ定義された長さであり、それは、調製反応(例えば、増幅ベースの反応、環状化選択ベースの反応、例えば、MIP反応)において独特の標的:識別タグ配列を生成する尤度を制御するために選択される。識別タグ配列は、最大5、最大6、最大7 最大8、最大9、最大10、最大11、最大12、最大13、最大14、最大15、最大16、最大17、最大18、最大19、最大20、最大21、最大22、最大23、最大24、最大25またはそれ以上のヌクレオチド長であり得る。遺伝子タイピングの目的のために、単離された核酸が、標的核酸配列と識別タグ配列との独特の組み合わせを含み、標的核酸配列と識別タグ配列との閾値数の独特の組み合わせの観察結果(observance)が、その遺伝子型におけるある特定の統計学的信頼度を提供する場合、その単離された核酸は、独立して単離されたと同定される。
ライブラリー調製プロセスにおいて、各核酸分子は、独特の識別タグ配列が目的の標的核酸配列(ライブラリーを調製するための核酸配列、例えば、多型配列)とともに配列決定されることを可能にする配置において、その識別タグ配列でタグ化され得る。特定の工程において識別タグ配列を含む核酸を組み込むことによって、そのプロトコルの後の工程においてバイアスの検出および補正が可能になる。
独特の識別タグ配列の大きなライブラリーは、規定の長さの縮重ランダム配列ポリヌクレオチドを用いることによって作製され得る。それらのポリヌクレオチドの識別タグ配列は、シークエンシングの最後の段階において解読され得る。識別タグ配列の観察結果を用いることにより、ライブラリーの最後のシークエンシングの読出しにおいてバイアスが検出され得、補正され得る。例えば、ランダムに生成され得る識別タグ配列の可能な総数は、4Nであり、ここで、Nは、識別タグ配列の長さである。よって、識別タグ配列の長さは、独特の識別タグ配列を有するMIPの集団のサイズが、MIP捕捉産物のライブラリーを生成するのに十分であるように調整され得る(ここで、標的核酸配列と識別タグ配列との独立した同一の組み合わせは稀である)ことが理解されるべきである。本明細書中で使用されるとき、標的核酸配列と識別タグ配列との組み合わせは、「標的:識別タグ配列」とも呼ばれ得る。
シークエンシングプロセスの最後の読出しにおいて、各リードは、追加的な独特の識別タグ配列を有し得る。いくつかの実施形態において、識別タグ配列が、ライブラリー内にランダムに分配されているとき、その独特の識別タグ配列のすべてが、ほぼ同じ回数で観察される。したがって、識別タグ配列の出現回数は、ポアソン分布に従い得る。
いくつかの実施形態において、調製核酸(例えば、増幅されたMIP捕捉産物)のプールにおける標的:識別タグ配列の過剰提示は、調製プロセスにおけるバイアス(例えば、増幅プロセスにおけるバイアス)を示唆する。例えば、統計学的に過剰提示される標的:識別タグ配列の組み合わせは、そのプロトコルの、MIPへの識別タグ配列の組み込みとMIP捕捉産物の実際のシークエンシングとの間の1つ以上の工程におけるバイアスを示唆する。
所与の標的:識別タグ配列のリードの数は、起源サンプル中に存在する標的配列の量を示唆し得る(代理として働き得る)。いくつかの実施形態において、起源サンプルにおける配列の出現回数は、目的の数である。例えば、本明細書中に開示される方法を用いるとき、MIPのプール内の識別タグ配列の出現率は、あらかじめ決められ得る(例えば、すべての識別タグ配列に対して同じであり得る)。したがって、増幅後およびシークエンシング後の識別タグ配列の出現率の変化は、そのプロトコルにおけるバイアスを示唆し得る。バイアスが補正されることにより、例えば診断目的のために、元のMIPプールの組成の正確な提示が提供され得る。
いくつかの局面によると、調製核酸分子(例えば、独特の識別タグ配列を有するライブラリー内の各核酸であるMIP)のライブラリーは、そのライブラリー内の核酸分子の数が、そのライブラリーを用いて捕捉される標的核酸分子の予定数よりも著しく多くなるように構築され得る。このことにより、調製方法の産物が、独特の標的:識別タグ配列だけを含むことが確実になり;例えば、MIP反応において、捕捉工程は、MIPライブラリー内の独特の識別タグ配列の集団全体をより少なくサンプリングし得る。例えば、1μgのゲノムDNAを利用した実験は、約〜150,000コピーの二倍体ゲノムを含み得る。ライブラリー内の各MIPが、ランダムに生成された12−merの識別タグ配列を含むMIPライブラリー(約160万個の独特の識別タグ配列が存在し得る)の場合、1ゲノムコピーあたり100を超える独特の識別タグ配列が存在し得る。ライブラリー内の各MIPが、ランダムに生成された15−merの識別タグ配列を含むMIPライブラリー(約10億個の独特の識別タグ配列が存在し得る)の場合、1ゲノムコピーあたり7000を超える独特の識別タグ配列が存在し得る。ゆえに、同じ識別タグ配列が複数回組み込まれる確率は、途方もなく小さい。よって、識別タグ配列の長さは、MIP捕捉反応における標的配列の量、および標的:識別タグ配列の組み合わせが独立して複数出現することに対する所望の確率に基づいて選択されるべきであることが認識されるだろう。
図5は、標的配列および識別タグ配列に基づいて遺伝子タイピングを行うための非限定的な方法を表している。標的配列および識別タグ配列のシークエンシングリードは、二倍体の遺伝子型コールを行うためにつぶされる。図6は、MIP捕捉反応のシミュレーションの非限定的な結果を表しており、ここで、MIPプローブ(各々、15ヌクレオチドの識別タグ配列を有する)は、10000コピーの標的配列(例えば、ゲノム等価物)と組み合わされている。このシミュレートされた反応では、同じ識別タグ配列を有する1コピー以上の標的配列を捕捉する確率は、0.05である。Y軸は、観察結果の数を反映している。X軸は、標的:識別タグ組み合わせの独立した出現数を反映している。図7は、シークエンシングカバレッジの非限定的なグラフを表しており、これは、対立遺伝子が十分な深度でサンプリングされることを確実にするのを助け得る(例えば、1000個の標的を仮定したときの対立遺伝子1つあたり10×または20×最小サンプリング)。この非限定的な例では、X軸は、標的1つあたりの必要とされる総カバレッジであり、Y軸は、所与の総カバレッジが各対立遺伝子に対して少なくとも10×または20×カバレッジをもたらす確率である。
MIPライブラリー調製プロセスの一部として、アダプターが、目的の分子の末端にライゲートされ得ることを当業者は認識するだろう。アダプターは、しばしば、PCRプライマー部位(増幅用またはエマルジョンPCR用)および/またはシークエンシングプライマー部位を含む。さらに、例えば、一緒に混合され得る個別のサンプル(例えば、患者サンプル)を一義的に同定するために、バーコードが含められ得る(例えば、USPTO
Publication Number US2007/0020640A1(McCloskeyら)を参照のこと)。
Publication Number US2007/0020640A1(McCloskeyら)を参照のこと)。
ランダムな識別タグ配列の実際の組み込みは、当該分野で公知の様々な方法によって行われ得る。例えば、識別タグ配列を含む核酸が、ライゲーションによって組み込まれ得る。これは、識別タグ配列を有する分子を任意の平滑末端核酸にライゲートすることができるので、融通の利く方法である。上記シークエンシングプライマーが識別タグ配列と標的配列の両方を配列決定するように、それらのシークエンシングプライマーを後で組み込まれなければならない。あるいは、ただ1回のライゲーションだけを行えばよいように、シークエンシングアダプターが、その3’末端の(縮重塩基として)ランダムな識別タグ配列とともに合成され得る。別の方法は、プライマー構造が、共通のアダプター配列の後にランダムな識別タグ配列、その後にPCRプライミング配列で(5’から3’への順序で)配置されるように、識別タグ配列をPCRプライマーに組み込む方法である。識別タグ配列およびアダプター配列(シークエンシングプライマー部位を含み得る)は、タグとして組み込まれる。識別タグ配列を組み込む別の方法は、遺伝子捕捉反応を行う前に、パドロックプローブ中に識別タグ配列を合成することである。識別タグ配列は、標的化アームに対して3’に組み込まれるが、そのプロトコルの下流で使用され得る増幅プライマーに対しては5’に組み込まれる。識別タグ配列を組み込む別の方法は、遺伝子特異的プライマーまたはポリ−dT逆転写プライマーにおけるタグとしてである。これにより、識別タグ配列をcDNAレベルで直接組み込むことが可能になる。
いくつかの実施形態において、組み込み工程における識別タグ配列の分布は、均一であると仮定され得る。この場合は、そのプロトコルの任意の部分におけるバイアスは、この分布の均一性を変化させ得、それは、シークエンシングの後に観察され得る。このことにより、最終的なアウトプットが多くの分子の並行したシークエンシングである任意の調製プロセスにおいて識別タグ配列を使用することが認められる。
識別タグ配列は、チップ上で並行して合成されるとき、複数のプローブ(例えば、MIP)に組み込まれ得、その組み込まれるヌクレオチドの縮重は、複数のプローブにおけるほぼ均一な分布を確実にするのに十分である。独特の識別タグ配列のプールの増幅自体が最初のプール内にバイアスを導入し得ることが認識されるべきである。しかしながら、ほとんどの実際の場合では、合成(例えば、カラム合成、チップベースの合成によるものなど)のスケールが十分大きいので識別タグ配列の最初のプールの増幅は必要でない。独特の識別タグ配列のプールに対する増幅工程または選択工程を回避することによって、潜在的なバイアスが最小にされ得る。
識別タグ配列の使用の1つの例は、ゲノムリシークエンシングにおけるものである。ほとんどの次世代シークエンシング機器の未処理の(raw)正確度が比較的低いことを考慮すると、目的のゲノム遺伝子座を過剰サンプリングすることは非常に重要である。さらに、すべての遺伝子座には2つの対立遺伝子が存在するので、サンプルがホモ接合であるかまたはヘテロ接合であるかを十分な程度の統計学的信頼度で決定するのに十分な回数、両方の対立遺伝子が観察されることを確実にするのに十分、サンプリングすることが重要である。実際は、シークエンシングを行うことにより、起源サンプル中の分子の組成物がサンプリングされる。しかしながら、複数のリードが、所与の遺伝子座に対して集められた後では、バイアス(例えば、PCR増幅工程によって引き起こされるバイアス)に起因して、それらのリードの大部分が単一の起源分子から得られたものである可能性がある。これは、観察された標的配列の集団を歪め得、遺伝子型コールの結果に影響し得る。例えば、ヘテロ接合である遺伝子座が、ホモ接合とコールされる可能性がある。なぜなら、その遺伝子座の多くの観察結果のうち第2の対立遺伝子の観察結果がほんのわずかにしか存在しないからである。しかしながら、提示過剰の対立遺伝子は、提示過剰の識別タグ配列を有するとも見られ得る(すなわち、提示過剰の識別タグ配列を有する配列のすべてが同じ単一分子に由来し得る)ので、識別タグ配列に対する情報が入手可能である場合、この状況は、防がれ得る。ゆえに、それらの配列および識別タグ配列の対応する分布が、遺伝子型をコールするアルゴリズムへの追加のインプットとして使用されることにより、遺伝子型コールの正確度および信頼度が著しく改善され得る。
いくつかの局面において、本開示は、遺伝子座または遺伝子座の一部(例えば、表1の遺伝子座)である複数の標的配列を分析するための方法を提供する。それらの遺伝子座は、1つ以上の多型(例えば、SNP)における遺伝子型を得るためにシークエンシングすることによって分析され得る。例示的な多型は、表2に開示される。当業者は、他の多型も当該分野で公知であり、例えば、Entrez Single Nucleotide
Polymorphismデータベースを照会することによって、例えば、表1の遺伝子IDを用いて検索することによって、同定され得ることを認識するだろう。
Polymorphismデータベースを照会することによって、例えば、表1の遺伝子IDを用いて検索することによって、同定され得ることを認識するだろう。
いくつかの実施形態において、本発明の局面は、核酸リピート配列を含む領域における核酸の欠失または挿入を検出するための方法に関する。
核酸リピート配列を含むゲノム領域は、リピート配列の数の増幅または縮小(例えば、1単位以上の反復配列の挿入または欠失)に起因する遺伝的不安定性の部位であることが多い。多数のリピート配列を含むゲノム領域の長さの不安定性は、いくつかの遺伝性および非遺伝性の疾患および状態に関連している。
例えば、「脆弱X症候群」、すなわちマーチン・ベル症候群は、徴候が重篤から軽度にわたる一連の特徴的な物理的、知的、情緒的および行動的な特色をもたらす遺伝的症候群である。この症候群は、X染色体上の単一のトリヌクレオチド遺伝子配列(CGG)の拡大に関連するものであり、正常な神経発生に必要なFMR−1タンパク質が発現できなくなる。脆弱X症候群には、繰り返しCGG配列の長さに関して一般に認められている形態が4つある;正常(29〜31個のCGGリピート)、前変異(55〜200個のCGGリピート)、完全変異(200個を超えるCGGリピート)および中間またはグレーゾーンの対立遺伝子(40〜60個のリピート)。
他の例としては、1つ以上のマイクロサテライト遺伝子座(例えば、BAT−25および/またはBAT−26)における核酸リピートのゲノムコピー数の増加または減少を含むマイクロサテライト不安定性(MSI)に関連している癌が挙げられる。現在、特定の遺伝子座における核酸リピート配列の数を決定するためおよび核酸の挿入または欠失の存在を同定するためのシークエンシングベースのアッセイが多く存在する。しかしながら、そのような手法は、ある領域の全長を配列決定しないことがあるハイスループット多重分析では有用でない。
対照的に、いくつかの実施形態において、本発明の局面は、遺伝子座を配列決定する必要なく(または、遺伝子座全体を配列決定する必要なく)、そのゲノム遺伝子座における挿入または欠失の存在を検出することに関する。本発明の局面は、高レベルのリピート配列を含む核酸領域における挿入または欠失を検出するために特に有用である。ある遺伝子座におけるリピート配列の存在は、ある集団において、その遺伝子座におけるリピート配列の1つ以上の挿入または欠失に起因する比較的高レベルの多型に関連することが多い。それらの多型は、疾患または疾患に対する素因に関連し得る(例えば、ある特定の多型の対立遺伝子は、疾患または状態に関連する劣性の対立遺伝子である)。しかしながら、その遺伝子座における正確な配列およびリピートの数を決定するためにシークエンシング手法を用いるとき、リピート配列の存在は、しばしば、遺伝子座の分析を複雑にし、エラーのリスクを高める。
いくつかの実施形態において、本発明の局面は、核酸捕捉法(例えば、分子反転プローブ技術に基づく核酸配列の捕捉法)を用いて、挿入または欠失を含むと疑われる(例えば、リピート配列の存在に起因して)遺伝子座の一部の捕捉頻度を評価することによって、遺伝子座のサイズを決定することに関する。本発明の局面によると、異なる生物学的サンプル(例えば、異なる被験体由来のサンプル)における目的の遺伝子座に対する捕捉効率の統計学的に有意な差は、それらのサンプルにおける相対的な長さが異なることを示唆する。その長さの差は、その遺伝子座の一方または両方の対立遺伝子におけるものであり得ることが認識されるだろう。したがって、本発明の局面は、生物学的サンプルがその多型に対してヘテロ接合において調べられているのかまたはホモ接合において調べられているのかに関係なく、多型を同定するために使用され得る。本発明の局面によると、挿入または欠失を有する1つ以上の遺伝子座を含む被験体は、適切なコントロール(例えば、既知の核酸サイズに対する捕捉効率、生物学的サンプル中の挿入または欠失を含むと疑われない他の領域に対する捕捉効率)もしくは所定の参照捕捉効率またはそれらの任意の組み合わせを用いて、1つ以上の生物学的サンプルから得られた核酸についての捕捉効率を分析することによって同定され得る。しかしながら、本発明の局面は、コントロールの性質または存在によって限定されないことが認識されるだろう。いくつかの実施形態において、捕捉効率の統計学的に有意な変動が検出される場合、被験体は、その遺伝子座における挿入または欠失に関連する疾患または状態に対してリスクがあると同定され得る。いくつかの実施形態において、挿入または欠失の正確な性質を決定するため、および被験体が1つ以上の挿入または欠失に対してヘテロ接合であるかまたはホモ接合であるかを決定するために、被験体は、より詳細に分析され得る。例えば、遺伝子座の増幅(例えば、PCR)産物のゲル電気泳動もしくはサザンブロッティング、またはそれらの任意の組み合わせが、遺伝子座の長さを実証する直交性アプローチとして用いられ得る。いくつかの実施形態において、挿入および欠失の数およびタイプを同定するために、遺伝子座のより網羅的かつ詳細な配列分析が行われ得る。しかしながら、本発明の局面にしたがって異常な長さを有すると同定された遺伝子座をさらに分析するために、他の手法も用いられ得る。
したがって、本発明の局面は、目的のゲノム領域における異常な核酸の長さを検出することに関する。いくつかの実施形態において、本発明は、反復エレメントなどのアクセスしづらいゲノム領域のサイズを推定することを目標とする。しかしながら、本発明の方法は、正確な長さを推定することを要求しないことが認識されるだろう。いくつかの実施形態では、異常な長さを有する1つ以上の対立遺伝子が目的の遺伝子座に存在することを決定することで十分である(例えば、異常な捕捉効率の検出に基づいて)。
非限定的な例において、本発明の局面を例証するために、トリヌクレオチドリピート(遺伝子型)のサイズが症状(表現型)と関係がある脆弱Xが用いられ得る。しかしながら、脆弱Xは、非限定的な例であり、同様の分析が、他の遺伝子座に対して行われ得る(例えば、独立して、または多重分析において同時に)ことが認識されるだろう。
分子反転プローブ(MIP)の使用は、単一ヌクレオチド多型の検出(Hardenbolら、2005 Genome Res 15:269−75)およびエキソンの大きなセットの調製的増幅(Porrecaら、2007 Nat Methods 4:931−6,Krishnakumarら、2008 Proc Natl Acad Sci USA 105:9296−301)について証明されている。どちらの場合においても、増幅される遺伝子座の上流および下流とハイブリダイズする末端(「標的化アーム」)を有するオリゴヌクレオチドプローブが設計される。
いくつかの実施形態において、本発明の局面は、プローブ捕捉効率に対する長さの影響をアッセイ(例えば、ハイスループットアッセイおよび/または多重アッセイ)に用いることにより、評価される領域全体のシークエンシングを必要とせずに配列の長さを決定することができるという認識に基づく。これは、サイズが変化しやすいリピート領域にとって特に有用である。Dengら、Nature Biotech.27:353−60(Dengらの補足図1Gを参照のこと)から再現された図8に図示されるように、MIPを用いるとき、短い配列が長い配列よりも高効率で捕捉されることが図示されている。統計パッケージRおよびそのエフェクト(effect)モジュールをこの分析のために用いた。線形モデルを使用し、個別の因子は独立していると仮定した。破線は、95%信頼区間を表している。より短い標的配列が、長い標的配列よりも高い効率で捕捉された(p<2×10−16)。しかしながら、配列の長さの体系的分析にこの差次的な捕捉効率を使用することは、以前は認識されていなかった。
いくつかの実施形態において、プローブハイブリダイゼーションの後に、ポリメラーゼ充填反応およびライゲーション反応を行うことにより、ハイブリダイズされたプローブが、所望の標的を含む共有結合的に閉じた環状分子に変換される。PCRまたはローリングサークル増幅に加えて、環状化されていない材料のエキソヌクレアーゼ消化を行うことにより、出発核酸プールから環状の標的が単離され、増幅される。この方法の主要な利点のうちの1つは、高度の多重化に対する能力であるので、一般に、数千の標的が、数千のプローブを含む単一反応において捕捉される。
本発明の局面によると、反復領域は、独特の非反復配列に取り囲まれており、その非反復配列を使用することにより、例えば、PCRまたはパドロック(MΙP)ベースの方法を用いて、リピート含有領域を増幅することができる。
反復領域に加えて、プローブ(例えば、MIPまたはパドロックプローブ)は、ゲノム(または標的プール)において一義的に同定されるのに十分な少なくとも1つの配列を含むように設計され得る。図9に図示されるように、プローブが環状化され、増幅された後、独特の配列が同定されて、反復領域の「代表」として働き得るように、アンプリコンの末端が配列決定され得る。図9は、反復領域(太い波線)と隣接する独特の配列(太い直線)の両方を含む領域のパドロック(MIP)捕捉の非限定的なスキームを図示している。これらのプローブの領域は、領域「1」および「3」として示される標的化アームとともに示されている。シークエンシングプライマー結合部位であり得るかまたはシークエンシングプライマー結合部位を含む介在領域は、「2」と示されている。パドロックが環状化され、増幅された後、末端を配列決定することにより、目的の反復領域に相当する独特の配列の配列を得ることができる。捕捉効率は、全体的に見て、標的の長さと逆の相関関係があるが、種々のプローブ配列は、独特の特性を有し得る。ゆえに、およそ0〜150bp、150〜600bpおよびそれ以上の反復サイズ(これらはそれぞれ、脆弱X症候群の正常、前変異および完全変異を表す)を識別するのに十分感度の高い最適なプローブが選択されるように、複数のプローブが、設計され得、試験され得る。しかしながら、ある範囲のリピート領域サイズの差(例えば、約3〜30塩基、約30〜60塩基、約60〜90塩基、約90〜120塩基、約120〜150塩基、約150〜300塩基、約300〜600塩基、約600〜900塩基という長さの差、または任意の中間もしくはそれより長い長さの差)を識別するように、他のプローブのサイズおよび配列が設計され得、必要に応じて、最適化され得ることが認識されるだろう。長さの差は、サイズの増加またはサイズの減少であり得ることが認識されるだろう。
いくつかの実施形態において、予想外の捕捉頻度の最初の決定は、サイズの差の存在を示す。いくつかの実施形態において、捕捉頻度の増加は、欠失を示唆する。いくつかの実施形態において、捕捉頻度の減少は、挿入を示唆する。しかしながら、捕捉プローブの特定の配列パラメータおよび相対的サイズ、標的領域ならびに欠失または挿入に応じて、捕捉頻度の変化は、標的領域の長さの増加または減少に関連し得ることが認識されるだろう。いくつかの実施形態において、その変化の正確な性質は、本明細書中に記載されるような1つ以上の追加の手法を用いて測定され得る。
したがって、いくつかの局面において、MIPプローブは、2つのハイブリダイゼーション配列または標的化アーム(一方は直鎖状プローブの各端に位置する)を含む直鎖状の核酸鎖を含み、ここで、ハイブリダイゼーション配列の各々は、標的核酸の同じ鎖における別個の配列に相補的であり、標的核酸におけるこれらの配列は、目的の標的核酸配列の2つの末端に隣接する。ハイブリダイゼーションの際、プローブの5’末端と3’末端の両方が同じ鎖にハイブリダイズすることにより、標的領域に隣接する領域を分断するという意味において、プローブの2つの末端は互いに対して反転している(例えば、図9に図示されるように)ことが認識されるだろう。
いくつかの実施形態において、ハイブリダイゼーション配列は、約10〜100ヌクレオチド長、例えば、約10〜30、約30〜60、約60〜90または約20、約30、約40もしくは約50ヌクレオチド長である。しかしながら、用途に応じて、他の長さを使用してもよい。いくつかの実施形態において、プローブの両方の標的化アームのハイブリダイゼーションTmは、同様であるように設計されるかまたは選択される。いくつかの実施形態において、異なる標的領域を捕捉するために設計された複数のプローブの標的化アームのハイブリダイゼーションTmは、同様であるように選択されるかまたは設計され、その結果、それらは多重反応において共に使用することができる。したがって、充填前のMIPプローブの代表的なサイズは、約60〜80ヌクレオチド長である。しかしながら、標的化アームのサイズおよびMIPプローブに存在する他の任意の配列(例えば、プライマー結合配列またはタグ配列)のサイズに応じて、他のサイズを使用してもよい。いくつかの実施形態において、MIPプローブは、配列依存的な二次構造を回避するように設計される。いくつかの実施形態において、MIPプローブは、標的化アームが、公知の多型の領域と重複しないように設計される。いくつかの実施形態において、脆弱X遺伝子座のリピート領域を捕捉するために使用され得る標的化アームは、捕捉される鎖に応じて、以下の配列を有し得るかまたはこれらの配列と相補的な配列を有し得る。
左:CTCCGTTTCGGTTTCACTTC(配列番号181)
右:ATCTTCTCTTCAGCCCTGCT(配列番号182) 。
左:CTCCGTTTCGGTTTCACTTC(配列番号181)
右:ATCTTCTCTTCAGCCCTGCT(配列番号182) 。
これらの標的化アームを用いて捕捉される代表的なサイズは、約100ヌクレオチド長(例えば、トリヌクレオチドリピートの約30リピート)である。
いくつかの実施形態において、反復領域の「代表」に対して得られるリードの数は、得られるリードの総数に依存するので、そのリードの数は、標的の長さを推定する情報価値がない。これを克服するために、集団の中で多型が存在しないかまたは多型が最小である他の「コントロール」領域を標的にする1つ以上のプローブを含めることが有用である。捕捉効率が体系的に一貫するので(例えば、図9を参照のこと)、反復領域の「代表」に対して得られたリードと、コントロール領域に対して得られたリードとの比は、規定数のリピートを有するDNAを用いて調整され得る。最終的には、その比は、図10に図示されるように、リピートの長さの基準として働き得る。図10は、「コントロール」領域のリードに対するリピートの「代表」のリードの比によって測定される、標的のギャップサイズと反復領域のリードの相対数との非限定的な仮定的関係性を図示している。y軸の単位は、任意である。
いくつかの実施形態において、同様のサイズ範囲を有する標的をより上手く見分けるために、ショットガンライブラリーを作製することによって(例えば、捕捉された配列(例えば、MIPプローブを用いて捕捉された配列)からショットガンライブラリーを作製することによって)反復領域全体が配列決定され得る。リピートが長いほど、リピートの短いリードが多く得られ得る。ゆえに、標的の長さは、「反復」リードの相対数に対して2倍寄与し得、それにより、区別している標的のよりよい分離がもたらされ得る。いくつかの実施形態において、任意の所与のリピートからのリードの数は、存在するリピートの数の一次関数であり得るということが期待される。しかしながら、いくつかの実施形態において、ポアソンサンプリングによって誘導される広がりは、考慮される必要があり得、いくつかの実施形態において、その分離を限定するのに十分に大きい場合がある。
二倍体サンプル由来の両方の対立遺伝子の長さの正確な測定が望まれるとき、さらなる操作が必要になり得る。これは、測定される捕捉効率が、実際にはその2つの対立遺伝子の平均効率であり得るからである。各対立遺伝子に対する別個の測定を効率的に達成するために、後に続く(個別のゲノム遺伝子座からの)個別の捕捉事象の効率化を可能にするバーコード(例えば、配列タグ)が使用され得る。図11A〜Cは、上記のアプローチを示している。反応物中に同じ識別タグ配列を有する2つの任意のMIPが存在する確率が低くなるように、所与の遺伝子座に対して、それらの骨格に多数の識別タグのうちの1つを含むMIPを合成する。MIP捕捉をそのサンプルに対して行う;その反応は、より短い標的の長さに偏り、ゆえに、その反応産物は、「長い」環よりも「短い」環を多く含み得る。各環は、独特の識別タグ配列を有するはずである。次いで、直鎖RCA(lRCA)をそれらの環に対して行う。lRCA反応において、環は、それら自体の長い直鎖状のコンカテマーに変換される。そのコンカテマーが「一定の」長さ(そのポリメラーゼの処理能力/エラー率に基づいて)に達したら、所与の環に対するlRCA反応を停止する。ゆえに、より小さい環から得られたコンカテマーは、より多いコピー数の識別タグを含み得、より大きい環から得られたコンカテマーは、より少ないコピー数の識別タグを含み得る。各識別タグ配列の数は、例えば、次世代シークエンシングによって、計数される。出現数を識別タグIDに対してプロットすると、データは当然、二倍体サンプルにおける2つの対立遺伝子の長さを反映する2つの群にクラスター化する。ゆえに、既知の標準を用いて長さの絶対較正が行われた後、対立遺伝子の長さは、このグラフから直接読み取ることができる。いくつかの実施形態において、シークエンシング法(例えば、次世代シークエンシング法)を用いることにより、1つ以上の捕捉された標的(例えば、またはそのアンプリコン)の一部が配列決定され、それらの配列を用いることにより、存在する種々のバーコードの数が計数される。したがって、いくつかの実施形態において、本発明の局面は、高度に多重化されたqPCR反応に関する。
挿入もしくは欠失またはリピート配列が疾患または状態に関連し得る遺伝子座の他の非限定的な例が、表3および4に提供される。これらの遺伝子座のいずれか1つ以上における異常な長さの存在は、本発明の局面にしたがって評価され得ることが認識されるだろう。いくつかの実施形態において、これらの遺伝子座または他の遺伝子座の2つ以上は、同じ反応条件下において生物学的サンプル中の異なる標的核酸とハイブリダイズするように設計された種々のプローブを用いる単一の多重反応において評価され得る。
4.検出感度の上昇:
いくつかの実施形態において、本発明の局面は、核酸検出アッセイの感度を高めるための方法に関する。
いくつかの実施形態において、本発明の局面は、核酸検出アッセイの感度を高めるための方法に関する。
現在、次世代(ポロニーベースの)シークエンシング(とりわけ、ゲノムリシークエンシング、遺伝子発現についてのRNA−seq、メチル化についての亜硫酸水素塩シークエンシングおよびImmune−seqを含む)を利用してデータを生成する多くのゲノミクスアッセイが存在する。定量的測定(遺伝子型コールを含む)を行うために、これらの方法は、核酸の元のサンプルにおけるその配列の提示に対する代理として所与のゲノム遺伝子座のシークエンシングリードの数を利用する。これらの手法の大部分は、目的のサンプルを代表するDNA分子の高複雑度ライブラリーを構築する調製工程を必要とする。現在のアッセイは、いくつかの代替の核酸調製法(例えば、増幅、例えば、PCRベースの増幅;配列特異的捕捉、例えば、固定化された捕捉プローブを用いるもの;または環状化されたプローブへの標的捕捉の後の配列分析工程)のうちの1つを使用する。核酸単離手法および配列分析手法の予測不能性(確率的性質)に関連するエラーを減少させるために、現在の方法は、元の核酸サンプル中に存在するすべての配列が最終的な配列データにおいて提示される尤度を高めるために、標的核酸調製物の過剰サンプリングを伴う。例えば、ゲノムシークエンシングライブラリーは、そのライブラリーの構築プロセスにおける確率的変動の結果として、ソース核酸サンプル(例えば、ゲノム調製物)由来の特定の配列の提示過剰または提示不足を含み得る。そのような変動は、シークエンシングライブラリー内に存在しないゲノム由来の標的配列またはシークエンシングライブラリー内の検出不可能なゲノム由来の標的配列に生じるとき、特に問題であり得る。例えば、シークエンシングライブラリー内のゲノム由来の特定の対立遺伝子の配列(例えば、ヘテロ接合の対立遺伝子)の提示不足は、シークエンシングライブラリーにおいて明らかなホモ接合の提示をもたらし得る。
対照的に、本発明の局面は、標的核酸を単に過剰サンプリングするのではなく、核酸配列の分析を、サンプリングされる核酸のタイプで異なる系統誤差を有する2つ以上の異なる核酸調製手法からの結果に基づかせることに関する。いくつかの実施形態によると、異なる手法は、体系的でありかつ単純に核酸の捕捉中または増幅中の確率的影響に起因しない異なる配列バイアスを有する。したがって、いくつかの実施形態において、核酸調製における変動を克服するために必要な過剰サンプリングの程度は、バイアスを克服するのに十分である必要がある。いくつかの実施形態において、本発明は、異なるバイアスを有する2つ以上の異なる核酸調製手法から得られた核酸および/または配列の結果を組み合わせることによって、過剰サンプリングの必要性を低下させる方法を提供する。
本発明によると、異なる手法は、異なる特徴的なバイアスまたは系統誤差を有する。例えば、1つの手法は、サンプル分析を目的の遺伝子座における1つの特定の対立遺伝子に偏らせ得るのに対し、別の手法は、サンプル分析を同じ遺伝子座の別の対立遺伝子に偏らせ得る。したがって、同じサンプルが、配列分析にむけて核酸を調製するために使用される手法のタイプに応じて、異なると同定され得る。各手法が、目的の多型配列に対して異なる相対的な感度を有するので、これは、感度の問題を効率的に表す。
本発明の局面によると、核酸分析の感度は、異なる核酸調製工程からの配列を組み合わせ、組み合わされた配列情報を診断アッセイのために(例えば、被験体が目的の遺伝子座においてホモ接合であるかまたはヘテロ接合であるかに関するコールを生成するために)用いることによって、高められ得る。
現在、DNAシークエンシングが変異を検出する能力は、上流のサンプル単離方法(例えば、増幅、固定化濃縮、環状化捕捉などによる方法)が目的の遺伝子座を、信頼性をもって単離する能力によって限定されている。二倍体ゲノム(例えば、分子診断用シークエンシングのために提供されるヒトサンプル)についてヘテロ接合のベースコールを生成したい場合、いくつかの実施形態では、その単離方法がほぼ均一または完全に均一(目的の遺伝子座に対してヘテロ接合体またはホモ接合体と明確に「コール」されるのに少なくとも十分均一)の量の2つの配列決定された対立遺伝子を生成することが重要である。
サンプル調製方法は、3つのクラス:1)単一またはいくつかの標的の増幅(例えば、一重(uniplex)PCR、「多重」PCR)、2)多標的(multi−target)ハイブリダイゼーション濃縮(例えば、Agilent SureSelect「ハイブリッド」捕捉[Gnirkeら、2009,Nature methods 27:182−9]、Roche/Nimblegen「配列捕捉」[Hodgesら、2007,Nature genetics 39:1522−7]、および3)多標的環状化選択(例えば、分子反転プローブまたはパドロックプローブ[Porrecaら、2007,Nature methods 4:931−6、Turnerら、2009,Nature methods 6:315−6]、「セレクター」[Dahlら、2005,Nucleic acids research 33:e71])に分けられ得る。これらの方法の各々は、インプットの存在量の分布を適切に表さない単離された産物のプールを生じ得る。例えば、ヘテロ接合の位置における2つの対立遺伝子は、インプットの50:50という比から下流のシークエンシングにおいてベースコールを見落とす比に歪められ得る。例えば、その比が50:50から10:90に歪められ、かつそのサンプルが10×平均カバレッジに配列決定される場合、2つの対立遺伝子のうちの1つが10個のシークエンシングリードにおいて1回も観察されない確率が高い。これにより、ヘテロ接合の位置がホモ接合に変換されることによってシークエンシング方法の感度が低下し得る(もしかすると「変異」対立遺伝子は、観察されない対立遺伝子であるかもしれない)。いくつかの実施形態において、歪められた比は、不均一な腫瘍組織に存在する変異を検出する感度を低下させる特定の問題である。例えば、不均一なサンプルにおいて分析される細胞のわずか10%しか、ヘテロ接合性の変異を有していない場合、その変異は、配列リードの50%ではなく5%に存在すると予想され得る。このシナリオでは、ロバストな高感度の検出の必要性がなおも重大であり得る。
本明細書中に開示される方法は、ある特定のクラスの単離方法が種々の様式のバイアスを有するという発見に部分的に基づく。本開示は、1つのサンプルに対して複数の単離方法の組み合わせ(例えば、本明細書中に開示されるクラスのうちの少なくとも2つから1つ以上)を用いることによって下流のシークエンシングの感度を高めるための方法を提供する。これは、疾患関連変異を「見落とす」可能性を最小にするために高感度が要求される分子診断法において特に重要である。例えば、環状化選択後のシークエンシングに対して1×10−3という名目上の偽陰性のエラー率およびハイブリダイゼーション濃縮後のシークエンシングに対して1×10−3という偽陰性のエラー率が与えられるとき、そのサンプルに対して両方の手法を行うことによって、1×10−6という最終的な偽陰性の割合が達成され得る(各方法における失敗は完全に独立していると仮定する)。単一の完全浸透の変異対立遺伝子によって引き起こされる保因者の頻度が0.1の劣性の疾患の場合、見落とされる保因者診断の数は、試験された100万人の患者あたり1000人から試験された100万人の患者あたり1人にまで減少し得る。さらに、この試験が、出生前保因者スクリーニングにおいて使用される場合、一方の親において保因者であるというコールを見落とす結果として生まれる罹患小児の数は、出生児100万人あたり25人から10億人あたり25人にまで減少し得る。
さらに、本開示は、疾患関連対立遺伝子を含む領域におけるシークエンシングカバレッジを効率的に上げる調製方法の組み合わせを提供する。ヘテロ接合体のエラー率は、50:50の対立遺伝子提示からの偏差と、次世代DNAシークエンシングの場合の平均存在量からの偏差との両方に広く関係しているので(単離されたより少ない標的は、一方または両方の対立遺伝子においてより少なくサンプリングされる可能性が高い)、これらの領域におけるカバレッジを選択的に上げることにより、感度も選択的に上がり得る。さらに、特定の公知の疾患関連変異の存在または非存在を検出するMIPを用いることにより、感度を選択的に高めることができる。いくつかの実施形態において、これらのMIPは、最も3’側の領域が、予想される変異と相補的であり、かつ0bpまたはそれ以上のbpの充填長を有する、標的化アームを有し得る。よって、変異が存在する場合のみ、MIPは形成し、その存在は、シークエンシングによって検出され得る。
さらに、本明細書中に開示されるアルゴリズムを用いることにより、様々なレベルのストリンジェンシーで、所与の位置が任意の公知の疾患関連対立遺伝子を有するか否かに応じた塩基同一性の決定が行われ得る。ストリンジェンシーは、コンセンサスベースコールを生成するために必要な観察される変異リードの最小数を減少させることによって、そのような位置において低下され得る。これは、特異性の低下を犠牲にして変異対立遺伝子の検出に対する感度を効率的に高め得る。
本発明の実施形態は、例えば、標的核酸における多型の存在を検出するために、MIPと、ハイブリダイゼーション濃縮と、必要に応じて一般的な疾患に関連する公知の特定の遺伝子座を標的にした別のMIPとを組み合わせる。非限定的な例が、例えば、標的核酸における多型の存在を検出するために、MIPと、ハイブリダイゼーション濃縮と、必要に応じて一般的な疾患に関連する公知の特定の遺伝子座を標的にした別のMIPとを用いた概略図を図示している図12に例証されている。
図13および14は、MIPベースの捕捉に対する種々の捕捉効率を図示している。図13は、MIP捕捉による標的1つあたりの存在量のグラフを示している。このグラフでは、ここに多く存在しない標的は、両方の対立遺伝子を適切にサンプリングするためにシークエンシングにおいて十分な深度でカバーされる可能性が低いので、バイアスが、ヘテロ接合体のエラー率を大きく動かす。これは、Turnerら、2009,Nature
methods 6:315−6からのものである。ハイブリダイゼーション濃縮は、定性的に類似の存在量の分布をもたらすが、所与の標的の存在量は、おそらく、2つの方法の間で相関しない。図14は、Ballら、2009,Nature biotechnology 27:361−8からの2つのMIP捕捉反応の相関関係のグラフを示している。各点は、複製物1および複製物2における標的の存在量を表している。ピアソン相関r=0.956。これは、MIP捕捉が、標的を特定の存在量に再現性よく偏らせることを示唆する。ハイブリダイゼーション濃縮は、同様に1つの捕捉から次の捕捉へと相関する。
methods 6:315−6からのものである。ハイブリダイゼーション濃縮は、定性的に類似の存在量の分布をもたらすが、所与の標的の存在量は、おそらく、2つの方法の間で相関しない。図14は、Ballら、2009,Nature biotechnology 27:361−8からの2つのMIP捕捉反応の相関関係のグラフを示している。各点は、複製物1および複製物2における標的の存在量を表している。ピアソン相関r=0.956。これは、MIP捕捉が、標的を特定の存在量に再現性よく偏らせることを示唆する。ハイブリダイゼーション濃縮は、同様に1つの捕捉から次の捕捉へと相関する。
本発明の局面によると、そのようなバイアスは、複数の被験体サンプル中の複数の遺伝子座を調べるアッセイにおいて種々の捕捉手法および/または分析手法を体系的に組み合わせることによって、検出され得るかまたは克服され得る。
したがって、本明細書中に記載される実施形態のいずれか(例えば、タイリング/スタガリング、タギング、サイズ検出、感度増強アルゴリズムまたはそれらの任意の組み合わせ)において、本発明の局面は、ゲノム核酸を調製すること、および/またはそれらを1つ以上の異なるプローブ(例えば、捕捉プローブ、ハイブリダイゼーションプローブ、MIPなど)と接触させることを含むことが認識されるだろう。いくつかの実施形態において、1被験体あたり使用されるゲノム核酸の量は、1ng〜10マイクログラム(例えば、500ng〜5マイクログラム)の範囲である。しかしながら、それよりも多い量または少ない量(例えば、1ng未満、10マイクログラム超、10〜50マイクログラム、50〜100マイクログラムまたはそれ以上)も使用され得る。いくつかの実施形態において、目的の各遺伝子座について、1アッセイあたり使用されるプローブの量は、特定の用途に対して最適化され得る。いくつかの実施形態において、プローブとゲノム等価物(例えば、半数体または二倍体のゲノム等価物、例えば、核酸標的または目的の遺伝子座の各対立遺伝子または両方の対立遺伝子に対して)との比(モル比、例えば、濃度比として測定される比)は、1/100、1/10、1/1、10/1、100/1、1000/1とさまざまである。しかしながら、それより低い比、高い比または中間の比を使用してもよい。
いくつかの実施形態において、各反応に使用される標的核酸およびプローブの量は、正規化されることにより、濃度または比が異なることによって引き起こされる、観察される任意の差が回避される。いくつかの実施形態において、ゲノムDNAおよびプローブを正規化するために、ゲノムDNAの濃度が、標準的な分光光度計または蛍光を用いて(例えば、蛍光インターカレート色素を用いて)読まれる。プローブ濃度は、実験によって、またはプローブ製造者が明記する情報を用いて、決定され得る。
同様に、いったん遺伝子座が捕捉されると(例えば、MIPもしくは他のプローブ上に、または別の形態で)、その遺伝子座は、1つ以上のプライマーが関わる反応において増幅され得、そして/または配列決定され得る。各反応に対して加えられるプライマーの量は、0.1pmol〜1nmol、0.15pmol〜1.5nmolの範囲(例えば、およそ1.5pmol)であり得る。しかしながら、他の量(例えば、それより少ない量、多い量または中間の量)を使用してもよい。
いくつかの実施形態において、1つ以上の介在配列(例えば、MIP捕捉プローブ上の第1標的化アームと第2の標的化アームとの間の配列)、識別配列もしくはタグ配列、または標的配列(例えば、ゲノム標的配列)にハイブリダイズするように設計されていない他のプローブ配列は、標的配列または生物学的サンプル中に存在し得る他の配列(例えば、他のゲノム配列)に対する過度の相補性を回避するように(クロス−ハイブリダイゼーションを回避するように)設計されるべきであることが認識されるだろう。例えば、これらの配列は、任意のゲノム配列と十分な数のミスマッチ(例えば、30塩基のうち少なくとも5、10、15またはそれ以上のミスマッチ)を有するように、またはハイブリダイゼーション反応温度よりも低い(例えば、少なくとも5、10、15、20℃またはそれ以上低い)Tm(例えば、ミスマッチTm)を有するように、設計され得る。
分析される核酸がDNA(例えば、ゲノムDNA)である場合、本明細書中で使用される標的化アームは、目的の遺伝子座のいずれかの鎖にハイブリダイズする(例えば、相補的である)ように設計され得ることが認識されるだろう。しかしながら、MIPプローブにおいては、一方の標的化アームに対して選択されるどちらかの鎖が他方の標的化アームに対しても用いられ得る。しかしながら、RNA分析においては、標的化アームは、転写されたRNAにハイブリダイズするように設計されるべきであることが認識されるだろう。標的配列を「捕捉する」と本明細書中で言及されるMIPプローブは、実際のところ、実際の標的分子の捕捉によってではなく鋳型に基づいた合成によって標的配列を捕捉することも認識されるだろう(例えば、アームが、標的分子にハイブリダイズする最初の段階以外、または標的分子が変性されるまでもしくは別途除去されるまで、伸長されたMIP産物に標的分子が結合したままであり得るという意味において)。
いくつかの実施形態において、標的化アームは、1つの対立遺伝子または変異(例えば、SNPまたは他の多型、変異など)と相補的な配列を含み得、その結果、プローブは、その対立遺伝子または変異を有する標的核酸を優先的にハイブリダイズする(および捕捉する)ことが認識されるだろう。しかしながら、多くの実施形態において、各標的化アームは、評価されている集団の被験体において多型でない配列にハイブリダイズする(例えば、相補的である)ように設計される。これにより、すべての対立遺伝子に対して標的配列が捕捉されることおよび/または配列決定されることが可能になり、被験体間(例えば、1つ以上の遺伝子座に対するヘテロ接合またはホモ接合のコール間)の差は、本明細書中に記載されるような配列情報および/または頻度に基づき得る。
配列タグ(バーコードとも呼ばれる)は、プローブ内またはプローブのファミリー内の他の位置に出現しないという点において独特であるように設計され得、また、それらは、標的にされている配列内にも出現しないことが認識されるだろう。ゆえに、それらを用いることにより、他の特徴を有する(例えば、特定の被験体および/または特定の遺伝子座に対して)特定のプローブを一義的に同定することができる(例えば、シークエンシングまたはハイブリダイゼーション特性によって)。
いくつかの実施形態において、プローブもしくはプローブの領域または他の核酸は、ある特定の配列または配列の特徴(例えば、長さ、他の特性など)を含む(comprising)かまたは含む(including)と本明細書中に記載されることも認識されるだろう。しかしながら、いくつかの実施形態では、それらの実施形態のいずれかの文脈において、プローブもしくはプローブの領域または他の核酸のいずれもが、それらの領域(例えば、アーム、中央領域、タグ、プライマー部位など、またはそれらの任意の組み合わせ)からなるか、またはそれらの配列からなるか、または本明細書中に記載されるような1つ以上の特徴(例えば、長さまたは他の特性など)からなる特徴を有する配列を有する(例えば、タイリングプローブもしくはずらされたプローブ、タグ化されたプローブ、長さの検出、感度増強アルゴリズムまたはそれらの任意の組み合わせについて)ことが認識されるだろう。
本明細書中で設計されるかまたは使用されるプローブ、プライマーおよび他の核酸は、合成のもの、天然のものまたはそれらの組み合わせであり得ることが認識されるだろう。したがって、本明細書中で使用されるとき、用語「核酸」とは、複数の連結されたヌクレオチド(すなわち、ピリミジン(例えば、シトシン(C)、チミジン(T)またはウラシル(U))またはプリン(例えば、アデニン(A)またはグアニン(G))である交換可能な有機塩基に連結された糖(例えば、リボースまたはデオキシリボース)を含む分子)のことを指す。「核酸」および「核酸分子」は、交換可能に使用され得、それらは、オリゴリボヌクレオチドならびにオリゴデオキシリボヌクレオチドのことを指す。これらの用語は、ポリヌクレオシド(すなわち、ポリヌクレオチドからリン酸を引いたもの)および他の任意の有機塩基を含む核酸も含むものとする。それらの有機塩基には、アデニン、ウラシル、グアニン、チミン、シトシンおよびイノシンが含まれる。別段述べられない限り、核酸は、一本鎖または二本鎖であり得る。その核酸は、天然に存在するものまたは天然に存在しないものであり得る。核酸は、自然源から得ることができるか、または核酸合成装置を用いて合成され得る(すなわち、合成のものであり得る)。核酸の回収および単離は、当該分野において通例のとおり行われ、適当な方法は、標準的な分子生物学の教科書に見られる(例えば、Maniatis’ Handbook of Molecular Biologyを参照のこと)。核酸は、DNAまたはRNA(例えば、ゲノムDNA、ミトコンドリアDNA、mRNA、cDNA、rRNA、miRNAまたはそれらの組み合わせ)であり得る。天然に存在しない核酸(例えば、細菌人工染色体(BAC)および酵母人工染色体(YAC))も使用され得る。
本発明は、核酸誘導体の使用も企図する。本明細書中に記載されるように、ある特定の核酸誘導体の使用は、特にそれらがヌクレアーゼを含み得る生物学的サンプルに曝露されたときの、それらの消化を防ぐことによって、本発明の核酸の安定性を高め得る。本明細書中で使用されるとき、核酸誘導体は、天然に存在しない核酸またはその単位である。核酸誘導体は、天然に存在しないエレメント(例えば、天然に存在しないヌクレオチドおよび天然に存在しない骨格結合(backbone linkages))を含み得る。
核酸誘導体は、骨格修飾(例えば、ホスホロチオエート結合、ホスホジエステル修飾された核酸、ホスホロチオレート修飾、ホスホジエステル核酸とホスホロチオエート核酸との組み合わせ、メチルホスホネート、アルキルホスホネート、リン酸エステル、アルキルホスホノチオエート、ホスホルアミデート、カルバメート、カーボネート、リン酸トリエステル、アセトアミデート、カルボキシメチルエステル、メチルホスホロチオエート、ホスホロジチオエート、p−エトキシおよびそれらの組み合わせであるがこれらに限定されない)を含み得る。核酸の骨格の組成は、均一または不均一であり得る。
核酸誘導体は、糖および/または塩基における置換または修飾を含み得る。例えば、核酸誘導体は、3’位にヒドロキシル基以外および5’位にリン酸基以外の低分子量の有機基に共有結合した骨格の糖(例えば、2’−O−アルキル化されたリボース基)を有する核酸を含む。核酸誘導体は、アラビノースなどの非リボース糖を含み得る。核酸誘導体は、置換プリンおよび置換ピリミジン(例えば、C−5プロピンで修飾された塩基、5−メチルシトシン、2−アミノプリン、2−アミノ−6−クロロプリン、2,6−ジアミノプリン、ヒポキサンチン、2−チオウラシルおよびシュードイソシトシン(pseudoisocytosine))を含み得る。いくつかの実施形態において、置換は、糖/塩基、塩基に結合した基(ビオチン、蛍光基(フルオレセイン、シアニン、ローダミンなど)、化学的に反応性の基(カルボキシル、NHS、チオールなどを含む)を含む)またはそれらの任意の組み合わせにおける1つ以上の置換/修飾を含み得る。
核酸は、ペプチド核酸(PNA)、ロックト(locked)核酸(LNA)、DNA、RNAまたはそれらの共核酸(co−nucleic acids)(例えば、DNA−LNA共核酸)であり得る。PNAは、グリシンアミノ窒素およびメチレンカルボニルリンカーを介してヌクレオチド塩基に連結された2−アミノエチルグリシン残基で置き換えられたリン酸骨格を有するDNAアナログである。PNAは、ワトソン−クリック塩基対形成によってDNA標的とRNA標的の両方に結合し得、その際、場合によっては、DNAまたはRNAに基づくオリゴヌクレオチドを用いて形成され得るハイブリッドよりも強いハイブリッドを形成し得る。
PNAは、ペプチド結合によって接続されるモノマーから合成される(Nielsen,P.E.ら、Peptide Nucleic Acids,Protocols and Applications,Norfolk:Horizon Scientific Press,p.1−19(1999))。それらのモノマーは、標準的な固相ペプチド合成法を用いて作製され得る。PNAの化学および合成によって、PNAの設計においてアミノ酸およびポリペプチド配列を含めることが可能になる。例えば、リジン残基を用いることにより、PNA骨格に正電荷が導入され得る。アミノ酸側鎖の修飾のために利用可能なすべての化学的アプローチが、PNAに対して直接、適用可能である。いくつかのタイプのPNAのデザインが存在し、これらには、一本鎖PNA(ssPNA)、bisPNAおよび偽相補(pseudocomplementary)PNA(pcPNA)が含まれる。
PNA/DNA複合体の構造は、特定のPNAおよびその配列に依存する。ssPNAは、好ましくは、逆平行の向きで(すなわち、ssPNAのN末端がssDNAの3’末端と整列するように)、かつワトソン−クリック対形成によって、一本鎖DNA(ssDNA)に結合する。PNAはまた、フーグスティーン塩基対形成によってDNAに結合し得、それにより、二本鎖DNA(dsDNA)と三重鎖を形成し得る(Wittung,P.ら、Biochemistry 36:7973(1997))。
ロックト核酸(LNA)は、改変されたRNAヌクレオチドである。LNAは、DNAとハイブリッドを形成し、そのハイブリッドは、PNA/DNAハイブリッドと少なくとも同程度に安定である(Braasch,D.A.ら、Chem & Biol.8(1):1−7(2001))。それゆえ、LNAは、PNA分子であり得るように使用され得る。LNAの結合効率は、正電荷をLNAに付加することによって、いくつかの実施形態において高まり得る。LNAは、本質的に高い結合親和性を有すると報告されている。
市販の核酸合成装置および標準的なホスホルアミダイト化学を用いることにより、LNAが作製される。それゆえ、混合性のLNA/DNA配列の作製は、混合性のPNA/ペプチド配列の作製と同程度に簡便である。LNAモノマーの安定化の効果は、相加効果ではない。LNAモノマーは、隣接するデオキシヌクレオチドの糖環のコンフォメーションに影響し、その隣接するデオキシヌクレオチドの糖環をより安定な配置に変える(Nielsen,P.E.ら、Peptide Nucleic Acids,Protocols and Applications,Norfolk:Horizon Scientific Press,p.1−19(1999))。また、配列内のLNA残基がより少ないことにより、合成の正確度は劇的に改善される。核酸を結合体化するための生化学的なアプローチのほとんどが、LNA/DNA構築物に適用可能である。
これらおよび他の本発明の局面は、以下の非限定的な例によって例証される。
以下の実施例は、本発明の非限定的な実施形態を例証するものである。
実施例1:ヒト標的エキソン用の捕捉プローブセットの設計
すべての標的が、部分的に重複するサブターゲットのセットとして捕捉される。例えば、タイリングアプローチにおいて、200bpの標的エキソンは、12個のサブターゲット(各々60bp長)のセットとして捕捉され得る(図1)。各サブターゲットは、他の2または3つの標的と部分的に重複するように選択される。
すべての標的が、部分的に重複するサブターゲットのセットとして捕捉される。例えば、タイリングアプローチにおいて、200bpの標的エキソンは、12個のサブターゲット(各々60bp長)のセットとして捕捉され得る(図1)。各サブターゲットは、他の2または3つの標的と部分的に重複するように選択される。
いくつかの実施形態において、すべてのプローブが、3つの領域:1)サブターゲットからすぐ上流とハイブリダイズする配列を含む20bpの「標的化アーム」、2)増幅プライミング部位の対として使用される配列を含む30bpの「定常領域」、および3)サブターゲットからすぐ下流とハイブリダイズする配列を含む第2の20bpの「標的化アーム」から構成される。標的化アームの配列は、セット内の捕捉プローブごとに異なるが、定常領域の配列は、そのセット内のすべてのプローブについて同じであることから、すべての捕捉された標的を単一のプライマーセットで増幅することが可能である。標的化アームの配列は、20bp配列の任意の所与の対が標的ゲノム内で独特であるように(望まれない部位の偽の捕捉を防止するように)設計されるべきである。さらに、融解温度は、ハイブリダイゼーション効率が一定温度(例えば、60℃)においてすべてのプローブについて均一になるように、そのセット内のすべてのプローブに対して一致させるべきである。ゲノム標的と塩基対形成する能力を損ない得る強い二次構造を形成しないことを確実にするために、標的化アームの配列は、計算的にスクリーニングされるべきである。
ヒトゲノムサンプルへの捕捉プローブのハイブリダイズ
ハイブリダイゼーション反応物を組み立てる:
・1.0μlの捕捉プローブ混合物(約2.5pmol)
・2.0μlの10×Ampligase緩衝液(Epicentre)
・6.0μlの500ng/μlヒトゲノムDNA(約16.7fmol)
・11μlのdH2O 。
ハイブリダイゼーション反応物を組み立てる:
・1.0μlの捕捉プローブ混合物(約2.5pmol)
・2.0μlの10×Ampligase緩衝液(Epicentre)
・6.0μlの500ng/μlヒトゲノムDNA(約16.7fmol)
・11μlのdH2O 。
サーマルサイクラーにおいて、ゲノムDNAを変性するために95℃にて5分間の加熱反応を行い、次いで、60℃に冷却する。60℃にて40時間インキュベートする。
ハイブリダイズされたプローブを、サブターゲットを含む共有結合的に閉じた環状産物に変換する
充填/ライゲーション反応混合物を調製する:
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
充填/ライゲーション反応混合物を調製する:
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
1.0μlのこの混合物をハイブリダイズされたプローブ反応物に加え、60℃で10時間インキュベートする。
環状化されたプローブ/サブターゲット産物を未反応のプローブおよびゲノムDNAから精製する
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
37℃で60分間インキュベート(Incubte)し、次いで、80℃で15分間インキュベートすることによって熱失活させる。貯蔵のために、直ちに4℃に冷却する。
プローブの「定常領域」に特異的なプライマーを用いてPCRによって環状材料を増幅する
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA(5’−GCACGATCCGACGGTAGTGT−3’)(配列番号183)
・1.5μlの10μM CP−2−RA(5’−CCGTAATCGGGAAGCTGAAG−3’)(配列番号184)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA(5’−GCACGATCCGACGGTAGTGT−3’)(配列番号183)
・1.5μlの10μM CP−2−RA(5’−CCGTAATCGGGAAGCTGAAG−3’)(配列番号184)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
以下のプロトコルに従ってリアルタイムサーマルサイクラーにおいて熱サイクル反応を行うが、増幅の収量がプラトーに達する前にサイクル反応を停止する(通常、8〜12サイクル):
1.95℃で5分間
2.95℃で30秒間
3.58℃で60秒間
4.72℃で60秒間
5.2に戻り、さらにN回 。
1.95℃で5分間
2.95℃で30秒間
3.58℃で60秒間
4.72℃で60秒間
5.2に戻り、さらにN回 。
分析にむけて、ショットガン次世代シークエンシングライブラリーを調製する。
・ゲル抽出によって、所望のアンプリコン集団を非特異的な増幅産物から精製する。
・アンプリコンを、剪断に適した高分子量産物にコンカテマー化(Concatemerize)する。
・噴霧器、BioRuptor、Hydroshear、Covarisまたは類似の装置を用いて機械的に剪断する。DNAは、数百塩基対の長さのフラグメントに剪断されるだろう。
・使用されるシークエンシングプラットフォームによる増幅に必要なアダプターをライゲートする。必要であれば、ライゲートされた産物をライゲートされていない産物およびアダプターから精製する。
・ゲル抽出によって、所望のアンプリコン集団を非特異的な増幅産物から精製する。
・アンプリコンを、剪断に適した高分子量産物にコンカテマー化(Concatemerize)する。
・噴霧器、BioRuptor、Hydroshear、Covarisまたは類似の装置を用いて機械的に剪断する。DNAは、数百塩基対の長さのフラグメントに剪断されるだろう。
・使用されるシークエンシングプラットフォームによる増幅に必要なアダプターをライゲートする。必要であれば、ライゲートされた産物をライゲートされていない産物およびアダプターから精製する。
実施例2:エキソン標的セットのMIP捕捉反応においてバイアスを検出するためおよび補正するための識別タグ配列の使用
検出/補正を行う際の第1工程は、所与のサンプルについてどれだけ多くの識別タグ配列が必要であるかを決定することである。この実施例では、1000個のエキソンに対応する1000個のゲノム標的を捕捉した。識別タグ配列は、プローブの一部であるので、1番最初のプロトコル工程から生じるバイアスを測定/報告する。また、識別タグ配列は、骨格に位置するので、別個のプライミング部位から容易に配列決定され得、ゆえに、標的の配列決定に対する達成可能な総リード長に影響を及ぼさない。MIPプローブは、かなり多数の販売業者(例えば、IDT)によって、標準的なカラムベースのオリゴヌクレオチド合成法を用いて合成され、識別タグ配列は、その骨格内の「縮重」位置として導入される。各縮重位置は、合成される識別タグ配列の総数を4倍増加させるので、10ntの縮重領域は、約le6種という識別タグ配列の複雑度を意味する。
検出/補正を行う際の第1工程は、所与のサンプルについてどれだけ多くの識別タグ配列が必要であるかを決定することである。この実施例では、1000個のエキソンに対応する1000個のゲノム標的を捕捉した。識別タグ配列は、プローブの一部であるので、1番最初のプロトコル工程から生じるバイアスを測定/報告する。また、識別タグ配列は、骨格に位置するので、別個のプライミング部位から容易に配列決定され得、ゆえに、標的の配列決定に対する達成可能な総リード長に影響を及ぼさない。MIPプローブは、かなり多数の販売業者(例えば、IDT)によって、標準的なカラムベースのオリゴヌクレオチド合成法を用いて合成され、識別タグ配列は、その骨格内の「縮重」位置として導入される。各縮重位置は、合成される識別タグ配列の総数を4倍増加させるので、10ntの縮重領域は、約le6種という識別タグ配列の複雑度を意味する。
捕捉プローブをヒトゲノムサンプルにハイブリダイズする
ハイブリダイゼーション反応物を組み立てる:
・1.0μlの捕捉プローブ混合物(約2.5pmol)
・2.0μlの10×Ampligase緩衝液(Epicentre)
・6.0μlの500ng/μlヒトゲノムDNA(約16.7fmol)
・11μlのdH2O 。
ハイブリダイゼーション反応物を組み立てる:
・1.0μlの捕捉プローブ混合物(約2.5pmol)
・2.0μlの10×Ampligase緩衝液(Epicentre)
・6.0μlの500ng/μlヒトゲノムDNA(約16.7fmol)
・11μlのdH2O 。
サーマルサイクラーにおいて、ゲノムDNAを変性するために95℃にて5分間の加熱反応を行い、次いで、60℃に冷却する。60℃にて40時間インキュベートする。
ハイブリダイズされたプローブを、サブターゲットを含む共有結合的に閉じた環状産物に変換する。
充填/ライゲーション反応混合物を調製する:
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
1.0μlのこの混合物をハイブリダイズされたプローブ反応物に加え、60℃で10時間インキュベートする。
環状化されたプローブ/サブターゲット産物を未反応のプローブおよびゲノムDNAから精製する
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
37℃で60分間インキュベートし、次いで、80℃で15分間インキュベートすることによって熱失活させる。貯蔵のために、直ちに4℃に冷却する。
プローブの「定常領域」に特異的なプライマーを用いてPCRによって環状材料を増幅する
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA(5’−GCACGATCCGACGGTAGTGT−3’)(配列番号183)
・1.5μlの10μM CP−2−RA(5’−CCGTAATCGGGAAGCTGAAG−3’)(配列番号184)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA(5’−GCACGATCCGACGGTAGTGT−3’)(配列番号183)
・1.5μlの10μM CP−2−RA(5’−CCGTAATCGGGAAGCTGAAG−3’)(配列番号184)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
以下のプロトコルに従ってリアルタイムサーマルサイクラーにおいて熱サイクル反応を行うが、増幅の収量がプラトーに達する前にサイクル反応を停止する(通常、8〜12サイクル):
6.95℃で5分間
7.95℃で30秒間
8.58℃で60秒間
9.72℃で60秒間
10.2に戻り、さらにN回 。
6.95℃で5分間
7.95℃で30秒間
8.58℃で60秒間
9.72℃で60秒間
10.2に戻り、さらにN回 。
分析にむけて、ショットガン次世代シークエンシングライブラリーを調製する。
・ゲル抽出によって、所望のアンプリコン集団を非特異的な増幅産物から精製する。
・アンプリコンを、剪断に適した高分子量産物にコンカテマー化する。
・噴霧器、BioRuptor、Hydroshear、Covarisまたは類似の装置を用いて機械的に剪断する。DNAは、数百塩基対の長さ(lenth)のフラグメントに剪断されるだろう。
・使用されるシークエンシングプラットフォームによる増幅に必要なアダプターをライゲートする。必要であれば、ライゲートされた産物をライゲートされていない産物およびアダプターから精製する。
・ゲル抽出によって、所望のアンプリコン集団を非特異的な増幅産物から精製する。
・アンプリコンを、剪断に適した高分子量産物にコンカテマー化する。
・噴霧器、BioRuptor、Hydroshear、Covarisまたは類似の装置を用いて機械的に剪断する。DNAは、数百塩基対の長さ(lenth)のフラグメントに剪断されるだろう。
・使用されるシークエンシングプラットフォームによる増幅に必要なアダプターをライゲートする。必要であれば、ライゲートされた産物をライゲートされていない産物およびアダプターから精製する。
製造者の説明書(例えば、Illumina、ABIなど)に従ってライブラリーのシークエンシングを行い、標的配列と識別タグ配列の両方を読み取る
識別タグ配列の存在量を定量化することによって検出される任意のバイアスについて補正することによってデータを分析する
リードデータから標的:識別タグの存在量の表を構築する、例えば:
識別タグ配列の存在量を定量化することによって検出される任意のバイアスについて補正することによってデータを分析する
リードデータから標的:識別タグの存在量の表を構築する、例えば:
実施例3:MIP捕捉反応用の識別タグ配列の設計
ある標的のセットに対して、ある特定の識別タグ配列がある特定の標的配列との組み合わせにおいて2回以上偶然に観察されないと信頼できる(いくつかの統計的限界内で)ために必要な識別タグ配列の数を決定した。ある特定の長さの識別タグ配列に対する独特の識別タグ配列の総数は、4(識別タグ配列のヌクレオチドの長さ)と決定される。識別タグ配列を有するMIPプローブを用いる分子反転プローブ捕捉反応に対しては、捕捉反応を行い、同じ識別タグ配列を有する1以上のコピー数の標的配列を捕捉する確率は:p=1−[N!/(N−M)!]/[N^M]として計算され、式中、Nは、存在し得る独特の識別タグ配列の総数であり、Mは、捕捉反応における標的配列コピーの数である。よって、識別タグ配列の長さを変化させることによって、同じ識別タグ配列を有する1以上のコピー数の標的配列を捕捉する確率が所定の確率の値に設定されたMIP捕捉反応を行うことが可能である。
ある標的のセットに対して、ある特定の識別タグ配列がある特定の標的配列との組み合わせにおいて2回以上偶然に観察されないと信頼できる(いくつかの統計的限界内で)ために必要な識別タグ配列の数を決定した。ある特定の長さの識別タグ配列に対する独特の識別タグ配列の総数は、4(識別タグ配列のヌクレオチドの長さ)と決定される。識別タグ配列を有するMIPプローブを用いる分子反転プローブ捕捉反応に対しては、捕捉反応を行い、同じ識別タグ配列を有する1以上のコピー数の標的配列を捕捉する確率は:p=1−[N!/(N−M)!]/[N^M]として計算され、式中、Nは、存在し得る独特の識別タグ配列の総数であり、Mは、捕捉反応における標的配列コピーの数である。よって、識別タグ配列の長さを変化させることによって、同じ識別タグ配列を有する1以上のコピー数の標的配列を捕捉する確率が所定の確率の値に設定されたMIP捕捉反応を行うことが可能である。
例えば、15ヌクレオチド長の識別タグ配列に対しては、1,073,741,824個の識別タグ配列が存在し得る。各々が15ヌクレオチドの識別タグ配列を有するMIPプローブが10000コピーの標的配列(例えば、ゲノム等価物)と組み合わされるMIP捕捉反応において、同じ識別タグ配列を有する1以上のコピー数の標的配列を捕捉する確率は、0.05である。この例では、MIP反応は、複数コピーが同じ識別タグ配列でタグ化された標的をほとんど生成しない(通常0個であるが、たまに1個またはそれ以上)。図6は、15ヌクレオチドの識別タグ配列を有する100000個の捕捉反応および10000個の標的配列に対するシミュレーションの結果を示している。
実施例4:シークエンシングカバレッジの関数としての、複数の独立した遺伝子座において正確なベースコールを行うのに十分なシークエンシングリードを得るための確率の評価
シークエンシングカバレッジの必要条件を決定するために、モンテカルロシミュレーションを行った。このシミュレーションは、所与の遺伝子座(標的)の10000ゲノムコピー(半数が母系対立遺伝子であり、半数が父系対立遺伝子である)を仮定する。このシミュレーションは、さらに、MIP反応について1%の捕捉効率を仮定する。このシミュレーションは、ある捕捉混合物から100回、非復元抽出することにより、100個の捕捉産物のセットを得る。次いで、このシミュレーションは、その100個の捕捉産物のセットから復元抽出することにより(偏りのない増幅と仮定して)、母系または父系から「リード」を生成する。標本抽出されるリードの数は、カバレッジに依存する。次いで、高精度のベースコールを行うために必要な母系と父系の両方からの独立したリードの数(10または20リードと仮定される)を測定した。このプロセスを各カバレッジレベルについて1000回繰り返し、両方の親からの十分なリードが首尾よく得られる回数の割合を測定した。成功したベースコールを得るはずの1000個の独立した遺伝子座を有すると仮定して、この割合を1000乗し、プロットした(図7を参照のこと)。結果は、>0.95の確率で各対立遺伝子を>=10×捕捉するためにはおよそ50×カバレッジが必要であるということを示している。
シークエンシングカバレッジの必要条件を決定するために、モンテカルロシミュレーションを行った。このシミュレーションは、所与の遺伝子座(標的)の10000ゲノムコピー(半数が母系対立遺伝子であり、半数が父系対立遺伝子である)を仮定する。このシミュレーションは、さらに、MIP反応について1%の捕捉効率を仮定する。このシミュレーションは、ある捕捉混合物から100回、非復元抽出することにより、100個の捕捉産物のセットを得る。次いで、このシミュレーションは、その100個の捕捉産物のセットから復元抽出することにより(偏りのない増幅と仮定して)、母系または父系から「リード」を生成する。標本抽出されるリードの数は、カバレッジに依存する。次いで、高精度のベースコールを行うために必要な母系と父系の両方からの独立したリードの数(10または20リードと仮定される)を測定した。このプロセスを各カバレッジレベルについて1000回繰り返し、両方の親からの十分なリードが首尾よく得られる回数の割合を測定した。成功したベースコールを得るはずの1000個の独立した遺伝子座を有すると仮定して、この割合を1000乗し、プロットした(図7を参照のこと)。結果は、>0.95の確率で各対立遺伝子を>=10×捕捉するためにはおよそ50×カバレッジが必要であるということを示している。
実施例5:「標的」遺伝子座および「コントロール」遺伝子座のMIP捕捉
いくつかの実施形態において、標的遺伝子座の捕捉効率を正確に定量化するために、様々な長さの標的遺伝子座に対する代理として働くと経験的に示されている少なくとも3セットのコントロール遺伝子座を並行して捕捉する。例えば、標的遺伝子座が、50〜1000bpの長さを有すると予想される場合、50、250および1000bpの長さを有するコントロール遺伝子座のセットが捕捉され得(例えば、1セットあたり20個の遺伝子座が外れ値からの妥当な保護をもたらすはずである)、それらの存在量がシークエンシングによってデジタル方式で測定され得る。これらの遺伝子座は、サンプル間の効率の変動および同じサンプルの複数のランにおける効率の変動が最小であることが観察されるように(ゆえに、「一定の効率」であるように)、選択されるべきである。これらは、存在量−対−長さの曲線の形状を定義する「参照」点として働き得る。次いで、標的の長さを決定することは、単に、検量線上の適切な点から長さを「読む」ことである。
いくつかの実施形態において、標的遺伝子座の捕捉効率を正確に定量化するために、様々な長さの標的遺伝子座に対する代理として働くと経験的に示されている少なくとも3セットのコントロール遺伝子座を並行して捕捉する。例えば、標的遺伝子座が、50〜1000bpの長さを有すると予想される場合、50、250および1000bpの長さを有するコントロール遺伝子座のセットが捕捉され得(例えば、1セットあたり20個の遺伝子座が外れ値からの妥当な保護をもたらすはずである)、それらの存在量がシークエンシングによってデジタル方式で測定され得る。これらの遺伝子座は、サンプル間の効率の変動および同じサンプルの複数のランにおける効率の変動が最小であることが観察されるように(ゆえに、「一定の効率」であるように)、選択されるべきである。これらは、存在量−対−長さの曲線の形状を定義する「参照」点として働き得る。次いで、標的の長さを決定することは、単に、検量線上の適切な点から長さを「読む」ことである。
いくつかの実施形態において、この方法からの標的の長さの推定における統計学的信頼度は、主として3つの因子:1)検量線を作成するために使用される存在量データの再現性/変動;2)「コントロール」データポイントに対する回帰の適合度;3)測定されている標的遺伝子座に対する存在量データの再現性によって動かされる。1)および2)における統計的限度は、アッセイを構築する際に測定されているので、あらかじめ判明している。さらに、適切な集団のサンプリングおよび技術的な再現性の測定がアッセイの構築に含まれているはずであるので、3)における統計的限度も、通常あらかじめ判明している。これらの3つの測定を、標的存在量の任意の所与の実験に基づく測定に対する単一のP値に統合するために標準的な統計学的方法が用いられるべきである。
いくつかの実施形態において、較正の観察結果のセットおよびそのデータに対する線形回帰の当てはめが与えられる場合、回帰を用いることにより、長さが不明の標的遺伝子座のn回の観察結果に対して長さの値を予測することができる。まず、長さの推定値の信頼区間に対する許容可能な範囲を選択する。例えば、脆弱Xの「正常」症例(87〜93bp)を「前変異」(165〜600bp)の潜在的な症例と識別する場合、目標は、93bpを165bpと識別するのに十分な精度で長さを測定することである。n回の観察結果が回帰直線(regressed line)に対する方程式に代入されたときにコンピュータで計算される反応の予測値は、任意精度を有し得る。しかしながら、例えば、95%信頼水準が望まれる場合、95%信頼区間は、「正常」の長さの範囲と「前変異」の長さの範囲の両方と重複しない程度に十分短くなければならない。例を続けると、較正データからの回帰に基づいてn=400のMIP観察結果から190という長さが計算される場合、95%信頼区間は、190+/−20bpであり、そのサンプルが95%の確実性で「前変異」の長さを表すと結論づけられ得る。逆に、較正データがそれほどロバストでない場合、その回帰のエラー推定値はより高いことがあり、予測される反応値に対してより広い信頼区間がもたらされる。いくつかの実施形態において、95%CIが、n=400から190+/−100bpと計算される場合、予測される反応値が「正常」の長さに対応するかまたは「前変異」の長さに対応するかを決定できない可能性がある。
いくつかの実施形態において、予測される反応に対する信頼区間は、以下のとおり計算される:
反応に対する推定値
反応に対する推定値
いくつかの実施形態において、目的の遺伝子座を分析するための手法は、以下の工程を含み得る。
ハイブリダイズされたプローブを、サブターゲットを含む共有結合的に閉じた環状産物に変換する。
充填/ライゲーション反応混合物を調製する:
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
1.0μlのこの混合物をハイブリダイズされたプローブ反応物に加え、60℃で10時間インキュベートする。
環状化されたプローブ/サブターゲット産物を未反応のプローブおよびゲノムDNAから精製する
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
37℃で60分間インキュベートし、次いで、80℃で15分間インキュベートすることによって熱失活させる。貯蔵のために、直ちに4℃に冷却する。
プローブの「定常領域」に特異的なプライマーを用いてPCRによって環状材料を増幅する
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA−Ilmn(プラットフォーム特異的増幅配列+「環定常領域」特異的配列)
・1.5μlの10μM CP−2−RA−Ilmn(プラットフォーム特異的増幅配列+「環定常領域」特異的配列)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA−Ilmn(プラットフォーム特異的増幅配列+「環定常領域」特異的配列)
・1.5μlの10μM CP−2−RA−Ilmn(プラットフォーム特異的増幅配列+「環定常領域」特異的配列)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
以下のプロトコルに従ってリアルタイムサーマルサイクラーにおいて熱サイクル反応を行うが、増幅の収量がプラトーに達する前にサイクル反応を停止する(通常、8〜12サイクル):
11.95℃で5分間
12.95℃で30秒間
13.58℃で60秒間
14.72℃で60秒間
15.2に戻り、さらにN回 。
11.95℃で5分間
12.95℃で30秒間
13.58℃で60秒間
14.72℃で60秒間
15.2に戻り、さらにN回 。
製造者の指示書(例えば、Illumina、ABI)に従ってデジタル定量化用のサンプルにおいてシークエンシング(例えば、次世代シークエンシング)を行う。
実施例6:エキソン標的核酸セットのMIP捕捉反応
MIPプローブは、かなり多数の販売業者(例えば、IDT)によって、標準的なカラムベースのオリゴヌクレオチド合成法を用いて合成される。
MIPプローブは、かなり多数の販売業者(例えば、IDT)によって、標準的なカラムベースのオリゴヌクレオチド合成法を用いて合成される。
捕捉プローブをヒトゲノムサンプルにハイブリダイズする
ハイブリダイゼーション反応物を組み立てる:
・1.0μlの捕捉プローブ混合物(約2.5pmol)
・2.0μlの10×Ampligase緩衝液(Epicentre)
・6.0μlの500ng/μlヒトゲノムDNA(約16.7fmol)
・11μlのdH2O 。
ハイブリダイゼーション反応物を組み立てる:
・1.0μlの捕捉プローブ混合物(約2.5pmol)
・2.0μlの10×Ampligase緩衝液(Epicentre)
・6.0μlの500ng/μlヒトゲノムDNA(約16.7fmol)
・11μlのdH2O 。
サーマルサイクラーにおいて、ゲノムDNAを変性するために95℃にて5分間の加熱反応を行い、次いで、60℃に冷却する。60℃にて40時間インキュベートする。
ハイブリダイズされたプローブを、標的核酸を含む共有結合的に閉じた環状産物に変換する。
充填/ライゲーション反応混合物を調製する:
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
1.0μlのこの混合物をハイブリダイズされたプローブ反応物に加え、60℃で10時間インキュベートする。
環状化されたプローブ/標的核酸産物を未反応のプローブおよびゲノムDNAから精製する
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
37℃で60分間インキュベートし、次いで、80℃で15分間インキュベートすることによって熱失活させる。貯蔵のために、直ちに4℃に冷却する。
プローブの「定常領域」に特異的なプライマーを用いてPCRによって環状材料を増幅する
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA(5’−GCACGATCCGACGGTAGTGT−3’)(配列番号183)
・1.5μlの10μM CP−2−RA(5’−CCGTAATCGGGAAGCTGAAG−3’)(配列番号184)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA(5’−GCACGATCCGACGGTAGTGT−3’)(配列番号183)
・1.5μlの10μM CP−2−RA(5’−CCGTAATCGGGAAGCTGAAG−3’)(配列番号184)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
以下のプロトコルに従ってリアルタイムサーマルサイクラーにおいて熱サイクル反応を行うが、増幅の収量がプラトーに達する前にサイクル反応を停止する(通常、8〜12サイクル):
16.95℃で5分間
17.95℃で30秒間
18.58℃で60秒間
19.72℃で60秒間
20.2に戻り、さらにN回 。
16.95℃で5分間
17.95℃で30秒間
18.58℃で60秒間
19.72℃で60秒間
20.2に戻り、さらにN回 。
分析にむけて、ショットガン次世代シークエンシングライブラリーを調製する
・ゲル抽出によって、所望のアンプリコン集団を非特異的な増幅産物から精製する。
・アンプリコンを、剪断に適した高分子量産物にコンカテマー化する。
・噴霧器、BioRuptor、Hydroshear、Covarisまたは類似の装置を用いて機械的に剪断する。DNAは、数百塩基対の長さのフラグメントに剪断されるだろう。
・使用されるシークエンシングプラットフォームによる増幅に必要なアダプターをライゲートする。必要であれば、ライゲートされた産物をライゲートされていない産物およびアダプターから精製する。
・ゲル抽出によって、所望のアンプリコン集団を非特異的な増幅産物から精製する。
・アンプリコンを、剪断に適した高分子量産物にコンカテマー化する。
・噴霧器、BioRuptor、Hydroshear、Covarisまたは類似の装置を用いて機械的に剪断する。DNAは、数百塩基対の長さのフラグメントに剪断されるだろう。
・使用されるシークエンシングプラットフォームによる増幅に必要なアダプターをライゲートする。必要であれば、ライゲートされた産物をライゲートされていない産物およびアダプターから精製する。
製造者の説明書(例えば、Illumina、ABIなど)に従ってライブラリーのシークエンシングを行い、標的配列を読み取ることにより、標的核酸の存在量を測定する。
実施例7:1000個の標的のセットの遺伝子タイピングを行うためのMIP、ハイブリダイゼーションおよび変異検出MIPの使用
MIP、ハイブリダイゼーションおよび変異検出MIPを用いることにより、1000個の標的のセットの遺伝子タイピングを行う。このプロトコルによって、50個の特定の公知の点変異のうちのいずれかの検出が可能になる。
MIP、ハイブリダイゼーションおよび変異検出MIPを用いることにより、1000個の標的のセットの遺伝子タイピングを行う。このプロトコルによって、50個の特定の公知の点変異のうちのいずれかの検出が可能になる。
まず、MIP、ハイブリダイゼーションおよび変異検出MIPの別個の反応を生物学的サンプルにおいて行う。MIP捕捉反応は、本質的にはTurnerら、2009,Nature methods 6:315−6に記載されているように行う。MIPのセットは、そのセット内の各プローブが1000個の標的のうちの1つと隣接するように設計される。別個に、ハイブリダイゼーション濃縮反応は、Agilent SureSelect手順を用いて行われる。選択の前に、Illuminaの「Fragment Library」キットおよびプロトコルを用いて、濃縮されるゲノムDNAをショットガンシークエンシングライブラリーに変換する。Agilentのウェブインターフェースを用いることにより、標的核酸にハイブリダイズし得るプローブのセットを設計する。別個に、変異(例えば、特定の多型)が存在する場合のみMIPを形成し得るプローブのセットを設計する(変異検出MIP)。各変異検出MIPは、単一の公知の変異に特異的な最も3’側の塩基の同一性を有する。この変異検出MIPのセットを用いた反応を行うことにより、任意の変異対立遺伝子の存在が選択的に検出される。
3つすべての反応が行われたら、2つのMIP反応物を、単一のチューブに混合し(例えば、変異検出の感度をさらに高めるために潜在的に等モルでない比で)、1つのサンプルとして次世代DNAシークエンシング機器にかける。そのハイブリダイゼーション濃縮反応物を別個のサンプルとして次世代DNAシークエンシング機器にかける。各位置における総カバレッジ、その総カバレッジでの各リードの起源、各個別のリードの質のスコア、およびその領域と重複する変異特異的MIPから得られた任意のリードの存在(または非存在)を評価することによって標的セット内の各位置においてコンセンサス二倍体遺伝子型を形成するソフトウェアアルゴリズムによって、各「サンプル」からのリードを統合する。
前出の実施例は、非限定的なものであり、本発明の局面は、当業者(one or ordinary skill in the art)にとって利用可能な代替の手法および/またはプロトコルを用いて、本明細書中に記載されるように実行され得ることが認識されるだろう。
前述の説明および実施例に詳しく記載されているもの以外の方法が実施され得ることは明らかである。上記の教示に鑑みて、本開示の数多くの改変およびバリエーションが存在し得、ゆえに、それらは請求項の範囲内である。本開示の各局面の好ましい特徴は、必要な変更を加えた他の各局面と同様のものである。本明細書中で言及される特許、特許出願、学術論文または他の開示を含む書面は、それらの全体が本明細書によって参考として援用される。矛盾が生じる場合には、明らかな誤りの場合を除いて本願の開示が支配する。
Claims (1)
- 明細書に記載された発明。
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17447009P | 2009-04-30 | 2009-04-30 | |
US61/174,470 | 2009-04-30 | ||
US17892309P | 2009-05-15 | 2009-05-15 | |
US61/178,923 | 2009-05-15 | ||
US17935809P | 2009-05-18 | 2009-05-18 | |
US61/179,358 | 2009-05-18 | ||
US18208909P | 2009-05-28 | 2009-05-28 | |
US61/182,089 | 2009-05-28 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012508490A Division JP2012525147A (ja) | 2009-04-30 | 2010-04-30 | 遺伝マーカーを評価するための方法および組成物 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016000046A true JP2016000046A (ja) | 2016-01-07 |
Family
ID=43032733
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012508490A Pending JP2012525147A (ja) | 2009-04-30 | 2010-04-30 | 遺伝マーカーを評価するための方法および組成物 |
JP2015164811A Pending JP2016000046A (ja) | 2009-04-30 | 2015-08-24 | 遺伝マーカーを評価するための方法および組成物 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012508490A Pending JP2012525147A (ja) | 2009-04-30 | 2010-04-30 | 遺伝マーカーを評価するための方法および組成物 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11840730B1 (ja) |
EP (1) | EP2425240A4 (ja) |
JP (2) | JP2012525147A (ja) |
AU (1) | AU2010242073C1 (ja) |
CA (1) | CA2760439A1 (ja) |
IL (1) | IL216054A (ja) |
WO (1) | WO2010126614A2 (ja) |
Families Citing this family (80)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9085798B2 (en) | 2009-04-30 | 2015-07-21 | Prognosys Biosciences, Inc. | Nucleic acid constructs and methods of use |
CA2760439A1 (en) | 2009-04-30 | 2010-11-04 | Good Start Genetics, Inc. | Methods and compositions for evaluating genetic markers |
JP5893607B2 (ja) | 2010-04-05 | 2016-03-23 | プログノシス バイオサイエンシズ インコーポレイテッドPrognosys Biosciences,Inc. | 空間コード化生物学的アッセイ |
US20190300945A1 (en) | 2010-04-05 | 2019-10-03 | Prognosys Biosciences, Inc. | Spatially Encoded Biological Assays |
US10787701B2 (en) | 2010-04-05 | 2020-09-29 | Prognosys Biosciences, Inc. | Spatially encoded biological assays |
WO2012083225A2 (en) | 2010-12-16 | 2012-06-21 | Gigagen, Inc. | System and methods for massively parallel analysis of nycleic acids in single cells |
US9163281B2 (en) | 2010-12-23 | 2015-10-20 | Good Start Genetics, Inc. | Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction |
GB201106254D0 (en) | 2011-04-13 | 2011-05-25 | Frisen Jonas | Method and product |
CN103748236B (zh) | 2011-04-15 | 2018-12-25 | 约翰·霍普金斯大学 | 安全测序系统 |
AU2012281242B2 (en) | 2011-07-08 | 2016-12-22 | Keygene N.V. | Sequence based genotyping based on oligonucleotide ligation assays |
US9228233B2 (en) | 2011-10-17 | 2016-01-05 | Good Start Genetics, Inc. | Analysis methods |
WO2013112655A1 (en) * | 2012-01-24 | 2013-08-01 | Gigagen, Inc. | Method for correction of bias in multiplexed amplification |
ES2665071T3 (es) | 2012-02-17 | 2018-04-24 | Fred Hutchinson Cancer Research Center | Composiciones y métodos para identificar mutaciones de manera precisa |
US8209130B1 (en) | 2012-04-04 | 2012-06-26 | Good Start Genetics, Inc. | Sequence assembly |
US8812422B2 (en) | 2012-04-09 | 2014-08-19 | Good Start Genetics, Inc. | Variant database |
US10227635B2 (en) | 2012-04-16 | 2019-03-12 | Molecular Loop Biosolutions, Llc | Capture reactions |
WO2014070462A1 (en) | 2012-10-29 | 2014-05-08 | The Johns Hopkins University | Papanicolaou test for ovarian and endometrial cancers |
US8778609B1 (en) * | 2013-03-14 | 2014-07-15 | Good Start Genetics, Inc. | Methods for analyzing nucleic acids |
CA2907177A1 (en) * | 2013-03-15 | 2014-09-18 | Good Start Genetics, Inc. | Methods and compositions for evaluating genetic markers |
US10202629B2 (en) * | 2013-03-15 | 2019-02-12 | Aegea Biotechnologies, Inc. | Methods for amplification of nucleic acids utilizing clamp oligonucleotides |
EP2979168A4 (en) * | 2013-03-29 | 2016-11-23 | Univ Washington Ct Commerciali | SYSTEMS, ALGORITHMS AND SOFTWARE FOR THE DESIGN OF A MOLECULAR INVERSION PROBE (MIP) |
WO2014197377A2 (en) | 2013-06-03 | 2014-12-11 | Good Start Genetics, Inc. | Methods and systems for storing sequence read data |
WO2014210223A1 (en) | 2013-06-25 | 2014-12-31 | Prognosys Biosciences, Inc. | Spatially encoded biological assays using a microfluidic device |
US20150141257A1 (en) * | 2013-08-02 | 2015-05-21 | Roche Nimblegen, Inc. | Sequence capture method using specialized capture probes (heatseq) |
WO2015057565A1 (en) | 2013-10-18 | 2015-04-23 | Good Start Genetics, Inc. | Methods for assessing a genomic region of a subject |
US10851414B2 (en) * | 2013-10-18 | 2020-12-01 | Good Start Genetics, Inc. | Methods for determining carrier status |
US9824068B2 (en) | 2013-12-16 | 2017-11-21 | 10X Genomics, Inc. | Methods and apparatus for sorting data |
WO2015175530A1 (en) | 2014-05-12 | 2015-11-19 | Gore Athurva | Methods for detecting aneuploidy |
WO2015188192A2 (en) | 2014-06-06 | 2015-12-10 | Cornell University | Method for identification and enumeration of nucleic acid sequence, expression, copy, or dna methylation changes, using combined nuclease, ligase, polymerase, and sequencing reactions |
CN106575322B (zh) | 2014-06-26 | 2019-06-18 | 10X基因组学有限公司 | 核酸序列装配的方法和系统 |
WO2016040446A1 (en) | 2014-09-10 | 2016-03-17 | Good Start Genetics, Inc. | Methods for selectively suppressing non-target sequences |
EP3224595A4 (en) | 2014-09-24 | 2018-06-13 | Good Start Genetics, Inc. | Process control for increased robustness of genetic assays |
WO2016112073A1 (en) | 2015-01-06 | 2016-07-14 | Good Start Genetics, Inc. | Screening for structural variants |
CA2968417A1 (en) | 2015-01-13 | 2016-07-21 | 10X Genomics, Inc. | Systems and methods for visualizing structural variation and phasing information |
SG11201705996PA (en) | 2015-02-09 | 2017-09-28 | 10X Genomics Inc | Systems and methods for determining structural variation and phasing using variant call data |
ES2935860T3 (es) | 2015-04-10 | 2023-03-13 | Spatial Transcriptomics Ab | Análisis de ácidos nucleicos múltiplex, espacialmente distinguidos de especímenes biológicos |
US9422547B1 (en) | 2015-06-09 | 2016-08-23 | Gigagen, Inc. | Recombinant fusion proteins and libraries from immune cell repertoires |
EP3329014A2 (en) * | 2015-07-29 | 2018-06-06 | Progenity, Inc. | Systems and methods for genetic analysis |
CN108350500A (zh) | 2015-07-29 | 2018-07-31 | 普罗格尼迪公司 | 用于检测染色体异常的核酸和方法 |
US11286531B2 (en) | 2015-08-11 | 2022-03-29 | The Johns Hopkins University | Assaying ovarian cyst fluid |
US11081208B2 (en) | 2016-02-11 | 2021-08-03 | 10X Genomics, Inc. | Systems, methods, and media for de novo assembly of whole genome sequence data |
CN110392739B (zh) * | 2017-03-20 | 2024-01-16 | 张立峰 | 检测dna突变的测序方法 |
WO2018183942A1 (en) | 2017-03-31 | 2018-10-04 | Grail, Inc. | Improved library preparation and use thereof for sequencing-based error correction and/or variant identification |
US11519033B2 (en) | 2018-08-28 | 2022-12-06 | 10X Genomics, Inc. | Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample |
EP3894585A2 (en) | 2018-12-10 | 2021-10-20 | 10X Genomics, Inc. | Generating capture probes for spatial analysis |
US11926867B2 (en) | 2019-01-06 | 2024-03-12 | 10X Genomics, Inc. | Generating capture probes for spatial analysis |
US11649485B2 (en) | 2019-01-06 | 2023-05-16 | 10X Genomics, Inc. | Generating capture probes for spatial analysis |
WO2020191365A1 (en) | 2019-03-21 | 2020-09-24 | Gigamune, Inc. | Engineered cells expressing anti-viral t cell receptors and methods of use thereof |
EP3947718A4 (en) | 2019-04-02 | 2022-12-21 | Enumera Molecular, Inc. | METHODS, SYSTEMS AND COMPOSITIONS FOR COUNTING NUCLEIC ACID MOLECULES |
WO2020243579A1 (en) | 2019-05-30 | 2020-12-03 | 10X Genomics, Inc. | Methods of detecting spatial heterogeneity of a biological sample |
EP4055185A1 (en) | 2019-11-08 | 2022-09-14 | 10X Genomics, Inc. | Spatially-tagged analyte capture agents for analyte multiplexing |
EP4025711A2 (en) | 2019-11-08 | 2022-07-13 | 10X Genomics, Inc. | Enhancing specificity of analyte binding |
FI3891300T3 (fi) | 2019-12-23 | 2023-05-10 | 10X Genomics Inc | Menetelmät spatiaalista analyysiä varten rna-templatoitua ligaatiota käyttäen |
US11702693B2 (en) | 2020-01-21 | 2023-07-18 | 10X Genomics, Inc. | Methods for printing cells and generating arrays of barcoded cells |
US11732299B2 (en) | 2020-01-21 | 2023-08-22 | 10X Genomics, Inc. | Spatial assays with perturbed cells |
US11821035B1 (en) | 2020-01-29 | 2023-11-21 | 10X Genomics, Inc. | Compositions and methods of making gene expression libraries |
US11898205B2 (en) | 2020-02-03 | 2024-02-13 | 10X Genomics, Inc. | Increasing capture efficiency of spatial assays |
US11732300B2 (en) | 2020-02-05 | 2023-08-22 | 10X Genomics, Inc. | Increasing efficiency of spatial analysis in a biological sample |
US11835462B2 (en) | 2020-02-11 | 2023-12-05 | 10X Genomics, Inc. | Methods and compositions for partitioning a biological sample |
US11891654B2 (en) | 2020-02-24 | 2024-02-06 | 10X Genomics, Inc. | Methods of making gene expression libraries |
US11926863B1 (en) | 2020-02-27 | 2024-03-12 | 10X Genomics, Inc. | Solid state single cell method for analyzing fixed biological cells |
US11768175B1 (en) | 2020-03-04 | 2023-09-26 | 10X Genomics, Inc. | Electrophoretic methods for spatial analysis |
WO2021216622A1 (en) * | 2020-04-21 | 2021-10-28 | Aspen Neuroscience, Inc. | Gene editing of gba1 in stem cells and method of use of cells differentiated therefrom |
ES2965354T3 (es) | 2020-04-22 | 2024-04-12 | 10X Genomics Inc | Métodos para análisis espacial que usan eliminación de ARN elegido como diana |
EP4153775A1 (en) | 2020-05-22 | 2023-03-29 | 10X Genomics, Inc. | Simultaneous spatio-temporal measurement of gene expression and cellular activity |
AU2021275906A1 (en) | 2020-05-22 | 2022-12-22 | 10X Genomics, Inc. | Spatial analysis to detect sequence variants |
WO2021242834A1 (en) | 2020-05-26 | 2021-12-02 | 10X Genomics, Inc. | Method for resetting an array |
EP4025692A2 (en) | 2020-06-02 | 2022-07-13 | 10X Genomics, Inc. | Nucleic acid library methods |
CN116249785A (zh) | 2020-06-02 | 2023-06-09 | 10X基因组学有限公司 | 用于抗原-受体的空间转录组学 |
EP4162074B1 (en) | 2020-06-08 | 2024-04-24 | 10X Genomics, Inc. | Methods of determining a surgical margin and methods of use thereof |
WO2021252591A1 (en) | 2020-06-10 | 2021-12-16 | 10X Genomics, Inc. | Methods for determining a location of an analyte in a biological sample |
CN116034166A (zh) | 2020-06-25 | 2023-04-28 | 10X基因组学有限公司 | Dna甲基化的空间分析 |
US11981960B1 (en) | 2020-07-06 | 2024-05-14 | 10X Genomics, Inc. | Spatial analysis utilizing degradable hydrogels |
US11761038B1 (en) | 2020-07-06 | 2023-09-19 | 10X Genomics, Inc. | Methods for identifying a location of an RNA in a biological sample |
US11981958B1 (en) | 2020-08-20 | 2024-05-14 | 10X Genomics, Inc. | Methods for spatial analysis using DNA capture |
US11926822B1 (en) | 2020-09-23 | 2024-03-12 | 10X Genomics, Inc. | Three-dimensional spatial analysis |
US11827935B1 (en) | 2020-11-19 | 2023-11-28 | 10X Genomics, Inc. | Methods for spatial analysis using rolling circle amplification and detection probes |
WO2022140028A1 (en) | 2020-12-21 | 2022-06-30 | 10X Genomics, Inc. | Methods, compositions, and systems for capturing probes and/or barcodes |
EP4301870A1 (en) | 2021-03-18 | 2024-01-10 | 10X Genomics, Inc. | Multiplex capture of gene and protein expression from a biological sample |
EP4196605A1 (en) | 2021-09-01 | 2023-06-21 | 10X Genomics, Inc. | Methods, compositions, and kits for blocking a capture probe on a spatial array |
Family Cites Families (339)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5242794A (en) | 1984-12-13 | 1993-09-07 | Applied Biosystems, Inc. | Detection of specific sequences in nucleic acids |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US5583024A (en) | 1985-12-02 | 1996-12-10 | The Regents Of The University Of California | Recombinant expression of Coleoptera luciferase |
US4988617A (en) | 1988-03-25 | 1991-01-29 | California Institute Of Technology | Method of detecting a nucleotide change in nucleic acids |
US5234809A (en) | 1989-03-23 | 1993-08-10 | Akzo N.V. | Process for isolating nucleic acid |
US6416952B1 (en) | 1989-06-07 | 2002-07-09 | Affymetrix, Inc. | Photolithographic and other means for manufacturing arrays |
US5494810A (en) | 1990-05-03 | 1996-02-27 | Cornell Research Foundation, Inc. | Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease |
CA2039652C (en) | 1990-05-30 | 1996-12-24 | Frank Zdybel, Jr. | Hardcopy lossless data storage and communications for electronic document processing systems |
US5060980A (en) | 1990-05-30 | 1991-10-29 | Xerox Corporation | Form utilizing encoded indications for form field processing |
US6716580B2 (en) | 1990-06-11 | 2004-04-06 | Somalogic, Inc. | Method for the automated generation of nucleic acid ligands |
US5210015A (en) | 1990-08-06 | 1993-05-11 | Hoffman-La Roche Inc. | Homogeneous assay system using the nuclease activity of a nucleic acid polymerase |
US6197508B1 (en) | 1990-09-12 | 2001-03-06 | Affymetrix, Inc. | Electrochemical denaturation and annealing of nucleic acid |
US5491224A (en) | 1990-09-20 | 1996-02-13 | Bittner; Michael L. | Direct label transaminated DNA probe compositions for chromosome identification and methods for their manufacture |
US5994056A (en) | 1991-05-02 | 1999-11-30 | Roche Molecular Systems, Inc. | Homogeneous methods for nucleic acid amplification and detection |
US6033854A (en) | 1991-12-16 | 2000-03-07 | Biotronics Corporation | Quantitative PCR using blocking oligonucleotides |
US5567583A (en) | 1991-12-16 | 1996-10-22 | Biotronics Corporation | Methods for reducing non-specific priming in DNA detection |
US5348853A (en) | 1991-12-16 | 1994-09-20 | Biotronics Corporation | Method for reducing non-specific priming in DNA amplification |
JPH05236997A (ja) | 1992-02-28 | 1993-09-17 | Hitachi Ltd | ポリヌクレオチド捕捉用チップ |
US5869252A (en) | 1992-03-31 | 1999-02-09 | Abbott Laboratories | Method of multiplex ligase chain reaction |
US6100099A (en) | 1994-09-06 | 2000-08-08 | Abbott Laboratories | Test strip having a diagonal array of capture spots |
DE69433180T2 (de) | 1993-10-26 | 2004-06-24 | Affymetrix, Inc., Santa Clara | Felder von nukleinsaeuresonden auf biologischen chips |
US5459307A (en) | 1993-11-30 | 1995-10-17 | Xerox Corporation | System for storage and retrieval of digitally encoded information on a medium |
SE9400522D0 (sv) | 1994-02-16 | 1994-02-16 | Ulf Landegren | Method and reagent for detecting specific nucleotide sequences |
US5888788A (en) | 1994-05-18 | 1999-03-30 | Union Nationale Des Groupements De Distillateurs D'alcool (Ungda) | Use of ionophoretic polyether antibiotics for controlling bacterial growth in alcoholic fermentation |
US5942391A (en) | 1994-06-22 | 1999-08-24 | Mount Sinai School Of Medicine | Nucleic acid amplification method: ramification-extension amplification method (RAM) |
US7008771B1 (en) | 1994-09-30 | 2006-03-07 | Promega Corporation | Multiplex amplification of short tandem repeat loci |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US5695934A (en) | 1994-10-13 | 1997-12-09 | Lynx Therapeutics, Inc. | Massively parallel sequencing of sorted polynucleotides |
US5604097A (en) | 1994-10-13 | 1997-02-18 | Spectragen, Inc. | Methods for sorting polynucleotides using oligonucleotide tags |
ATE314469T1 (de) | 1994-10-18 | 2006-01-15 | Univ Ottawa | Neuronales apotose-inhibitor protein, gen sequenz und mutationen die wirbelsäulenmuskelatrophie verursachen |
US5776737A (en) | 1994-12-22 | 1998-07-07 | Visible Genetics Inc. | Method and composition for internal identification of samples |
US6235501B1 (en) | 1995-02-14 | 2001-05-22 | Bio101, Inc. | Method for isolation DNA |
US5866337A (en) | 1995-03-24 | 1999-02-02 | The Trustees Of Columbia University In The City Of New York | Method to detect mutations in a nucleic acid using a hybridization-ligation procedure |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
US5701256A (en) | 1995-05-31 | 1997-12-23 | Cold Spring Harbor Laboratory | Method and apparatus for biological sequence comparison |
US5636400A (en) | 1995-08-07 | 1997-06-10 | Young; Keenan L. | Automatic infant bottle cleaner |
US20050026204A1 (en) | 1995-09-08 | 2005-02-03 | Ulf Landegren | Methods and compositions for nucleic acid targeting |
SE9601676D0 (sv) | 1996-04-30 | 1996-04-30 | Ulf Landegren | Improved probing of specific mucleic acids |
US5830064A (en) | 1996-06-21 | 1998-11-03 | Pear, Inc. | Apparatus and method for distinguishing events which collectively exceed chance expectations and thereby controlling an output |
US6361940B1 (en) | 1996-09-24 | 2002-03-26 | Qiagen Genomics, Inc. | Compositions and methods for enhancing hybridization and priming specificity |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
AU735272B2 (en) | 1996-10-04 | 2001-07-05 | Intronn Llc | Sample collection devices and methods using markers and the use of such markers as controls in sample validation, laboratory evaluation and/or accreditation |
TW491892B (en) | 1996-11-07 | 2002-06-21 | Srl Inc | Apparatus for detecting microorganism |
EP0848060A3 (en) | 1996-12-11 | 2000-02-02 | Smithkline Beecham Corporation | Novel human 11CB splice variant |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
EP3034626A1 (en) | 1997-04-01 | 2016-06-22 | Illumina Cambridge Limited | Method of nucleic acid sequencing |
GB9716664D0 (en) | 1997-08-06 | 1997-10-15 | Norwegian Inst Of Fisheries & | A method of removing nucleic acid contamination reactions |
CA2214461A1 (en) | 1997-09-02 | 1999-03-02 | Mcgill University | Screening method for determining individuals at risk of developing diseases associated with different polymorphic forms of wildtype p53 |
EP1027145A4 (en) | 1997-09-17 | 2004-08-25 | Gentra Systems Inc | APPARATUS AND METHODS FOR ISOLATING NUCLEIC ACID |
US5869717A (en) | 1997-09-17 | 1999-02-09 | Uop Llc | Process for inhibiting the polymerization of vinyl aromatics |
US20010046673A1 (en) | 1999-03-16 | 2001-11-29 | Ljl Biosystems, Inc. | Methods and apparatus for detecting nucleic acid polymorphisms |
US5993611A (en) | 1997-09-24 | 1999-11-30 | Sarnoff Corporation | Capacitive denaturation of nucleic acid |
US6866996B1 (en) | 1998-01-30 | 2005-03-15 | Evolutionary Genomics, Llc | Methods to identify polynucleotide and polypeptide sequences which may be associated with physiological and medical conditions |
US6054276A (en) | 1998-02-23 | 2000-04-25 | Macevicz; Stephen C. | DNA restriction site mapping |
CA2263784A1 (en) | 1998-03-23 | 1999-09-23 | Megabios Corporation | Dual-tagged proteins and their uses |
EP1066414B1 (en) | 1998-03-25 | 2009-06-10 | Olink AB | Rolling circle replication of padlock probes |
US6946291B2 (en) | 1998-04-24 | 2005-09-20 | University Hospitals Of Cleveland | Mixed cell diagnostic systems |
US5971921A (en) | 1998-06-11 | 1999-10-26 | Advanced Monitoring Devices, Inc. | Medical alarm system and methods |
US6223128B1 (en) | 1998-06-29 | 2001-04-24 | Dnstar, Inc. | DNA sequence assembly system |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
US20020001800A1 (en) | 1998-08-14 | 2002-01-03 | Stanley N. Lapidus | Diagnostic methods using serial testing of polymorphic loci |
US6315767B1 (en) | 1998-08-19 | 2001-11-13 | Gambro, Inc. | Cell storage maintenance and monitoring system |
US6235502B1 (en) | 1998-09-18 | 2001-05-22 | Molecular Staging Inc. | Methods for selectively isolating DNA using rolling circle amplification |
US6703228B1 (en) | 1998-09-25 | 2004-03-09 | Massachusetts Institute Of Technology | Methods and products related to genotyping and DNA analysis |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US7034143B1 (en) | 1998-10-13 | 2006-04-25 | Brown University Research Foundation | Systems and methods for sequencing by hybridization |
US7071324B2 (en) | 1998-10-13 | 2006-07-04 | Brown University Research Foundation | Systems and methods for sequencing by hybridization |
ATE381016T1 (de) | 1998-10-28 | 2007-12-15 | Covaris Inc | Vorrichtung und verfahren zur kontrolle einer akustischen behandlung |
US6948843B2 (en) | 1998-10-28 | 2005-09-27 | Covaris, Inc. | Method and apparatus for acoustically controlling liquid solutions in microfluidic devices |
US6927024B2 (en) | 1998-11-30 | 2005-08-09 | Genentech, Inc. | PCR assay |
DE60042775D1 (de) | 1999-01-06 | 2009-10-01 | Callida Genomics Inc | Verbesserte sequenzierung mittels hybridisierung durch verwendung von sondengemischen |
GB9901475D0 (en) | 1999-01-22 | 1999-03-17 | Pyrosequencing Ab | A method of DNA sequencing |
CN1264744A (zh) | 1999-02-26 | 2000-08-30 | 上海生元基因开发有限公司 | 一种通过循环差减进行大规模cDNA克隆和测序的方法 |
US6360235B1 (en) | 1999-03-16 | 2002-03-19 | Webcriteria, Inc. | Objective measurement and graph theory modeling of web sites |
US7074586B1 (en) | 1999-06-17 | 2006-07-11 | Source Precision Medicine, Inc. | Quantitative assay for low abundance molecules |
US6818395B1 (en) | 1999-06-28 | 2004-11-16 | California Institute Of Technology | Methods and apparatus for analyzing polynucleotide sequences |
US7482443B2 (en) | 2000-03-09 | 2009-01-27 | Genetag Technology, Inc. | Systems and methods to quantify and amplify both signaling probes for cDNA chips and genes expression microarrays |
JP2001041918A (ja) | 1999-08-03 | 2001-02-16 | Honda Motor Co Ltd | オイルの気体濃度検出装置 |
US6941317B1 (en) | 1999-09-14 | 2005-09-06 | Eragen Biosciences, Inc. | Graphical user interface for display and analysis of biological sequence data |
US7244559B2 (en) | 1999-09-16 | 2007-07-17 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US7211390B2 (en) | 1999-09-16 | 2007-05-01 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
WO2001023610A2 (en) | 1999-09-29 | 2001-04-05 | Solexa Ltd. | Polynucleotide sequencing |
US7430477B2 (en) | 1999-10-12 | 2008-09-30 | Maxygen, Inc. | Methods of populating data structures for use in evolutionary simulations |
US6613516B1 (en) | 1999-10-30 | 2003-09-02 | Affymetrix, Inc. | Preparation of nucleic acid samples |
US6582938B1 (en) | 2001-05-11 | 2003-06-24 | Affymetrix, Inc. | Amplification of nucleic acids |
US20060276629A9 (en) | 1999-12-17 | 2006-12-07 | Hildebrand William H | Purification and characterization of soluble human HLA proteins |
US20030166057A1 (en) | 1999-12-17 | 2003-09-04 | Hildebrand William H. | Method and apparatus for the production of soluble MHC antigens and uses thereof |
US6775622B1 (en) | 2000-01-31 | 2004-08-10 | Zymogenetics, Inc. | Method and system for detecting near identities in large DNA databases |
US6714874B1 (en) | 2000-03-15 | 2004-03-30 | Applera Corporation | Method and system for the assembly of a whole genome using a shot-gun data set |
US20030208454A1 (en) | 2000-03-16 | 2003-11-06 | Rienhoff Hugh Y. | Method and system for populating a database for further medical characterization |
AU2001293336A1 (en) | 2000-04-11 | 2001-10-23 | Ulf Landegren | Nucleic acid detection medium |
US20020091666A1 (en) | 2000-07-07 | 2002-07-11 | Rice John Jeremy | Method and system for modeling biological systems |
US6913879B1 (en) | 2000-07-10 | 2005-07-05 | Telechem International Inc. | Microarray method of genotyping multiple samples at multiple LOCI |
US6448717B1 (en) | 2000-07-17 | 2002-09-10 | Micron Technology, Inc. | Method and apparatuses for providing uniform electron beams from field emission displays |
US6569920B1 (en) | 2000-08-16 | 2003-05-27 | Millennium Inorganic Chemicals, Inc. | Titanium dioxide slurries having improved stability |
US20020182609A1 (en) | 2000-08-16 | 2002-12-05 | Luminex Corporation | Microsphere based oligonucleotide ligation assays, kits, and methods of use, including high-throughput genotyping |
WO2002017207A2 (en) | 2000-08-23 | 2002-02-28 | Arexis Ab | System and method of storing genetic information |
US8501471B2 (en) | 2000-10-18 | 2013-08-06 | Sloan-Kettering Institute For Cancer Research | Uses of monoclonal antibody 8H9 |
DE60131903T2 (de) | 2000-10-24 | 2008-11-27 | The Board of Trustees of the Leland S. Stanford Junior University, Palo Alto | Direkte multiplex charakterisierung von genomischer dna |
US7119188B2 (en) | 2001-01-04 | 2006-10-10 | Bristol-Myers Squibb Company | N-carbobenzyloxy (N-CBZ)-deprotecting enzyme and uses therefor |
JP2004523243A (ja) | 2001-03-12 | 2004-08-05 | カリフォルニア インスティチュート オブ テクノロジー | 非同期性塩基伸長によってポリヌクレオチド配列を分析するための方法および装置 |
WO2002079502A1 (en) | 2001-03-28 | 2002-10-10 | The University Of Queensland | A method for nucleic acid sequence analysis |
US20020187483A1 (en) | 2001-04-20 | 2002-12-12 | Cerner Corporation | Computer system for providing information about the risk of an atypical clinical event based upon genetic information |
US7809509B2 (en) | 2001-05-08 | 2010-10-05 | Ip Genesis, Inc. | Comparative mapping and assembly of nucleic acid sequences |
WO2002093453A2 (en) | 2001-05-12 | 2002-11-21 | X-Mine, Inc. | Web-based genetic research apparatus |
GB2378245A (en) | 2001-08-03 | 2003-02-05 | Mats Nilsson | Nucleic acid amplification method |
US20040142325A1 (en) | 2001-09-14 | 2004-07-22 | Liat Mintz | Methods and systems for annotating biomolecular sequences |
US7070933B2 (en) | 2001-09-28 | 2006-07-04 | Gen-Probe Incorporated | Inversion probes |
US20030224384A1 (en) | 2001-11-13 | 2003-12-04 | Khalid Sayood | Divide and conquer system and method of DNA sequence assembly |
DE60231543D1 (de) | 2001-11-19 | 2009-04-23 | Parallele Bioscience Inc | Multiplex-oligonukleotidaddition und zielamplifikation |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
US20030175709A1 (en) | 2001-12-20 | 2003-09-18 | Murphy George L. | Method and system for depleting rRNA populations |
DK1321477T3 (da) | 2001-12-22 | 2005-02-14 | 4Antibody Ag | Fremgangsmåde til frembringelsen af genetisk modificerede vertebrate precursor-lymfocytter og anvendelse deraf til fremstillingen af heterologe bindende proteiner |
US7127436B2 (en) | 2002-03-18 | 2006-10-24 | Motorola, Inc. | Gene expression programming algorithm |
US20030203370A1 (en) * | 2002-04-30 | 2003-10-30 | Zohar Yakhini | Method and system for partitioning sets of sequence groups with respect to a set of subsequence groups, useful for designing polymorphism-based typing assays |
US6841384B2 (en) | 2002-08-08 | 2005-01-11 | Becton Dickinson Company | Advanced roller bottle system for cell and tissue culturing |
EP2607369B1 (en) | 2002-08-23 | 2015-09-23 | Illumina Cambridge Limited | Modified nucleotides for polynucleotide sequencing |
WO2004026892A2 (en) | 2002-09-19 | 2004-04-01 | Applera Corporation | Fragmentation of dna |
AU2003275377A1 (en) | 2002-09-30 | 2004-04-19 | The Children's Mercy Hospital | Subtelomeric dna probes and method of producing the same |
US7865534B2 (en) | 2002-09-30 | 2011-01-04 | Genstruct, Inc. | System, method and apparatus for assembling and mining life science data |
US20050003369A1 (en) | 2002-10-10 | 2005-01-06 | Affymetrix, Inc. | Method for depleting specific nucleic acids from a mixture |
US7820378B2 (en) | 2002-11-27 | 2010-10-26 | Sequenom, Inc. | Fragmentation-based methods and systems for sequence variation detection and discovery |
US8275554B2 (en) * | 2002-12-20 | 2012-09-25 | Caliper Life Sciences, Inc. | System for differentiating the lengths of nucleic acids of interest in a sample |
AU2004254552B2 (en) | 2003-01-29 | 2008-04-24 | 454 Life Sciences Corporation | Methods of amplifying and sequencing nucleic acids |
US20060183132A1 (en) | 2005-02-14 | 2006-08-17 | Perlegen Sciences, Inc. | Selection probe amplification |
WO2004081183A2 (en) | 2003-03-07 | 2004-09-23 | Rubicon Genomics, Inc. | In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna |
US7041481B2 (en) | 2003-03-14 | 2006-05-09 | The Regents Of The University Of California | Chemical amplification based on fluid partitioning |
WO2004083819A2 (en) | 2003-03-17 | 2004-09-30 | Trace Genetics, Inc | Molecular forensic specimen marker |
ITMI20030643A1 (it) | 2003-04-01 | 2004-10-02 | Copan Innovation Ltd | Tampone per il prelievo di campioni biologici |
EP3261006A1 (en) | 2003-04-09 | 2017-12-27 | Omicia Inc. | Methods of selection, reporting and analysis of genetic markers using broad based genetic profiling applications |
US7300755B1 (en) | 2003-05-12 | 2007-11-27 | Fred Hutchinson Cancer Research Center | Methods for haplotyping genomic DNA |
US8694263B2 (en) | 2003-05-23 | 2014-04-08 | Cold Spring Harbor Laboratory | Method of identifying virtual representations of nucleotide sequences |
US7670810B2 (en) * | 2003-06-20 | 2010-03-02 | Illumina, Inc. | Methods and compositions for whole genome amplification and genotyping |
SE0301951D0 (sv) | 2003-06-30 | 2003-06-30 | Pyrosequencing Ab | New method |
US7108979B2 (en) | 2003-09-03 | 2006-09-19 | Agilent Technologies, Inc. | Methods to detect cross-contamination between samples contacted with a multi-array substrate |
US7537889B2 (en) | 2003-09-30 | 2009-05-26 | Life Genetics Lab, Llc. | Assay for quantitation of human DNA using Alu elements |
US7729865B2 (en) | 2003-10-06 | 2010-06-01 | Cerner Innovation, Inc. | Computerized method and system for automated correlation of genetic test results |
AU2004287069B2 (en) | 2003-10-29 | 2009-07-16 | Bioarray Solutions, Ltd. | Multiplexed nucleic acid analysis by fragmentation of double-stranded DNA |
EP1682680B2 (en) | 2003-10-31 | 2018-03-21 | AB Advanced Genetic Analysis Corporation | Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof |
US20050186589A1 (en) | 2003-11-07 | 2005-08-25 | University Of Massachusetts | Interspersed repetitive element RNAs as substrates, inhibitors and delivery vehicles for RNAi |
US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
WO2005050222A1 (en) | 2003-11-19 | 2005-06-02 | Evotec Neurosciences Gmbh | Diagnostic and therapeutic use of the human sgpl1 gene and protein for neurodegenerative diseases |
US20050214811A1 (en) | 2003-12-12 | 2005-09-29 | Margulies David M | Processing and managing genetic information |
US8529744B2 (en) | 2004-02-02 | 2013-09-10 | Boreal Genomics Corp. | Enrichment of nucleic acid targets |
US7910353B2 (en) | 2004-02-13 | 2011-03-22 | Signature Genomic Laboratories | Methods and apparatuses for achieving precision genetic diagnoses |
CA2497324A1 (en) | 2004-02-17 | 2005-08-17 | Affymetrix, Inc. | Methods for fragmenting and labelling dna |
US20060195266A1 (en) | 2005-02-25 | 2006-08-31 | Yeatman Timothy J | Methods for predicting cancer outcome and gene signatures for use therein |
US20100216151A1 (en) | 2004-02-27 | 2010-08-26 | Helicos Biosciences Corporation | Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities |
US20100216153A1 (en) | 2004-02-27 | 2010-08-26 | Helicos Biosciences Corporation | Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities |
WO2005085477A1 (en) | 2004-03-02 | 2005-09-15 | Orion Genomics Llc | Differential enzymatic fragmentation by whole genome amplification |
US20080176209A1 (en) | 2004-04-08 | 2008-07-24 | Biomatrica, Inc. | Integration of sample storage and sample management for life science |
CA2563305A1 (en) | 2004-04-09 | 2005-11-24 | University Of South Florida | Combination therapies for cancer and proliferative angiopathies |
WO2005104401A2 (en) | 2004-04-22 | 2005-11-03 | Ramot At Tel Aviv University Ltd. | Method and apparatus for optimizing multidimensional systems |
WO2005111242A2 (en) | 2004-05-10 | 2005-11-24 | Parallele Bioscience, Inc. | Digital profiling of polynucleotide populations |
SE0401270D0 (sv) | 2004-05-18 | 2004-05-18 | Fredrik Dahl | Method for amplifying specific nucleic acids in parallel |
US7622281B2 (en) | 2004-05-20 | 2009-11-24 | The Board Of Trustees Of The Leland Stanford Junior University | Methods and compositions for clonal amplification of nucleic acid |
CN101087890A (zh) | 2004-07-26 | 2007-12-12 | 帕拉列勒生物科学公司 | 多个基因组的同时分析 |
WO2006044017A2 (en) | 2004-08-13 | 2006-04-27 | Jaguar Bioscience Inc. | Systems and methods for identifying diagnostic indicators |
US8024128B2 (en) | 2004-09-07 | 2011-09-20 | Gene Security Network, Inc. | System and method for improving clinical decisions by aggregating, validating and analysing genetic and phenotypic data |
US20060078894A1 (en) | 2004-10-12 | 2006-04-13 | Winkler Matthew M | Methods and compositions for analyzing nucleic acids |
EP2857523A1 (en) | 2005-02-01 | 2015-04-08 | Applied Biosystems, LLC | Method for identifying a sequence in a polynucleotide |
US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
US7658346B2 (en) | 2005-02-25 | 2010-02-09 | Honeywell International Inc. | Double ducted hovering air-vehicle |
GB0504184D0 (en) | 2005-03-01 | 2005-04-06 | Lingvitae As | Method |
KR101363032B1 (ko) | 2005-04-18 | 2014-02-13 | 미토믹스 인크. | 일광 노출, 전립선암 및 다른 암의 검출용 진단 도구로서미토콘드리아 돌연변이 및 전위 |
US7523117B2 (en) | 2005-05-04 | 2009-04-21 | West Virginia University Research Corporation | Method for data clustering and classification by a graph theory model—network partition into high density subgraphs |
US20070009925A1 (en) | 2005-05-05 | 2007-01-11 | Applera Corporation | Genomic dna sequencing methods and kits |
US20060263789A1 (en) | 2005-05-19 | 2006-11-23 | Robert Kincaid | Unique identifiers for indicating properties associated with entities to which they are attached, and methods for using |
WO2007145612A1 (en) | 2005-06-06 | 2007-12-21 | 454 Life Sciences Corporation | Paired end sequencing |
US7368242B2 (en) | 2005-06-14 | 2008-05-06 | Affymetrix, Inc. | Method and kits for multiplex hybridization assays |
US20060286577A1 (en) | 2005-06-17 | 2006-12-21 | Xiyu Jia | Methods for detection of methylated DNA |
US20060292585A1 (en) | 2005-06-24 | 2006-12-28 | Affymetrix, Inc. | Analysis of methylation using nucleic acid arrays |
GB0514936D0 (en) | 2005-07-20 | 2005-08-24 | Solexa Ltd | Preparation of templates for nucleic acid sequencing |
US20070020640A1 (en) | 2005-07-21 | 2007-01-25 | Mccloskey Megan L | Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis |
US7838646B2 (en) | 2005-08-18 | 2010-11-23 | Quest Diagnostics Investments Incorporated | Cystic fibrosis transmembrane conductance regulator gene mutations |
US7666593B2 (en) | 2005-08-26 | 2010-02-23 | Helicos Biosciences Corporation | Single molecule sequencing of captured nucleic acids |
EP3211086B1 (en) | 2005-09-20 | 2021-06-09 | Menarini Silicon Biosystems S.p.A. | Methods and composition to generate unique sequence dna probes, labeling of dna probes and the use of these probes |
AU2006294565A1 (en) * | 2005-09-30 | 2007-04-05 | Perlegen Sciences, Inc. | Methods and compositions for screening and treatment of disorders of blood glucose regulation |
JP5438320B2 (ja) | 2005-10-03 | 2014-03-12 | アプライド バイオシステムズ リミテッド ライアビリティー カンパニー | 核酸を増幅するための組成物、方法およびキット |
US20070092883A1 (en) | 2005-10-26 | 2007-04-26 | De Luwe Hoek Octrooien B.V. | Methylation specific multiplex ligation-dependent probe amplification (MS-MLPA) |
GB0522310D0 (en) | 2005-11-01 | 2005-12-07 | Solexa Ltd | Methods of preparing libraries of template polynucleotides |
JP2009516525A (ja) | 2005-11-22 | 2009-04-23 | プラント リサーチ インターナショナル ベー. フェー. | 複合的核酸検出法 |
US7329860B2 (en) | 2005-11-23 | 2008-02-12 | Illumina, Inc. | Confocal imaging methods and apparatus |
WO2007062164A2 (en) | 2005-11-26 | 2007-05-31 | Gene Security Network Llc | System and method for cleaning noisy genetic data and using data to make predictions |
EP2363205A3 (en) | 2006-01-11 | 2014-06-04 | Raindance Technologies, Inc. | Microfluidic Devices And Methods Of Use In The Formation And Control Of Nanoreactors |
US7537897B2 (en) | 2006-01-23 | 2009-05-26 | Population Genetics Technologies, Ltd. | Molecular counting |
EP1987162A4 (en) | 2006-01-23 | 2009-11-25 | Population Genetics Technologi | NUCLEIC ACID ANALYSIS ABOUT SEQUENCE TOKENS |
WO2007092538A2 (en) * | 2006-02-07 | 2007-08-16 | President And Fellows Of Harvard College | Methods for making nucleotide probes for sequencing and synthesis |
ES2546848T3 (es) | 2006-03-10 | 2015-09-29 | Epigenomics Ag | Un método para identificar una muestra biológica para el análisis de la metilación |
JP5297207B2 (ja) | 2006-03-10 | 2013-09-25 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | スペクトル分析を介したdnaパターンの同定方法及びシステム |
WO2007107717A1 (en) * | 2006-03-21 | 2007-09-27 | Ucl Business Plc | Biomarkers for bisphosphonate-responsive bone disorders |
US8457900B2 (en) | 2006-03-23 | 2013-06-04 | The Regents Of The University Of California | Method for identification and sequencing of proteins |
EP3722409A1 (en) | 2006-03-31 | 2020-10-14 | Illumina, Inc. | Systems and devices for sequence by synthesis analysis |
EP2010668A4 (en) | 2006-04-10 | 2009-04-29 | Univ California | SYSTEMS AND METHODS FOR EFFICIENT COLLECTION OF UNIQUE CELLS AND COLONIES OF CELLS AND RAPID FORMATION OF STABLE TRANSFECTORS |
US7282337B1 (en) | 2006-04-14 | 2007-10-16 | Helicos Biosciences Corporation | Methods for increasing accuracy of nucleic acid sequencing |
US7702468B2 (en) | 2006-05-03 | 2010-04-20 | Population Diagnostics, Inc. | Evaluating genetic disorders |
WO2007133710A2 (en) | 2006-05-11 | 2007-11-22 | Raindance Technologies, Inc. | Microfluidic devices and methods of use thereof |
EP2021415B1 (en) | 2006-05-18 | 2017-03-15 | Illumina Cambridge Limited | Dye compounds and the use of their labelled conjugates |
US20080050739A1 (en) | 2006-06-14 | 2008-02-28 | Roland Stoughton | Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats |
US20080124721A1 (en) | 2006-06-14 | 2008-05-29 | Martin Fuchs | Analysis of rare cell-enriched samples |
US20100035243A1 (en) | 2006-07-10 | 2010-02-11 | Nanosphere, Inc. | Ultra-sensitive detection of analytes |
US20080085836A1 (en) | 2006-09-22 | 2008-04-10 | Kearns William G | Method for genetic testing of human embryos for chromosome abnormalities, segregating genetic disorders with or without a known mutation and mitochondrial disorders following in vitro fertilization (IVF), embryo culture and embryo biopsy |
US7985716B2 (en) | 2006-09-22 | 2011-07-26 | Uchicago Argonne, Llc | Nucleic acid sample purification and enrichment with a thermo-affinity microfluidic sub-circuit |
US20080081330A1 (en) | 2006-09-28 | 2008-04-03 | Helicos Biosciences Corporation | Method and devices for analyzing small RNA molecules |
US7754429B2 (en) | 2006-10-06 | 2010-07-13 | Illumina Cambridge Limited | Method for pair-wise sequencing a plurity of target polynucleotides |
US8603749B2 (en) | 2006-11-15 | 2013-12-10 | Biospherex, LLC | Multitag sequencing ecogenomics analysis-US |
JP2010522537A (ja) | 2006-11-30 | 2010-07-08 | ナビジェニクス インコーポレイティド | 遺伝子分析系および方法 |
US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
GB2457851B (en) | 2006-12-14 | 2011-01-05 | Ion Torrent Systems Inc | Methods and apparatus for measuring analytes using large scale fet arrays |
US7855054B2 (en) | 2007-01-16 | 2010-12-21 | Somalogic, Inc. | Multiplexed analyses of test samples |
US7862999B2 (en) | 2007-01-17 | 2011-01-04 | Affymetrix, Inc. | Multiplex targeted amplification using flap nuclease |
WO2008092150A1 (en) | 2007-01-26 | 2008-07-31 | Illumina, Inc. | Nucleic acid sequencing system and method |
JP2010517539A (ja) | 2007-02-05 | 2010-05-27 | アプライド バイオシステムズ, エルエルシー | ショートリード配列決定を用いたインデル識別のためのシステムおよび方法 |
US20080269068A1 (en) | 2007-02-06 | 2008-10-30 | President And Fellows Of Harvard College | Multiplex decoding of sequence tags in barcodes |
KR100896987B1 (ko) | 2007-03-14 | 2009-05-14 | 한국과학기술연구원 | 앱타머를 이용한 표적 단백질 검출 방법 및 검출키트 |
US8533327B2 (en) | 2007-04-04 | 2013-09-10 | Zte Corporation | System and method of providing services via a peer-to-peer-based next generation network |
US7774962B1 (en) | 2007-04-27 | 2010-08-17 | David Ladd | Removable and reusable tags for identifying bottles, cans, and the like |
US20080293589A1 (en) | 2007-05-24 | 2008-11-27 | Affymetrix, Inc. | Multiplex locus specific amplification |
EP2171088B1 (en) | 2007-06-19 | 2015-10-14 | Stratos Genomics Inc. | High throughput nucleic acid sequencing by expansion |
US8283116B1 (en) | 2007-06-22 | 2012-10-09 | Ptc Therapeutics, Inc. | Methods of screening for compounds for treating spinal muscular atrophy using SMN mRNA translation regulation |
JP2009009624A (ja) | 2007-06-26 | 2009-01-15 | Hitachi Global Storage Technologies Netherlands Bv | サーボパターン形成方法および磁気ディスク装置 |
CN101802220B (zh) | 2007-07-26 | 2013-07-31 | 加利福尼亚太平洋生物科学股份有限公司 | 分子冗余测序法 |
US20120252020A1 (en) | 2007-08-17 | 2012-10-04 | Predictive Biosciences, Inc. | Screening Assay for Bladder Cancer |
EP2201143B2 (en) | 2007-09-21 | 2016-08-24 | Katholieke Universiteit Leuven | Tools and methods for genetic tests using next generation sequencing |
US20100086914A1 (en) | 2008-10-03 | 2010-04-08 | Roche Molecular Systems, Inc. | High resolution, high throughput hla genotyping by clonal sequencing |
EP2053132A1 (en) | 2007-10-23 | 2009-04-29 | Roche Diagnostics GmbH | Enrichment and sequence analysis of geomic regions |
US20090119313A1 (en) | 2007-11-02 | 2009-05-07 | Ioactive Inc. | Determining structure of binary data using alignment algorithms |
US8478544B2 (en) | 2007-11-21 | 2013-07-02 | Cosmosid Inc. | Direct identification and measurement of relative populations of microorganisms with direct DNA sequencing and probabilistic methods |
US8463895B2 (en) | 2007-11-29 | 2013-06-11 | International Business Machines Corporation | System and computer program product to predict edges in a non-cumulative graph |
JP5362738B2 (ja) | 2007-12-05 | 2013-12-11 | コンプリート・ジェノミックス・インコーポレイテッド | シーケンシング反応における効率のよい塩基決定 |
DE102007060291B4 (de) | 2007-12-12 | 2011-04-28 | Sartorius Stedim Biotech Gmbh | Behälteranordnung mit einem Behälter mit flexibler Wandung |
US20090156412A1 (en) | 2007-12-17 | 2009-06-18 | Helicos Biosciences Corporation | Surface-capture of target nucleic acids |
US20090163366A1 (en) | 2007-12-24 | 2009-06-25 | Helicos Biosciences Corporation | Two-primer sequencing for high-throughput expression analysis |
US8003326B2 (en) | 2008-01-02 | 2011-08-23 | Children's Medical Center Corporation | Method for diagnosing autism spectrum disorder |
US20090181389A1 (en) | 2008-01-11 | 2009-07-16 | Signosis, Inc., A California Corporation | Quantitative measurement of nucleic acid via ligation-based linear amplification |
EP3360972B1 (en) | 2008-01-17 | 2019-12-11 | Sequenom, Inc. | Single molecule nucleic acid sequence analysis processes |
EP2250594B1 (en) | 2008-02-12 | 2017-04-19 | Codexis, Inc. | Method of generating an optimized, diverse population of variants |
EP2250286A1 (en) | 2008-02-15 | 2010-11-17 | Life Technologies Corporation | Methods and compositions for shearing of polymers by sonication |
US20090226975A1 (en) | 2008-03-10 | 2009-09-10 | Illumina, Inc. | Constant cluster seeding |
US9074244B2 (en) | 2008-03-11 | 2015-07-07 | Affymetrix, Inc. | Array-based translocation and rearrangement assays |
US8271206B2 (en) | 2008-04-21 | 2012-09-18 | Softgenetics Llc | DNA sequence assembly methods of short reads |
US20090298064A1 (en) | 2008-05-29 | 2009-12-03 | Serafim Batzoglou | Genomic Sequencing |
AU2009256212B2 (en) | 2008-06-04 | 2015-12-10 | Jp Laboratories Inc. | A monitoring system based on etching of metals |
BRPI0915619A2 (pt) | 2008-07-23 | 2016-11-01 | Univ California | métodos para determinar uma probabilidade de que um sujeito tenha contribuído com material genético para amostra de teste de material genético, para caracterizar amostra de teste de material genético e para determinar se uma pessoa de interesse contribuiu com material genético para uma amostra de teste de material genético, kit para análise de amostra de teste de material genético e sistema para determinar se um sujeito contribuiu com material genético para uma amostra |
US20100035252A1 (en) | 2008-08-08 | 2010-02-11 | Ion Torrent Systems Incorporated | Methods for sequencing individual nucleic acids under tension |
US8645343B2 (en) | 2008-08-26 | 2014-02-04 | 23Andme, Inc. | Processing data from genotyping chips |
US20100063742A1 (en) | 2008-09-10 | 2010-03-11 | Hart Christopher E | Multi-scale short read assembly |
US8383345B2 (en) | 2008-09-12 | 2013-02-26 | University Of Washington | Sequence tag directed subassembly of short sequencing reads into long sequencing reads |
US8921046B2 (en) | 2008-09-19 | 2014-12-30 | Pacific Biosciences Of California, Inc. | Nucleic acid sequence analysis |
CA2738596C (en) | 2008-09-22 | 2015-06-30 | Biomicro, Inc. | Selective processing of biological material on a microarray substrate |
US20100301398A1 (en) | 2009-05-29 | 2010-12-02 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
US8546128B2 (en) | 2008-10-22 | 2013-10-01 | Life Technologies Corporation | Fluidics system for sequential delivery of reagents |
US20110301042A1 (en) | 2008-11-11 | 2011-12-08 | Helicos Biosciences Corporation | Methods of sample encoding for multiplex analysis of samples by single molecule sequencing |
US8474228B2 (en) | 2009-12-08 | 2013-07-02 | Life Technologies Corporation | Packaging systems and methods for transporting vials |
US8462161B1 (en) | 2009-01-20 | 2013-06-11 | Kount Inc. | System and method for fast component enumeration in graphs with implicit edges |
CA2751455C (en) | 2009-02-03 | 2019-03-12 | Netbio, Inc. | Nucleic acid purification |
CN103952482A (zh) | 2009-04-02 | 2014-07-30 | 弗卢伊蒂格姆公司 | 用于对目标核酸进行条形码化的多引物扩增方法 |
WO2010129019A2 (en) | 2009-04-27 | 2010-11-11 | Pacific Biosciences Of California, Inc. | Real-time sequencing methods and systems |
DK2511843T3 (en) | 2009-04-29 | 2017-03-27 | Complete Genomics Inc | METHOD AND SYSTEM FOR DETERMINING VARIATIONS IN A SAMPLE POLYNUCLEOTIDE SEQUENCE IN TERMS OF A REFERENCE POLYNUCLEOTIDE SEQUENCE |
US20120165202A1 (en) | 2009-04-30 | 2012-06-28 | Good Start Genetics, Inc. | Methods and compositions for evaluating genetic markers |
CA2760439A1 (en) | 2009-04-30 | 2010-11-04 | Good Start Genetics, Inc. | Methods and compositions for evaluating genetic markers |
US20130337447A1 (en) | 2009-04-30 | 2013-12-19 | Good Start Genetics, Inc. | Methods and compositions for evaluating genetic markers |
US8574835B2 (en) | 2009-05-29 | 2013-11-05 | Life Technologies Corporation | Scaffolded nucleic acid polymer particles and methods of making and using |
US8673627B2 (en) | 2009-05-29 | 2014-03-18 | Life Technologies Corporation | Apparatus and methods for performing electrochemical reactions |
US20110007639A1 (en) | 2009-07-10 | 2011-01-13 | Qualcomm Incorporated | Methods and apparatus for detecting identifiers |
WO2011019964A1 (en) | 2009-08-12 | 2011-02-17 | Nugen Technologies, Inc. | Methods, compositions, and kits for generating nucleic acid products substantially free of template nucleic acid |
EP3135772B1 (en) | 2009-09-08 | 2019-10-23 | Laboratory Corporation of America Holdings | Method for diagnosing autism spectrum disorders |
WO2011030838A1 (ja) | 2009-09-10 | 2011-03-17 | 富士フイルム株式会社 | アレイ比較ゲノムハイブリダイゼーション法による核酸変異解析法 |
US8975019B2 (en) | 2009-10-19 | 2015-03-10 | University Of Massachusetts | Deducing exon connectivity by RNA-templated DNA ligation/sequencing |
US20110098193A1 (en) | 2009-10-22 | 2011-04-28 | Kingsmore Stephen F | Methods and Systems for Medical Sequencing Analysis |
WO2011055232A2 (en) | 2009-11-04 | 2011-05-12 | Population Genetics Technologies Ltd. | Base-by-base mutation screening |
WO2011066476A1 (en) | 2009-11-25 | 2011-06-03 | Quantalife, Inc. | Methods and compositions for detecting genetic material |
GB0921264D0 (en) | 2009-12-03 | 2010-01-20 | Olink Genomics Ab | Method for amplification of target nucleic acid |
US20120270739A1 (en) | 2010-01-19 | 2012-10-25 | Verinata Health, Inc. | Method for sample analysis of aneuploidies in maternal samples |
WO2011090556A1 (en) | 2010-01-19 | 2011-07-28 | Verinata Health, Inc. | Methods for determining fraction of fetal nucleic acid in maternal samples |
US20110257889A1 (en) | 2010-02-24 | 2011-10-20 | Pacific Biosciences Of California, Inc. | Sequence assembly and consensus sequence determination |
EP2550370B1 (en) | 2010-03-22 | 2015-12-30 | Esoterix Genetic Laboratories, LLC | Mutations associated with cystic fibrosis |
SG184051A1 (en) | 2010-03-25 | 2012-10-30 | Agency Science Tech & Res | Method of producing recombinant proteins with mannose- terminated n-glycans |
EP2854058A3 (en) | 2010-05-18 | 2015-10-28 | Natera, Inc. | Methods for non-invasive pre-natal ploidy calling |
US20140206552A1 (en) | 2010-05-18 | 2014-07-24 | Natera, Inc. | Methods for preimplantation genetic diagnosis by sequencing |
EP2580351B1 (en) | 2010-06-09 | 2018-08-29 | Keygene N.V. | Combinatorial sequence barcodes for high throughput screening |
ES2862331T3 (es) | 2010-06-18 | 2021-10-07 | Myriad Genetics Inc | Métodos para predecir el estado de los genes BRCA1 y BRCA2 en una célula de cáncer |
US20120046877A1 (en) | 2010-07-06 | 2012-02-23 | Life Technologies Corporation | Systems and methods to detect copy number variation |
KR101862756B1 (ko) | 2010-07-09 | 2018-05-30 | 세르겐티스 비.브이. | 관심있는 3-d 게놈 영역 서열화 전략 |
DK2601609T3 (en) | 2010-08-02 | 2017-06-06 | Population Bio Inc | COMPOSITIONS AND METHODS FOR DISCOVERING MUTATIONS CAUSING GENETIC DISORDERS |
US20140342940A1 (en) | 2011-01-25 | 2014-11-20 | Ariosa Diagnostics, Inc. | Detection of Target Nucleic Acids using Hybridization |
WO2012034030A1 (en) | 2010-09-09 | 2012-03-15 | Omicia, Inc. | Variant annotation, analysis and selection tool |
US9309556B2 (en) | 2010-09-24 | 2016-04-12 | The Board Of Trustees Of The Leland Stanford Junior University | Direct capture, amplification and sequencing of target DNA using immobilized primers |
US8715933B2 (en) | 2010-09-27 | 2014-05-06 | Nabsys, Inc. | Assay methods using nicking endonucleases |
US8430053B2 (en) | 2010-09-30 | 2013-04-30 | Temptime Corporation | Color-changing emulsions for freeze indicators |
US20120197533A1 (en) | 2010-10-11 | 2012-08-02 | Complete Genomics, Inc. | Identifying rearrangements in a sequenced genome |
US9163281B2 (en) | 2010-12-23 | 2015-10-20 | Good Start Genetics, Inc. | Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction |
US11270781B2 (en) | 2011-01-25 | 2022-03-08 | Ariosa Diagnostics, Inc. | Statistical analysis for non-invasive sex chromosome aneuploidy determination |
CA2826748C (en) | 2011-02-09 | 2020-08-04 | Bio-Rad Laboratories, Inc. | Method of detecting variations in copy number of a target nucleic acid |
AU2011358564B9 (en) | 2011-02-09 | 2017-07-13 | Natera, Inc | Methods for non-invasive prenatal ploidy calling |
US8782566B2 (en) | 2011-02-22 | 2014-07-15 | Cisco Technology, Inc. | Using gestures to schedule and manage meetings |
WO2012122546A2 (en) | 2011-03-09 | 2012-09-13 | Lawrence Ganeshalingam | Biological data networks and methods therefor |
US20120252686A1 (en) | 2011-03-31 | 2012-10-04 | Good Start Genetics | Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction |
US8680066B2 (en) | 2011-04-05 | 2014-03-25 | The United States of America as represented by the Development of Veterans Affairs | Methods for determining and inhibiting rheumatoid arthritis associated with the BRAF oncogene in a subject |
US20140357497A1 (en) | 2011-04-27 | 2014-12-04 | Kun Zhang | Designing padlock probes for targeted genomic sequencing |
PL2716766T3 (pl) | 2011-05-31 | 2017-09-29 | Berry Genomics Co., Ltd. | Urządzenie do wykrywania liczby kopii chromosomów płodowych lub chromosomów komórek nowotworowych |
PL2718466T3 (pl) | 2011-06-07 | 2019-01-31 | Icahn School Of Medicine At Mount Sinai | Materiały i sposób identyfikacji nosicieli rdzeniowego zaniku mięśni |
US9733221B2 (en) | 2011-06-09 | 2017-08-15 | Agilent Technologies, Inc. | Injection needle cartridge with integrated sealing force generator |
US20130178378A1 (en) | 2011-06-09 | 2013-07-11 | Andrew C. Hatch | Multiplex digital pcr |
US8496166B2 (en) | 2011-08-23 | 2013-07-30 | Eagile Inc. | System for associating RFID tag with UPC code, and validating associative encoding of same |
WO2013040773A1 (zh) | 2011-09-21 | 2013-03-28 | 深圳华大基因科技有限公司 | 确定单细胞染色体非整倍性的方法和系统 |
US9228233B2 (en) | 2011-10-17 | 2016-01-05 | Good Start Genetics, Inc. | Analysis methods |
EP2814514B1 (en) | 2012-02-16 | 2017-09-13 | Atyr Pharma, Inc. | Histidyl-trna synthetases for treating autoimmune and inflammatory diseases |
AU2013200876A1 (en) | 2012-02-24 | 2013-09-12 | Callum David Mcdonald | Method of graph processing |
CN104350158A (zh) | 2012-03-26 | 2015-02-11 | 约翰霍普金斯大学 | 快速非整倍性检测 |
US8209130B1 (en) | 2012-04-04 | 2012-06-26 | Good Start Genetics, Inc. | Sequence assembly |
US8812422B2 (en) | 2012-04-09 | 2014-08-19 | Good Start Genetics, Inc. | Variant database |
US10227635B2 (en) | 2012-04-16 | 2019-03-12 | Molecular Loop Biosolutions, Llc | Capture reactions |
DK2852680T3 (da) | 2012-05-21 | 2020-03-16 | Sequenom Inc | Fremgangsmåder og processer til ikke-invasiv evaluering af genetiske variationer |
US9193992B2 (en) | 2012-06-05 | 2015-11-24 | Agilent Technologies, Inc. | Method for determining ploidy of a cell |
EP2861787B1 (en) | 2012-06-18 | 2017-09-20 | Nugen Technologies, Inc. | Compositions and methods for negative selection of non-desired nucleic acid sequences |
WO2014036167A1 (en) | 2012-08-28 | 2014-03-06 | The Broad Institute, Inc. | Detecting variants in sequencing data and benchmarking |
US9940434B2 (en) | 2012-09-27 | 2018-04-10 | The Children's Mercy Hospital | System for genome analysis and genetic disease diagnosis |
WO2014059196A2 (en) | 2012-10-10 | 2014-04-17 | The Trustees Of Columbia University In The City Of New York | Diagnosis and treatment of sma and smn deficiency |
US20140129201A1 (en) | 2012-11-07 | 2014-05-08 | Good Start Genetics, Inc. | Validation of genetic tests |
US20140222349A1 (en) | 2013-01-16 | 2014-08-07 | Assurerx Health, Inc. | System and Methods for Pharmacogenomic Classification |
US20160186262A1 (en) | 2013-01-23 | 2016-06-30 | Reproductive Genetics And Technology Solutions, Llc | Compositions and methods for genetic analysis of embryos |
AU2014248511B2 (en) | 2013-03-12 | 2018-05-10 | Myriad Women’s Health, Inc. | Systems and methods for prenatal genetic analysis |
WO2014152990A1 (en) | 2013-03-14 | 2014-09-25 | University Of Rochester | System and method for detecting population variation from nucleic acid sequencing data |
US8778609B1 (en) | 2013-03-14 | 2014-07-15 | Good Start Genetics, Inc. | Methods for analyzing nucleic acids |
WO2014197377A2 (en) | 2013-06-03 | 2014-12-11 | Good Start Genetics, Inc. | Methods and systems for storing sequence read data |
US9579656B2 (en) | 2013-06-11 | 2017-02-28 | J. G. Finneran Associates, Inc. | Rotation-limiting well plate assembly |
US9116866B2 (en) | 2013-08-21 | 2015-08-25 | Seven Bridges Genomics Inc. | Methods and systems for detecting sequence variants |
WO2015057565A1 (en) | 2013-10-18 | 2015-04-23 | Good Start Genetics, Inc. | Methods for assessing a genomic region of a subject |
US11339435B2 (en) | 2013-10-18 | 2022-05-24 | Molecular Loop Biosciences, Inc. | Methods for copy number determination |
DK3102722T3 (da) | 2014-02-04 | 2020-11-16 | Jumpcode Genomics Inc | Genom fraktionering |
WO2016040446A1 (en) | 2014-09-10 | 2016-03-17 | Good Start Genetics, Inc. | Methods for selectively suppressing non-target sequences |
WO2016112073A1 (en) | 2015-01-06 | 2016-07-14 | Good Start Genetics, Inc. | Screening for structural variants |
CA3011035A1 (en) | 2015-01-15 | 2016-07-21 | Good Start Genetics, Inc. | Devices and systems for barcoding individual wells and vessels |
CN108350500A (zh) | 2015-07-29 | 2018-07-31 | 普罗格尼迪公司 | 用于检测染色体异常的核酸和方法 |
-
2010
- 2010-04-30 CA CA2760439A patent/CA2760439A1/en not_active Abandoned
- 2010-04-30 JP JP2012508490A patent/JP2012525147A/ja active Pending
- 2010-04-30 EP EP10770071A patent/EP2425240A4/en not_active Ceased
- 2010-04-30 AU AU2010242073A patent/AU2010242073C1/en not_active Ceased
- 2010-04-30 WO PCT/US2010/001293 patent/WO2010126614A2/en active Application Filing
-
2011
- 2011-10-30 IL IL216054A patent/IL216054A/en active IP Right Grant
-
2015
- 2015-08-24 JP JP2015164811A patent/JP2016000046A/ja active Pending
-
2020
- 2020-11-19 US US16/952,764 patent/US11840730B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
AU2010242073B2 (en) | 2015-09-03 |
JP2012525147A (ja) | 2012-10-22 |
CA2760439A1 (en) | 2010-11-04 |
IL216054A (en) | 2016-03-31 |
WO2010126614A2 (en) | 2010-11-04 |
EP2425240A2 (en) | 2012-03-07 |
AU2010242073A1 (en) | 2011-11-24 |
US11840730B1 (en) | 2023-12-12 |
EP2425240A4 (en) | 2012-12-12 |
AU2010242073C1 (en) | 2015-12-24 |
IL216054A0 (en) | 2012-01-31 |
WO2010126614A3 (en) | 2011-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11840730B1 (en) | Methods and compositions for evaluating genetic markers | |
JP6878631B2 (ja) | 非侵襲的に胎児の性染色体異数性のリスクを計算する方法 | |
US20120165202A1 (en) | Methods and compositions for evaluating genetic markers | |
KR102210852B1 (ko) | 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법 | |
US9624490B2 (en) | Multiplexed sequential ligation-based detection of genetic variants | |
US20140051585A1 (en) | Methods and compositions for reducing genetic library contamination | |
US20200123538A1 (en) | Compositions and methods for library construction and sequence analysis | |
US20130337447A1 (en) | Methods and compositions for evaluating genetic markers | |
AU2019283856B2 (en) | Non-invasive fetal sex determination | |
WO2017193044A1 (en) | Noninvasive prenatal diagnostic | |
EP2885445A1 (en) | Methods and compositions for reducing genetic library contamination | |
CA2907177A1 (en) | Methods and compositions for evaluating genetic markers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160705 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170209 |