JP2018514207A - 特異的分子インデックス(umi)を有する冗長リードを用いたシーケンシングdna断片におけるエラーの抑制 - Google Patents
特異的分子インデックス(umi)を有する冗長リードを用いたシーケンシングdna断片におけるエラーの抑制 Download PDFInfo
- Publication number
- JP2018514207A JP2018514207A JP2017555568A JP2017555568A JP2018514207A JP 2018514207 A JP2018514207 A JP 2018514207A JP 2017555568 A JP2017555568 A JP 2017555568A JP 2017555568 A JP2017555568 A JP 2017555568A JP 2018514207 A JP2018514207 A JP 2018514207A
- Authority
- JP
- Japan
- Prior art keywords
- umi
- sequence
- physical
- double
- adapter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000012634 fragment Substances 0.000 title claims abstract description 381
- 238000012163 sequencing technique Methods 0.000 title claims description 227
- 230000001629 suppression Effects 0.000 title description 7
- 238000000034 method Methods 0.000 claims abstract description 241
- 239000002157 polynucleotide Substances 0.000 claims abstract description 104
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 104
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 104
- 108700028369 Alleles Proteins 0.000 claims abstract description 19
- 238000004590 computer program Methods 0.000 claims abstract description 17
- 108020004414 DNA Proteins 0.000 claims description 356
- 102000053602 DNA Human genes 0.000 claims description 175
- 239000002773 nucleotide Substances 0.000 claims description 160
- 125000003729 nucleotide group Chemical group 0.000 claims description 160
- 150000007523 nucleic acids Chemical class 0.000 claims description 92
- 102000039446 nucleic acids Human genes 0.000 claims description 65
- 108020004707 nucleic acids Proteins 0.000 claims description 65
- 230000000295 complement effect Effects 0.000 claims description 45
- 108091034117 Oligonucleotide Proteins 0.000 claims description 39
- 238000002360 preparation method Methods 0.000 claims description 24
- 206010028980 Neoplasm Diseases 0.000 claims description 15
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 9
- 230000009977 dual effect Effects 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 8
- 108091008146 restriction endonucleases Proteins 0.000 claims description 8
- 239000000523 sample Substances 0.000 description 201
- 108091035707 Consensus sequence Proteins 0.000 description 61
- 239000000047 product Substances 0.000 description 59
- 210000004027 cell Anatomy 0.000 description 40
- 230000008569 process Effects 0.000 description 40
- 238000012360 testing method Methods 0.000 description 35
- 230000003321 amplification Effects 0.000 description 28
- 238000003199 nucleic acid amplification method Methods 0.000 description 28
- 238000007481 next generation sequencing Methods 0.000 description 23
- 210000000349 chromosome Anatomy 0.000 description 21
- 108091028043 Nucleic acid sequence Proteins 0.000 description 18
- 239000011324 bead Substances 0.000 description 18
- 239000012530 fluid Substances 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 16
- 238000003786 synthesis reaction Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 15
- 210000002381 plasma Anatomy 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 13
- 238000013467 fragmentation Methods 0.000 description 13
- 238000006062 fragmentation reaction Methods 0.000 description 13
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 12
- 238000013461 design Methods 0.000 description 12
- 210000004369 blood Anatomy 0.000 description 11
- 239000008280 blood Substances 0.000 description 11
- 238000003745 diagnosis Methods 0.000 description 11
- 150000002500 ions Chemical class 0.000 description 11
- 230000009191 jumping Effects 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 206010069754 Acquired gene mutation Diseases 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 210000003296 saliva Anatomy 0.000 description 10
- 230000037439 somatic mutation Effects 0.000 description 10
- 238000013459 approach Methods 0.000 description 9
- 238000012937 correction Methods 0.000 description 9
- 230000001965 increasing effect Effects 0.000 description 9
- 230000000670 limiting effect Effects 0.000 description 9
- 230000002441 reversible effect Effects 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 8
- 239000002299 complementary DNA Substances 0.000 description 8
- 238000013507 mapping Methods 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 8
- 210000002966 serum Anatomy 0.000 description 8
- 239000013060 biological fluid Substances 0.000 description 7
- 229960002685 biotin Drugs 0.000 description 7
- 239000011616 biotin Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000010348 incorporation Methods 0.000 description 7
- 108090000623 proteins and genes Proteins 0.000 description 7
- 238000011282 treatment Methods 0.000 description 7
- 238000012408 PCR amplification Methods 0.000 description 6
- 235000020958 biotin Nutrition 0.000 description 6
- 230000001605 fetal effect Effects 0.000 description 6
- 229920001519 homopolymer Polymers 0.000 description 6
- 230000008774 maternal effect Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 210000002700 urine Anatomy 0.000 description 6
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 5
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 238000001574 biopsy Methods 0.000 description 5
- 239000007795 chemical reaction product Substances 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 239000000975 dye Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000002203 pretreatment Methods 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- -1 cell-free DNA Chemical class 0.000 description 4
- 239000007850 fluorescent dye Substances 0.000 description 4
- 238000007672 fourth generation sequencing Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 210000003917 human chromosome Anatomy 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 102000054765 polymorphisms of proteins Human genes 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 230000037452 priming Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000007841 sequencing by ligation Methods 0.000 description 4
- 210000004243 sweat Anatomy 0.000 description 4
- 210000001138 tear Anatomy 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 3
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 210000003027 ear inner Anatomy 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013412 genome amplification Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 235000020256 human milk Nutrition 0.000 description 3
- 210000004251 human milk Anatomy 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 238000002663 nebulization Methods 0.000 description 3
- 210000005259 peripheral blood Anatomy 0.000 description 3
- 239000011886 peripheral blood Substances 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 238000010008 shearing Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 3
- 206010003445 Ascites Diseases 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 210000002593 Y chromosome Anatomy 0.000 description 2
- 101100100104 Zea mays TPS6 gene Proteins 0.000 description 2
- 210000004381 amniotic fluid Anatomy 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 238000004630 atomic force microscopy Methods 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000009223 counseling Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000000968 intestinal effect Effects 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 210000004880 lymph fluid Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000005257 nucleotidylation Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 150000002972 pentoses Chemical class 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- 235000018102 proteins Nutrition 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000000241 respiratory effect Effects 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000000392 somatic effect Effects 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101150059145 SPS3 gene Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 229950006790 adenosine phosphate Drugs 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 230000006154 adenylylation Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- 238000000889 atomisation Methods 0.000 description 1
- 230000003851 biochemical process Effects 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- LIYGYAHYXQDGEP-UHFFFAOYSA-N firefly oxyluciferin Natural products Oc1csc(n1)-c1nc2ccc(O)cc2s1 LIYGYAHYXQDGEP-UHFFFAOYSA-N 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000008241 heterogeneous mixture Substances 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 238000013188 needle biopsy Methods 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- JJVOROULKOMTKG-UHFFFAOYSA-N oxidized Photinus luciferin Chemical compound S1C2=CC(O)=CC=C2N=C1C1=NC(=O)CS1 JJVOROULKOMTKG-UHFFFAOYSA-N 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 150000004713 phosphodiesters Chemical group 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 238000005498 polishing Methods 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000003793 prenatal diagnosis Methods 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000004627 transmission electron microscopy Methods 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 239000002569 water oil cream Substances 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/191—Modifications characterised by incorporating an adaptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/119—Double strand sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2565/00—Nucleic acid analysis characterised by mode or means of detection
- C12Q2565/50—Detection characterised by immobilisation to a surface
- C12Q2565/514—Detection characterised by immobilisation to a surface characterised by the use of the arrayed oligonucleotides as identifier tags, e.g. universal addressable array, anti-tag or tag complement array
Abstract
Description
本出願はASCIIフォーマットで電子的に提出される配列表を含み、その全体が参照により本明細書に組み込まれる。ASCIIコピーは2016年4月20日に作成されたもので、ILMNP008WO_ST25.txtと名付けられ、大きさは1164バイトである。
本明細書で言及する全ての特許、特許出願、および他の刊行物は、これらの参考文献内で開示される全ての配列を含め、個々の各刊行物、特許、または特許出願が参照により組み込まれることを具体的かつ個々に示されているのと同じ程度に、参照により本明細書に明示的に組み込まれる。関連部分において引用されるすべての文書は、本明細書におけるそれらの引用の文脈によって示される目的のために、参照によりそれらの全体として本明細書に組み入れられる。しかしながら、いかなる文書の引用も、それが本開示に対する先行技術であるという承認として解釈されるべきではない。
本明細書で用いる場合、単数形「1つ(a)」、「1つ(an)」、および「その(the)」には、文脈が明らかに他を意味する場合を除き、複数の指示対象が含まれる。
次世代シーケンシング(NGS)技術は急速に発展しており、先端研究および科学に新しいツールをもたらすと同時に、遺伝子および関連の生体情報に依拠する医療サービスも提供する。NGS法は、大規模並列的なやり方で実行され、生物分子の配列情報決定のますますの高速化をもたらす。しかしながら、NGS法の多くおよび関連のサンプル操作技術はエラーを発生させ、その結果、結果として生じる配列は比較的エラー率が高く、数百塩基対に1エラーから数千塩基対に1エラーに及ぶ。このようなエラー率は、生殖細胞系列変異などの遺伝性の遺伝子情報を決定する場合には、斯かる情報が、テストサンプルにおいて同じゲノムの多数のコピーを提供する大部分の体細胞全体で一致することから、時に許容される。配列の1コピーを読み取ることから生じるエラーの影響は、同じ配列の多数のコピーをエラーなしで読み取る場合は軽微または除去可能である。例えば、配列の1コピーからの誤ったリードを参照配列に適切にアライメントすることができない場合、それはただ分析から除かれるだけである。同じ配列の他のコピーからのエラーなしリードがなお、正当な分析に十分な情報を提供し得る。あるいは、同じ配列の他のリードとは異なる塩基対を有するリードを除く代わりに、既知のまたは未知のエラーソースから生じた異なる塩基対を無視することが可能である。
・体細胞突然変異の検出のためのエラー抑制(例えば、対立遺伝子頻度が0.1%未満の突然変異の検出は、循環腫瘍DNAのリキッドバイオプシーでは非常に肝要である)、
・高品質の長いリード(例えば、1x1000bp)を得るための、prephasing、phasing、および他のシーケンシングエラーの補正、
・固定されたリード長に対するサイクル時間の減少、ならびに本方法による増加したphasingおよびprephasingの補正、
・断片の両側にあるUMIを用いた、仮想の長いペアエンドリードの作成(例えば、複製において500+50を行うことにより、2x500リードをステッチする)を含む。
図1Aは、UMIを用いて核酸断片をシーケンシングするワークフロー例100を示すフローチャートである。操作102は、二本鎖DNAの断片を提供する。DNA断片は、例えば、ゲノムDNAを断片化する、自然に断片化されたDNA(例えば、cfDNAまたはctDNA)を集める、または、RNAからDNA断片を合成することによって得ることができる。一部の実施態様では、RNAからDNA断片を合成するために、メッセンジャーRNAをまず、polyA選択を用いるか、またはリボソーマルRNAを減少させて精製し、次に選択したmRNAを化学的に断片化し、ランダムなヘキサマープライミングを用いて一本鎖cDNAに変換する。cDNAの相補鎖を生成して、ライブラリ構築向けに準備の整った二本鎖cDNAを作成する。二本鎖DNA断片をゲノムDNA(gDNA)から得るには、インプットgDNAを、例えば流体力学的剪断、噴霧化、酵素的断片化などにより断片化して、適切な長さ、例えば約1000bp、800bp、500bp、または200bpの断片を生成する。例えば、噴霧化は短時間でDNAを粉砕し、800bp未満のピースにすることが可能である。このプロセスは、3’および/または5’のオーバーハングを含有する二本鎖DNA断片を生成する。
アダプター
前述のワークフロー例で記載したアダプター設計に加え、他のアダプター設計を本明細書で開示する方法およびシステムの種々の実施態様において用いることができる。図2Aは、種々の実施態様で採用することができる、UMIを有する異なる5つのアダプター設計を図式的に示す。
前述のアダプターの一部の実施態様において、アダプターの物理的UMIにはランダムUMIが含まれる。一部の実施態様では、各ランダムUMIは、DNA断片に適用される他のどのランダムUMIと異なる。言い換えると、ランダムUMIは、配列長を与えられた全ての可能性ある異なるUMIを含むUMIの組から交換なしにランダムに選択される。他の実施態様では、ランダムUMIは交換ありでランダムに選択される。これらの実施態様では、2つのアダプターは偶然により同じUMIを有する場合がある。
仮想UMIを見ると、ソースDNA分子の末端位置で、またはソースDNA分子の末端位置に関して定義される仮想UMIは、末端位置の場所が一部の断片および天然に存在するcfDNAと同様に遺伝子的にランダムである場合、特異的またはほぼ特異的に個別のソースDNA分子を定義することが可能である。サンプルが比較的少ないソースDNA分子を含有する場合、仮想UMI自体で個々のソースDNA分子を特定することが可能である。それぞれがソースDNA分子の異なる末端に関連する2つの仮想UMIの組み合わせを用いると、仮想UMIだけでソースDNA分子を特異的に特定できる可能性が高まる。当然、1つまたは2つの仮想UMIだけではソースDNA分子を特異的に特定することができない場合であっても、このような仮想UMIと1つまたは複数の物理的UMIの組み合わせは成功する場合がある。
UMIを用いる種々の実施態様では、同じUMIを有する多数の配列リードを折りたたんで1つまたは複数のコンセンサス配列を得て、これを次に、ソースDNA分子の配列を決定するために用いる。多数の別個のリードは、同じソースDNA分子の別個の事例から生成させることができ、これらのリードを比較して、本明細書に記載のコンセンサス配列を作る。事例は、シーケンシング前にソースDNA分子を増幅することにより生成することができ、その結果、それぞれがソースDNA分子の配列を共有する別個の増幅産物において別個のシーケンシング操作が実行される。当然、増幅はエラーを引き起こし得、その結果別個の増幅産物の配列に差が生じる。Illumina社のシーケンシング・バイ・シンセシスなどの一部のシーケンシング技術の文脈では、ソースDNA分子またはその増幅産物は、フローセル領域に結合したDNA分子のクラスタを形成する。クラスタの分子は集合体としてリードを提供する。典型的には、少なくとも2つのリードがコンセンサス配列を提供するのに必要である。100、1000、および10,000というシーケンシング深度が、低い対立遺伝子頻度(例えば、約1%以下)向けにコンセンサスリードを作成する開示の実施形態において有用な、シーケンシング深度の例である。
多数の技法を用いて、多数のUMIを含むリードを折りたたむことができる。一部の実施態様では、共通の物理的UMIを共有するリードを折りたたんで、コンセンサス配列を得ることが可能である。一部の実施態様では、共通の物理的UMIがランダムUMIである場合、該ランダムUMIは、サンプル中のDNA断片の特定のソース分子を特定するのに十分なほど特異的であり得る。他の実施態様では、共通の物理的UMIが非ランダムUMIである場合、該UMIはそれだけで特定のソース分子を特定するのに十分なほど特異的ではない場合がある。何れの場合でも、物理的UMIを仮想UMIと組み合わせてソース分子のインデックスを提供することができる。
一部の実施態様では、リードを処理して参照配列に整列させ、参照配列におけるリードのアライメント位置を決める(位置測定)。しかしながら、上記に示さない一部の実施態様では、位置測定は、k−mer類似性分析およびリード−リードアライメントにより達成される。この第2実施態様には2つの利点がある:第1に、それはハロタイプの違いまたは転座が原因で参照にマッチしないリードも折りたたむことが可能であること(エラー補正)、第2に、アライナアルゴリズムに依存しないことにより、アライナが引き起こす人工物(アライナにおけるエラー)の可能性が取り除かれることである。一部の実施態様では、同じ位置測定情報を共有するリードを折りたたんで、ソースDNA断片の配列を決定するためのコンセンサス配列を得ることができる。一部の文脈では、アライメントプロセスはマッピングプロセスともいう。配列リードをアライメントプロセスにかけて、参照配列にマッピングする。種々のアライメントツールおよびアルゴリズムを用いて、本開示のどこか他で記載するように、リードを参照配列に整列させることができる。通常のように、アライメントアルゴリズムにおいて、一部のリードは上手く参照配列に整列する一方、他は参照配列に上手く整列しない、または参照配列への整列が不完全である場合がある。参照配列に上手く整列するリードは、参照配列の部位に関連する。整列させたリードおよびその関連部位は、配列タグともいう。多数の繰り返しを含有する一部の配列リードは、参照配列に整列させることがより難しい傾向がある。リードを、ある基準を超える数のミスマッチ塩基を有する参照配列に整列させる場合、リードは上手く整列しないと考えられる。種々の実施形態では、リードが少なくとも約1、2、3、4、5、6、7、8、9、または10個のミスマッチと整列させる場合、該リードは上手く整列しないと考えられる。他の実施形態では、リードを少なくとも約5%のミスマッチと整列させる場合、該リードは上手く整列しないと考えられる。他の実施形態では、リードを少なくとも約10%、15%、または20%のミスマッチ塩基と整列させる場合、該リードは上手く整列しないと考えられる。
種々のアプリケーションでは、本明細書で開示するエラー補正戦略は、以下の利点のうち1つまたは複数を提供し得る:(i)対立遺伝子頻度が非常に低い体細胞変異体を検出する、(ii)phasing/prephasingエラーを減少させることによりサイクル時間を減少させる、および/または、(iii)リードの後部におけるベースコールの質を増強することによりリード長を長くするなどである。対立遺伝子頻度の低い体細胞変異体の検出に関わるアプリケーションおよび基本原理は前述してある。
DNA断片配列の決定に用いるサンプルには、核酸を含む任意の細胞、液体、組織、または臓器から採取したサンプルが含まれ得、ここで対象の配列を決定することができる。がんの診断を含む一部の実施形態では、循環腫瘍DNAは、対象の体液、例えば血液または血漿から得ることができる。胎児の診断を含む一部の実施形態では、セルフリー核酸、例えばセルフリーDNA(cfDNA)は母体体液から得るのが好都合である。セルフリーDNAを含むセルフリー核酸は、当技術分野で既知の種々の方法により、限定するわけではないが、血漿、血清、尿を含む生物学的サンプルから得ることが可能である(例えば、Fan et al.,Proc Natl Acad Sci 105:16266−16271[2008];Koide et al.,Prenatal Diagnosis 25:604−607 [2005];Chen et al.,Nature Med.2:1033−1035 [1996];Lo et al.,Lancet 350:485−487 [1997];Botezatu et al.,Clin Chem.46:1078−1084,2000;and Su et al.,J Mol.Diagn.6:101−107[2004]参照)。
種々の実施形態において、シーケンシングは、シーケンシングライブラリの調製を必要とする種々のシーケンシングプラットフォームにおいて実行することができる。調製には、典型的には、DNAの断片化(音波処理、噴霧化、またはせん断)に続き、DNA修復および末端ポリッシング(平滑末端はまたはAオーバーハング)、ならびにプラットフォーム特異的アダプターライゲーションが含まれる。一実施形態では、本明細書に記載の方法は次世代シーケンシング技法(NGS)を利用することが可能であり、これにより、多数のサンプルを単一のシーケンシングランで、ゲノム分子として個別にシーケンシングするか(つまり、一重シーケンシング)、または、インデックスを付けたゲノム分子を含むプールされたサンプルとしてシーケンシングする(つまり、多重シーケンシング)ことが可能になる。これらの方法は、最大数億個のDNA配列リードを生成することが可能である。種々の実施形態では、ゲノム核酸および/またはインデックス付きゲノム核酸の配列を、例えば、本明細書に記載する次世代シーケンシング技法(NGS)を用いて決定することが可能である。種々の実施形態では、NGSを用いて得られた大量の配列データの解析は、本明細書に記載の1つまたは複数のプロセッサを用いて実行することが可能である。
本明細書に記載する方法および装置は、次世代シーケンシング技法(NGS)を用いることが可能であり、これは大規模並列シーケンシングを可能にする。ある実施形態では、クローン的に増幅したDNA鋳型または単一DNA分子を(例えばVolkerding et al.Clin Chem 55:641−658[2009];Metzker M Nature Rev 11:31−46[2010]に記載されているように)フローセル内で大規模並列的な方法でシーケンシングする。NGSのシーケンシング技法としては、限定するわけではないが、パイロシーケンシング、可逆性ダイターミネータを用いたシーケンシング・バイ・シンセシス、オリゴヌクレオチドプローブライゲーションによるシーケンシング、およびイオン半導体シーケンシングが挙げられる。個別サンプルに由来するDNAは、個別にシーケンシングするか(つまり、一重シーケンシング)、または、多数のサンプルに由来するDNAをプールしてインデックス付きゲノム分子として単一シーケンシングランでシーケンシングし(つまり、多重シーケンシング)、最大数億のDNA配列リードを生成することが可能である。本方法に従って配列情報を得るのに用いることが可能なシーケンシング技法の例について、さらに本明細書で記載する。
シーケンシングデータの解析およびそれに由来する診断は、典型的には、アルゴリズムおよびプログラムを実行する種々のコンピュータを用いて実行する。そのため、ある実施形態は、1つまたは複数のコンピュータシステムまたは他の処理システムに保存されるまたは転送されるデータを含むプロセスを利用する。本明細書に開示する実施形態は、また、これらの操作を実行するための装置にも関する。この装置は、必要な目的のために特別に構築されるか、または、該装置は、コンピュータプログラムおよび/またはコンピュータに保存されたデータ構造により選択的に作動するまたは再構成される汎用コンピュータ(またはコンピュータ群)とすることができる。一部の実施形態では、プロセッサ群は、言及した解析操作の一部またはすべてを共同的に(例えば、ネットワークまたはクラウドコンピューティングを介して)および/または並行して実行する。本明細書に記載の方法を実行するプロセッサまたはプロセッサ群は、プログラム可能な装置のようなマイクロコントローラおよびマイクロプロセッサ(例えば、CPLDおよびFPGA)ならびにゲートアレイASICなどのプラグラム固定式装置、または汎用マイクロプロセッサを含む種々のタイプとすることができる。
テストサンプルの核酸をシーケンシングすることによって得られるリード
リードを参照ゲノムまたは他の参照配列に整列させることによって得られるタグ
参照ゲノムまたは参照配列
テストサンプルを影響あり、影響なし、またはコールなしと判断するための閾値
対象の配列に関連する健康状態についての実際のコール
診断(コールと関連する病態)
判断および/または診断より導き出されたさらなる検査の勧告
判断および/もしくは診断より導き出された治療ならびに/またはモニタリング計画。
サンプル収集
シーケンシングの準備としてのサンプル処理
シーケンシング
配列データの解析および医療コールの導出
診断
患者または医療供給者への診断および/またはコールの報告
さらなる治療、テスト、および/またはモニタリングの計画の作成
計画の実行
カウンセリング。
実施例1
ランダム物理的UMIおよび仮想UMIを用いてエラー抑制
図7Aおよび図7Bは、本明細書に開示する方法を用いたエラー抑制の効率性を示す実験データを示す図である。実験者らはせん断されたNA12878のgDNAを用いた。該実験者らは、TruSeqライブラリ調製およびカスタムパネルを用いた濃縮を使用した(〜130Kb)。シーケンシングは2x150bpで、HiSeq(登録商標)2500の高速モードを用いて実行し、平均ターゲットカバレッジは〜10,000Xだった。図7Aは、標準的な方法を用いた高品質塩基(>Q30)のエラー率プロファイル(2番目に高い塩基の対立遺伝子頻度)を示す(平均エラー率は0.04%である)。図7Bは折りたたみ/UMIパイプラインのエラー率のプロファイルを示す(平均エラー率は0.007%である)。これらの結果はプロトタイプコードに基づき、さらにエラー率の低減は、改良された方法によって達成し得ることに注意されたい。
非ランダムな物理的UMIおよび位置を用いたエラー抑制
図8は、位置情報のみを用いてリードを折りたたむことは、実際には異なるソース分子に由来するリードを折りたたみがちであることを示すデータを示す。この現象は、リードの不一致ともいう。結果として、本方法は、サンプル中の断片数を過小評価する傾向がある。図8のY軸に示すのは、位置情報のみを用いてリードを折りたたむことによって観察される断片の数である。図8のX軸に示すのは、異なるSNPなどの異なる遺伝子型および他の遺伝子型に関する差異を考慮した推定断片数である。図に示すように、観察された断片数は、遺伝子型調整断片数よりも少なく、これは、位置情報のみを用いてリードを折りたたみ、断片を特定する際の、過小評価とリードの不一致を示す。
Claims (53)
- 特異的分子インデックス(UMI)を用いてサンプルの核酸分子をシーケンシングする方法であって、各特異的分子インデックス(UMI)は、前記サンプル中の二本鎖DNA断片の個々の分子を特定するために用いることが可能なオリゴヌクレオチド配列であり:
(a)アダプターを前記サンプル中の二本鎖DNA断片の両末端に適用することによりDNA−アダプター産物を得るステップであって、前記アダプターはそれぞれ、二本鎖ハイブリッド領域、一本鎖5’アーム、一本鎖3’アーム、および該アダプターの一方の鎖または各鎖に物理的UMIを含む、ステップと;
(b)前記DNA−アダプター産物の両鎖を増幅させて複数の増幅ポリヌクレオチドを得るステップと;
(c)前記複数の増幅ポリヌクレオチドをシーケンシングすることにより、それぞれ物理的UMIと関連する複数のリードを得るステップと;
(d)前記複数のリードと関連する複数の物理的UMIを特定するステップと;
(e)前記複数のリードと関連する複数の仮想UMIを特定するステップであって、各仮想UMIは、前記サンプル中のDNA断片に見られる配列である、ステップと;
(f)前記サンプル中の二本鎖DNA断片の配列を、ステップ(c)で得られた複数のリード、ステップ(d)で特定された複数の物理的UMI、およびステップ(e)で特定された複数の仮想UMIを用いて決定するステップとを含む、方法。 - 前記ステップ(f)は:
前記サンプル中の1つまたは複数の二本鎖DNA断片のそれぞれについて、(i)第1物理的UMIおよび少なくとも1つの仮想UMIを有するリードと、(ii)第2物理的UMIおよび前記少なくとも1つの仮想UMIを有するリードとを組み合わせて、コンセンサスヌクレオチド配列を決定するステップと;
前記サンプル中の1つまたは複数の二本鎖DNA断片のそれぞれについて、前記コンセンサスヌクレオチド配列を用いて配列を決定するステップとを含む、
請求項1に記載の方法。 - 前記複数の物理的UMIはランダムUMIを含む、請求項1に記載の方法。
- 前記複数の物理的UMIは非ランダムUMIを含む、請求項1に記載の方法。
- どの非ランダムUMIも、該非ランダムUMIの対応する配列位置において、少なくとも2ヌクレオチド分、前記アダプターの他のどの非ランダムUMIとも異なる、請求項4に記載の方法。
- 前記複数の物理的UMIは約10,000個以下の特異的な非ランダムUMIを含む、請求項5に記載の方法。
- 前記複数の物理的UMIは約1,000個以下の特異的な非ランダムUMIを含む、請求項6に記載の方法。
- 前記複数の物理的UMIは約500個以下の特異的な非ランダムUMIを含む、請求項7に記載の方法。
- 前記複数の物理的UMIは約100個以下の特異的な非ランダムUMIを含む、請求項8に記載の方法。
- 前記複数の物理的UMIは約96個の特異的な非ランダムUMIを含む、請求項9に記載の方法。
- 二本鎖DNA断片の両末端にアダプターを適用するステップは、前記二本鎖DNA断片の両末端に前記アダプターをライゲーションするステップを含む、請求項1に記載の方法。
- 前記ステップ(f)は、共通の物理的UMIと共通の仮想UMIとを共有するリードを用いて前記サンプルのDNA断片の配列を決定するステップを含む、請求項1に記載の方法。
- 前記複数の物理的UMIは12個未満のヌクレオチドを含む、請求項1に記載の方法。
- 前記複数のUMIは6個以下のヌクレオチドを含む、請求項13に記載の方法。
- 前記複数のUMIは4個以下のヌクレオチドを含む、請求項13に記載の方法。
- 前記アダプターはそれぞれ、前記二本鎖ハイブリッド領域のアダプターの各鎖において物理的UMIを含む、請求項1に記載の方法。
- 前記物理的UMIは前記3’アームまたは前記5’アームの向かい側にある前記二本鎖ハイブリッド領域の末端またはその近くにある、請求項16に記載の方法。
- 前記物理的UMIは前記二本鎖ハイブリッド領域の末端にあるか、または、前記二本鎖ハイブリッド領域の末端から1ヌクレオチド離れている、請求項17に記載の方法。
- 前記アダプターはそれぞれ、物理的UMIに隣接する前記二本鎖ハイブリッド領域において5’−TGG−3’トリヌクレオチドまたは3’−ACC−5’トリヌクレオチドを含む、請求項18に記載の方法。
- 前記アダプターはそれぞれ、前記二本鎖ハイブリッド領域の各鎖においてリードプライマー配列を含む、請求項19に記載の方法。
- 前記アダプターはそれぞれ、前記一本鎖5’アームまたは前記一本鎖3’アームのアダプターの一方の鎖においてのみ物理的UMIを含む、請求項1に記載の方法。
- 前記ステップ(f)は:
(i)同一の第1物理的UMIを有するリードを折りたたんで第1グループにして、第1コンセンサスヌクレオチド配列を得るステップと;
(ii)同一の第2物理的UMIを有するリードを折りたたんで第2グループにして、第2コンセンサスヌクレオチド配列を得るステップと;
(iii)前記第1コンセンサスヌクレオチド配列および前記第2コンセンサスヌクレオチド配列を用いて、前記サンプル中の二本鎖DNA断片の1つの配列を決定するステップとを含む、請求項21に記載の方法。 - 前記ステップ(iii)は:(1)前記第1コンセンサスヌクレオチド配列および前記第2コンセンサスヌクレオチド配列の位置測定情報および配列情報を用いて、第3コンセンサスヌクレオチド配列を得るステップと、(2)前記第3コンセンサスヌクレオチド配列を用いて、前記二本鎖DNA断片の1つの配列を決定するステップとを含む、請求項22に記載の方法。
- 前記ステップ(e)は、前記複数の仮想UMIを特定するステップを含み、一方、前記アダプターはそれぞれ、前記一本鎖5’アームまたは前記一本鎖3’アームにおいてのみ前記物理的UMIを含む、請求項21に記載の方法。
- 前記ステップ(f)は:
(i)第1物理的UMIおよび少なくとも1つの仮想UMIをリード方向で有するリードと、第2物理的UMIおよび前記少なくとも1つの仮想UMIを前記リード方向で有するリードとを組み合わせて、コンセンサスヌクレオチド配列を決定するステップと;
(ii)前記サンプル中の二本鎖DNA断片の1つの配列を、前記コンセンサスヌクレオチド配列を用いて決定するステップとを含む、請求項24に記載の方法。 - 前記アダプターはそれぞれ、前記アダプターの二本鎖領域のアダプターの各鎖において物理的UMIを含み、一方の鎖における前記物理的UMIは、もう一方の鎖の前記物理的UMIに対し相補的である、請求項1に記載の方法。
- 前記ステップ(f)は:
(i)第1物理的UMI、少なくとも1つの仮想UMI、および第2物理的UMIを5’から3’の方向で有するリードと、前記第2物理的UMI、前記少なくとも1つの仮想UMI、および前記第1物理的UMIを5’から3’の方向で有するリードとを組み合わせて、コンセンサスヌクレオチド配列を決定するステップと;
(ii)前記サンプル中の二本鎖DNA断片の1つの配列を、前記コンセンサスヌクレオチド配列を用いて決定するステップとを含む、請求項26に記載の方法。 - 前記アダプターはそれぞれ、前記アダプターの3’アームにおいて第1物理的UMIを、前記アダプターの5’アームにおいて第2物理的UMIを含み、前記第1物理的UMIおよび前記第2物理的UMIは互いに相補的ではない、請求項1に記載の方法。
- ステップ(f)は:
(i)第1物理的UMI、少なくとも1つの仮想UMI、および第2物理的UMIを5’から3’の方向で有するリードと、第3物理的UMI、前記少なくとも1つの仮想UMI、および第4物理的UMIを5’から3’の方向で有するリードとを組み合わせて、コンセンサスヌクレオチド配列を決定するステップと;
(ii)前記サンプル中の二本鎖DNA断片の1つの配列を、前記コンセンサスヌクレオチド配列を用いて決定するステップとを含む、請求項28に記載の方法。 - 前記仮想UMIの少なくとも一部は、前記サンプル中の二本鎖DNA断片の末端またはその近くのサブ配列に由来する、請求項1に記載の方法。
- 1つもしくは複数の物理的UMIおよび/または1つもしくは複数の仮想UMIは、前記サンプル中の二本鎖DNA断片と特異的に関連する、請求項1に記載の方法。
- 前記サンプル中の二本鎖DNA断片は約1,000個超のDNA断片を含む、請求項1に記載の方法。
- 前記複数の仮想UMIは約6bp〜約24bpのUMIを含む、請求項1に記載の方法。
- 前記複数の仮想UMIは約6bp〜約10bpのUMIを含む、請求項33に記載の方法。
- 操作ステップ(c)において前記複数のリードを得るステップは:前記増幅ポリヌクレオチドのそれぞれから2つのペアエンドリードを得るステップであって、前記2つのペアエンドリードは長リードと短リードを含み、前記長リードは前記短リードよりも長い、ステップを含む、請求項1に記載の方法。
- ステップ(f)は:
第1物理的UMIと関連するリードペアを第1グループにまとめ、第2物理的UMIと関連するリードペアを第2グループにまとめるステップであって、前記第1物理的UMIおよび前記第2物理的UMIは前記サンプル中の二本鎖断片と特異的に関連する、ステップと;
前記サンプル中の二本鎖断片の配列を、前記第1グループの長リードの配列情報および前記第2グループの長リードの配列情報を用いて決定するステップとを含む、請求項35に記載の方法。 - 前記長リードのリード長は約500bp以上である、請求項35に記載の方法。
- 前記短リードのリード長は約50bp以下である、請求項35に記載の方法。
- 以下の操作:PCR、ライブラリ調製、クラスタ化、およびシーケンシングのうち1つまたは複数で起きるエラーを抑制する、請求項1に記載の方法。
- 前記増幅ポリヌクレオチドは、対立遺伝子頻度が約1%より低い対立遺伝子を含む、請求項1に記載の方法。
- 前記増幅ポリヌクレオチドは腫瘍に由来するセルフリーDNA分子を含み、前記対立遺伝子は腫瘍を示唆する、請求項40に記載の方法。
- 前記複数の増幅ポリヌクレオチドをシーケンシングするステップは、少なくとも約100bpを有するリードを得るステップを含む、請求項1に記載の方法。
- 各鎖に物理的UMIを有する二重シーケンシングアダプターを作成する方法であって:
二本鎖ハイブリッド領域と、2つの一本鎖アームと、二本鎖ハイブリッド領域の末端において、前記2つの一本鎖アームからさらに離れて5’−CCANNNNANNNNTGG−3’を含むオーバーハングとを含む予備シーケンシングアダプターを提供するステップと;
前記二本鎖ハイブリッド領域の一方の鎖を、前記オーバーハングを鋳型として用いて伸長させることにより、伸長産物を生成するステップと;
制限酵素Xcm1を適用して前記伸長産物の二本鎖末端を消化することにより、物理的UMIを各鎖に有する二重シーケンシングアダプターを生成するステップとを含む、方法。 - 前記予備シーケンシングアダプターは各鎖においてリードプライマー配列を含む、請求項43に記載の方法。
- コンピュータシステムの1つまたは複数のプロセッサにより実行された場合、サンプル中の対象配列の配列情報を、前記サンプル中の二本鎖DNA断片の個々の分子を特定するために用いることが可能なオリゴヌクレオチド配列である特異的分子インデックス(UMI)を用いて決定する方法を前記コンピュータシステムに実行させるプログラムコードを記憶している非一時的な機械可読媒体を含むコンピュータプログラム製品であって、前記プログラムコードは:
複数の増幅ポリヌクレオチドのリードを得るためのコードであって、前記複数の増幅ポリヌクレオチドは、対象の配列を含む前記サンプル中の二本鎖DNA断片を増幅させ、前記二本鎖DNA断片にアダプターを結合させることにより得られる、コードと;
前記複数の増幅ポリヌクレオチドのリードにおける複数の物理的UMIを特定するためのコードであって、各物理的UMIは前記二本鎖DNA断片の1つに結合したアダプターにおいて見られる、コードと;
前記複数の増幅ポリヌクレオチドのリードにおける複数の仮想UMIを特定するためのコードであって、各仮想UMIは前記二本鎖DNA断片の1つの個々の分子に見られる、コードと;
前記二本鎖DNA断片の配列を、前記複数の増幅ポリヌクレオチドのリード、前記複数の物理的UMI、および前記複数の仮想UMIを用いて決定することにより、前記二本鎖DNA断片の決定配列におけるエラーを減少させるコードとを含む、コンピュータプログラム製品。 - 前記アダプターはそれぞれ、二本鎖ハイブリッド領域、一本鎖5’アーム、一本鎖3’アーム、および該アダプターの一方の鎖または各鎖において物理的な特異的分子インデックス(UMI)を含む、請求項45に記載のコンピュータプログラム製品。
- 前記二本鎖DNA断片の配列を決定するためのコードは:
(i)同一の第1物理的UMIを有するリードを折りたたんで第1グループにして、第1コンセンサスヌクレオチド配列を得るためのコードと;
(ii)同一の第2物理的UMIを有するリードを折りたたんで第2グループにして、第2コンセンサスヌクレオチド配列を得るためのコードと;
(iii)前記第1コンセンサスヌクレオチド配列および前記第2コンセンサスヌクレオチド配列を用いて、前記サンプル中の二本鎖DNA断片の1つの配列を決定するコードとを含む、請求項45に記載のコンピュータプログラム製品。 - 前記二本鎖DNA断片の配列を決定するためのコードは:
(i)第1物理的UMI、少なくとも1つの仮想UMI、および第2物理的UMIを5’から3’の方向で有する配列リードと、前記第2物理的UMI、前記少なくとも1つの仮想UMI、および前記第1物理的UMIを5’から3’の方向で有する配列リードとを組み合わせて、コンセンサスヌクレオチド配列を決定するためのコードと;
(ii)前記サンプル中の二本鎖DNA断片の1つの配列を、前記コンセンサスヌクレオチド配列を用いて決定するためのコードとを含む、請求項45に記載のコンピュータプログラム製品。 - 1つまたは複数のプロセッサと;
システムメモリと;
1つまたは複数のコンピュータ可読記憶媒体とを含む、コンピュータシステムであって、
前記コンピュータ可読記憶媒体はその中に、サンプル中の対象配列の配列情報を、前記サンプル中の二本鎖DNA断片の個々の分子を特定するのに用いることが可能なオリゴヌクレオチド配列である特異的分子インデックス(UMI)を用いて決定する方法を前記コンピュータシステムに実行させる、コンピュータ実行可能な指示を記憶しており、
前記指示は:
複数の増幅ポリヌクレオチドのリードを受け取る指示であって、前記複数の増幅ポリヌクレオチドは、対象の配列を含む前記サンプル中の二本鎖DNA断片を増幅させ、前記二本鎖DNA断片にアダプターを結合させることにより得られる、指示と;
受け取った前記複数の増幅ポリヌクレオチドのリードの複数の物理的UMIを特定する指示であって、各物理的UMIは前記二本鎖DNA断片の1つに結合したアダプターにおいて見られる、指示と;
受け取った前記複数の増幅ポリヌクレオチドのリードの複数の仮想UMIを特定する指示であって、各仮想UMIは前記二本鎖DNA断片の1つの個々の分子に見られる、指示と;
前記二本鎖DNA断片の配列を、前記複数の増幅ポリヌクレオチドの配列、前記複数の物理的UMI、および前記複数の仮想UMIを用いて決定することにより、前記二本鎖DNA断片の決定配列におけるエラーを減少させる、指示とを含む、コンピュータシステム。 - 前記二本鎖DNA断片の配列を決定する指示は:
(i)同一の第1物理的UMIを有するリードを折りたたんで第1グループにして、第1コンセンサスヌクレオチド配列を得る指示と;
(ii)同一の第2物理的UMIを有するリードを折りたたんで第2グループにして、第2コンセンサスヌクレオチド配列を得る指示と;
(iii)前記第1コンセンサスヌクレオチド配列および前記第2コンセンサスヌクレオチド配列を用いて、前記二本鎖DNA断片の1つの配列を決定する指示とを含む、請求項49に記載のコンピュータシステム。 - 前記二本鎖DNA断片の配列を決定する指示は:
(i)第1物理的UMI、少なくとも1つの仮想UMI、および第2物理的UMIを5’から3’の方向で有するリードと、前記第2物理的UMI、前記少なくとも1つの仮想UMI、および前記第1物理的UMIを5’から3’の方向で有するリードとを組み合わせて、コンセンサスヌクレオチド配列を決定する指示と;
(ii)前記二本鎖DNA断片の1つの配列を、前記コンセンサスヌクレオチド配列を用いて決定する指示とを含む、請求項49に記載のコンピュータシステム。 - サンプル由来の核酸分子をシーケンシングする方法であって:
(a)アダプターを前記サンプル中の二本鎖DNA断片の両末端に結合させるステップであって、
前記アダプターはそれぞれ、二本鎖ハイブリッド領域、一本鎖5’アーム、一本鎖3’アーム、および前記一本鎖5’アームまたは前記一本鎖3’アームに物理的な特異的分子インデックス(UMI)を含み、
UMIは、前記サンプル中の二本鎖DNA断片の個々の分子を特定するために用いることが可能なオリゴヌクレオチド配列である、ステップと;
(b)(a)のライゲーション産物の両鎖を増幅することにより、複数の一本鎖増幅ポリヌクレオチドを得るステップと;
(c)前記複数の増幅ポリヌクレオチドをシーケンシングすることにより、物理的UMIとそれぞれ関連する複数のリードを得るステップと;
(d)前記複数のリードと関連する複数の物理的UMIを特定するステップと;
(e)前記サンプル中の二本鎖DNA断片の配列を、(c)で得た複数の配列および(d)で特定した複数の物理的UMIを用いて決定するステップとを含む、方法。 - サンプルに由来する核酸分子をシーケンシングする方法であって:
(a)アダプターを前記サンプル中の二本鎖DNA断片の両末端に結合させるステップであって、
前記アダプターはそれぞれ、二本鎖ハイブリッド領域、一本鎖5’アーム、一本鎖3’アーム、および前記アダプターの一方の鎖または各鎖において12ヌクレオチドより短い物理的な特異的分子インデックス(UMI)を含み、
UMIは、前記サンプル中の二本鎖DNA断片の個々の分子を特定するために用いることが可能なオリゴヌクレオチド配列である、ステップと;
(b)(a)のライゲーション産物の両鎖を増幅することにより、それぞれ物理的UMIを含む、複数の一本鎖増幅ポリヌクレオチドを得るステップと;
(c)前記複数の増幅ポリヌクレオチドをシーケンシングすることにより、物理的UMIとそれぞれ関連する複数のリードを得るステップと;
(d)前記複数のリードと関連する複数の物理的UMIを特定するステップと;
(e)前記サンプル中の二本鎖DNA断片の配列を、(c)で得た複数のリードおよび(d)で特定した複数の物理的UMIを用いて決定するステップとを含む、方法。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562153699P | 2015-04-28 | 2015-04-28 | |
US62/153,699 | 2015-04-28 | ||
US201562193469P | 2015-07-16 | 2015-07-16 | |
US62/193,469 | 2015-07-16 | ||
US201562269485P | 2015-12-18 | 2015-12-18 | |
US62/269,485 | 2015-12-18 | ||
PCT/US2016/028430 WO2016176091A1 (en) | 2015-04-28 | 2016-04-20 | Error suppression in sequenced dna fragments using redundant reads with unique molecular indices (umis) |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018514207A true JP2018514207A (ja) | 2018-06-07 |
JP6685324B2 JP6685324B2 (ja) | 2020-04-22 |
Family
ID=55910388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017555568A Active JP6685324B2 (ja) | 2015-04-28 | 2016-04-20 | 特異的分子インデックス(umi)を有する冗長リードを用いたシーケンシングdna断片におけるエラーの抑制 |
Country Status (20)
Country | Link |
---|---|
US (3) | US10844428B2 (ja) |
EP (3) | EP4266314A3 (ja) |
JP (1) | JP6685324B2 (ja) |
KR (1) | KR102091312B1 (ja) |
CN (2) | CN108138227B (ja) |
AU (3) | AU2016256351B2 (ja) |
BR (1) | BR112017024118A2 (ja) |
CA (2) | CA2983935C (ja) |
DK (2) | DK3289097T4 (ja) |
ES (2) | ES2799074T5 (ja) |
FI (2) | FI3736341T3 (ja) |
HK (1) | HK1244513A1 (ja) |
IL (3) | IL294600B1 (ja) |
MX (3) | MX2017013775A (ja) |
MY (1) | MY181983A (ja) |
NZ (1) | NZ736609A (ja) |
RU (1) | RU2704286C2 (ja) |
SG (2) | SG11201708859XA (ja) |
WO (1) | WO2016176091A1 (ja) |
ZA (1) | ZA201707231B (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3670670A1 (en) | 2018-12-18 | 2020-06-24 | Ricoh Company, Ltd. | Nucleic acid analysis method, nucleic acid analysis program, and device for library preparation |
KR20210035175A (ko) * | 2018-07-03 | 2021-03-31 | 캔서 호스피탈 차이니즈 아카데미 오브 메디컬 사이언스 | 다양한 간암 일반 돌연변이를 동시에 검출하는 ctDNA 라이브러리 제작 및 시퀀싱 데이터 분석 방법 |
US11447818B2 (en) | 2017-09-15 | 2022-09-20 | Illumina, Inc. | Universal short adapters with variable length non-random unique molecular identifiers |
US11761035B2 (en) | 2017-01-18 | 2023-09-19 | Illumina, Inc. | Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths |
US11866777B2 (en) | 2015-04-28 | 2024-01-09 | Illumina, Inc. | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) |
Families Citing this family (118)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11111543B2 (en) | 2005-07-29 | 2021-09-07 | Natera, Inc. | System and method for cleaning noisy genetic data and determining chromosome copy number |
US10081839B2 (en) | 2005-07-29 | 2018-09-25 | Natera, Inc | System and method for cleaning noisy genetic data and determining chromosome copy number |
US10083273B2 (en) | 2005-07-29 | 2018-09-25 | Natera, Inc. | System and method for cleaning noisy genetic data and determining chromosome copy number |
US9424392B2 (en) | 2005-11-26 | 2016-08-23 | Natera, Inc. | System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals |
US11111544B2 (en) | 2005-07-29 | 2021-09-07 | Natera, Inc. | System and method for cleaning noisy genetic data and determining chromosome copy number |
US8825412B2 (en) | 2010-05-18 | 2014-09-02 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
EP2473638B1 (en) | 2009-09-30 | 2017-08-09 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US11939634B2 (en) | 2010-05-18 | 2024-03-26 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US11332785B2 (en) | 2010-05-18 | 2022-05-17 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US11339429B2 (en) | 2010-05-18 | 2022-05-24 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US11408031B2 (en) | 2010-05-18 | 2022-08-09 | Natera, Inc. | Methods for non-invasive prenatal paternity testing |
US11332793B2 (en) | 2010-05-18 | 2022-05-17 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US10316362B2 (en) | 2010-05-18 | 2019-06-11 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US11326208B2 (en) | 2010-05-18 | 2022-05-10 | Natera, Inc. | Methods for nested PCR amplification of cell-free DNA |
US11322224B2 (en) | 2010-05-18 | 2022-05-03 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US9677118B2 (en) | 2014-04-21 | 2017-06-13 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US20190010543A1 (en) | 2010-05-18 | 2019-01-10 | Natera, Inc. | Methods for simultaneous amplification of target loci |
EP2656263B1 (en) | 2010-12-22 | 2019-11-06 | Natera, Inc. | Methods for non-invasive prenatal paternity testing |
JP6153874B2 (ja) | 2011-02-09 | 2017-06-28 | ナテラ, インコーポレイテッド | 非侵襲的出生前倍数性呼び出しのための方法 |
WO2012129363A2 (en) | 2011-03-24 | 2012-09-27 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
ES2625288T3 (es) | 2011-04-15 | 2017-07-19 | The Johns Hopkins University | Sistema de secuenciación segura |
PL2814959T3 (pl) | 2012-02-17 | 2018-07-31 | Fred Hutchinson Cancer Research Center | Kompozycje i sposoby do dokładnej identyfikacji mutacji |
HUE051845T2 (hu) | 2012-03-20 | 2021-03-29 | Univ Washington Through Its Center For Commercialization | Módszerek a tömegesen párhuzamos DNS-szekvenálás hibaarányának csökkentésére duplex konszenzus szekvenálással |
US11913065B2 (en) | 2012-09-04 | 2024-02-27 | Guardent Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US20160040229A1 (en) | 2013-08-16 | 2016-02-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US10876152B2 (en) | 2012-09-04 | 2020-12-29 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
KR102393608B1 (ko) | 2012-09-04 | 2022-05-03 | 가던트 헬쓰, 인크. | 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법 |
ES2701742T3 (es) | 2012-10-29 | 2019-02-25 | Univ Johns Hopkins | Prueba de Papanicolaou para cánceres de ovario y de endometrio |
US10577655B2 (en) | 2013-09-27 | 2020-03-03 | Natera, Inc. | Cell free DNA diagnostic testing standards |
US10262755B2 (en) | 2014-04-21 | 2019-04-16 | Natera, Inc. | Detecting cancer mutations and aneuploidy in chromosomal segments |
US11286519B2 (en) | 2013-12-11 | 2022-03-29 | Accuragen Holdings Limited | Methods and compositions for enrichment of amplification products |
AU2014362227B2 (en) | 2013-12-11 | 2021-05-13 | Accuragen Holdings Limited | Compositions and methods for detecting rare sequence variants |
US11859246B2 (en) | 2013-12-11 | 2024-01-02 | Accuragen Holdings Limited | Methods and compositions for enrichment of amplification products |
CN106062214B (zh) | 2013-12-28 | 2020-06-09 | 夸登特健康公司 | 用于检测遗传变异的方法和系统 |
RU2717641C2 (ru) | 2014-04-21 | 2020-03-24 | Натера, Инк. | Обнаружение мутаций и плоидности в хромосомных сегментах |
US11479812B2 (en) | 2015-05-11 | 2022-10-25 | Natera, Inc. | Methods and compositions for determining ploidy |
US11286531B2 (en) | 2015-08-11 | 2022-03-29 | The Johns Hopkins University | Assaying ovarian cyst fluid |
JP7008016B2 (ja) | 2015-10-09 | 2022-01-25 | アキュラジェン ホールディングス リミテッド | 増幅産生物の富化のための方法および組成物 |
CN109072294A (zh) | 2015-12-08 | 2018-12-21 | 特温斯特兰德生物科学有限公司 | 用于双重测序的改良衔接子、方法和组合物 |
WO2017106768A1 (en) | 2015-12-17 | 2017-06-22 | Guardant Health, Inc. | Methods to determine tumor gene copy number by analysis of cell-free dna |
JP6714709B2 (ja) * | 2016-01-29 | 2020-06-24 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | 核酸配列決定のための新規アダプターおよび使用法 |
US11514289B1 (en) * | 2016-03-09 | 2022-11-29 | Freenome Holdings, Inc. | Generating machine learning models using genetic data |
US20190085406A1 (en) | 2016-04-14 | 2019-03-21 | Guardant Health, Inc. | Methods for early detection of cancer |
US11384382B2 (en) | 2016-04-14 | 2022-07-12 | Guardant Health, Inc. | Methods of attaching adapters to sample nucleic acids |
WO2017201102A1 (en) * | 2016-05-16 | 2017-11-23 | Accuragen Holdings Limited | Method of improved sequencing by strand identification |
US11708574B2 (en) | 2016-06-10 | 2023-07-25 | Myriad Women's Health, Inc. | Nucleic acid sequencing adapters and uses thereof |
EP4257701A3 (en) | 2016-06-30 | 2023-12-20 | Grail, LLC | Differential tagging of rna for preparation of a cell-free dna/rna sequencing library |
CA3033749A1 (en) | 2016-08-15 | 2018-02-22 | Accuragen Holdings Limited | Compositions and methods for detecting rare sequence variants |
US11485996B2 (en) | 2016-10-04 | 2022-11-01 | Natera, Inc. | Methods for characterizing copy number variation using proximity-litigation sequencing |
US10011870B2 (en) | 2016-12-07 | 2018-07-03 | Natera, Inc. | Compositions and methods for identifying nucleic acid molecules |
WO2018119399A1 (en) * | 2016-12-23 | 2018-06-28 | Grail, Inc. | Methods for high efficiency library preparation using double-stranded adapters |
US11414710B2 (en) | 2016-12-28 | 2022-08-16 | Quest Diagnostics Investments Llc | Compositions and methods for detecting circulating tumor DNA |
WO2018144159A1 (en) * | 2017-01-31 | 2018-08-09 | Counsyl, Inc. | Capture probes using positive and negative strands for duplex sequencing |
US10752946B2 (en) | 2017-01-31 | 2020-08-25 | Myriad Women's Health, Inc. | Methods and compositions for enrichment of target polynucleotides |
US10968447B2 (en) * | 2017-01-31 | 2021-04-06 | Myriad Women's Health, Inc. | Methods and compositions for enrichment of target polynucleotides |
WO2018148289A2 (en) * | 2017-02-08 | 2018-08-16 | Integrated Dna Technologies, Inc. | Duplex adapters and duplex sequencing |
CA3049139A1 (en) | 2017-02-21 | 2018-08-30 | Natera, Inc. | Compositions, methods, and kits for isolating nucleic acids |
US11274344B2 (en) | 2017-03-30 | 2022-03-15 | Grail, Inc. | Enhanced ligation in sequencing library preparation |
US11584958B2 (en) * | 2017-03-31 | 2023-02-21 | Grail, Llc | Library preparation and use thereof for sequencing based error correction and/or variant identification |
US11118222B2 (en) | 2017-03-31 | 2021-09-14 | Grail, Inc. | Higher target capture efficiency using probe extension |
CA3060369A1 (en) | 2017-05-01 | 2018-11-08 | Illumina, Inc. | Optimal index sequences for multiplex massively parallel sequencing |
CA3062174A1 (en) | 2017-05-08 | 2018-11-15 | Illumina, Inc. | Universal short adapters for indexing of polynucleotide samples |
WO2018211497A1 (en) * | 2017-05-14 | 2018-11-22 | Foresee Genomic Ltd | Dna construct for sequencing and method for preparing the same |
EP3642362A1 (en) * | 2017-06-20 | 2020-04-29 | Illumina, Inc. | Methods and compositions for addressing inefficiencies in amplification reactions |
CA3068273A1 (en) * | 2017-06-21 | 2018-12-27 | Bluedot Llc | Systems and methods for identification of nucleic acids in a sample |
EP3545106B1 (en) * | 2017-08-01 | 2022-01-19 | Helitec Limited | Methods of enriching and determining target nucleotide sequences |
US11519024B2 (en) | 2017-08-04 | 2022-12-06 | Billiontoone, Inc. | Homologous genomic regions for characterization associated with biological targets |
US11430543B2 (en) | 2017-08-04 | 2022-08-30 | Billiontoone, Inc. | Sequencing output determination and analysis with target-associated molecules in quantification associated with biological targets |
US11646100B2 (en) | 2017-08-04 | 2023-05-09 | Billiontoone, Inc. | Target-associated molecules for characterization associated with biological targets |
SG11202001010UA (en) | 2017-08-07 | 2020-03-30 | Univ Johns Hopkins | Methods and materials for assessing and treating cancer |
SG11202001858PA (en) * | 2017-10-09 | 2020-04-29 | Psomagen Inc | Single molecule sequencing and unique molecular identifiers to characterize nucleic acid sequences |
CN107604046B (zh) * | 2017-11-03 | 2021-08-24 | 上海交通大学 | 用于微量dna超低频突变检测的双分子自校验文库制备及杂交捕获的二代测序方法 |
DK3707723T3 (da) * | 2017-11-06 | 2023-12-18 | Illumina Inc | Teknikker til indeksering af nukleinsyrer |
AU2018366213A1 (en) | 2017-11-08 | 2020-05-14 | Twinstrand Biosciences, Inc. | Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters |
KR101967879B1 (ko) * | 2017-11-30 | 2019-04-10 | 사회복지법인 삼성생명공익재단 | 핵산 서열분석에서 uid 핵산 서열의 순결도를 측정하는 방법 |
WO2019108972A1 (en) * | 2017-11-30 | 2019-06-06 | Illumina, Inc. | Validation methods and systems for sequence variant calls |
AU2018399524B2 (en) | 2018-01-05 | 2022-05-26 | Billiontoone, Inc. | Quality control templates for ensuring validity of sequencing-based assays |
US11203782B2 (en) | 2018-03-29 | 2021-12-21 | Accuragen Holdings Limited | Compositions and methods comprising asymmetric barcoding |
WO2019204208A1 (en) * | 2018-04-16 | 2019-10-24 | Memorial Sloan Kettering Cancer Center | SYSTEMS AND METHODS FOR DETECTING CANCER VIA cfDNA SCREENING |
JP7358388B2 (ja) * | 2018-05-03 | 2023-10-10 | ベクトン・ディキンソン・アンド・カンパニー | 反対側の転写物末端における分子バーコーディング |
CN108841946B (zh) * | 2018-05-18 | 2022-03-22 | 中国人民解放军陆军军医大学第一附属医院 | 一种无创检测gjb2基因突变的方法,试剂盒及其制备方法 |
CN108949951B (zh) * | 2018-05-18 | 2022-01-28 | 中国人民解放军陆军军医大学第一附属医院 | 一种同时无创检测gjb2和slc26a4基因突变的方法和试剂盒 |
CN108531583B (zh) * | 2018-05-18 | 2022-05-17 | 中国人民解放军陆军军医大学第一附属医院 | 用于无创检测mitf基因突变的引物组合及检测方法 |
CN108486230B (zh) * | 2018-05-18 | 2022-02-08 | 中国人民解放军陆军军医大学第一附属医院 | 用于无创检测mitf基因突变的试剂盒及其制备方法 |
CN108642173B (zh) * | 2018-05-18 | 2022-03-22 | 中国人民解放军陆军军医大学第一附属医院 | 一种无创检测slc26a4基因突变的方法和试剂盒 |
CN108753934B (zh) * | 2018-05-18 | 2022-01-28 | 中国人民解放军陆军军医大学第一附属医院 | 一种检测基因突变的方法、试剂盒及其制备方法 |
CN108949941A (zh) * | 2018-06-25 | 2018-12-07 | 北京莲和医学检验所有限公司 | 低频突变检测方法、试剂盒和装置 |
GB201810901D0 (en) * | 2018-07-03 | 2018-08-15 | Ucb Biopharma Sprl | Method |
US11525159B2 (en) | 2018-07-03 | 2022-12-13 | Natera, Inc. | Methods for detection of donor-derived cell-free DNA |
KR20210059694A (ko) | 2018-07-12 | 2021-05-25 | 트윈스트랜드 바이오사이언시스, 인코포레이티드 | 게놈 편집, 클론 팽창 및 연관된 분야를 규명하기 위한 방법 및 시약 |
EP3844300A1 (en) * | 2018-08-28 | 2021-07-07 | Sophia Genetics S.A. | Methods for asymmetric dna library generation and optionally integrated duplex sequencing |
EP3856903A4 (en) | 2018-09-27 | 2022-07-27 | Grail, LLC | METHYLATION MARKER AND TARGETED METHYLATION PROBE PANEL |
CN109706219A (zh) * | 2018-12-20 | 2019-05-03 | 臻和(北京)科技有限公司 | 构建测序文库的方法、试剂盒、上机方法及测序数据的拆分方法 |
CN113728100A (zh) * | 2019-02-25 | 2021-11-30 | 特韦斯特生物科学公司 | 用于下一代测序的组合物和方法 |
WO2020226528A1 (ru) * | 2019-05-08 | 2020-11-12 | Общество с ограниченной ответственностью "ГЕНОТЕК ИТ" | Способ определения кариотипа плода беременной женщины |
CN110409001B (zh) * | 2019-07-25 | 2022-11-15 | 北京贝瑞和康生物技术有限公司 | 一种构建捕获文库的方法和试剂盒 |
EP3795685A1 (en) * | 2019-09-20 | 2021-03-24 | Sophia Genetics S.A. | Methods for dna library generation to facilitate the detection and reporting of low frequency variants |
US10927409B1 (en) | 2019-10-14 | 2021-02-23 | Pioneer Hi-Bred International, Inc. | Detection of sequences uniquely associated with a dna target region |
CN111073961A (zh) * | 2019-12-20 | 2020-04-28 | 苏州赛美科基因科技有限公司 | 一种基因稀有突变的高通量检测方法 |
WO2021146304A1 (en) * | 2020-01-13 | 2021-07-22 | St. Jude Children's Research Hospital | Error suppression in genetic sequencing |
EP3859012A1 (en) * | 2020-02-03 | 2021-08-04 | Albert-Ludwigs-Universität Freiburg | Methods for amplification of genomic dna and preparation of sequencing libraries |
US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
CN111304288A (zh) * | 2020-02-18 | 2020-06-19 | 江苏先声医学诊断有限公司 | 特异性分子标签umi组及其应用 |
EP3892737A1 (en) * | 2020-04-09 | 2021-10-13 | Takeda Vaccines, Inc. | Qualitative and quantitative determination of single virus haplotypes in complex samples |
US11932901B2 (en) | 2020-07-13 | 2024-03-19 | Becton, Dickinson And Company | Target enrichment using nucleic acid probes for scRNAseq |
WO2022053610A1 (en) | 2020-09-11 | 2022-03-17 | Illumina Cambridge Limited | Methods of enriching a target sequence from a sequencing library using hairpin adaptors |
CA3198842A1 (en) | 2020-10-21 | 2022-04-28 | Illumina, Inc. | Sequencing templates comprising multiple inserts and compositions and methods for improving sequencing throughput |
WO2022109207A2 (en) | 2020-11-19 | 2022-05-27 | The United States Of America As Represented By The Secretary, Department Of Health And Human Services | Massively paralleled multi-patient assay for pathogenic infection diagnosis and host physiology surveillance using nucleic acid sequencing |
JPWO2022131285A1 (ja) | 2020-12-15 | 2022-06-23 | ||
CN112687339B (zh) * | 2021-01-21 | 2021-12-14 | 深圳吉因加医学检验实验室 | 一种统计血浆dna片段测序数据中序列错误的方法和装置 |
EP4314328A1 (en) | 2021-03-29 | 2024-02-07 | Illumina, Inc. | Compositions and methods for assessing dna damage in a library and normalizing amplicon size bias |
KR20230161955A (ko) | 2021-03-30 | 2023-11-28 | 일루미나, 인코포레이티드 | 등온 상보적 dna 및 라이브러리 제조의 개선된 방법 |
BR112023019945A2 (pt) | 2021-03-31 | 2023-11-14 | Illumina Cambridge Ltd | Métodos para a preparação de bibliotecas de sequenciamento por tagmentação direcional com o uso de tecnologia baseada em transposon com identificadores moleculares exclusivos para correção de erros |
WO2022246062A1 (en) * | 2021-05-19 | 2022-11-24 | Illumina, Inc. | Umi collapsing |
WO2023201487A1 (zh) * | 2022-04-18 | 2023-10-26 | 京东方科技集团股份有限公司 | 接头、接头连接试剂及试剂盒和文库构建方法 |
WO2024015962A1 (en) | 2022-07-15 | 2024-01-18 | Pacific Biosciences Of California, Inc. | Blocked asymmetric hairpin adaptors |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012142213A2 (en) * | 2011-04-15 | 2012-10-18 | The Johns Hopkins University | Safe sequencing system |
WO2013142389A1 (en) * | 2012-03-20 | 2013-09-26 | University Of Washington Through Its Center For Commercialization | Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing |
Family Cites Families (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
WO1991006678A1 (en) | 1989-10-26 | 1991-05-16 | Sri International | Dna sequencing |
US5677170A (en) | 1994-03-02 | 1997-10-14 | The Johns Hopkins University | In vitro transposition of artificial transposons |
ES2563643T3 (es) | 1997-04-01 | 2016-03-15 | Illumina Cambridge Limited | Método de secuenciación de ácido nucleico |
US6159736A (en) | 1998-09-23 | 2000-12-12 | Wisconsin Alumni Research Foundation | Method for making insertional mutations using a Tn5 synaptic complex |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
EP1368460B1 (en) | 2000-07-07 | 2007-10-31 | Visigen Biotechnologies, Inc. | Real-time sequence determination |
US7211414B2 (en) | 2000-12-01 | 2007-05-01 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
US20040018520A1 (en) | 2002-04-22 | 2004-01-29 | James Thompson | Trans-splicing enzymatic nucleic acid mediated biopharmaceutical and protein |
EP3002289B1 (en) | 2002-08-23 | 2018-02-28 | Illumina Cambridge Limited | Modified nucleotides for polynucleotide sequencing |
EP1701785A1 (en) | 2004-01-07 | 2006-09-20 | Solexa Ltd. | Modified molecular arrays |
US7476503B2 (en) | 2004-09-17 | 2009-01-13 | Pacific Biosciences Of California, Inc. | Apparatus and method for performing nucleic acid analysis |
EP1828412B2 (en) | 2004-12-13 | 2019-01-09 | Illumina Cambridge Limited | Improved method of nucleotide detection |
GB0514936D0 (en) | 2005-07-20 | 2005-08-24 | Solexa Ltd | Preparation of templates for nucleic acid sequencing |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
CN101460953B (zh) | 2006-03-31 | 2012-05-30 | 索雷克萨公司 | 用于合成分析的序列的系统和装置 |
WO2008051530A2 (en) | 2006-10-23 | 2008-05-02 | Pacific Biosciences Of California, Inc. | Polymerase enzymes and reagents for enhanced nucleic acid sequencing |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
WO2008093098A2 (en) | 2007-02-02 | 2008-08-07 | Illumina Cambridge Limited | Methods for indexing samples and sequencing multiple nucleotide templates |
WO2011074960A1 (en) * | 2009-12-17 | 2011-06-23 | Keygene N.V. | Restriction enzyme based whole genome sequencing |
US9260745B2 (en) | 2010-01-19 | 2016-02-16 | Verinata Health, Inc. | Detecting and classifying copy number variation |
EP2366031B1 (en) * | 2010-01-19 | 2015-01-21 | Verinata Health, Inc | Sequencing methods in prenatal diagnoses |
WO2011139797A2 (en) | 2010-04-27 | 2011-11-10 | Spiral Genetics Inc. | Method and system for analysis and error correction of biological sequences and inference of relationship for multiple samples |
ES2595433T3 (es) | 2010-09-21 | 2016-12-30 | Population Genetics Technologies Ltd. | Aumento de la confianza en las identificaciones de alelos con el recuento molecular |
CA2810931C (en) | 2010-09-24 | 2018-04-17 | The Board Of Trustees Of The Leland Stanford Junior University | Direct capture, amplification and sequencing of target dna using immobilized primers |
CA2840929C (en) * | 2011-07-08 | 2020-03-24 | Keygene N.V. | Sequence based genotyping based on oligonucleotide ligation assays |
CA2840418C (en) * | 2011-07-26 | 2019-10-29 | Verinata Health, Inc. | Method for determining the presence or absence of different aneuploidies in a sample |
AU2012327251A1 (en) | 2011-10-27 | 2013-05-23 | Verinata Health, Inc. | Set membership testers for aligning nucleic acid samples |
US20130267428A1 (en) | 2012-02-10 | 2013-10-10 | Washington University In St. Louis | High throughput digital karyotyping for biome characterization |
WO2013138510A1 (en) | 2012-03-13 | 2013-09-19 | Patel Abhijit Ajit | Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing |
CA2873585C (en) | 2012-05-14 | 2021-11-09 | Cb Biotechnologies, Inc. | Method for increasing accuracy in quantitative detection of polynucleotides |
EP2852608A4 (en) | 2012-05-21 | 2016-05-04 | Distributed Bio Inc | EPITOPIC CROPPING BY VARIABLE EFFECTIVE ANTIGEN SURFACE CONCENTRATION |
AU2013267609C1 (en) | 2012-05-31 | 2019-01-03 | Board Of Regents, The University Of Texas System | Method for accurate sequencing of DNA |
US20140024541A1 (en) | 2012-07-17 | 2014-01-23 | Counsyl, Inc. | Methods and compositions for high-throughput sequencing |
DK3553175T3 (da) | 2013-03-13 | 2021-08-23 | Illumina Inc | Fremgangsmåde til fremstilling af et nukleinsyresekvenseringsbibliotek |
WO2014151117A1 (en) | 2013-03-15 | 2014-09-25 | The Board Of Trustees Of The Leland Stanford Junior University | Identification and use of circulating nucleic acid tumor markers |
US9328382B2 (en) | 2013-03-15 | 2016-05-03 | Complete Genomics, Inc. | Multiple tagging of individual long DNA fragments |
CN105593683B (zh) | 2013-10-01 | 2018-11-30 | 考利达基因组股份有限公司 | 鉴定基因组中的变异的定相和连接方法 |
EP3058091B1 (en) * | 2013-10-18 | 2020-03-25 | The Broad Institute, Inc. | Spatial and cellular mapping of biomolecules in situ by high-throughput sequencing |
CN106062214B (zh) | 2013-12-28 | 2020-06-09 | 夸登特健康公司 | 用于检测遗传变异的方法和系统 |
US9677132B2 (en) | 2014-01-16 | 2017-06-13 | Illumina, Inc. | Polynucleotide modification on solid support |
WO2015179493A1 (en) | 2014-05-23 | 2015-11-26 | Centrillion Technology Holding Corporation | Methods for generating and decoding barcodes |
ES2925014T3 (es) | 2014-09-12 | 2022-10-13 | Univ Leland Stanford Junior | Identificación y uso de ácidos nucleicos circulantes |
US11661597B2 (en) | 2015-04-15 | 2023-05-30 | The Board Of Trustees Of The Leland Stanford Junior University | Robust quantification of single molecules in next-generation sequencing using non-random combinatorial oligonucleotide barcodes |
US10844428B2 (en) | 2015-04-28 | 2020-11-24 | Illumina, Inc. | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) |
CN109072294A (zh) | 2015-12-08 | 2018-12-21 | 特温斯特兰德生物科学有限公司 | 用于双重测序的改良衔接子、方法和组合物 |
US11708574B2 (en) | 2016-06-10 | 2023-07-25 | Myriad Women's Health, Inc. | Nucleic acid sequencing adapters and uses thereof |
EP3494214A4 (en) | 2016-08-05 | 2020-03-04 | Bio-Rad Laboratories, Inc. | SECOND RANK DIRECT |
EP3889962A1 (en) | 2017-01-18 | 2021-10-06 | Illumina, Inc. | Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths |
WO2018148289A2 (en) | 2017-02-08 | 2018-08-16 | Integrated Dna Technologies, Inc. | Duplex adapters and duplex sequencing |
WO2018175997A1 (en) | 2017-03-23 | 2018-09-27 | University Of Washington | Methods for targeted nucleic acid sequence enrichment with applications to error corrected nucleic acid sequencing |
US11447818B2 (en) | 2017-09-15 | 2022-09-20 | Illumina, Inc. | Universal short adapters with variable length non-random unique molecular identifiers |
AU2018366213A1 (en) | 2017-11-08 | 2020-05-14 | Twinstrand Biosciences, Inc. | Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters |
WO2019160998A1 (en) | 2018-02-13 | 2019-08-22 | Twinstrand Biosciences, Inc. | Methods and reagents for detecting and assessing genotoxicity |
JP2021515579A (ja) | 2018-03-15 | 2021-06-24 | ツインストランド・バイオサイエンシズ・インコーポレイテッドTwinstrand Biosciences, Inc. | 配列決定用途および他の核酸物質インテロゲーションのための核酸物質を濃縮するための方法および試薬 |
AU2019269635A1 (en) | 2018-05-16 | 2020-11-26 | Twinstrand Biosciences, Inc. | Methods and reagents for resolving nucleic acid mixtures and mixed cell populations and associated applications |
KR20210059694A (ko) | 2018-07-12 | 2021-05-25 | 트윈스트랜드 바이오사이언시스, 인코포레이티드 | 게놈 편집, 클론 팽창 및 연관된 분야를 규명하기 위한 방법 및 시약 |
EP3867397A4 (en) | 2018-10-16 | 2022-07-13 | Twinstrand Biosciences, Inc. | METHODS AND REAGENTS FOR THE EFFECTIVE GENOTYPING OF LARGE NUMBERS OF SAMPLES BY POOLING |
EP4007818A4 (en) | 2019-08-01 | 2023-09-20 | Twinstrand Biosciences, Inc. | METHODS AND REAGENTS FOR NUCLEIC ACID SEQUENCING AND RELATED APPLICATIONS |
-
2016
- 2016-04-15 US US15/130,668 patent/US10844428B2/en active Active
- 2016-04-20 DK DK16720269.6T patent/DK3289097T4/da active
- 2016-04-20 SG SG11201708859XA patent/SG11201708859XA/en unknown
- 2016-04-20 IL IL294600A patent/IL294600B1/en unknown
- 2016-04-20 DK DK20161152.2T patent/DK3736341T3/da active
- 2016-04-20 EP EP23187855.4A patent/EP4266314A3/en active Pending
- 2016-04-20 SG SG10202006185QA patent/SG10202006185QA/en unknown
- 2016-04-20 RU RU2017137401A patent/RU2704286C2/ru active
- 2016-04-20 CN CN201680036120.4A patent/CN108138227B/zh active Active
- 2016-04-20 MY MYPI2017001577A patent/MY181983A/en unknown
- 2016-04-20 NZ NZ736609A patent/NZ736609A/en unknown
- 2016-04-20 CA CA2983935A patent/CA2983935C/en active Active
- 2016-04-20 BR BR112017024118-8A patent/BR112017024118A2/pt active Search and Examination
- 2016-04-20 FI FIEP20161152.2T patent/FI3736341T3/fi active
- 2016-04-20 EP EP16720269.6A patent/EP3289097B2/en active Active
- 2016-04-20 MX MX2017013775A patent/MX2017013775A/es unknown
- 2016-04-20 ES ES16720269T patent/ES2799074T5/es active Active
- 2016-04-20 AU AU2016256351A patent/AU2016256351B2/en active Active
- 2016-04-20 EP EP20161152.2A patent/EP3736341B1/en active Active
- 2016-04-20 IL IL285319A patent/IL285319B2/en unknown
- 2016-04-20 WO PCT/US2016/028430 patent/WO2016176091A1/en active Application Filing
- 2016-04-20 FI FIEP16720269.6T patent/FI3289097T4/fi active
- 2016-04-20 ES ES20161152T patent/ES2961338T3/es active Active
- 2016-04-20 CN CN202111025054.XA patent/CN113832139A/zh active Pending
- 2016-04-20 CA CA3109403A patent/CA3109403A1/en active Pending
- 2016-04-20 KR KR1020177034336A patent/KR102091312B1/ko active IP Right Grant
- 2016-04-20 JP JP2017555568A patent/JP6685324B2/ja active Active
-
2017
- 2017-10-22 IL IL255187A patent/IL255187B/en unknown
- 2017-10-24 ZA ZA2017/07231A patent/ZA201707231B/en unknown
- 2017-10-26 MX MX2022008045A patent/MX2022008045A/es unknown
- 2017-10-26 MX MX2023004394A patent/MX2023004394A/es unknown
-
2018
- 2018-03-20 HK HK18103843.3A patent/HK1244513A1/zh unknown
-
2019
- 2019-10-17 AU AU2019250200A patent/AU2019250200B2/en active Active
-
2020
- 2020-10-21 US US17/076,715 patent/US11866777B2/en active Active
-
2022
- 2022-01-12 AU AU2022200179A patent/AU2022200179A1/en active Pending
-
2023
- 2023-08-08 US US18/231,724 patent/US20240084376A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012142213A2 (en) * | 2011-04-15 | 2012-10-18 | The Johns Hopkins University | Safe sequencing system |
WO2013142389A1 (en) * | 2012-03-20 | 2013-09-26 | University Of Washington Through Its Center For Commercialization | Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11866777B2 (en) | 2015-04-28 | 2024-01-09 | Illumina, Inc. | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) |
US11761035B2 (en) | 2017-01-18 | 2023-09-19 | Illumina, Inc. | Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths |
US11447818B2 (en) | 2017-09-15 | 2022-09-20 | Illumina, Inc. | Universal short adapters with variable length non-random unique molecular identifiers |
US11898198B2 (en) | 2017-09-15 | 2024-02-13 | Illumina, Inc. | Universal short adapters with variable length non-random unique molecular identifiers |
KR20210035175A (ko) * | 2018-07-03 | 2021-03-31 | 캔서 호스피탈 차이니즈 아카데미 오브 메디컬 사이언스 | 다양한 간암 일반 돌연변이를 동시에 검출하는 ctDNA 라이브러리 제작 및 시퀀싱 데이터 분석 방법 |
KR102547995B1 (ko) * | 2018-07-03 | 2023-06-26 | 캔서 호스피탈 차이니즈 아카데미 오브 메디컬 사이언스 | 다양한 간암 일반 돌연변이를 동시에 검출하는 ctDNA 라이브러리 제작 및 시퀀싱 데이터 분석 방법 |
EP3670670A1 (en) | 2018-12-18 | 2020-06-24 | Ricoh Company, Ltd. | Nucleic acid analysis method, nucleic acid analysis program, and device for library preparation |
US11705218B2 (en) | 2018-12-18 | 2023-07-18 | Ricoh Company, Ltd. | Nucleic acid analysis method, nucleic acid analysis program, and device for library preparation |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11866777B2 (en) | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) | |
US11898198B2 (en) | Universal short adapters with variable length non-random unique molecular identifiers | |
JP7051900B2 (ja) | 不均一分子長を有するユニーク分子インデックスセットの生成およびエラー補正のための方法およびシステム | |
US20200286586A1 (en) | Sequence-graph based tool for determining variation in short tandem repeat regions | |
RU2799654C2 (ru) | Инструмент на основе графов последовательностей для определения вариаций в областях коротких тандемных повторов |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181127 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190827 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200317 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200331 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6685324 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |