JP7304852B2 - 脱アミノ化に誘導される配列エラーの補正 - Google Patents
脱アミノ化に誘導される配列エラーの補正 Download PDFInfo
- Publication number
- JP7304852B2 JP7304852B2 JP2020524480A JP2020524480A JP7304852B2 JP 7304852 B2 JP7304852 B2 JP 7304852B2 JP 2020524480 A JP2020524480 A JP 2020524480A JP 2020524480 A JP2020524480 A JP 2020524480A JP 7304852 B2 JP7304852 B2 JP 7304852B2
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- sequencing
- subset
- variant
- variation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000009615 deamination Effects 0.000 title claims description 102
- 238000006481 deamination reaction Methods 0.000 title claims description 102
- 150000007523 nucleic acids Chemical class 0.000 claims description 424
- 102000039446 nucleic acids Human genes 0.000 claims description 417
- 108020004707 nucleic acids Proteins 0.000 claims description 417
- 239000002773 nucleotide Substances 0.000 claims description 305
- 125000003729 nucleotide group Chemical group 0.000 claims description 305
- 238000012163 sequencing technique Methods 0.000 claims description 198
- 238000000034 method Methods 0.000 claims description 146
- 206010028980 Neoplasm Diseases 0.000 claims description 80
- 238000004891 communication Methods 0.000 claims description 71
- 201000011510 cancer Diseases 0.000 claims description 59
- 230000000295 complement effect Effects 0.000 claims description 30
- 108090000623 proteins and genes Proteins 0.000 claims description 29
- 230000015654 memory Effects 0.000 claims description 28
- 102000004169 proteins and genes Human genes 0.000 claims description 23
- 230000000694 effects Effects 0.000 claims description 22
- 210000001124 body fluid Anatomy 0.000 claims description 21
- 238000011282 treatment Methods 0.000 claims description 16
- 241000282414 Homo sapiens Species 0.000 claims description 14
- 239000010839 body fluid Substances 0.000 claims description 10
- 210000002381 plasma Anatomy 0.000 claims description 10
- 108060002716 Exonuclease Proteins 0.000 claims description 9
- 210000004369 blood Anatomy 0.000 claims description 9
- 239000008280 blood Substances 0.000 claims description 9
- 102000013165 exonuclease Human genes 0.000 claims description 9
- 238000009396 hybridization Methods 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 210000002700 urine Anatomy 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000012175 pyrosequencing Methods 0.000 claims description 6
- 238000007841 sequencing by ligation Methods 0.000 claims description 6
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 5
- 238000007672 fourth generation sequencing Methods 0.000 claims description 5
- 239000004065 semiconductor Substances 0.000 claims description 5
- 238000003491 array Methods 0.000 claims description 4
- 210000003917 human chromosome Anatomy 0.000 claims description 4
- 210000003296 saliva Anatomy 0.000 claims description 4
- 239000000523 sample Substances 0.000 description 84
- 102000053602 DNA Human genes 0.000 description 42
- 108020004414 DNA Proteins 0.000 description 42
- 108091035707 Consensus sequence Proteins 0.000 description 40
- 230000035772 mutation Effects 0.000 description 30
- 238000006243 chemical reaction Methods 0.000 description 29
- 238000003199 nucleic acid amplification method Methods 0.000 description 27
- 210000004027 cell Anatomy 0.000 description 26
- 230000003321 amplification Effects 0.000 description 25
- 108700028369 Alleles Proteins 0.000 description 19
- 238000003860 storage Methods 0.000 description 19
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 17
- 102000040430 polynucleotide Human genes 0.000 description 17
- 108091033319 polynucleotide Proteins 0.000 description 17
- 239000002157 polynucleotide Substances 0.000 description 17
- 238000012545 processing Methods 0.000 description 17
- 201000010099 disease Diseases 0.000 description 16
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 16
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 14
- 229920002477 rna polymer Polymers 0.000 description 13
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 12
- 238000006467 substitution reaction Methods 0.000 description 11
- 230000007704 transition Effects 0.000 description 11
- 230000002068 genetic effect Effects 0.000 description 10
- 239000000439 tumor marker Substances 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- 238000007481 next generation sequencing Methods 0.000 description 8
- 229930024421 Adenine Natural products 0.000 description 7
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 7
- 229960000643 adenine Drugs 0.000 description 7
- 229940104302 cytosine Drugs 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 230000004075 alteration Effects 0.000 description 6
- 238000009169 immunotherapy Methods 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 108091093088 Amplicon Proteins 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 238000011049 filling Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- -1 less than 500 Chemical class 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- 229940113082 thymine Drugs 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 230000001973 epigenetic effect Effects 0.000 description 3
- 210000003722 extracellular fluid Anatomy 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 238000004393 prognosis Methods 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 101150023956 ALK gene Proteins 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 2
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 2
- 206010061818 Disease progression Diseases 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 208000000453 Skin Neoplasms Diseases 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 238000005576 amination reaction Methods 0.000 description 2
- 208000036878 aneuploidy Diseases 0.000 description 2
- 231100001075 aneuploidy Toxicity 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 230000005750 disease progression Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000001605 fetal effect Effects 0.000 description 2
- 230000004077 genetic alteration Effects 0.000 description 2
- 231100000118 genetic alteration Toxicity 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 201000000849 skin cancer Diseases 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000000392 somatic effect Effects 0.000 description 2
- 230000037439 somatic mutation Effects 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 238000007704 wet chemistry method Methods 0.000 description 2
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 102000008096 B7-H1 Antigen Human genes 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 1
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 102100027207 CD27 antigen Human genes 0.000 description 1
- 101150013553 CD40 gene Proteins 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 208000037051 Chromosomal Instability Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 206010061819 Disease recurrence Diseases 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 1
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 description 1
- 101000851370 Homo sapiens Tumor necrosis factor receptor superfamily member 9 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 102000002698 KIR Receptors Human genes 0.000 description 1
- 108010043610 KIR Receptors Proteins 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 102000017578 LAG3 Human genes 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 208000003445 Mouth Neoplasms Diseases 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100407308 Mus musculus Pdcd1lg2 gene Proteins 0.000 description 1
- 208000010505 Nose Neoplasms Diseases 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 208000037581 Persistent Infection Diseases 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 208000032236 Predisposition to disease Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 108700030875 Programmed Cell Death 1 Ligand 2 Proteins 0.000 description 1
- 102100024213 Programmed cell death 1 ligand 2 Human genes 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 206010043515 Throat cancer Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 description 1
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 description 1
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 1
- 102100036856 Tumor necrosis factor receptor superfamily member 9 Human genes 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 239000010836 blood and blood product Substances 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 230000000770 proinflammatory effect Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000031539 regulation of cell division Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 210000005166 vasculature Anatomy 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Description
本出願は、2017年11月3日に出願された米国仮出願第62/581,309号に基づく優先権を主張し、そのような仮出願は、参照によりすべての目的で本明細書に全体的に組み込まれる。
腫瘍は、細胞の異常な増殖である。細胞、例えば、腫瘍細胞が死滅すると、断片化DNAが体液中に放出されることが多い。よって、体液中の無細胞DNAの一部は、腫瘍DNAである。腫瘍は、良性である場合も悪性である場合もある。悪性腫瘍は、がんと称されることが多い。
本開示の一態様は、核酸の集団においてバリアントヌクレオチドを識別するための方法であって、(a)一方または両方の末端に一本鎖オーバーハングを有する二本鎖分子を含む核酸の集団を、5’-3’ポリメラーゼ活性および3’-5’エキソヌクレアーゼ活性を有するタンパク質と接触させるステップであって、タンパク質が、一方または両方の末端において、3’オーバーハングを消化し、5’オーバーハングを相補的な核酸で充填して、二本鎖平滑末端化核酸を生成する、ステップと、(b)シーケンシングされた核酸を得るために、二本鎖平滑末端化核酸の配列を決定するステップと、(c)参照配列におけるそれぞれの指定位置について、(i)指定位置を含む、シーケンシングされた核酸のサブセットを識別するステップ、そして(ii)指定位置がバリアントヌクレオチドによって占有されているサブセット内のシーケンシングされた核酸を識別するステップと、および(d)変動を有するサブセット内のシーケンシングされた核酸がコールをサポートするそれぞれの指定位置におけるバリアントヌクレオチドの存在をコールするステップであって、ただし、指定位置におけるバリアントヌクレオチドの存在は、(i)バリアントが、参照ヌクレオチドと比較して、CからTまたはGからAへの変動である場合、および(ii)バリアントヌクレオチドが、(1)指定位置の周囲のヌクレオチドコンテキスト、および/または(2)サブセット内のシーケンシングされた核酸の5’末端から、指定位置におけるCからTへの変動の距離、またはサブセット内のシーケンシングされた核酸の3’末端から、指定位置におけるGからAへの変動までの距離に基づいて、脱アミノ化エラーとして分類される場合には、コールされないことを除く、ステップとを含む、方法に関する。
(1)1つのそのようなシステムは、
(2)核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容する通信インターフェースと、
(3)通信インターフェースと通信するコンピューターであって、1つまたは複数のコンピュータープロセッサと、1つまたは複数のコンピュータープロセッサによる実行の際に、
(a)核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容するステップと、
(b)参照配列におけるそれぞれの指定位置について、
(i)指定位置を含む、シーケンシングリードのサブセットを識別し、
(ii)指定位置がバリアントヌクレオチドによって占有されているサブセット内のシーケンシングリードを識別する、ステップと、
(c)変動を有するサブセット内のシーケンシングリードがコールをサポートするそれぞれの指定位置におけるバリアントヌクレオチドの存在をコールするステップであって、ただし、指定位置におけるバリアントヌクレオチドの存在は、
(i)バリアントが、参照ヌクレオチドと比較して、CからTまたはGからAへの変動である場合、および
(ii)バリアントヌクレオチドが、
(1)指定位置の周囲のヌクレオチドコンテキスト、および/または
(2)サブセット内のシーケンシングされた核酸の5’末端から、指定位置におけるCからTへの変動の距離、またはサブセット内のシーケンシングされた核酸の3’末端から、指定位置におけるGからAへの変動の距離に基づいて、脱アミノ化エラーとして分類される場合にはコールされないことを除く、ステップと
を含む方法を実施するマシン実行可能コードを含むコンピューター可読媒体とを含む、コンピューターと
を含む。
(1)核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容する通信インターフェースと、
(2)通信インターフェースと通信するコンピューターであって、1つまたは複数のコンピュータープロセッサと、1つまたは複数のコンピュータープロセッサによる実行の際に、
(a)核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容するステップと、
(b)決定した配列を、参照配列と比較するステップであって、決定した配列が、決定した配列の5’末端の20ヌクレオチドまたはそれ未満以内の少なくとも1つの指定位置における少なくとも1つのCからTへの変動、または決定した配列の3’末端の20ヌクレオチドまたはそれ未満以内における少なくとも1つのGからAへの変動を含む、ステップと、
(c)核酸の配列を、決定した配列としてコールするステップであって、ただし、CからTへの変動が決定した配列の5’末端の20ヌクレオチドまたはそれ未満以内に存在するか、またはGからAへの変動が決定した配列の3’末端の20ヌクレオチドまたはそれ未満以内に存在する位置のうちの少なくとも1つにおいては、参照配列を占有しているヌクレオチドが、指定位置でコールされることを除く、ステップとを含む方法を実施するマシン実行可能コードを含むコンピューター可読媒体とを含む、コンピューターとを含む、システムを提供する。
(1)核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容する通信インターフェースと、
(2)通信インターフェースと通信するコンピューターであって、1つまたは複数のコンピュータープロセッサと、1つまたは複数のコンピュータープロセッサによる実行の際に、
(a)核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容するステップと、
(b)シーケンシングリードの配列をファミリーに分類するステップであって、ファミリーのメンバーが、核酸上の同じ開始点および終止点ならびに同じアダプターを有し、ファミリーについて、そのそれぞれのメンバーの配列から、コンセンサス配列を決定する、ステップと、
(c)参照配列におけるそれぞれの指定位置について、指定位置を含むコンセンサス配列を有するファミリーのサブセットを決定し、指定位置がバリアントヌクレオチドによって占有されているコンセンサス配列を識別する、ステップと、
(d)それぞれの指定位置におけるバリアントヌクレオチドの存在をコールするステップであって、バリアントヌクレオチドを有するサブセット内のコンセンサス配列が、コールをサポートするが、指定位置におけるバリアントヌクレオチドの存在は、
(i)バリアントヌクレオチドが、参照ヌクレオチドと比較して、CからTまたはGからAへの変動である場合、および
(ii)バリアントヌクレオチドが、
(1)指定位置の周囲のヌクレオチドコンテキスト、および/または
(2)5’末端から、サブセット内のコンセンサス配列の指定位置におけるCからTへの変動の距離、または3’末端から、コンセンサス配列の指定位置におけるGからAへの変動の距離に基づいて、脱アミノ化エラーとして分類される場合
には、コールされないことを除く、ステップと
を含む方法を実施するマシン実行可能コードを含むコンピューター可読媒体とを含む、コンピューターと
を含む、システムを提供する。
(1)核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容する通信インターフェースと、
(2)通信インターフェースと通信するコンピューターであって、1つまたは複数のコンピュータープロセッサと、1つまたは複数のコンピュータープロセッサによる実行の際に、
(a)核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容するステップと、
(b)参照配列におけるそれぞれの指定位置について、指定位置を含むシーケンシングリードのサブセットを識別し、指定位置が参照ヌクレオチドによって占有されているサブセット内のシーケンシングされた核酸、および指定位置がバリアントヌクレオチドによって占有されているサブセット内のシーケンシングされた核酸を識別する、ステップと、
(c)指定位置にCからTまたはGからAへの変動指定位置でCからTまたはGからAへの変動を有するシーケンシングされた核酸がコールをサポートするそれぞれの指定位置における偽陽性バリアントヌクレオチドの存在をコールするステップであって、変動が、
(1)指定位置の周囲のヌクレオチドコンテキスト、および/または
(2)指定位置が5’末端の規定される近接度内にあるサブセットの第1の比率内のシーケンシングされた核酸におけるCからTへの変換の過剰出現、もしくは指定位置が3’末端の規定される近接度内にあるサブセットの第2の比率内のシーケンシングされた核酸におけるGからAへの変換の過剰出現
に基づいて、脱アミノ化エラーとして分類される、ステップと
を含む方法を実施するマシン実行可能コードを含むコンピューター可読媒体とを含む、コンピューターと
を含む、システムを提供する。
(1)核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容する通信インターフェースと、
(2)通信インターフェースと通信するコンピューターであって、1つまたは複数のコンピュータープロセッサと、1つまたは複数のコンピュータープロセッサによる実行の際に、
(a)核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容するステップと、
(b)脱アミノ化エラーの確率に基づいてシーケンシングリードにおけるTまたはAバリアントの数を調節するステップであって、エラーの確率が、「T」の場合には分子の5’末端からおよび「A」の場合には分子の3’末端からのバリアントの距離の関数である、ステップとを含む方法を実施するマシン実行可能コードを含むコンピューター可読媒体とを含む、コンピューターとを含む、システムを提供する。
対象は、動物、例えば、哺乳動物種(好ましくは、ヒト)もしくは鳥類(例えば、鳥)種、または他の生物、例えば、植物を指す。より具体的には、対象は、脊椎動物、例えば、哺乳動物、例えば、マウス、霊長類、サル、またはヒトであり得る。動物には、家畜動物、競技動物、およびペットが含まれる。対象は、健康な個体、症状もしくは徴候を有するか、または疾患もしくは疾患の傾向を有することが疑われる個体、または治療を必要とするかもしくは治療を必要とすることが疑われる個体であり得る。
I.概要
II.脱アミノ化に誘導されるエラーを識別し、補正する方法
III.コンピューター実施
IV.方法の一般的な特徴
1.試料
2.増幅
3.バーコード
4.シーケンシング
5.分析
6.処置
図6は、無細胞DNAのシーケンシングリードファミリーを示す。シーケンシングリードは、ヒト染色体2のALK遺伝子(CD246)の様々なセグメントにマッピングされる。ALK遺伝子の関連領域の参照配列は、図の下部に示されている(配列中のギャップは、図面の簡潔さのために示されていない追加のヌクレオチドを表す)。この図は、上から下に、それぞれ、2、3、6、3、および6つのリードを有する、5つのシーケンシングリードファミリーを示す。一方の向きからのリードを、黒色で示し、他方の向きからのリードを、白色で示す。ファミリーのそれぞれは、ファミリーのそれぞれのリードにおいて、GからAへのミスマッチを示す。別々に見ると、これらのシーケンシングリードファミリーは、GからAへの変異をコールするのに十分な根拠を提供する。しかしながら、この図は、GからAへの変異の位置が、配列リードの3’末端に対して、以下:
(1)ファミリー1:第1の鎖:2つのリード、第2の鎖:リードなし、GからAへの変異は、3’末端から70塩基に位置している
(2)ファミリー2:第1の鎖:リードなし、第2の鎖:3つのリード、GからAへの変異は、3’末端から2塩基に位置している
(3)ファミリー3:第1の鎖:2つのリード、第2の鎖:4つのリード、GからAへの変異は、3’末端から6塩基に位置している
(4)ファミリー4:第1の鎖:1つのリード、第2の鎖:2つのリード、GからAへの変異は、3’末端から1塩基に位置している
(5)ファミリー5:第1の鎖:5つのリード、第2の鎖:1つのリード、GからAへの変異は、3’末端から3塩基に位置している
とみなされる場合に変化する。
(実施例2)
(1)ファミリー1:第1の鎖:8つリード、第2の鎖:リードなし、GからAへの変異は、3’末端から62塩基に位置している
(2)ファミリー2:第1の鎖:2つのリード、第2の鎖:2つのリード、GからAへの変異は、3’末端から2塩基に位置している
(3)ファミリー3:第1の鎖:2つのリード、第2の鎖:リードなし、GからAへの変異は、3’末端から72塩基に位置している
(4)ファミリー4:第1の鎖:1つのリード、第2の鎖:4つのリード、GからAへの変異は、3’末端から63塩基に位置している
(5)ファミリー5:第1の鎖:リードなし、第2の鎖:4つのリード、GからAへの変異は、3’末端から79塩基に位置している
本発明は、例えば、以下の項目を提供する。
(項目1)
核酸の集団におけるバリアントヌクレオチドを識別するための方法であって、
(a)一方または両方の末端に一本鎖オーバーハングを有する二本鎖分子を含む核酸の集団を、5’-3’ポリメラーゼ活性および3’-5’エキソヌクレアーゼ活性を有するタンパク質と接触させるステップであって、前記タンパク質が、一方または両方の末端において、3’オーバーハングを消化し、5’オーバーハングを相補的な核酸で充填して、二本鎖平滑末端化核酸を生成する、ステップと、
(b)シーケンシングされた核酸を得るために、前記二本鎖平滑末端化核酸の配列を決定するステップと、
(c)参照配列におけるそれぞれの指定位置について、
(i)前記指定位置を含む、シーケンシングされた核酸のサブセットを識別し、
(ii)前記指定位置がバリアントヌクレオチドによって占有されている前記サブセット内のシーケンシングされた核酸を識別する、ステップと、
(d)ステップ(c)の(ii)における前記シーケンシングされた核酸が、前記コールをサポートするそれぞれの指定位置におけるバリアントヌクレオチドの存在をコールするステップであって、ただし、指定位置におけるバリアントヌクレオチドの存在は、
(i)前記バリアントが、前記参照ヌクレオチドと比較して、CからTまたはGからAへの変動である場合、および
(ii)前記バリアントヌクレオチドが、
(1)前記指定位置の周囲のヌクレオチドコンテキスト、および/または
(2)前記サブセット内のシーケンシングされた核酸の5’末端から、前記指定位置における前記CからTへの変動の距離、または前記サブセット内のシーケンシングされた核酸の3’末端から、前記指定位置における前記GからAへの変動の距離に基づいて、脱アミノ化エラーとして分類される場合には、コールされないことを除く、ステップと
を含む、方法。
(項目2)
ステップ(c)の(ii)が、前記指定位置がバリアントヌクレオチドによって占有されている前記サブセット内の核酸の数を識別し、ステップ(d)の(i)および(ii)で指定される場合を除き、前記変動を有する前記サブセット内のシーケンシングされた核酸の数が閾値に合致すると、それぞれの指定位置におけるバリアントヌクレオチドの存在がコールされる、項目1に記載の方法。
(項目3)
前記バリアントヌクレオチドが、前記サブセット内のシーケンシングされた核酸において5’末端の規定される近接度内にある前記指定位置における前記CからTへの変動の出現、または前記サブセット内のシーケンシングされた核酸において3’末端の規定される近接度内にある前記指定位置における前記GからAへの変動の出現に基づいて、脱アミノ化エラーとして分類される、項目1に記載の方法。
(項目4)
ステップ(c)の(ii)が、前記指定位置が参照ヌクレオチドによって占有されている前記サブセット内のシーケンシングされた核酸の数を識別することをさらに含む、先行する項目のいずれかに記載の方法。
(項目5)
ステップ(b)が、前記二本鎖平滑末端化核酸の両方の鎖の配列を決定することを含む、先行する項目のいずれかに記載の方法。
(項目6)
ステップ(c)が、少なくとも1つの指定位置について行われ、前記変動を有する前記サブセット内の前記シーケンシングされた核酸が、前記二本鎖平滑末端化核酸のシーケンシングされた核酸の両方の鎖の配列を含む、項目5に記載の方法。
(項目7)
ステップ(b)が、鎖の両方の末端から配列を決定することを含む、先行する項目のいずれかに記載の方法。
(項目8)
前記二本鎖平滑末端化核酸を、バーコードを含むアダプターに連結させること、前記アダプターに結合するプライマー分子からプライミングされる前記核酸を増幅させることをさらに含み、
ステップ(b)が、増幅した核酸分子の配列を決定すること、および前記増幅した核酸分子の配列をファミリーにグループ分けすることであって、ファミリーのメンバーが、前記核酸上の同じ開始点および終止点ならびに同じバーコードを有し、前記ファミリーについて、そのそれぞれのメンバーの配列から、複数の位置のそれぞれにおけるコンセンサスヌクレオチドを決定することを含む、先行する項目のいずれかに記載の方法。
(項目9)
前記核酸の集団が、対象の無細胞核酸を含む試料に由来する、先行する項目のいずれかに記載の方法。
(項目10)
前記無細胞核酸が、がんを有するかまたはがんを有することに一致する徴候または症状を有する対象の体液に由来する、項目9に記載の方法。
(項目11)
前記体液が、血液、血漿、唾液、尿、および脳脊髄液からなる群から選択される、項目10に記載の方法。
(項目12)
前記指定位置における前記CからTへの変動は、その出現が、前記指定位置が前記5’末端の規定される近接度内にある前記サブセットの第1の比率において少なくとも50%である場合に、脱アミノ化エラーとして分類されるか、または前記指定位置における前記GからAへの変動は、その出現が、前記指定位置が前記3’末端の規定される近接度内にある前記サブセットの第2の比率において少なくとも50%である場合に、脱アミノ化エラーとして分類される、先行する項目のいずれかに記載の方法。
(項目13)
前記指定位置における前記CからTへの変動は、前記変動が、前記指定位置が前記5’末端の規定される近接度内にある前記サブセットの第1の比率において、前記サブセット内の他のシーケンシングされた核酸におけるよりも少なくとも2倍の出現を有することに基づいて、脱アミノ化エラーとして分類されるか、または前記指定位置における前記GからAへの変動は、前記変動が、前記指定位置が前記3’末端の規定される近接度内にある前記サブセットの第2の比率において、前記サブセット内の他のシーケンシングされた核酸におけるよりも少なくとも2倍の出現を有することに基づいて、脱アミノ化エラーとして分類される、項目12に記載の方法。
(項目14)
前記閾値は、前記変動が、前記サブセット内のシーケンシングされた核酸の少なくとも1%で存在することである、先行する項目のいずれかに記載の方法。
(項目15)
前記CからTまたはGからAへの変動が、少なくとも、前記周囲のコンテキストがTCGからTTGまたはCGAからCAAであることに基づいて、脱アミノ化エラーとして分類される、先行する項目のいずれかに記載の方法。
(項目16)
前記5’末端へま前記規定される近接度が、前記5’末端まで20ヌクレオチド以内であるか、またはそれよりも少ない数のヌクレオチド以内であるとして規定され、前記3’末端への前記規定される近接度が、前記3’末端まで20ヌクレオチド以内であるか、またはそれよりも少ない数のヌクレオチド以内であるとして規定される、項目3に記載の方法。
(項目17)
前記5’末端への前記規定される近接度が、前記5’末端まで20ヌクレオチド以内であるとして規定され、前記3’末端への前記規定される近接度が、前記3’末端まで20ヌクレオチド以内であるとして規定される、項目16に記載の方法。
(項目18)
前記タンパク質が、クレノウである、先行する項目のいずれかに記載の方法。
(項目19)
ステップ(c)および(d)が、これらのステップを実行するコンピューターにより作動されるシステムなどにおいて行われる、先行する項目のいずれかに記載の方法。
(項目20)
前記参照配列が、ヒトゲノムの配列である、先行する項目のいずれかに記載の方法。
(項目21)
前記参照配列が、ヒト染色体の配列である、項目20に記載の方法。
(項目22)
前記参照配列が、前記ヒトゲノムの非連続領域を含む、項目20に記載の方法。
(項目23)
前記コールされるバリアントヌクレオチドのうちの少なくとも1つが、がんと関連していることが既知である、先行する項目のいずれかに記載の方法。
(項目24)
がんを有するかまたはがんを有することが疑われる対象の集団の試料に由来する核酸集団に行われ、前記集団内の対象が、その後に、前記個々の対象においてどのバリアントヌクレオチドがコールされたかに応じて、異なる処置を受容する、先行する項目のいずれかに記載の方法。
(項目25)
脱アミノ化エラーとして分類されるバリアントヌクレオチドが、前記コールされたバリアントヌクレオチドのうちの少なくとも1%である、先行する項目のいずれかに記載の方法。
(項目26)
脱アミノ化エラーとして分類されるバリアントヌクレオチドが、前記コールされたバリアントヌクレオチドのうちの少なくとも10%である、先行する項目のいずれかに記載の方法。
(項目27)
バリアントの存在は、少なくとも5個のバリアントヌクレオチドが脱アミノ化エラーとして分類される場合、コールされない、先行する項目のいずれかに記載の方法。
(項目28)
前記核酸の集団が、固形組織に由来する、先行する項目のいずれかに記載の方法。
(項目29)
前記体液が、血漿である、項目11に記載の方法。
(項目30)
前記5’末端に連結されるバーコードを含む前記アダプターが、前記3’末端に連結されるバーコードを含む前記アダプターとは異なる、項目8に記載の方法。
(項目31)
前記脱アミノ化エラーの頻度が、少なくとも1%である、先行する項目のいずれかに記載の方法。
(項目32)
前記脱アミノ化エラーの頻度が、少なくとも10%である、先行する項目のいずれかに記載の方法。
(項目33)
前記バリアントヌクレオチドは、前記サブセット内のシーケンシングされた核酸の5’末端から、前記指定位置における前記CからTへの変動の平均距離が、前記指定位置における前記参照ヌクレオチドの平均距離よりも小さいこと、または前記サブセット内のシーケンシングされた核酸の3’末端から、前記指定位置における前記GからAへの変動が、前記指定位置における前記参照ヌクレオチドの平均距離よりも小さいことに基づいて、脱アミノ化エラーとして分類される、先行する項目のいずれかに記載の方法。
(項目34)
前記バリアントヌクレオチドが、単一バリアント(SNV)である、先行する項目のいずれかに記載の方法。
(項目35)
核酸においてバリアントヌクレオチドを識別する方法であって、
(a)一本鎖オーバーハングを有する二本鎖核酸を、5’-3’ポリメラーゼ活性および3’-5’エキソヌクレアーゼ活性を有するタンパク質と接触させるステップであって、それによって、二本鎖平滑末端化核酸を産生するステップと、
(b)前記二本鎖平滑末端化核酸の配列を決定するステップと、
(c)前記決定した配列を参照配列と比較するステップであって、前記決定した配列が、前記決定した配列の5’末端の20ヌクレオチドまたはそれ未満以内の少なくとも1つの指定位置における少なくとも1つのCからTへの変動、または前記決定した配列の3’末端の20ヌクレオチドまたはそれ未満以内における少なくとも1つのGからAへの変動を含む、ステップと、
(d)前記核酸の配列を、前記決定した配列としてコールするステップであって、ただし、CからTへの変動が前記決定した配列の5’末端の20ヌクレオチドまたはそれ未満以内に存在するか、またはGからAへの変動が前記決定した配列の3’末端の20ヌクレオチドまたはそれ未満以内に存在する前記位置のうちの少なくとも1つにおいて、前記参照配列を占有しているヌクレオチドが、前記指定位置でコールされることを除く、ステップと
を含む、方法。
(項目36)
前記CからTまたはGからAへの変動が、TCGからTTGまたはCGAからCAAの周囲コンテキストにおいて生じる、項目35に記載の方法。
(項目37)
核酸の集団においてバリアントヌクレオチドを識別する方法であって、
(a)少なくとも1つが一方または両方の末端に一本鎖オーバーハングを有する二本鎖分子である、オーバーラップする配列の核酸の集団を、5’-3’ポリメラーゼ活性および3’-5’エキソヌクレアーゼ活性を有するタンパク質と接触させるステップであって、前記タンパク質が、3’オーバーハングを消化し、5’オーバーハングを充填して、二本鎖平滑末端化核酸を生成する、ステップと、
(b)前記二本鎖平滑末端化核酸を、バーコードを含むアダプターに連結させ、前記アダプターに結合するプライマー分子からプライミングされる前記核酸を増幅させるステップと、
(c)増幅した核酸分子の配列を決定し、前記増幅した核酸分子の配列をファミリーに分類し、ファミリーのメンバーが、前記核酸上の同じ開始点および終止点ならびに同じバーコードを有し、前記ファミリーについて、そのそれぞれのメンバーの配列から、コンセンサス配列を決定するステップと、
(d)参照配列におけるそれぞれの指定位置について、前記指定位置を含むコンセンサス配列を有するファミリーのサブセットを決定するステップであって、前記指定位置がバリアントヌクレオチドによって占有されている前記サブセット内のコンセンサス配列を識別する、ステップと、
(e)前記バリアントヌクレオチドを有する前記サブセット内の前記コンセンサス配列が前記コールをサポートする指定位置におけるバリアントヌクレオチドの存在をコールするステップであって、ただし、指定位置におけるバリアントヌクレオチドの存在は、
(i)前記バリアントヌクレオチドが、前記参照ヌクレオチドと比較して、CからTまたはGからAへの変動である場合、および
(ii)前記バリアントヌクレオチドが、
(1)前記指定位置の周囲のヌクレオチドコンテキスト、および/または
(2)前記5’末端から、前記サブセット内のコンセンサス配列の前記指定位置における前記CからTへの変動の距離、または前記3’末端から、コンセンサス配列の前記指定位置における前記GからAへの変動の距離に基づいて、脱アミノ化エラーとして分類される場合
には、コールされないことを除く、ステップと
を含む、方法。
(項目38)
ステップ(c)の(ii)が、前記指定位置がバリアントヌクレオチドによって占有されている前記サブセット内の核酸の数を識別し、ステップ(d)の(i)および(ii)で指定される場合を除き、前記変動を有する前記サブセット内のシーケンシングされた核酸の数が閾値に合致するとき、それぞれの指定位置におけるバリアントヌクレオチドの存在がコールされる、項目37に記載の方法。
(項目39)
核酸の集団において偽陽性バリアントヌクレオチドを識別するための方法であって、
(a)少なくとも1つが一方または両方の末端に一本鎖オーバーハングを有する二本鎖分子である、配列がオーバーラップする核酸の集団を、5’-3’ポリメラーゼ活性および3’-5’エキソヌクレアーゼ活性を有するタンパク質と接触させるステップであって、前記タンパク質が、一方または両方の末端において、3’オーバーハングを消化し、5’オーバーハングを相補的な核酸で充填して、二本鎖平滑末端化核酸を生成する、ステップと、
(b)シーケンシングされた核酸を得るために、前記二本鎖平滑末端化核酸の配列を決定するステップと、
(c)参照配列におけるそれぞれの指定位置について、前記指定位置を含むシーケンシングされた核酸のサブセットを識別し、そして前記指定位置が参照ヌクレオチドによって占有されている前記サブセット内のシーケンシングされた核酸、および前記指定位置がバリアントヌクレオチドによって占有されている前記サブセット内のシーケンシングされた核酸の数を識別する、ステップと、
(d)前記指定位置にCからTまたはGからAへの変動指定位置でCからTまたはGからAへの変動を有する前記シーケンシングされた核酸が、前記コールに合致してサポートするそれぞれの指定位置における偽陽性バリアントヌクレオチドの存在をコールするステップであって、そして前記変動が、
(1)前記指定位置の周囲のヌクレオチドコンテキスト、および/または
(2)前記指定位置が前記5’末端の規定される近接度内にある前記サブセットの第1の比率内のシーケンシングされた核酸における前記CからTへの変換の過剰出現、もしくは前記指定位置が前記3’末端の規定される近接度内にある、前記サブセットの第2の比率内のシーケンシングされた核酸における前記GからAへの変換の過剰出現に基づいて、脱アミノ化エラーとして分類される、ステップと
を含む、方法。
(項目40)
ステップ(c)の(ii)が、前記指定位置がバリアントヌクレオチドによって占有されている前記サブセット内の核酸の数を識別し、ステップ(d)の(i)および(ii)で指定される場合を除き、前記変動を有する前記サブセット内のシーケンシングされた核酸の数が閾値に合致するとき、それぞれの指定位置におけるバリアントヌクレオチドの存在がコールされる、項目39に記載の方法。
(項目41)
参照配列内の指定位置における「C」から「T」または「G」から「A」へのバリアントのマイナー対立遺伝子頻度を、前記指定位置にマッピングされるシーケンシングされた核酸の集団において決定する方法であって、マイナー対立遺伝子頻度が、前記バリアントを含む前記指定位置にマッピングされるシーケンシングされた核酸の数(「バリアント数」)を、前記指定位置にマッピングされるシーケンシングされた核酸の総数と比較し、前記方法が、脱アミノ化エラーの確率について、前記指定位置におけるTまたはAバリアントの数を調節するステップを含み、エラーの確率が、「T」の場合には分子の5’末端からおよび「A」の場合には分子の3’末端からの前記バリアントの距離の関数である、方法。
(項目42)
シーケンシングされたポリヌクレオチドの5’末端から選択された距離内に位置する「T」バリアント、またはシーケンシングされた核酸の3’末端から選択された距離内に位置する「A」バリアントが、前記バリアント数にカウントされない、項目41に記載の方法。
(項目43)
シーケンシングされたポリヌクレオチドの5’末端から選択された距離内に位置する「T」バリアントの、シーケンシングされた核酸の5’末端から前記選択された距離外に位置する「T」バリアントに対する比が、所定の比を上回る(例えば、50%を上回る)場合、またはシーケンシングされた核酸の3’末端から選択された距離内に位置する「A」バリアントの、シーケンシングされた核酸の3’末端から前記選択された距離外に位置する「A」バリアントに対する比が、所定の比を上回る(例えば、50%を上回る)場合、すべての「T」バリアントは、前記バリアント数からディスカウントされる、項目41に記載の方法。
(項目44)
前記バリアント数が、それぞれの「T」バリアントまたはそれぞれの「A」バリアントが、真のバリアントである確率の合計として決定される、項目41に記載の方法。
(項目45)
先行する項目のいずれかに記載の方法によって、がんマーカーを有することが決定された対象に、前記がんマーカーにより特徴付けられるがんを処置するのに有効な治療介入を投与することを含む、方法。
(項目46)
項目1から45のいずれか1項に記載の方法を行うことによって、対象の無細胞核酸における1つまたは複数のバリアントヌクレオチドの同一性に関するデータを受容するステップと、
前記1つまたは複数のバリアントヌクレオチドから、がんマーカーの存在を決定するステップと、
前記がんマーカーにより特徴付けられるがんを処置するのに有効な治療介入を投与するステップとを含む、方法。
(項目47)
核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容する通信インターフェースと、
前記通信インターフェースと通信するコンピューターであって、1つまたは複数のコンピュータープロセッサと、前記1つまたは複数のコンピュータープロセッサによる実行の際に、
(a)前記核酸シーケンサーによって生成された前記シーケンシングリードを、前記通信ネットワークを通じて受容するステップと、
(b)参照配列におけるそれぞれの指定位置について、
(i)前記指定位置を含む、シーケンシングリードのサブセットを識別し、
(ii)前記指定位置がバリアントヌクレオチドによって占有されている、前記サブセット内のシーケンシングリードを識別する、ステップと、
(c)前記変動を有する前記サブセット内の前記シーケンシングリードが、前記コールをサポートするそれぞれの指定位置におけるバリアントヌクレオチドの存在をコールするステップであって、ただし、指定位置におけるバリアントヌクレオチドの存在は、
(i)前記バリアントが、前記参照ヌクレオチドと比較して、CからTまたはGからAへの変動である場合、および
(ii)前記バリアントヌクレオチドが、
(1)前記指定位置の周囲のヌクレオチドコンテキスト、および/または
(2)前記サブセット内のシーケンシングされた核酸の5’末端から、前記指定位置における前記CからTへの変動の距離、または前記サブセット内のシーケンシングされた核酸の3’末端から、前記指定位置における前記GからAへの変動の距離に基づいて、脱アミノ化エラーとして分類される場合には、コールされないことを除く、ステップと
を含む方法を実施するマシン実行可能コードを含むコンピューター可読媒体とを含む、コンピューターと
を含む、システム。
(項目48)
ステップ(c)の(ii)が、前記指定位置がバリアントヌクレオチドによって占有されている前記サブセット内の核酸の数を識別し、ステップ(d)の(i)および(ii)で指定される場合を除き、前記変動を有する前記サブセット内のシーケンシングされた核酸の数が閾値に合致すると、それぞれの指定位置におけるバリアントヌクレオチドの存在がコールされる、項目47に記載のシステム。
(項目49)
核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容する通信インターフェースと、
前記通信インターフェースと通信するコンピューターであって、1つまたは複数のコンピュータープロセッサと、前記1つまたは複数のコンピュータープロセッサによる実行の際に、
(a)前記核酸シーケンサーによって生成された前記シーケンシングリードを、前記通信ネットワークを通じて受容するステップと、
(b)前記決定した配列を、参照配列と比較するステップであって、前記決定した配列が、前記決定した配列の5’末端の20ヌクレオチドまたはそれ未満以内の少なくとも1つの指定位置における少なくとも1つのCからTへの変動、または前記決定した配列の3’末端の20ヌクレオチドまたはそれ未満以内における少なくとも1つのGからAへの変動を含む、ステップと、
(c)前記核酸の配列を前記決定した配列としてコールするステップであって、ただし、CからTへの変動が前記決定した配列の5’末端の20ヌクレオチドまたはそれ未満以内に存在するか、またはGからAへの変動が前記決定した配列の3’末端の20ヌクレオチドまたはそれ未満以内に存在する前記位置のうちの少なくとも1つにおいては、前記参照配列を占有しているヌクレオチドが、前記指定位置でコールされることを除く、ステップとを含む方法を実施するマシン実行可能コードを含むコンピューター可読媒体とを含む、コンピューターとを含む、システム。
(項目50)
核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容する通信インターフェースと、
前記通信インターフェースと通信するコンピューターであって、1つまたは複数のコンピュータープロセッサと、前記1つまたは複数のコンピュータープロセッサによる実行の際に、
(a)前記核酸シーケンサーによって生成された前記シーケンシングリードを、前記通信ネットワークを通じて受容するステップと、
(b)前記シーケンシングリードの配列をファミリーにグループ分けするステップであって、ファミリーのメンバーが、前記核酸上の同じ開始点および終止点ならびに同じバーコードを有し、前記ファミリーについて、そのそれぞれのメンバーの配列から、コンセンサス配列を決定する、ステップと、
(c)参照配列におけるそれぞれの指定位置について、前記指定位置を含むコンセンサス配列を有するファミリーのサブセットを決定し、前記指定位置がバリアントヌクレオチドによって占有されている、前記コンセンサス配列を識別するステップと、
(d)前記バリアントヌクレオチドを有する前記サブセット内の前記コンセンサス配列がそれぞれの指定位置におけるバリアントヌクレオチドの存在をコールするステップであって、ただし、前記コールをサポートするが、指定位置におけるバリアントヌクレオチドの存在は、
(i)前記バリアントヌクレオチドが、前記参照ヌクレオチドと比較して、CからTまたはGからAへの変動である場合、および
(ii)前記バリアントヌクレオチドが、
(1)前記指定位置の周囲のヌクレオチドコンテキスト、および/または
(2)5’末端から、前記サブセット内のコンセンサス配列内の前記指定位置における前記CからTへの変動の距離、または3’末端から、コンセンサス配列の前記指定位置における前記GからAへの変動の距離に基づいて、脱アミノ化エラーとして分類される場合には、コールされないことを除く、ステップと
を含む方法を実施するマシン実行可能コードを含むコンピューター可読媒体とを含む、コンピューターとを含む、システム。
(項目51)
ステップ(c)が、前記指定位置がバリアントヌクレオチドによって占有されている前記サブセット内のコンセンサス配列の数を識別し、ステップ(d)の(i)および(ii)で指定される場合を除き、前記変動を有する前記サブセット内のコンセンサス配列の数が閾値に合致すると、それぞれの指定位置におけるバリアントヌクレオチドの存在がコールされる、項目50に記載のシステム。
(項目52)
核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容する通信インターフェースと、
前記通信インターフェースと通信するコンピューターであって、1つまたは複数のコンピュータープロセッサと、前記1つまたは複数のコンピュータープロセッサによる実行の際に、
(a)前記核酸シーケンサーによって生成された前記シーケンシングリードを、前記通信ネットワークを通じて受容するステップと、
(b)参照配列におけるそれぞれの指定位置について、前記指定位置を含むシーケンシングリードのサブセットを識別し、前記指定位置が参照ヌクレオチドによって占有されている前記サブセット内のシーケンシングされた核酸、および前記指定位置がバリアントヌクレオチドによって占有されている前記サブセット内のシーケンシングされた核酸の数を識別する、ステップと、
(c)前記指定位置でCからTまたはGからAへの変動を有する前記シーケンシングされた核酸が前記コールをサポートするそれぞれの指定位置における偽陽性バリアントヌクレオチドの存在をコールするステップであって、前記変動が、
(1)前記指定位置の周囲のヌクレオチドコンテキスト、および/または
(2)前記指定位置が5’末端の規定される近接度内にある、前記サブセットの第1の比率内のシーケンシングされた核酸における前記CからTへの変換の過剰出現、もしくは前記指定位置が3’末端の規定される近接度内にある前記サブセットの第2の比率内のシーケンシングされた核酸における前記GからAへの変換の過剰出現に基づいて、脱アミノ化エラーとして分類される、ステップとを含む方法を実施するマシン実行可能コードを含むコンピューター可読媒体とを含む、コンピューターとを含む、システム。
(項目53)
核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容する通信インターフェースと、
前記通信インターフェースと通信するコンピューターであって、1つまたは複数のコンピュータープロセッサと、前記1つまたは複数のコンピュータープロセッサによる実行の際に、
(a)前記核酸シーケンサーによって生成された前記シーケンシングリードを、前記通信ネットワークを通じて受容するステップと、
(b)脱アミノ化エラーの確率に基づいて前記シーケンシングリードにおけるTまたはAバリアントの数を調節するステップであって、エラーの確率が、「T」の場合には分子の5’末端からおよび「A」の場合には前記分子の3’末端からの前記バリアントの距離の関数である、ステップとを含む方法を実施するマシン実行可能コードを含むコンピューター可読媒体とを含む、コンピューターとを含む、システム。
(項目54)
前記核酸シーケンサーをさらに含む、項目47から53のいずれか1項に記載のシステム。
(項目55)
前記核酸シーケンサーが、対象に由来する無細胞DNA分子から生成されたシーケンシングライブラリーをシーケンシングし、前記シーケンシングライブラリーが、前記無細胞DNA分子およびバーコードを含むアダプターを含む、項目47から53のいずれか1項に記載のシステム。
(項目56)
前記核酸シーケンサーが、前記シーケンシングライブラリーにシーケンシングバイシンセシスを行って、前記シーケンシングリードを生成する、項目47から53のいずれか1項に記載のシステム。
(項目57)
前記核酸シーケンサーが、前記シーケンシングライブラリーにパイロシーケンシング、単分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、シーケンシングバイライゲーション、またはシーケンシングバイハイブリダイゼーションを行って、前記シーケンシングリードを生成する、項目47から53のいずれか1項に記載のシステム。
(項目58)
前記核酸シーケンサーが、前記シーケンシングライブラリーに由来するクローン単一分子アレイを使用して、前記シーケンシングリードを生成する、項目47から53のいずれか1項に記載のシステム。
(項目59)
前記核酸シーケンサーが、前記シーケンシングライブラリーをシーケンシングして前記シーケンシングリードを生成するための、マイクロウェルのアレイを有するチップを含む、項目47から53のいずれか1項に記載のシステム。
(項目60)
前記コンピューター可読媒体が、メモリー、ハードドライブ、またはコンピューターサーバーを含む、項目47から53のいずれか1項に記載のシステム。
(項目61)
前記通信ネットワークが、遠隔通信ネットワーク、インターネット、エクストラネット、またはイントラネットを含む、項目47から53のいずれか1項に記載のシステム。
(項目62)
前記通信ネットワークが、分散コンピューティングの可能な1つまたは複数のコンピューターサーバーを含む、項目47から53のいずれか1項に記載のシステム。
(項目63)
分散コンピューティングが、クラウドコンピューティングである、項目64に記載のシステム。
(項目64)
前記コンピューターが、前記核酸シーケンサーから遠隔設置されているコンピューターサーバー上に設置されている、項目47から53のいずれか1項に記載のシステム。
(項目65)
前記シーケンシングライブラリーが、試料を、1つまたは複数の試料と区別する試料バーコードをさらに含む、項目64に記載のシステム。
(項目66)
ネットワークを通じて前記コンピューターと通信する、電子ディスプレイであって、(a)~(c)を実施した際の結果を表示するためのユーザーインターフェースを含む、電子ディスプレイをさらに含む、項目47から53のいずれか1項に記載のシステム。
(項目67)
前記ユーザーインターフェースが、グラフィカルユーザーインターフェース(GUI)またはウェブベースユーザーインターフェースである、項目66に記載のシステム。
(項目68)
前記電子ディスプレイが、パーソナルコンピューターにおいて存在する、項目66に記載のシステム。
(項目69)
前記電子ディスプレイが、インターネット対応コンピューターにおいて存在する、項目66に記載のシステム。
(項目70)
前記インターネット対応コンピューターが、前記コンピューターから遠隔した位置に設置されている、項目69に記載のシステム。
Claims (16)
- 無細胞核酸の集団におけるバリアントヌクレオチドを識別するための方法であって、
(a)一方または両方の末端に一本鎖オーバーハングを有する二本鎖分子を含む無細胞核酸の集団を、5’-3’ポリメラーゼ活性および3’-5’エキソヌクレアーゼ活性を有するタンパク質と接触させるステップであって、前記タンパク質が、一方または両方の末端において、3’オーバーハングを消化し、5’オーバーハングを相補的な核酸で充填して、二本鎖平滑末端化核酸を生成する、ステップと、
(b)シーケンシングされた核酸を得るために、前記二本鎖平滑末端化核酸の配列を決定するステップと、
(c)参照配列におけるそれぞれの指定位置について、
(i)前記指定位置を含む、シーケンシングされた核酸のサブセットを識別し、
(ii)前記指定位置がバリアントヌクレオチドによって占有されている前記サブセット内のシーケンシングされた核酸を識別する、ステップと、
(d)ステップ(c)の(ii)における前記シーケンシングされた核酸が閾値に合致するそれぞれの指定位置におけるバリアントヌクレオチドの存在をコールするステップであって、ただし、指定位置におけるバリアントヌクレオチドの存在は、
(i)前記バリアントが、前記参照ヌクレオチドと比較して、CからTまたはGからAへの変動である場合、および
(ii)前記バリアントヌクレオチドが、
(1)前記指定位置の周囲のヌクレオチドコンテキスト、および/または
(2)前記サブセット内のシーケンシングされた核酸の5’末端から、前記指定位置における前記CからTへの変動の距離、または前記サブセット内のシーケンシングされた核酸の3’末端から、前記指定位置における前記GからAへの変動の距離
に基づいて、脱アミノ化エラーとして分類される場合には、コールされないことを除く、ステップと
を含む、方法。 - 前記指定位置が参照ヌクレオチドによって占有されている前記サブセット内のシーケンシングされた核酸の数を識別することをさらに含む、請求項1に記載の方法。
- ステップ(b)が、
(a)前記二本鎖平滑末端化核酸の両方の鎖の配列を決定することを含み、ステップ(c)が、少なくとも1つの指定位置について行われ、前記変動を有する前記サブセット内の前記シーケンシングされた核酸が、前記二本鎖平滑末端化核酸のシーケンシングされた核酸の両方の鎖の配列を含み、および/または
(b)鎖の両方の末端から配列を決定することを含む、
請求項1または2に記載の方法。 - (a)前記バリアントヌクレオチドが、前記サブセット内のシーケンシングされた核酸において5’末端の規定される近接度内にある前記指定位置における前記CからTへの変動の出現、または前記サブセット内のシーケンシングされた核酸において3’末端の規定される近接度内にある前記指定位置における前記GからAへの変動の出現に基づいて、脱アミノ化エラーとして分類され、前記5’末端へ前記規定される近接度が、前記5’末端まで20ヌクレオチド以内であるか、またはそれよりも少ない数のヌクレオチド以内であるとして規定され、前記3’末端への前記規定される近接度が、前記3’末端まで20ヌクレオチド以内であるか、またはそれよりも少ない数のヌクレオチド以内であるとして規定され、
(b)前記CからTまたはGからAへの変動が、少なくとも、前記周囲のコンテキストがTCGからTTGまたはCGAからCAAであることに基づいて、脱アミノ化エラーとして分類され、
(c)前記バリアントヌクレオチドは、前記サブセット内のシーケンシングされた核酸の5’末端から、前記指定位置における前記CからTへの変動の平均距離が、前記指定位置における前記参照ヌクレオチドの平均距離よりも小さいこと、または前記サブセット内のシーケンシングされた核酸の3’末端から、前記指定位置における前記GからAへの変動が、前記指定位置における前記参照ヌクレオチドの平均距離よりも小さいことに基づいて、脱アミノ化エラーとして分類され、および/または
(d)前記指定位置における前記CからTへの変動は、その出現が、前記指定位置が前記5’末端の規定される近接度内にある前記サブセットの第1の比率において少なくとも50%である場合に、脱アミノ化エラーとして分類されるか、または前記指定位置における前記GからAへの変動は、その出現が、前記指定位置が前記3’末端の規定される近接度内にある前記サブセットの第2の比率において少なくとも50%である場合に、脱アミノ化エラーとして分類され、
(i)前記指定位置における前記CからTへの変動は、前記変動が、前記指定位置が前記5’末端の規定される近接度内にある前記サブセットの第1の比率において、前記サブセット内の他のシーケンシングされた核酸におけるよりも少なくとも2倍の出現を有することに基づいて、脱アミノ化エラーとして分類されるか、もしくは
(ii)前記指定位置における前記GからAへの変動は、前記変動が、前記指定位置が前記3’末端の規定される近接度内にある前記サブセットの第2の比率において、前記サブセット内の他のシーケンシングされた核酸におけるよりも少なくとも2倍の出現を有することに基づいて、脱アミノ化エラーとして分類される、
請求項1~3のいずれか一項に記載の方法。 - 前記二本鎖平滑末端化核酸を、バーコードを含むアダプターに連結させること、前記アダプターに結合するプライマー分子からプライミングされる前記核酸を増幅させることをさらに含み、
ステップ(b)が、増幅した核酸分子の配列を決定すること、および前記増幅した核酸分子の配列をファミリーにグループ分けすることであって、ファミリーのメンバーが、前記核酸上の同じ開始点および終止点ならびに同じバーコードを有し、前記ファミリーについて、そのそれぞれのメンバーの配列から、複数の位置のそれぞれにおけるコンセンサスヌクレオチドを決定することを含む、
請求項1~4のいずれか一項に記載の方法。 - 前記無細胞核酸が、体液に由来し、前記体液が、血液、血漿、唾液、尿、および脳脊髄液からなる群から選択される、請求項1~5のいずれか一項に記載の方法。
- 前記タンパク質が、クレノウである、および/または前記バリアントヌクレオチドが、単一ヌクレオチドバリアント(SNV)である、請求項1~6のいずれか一項に記載の方法。
- 前記参照配列が、ヒトゲノム、またはヒト染色体の配列、または前記ヒトゲノムの非連続領域を含む、請求項1~7のいずれか一項に記載の方法。
- 前記コールされるバリアントヌクレオチドのうちの少なくとも1つが、がんと関連していることが既知である、請求項1~8のいずれか一項に記載の方法。
- がんを有するかまたはがんを有することが疑われる対象の集団の試料に由来する核酸集団に行われ、前記個々の対象においてコールされたバリアントヌクレオチドの数および種類が、前記集団における対象に投与される異なる処置を示す、請求項1~9のいずれか一項に記載の方法。
- 脱アミノ化エラーとして分類されるバリアントヌクレオチドが、前記コールされたバリアントヌクレオチドのうちの少なくとも1%または少なくとも10%である、請求項1~10のいずれか一項に記載の方法。
- バリアントの存在は、少なくとも5個のバリアントヌクレオチドが脱アミノ化エラーとして分類される場合、コールされない、請求項1~11のいずれか一項に記載の方法。
- 前記脱アミノ化エラーの頻度が、少なくとも1%または少なくとも10%である、請求項1~12のいずれか一項に記載の方法。
- 前記閾値は、前記変動が、前記サブセット内のシーケンシングされた核酸の少なくとも1%で存在することである、請求項1に記載の方法。
- 核酸シーケンサーによって生成されたシーケンシングリードを、通信ネットワークを通じて受容する通信インターフェースと、
前記通信インターフェースと通信するコンピューターであって、1つまたは複数のコンピュータープロセッサと、前記1つまたは複数のコンピュータープロセッサによる実行の際に、
(a)前記核酸シーケンサーによって生成された前記シーケンシングリードを、前記通信ネットワークを通じて受容するステップであって、前記核酸シーケンサーが、対象に由来する無細胞DNA分子から生成されたシーケンシングライブラリーをシーケンシングし、前記シーケンシングライブラリーが、前記無細胞DNA分子およびバーコードを含むアダプターを含む、ステップと、
(b)参照配列におけるそれぞれの指定位置について、
(i)前記指定位置を含む、シーケンシングリードのサブセットを識別し、
(ii)前記指定位置がバリアントヌクレオチドによって占有されている、前記サブセット内のシーケンシングリードを識別する、ステップと、
(c)前記変動を有する前記サブセット内の前記シーケンシングリードが、前記コールをサポートするそれぞれの指定位置におけるバリアントヌクレオチドの存在をコールするステップであって、ただし、指定位置におけるバリアントヌクレオチドの存在は、
(i)前記バリアントが、前記参照ヌクレオチドと比較して、CからTまたはGからAへの変動である場合、および
(ii)前記バリアントヌクレオチドが、
(1)前記指定位置の周囲のヌクレオチドコンテキスト、および/または
(2)前記サブセット内のシーケンシングされた核酸の5’末端から、前記指定位置における前記CからTへの変動の距離、または前記サブセット内のシーケンシングされた核酸の3’末端から、前記指定位置における前記GからAへの変動の距離に基づいて、脱アミノ化エラーとして分類される場合には、コールされないことを除く、ステップと
を含む方法を実施するマシン実行可能コードを含むコンピューター可読媒体とを含む、コンピューターと
を含む、システム。 - (a)前記核酸シーケンサーをさらに含む、
(b)前記核酸シーケンサーが、前記シーケンシングライブラリーにシーケンシングバイシンセシスを行って、前記シーケンシングリードを生成する、
(c)前記核酸シーケンサーが、前記シーケンシングライブラリーにパイロシーケンシング、単分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、シーケンシングバイライゲーション、またはシーケンシングバイハイブリダイゼーションを行って、前記シーケンシングリードを生成する、
(d)前記核酸シーケンサーが、前記シーケンシングライブラリーに由来するクローン単一分子アレイを使用して、前記シーケンシングリードを生成する、
(e)前記核酸シーケンサーが、前記シーケンシングライブラリーをシーケンシングして前記シーケンシングリードを生成するための、マイクロウェルのアレイを有するチップを含む、
(f)前記コンピューター可読媒体が、メモリー、ハードドライブ、またはコンピューターサーバーを含む、
(g)前記通信ネットワークが、遠隔通信ネットワーク、インターネット、エクストラネット、またはイントラネットを含む、
(h)前記通信ネットワークが、分散コンピューティングの可能な1つまたは複数のコンピューターサーバーを含む、
(i)前記コンピューターが、前記核酸シーケンサーから遠隔設置されているコンピューターサーバー上に設置されている、
(j)前記シーケンシングライブラリーが、試料を、1つまたは複数の試料と区別する試料バーコードをさらに含む、および/または
(k)ネットワークを通じて前記コンピューターと通信する、電子ディスプレイであって、(a)~(c)を実施した際の結果を表示するためのグラフィカルもしくはウェブベースのユーザーインターフェース、パーソナルコンピューター、またはインターネット対応コンピューターを含む、電子ディスプレイをさらに含み、前記インターネット対応コンピューターが、前記コンピューターから遠隔した位置に設置されている、
請求項15に記載のシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023030896A JP2023060046A (ja) | 2017-11-03 | 2023-03-01 | 脱アミノ化に誘導される配列エラーの補正 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762581609P | 2017-11-03 | 2017-11-03 | |
US62/581,609 | 2017-11-03 | ||
PCT/US2018/059056 WO2019090147A1 (en) | 2017-11-03 | 2018-11-02 | Correcting for deamination-induced sequence errors |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023030896A Division JP2023060046A (ja) | 2017-11-03 | 2023-03-01 | 脱アミノ化に誘導される配列エラーの補正 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021502072A JP2021502072A (ja) | 2021-01-28 |
JP2021502072A5 JP2021502072A5 (ja) | 2021-12-09 |
JP7304852B2 true JP7304852B2 (ja) | 2023-07-07 |
Family
ID=66332356
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020524480A Active JP7304852B2 (ja) | 2017-11-03 | 2018-11-02 | 脱アミノ化に誘導される配列エラーの補正 |
JP2023030896A Pending JP2023060046A (ja) | 2017-11-03 | 2023-03-01 | 脱アミノ化に誘導される配列エラーの補正 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023030896A Pending JP2023060046A (ja) | 2017-11-03 | 2023-03-01 | 脱アミノ化に誘導される配列エラーの補正 |
Country Status (6)
Country | Link |
---|---|
US (3) | US11008616B2 (ja) |
EP (1) | EP3704265A4 (ja) |
JP (2) | JP7304852B2 (ja) |
CN (1) | CN111542616A (ja) |
CA (1) | CA3079252A1 (ja) |
WO (1) | WO2019090147A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024050242A1 (en) * | 2022-08-29 | 2024-03-07 | Foundation Medicine, Inc. | Methods and systems for detecting tumor shedding |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150066385A1 (en) | 2013-08-30 | 2015-03-05 | 10X Technologies, Inc. | Sequencing methods |
WO2016128758A1 (en) | 2015-02-13 | 2016-08-18 | Prokyma Technologies Limited | Treatment of a blood sample for sequencing circulating tumour cells |
WO2016149261A1 (en) | 2015-03-16 | 2016-09-22 | Personal Genome Diagnostics, Inc. | Systems and methods for analyzing nucleic acid |
JP2017033046A (ja) | 2015-07-28 | 2017-02-09 | 株式会社理研ジェネシス | 変異判定方法、変異判定プログラムおよび記録媒体 |
WO2017136603A1 (en) | 2016-02-02 | 2017-08-10 | Guardant Health, Inc. | Cancer evolution detection and diagnostic |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6582908B2 (en) | 1990-12-06 | 2003-06-24 | Affymetrix, Inc. | Oligonucleotides |
US6630144B1 (en) * | 1999-08-30 | 2003-10-07 | The United States Of America As Represented By The Secretary Of The Army | Monoclonal antibodies to Ebola glycoprotein |
EP1448799B2 (en) | 2001-11-28 | 2018-05-16 | Life Technologies Corporation | Methods of selective nucleic acid isolation |
WO2006031745A2 (en) * | 2004-09-10 | 2006-03-23 | Sequenom, Inc. | Methods for long-range sequence analysis of nucleic acids |
US8486630B2 (en) * | 2008-11-07 | 2013-07-16 | Industrial Technology Research Institute | Methods for accurate sequence data and modified base position determination |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
ES2523140T3 (es) * | 2010-09-21 | 2014-11-21 | Population Genetics Technologies Ltd. | Aumento de la confianza en las identificaciones de alelos con el recuento molecular |
CA2867293C (en) * | 2012-03-13 | 2020-09-01 | Abhijit Ajit PATEL | Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing |
DK2828218T3 (da) | 2012-03-20 | 2020-11-02 | Univ Washington Through Its Center For Commercialization | Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing |
AU2013240166A1 (en) * | 2012-03-30 | 2014-10-30 | Pacific Biosciences Of California, Inc. | Methods and composition for sequencing modified nucleic acids |
EP2677449A1 (en) * | 2012-06-19 | 2013-12-25 | Sjöblom, Tobias | Method and device for efficient calculation of allele ratio confidence intervals and uses thereof |
US9092401B2 (en) * | 2012-10-31 | 2015-07-28 | Counsyl, Inc. | System and methods for detecting genetic variation |
CA2883901C (en) | 2012-09-04 | 2023-04-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
ES2732012T3 (es) * | 2013-03-14 | 2019-11-20 | Abbott Molecular Inc | Minimización de errores utilizando uracil-ADN-N-glicosilasa |
CN105408496A (zh) * | 2013-03-15 | 2016-03-16 | 夸登特健康公司 | 检测稀有突变和拷贝数变异的系统和方法 |
US20150044192A1 (en) * | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
WO2015164432A1 (en) * | 2014-04-21 | 2015-10-29 | Natera, Inc. | Detecting mutations and ploidy in chromosomal segments |
WO2015188192A2 (en) * | 2014-06-06 | 2015-12-10 | Cornell University | Method for identification and enumeration of nucleic acid sequence, expression, copy, or dna methylation changes, using combined nuclease, ligase, polymerase, and sequencing reactions |
ES2925014T3 (es) | 2014-09-12 | 2022-10-13 | Univ Leland Stanford Junior | Identificación y uso de ácidos nucleicos circulantes |
US11427866B2 (en) * | 2016-05-16 | 2022-08-30 | Accuragen Holdings Limited | Method of improved sequencing by strand identification |
-
2018
- 2018-11-02 WO PCT/US2018/059056 patent/WO2019090147A1/en unknown
- 2018-11-02 JP JP2020524480A patent/JP7304852B2/ja active Active
- 2018-11-02 EP EP18874697.8A patent/EP3704265A4/en active Pending
- 2018-11-02 CA CA3079252A patent/CA3079252A1/en active Pending
- 2018-11-02 CN CN201880085431.9A patent/CN111542616A/zh active Pending
-
2020
- 2020-05-04 US US16/866,252 patent/US11008616B2/en active Active
-
2021
- 2021-03-23 US US17/210,202 patent/US11718873B2/en active Active
-
2023
- 2023-03-01 JP JP2023030896A patent/JP2023060046A/ja active Pending
- 2023-06-16 US US18/336,281 patent/US20240141425A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150066385A1 (en) | 2013-08-30 | 2015-03-05 | 10X Technologies, Inc. | Sequencing methods |
WO2016128758A1 (en) | 2015-02-13 | 2016-08-18 | Prokyma Technologies Limited | Treatment of a blood sample for sequencing circulating tumour cells |
WO2016149261A1 (en) | 2015-03-16 | 2016-09-22 | Personal Genome Diagnostics, Inc. | Systems and methods for analyzing nucleic acid |
JP2017033046A (ja) | 2015-07-28 | 2017-02-09 | 株式会社理研ジェネシス | 変異判定方法、変異判定プログラムおよび記録媒体 |
WO2017136603A1 (en) | 2016-02-02 | 2017-08-10 | Guardant Health, Inc. | Cancer evolution detection and diagnostic |
Non-Patent Citations (4)
Title |
---|
Briggs A. et.al.,Preparation of next-generation sequencing libraries from damaged DNA,Methods in molecular biology,vol.840,2012年,pp.143-154 |
Chen L. et.al.,DNA damage is a major cause of sequencing errors, directly confounding variant identification,Biorxiv,2016年08月23日,doi: https://doi.org/10.1101/070334 |
Chen, G. et.al.,Cytosine deamination is a major cause of baseline noise in next generation sequencing,Mol. diagn. ther.,2014年,vol.18, no.5,pp.587-593 |
Starrett, G.J. et.al.,The DNA cytosine deaminase APOBEC3H haplotype I likely contributes to breast and lung cancer mutagenesis,Nature communications,2016年,vol.7,pp.1-13, doi: 10.1038/ncomms12918 |
Also Published As
Publication number | Publication date |
---|---|
CA3079252A1 (en) | 2019-05-09 |
US20240141425A1 (en) | 2024-05-02 |
EP3704265A1 (en) | 2020-09-09 |
WO2019090147A1 (en) | 2019-05-09 |
US20200377941A1 (en) | 2020-12-03 |
JP2021502072A (ja) | 2021-01-28 |
JP2023060046A (ja) | 2023-04-27 |
US11008616B2 (en) | 2021-05-18 |
US20210395816A1 (en) | 2021-12-23 |
CN111542616A (zh) | 2020-08-14 |
US11718873B2 (en) | 2023-08-08 |
EP3704265A4 (en) | 2021-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11193175B2 (en) | Normalizing tumor mutation burden | |
JP7242644B2 (ja) | 体細胞および生殖細胞系統バリアントを鑑別するための方法およびシステム | |
US12106825B2 (en) | Computational modeling of loss of function based on allelic frequency | |
JP2024056984A (ja) | エピジェネティック区画アッセイを較正するための方法、組成物およびシステム | |
US20240141425A1 (en) | Correcting for deamination-induced sequence errors | |
US20210398610A1 (en) | Significance modeling of clonal-level absence of target variants | |
US20220068433A1 (en) | Computational detection of copy number variation at a locus in the absence of direct measurement of the locus | |
KR102722821B1 (ko) | 체세포 및 생식세포계열 변이체를 구별하기 위한 방법 및 시스템 | |
KR20240157126A (ko) | 체세포 및 생식세포계열 변이체를 구별하기 위한 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211101 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211101 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220901 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221130 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230627 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7304852 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |