JP2021536612A - マージされたリードおよびマージされないリードに基づいた遺伝的変異体の検出 - Google Patents
マージされたリードおよびマージされないリードに基づいた遺伝的変異体の検出 Download PDFInfo
- Publication number
- JP2021536612A JP2021536612A JP2021510444A JP2021510444A JP2021536612A JP 2021536612 A JP2021536612 A JP 2021536612A JP 2021510444 A JP2021510444 A JP 2021510444A JP 2021510444 A JP2021510444 A JP 2021510444A JP 2021536612 A JP2021536612 A JP 2021536612A
- Authority
- JP
- Japan
- Prior art keywords
- reads
- nucleic acid
- unmerged
- read
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002068 genetic effect Effects 0.000 title abstract description 21
- 238000001514 detection method Methods 0.000 title description 12
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 300
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 288
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 288
- 238000000034 method Methods 0.000 claims abstract description 145
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 24
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 24
- 239000002157 polynucleotide Substances 0.000 claims abstract description 24
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 14
- 125000003729 nucleotide group Chemical group 0.000 claims description 175
- 239000002773 nucleotide Substances 0.000 claims description 172
- 238000012163 sequencing technique Methods 0.000 claims description 104
- 206010028980 Neoplasm Diseases 0.000 claims description 43
- 238000003780 insertion Methods 0.000 claims description 36
- 230000037431 insertion Effects 0.000 claims description 36
- 238000012217 deletion Methods 0.000 claims description 35
- 230000037430 deletion Effects 0.000 claims description 35
- 108020004414 DNA Proteins 0.000 claims description 33
- 201000011510 cancer Diseases 0.000 claims description 26
- 201000010099 disease Diseases 0.000 claims description 21
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 21
- 230000008707 rearrangement Effects 0.000 claims description 21
- 230000007170 pathology Effects 0.000 claims description 9
- 102000053602 DNA Human genes 0.000 claims description 8
- 210000001124 body fluid Anatomy 0.000 claims description 8
- 239000010839 body fluid Substances 0.000 claims description 8
- 108091034117 Oligonucleotide Proteins 0.000 claims description 7
- 210000004369 blood Anatomy 0.000 claims description 6
- 239000008280 blood Substances 0.000 claims description 6
- 210000002381 plasma Anatomy 0.000 claims description 5
- 210000002966 serum Anatomy 0.000 claims description 4
- 210000002700 urine Anatomy 0.000 claims description 4
- 206010036790 Productive cough Diseases 0.000 claims description 3
- 210000003296 saliva Anatomy 0.000 claims description 3
- 210000003802 sputum Anatomy 0.000 claims description 3
- 208000024794 sputum Diseases 0.000 claims description 3
- 230000036541 health Effects 0.000 claims description 2
- 238000003491 array Methods 0.000 claims 1
- 210000000349 chromosome Anatomy 0.000 abstract description 20
- 238000003745 diagnosis Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 112
- 230000035772 mutation Effects 0.000 description 28
- 238000003860 storage Methods 0.000 description 22
- 238000011282 treatment Methods 0.000 description 20
- 108091035707 Consensus sequence Proteins 0.000 description 19
- 238000003199 nucleic acid amplification method Methods 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 17
- 230000003321 amplification Effects 0.000 description 16
- 210000004027 cell Anatomy 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 230000015654 memory Effects 0.000 description 12
- 230000004927 fusion Effects 0.000 description 11
- 108091093088 Amplicon Proteins 0.000 description 10
- 238000007481 next generation sequencing Methods 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 9
- 238000013507 mapping Methods 0.000 description 9
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 229920001519 homopolymer Polymers 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- -1 DNA or RNA (eg Chemical class 0.000 description 5
- 108700024394 Exon Proteins 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 238000012300 Sequence Analysis Methods 0.000 description 5
- 238000009169 immunotherapy Methods 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 239000002777 nucleoside Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000004393 prognosis Methods 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 3
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 238000005304 joining Methods 0.000 description 3
- 230000003902 lesion Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 2
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 2
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 2
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 2
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 2
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 208000000453 Skin Neoplasms Diseases 0.000 description 2
- 102000049937 Smad4 Human genes 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000003722 extracellular fluid Anatomy 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 238000012252 genetic analysis Methods 0.000 description 2
- 230000007614 genetic variation Effects 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 229960003784 lenvatinib Drugs 0.000 description 2
- WOSKHXYHFSIKNG-UHFFFAOYSA-N lenvatinib Chemical compound C=12C=C(C(N)=O)C(OC)=CC2=NC=CC=1OC(C=C1Cl)=CC=C1NC(=O)NC1CC1 WOSKHXYHFSIKNG-UHFFFAOYSA-N 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 229950001290 lorlatinib Drugs 0.000 description 2
- IIXWYSCJSQVBQM-LLVKDONJSA-N lorlatinib Chemical compound N=1N(C)C(C#N)=C2C=1CN(C)C(=O)C1=CC=C(F)C=C1[C@@H](C)OC1=CC2=CN=C1N IIXWYSCJSQVBQM-LLVKDONJSA-N 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 229920002477 rna polymer Polymers 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000011451 sequencing strategy Methods 0.000 description 2
- 201000000849 skin cancer Diseases 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000037439 somatic mutation Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- AILRADAXUVEEIR-UHFFFAOYSA-N 5-chloro-4-n-(2-dimethylphosphorylphenyl)-2-n-[2-methoxy-4-[4-(4-methylpiperazin-1-yl)piperidin-1-yl]phenyl]pyrimidine-2,4-diamine Chemical compound COC1=CC(N2CCC(CC2)N2CCN(C)CC2)=CC=C1NC(N=1)=NC=C(Cl)C=1NC1=CC=CC=C1P(C)(C)=O AILRADAXUVEEIR-UHFFFAOYSA-N 0.000 description 1
- 102100034580 AT-rich interactive domain-containing protein 1A Human genes 0.000 description 1
- 102100034571 AT-rich interactive domain-containing protein 1B Human genes 0.000 description 1
- 102000000872 ATM Human genes 0.000 description 1
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 102000052609 BRCA2 Human genes 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 1
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 1
- 102100027207 CD27 antigen Human genes 0.000 description 1
- 101150013553 CD40 gene Proteins 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- 108091007854 Cdh1/Fizzy-related Proteins 0.000 description 1
- 102000038594 Cdh1/Fizzy-related Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 208000037051 Chromosomal Instability Diseases 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 1
- 102100024458 Cyclin-dependent kinase inhibitor 2A Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 102100031785 Endothelial transcription factor GATA-2 Human genes 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 1
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 1
- 102100028924 Formin-2 Human genes 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 1
- 102100031561 Hamartin Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000924266 Homo sapiens AT-rich interactive domain-containing protein 1A Proteins 0.000 description 1
- 101000924255 Homo sapiens AT-rich interactive domain-containing protein 1B Proteins 0.000 description 1
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 1
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 1
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 1
- 101001066265 Homo sapiens Endothelial transcription factor GATA-2 Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101001059398 Homo sapiens Formin-2 Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 1
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 1
- 101000795643 Homo sapiens Hamartin Proteins 0.000 description 1
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 1
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 description 1
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 1
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 1
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 1
- 101000595426 Homo sapiens Polyprenol reductase Proteins 0.000 description 1
- 101001126582 Homo sapiens Post-GPI attachment to proteins factor 3 Proteins 0.000 description 1
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 1
- 101000742859 Homo sapiens Retinoblastoma-associated protein Proteins 0.000 description 1
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 1
- 101000628562 Homo sapiens Serine/threonine-protein kinase STK11 Proteins 0.000 description 1
- 101000819111 Homo sapiens Trans-acting T-cell-specific transcription factor GATA-3 Proteins 0.000 description 1
- 101000851370 Homo sapiens Tumor necrosis factor receptor superfamily member 9 Proteins 0.000 description 1
- 101000772888 Homo sapiens Ubiquitin-protein ligase E3A Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 208000005016 Intestinal Neoplasms Diseases 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 1
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 1
- 102000002698 KIR Receptors Human genes 0.000 description 1
- 108010043610 KIR Receptors Proteins 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 239000002146 L01XE16 - Crizotinib Substances 0.000 description 1
- 102000017578 LAG3 Human genes 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 101150083522 MECP2 gene Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 1
- 208000003445 Mouth Neoplasms Diseases 0.000 description 1
- 101150097381 Mtor gene Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100407308 Mus musculus Pdcd1lg2 gene Proteins 0.000 description 1
- 102000013609 MutL Protein Homolog 1 Human genes 0.000 description 1
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 1
- 102000007530 Neurofibromin 1 Human genes 0.000 description 1
- 108010085793 Neurofibromin 1 Proteins 0.000 description 1
- 208000010505 Nose Neoplasms Diseases 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 208000037581 Persistent Infection Diseases 0.000 description 1
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 1
- 206010034811 Pharyngeal cancer Diseases 0.000 description 1
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 1
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 1
- 208000002151 Pleural effusion Diseases 0.000 description 1
- 102100036020 Polyprenol reductase Human genes 0.000 description 1
- 102100030423 Post-GPI attachment to proteins factor 3 Human genes 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 108700030875 Programmed Cell Death 1 Ligand 2 Proteins 0.000 description 1
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 description 1
- 102100024213 Programmed cell death 1 ligand 2 Human genes 0.000 description 1
- 102100028772 Proline dehydrogenase 1, mitochondrial Human genes 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 102100038042 Retinoblastoma-associated protein Human genes 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 1
- 102100026715 Serine/threonine-protein kinase STK11 Human genes 0.000 description 1
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 102100021386 Trans-acting T-cell-specific transcription factor GATA-3 Human genes 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 description 1
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 description 1
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 1
- 102100036856 Tumor necrosis factor receptor superfamily member 9 Human genes 0.000 description 1
- 102100030434 Ubiquitin-protein ligase E3A Human genes 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 229960001686 afatinib Drugs 0.000 description 1
- ULXXDDBFHOBEHA-CWDCEQMOSA-N afatinib Chemical compound N1=CN=C2C=C(O[C@@H]3COCC3)C(NC(=O)/C=C/CN(C)C)=CC2=C1NC1=CC=C(F)C(Cl)=C1 ULXXDDBFHOBEHA-CWDCEQMOSA-N 0.000 description 1
- 229960001611 alectinib Drugs 0.000 description 1
- KDGFLJKFZUIJMX-UHFFFAOYSA-N alectinib Chemical compound CCC1=CC=2C(=O)C(C3=CC=C(C=C3N3)C#N)=C3C(C)(C)C=2C=C1N(CC1)CCC1N1CCOCC1 KDGFLJKFZUIJMX-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000000386 athletic effect Effects 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 229950004272 brigatinib Drugs 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 229960005395 cetuximab Drugs 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 229960005061 crizotinib Drugs 0.000 description 1
- KTEIFNKAUNYNJU-GFCCVEGCSA-N crizotinib Chemical compound O([C@H](C)C=1C(=C(F)C=CC=1Cl)Cl)C(C(=NC=1)N)=CC=1C(=C1)C=NN1C1CCNCC1 KTEIFNKAUNYNJU-GFCCVEGCSA-N 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000000416 exudates and transudate Anatomy 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 210000003731 gingival crevicular fluid Anatomy 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000003426 interchromosomal effect Effects 0.000 description 1
- 201000002313 intestinal cancer Diseases 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 208000037830 nasal cancer Diseases 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000770 proinflammatory effect Effects 0.000 description 1
- 108020004930 proline dehydrogenase Proteins 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- FIKPXCOQUIZNHB-WDEREUQCSA-N repotrectinib Chemical compound C[C@H]1CNC(=O)C2=C3N=C(N[C@H](C)C4=C(O1)C=CC(F)=C4)C=CN3N=C2 FIKPXCOQUIZNHB-WDEREUQCSA-N 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 229940121358 tyrosine kinase inhibitor Drugs 0.000 description 1
- 239000005483 tyrosine kinase inhibitor Substances 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 210000005166 vasculature Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000007704 wet chemistry method Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
本出願は、その全体が参照により本明細書に組み込まれる2018年8月31日出願の米国仮出願第62/726,131号の利益を主張するものである。
本開示の理解をより容易にするために、最初にある特定の用語を以下に定義する。以下の用語および他の用語についての追加的な定義が本明細書を通じて記載されている場合がある。下記の用語の定義が、参照により組み込まれる出願または特許における定義と相反する場合には、本出願に記載の定義を使用して用語の意味を理解すべきである。
図1は、本開示のある実施形態に従った、対象111の試料中の核酸変異体を同定するためのシステム100の例を説明する。システム100は、対象111由来の1つまたは複数の試料101を処理して、変異体を検出するための配列リードを生成することができる。システム100は、実験室システム102、コンピュータシステム110、および/または他の構成要素を含み得る。実験室システム102とコンピュータシステム110は、互いと離れていて、コンピュータネットワークを通じて互いに接続するものであってよいことに留意するべきである(図示していない)。実験室システム102は、試料採取および調製パイプライン103、シーケンシングパイプライン105、配列リードデータストア109、および/または他の構成要素を含み得る。シーケンシングパイプライン105は、1つまたは複数のシーケンシングデバイス107(図1においてシーケンシングデバイス107a…nとして説明されている)を含み得る。
Claims (50)
- 対象由来の核酸分子の試料中の核酸変異体を検出するための方法であって、
コンピュータシステムにより、前記対象由来の前記核酸分子の試料から生成された複数のペアエンドリードにアクセスするステップと、
前記コンピュータシステムにより、オーバーラップ基準に基づいて前記複数のペアエンドリードの中から複数のペアエンドリードの対を同定するステップと、
前記コンピュータシステムにより、オーバーラッピング基準を満たす前記複数のペアエンドリードの対に基づいて複数のマージされたリードを生成するステップであって、マージされたリードが、ペアエンドリードの対のそれぞれの配列に基づく配列を含む、ステップと、
前記コンピュータシステムにより、前記オーバーラップ基準を満たさない前記複数のペアエンドリードの中から複数のマージされないリードを同定するステップであって、所与のマージされないリードが、前記オーバーラップ基準を満たさないペアエンドリードをメイトペアエンドリードと共に含む、ステップと、
前記コンピュータシステムにより、前記複数のマージされたリードおよび前記複数のマージされないリードを参照ゲノムに対してアラインメントさせて、複数のアラインメントしたリードを生成するステップと、
前記コンピュータシステムにより、前記複数のアラインメントしたリードの中から複数の分割リードを同定するステップであって、所与の分割リードが、参照配列の第1の核酸遺伝子座にアラインメントする第1の部分配列部分および参照配列の第2の核酸遺伝子座にアラインメントする第2の部分配列部分を含み、前記第2の核酸遺伝子座が、前記第1の核酸遺伝子座とは異なる、ステップと、
前記コンピュータシステムにより、所与の分割リードについて、前記第1の核酸遺伝子座および前記第2の核酸遺伝子座に対応するゲノム位置の対を含むブレークポイントを決定するステップと、
前記コンピュータシステムにより、前記複数の分割リードのそれぞれのブレークポイントに基づいて前記複数の分割リードをクラスター化して、複数の変異体クラスターを生成するステップと、
前記コンピュータシステムにより、所定の基準に合致する前記複数の変異体クラスターの任意の1つまたは複数を、検出された変異体を指し示すものとして同定するステップと
を含む、方法。 - 前記複数のマージされないリードの所与のマージされないリードが、対応するマージされないリードを有し、前記方法が、
所与のマージされないリードおよび対応するマージされないリードについて、人工ヌクレオチド配列を生成するステップをさらに含む、請求項1に記載の方法。 - 前記人工ヌクレオチド配列を前記マージされないリードの第1の配列および前記対応するマージされないリードの第2の配列および前記対応するマージされないリードの配列に鎖状連結するステップをさらに含む、請求項2に記載の方法。
- 前記人工ヌクレオチド配列が、前記第1の配列と前記第2の配列との間に位置する、請求項3に記載の方法。
- 前記人工ヌクレオチド配列が、少なくとも1ヌクレオチド、少なくとも2ヌクレオチド、少なくとも5ヌクレオチド、少なくとも10ヌクレオチド、少なくとも15ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、または少なくとも100ヌクレオチドの長さである、請求項2に記載の方法。
- ブレークポイントの位置が、前記人工ヌクレオチド配列内に位置するように近づけられている、請求項2に記載の方法。
- 群が、前記人工ヌクレオチド配列内にブレークポイントを有する分割リードおよび前記第1の部分配列部分または前記第2の部分配列部分内にブレークポイントを有する分割リードを含む、請求項6に記載の方法。
- 前記それぞれのブレークポイントが、5ヌクレオチド以下、10ヌクレオチド以下または25ヌクレオチド以下離れている、請求項1に記載の方法。
- 前記所定の基準が、前記複数の変異体クラスターの任意の1つまたは複数の中に1つよりも多くの分割リードを有することを含む、請求項1に記載の方法。
- 前記所定の基準が、前記第1の部分配列または前記第2の部分配列内にブレークポイントが1つ存在する前記複数の変異体クラスターの任意の1つまたは複数内に少なくとも1つの分割リードを有することを含む、請求項1または9に記載の方法。
- 前記試料が、血液、血漿、血清、尿、唾液、粘膜排泄物、痰、便、および涙からなる群より選択される体液試料である、請求項1に記載の方法。
- 前記対象が疾患を有する、請求項1に記載の方法。
- 前記疾患ががんである、請求項12に記載の方法。
- 前記核酸分子がDNAである、請求項1に記載の方法。
- 前記DNAが、無細胞DNAである、請求項14に記載の方法。
- シーケンシング前に前記無細胞DNA分子のコピーを生成するステップをさらに含む、請求項15に記載の方法。
- シーケンシング前に前記核酸分子にバーコードを含む1つまたは複数のアダプターを付着させるステップをさらに含む、請求項1に記載の方法。
- 前記アダプターを前記核酸分子の両末端にランダムに付着させる、請求項17に記載の方法。
- 前記核酸分子に一意的にバーコード付けする、請求項18に記載の方法。
- 前記核酸分子に非一意的にバーコード付けする、請求項18に記載の方法。
- 各バーコードが、選択された領域からシーケンシングされた分子の多様性との組合せで一意的な分子の同定を可能にする固定されたまたはセミランダムなオリゴヌクレオチド配列を含む、請求項18に記載の方法。
- シーケンシング前に複数の核酸遺伝子座について前記核酸分子を選択的に富化するステップをさらに含む、請求項1に記載の方法。
- 実験室システムにより、前記対象の前記試料由来のポリヌクレオチドを増幅するステップをさらに含む、請求項1に記載の方法。
- 前記検出された変異体が挿入、欠失、または核酸再編成を含むことを決定するステップ
をさらに含む、請求項1に記載の方法。 - 前記検出された変異体に基づいて、予測される病態を決定するステップ
をさらに含む、請求項24に記載の方法。 - 対象由来の核酸分子の試料中の核酸変異体を検出するための方法であって、
コンピュータシステムにより、前記対象由来の前記核酸分子の試料から生成された複数のペアエンドリードにアクセスするステップと、
前記コンピュータシステムにより、オーバーラップ基準を満たすペアエンドリードのそれぞれのメイト対に基づいて、複数のマージされたリードを生成するステップと、
前記コンピュータシステムにより、前記複数のペアエンドリードの中から複数のマージされないリードを同定するステップであって、所与のマージされないリードが、オーバーラップ基準を満たさないペアエンドリードをメイトペアエンドリードと共に含む、ステップと、
前記コンピュータシステムにより、前記複数のマージされないリードに基づいて、複数の鎖状連結したマージされないリードを生成するステップと、
前記コンピュータシステムにより、前記複数のマージされたリードおよび前記複数の鎖状連結したマージされないリードを参照ゲノムに対してアラインメントさせて、複数のアラインメントしたリードを生成するステップと、
前記コンピュータシステムにより、前記複数のアラインメントしたリードの中から複数の分割リードを同定するステップであって、前記複数の分割リードの中からの所与の分割リードが、参照配列の第1の核酸遺伝子座にアラインメントする第1の部分配列部分および参照配列の第2の核酸遺伝子座にアラインメントする第2の部分配列部分を含み、前記第2の核酸遺伝子座が前記第1の核酸遺伝子座とは異なる、ステップと、
前記コンピュータシステムにより、前記複数の分割リードに基づいて1つまたは複数の変異体を同定するステップと
を含む、方法。 - 前記複数のマージされたリードを起源とする前記複数の分割リードの中から複数のマージされた分割リードを同定するステップと、
前記複数のマージされた分割リードに基づいて複数の変異体クラスターを生成するステップと、
前記複数の変異体クラスターのうちの所与の1つについてブレークポイントの対を同定するステップであって、所与のブレークポイントの対が、対応する第1の核酸遺伝子座に対応する第1のブレークポイントおよび対応する第2の核酸遺伝子座に対応する第2のブレークポイントを含む、ステップと
をさらに含み、
前記1つまたは複数の変異体が、同定された前記ブレークポイントの対のうちの対応するものに基づいて同定される、請求項26に記載の方法。 - 基準に合致する前記複数の変異体クラスターのうちの1つまたは複数を前記1つまたは複数の変異体として同定するステップ
をさらに含む、請求項27に記載の方法。 - 前記複数のマージされないリードを起源とする前記複数の分割リードの中から複数のマージされない分割リードを同定するステップと、
マージされない分割リードが前記第1の核酸遺伝子座および前記第2の核酸遺伝子座にアラインメントすることを決定するステップであって、前記マージされない分割リードの前記第1の核酸遺伝子座および前記第2の核酸遺伝子座に対する前記アラインメントが前記基準として使用される、ステップ
をさらに含む、請求項28に記載の方法。 - 前記所定の基準が、前記複数の変異体クラスターのうちの1つまたは複数の中に1つよりも多くの分割リードを有することを含む、請求項28に記載の方法。
- 前記所定の基準が、前記第1の部分配列または前記第2の部分配列内にブレークポイントが1つ存在する前記複数の変異体クラスターのうちの1つまたは複数内に少なくとも1つの分割リードを有することを含む、請求項28に記載の方法。
- 前記複数の変異体クラスターを生成するステップが、マージされたリードに隣接する前記複数の鎖状連結したマージされないリードの1つまたは複数にさらに基づく、請求項27に記載の方法。
- 前記複数のマージされないリードを起源とする前記複数の分割リードの中から複数のマージされない分割リードを同定するステップと、
前記複数のマージされない分割リードに基づいて複数の変異体クラスターを生成するステップと、
前記複数の変異体クラスターのうちの所与の1つについてブレークポイントの対を同定するステップであって、所与のブレークポイントの対が、対応する第1の核酸遺伝子座に対応する第1のブレークポイントおよび対応する第2の核酸遺伝子座に対応する第2のブレークポイントを含む、ステップと
をさらに含み、
前記1つまたは複数の変異体が、同定された前記ブレークポイントの対のうちの対応するものに基づいて同定される、請求項26に記載の方法。 - 前記複数の分割リードに基づいて複数の変異体クラスターを生成するステップと、
前記複数の変異体クラスターのうちの所与の1つについてブレークポイントの対を同定するステップであって、所与のブレークポイントの対が、対応する第1の核酸遺伝子座に対応する第1のブレークポイントおよび対応する第2の核酸遺伝子座に対応する第2のブレークポイントを含む、ステップと
をさらに含み、
前記1つまたは複数の変異体が、同定された前記ブレークポイントの対のうちの対応するものに基づいて同定される、請求項26に記載の方法。 - 前記1つまたは複数の変異体が挿入、欠失、または核酸再編成を含むことを決定するステップ
をさらに含む、請求項26に記載の方法。 - 検出された前記1つまたは複数の変異体に基づいて、予測される病態を決定するステップ
をさらに含む、請求項35に記載の方法。 - 対象由来の核酸分子の試料中の核酸変異体を検出するためのシステムであって、
前記対象由来の前記核酸分子の試料から生成された複数のペアエンドリードにアクセスする;
オーバーラップ基準に基づいて前記複数のペアエンドリードの中から複数のペアエンドリードの対を同定する;
オーバーラップしている前記複数のペアエンドリードの対に基づいて複数のマージされたリードを生成し、ここで、マージされたリードは、オーバーラップしているペアエンドリードの対のそれぞれの配列に基づく配列を含む;
前記複数のペアエンドリードの中から複数のマージされないリードを同定し、ここで、所与のマージされないリードはオーバーラップ基準を満たさないペアエンドリードをメイトペアエンドリードと共に含む;
前記複数のマージされたリードおよび前記複数のマージされないリードを参照ゲノムに対してアラインメントさせて、複数のアラインメントしたリードを生成する;
前記複数のアラインメントしたリードの中から複数の分割リードを同定し、ここで、所与の分割リードは、参照配列の第1の核酸遺伝子座にアラインメントする第1の部分配列部分および参照配列の第2の核酸遺伝子座にアラインメントする第2の部分配列部分を含み、前記第2の核酸遺伝子座は、前記第1の核酸遺伝子座とは異なる;
所与の分割リードについて、前記第1の核酸遺伝子座および前記第2の核酸遺伝子座に対応するゲノム位置の対を含むブレークポイントを決定する;
前記複数の分割リードのそれぞれのブレークポイントに基づいて前記複数の分割リードをクラスター化して、複数の変異体クラスターを生成する;かつ
所定の基準に合致する前記複数の変異体クラスターの任意の1つまたは複数を、検出された変異体として同定する
ようにプログラミングされたプロセッサーを含むコンピュータシステム
を含む、システム。 - 前記複数のマージされないリードの所与のマージされないリードが、対応するマージされないリードを有し、前記プロセッサーが、所与のマージされないリードおよび対応するマージされないリードについて、人工ヌクレオチド配列を生成するようにさらにプログラミングされている、請求項37に記載のシステム。
- 前記プロセッサーが、
前記人工ヌクレオチド配列を前記マージされないリードの第1の配列および前記対応するマージされないリードの第2の配列および前記対応するマージされないリードの配列に鎖状連結する
ようにさらにプログラミングされている、請求項38に記載のシステム。 - ブレークポイントの位置が、前記人工ヌクレオチド配列内に位置するように近づけられている、請求項38に記載のシステム。
- 群が、前記人工ヌクレオチド配列内にブレークポイントを有する分割リードおよび前記第1の部分配列部分または前記第2の部分配列部分内にブレークポイントを有する分割リードを含む、請求項40に記載のシステム。
- 前記対象の前記試料由来のポリヌクレオチドを増幅するための実験室システムをさらに含む、請求項37に記載のシステム。
- 前記プロセッサーが、
前記検出された変異体が挿入、欠失、または核酸再編成を含むことを決定する
ようにさらにプログラミングされている、請求項37に記載のシステム。 - 前記プロセッサーが、
前記検出された変異体に基づいて、予測される病態を決定する
ようにさらにプログラミングされている、請求項43に記載のシステム。 - 対象由来の核酸分子の試料中の核酸変異体を検出するためのシステムであって、
前記対象由来の前記核酸分子の試料から生成された複数のペアエンドリードにアクセスする;
オーバーラップ基準を満たすペアエンドリードのそれぞれのメイト対に基づいて、複数のマージされたリードを生成する;
前記複数のペアエンドリードの中から複数のマージされないリードを同定し、ここで、所与のマージされないリードは、オーバーラップ基準を満たさないペアエンドリードを対応するメイトペアエンドリードと共に含む;
前記複数のマージされないリードに基づいて複数の鎖状連結したマージされないリードを生成する;
前記複数のマージされたリードおよび前記複数の鎖状連結したマージされないリードを参照ゲノムに対してアラインメントさせて、複数のアラインメントしたリードを生成する;
前記複数のアラインメントしたリードの中から複数の分割リードを同定し、ここで、前記複数の分割リードの中からの所与の分割リードは、参照配列の第1の核酸遺伝子座にアラインメントする第1の部分配列部分および参照配列の第2の核酸遺伝子座にアラインメントする第2の部分配列部分を含み、前記第2の核酸遺伝子座が前記第1の核酸遺伝子座とは異なる;かつ
前記複数の分割リードに基づいて1つまたは複数の変異体を同定する
ようにプログラミングされたプロセッサーを含むコンピュータシステム
を含む、システム。 - 前記対象の前記試料由来のポリヌクレオチドを増幅するための実験室システムをさらに含む、請求項45に記載のシステム。
- 前記プロセッサーが、
前記1つまたは複数の変異体が挿入、欠失、または核酸再編成を含むことを決定する
ようにさらにプログラミングされている、請求項45に記載のシステム。 - 前記プロセッサーが、
前記1つまたは複数の変異体に基づいて、予測される病態を決定する
ようにさらにプログラミングされている、請求項47に記載のシステム。 - 前記試料中の前記変異体の存在または非存在に関する情報、および/または前記試料中の前記変異体の存在または非存在から導き出された情報を必要に応じて含む報告書を作成することをさらに含む、先行する請求項のいずれか一項に記載の方法またはシステム。
- 前記報告書を前記試料が由来する前記対象または健康管理実施者などの第三者に伝達することをさらに含む、請求項49に記載の方法またはシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862726131P | 2018-08-31 | 2018-08-31 | |
US62/726,131 | 2018-08-31 | ||
PCT/US2019/049382 WO2020047553A1 (en) | 2018-08-31 | 2019-09-03 | Genetic variant detection based on merged and unmerged reads |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021536612A true JP2021536612A (ja) | 2021-12-27 |
JP7535998B2 JP7535998B2 (ja) | 2024-08-19 |
Family
ID=67957453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021510444A Active JP7535998B2 (ja) | 2018-08-31 | 2019-09-03 | マージされたリードおよびマージされないリードに基づいた遺伝的変異体の検出 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200075123A1 (ja) |
EP (1) | EP3844760A1 (ja) |
JP (1) | JP7535998B2 (ja) |
WO (1) | WO2020047553A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4081663A1 (en) * | 2019-12-24 | 2022-11-02 | Invivoscribe, Inc. | A method of nucleic acid sequence analysis |
WO2021202753A1 (en) * | 2020-03-31 | 2021-10-07 | TeselaGen Biotechnology Inc. | Method, apparatus, and computer-readable medium for optimal pooling of nucleic acid samples for next generation sequencing |
KR20230039218A (ko) * | 2021-09-14 | 2023-03-21 | (주)디엑솜 | 차세대 염기서열 분석을 위한 짝지어진 서열조각 병합 표시 방법 |
WO2023250504A1 (en) * | 2022-06-24 | 2023-12-28 | Illumina Software, Inc. | Improving split-read alignment by intelligently identifying and scoring candidate split groups |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014028771A1 (en) * | 2012-08-15 | 2014-02-20 | The Board Of Trustees Of The University Of Illinois | Iterative genome assembler |
US20160246922A1 (en) * | 2015-02-17 | 2016-08-25 | Dovetail Genomics Llc | Nucleic acid sequence assembly |
WO2017062970A1 (en) * | 2015-10-10 | 2017-04-13 | Guardant Health, Inc. | Methods and applications of gene fusion detection in cell-free dna analysis |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6582908B2 (en) | 1990-12-06 | 2003-06-24 | Affymetrix, Inc. | Oligonucleotides |
US20030017081A1 (en) | 1994-02-10 | 2003-01-23 | Affymetrix, Inc. | Method and apparatus for imaging a sample on a device |
US7208271B2 (en) | 2001-11-28 | 2007-04-24 | Applera Corporation | Compositions and methods of selective nucleic acid isolation |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
KR20220061271A (ko) | 2012-09-04 | 2022-05-12 | 가던트 헬쓰, 인크. | 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법 |
US20160040229A1 (en) | 2013-08-16 | 2016-02-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
EP3851539A1 (en) * | 2013-10-07 | 2021-07-21 | Sequenom, Inc. | Methods and processes for non-invasive assessment of chromosome alterations |
WO2015175705A1 (en) * | 2014-05-13 | 2015-11-19 | Board Of Regents, The University Of Texas System | Gene mutations and copy number alterations of egfr, kras and met |
MX2017010142A (es) * | 2015-02-09 | 2017-12-11 | 10X Genomics Inc | Sistemas y metodos para determinar variacion estructural y ajuste de fases con datos de recuperacion de variantes. |
GB2541904B (en) * | 2015-09-02 | 2020-09-02 | Oxford Nanopore Tech Ltd | Method of identifying sequence variants using concatenation |
US11929147B2 (en) * | 2017-09-14 | 2024-03-12 | Roche Sequencing Solutions, Inc. | Direct variant phasing in long reads to detect quasispecies |
-
2019
- 2019-09-03 US US16/559,465 patent/US20200075123A1/en active Pending
- 2019-09-03 WO PCT/US2019/049382 patent/WO2020047553A1/en unknown
- 2019-09-03 JP JP2021510444A patent/JP7535998B2/ja active Active
- 2019-09-03 EP EP19769350.0A patent/EP3844760A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014028771A1 (en) * | 2012-08-15 | 2014-02-20 | The Board Of Trustees Of The University Of Illinois | Iterative genome assembler |
US20160246922A1 (en) * | 2015-02-17 | 2016-08-25 | Dovetail Genomics Llc | Nucleic acid sequence assembly |
WO2017062970A1 (en) * | 2015-10-10 | 2017-04-13 | Guardant Health, Inc. | Methods and applications of gene fusion detection in cell-free dna analysis |
Non-Patent Citations (2)
Title |
---|
CELINE VAN DE PAER ET AL.: "Mitogenomics of Hesperelaea, an extinct genus of Oleaceae", GENE [ONLINE], vol. 594, JPN6023043401, 4 September 2016 (2016-09-04), pages 197 - 202, XP029762094, ISSN: 0005178006, DOI: 10.1016/j.gene.2016.09.007 * |
FREDERICO SCHMITT KREMER ET AL.: "Approaches for in silico finishing of microbial genome sequences", GENETICS AND MOLECULAR BIOLOGY [ONLINE], JPN6023043400, September 2017 (2017-09-01), pages 553 - 562, ISSN: 0005178007 * |
Also Published As
Publication number | Publication date |
---|---|
US20200075123A1 (en) | 2020-03-05 |
EP3844760A1 (en) | 2021-07-07 |
WO2020047553A1 (en) | 2020-03-05 |
JP7535998B2 (ja) | 2024-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11959139B2 (en) | Methods and systems for detecting genetic variants | |
US11193175B2 (en) | Normalizing tumor mutation burden | |
JP7535998B2 (ja) | マージされたリードおよびマージされないリードに基づいた遺伝的変異体の検出 | |
US20230335219A1 (en) | Methods and systems for detecting insertions and deletions | |
US20230360727A1 (en) | Computational modeling of loss of function based on allelic frequency | |
US20240141425A1 (en) | Correcting for deamination-induced sequence errors | |
US20210398610A1 (en) | Significance modeling of clonal-level absence of target variants | |
JP2022512848A (ja) | エピジェネティック区画アッセイを較正するための方法、組成物およびシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231020 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240119 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240419 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240806 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7535998 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |