JP2023554509A - サンプルを臨床関連カテゴリーに分類する方法 - Google Patents
サンプルを臨床関連カテゴリーに分類する方法 Download PDFInfo
- Publication number
- JP2023554509A JP2023554509A JP2023537605A JP2023537605A JP2023554509A JP 2023554509 A JP2023554509 A JP 2023554509A JP 2023537605 A JP2023537605 A JP 2023537605A JP 2023537605 A JP2023537605 A JP 2023537605A JP 2023554509 A JP2023554509 A JP 2023554509A
- Authority
- JP
- Japan
- Prior art keywords
- sample
- score
- cfdna
- sequence
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000523 sample Substances 0.000 claims abstract description 174
- 239000012634 fragment Substances 0.000 claims abstract description 108
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 98
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 86
- 238000000034 method Methods 0.000 claims abstract description 84
- 239000012472 biological sample Substances 0.000 claims abstract description 10
- 108020004414 DNA Proteins 0.000 claims description 63
- 201000011510 cancer Diseases 0.000 claims description 44
- 238000012163 sequencing technique Methods 0.000 claims description 36
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 24
- 210000001519 tissue Anatomy 0.000 claims description 10
- 239000013074 reference sample Substances 0.000 claims description 5
- 206010009944 Colon cancer Diseases 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 4
- 206010006187 Breast cancer Diseases 0.000 claims description 3
- 208000026310 Breast neoplasm Diseases 0.000 claims description 3
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 3
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 3
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 3
- 206010060862 Prostate cancer Diseases 0.000 claims description 3
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 3
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 3
- 208000037842 advanced-stage tumor Diseases 0.000 claims description 3
- 206010017758 gastric cancer Diseases 0.000 claims description 3
- 208000005017 glioblastoma Diseases 0.000 claims description 3
- 201000010536 head and neck cancer Diseases 0.000 claims description 3
- 208000014829 head and neck neoplasm Diseases 0.000 claims description 3
- 201000007270 liver cancer Diseases 0.000 claims description 3
- 208000014018 liver neoplasm Diseases 0.000 claims description 3
- 201000005202 lung cancer Diseases 0.000 claims description 3
- 208000020816 lung neoplasm Diseases 0.000 claims description 3
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 3
- 201000002528 pancreatic cancer Diseases 0.000 claims description 3
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 3
- 201000011549 stomach cancer Diseases 0.000 claims description 3
- 206010027476 Metastases Diseases 0.000 claims description 2
- 201000005787 hematologic cancer Diseases 0.000 claims description 2
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 claims description 2
- 230000009401 metastasis Effects 0.000 claims 1
- 239000002773 nucleotide Substances 0.000 abstract description 16
- 125000003729 nucleotide group Chemical group 0.000 abstract description 15
- 108020004707 nucleic acids Proteins 0.000 description 17
- 102000039446 nucleic acids Human genes 0.000 description 17
- 230000002159 abnormal effect Effects 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 210000004027 cell Anatomy 0.000 description 9
- 238000011528 liquid biopsy Methods 0.000 description 9
- 239000011324 bead Substances 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 230000035945 sensitivity Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000007481 next generation sequencing Methods 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 238000011282 treatment Methods 0.000 description 6
- 239000000107 tumor biomarker Substances 0.000 description 6
- -1 DNA during apoptosis Chemical class 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 108010090804 Streptavidin Proteins 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- 206010036790 Productive cough Diseases 0.000 description 3
- 239000008186 active pharmaceutical agent Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 239000000090 biomarker Substances 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 206010061289 metastatic neoplasm Diseases 0.000 description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 210000003802 sputum Anatomy 0.000 description 3
- 208000024794 sputum Diseases 0.000 description 3
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 3
- 210000002700 urine Anatomy 0.000 description 3
- 108090001008 Avidin Proteins 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 2
- 206010061818 Disease progression Diseases 0.000 description 2
- 206010061819 Disease recurrence Diseases 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 108010047956 Nucleosomes Proteins 0.000 description 2
- 208000007660 Residual Neoplasm Diseases 0.000 description 2
- 241001362551 Samba Species 0.000 description 2
- 102100033254 Tumor suppressor ARF Human genes 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000005750 disease progression Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000001394 metastastic effect Effects 0.000 description 2
- 210000001623 nucleosome Anatomy 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 102000000872 ATM Human genes 0.000 description 1
- 102100035886 Adenine DNA glycosylase Human genes 0.000 description 1
- 208000003200 Adenoma Diseases 0.000 description 1
- 206010001233 Adenoma benign Diseases 0.000 description 1
- 241001504639 Alcedo atthis Species 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 description 1
- 101700002522 BARD1 Proteins 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 102100028048 BRCA1-associated RING domain protein 1 Human genes 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 102000052609 BRCA2 Human genes 0.000 description 1
- 102100025423 Bone morphogenetic protein receptor type-1A Human genes 0.000 description 1
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- ZEOWTGPWHLSLOG-UHFFFAOYSA-N Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F Chemical compound Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F ZEOWTGPWHLSLOG-UHFFFAOYSA-N 0.000 description 1
- 108091007854 Cdh1/Fizzy-related Proteins 0.000 description 1
- 102000038594 Cdh1/Fizzy-related Human genes 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 108010043471 Core Binding Factor Alpha 2 Subunit Proteins 0.000 description 1
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 1
- 102100036252 Cyclin-dependent kinase 4 Human genes 0.000 description 1
- 102100021122 DNA damage-binding protein 2 Human genes 0.000 description 1
- 102100035186 DNA excision repair protein ERCC-1 Human genes 0.000 description 1
- 102100031866 DNA excision repair protein ERCC-5 Human genes 0.000 description 1
- 108010035476 DNA excision repair protein ERCC-5 Proteins 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 102100034157 DNA mismatch repair protein Msh2 Human genes 0.000 description 1
- 102100021147 DNA mismatch repair protein Msh6 Human genes 0.000 description 1
- 102100024829 DNA polymerase delta catalytic subunit Human genes 0.000 description 1
- 102100035481 DNA polymerase eta Human genes 0.000 description 1
- 102100029094 DNA repair endonuclease XPF Human genes 0.000 description 1
- 102100039116 DNA repair protein RAD50 Human genes 0.000 description 1
- 102100034484 DNA repair protein RAD51 homolog 3 Human genes 0.000 description 1
- 102100034483 DNA repair protein RAD51 homolog 4 Human genes 0.000 description 1
- 101100226017 Dictyostelium discoideum repD gene Proteins 0.000 description 1
- 102100031480 Dual specificity mitogen-activated protein kinase kinase 1 Human genes 0.000 description 1
- 108060006698 EGF receptor Proteins 0.000 description 1
- 102000012804 EPCAM Human genes 0.000 description 1
- 101150084967 EPCAM gene Proteins 0.000 description 1
- 101150105460 ERCC2 gene Proteins 0.000 description 1
- 101001003194 Eleusine coracana Alpha-amylase/trypsin inhibitor Proteins 0.000 description 1
- 101710105178 F-box/WD repeat-containing protein 7 Proteins 0.000 description 1
- 102100028138 F-box/WD repeat-containing protein 7 Human genes 0.000 description 1
- 102000009095 Fanconi Anemia Complementation Group A protein Human genes 0.000 description 1
- 108010087740 Fanconi Anemia Complementation Group A protein Proteins 0.000 description 1
- 102000018825 Fanconi Anemia Complementation Group C protein Human genes 0.000 description 1
- 108010027673 Fanconi Anemia Complementation Group C protein Proteins 0.000 description 1
- 102000013601 Fanconi Anemia Complementation Group D2 protein Human genes 0.000 description 1
- 108010026653 Fanconi Anemia Complementation Group D2 protein Proteins 0.000 description 1
- 102000010634 Fanconi Anemia Complementation Group E protein Human genes 0.000 description 1
- 108010077898 Fanconi Anemia Complementation Group E protein Proteins 0.000 description 1
- 102000012216 Fanconi Anemia Complementation Group F protein Human genes 0.000 description 1
- 108010022012 Fanconi Anemia Complementation Group F protein Proteins 0.000 description 1
- 102000007122 Fanconi Anemia Complementation Group G protein Human genes 0.000 description 1
- 108010033305 Fanconi Anemia Complementation Group G protein Proteins 0.000 description 1
- 102000052930 Fanconi Anemia Complementation Group L protein Human genes 0.000 description 1
- 108700026162 Fanconi Anemia Complementation Group L protein Proteins 0.000 description 1
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 description 1
- 102000016627 Fanconi Anemia Complementation Group N protein Human genes 0.000 description 1
- 102100027285 Fanconi anemia group B protein Human genes 0.000 description 1
- 102100034554 Fanconi anemia group I protein Human genes 0.000 description 1
- 102100034553 Fanconi anemia group J protein Human genes 0.000 description 1
- 102100034552 Fanconi anemia group M protein Human genes 0.000 description 1
- 102100023593 Fibroblast growth factor receptor 1 Human genes 0.000 description 1
- 101710182386 Fibroblast growth factor receptor 1 Proteins 0.000 description 1
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 1
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 1
- 108010010285 Forkhead Box Protein L2 Proteins 0.000 description 1
- 102100035137 Forkhead box protein L2 Human genes 0.000 description 1
- 102100030708 GTPase KRas Human genes 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 102100031885 General transcription and DNA repair factor IIH helicase subunit XPB Human genes 0.000 description 1
- 102100035184 General transcription and DNA repair factor IIH helicase subunit XPD Human genes 0.000 description 1
- 102100038367 Gremlin-1 Human genes 0.000 description 1
- 102100025334 Guanine nucleotide-binding protein G(q) subunit alpha Human genes 0.000 description 1
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 1
- 102100036738 Guanine nucleotide-binding protein subunit alpha-11 Human genes 0.000 description 1
- 102100029283 Hepatocyte nuclear factor 3-alpha Human genes 0.000 description 1
- 102100035108 High affinity nerve growth factor receptor Human genes 0.000 description 1
- 102100021088 Homeobox protein Hox-B13 Human genes 0.000 description 1
- 101001000351 Homo sapiens Adenine DNA glycosylase Proteins 0.000 description 1
- 101000785776 Homo sapiens Artemin Proteins 0.000 description 1
- 101000934638 Homo sapiens Bone morphogenetic protein receptor type-1A Proteins 0.000 description 1
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 1
- 101001041466 Homo sapiens DNA damage-binding protein 2 Proteins 0.000 description 1
- 101000876529 Homo sapiens DNA excision repair protein ERCC-1 Proteins 0.000 description 1
- 101001134036 Homo sapiens DNA mismatch repair protein Msh2 Proteins 0.000 description 1
- 101000968658 Homo sapiens DNA mismatch repair protein Msh6 Proteins 0.000 description 1
- 101000909198 Homo sapiens DNA polymerase delta catalytic subunit Proteins 0.000 description 1
- 101001094607 Homo sapiens DNA polymerase eta Proteins 0.000 description 1
- 101000865085 Homo sapiens DNA polymerase theta Proteins 0.000 description 1
- 101000743929 Homo sapiens DNA repair protein RAD50 Proteins 0.000 description 1
- 101001132271 Homo sapiens DNA repair protein RAD51 homolog 3 Proteins 0.000 description 1
- 101001132266 Homo sapiens DNA repair protein RAD51 homolog 4 Proteins 0.000 description 1
- 101001095815 Homo sapiens E3 ubiquitin-protein ligase RING2 Proteins 0.000 description 1
- 101000967216 Homo sapiens Eosinophil cationic protein Proteins 0.000 description 1
- 101100119754 Homo sapiens FANCL gene Proteins 0.000 description 1
- 101000914679 Homo sapiens Fanconi anemia group B protein Proteins 0.000 description 1
- 101000848174 Homo sapiens Fanconi anemia group I protein Proteins 0.000 description 1
- 101000848171 Homo sapiens Fanconi anemia group J protein Proteins 0.000 description 1
- 101000848187 Homo sapiens Fanconi anemia group M protein Proteins 0.000 description 1
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101000920748 Homo sapiens General transcription and DNA repair factor IIH helicase subunit XPB Proteins 0.000 description 1
- 101001032872 Homo sapiens Gremlin-1 Proteins 0.000 description 1
- 101000857888 Homo sapiens Guanine nucleotide-binding protein G(q) subunit alpha Proteins 0.000 description 1
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 1
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 1
- 101001072407 Homo sapiens Guanine nucleotide-binding protein subunit alpha-11 Proteins 0.000 description 1
- 101001062353 Homo sapiens Hepatocyte nuclear factor 3-alpha Proteins 0.000 description 1
- 101000596894 Homo sapiens High affinity nerve growth factor receptor Proteins 0.000 description 1
- 101001041145 Homo sapiens Homeobox protein Hox-B13 Proteins 0.000 description 1
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 1
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 101001057193 Homo sapiens Membrane-associated guanylate kinase, WW and PDZ domain-containing protein 1 Proteins 0.000 description 1
- 101000582631 Homo sapiens Menin Proteins 0.000 description 1
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 1
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 1
- 101000981336 Homo sapiens Nibrin Proteins 0.000 description 1
- 101001109719 Homo sapiens Nucleophosmin Proteins 0.000 description 1
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 1
- 101000595741 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit beta isoform Proteins 0.000 description 1
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 1
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 1
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 description 1
- 101000579425 Homo sapiens Proto-oncogene tyrosine-protein kinase receptor Ret Proteins 0.000 description 1
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 description 1
- 101000712530 Homo sapiens RAF proto-oncogene serine/threonine-protein kinase Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000932478 Homo sapiens Receptor-type tyrosine-protein kinase FLT3 Proteins 0.000 description 1
- 101000771237 Homo sapiens Serine/threonine-protein kinase A-Raf Proteins 0.000 description 1
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 1
- 101000777277 Homo sapiens Serine/threonine-protein kinase Chk2 Proteins 0.000 description 1
- 101000628562 Homo sapiens Serine/threonine-protein kinase STK11 Proteins 0.000 description 1
- 101000642268 Homo sapiens Speckle-type POZ protein Proteins 0.000 description 1
- 101000617830 Homo sapiens Sterol O-acyltransferase 1 Proteins 0.000 description 1
- 101000702606 Homo sapiens Structure-specific endonuclease subunit SLX4 Proteins 0.000 description 1
- 101000951145 Homo sapiens Succinate dehydrogenase [ubiquinone] cytochrome b small subunit, mitochondrial Proteins 0.000 description 1
- 101000685323 Homo sapiens Succinate dehydrogenase [ubiquinone] flavoprotein subunit, mitochondrial Proteins 0.000 description 1
- 101000874160 Homo sapiens Succinate dehydrogenase [ubiquinone] iron-sulfur subunit, mitochondrial Proteins 0.000 description 1
- 101000934888 Homo sapiens Succinate dehydrogenase cytochrome b560 subunit, mitochondrial Proteins 0.000 description 1
- 101000799466 Homo sapiens Thrombopoietin receptor Proteins 0.000 description 1
- 101000819111 Homo sapiens Trans-acting T-cell-specific transcription factor GATA-3 Proteins 0.000 description 1
- 101000702545 Homo sapiens Transcription activator BRG1 Proteins 0.000 description 1
- 101000638154 Homo sapiens Transmembrane protease serine 2 Proteins 0.000 description 1
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 description 1
- 101000740048 Homo sapiens Ubiquitin carboxyl-terminal hydrolase BAP1 Proteins 0.000 description 1
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 1
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 1
- 101000740049 Latilactobacillus curvatus Bioactive peptide 1 Proteins 0.000 description 1
- 108010068342 MAP Kinase Kinase 1 Proteins 0.000 description 1
- 108010075654 MAP Kinase Kinase Kinase 1 Proteins 0.000 description 1
- 102000046961 MRE11 Homologue Human genes 0.000 description 1
- 108700019589 MRE11 Homologue Proteins 0.000 description 1
- 229910015837 MSH2 Inorganic materials 0.000 description 1
- 108700012912 MYCN Proteins 0.000 description 1
- 101150022024 MYCN gene Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102100027240 Membrane-associated guanylate kinase, WW and PDZ domain-containing protein 1 Human genes 0.000 description 1
- 102100030550 Menin Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010074346 Mismatch Repair Endonuclease PMS2 Proteins 0.000 description 1
- 102000008071 Mismatch Repair Endonuclease PMS2 Human genes 0.000 description 1
- 102100033115 Mitogen-activated protein kinase kinase kinase 1 Human genes 0.000 description 1
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 1
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 1
- 101150097381 Mtor gene Proteins 0.000 description 1
- 102000013609 MutL Protein Homolog 1 Human genes 0.000 description 1
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 108700026495 N-Myc Proto-Oncogene Proteins 0.000 description 1
- 102100030124 N-myc proto-oncogene protein Human genes 0.000 description 1
- 102100024403 Nibrin Human genes 0.000 description 1
- 102100022678 Nucleophosmin Human genes 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 1
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 1
- 102100036061 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit beta isoform Human genes 0.000 description 1
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 description 1
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 description 1
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 1
- 102100033479 RAF proto-oncogene serine/threonine-protein kinase Human genes 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 101710100969 Receptor tyrosine-protein kinase erbB-3 Proteins 0.000 description 1
- 102100029986 Receptor tyrosine-protein kinase erbB-3 Human genes 0.000 description 1
- 102100029981 Receptor tyrosine-protein kinase erbB-4 Human genes 0.000 description 1
- 101710100963 Receptor tyrosine-protein kinase erbB-4 Proteins 0.000 description 1
- 102100020718 Receptor-type tyrosine-protein kinase FLT3 Human genes 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 102100029437 Serine/threonine-protein kinase A-Raf Human genes 0.000 description 1
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 1
- 102100031075 Serine/threonine-protein kinase Chk2 Human genes 0.000 description 1
- 102100026715 Serine/threonine-protein kinase STK11 Human genes 0.000 description 1
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 description 1
- 102100036422 Speckle-type POZ protein Human genes 0.000 description 1
- 102100021993 Sterol O-acyltransferase 1 Human genes 0.000 description 1
- 101000697584 Streptomyces lavendulae Streptothricin acetyltransferase Proteins 0.000 description 1
- 102100031003 Structure-specific endonuclease subunit SLX4 Human genes 0.000 description 1
- 102100038014 Succinate dehydrogenase [ubiquinone] cytochrome b small subunit, mitochondrial Human genes 0.000 description 1
- 102100023155 Succinate dehydrogenase [ubiquinone] flavoprotein subunit, mitochondrial Human genes 0.000 description 1
- 102100035726 Succinate dehydrogenase [ubiquinone] iron-sulfur subunit, mitochondrial Human genes 0.000 description 1
- 102100031715 Succinate dehydrogenase assembly factor 2, mitochondrial Human genes 0.000 description 1
- 108050007461 Succinate dehydrogenase assembly factor 2, mitochondrial Proteins 0.000 description 1
- 102100025393 Succinate dehydrogenase cytochrome b560 subunit, mitochondrial Human genes 0.000 description 1
- 101150057140 TACSTD1 gene Proteins 0.000 description 1
- 102100034196 Thrombopoietin receptor Human genes 0.000 description 1
- 102100021386 Trans-acting T-cell-specific transcription factor GATA-3 Human genes 0.000 description 1
- 102100031027 Transcription activator BRG1 Human genes 0.000 description 1
- 102100031989 Transmembrane protease serine 2 Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 description 1
- 108700031763 Xeroderma Pigmentosum Group D Proteins 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- 238000007622 bioinformatic analysis Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 108091092259 cell-free RNA Proteins 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 108091092240 circulating cell-free DNA Proteins 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 210000000416 exudates and transudate Anatomy 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000002489 hematologic effect Effects 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000012977 invasive surgical procedure Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 208000037819 metastatic cancer Diseases 0.000 description 1
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 101150071637 mre11 gene Proteins 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 239000011807 nanoball Substances 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000000771 oncological effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 238000009598 prenatal testing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000092 prognostic biomarker Substances 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000020292 regulation of DNA metabolic process Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 108010073629 xeroderma pigmentosum group F protein Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/10—Design of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/165—Mathematical modelling, e.g. logarithm, ratio
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/50—Determining the risk of developing a disease
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Medical Informatics (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Primary Health Care (AREA)
Abstract
本開示は、臨床関連カテゴリーへの生物学的サンプルの分類のための方法及びキットを提供する。本方法は、無細胞腫瘍DNAを含むものとしてサンプルを分類する方法であって、(i)複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止の配列座標を参照配列へのアライメントによって決定するステップと、(ii)a)(i)で決定された各開始及び/又は停止配列座標に対して内側の、ただしそれに隣接する1~5塩基対の範囲内、及び/又はb)(i)で決定された各開始及び/又は停止配列座標に対して外側の、ただしそれに隣接する1~5塩基対の範囲内において、トリヌクレオチド、テトラヌクレオチド及びペンタヌクレオチドで構成されるすべての核酸モチーフを参照配列中で決定するステップと、(iii)a)サンプルに含まれる複数のcfDNA断片における、(i)で決定された各配列座標+及び/又は-1塩基対、b)サンプルに含まれる複数のcfDNA断片における、(ii)a)及びb)で決定された核酸モチーフの各々の頻度を決定するステップと、(iv)対応する参照頻度に対する、(iii)a)及びb)で決定された頻度の各々の比を計算するステップと、(v)ステップ(iv)で決定された各比について別々に診断スコアを計算するステップであって、前記スコアは、ステップ(iv)のすべてのそれぞれの頻度比のそれぞれの加重和である、ステップと、(vi)(v)で決定された診断スコアの少なくとも2つ以上から組合せ診断スコアを計算するステップであって、前記スコアは、(v)で決定された前記2つ以上の診断スコアの加重和である、ステップと、(vii)組合せ診断スコアと参照スコアとを比較することにより、サンプルの分類を決定するステップとを含み、NIPD GENETICS PUBLIC COMPANY LIMITED CH Kilger Anwaltspartnerschaft mbBCyprus Fasanenstrase 29Our Ref.:B281-0029WO1 10719 Berlin、サンプルは、組合せ診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合、腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される、方法である。
Description
本発明は、生物学、医学及び化学の分野、特に分子生物学の分野、より特に分子診断の分野におけるものである。
真核生物ゲノムは、クロマチン中に組織化され、それにより、DNAのコンパクト化だけでなく、DNA代謝(複製、転写、修復、組換え)のレギュレーションも可能になる。真核生物のクロマチン構造のシグネチャー、特にヌクレオソーム配置は、真核生物に存在する複合混合物中の稀有な核酸断片を同定するために使用可能であることが示されている(Heitzer E.et al.,Nat.Rev.Genet.,2019,20(2):71-88)。
ヌクレオソームによるDNAの保護は、近くのゲノミック位置と比較したとき、特異的サイズ分布の核酸断片の末端が予想よりも高い頻度で発生することが見出される、ゲノム中の領域として定義される非ランダム断片化のホットスポット(HSNRF)の存在に関与するという仮説が立てられている。
癌は、ヒト身体の容易にアクセス可能でない位置に見出されることが多い。癌の診断のための「ゴールドスタンダード」の侵襲的外科的生検は、出血及び感染をはじめとする有意な臨床的リスクを課す。かかる侵襲的手順の欠点には、腫瘍組織から採取されたサンプルが、手順が行われたときからの空間的に限定された表現のみであるという事実が含まれる。しかしながら、癌は、静的状態のままであるわけではなく、連続変化を受けて腫瘍内において且つ原発癌及び転移癌間でジェネティックヘテロジニアス性をもたらす。癌の診断、モニタリング及び療法ガイダンスのための非侵襲的/最小侵襲的方法の開発に多くの労力が払われてきた。母体血漿からの無細胞DNAを用いて数値異常の非侵襲的出生前検査に成功した技術開発も、癌の診断のためにバイオマーカーの発見に使用可能であった。血漿中の循環腫瘍DNAの発見は、癌処置への応答の検出、予後及び予測のために、侵襲的外科的手順に関連するリスクに対処する必要もなく、それをバイオマーカーとして利用して液状生検検査を採用する可能性を提供してきた。この技術は、癌をその早期ステージで検出して回復の成功の可能性を増加させ、最も適切な療法の選択を支援することにより癌患者に利益を与え、且つさらに処置経過後に微小残留疾患の検出を促進して、臨床医が必要な医学的介入を行うことを支援する。合併症のリスクを有する現在の侵襲的検査方法と異なり、液状生検は、血液、尿、痰などのサンプルを使用するため、患者にとって本質的に安全である。
これまで、予後バイオマーカー、療法への応答及び/又は抵抗性並びに疾患の再発のインジケーターとして無細胞腫瘍DNA(cftDNA)を使用するために、血漿中に見出される無細胞DNA(cfDNA)の合計量への腫瘍由来寄与の推定値の提供を試みるごく限られた数の方法が記載されてきたにすぎない(Smith C.G.et al.,Genome Med.,2020,12(1):23、Peiyong Jiang et al.,PNAS,2018,115(46):E10925-E10933、Cristiano S.et al.Nature,2019,570:385-389、Mouliere et al.,Sci.Transl.Med.,2018,10(466):eaat4921、Newman A.et al.,Nat. Med.,2014,20(5):548-554)。
現在の液状生検ベース検査は、複雑であるうえに感度及び特異度が限られるため、精度のよいオンコロジーのニーズを満たすことができない(De Rubis G. et al.,Trends Pharmacol Sci.,2019,40(3):172-186、Peiyong Jiang et al.,Cancer Discov.,2020,CD-19-0622)。そのため、かかる方法の確度は、十分に高くなく、誤解を招く結果を生じさせる可能性がある。
本発明は、循環腫瘍DNA(ctDNA)のシーケンシングから抽出可能な情報の範囲を拡大して新規マルチパラメーター戦略を実現し、臨床関連カテゴリーへのサンプルの分類のためのロバストで感度のよい特異的液状生検アッセイを確立することにより、従来技術の液状生検アプローチが直面する限界への解決策を提供する。
本発明は、他の液状生検アプローチが現在直面する確度限界への解決策を提供する。本発明は、無細胞腫瘍DNA又はctDNAのシーケンシングから抽出可能な情報の範囲を拡大して新規マルチパラメーター戦略を実現し、臨床関連カテゴリーへのサンプルの分類のためのロバストで感度のよい特異的液状生検アッセイを確立することにより、前記確度限界を克服する。
一実施形態では、本発明は、無細胞腫瘍DNAを含むものとしてサンプルを分類する方法に関し、本方法は、
(i)複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止の配列座標を参照配列へのアライメントによって決定するステップと、
(ii)a)(i)で決定された各開始及び/又は停止配列座標に対して内側の、ただしそれに隣接する1~5塩基対の範囲内、及び/又は
b)(i)で決定された各開始及び/又は停止配列座標に対して外側の、ただしそれに隣接する1~5塩基対の範囲内
において、トリヌクレオチド、テトラヌクレオチド及びペンタヌクレオチドで構成されるすべての核酸モチーフを参照配列中で決定するステップと、
(iii)a)サンプルに含まれる複数のcfDNA断片における、(i)で決定された各配列座標+及び/又は-1塩基対、
b)サンプルに含まれる複数のcfDNA断片における、(ii)a)及びb)で決定された核酸モチーフの各々
の頻度を決定するステップと、
(iv)対応する参照頻度に対する、(iii)a)及びb)で決定された頻度の各々の比を計算するステップと、
(v)ステップ(iv)で決定された各比について別々に診断スコアを計算するステップであって、前記スコアは、ステップ(iv)のすべてのそれぞれの頻度比のそれぞれの加重和である、ステップと、
(vi)(v)で決定された診断スコアの少なくとも2つ以上から組合せ診断スコアを計算するステップであって、前記スコアは、(v)で決定された前記2つ以上の診断スコアの加重和である、ステップと、
(vii)組合せ診断スコアと参照スコアとを比較することにより、サンプルの分類を決定するステップと
を含み、サンプルは、組合せ診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合、腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
(i)複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止の配列座標を参照配列へのアライメントによって決定するステップと、
(ii)a)(i)で決定された各開始及び/又は停止配列座標に対して内側の、ただしそれに隣接する1~5塩基対の範囲内、及び/又は
b)(i)で決定された各開始及び/又は停止配列座標に対して外側の、ただしそれに隣接する1~5塩基対の範囲内
において、トリヌクレオチド、テトラヌクレオチド及びペンタヌクレオチドで構成されるすべての核酸モチーフを参照配列中で決定するステップと、
(iii)a)サンプルに含まれる複数のcfDNA断片における、(i)で決定された各配列座標+及び/又は-1塩基対、
b)サンプルに含まれる複数のcfDNA断片における、(ii)a)及びb)で決定された核酸モチーフの各々
の頻度を決定するステップと、
(iv)対応する参照頻度に対する、(iii)a)及びb)で決定された頻度の各々の比を計算するステップと、
(v)ステップ(iv)で決定された各比について別々に診断スコアを計算するステップであって、前記スコアは、ステップ(iv)のすべてのそれぞれの頻度比のそれぞれの加重和である、ステップと、
(vi)(v)で決定された診断スコアの少なくとも2つ以上から組合せ診断スコアを計算するステップであって、前記スコアは、(v)で決定された前記2つ以上の診断スコアの加重和である、ステップと、
(vii)組合せ診断スコアと参照スコアとを比較することにより、サンプルの分類を決定するステップと
を含み、サンプルは、組合せ診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合、腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
一実施形態では、組合せ診断スコアは、上記の方法のステップ(v)で計算された各比について計算された診断スコアのすべてから計算される。
一実施形態では、本発明は、無細胞腫瘍DNAを含むものとしてサンプルを分類する方法に関し、本方法は、
(i)複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止並びに開始及び/又は停止+及び/又は-1塩基対の配列座標を参照配列へのアライメントによって決定するステップと、
(ii)サンプルに含まれる複数のcfDNA断片における、(i)で決定された各座標の頻度を決定するステップと、
(iii)対応する参照頻度に対する、(ii)で決定された各座標の頻度の比を計算するステップと、
(iv)(iii)で決定されたすべての比から診断スコアを計算するステップであって、前記スコアは、(iii)で決定されたすべての頻度比の加重和である、ステップと、
(v)診断スコアと参照スコアとを比較することにより、サンプルの分類を決定するステップと
を含み、サンプルは、診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合、腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
(i)複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止並びに開始及び/又は停止+及び/又は-1塩基対の配列座標を参照配列へのアライメントによって決定するステップと、
(ii)サンプルに含まれる複数のcfDNA断片における、(i)で決定された各座標の頻度を決定するステップと、
(iii)対応する参照頻度に対する、(ii)で決定された各座標の頻度の比を計算するステップと、
(iv)(iii)で決定されたすべての比から診断スコアを計算するステップであって、前記スコアは、(iii)で決定されたすべての頻度比の加重和である、ステップと、
(v)診断スコアと参照スコアとを比較することにより、サンプルの分類を決定するステップと
を含み、サンプルは、診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合、腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
一実施形態では、本発明は、無細胞腫瘍DNAを含むものとしてサンプルを分類する方法に関し、本方法は、
(i)複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止の配列座標を参照配列へのアライメントによって決定するステップと、
(ii)(i)で決定された各開始及び/又は停止配列座標に対して内側の、ただしそれに隣接する1~5塩基対の範囲内において、トリヌクレオチド、テトラヌクレオチド及びペンタヌクレオチドで構成されるすべての核酸モチーフを参照配列中で決定するステップと、
(iii)サンプルに含まれる複数のcfDNA断片における、(ii)で決定された核酸モチーフの各々の頻度を決定するステップと、
(iv)対応する参照頻度に対する、(iii)で決定された頻度の各々の比を計算するステップと、
(v)(iv)で決定されたすべての比から診断スコアを計算するステップであって、前記スコアは、(iv)で決定されたすべての頻度比の加重和である、ステップと、
(vi)診断スコアと参照スコアとを比較することにより、サンプルの分類を決定するステップと
を含み、サンプルは、診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合、腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
(i)複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止の配列座標を参照配列へのアライメントによって決定するステップと、
(ii)(i)で決定された各開始及び/又は停止配列座標に対して内側の、ただしそれに隣接する1~5塩基対の範囲内において、トリヌクレオチド、テトラヌクレオチド及びペンタヌクレオチドで構成されるすべての核酸モチーフを参照配列中で決定するステップと、
(iii)サンプルに含まれる複数のcfDNA断片における、(ii)で決定された核酸モチーフの各々の頻度を決定するステップと、
(iv)対応する参照頻度に対する、(iii)で決定された頻度の各々の比を計算するステップと、
(v)(iv)で決定されたすべての比から診断スコアを計算するステップであって、前記スコアは、(iv)で決定されたすべての頻度比の加重和である、ステップと、
(vi)診断スコアと参照スコアとを比較することにより、サンプルの分類を決定するステップと
を含み、サンプルは、診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合、腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
他の一実施形態では、本発明は、無細胞腫瘍DNAを含むものとしてサンプルを分類する方法に関し、本方法は、
(i)複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止の配列座標を参照配列へのアライメントによって決定するステップと、
(ii)(i)で決定された各開始及び/又は停止配列座標に対して外側の、ただしそれに隣接する1~5塩基対の範囲内において、トリヌクレオチド、テトラヌクレオチド及びペンタヌクレオチドで構成されるすべての核酸モチーフを参照配列中で決定するステップと、
(iii)サンプルに含まれる複数のcfDNA断片における、(ii)で決定された核酸モチーフの各々の頻度を決定するステップと、
(iv)対応する参照頻度に対する、(iii)で決定された頻度の各々の比を計算するステップと、
(v)(iv)で決定されたすべての比から診断スコアを計算するステップであって、前記スコアは、(iv)で決定されたすべての頻度比の加重和である、ステップと、
(vi)診断スコアと参照スコアとを比較することにより、サンプルの分類を決定するステップと
を含み、サンプルは、診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合、腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
(i)複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止の配列座標を参照配列へのアライメントによって決定するステップと、
(ii)(i)で決定された各開始及び/又は停止配列座標に対して外側の、ただしそれに隣接する1~5塩基対の範囲内において、トリヌクレオチド、テトラヌクレオチド及びペンタヌクレオチドで構成されるすべての核酸モチーフを参照配列中で決定するステップと、
(iii)サンプルに含まれる複数のcfDNA断片における、(ii)で決定された核酸モチーフの各々の頻度を決定するステップと、
(iv)対応する参照頻度に対する、(iii)で決定された頻度の各々の比を計算するステップと、
(v)(iv)で決定されたすべての比から診断スコアを計算するステップであって、前記スコアは、(iv)で決定されたすべての頻度比の加重和である、ステップと、
(vi)診断スコアと参照スコアとを比較することにより、サンプルの分類を決定するステップと
を含み、サンプルは、診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合、腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
一実施形態では、各開始及び/又は停止配列座標に対して内側の、ただしそれに隣接する塩基対の範囲は、各開始及び/又は停止座標から2bp~6bp、又は3bp~7bp、又は4bp~8bp、又は5bp~9bp、又は6bp~10bpであり得る。
一実施形態では、分析されるサンプル中に含まれるcfDNA断片の最小量は、10万~50万、50万~100万、100万~200万、200万~500万、又は500万~1000万、又は1000万~2000万、又は2000万~5000万、又は5000万~5億である。
一実施形態では、サンプル中の腫瘍cfDNAの量は、組合せ診断スコアが参照スコアの2~4標準偏差である場合には低として、組合せスコアが参照スコアの4~6.5標準偏差である場合には中として及び組合せスコアが参照スコアの6.5標準偏差超である場合には高として分類され得る。
一実施形態では、参照サンプルは、癌のない患者、又は非再発患者、又は処置が成功した癌患者からのサンプルであり得る。
一実施形態では、複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止の配列座標を参照配列へのアライメントによって決定する、上記の方法のいずれかのステップ(i)は、参照配列へのアライメント前にサンプル中の複数のcfDNA断片の少なくとも一部分の核酸配列を決定することを含む。
一実施形態では、複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止の配列座標を参照配列へのアライメントによって決定する、上記の方法のいずれかのステップ(i)は、cfDNA断片の核酸配列の決定前にcfDNA断片を富化することをさらに含む。
一実施形態では、サンプルは、血液癌、肝癌、肺癌、膵癌、前立腺癌、乳癌、胃癌、膠芽細胞腫、結腸直腸癌、頭頸部癌、固形腫瘍、良性腫瘍、悪性腫瘍、進行ステージ癌、転移又は前癌組織の群から選択される腫瘍を起源とする腫瘍cfDNAを含むものとして分類される。
他の一実施形態では、本発明は、
(i)上記の方法のいずれかを行うための成分であって、
a)生物学的サンプルから無細胞DNAを単離するための1つ以上の成分、
b)シーケンシングライブラリーを調製及び富化するための1つ以上の成分、及び/又は
c)富化されたライブラリーを増幅及び/又はシーケンスするための1つ以上の成分
を含む成分、
(ii)統計解析を実施するためのソフトウェア
を含むキットに関する。
(i)上記の方法のいずれかを行うための成分であって、
a)生物学的サンプルから無細胞DNAを単離するための1つ以上の成分、
b)シーケンシングライブラリーを調製及び富化するための1つ以上の成分、及び/又は
c)富化されたライブラリーを増幅及び/又はシーケンスするための1つ以上の成分
を含む成分、
(ii)統計解析を実施するためのソフトウェア
を含むキットに関する。
癌のない患者からの20の正常サンプル及び進行非小細胞肺癌(NSCLC)又は結腸癌と診断された患者からの27の異常サンプルを解析した。実施例1~4では、未知パラメーターを推定するために、ランダムに選択された10の正常サンプル及びランダムに選択された10の異常サンプルをトレーニングステップで使用した。
本発明は、ctDNAシーケンシングから抽出可能な情報の拡大範囲に基づく新規バイオインフォマティック解析を利用して新規マルチパラメーター戦略を実現し、臨床関連カテゴリーへのサンプルの分類のためのロバストで感度のよい特異的液状生検アッセイを確立する液状生検方法を記述する。
本発明の一実施形態は、無細胞腫瘍DNAを含むものとしてサンプルを分類する方法に関し、前記方法は、サンプルに含まれる複数のcfDNA断片の末端又は「開始及び/又は停止」並びに任意に開始及び/又は停止+及び/又は-1塩基対の配列座標の決定を含む。cfDNA断片の「開始及び/又は停止」は、本明細書では、cfDNA断片の末端、境界又は最外側塩基対若しくはヌクレオチドに関する。cfDNA断片の配列座標の決定は、参照配列へのアライメントにより達成可能であり、参照配列は、生物のDNA配列、好ましくはヒトDNA配列、例えばhg19若しくはhg38ヒトゲノム配列又はヒト対象(一実施形態では健常若しくは癌のないヒト対象であり得る)のゲノム配列であり得る。
本発明の一実施形態では、配列座標の決定は、シーケンシング解析などによる複数のcfDNA断片の核酸配列の解析及び/又は決定を含み得る。一実施形態では、配列座標の決定は、サンプルからの核酸及び/又は具体的にはcfDNA断片の抽出若しくは精製並びに/或いはサンプルからのcfDNA断片の富化及び/又はシーケンシング解析前の単離されたDNA、RNA若しくはcfDNAからのシーケンシングライブラリーの調製をさらに含み得る。
シーケンシングデータの解析は、参照ゲノム配列への得られたcfDNA核酸配列情報のアライメントを含み得る。このアライメントは、参照ゲノム配列への解析されたcfDNA断片の「開始及び/又は停止」又は末端の配列座標のマッピングを可能にする。本発明の好ましい実施形態では、シーケンスされたcfDNA断片の開始及び/又は停止座標に加えて、開始及び/又は停止から+1bp及び1bp位置の配列座標も参照ゲノム配列から決定される。
続いて、サンプル中に含まれる複数のcfDNA断片の各決定された開始及び/又は停止配列座標の頻度を決定可能である。同一cfDNA断片(技術的デュプリケート)に対して又は2つの異なるcfDNA断片(生物学的デュプリケート)に対して検出された座標のすべては、複数のcfDNA断片で検出された各開始及び/又は停止配列座標の頻度(存在量)の計算で考慮される。本発明の好ましい実施形態では、各開始及び/又は停止座標の頻度に加えて、開始及び/又は停止座標から+1bp及び1bpの各配列座標の頻度もサンプル中の複数のcfDNA断片内で決定される。
本発明の一実施形態では、対応する参照頻度に対する各決定された参照ゲノム座標の頻度の比が決定される。好ましい実施形態では、参照頻度に対するサンプル中の座標の頻度のこの比は、開始及び/又は停止+1bp及び1bp配列座標の各頻度に対しても計算される。
続いて、本発明の方法に従ってすべての頻度比から診断スコアが計算され得る。前記診断スコアは、実施例1に記載のように得られるすべての頻度比の加重和として定義され、解析されたサンプルは、診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合には腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
本発明の一実施形態では、サンプルに含まれる複数のcfDNA断片の開始及び/又は停止座標の決定後、各開始及び/又は停止配列座標から内側の、ただしそれに1bp以上隣接する塩基対の特異的範囲内において、例えばトリヌクレオチド(3連続ヌクレオチド)、テトラヌクレオチド(4連続ヌクレオチド)及び/又はペンタヌクレオチド(5連続ヌクレオチド)で構成される参照配列中のすべての核酸モチーフが決定され得る。本発明の一実施形態では、各開始及び/又は停止配列座標から内側の、ただしそれに1bp以上隣接する塩基対の特異的範囲は、1bp~5bp、2bp~6bp、3bp~7bp、4bp~8bp、5bp~9bp又は6bp~10bpであり得る。好ましい実施形態では、サンプル中の複数のcfDNA断片で決定される各開始及び/又は停止配列座標から内側の範囲は、1bp~5bpであり得る。モチーフは、個体間変動性(すなわち単一ヌクレオチド多型)を回避するために参照ゲノム配列から取り出される。
核酸モチーフは、cfDNA断片がアラインされた且つ断片の実際の配列ではない参照配列中の各検出された開始及び/又は停止位置に基づいて決定され得る。
続いて、サンプル中の複数のcfDNA断片の各検出された核酸モチーフの頻度(存在量)が決定され得る。同一cfDNA断片に対して又は2つの異なるcfDNA断片に対して検出されたモチーフのすべては、複数のcfDNA断片で検出された各モチーフの頻度(存在量)の計算で考慮される。この後、複数のcfDNA断片内の核酸モチーフ頻度の各々及び対応する参照頻度の比が計算値される。続いて、本発明の方法に従ってすべての頻度比から診断スコアが計算される。前記診断スコアは、実施例2に記載のすべての頻度比の加重和として定義され、解析されたサンプルは、診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合には腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
本発明の一実施形態では、サンプル中に含まれる複数のcfDNA断片の開始及び/又は停止座標の決定後、各開始及び/又は停止配列座標から内側の、ただしそれに1bp以上隣接する塩基対の特異的範囲内において、例えばトリヌクレオチド(3連続ヌクレオチド)、テトラヌクレオチド(4連続ヌクレオチド)及び/又はペンタヌクレオチド(5連続ヌクレオチド)で構成される参照配列中のすべての核酸モチーフが決定され得る。
本発明の一実施形態では、各開始及び/又は停止配列座標に対して外側の、ただしそれに1bp以上隣接する塩基対の特異的範囲は、1bp~5bp、2bp~6bp、3bp~7bp、4bp~8bp、5bp~9bp又は6bp~10bpであり得る。好ましい実施形態では、サンプル中の複数のcfDNA断片で決定される各開始及び/又は停止配列座標から外側の範囲は、1bp~5bpであり得る。核酸モチーフは、cfDNA断片がアラインされた参照配列中の各検出された開始及び/又は停止位置に基づいて決定され得る。かかる核酸モチーフは、cfDNA断片がアラインされた位置に1bp以上隣接する参照配列の核酸配列のみを含み得る。かかるモチーフは、cfDNA断片の核酸配列を含まず、参照配列中の開始又は停止座標、例えば開始座標の外側から直接始まる、開始及び/又は停止に対して1bp~5bp外側の、ただしそれに隣接する配列を含む。
続いて、サンプル中の複数のcfDNA断片の各検出された核酸モチーフの頻度が決定され得る。同一cfDNA断片に対して又は2つの異なるcfDNA断片に対して検出されたモチーフのすべては、複数のcfDNA断片で検出された各モチーフの頻度(存在量)の計算で考慮される。この後、複数のcfDNA断片内の核酸モチーフ頻度の各々及び対応する参照頻度の比が計算値される。続いて、本発明の方法に従ってすべての頻度比から診断スコアが計算され得る。前記診断スコアは、実施例3に記載のすべての頻度比の加重和として定義され、解析されたサンプルは、診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合には腫瘍cfDNAを含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
本発明の一実施形態では、参照頻度と比較した、(a)開始及び/又は停止配列座標(任意に-1bp及び/又は+1bp)の頻度、(b)cfDNA断片の開始及び/又は停止座標に対して内側に、ただしそれに1bp以上隣接して位置するすべての核酸モチーフの頻度、並びに(c)cfDNA配列を含むことなくcfDNA断片開始及び/又は停止座標に対して外側に、ただしそれに1bp以上隣接して位置するすべての核酸モチーフの頻度の比からスコアを計算するこれ以前に記載の方法ステップは、すべて並行して又は特異的順序で行われ得、続いて、実施例4に記載のように、本発明の方法に従って組合せ診断スコア値を計算するために、ステップ(a)、(b)及び(c)の2つ又はすべての診断スコア値が使用され得る。この組合せ診断スコア値によれば、解析されたサンプルは、組合せ診断スコア値が参照スコアの平均よりも参照スコアの少なくとも1標準偏差だけ高い場合、腫瘍cfDNA又は循環腫瘍DNA(ctDNA)を含むものとして分類され、参照スコアは、1つ以上の参照値から計算される。
一実施形態では、各異常サンプルで得られた組合せ診断スコア値と参照スコアとを比較することにより、サンプル中の腫瘍cfDNA又はctDNAの量は、(a)組合せ診断スコアが参照スコアの2~4標準偏差である場合には低として、(b)組合せスコアが参照スコアの4~6.5標準偏差である場合には中として、及び(c)組合せスコアが参照スコアの6.5標準偏差超である場合には高として分類され得る(表1)。
無細胞核酸
本明細書では、好ましくは、核酸断片の混合物は、真核生物、好ましくは霊長動物、より好ましくはヒトから採取されたサンプルから単離される。サンプルは、異なる組織型からの細胞又は核酸を含み得る。このため、サンプルは、内因的に核酸断片の混合物を含み得る。
本明細書では、好ましくは、核酸断片の混合物は、真核生物、好ましくは霊長動物、より好ましくはヒトから採取されたサンプルから単離される。サンプルは、異なる組織型からの細胞又は核酸を含み得る。このため、サンプルは、内因的に核酸断片の混合物を含み得る。
本明細書では、「核酸」又は「核酸配列」は、限定されるものではないが、DNA、RNA、ゲノミックDNA、無細胞DNA及び/又はRNA並びにtRNA、メッセンジャーRNA(mRNA)、合成DNA又はRNAと互換的に用いられ得る。
本発明との関連では、「核酸断片」及び「断片化核酸」という用語は、互換的に用いることが可能である。本発明に係る方法の好ましい実施形態では、核酸断片は、循環無細胞DNA又はRNAである。
本発明の一実施形態では、サンプル中に含まれる最小100,000cfDNA断片が分析され得る。他の一実施形態では、解析されるサンプル中に含まれるcfDNA断片の数は、10万~50万、50万~100万、100万~200万、200万~500万、500万~1000万、1000万~2000万、2000万~5000万又は5000万~5億の範囲内であり得る。
本発明の一実施形態では、「サンプル」は、無細胞DNA(cfDNA)、無細胞腫瘍DNA(cftDNA)、循環腫瘍DNA(ctDNA)又は循環cftDNAを含む血液サンプル、血清サンプル、血漿サンプル、液状生検サンプル又はDNAサンプル(例えば、核酸断片の混合物)である。本発明との関連では、「cfDNA」、「cftDNA」、「ctDNA」又は「循環cftDNA」という用語は、互換的に用いられ得る。
一実施形態では、サンプルは、瘍を有するか又は有する疑いのある対象からの血漿サンプル、血液サンプル、尿サンプル、痰サンプル、脳脊髄液サンプル、腹水サンプル及び腫胸膜液サンプルからなる群から選択される。一実施形態では、サンプル又はDNAサンプルは、腫瘍又は一群の悪性細胞を有するか又は有する疑いのある対象からの組織サンプルに由来する。
本発明との関連では、「腫瘍」、「癌」又は「異常」という用語は、互換的に用いられ得る。本明細書では、「癌」又は「腫瘍」という用語は、早期ステージ癌又は進行癌、転移又は前癌の組織又は細胞も含み得る。本明細書では、腫瘍サンプル又は異常サンプルは、原発腫瘍又は転移腫瘍を起源とする(無細胞)DNA又はRNAを含むサンプルに関し得る。正常サンプル又は参照サンプルは、本明細書では、非癌性、健常又は「正常」組織又は細胞を起源とする(無細胞)DNA又はRNAのみを含むサンプルに関し得る。本発明との関連では、「正常」、「コントロール」又は「参照」という用語は、互換的に用いられ得る。
本発明の方法は、様々な生物学的サンプルで使用可能である。本質的には、ジェネティック材料、例えばRNA又はDNA、特に無細胞DNA(cfDNA)又は無細胞RNAを含有するいずれの生物学的サンプルも、それらに含まれるRNA又はDNAのジェネティック解析を可能にする本方法でサンプルとして使用可能である。例えば、一実施形態では、DNAサンプルは、無細胞DNA(cfDNA)を含有する血漿サンプル又は血液サンプルである。
そのうえ他の一実施形態では、サンプルは、腫瘍又は癌を有するか又は有する疑いのある被験体から得られる生物学的サンプルである。一実施形態では、サンプルは、循環無細胞腫瘍DNA(cftDNA)を含む。他の一実施形態では、サンプルは、対象の尿、痰、腹水、脳脊髄液又は胸膜滲出液である。他の一実施形態では、腫瘍学的サンプルは、対象末梢血から調製される対象血漿サンプルである。そのため、サンプルは、対象の血液サンプルから非侵襲的に得られる液状生検サンプルであり得るため、検出可能若しくは触知可能腫瘍の発生前に癌の早期検出を潜在的に可能にするか、又は疾患進行、疾患処置若しくは疾患再発のモニタリングを可能にする。
本明細書では、無細胞DNA(cfDNA)は、細胞内に含有されないDNAを意味する。サンプルは、正常若しくは健常細胞からの及び/又は癌細胞からのcfDNAを含み得る。無細胞DNAは、分泌、アポトーシス又は壊死を介して血液又は血清中に放出され得る。cfDNAが腫瘍又は癌細胞から放出された場合、それは無細胞腫瘍DNA(cftDNA)と呼ばれ得る。
本発明との関連では、「対象」という用語は、動物、好ましくは哺乳動物、より好ましくはヒト又はヒト患者を意味する。本明細書で用いられる場合、「対象」という用語は、腫瘍に罹患しているか又はそれを有する疑いのある対象を意味し得る。
「腫瘍」は、本明細書では、限定されるものではないが、固形腫瘍、腺腫、血液癌、肝癌、肺癌、膵癌、前立腺癌、乳癌、胃癌、膠芽細胞腫、結腸直腸癌、頭頸部癌、進行ステージ癌腫瘍、良性又は悪性腫瘍、転移又は前癌組織を含めて、癌全般を意味する。
本明細書では、cfDNA断片の「末端」は、核酸断片の3’及び5’末端の最外側ヌクレオチドを定義し、本明細書では、cfDNA断片の「開始及び/又は停止(位置)」又は「切断点」又は「境界」ともいわれ得る。参照配列にアラインされたとき、cfDNA断片の「(開始及び/又は停止)座標」又は「配列座標」は、参照配列中でcfDNA断片の末端がアラインされた最外側核酸配列位置により定義される。例えば、cfDNA断片が配列位置1500bp~1700bpにわたる参照核酸配列に相補的であるか又はそれにアラインされた場合、配列座標は、cfDNA断片の200bpの長さを定義する1500及び1700bpになるであろう。
166bpメジャーピーク及び10bpインターバルを有するより小さいピークを呈するcfDNAのサイズプロファイルは、cfDNAの生物学的性状がヌクレオソーマル組織化に関連する可能性があることが示唆された。類似のパターンは、癌患者の血漿DNA中でも観測された。起源の組織に関連するcfDNAの非ランダム断片化パターンは、患者の健康状態にも関連する可能性がある。そのため、無細胞DNA断片の末端又は開始及び/又は停止の座標及び頻度は、疾患進行の指標となる。それらは、腫瘍の起源及び疾患の範囲ひいては所与の療法へのその応答を反映する腫瘍塊によって異なる。
本明細書で用いられる場合、開始及び/又は停止」座標から「内側」という用語は、配列又はモチーフが延在する参照配列中の核酸断片の「開始及び/又は停止」座標からの方向を意味する。「内側」は、核酸断片配列又はそれがアラインされた参照配列に含まれる核酸配列又はモチーフに関し得る。「内側」は、核酸断片の開始座標から+1、+2、+3、+4、+5などの塩基対及び/又は停止座標から-1、-2、-3、-4、-5塩基対を意味し得る。一実施形態では、各開始及び/又は停止配列座標に対して内側の、ただしそれに隣接する塩基対の範囲は、各開始及び/又は停止座標から1bp~5bp、2bp~6bp、又は3bp~7bp、又は4bp~8bp、又は5bp~9bp、又は6bp~10bpであり得る。
本明細書で用いられる場合、開始及び/又は停止」座標から「外側」という用語は、配列が延在する参照配列中の核酸断片の「開始及び/又は停止」座標からの方向を意味する。「外側」は、核酸断片配列又はそれがアラインされた参照配列に含まれる核酸配列又はモチーフに関し得る。「外側」は、核酸断片の停止座標から+1、+2、+3、+4、+5などの塩基対及び/又は開始座標から-1、-2、-3、-4、-5塩基対を意味し得る。一実施形態では、各開始及び/又は停止配列座標に対して外側の、ただしそれに隣接する塩基対の範囲は、各開始及び/又は停止座標から1bp~5bp、2bp~6bp、又は3bp~7bp、又は4bp~8bp、又は5bp~9bp、又は6bp~10bpであり得る。
断片の観測末端部位が必ずしも真の切断/消化部位とは限らない可能性があるため、本方法は、開始及び/又は停止座標±1bpの頻度及び/又は配列モチーフを解析する(Peiyong Jiang et al.,Genome Res.,2020,doi:10.1101/gr.261396.120)。そのため、近くのゲノミック塩基が真の消化部位である尤度を考慮に入れて、本発明は、臨床関連カテゴリーへの生物学的サンプルの分類で従来技術よりも優れた確度の改善をもたらす。
本明細書では、「核酸モチーフ」、「配列モチーフ」又は「モチーフ」は、2、3、4、5、6、7、8、9、10、20、30、40、50、100などの連続ヌクレオチドで構成される核酸配列中の連続ヌクレオチドのアレイを意味する。連続ヌクレオチドのこのアレイは、「トリヌクレオチド」、「テトラヌクレオチド」、「ペンタヌクレオチド」、「ヘキサヌクレオチド」などとも呼ばれ得る。前記モチーフは、無細胞及び/又は循環DNA分子が発生されて血漿中に放出されるとき、特異的ヌクレアーゼなどにより優先的に切断されるヒトゲノミック位置のサブセットである。アポトーシス時にDNAなどの核酸を切断するヌクレアーゼから生じるかかる血漿DNA末端モチーフは、HSNRFを含み得るか又はそれに特異的である識別可能シグネチャーを提示する。好ましい実施形態では、「モチーフ」は、参照ゲノム配列からの3、4又は5連続ヌクレオチドのアレイを意味する。
一実施形態では、核酸モチーフは、cfDNA断片の末端又は切断点に位置し得、モチーフは、cfDNA断片の核酸配列内に含まれ得るか、又はcfDNA断片配列の境界外に且つ参照核酸配列内に(例えば、cfDNA断片がアラインされた位置に隣接して)位置し得る。
cfDNAの解析
本明細書では、「参照配列」は、いずれかの核酸配列、ゲノミック配列、生物若しくは対象のゲノミック配列、好ましくはヒトゲノム(例えば、hg19若しくはhg38)の又は健常個体若しくは対象の配列であり得る。
本明細書では、「参照配列」は、いずれかの核酸配列、ゲノミック配列、生物若しくは対象のゲノミック配列、好ましくはヒトゲノム(例えば、hg19若しくはhg38)の又は健常個体若しくは対象の配列であり得る。
本明細書では、開始及び/又は停止配列座標の頻度に対する「参照頻度」は、1つ以上の参照ゲノム、参照配列又は1つ以上の健常若しくは「正常」コントロールサンプル、対象若しくは患者の1つ以上のゲノム若しくは配列中の対応する開始及び/又は停止配列座標の頻度であり得る。本明細書では、核酸モチーフに対する「参照頻度」は、1つ以上の参照ゲノム、参照配列又は1つ以上の健常若しくは「正常」コントロールサンプル、対象若しくは患者の1つ以上のゲノム若しくは配列中の対応する核酸モチーフの頻度であり得る。
本明細書では、「頻度」は、存在量及び発生率と互換的に用いられ得る。本発明の一実施形態では、「頻度」は、例えば、サンプルに含まれる複数の核酸又はcfDNA断片で検出又は計数された核酸配列モチーフ、核酸(cfDNA)断片又は開始及び/若しくは停止配列座標の存在量及び発生率又は数を記述する。
本明細書では、「比」は、例えば、サンプル中の複数の核酸断片で検出された核酸配列モチーフの頻度の、参照サンプル中の同一核酸配列モチーフの頻度に対する、数学的関係又は割合を意味し得る。本明細書では、比は、各座標又はモチーフの頻度を対応する座標又はモチーフの対応する参照頻度で除算することにより計算され得る。
サンプル調製のために、DNA及び/又はRNAなどの核酸は、当技術分野で公知の標準的技術(その非限定的例は、QIAsymphony(QIAGEN)プロトコル、QIAamp Circulating Nucleic Acid(QIAGEN)、KingFisher(Thermofisher)プロトコル、MagMAX(商標)Cell-Free DNA(Thermofisher)又は無細胞DNA単離に好適ないずれかの他の手動若しくは自動抽出法である)を用いてサンプルから抽出される。
単離後、サンプルの無細胞DNAは、次世代シーケンシング(NGS)などの下流シーケンシング技術にサンプルが適合可能になるようにシーケンシングライブラリー調製に使用され得る。典型的には、これは、無細胞DNA断片の末端へのアダプターのライゲーションを含む。シーケンシングライブラリー調製キットは、市販されているか又は開発可能である。
cfDNAの標的富化は、ヒトゲノム上の対象領域に結合する標的キャプチャー配列(TACS)を用いて実施され、プール内の各配列は、125~260塩基対の長さ、及び/又は125~300bpの長さ、及び/又は125~350bpの長さであり、各配列は、5’末端及び3’末端を有し、プール内の各配列は、コピー数変動、セグメンタルデュプリケーション又は繰返しDNAエレメントを保有する領域からを少なくとも10塩基対離れた対象領域に5’末端及び3’末端の両方で結合し、TACSのGC含有率、20%~50%、及び/又は20%~60%、及び/又は20%~70%、及び/又は20%~80%である。
本明細書では、「標的キャプチャー配列」又は「TACS」という用語は、対象ゲノミック配列上の対象領域に相補的なDNA配列を意味し、これは、生物学的サンプルから調製される全ゲノミックシーケンシングライブラリーなどの大きい配列ライブラリーから対象領域をキャプチャーし富化する「ベイト」として使用される。本発明との関連では、「標的キャプチャー配列」又は「TACS」又は「プローブ」という用語は、互換的に用いられ得る。
他の一実施形態では、TACSのプールは、限定されるものではないが、AKT1、ALK、APC、AR、ARAF、ATM、BAP1、BARD1、BMPR1A、BRAF、BRCA1、BRCA2、BRIP1、CDH1、CDK4、CDKN2A(pl4ARF)、CDKN2A(pl6INK4a)、CHEK2、CTNNB1、DDB2、DDR2、DICERl、eGFR、EPCAM、ERBB2、ERBB3、ERBB4、ERCC1、ERCC2、ERCC3、ERCC4、ERCC5、ESR1、FANCA、FANCB、FANCC、FANCD2、FANCE、FANCF、FANCG、FANCI、FANCL、FANCM、FBXW7、FGFR1、FGFR2、FLT3、FOXA1、FOXL2、GATA3、GNA11、GNAQ、GNAS、GREM1、HOXB13、IDH1、IDH2、JAK2、KEAP1、KIT、KRAS、MAP2K1、MAP3K1、MEN1、MET、MLH1、MPL、MRE11A、MSH2、MSH6、MTOR、MUTYH、MYC、MYCN、NBN、NPM1、NRAS、NTRK1、PALB2、PDGFRA、PIK3CA、PIK3CB、PMS2、POLD1、POLE、POLH、PTEN、RAD50、RAD51C、RAD51D、RAF1、RBI、RET、ROS1、RUNX1、SDHA、SDHAF2、SDHB、SDHC、SDHD、SLX4、SMAD4、SMARCA4、SPOP、STAT、STK11、TMPRSS2、TP53、VHL、XPA、XPC及びそれらの組合せ
を含む群から選択される複数の対象腫瘍バイオマーカー配列に結合する。一実施形態では、TACSのプールは、EGFR_6240、KRAS_521、EGFR_6225、NRAS_578、NRAS_580、PIK3CA_763、EGFR_13553、EGFR_18430、BRAF_476、KIT_1314、NRAS_584、EGFR_12378及びそれらの組合せを含む群から選択される複数の対象腫瘍バイオマーカー配列に結合する。
を含む群から選択される複数の対象腫瘍バイオマーカー配列に結合する。一実施形態では、TACSのプールは、EGFR_6240、KRAS_521、EGFR_6225、NRAS_578、NRAS_580、PIK3CA_763、EGFR_13553、EGFR_18430、BRAF_476、KIT_1314、NRAS_584、EGFR_12378及びそれらの組合せを含む群から選択される複数の対象腫瘍バイオマーカー配列に結合する。
他の一実施形態では、TACSのプールは、限定されるものではないが、COSM6240(EGFR_6240)、COSM521(KRAS_521)、COSM6225(EGFR_6225)、COSM578(NRAS_578)、COSM580(NRAS_580)、COSM763(PIK3CA_763)、COSM13553(EGFR_13553)、COSM18430(EGFR_18430)、COSM476(BRAF_476)、COSM1314(KIT_1314)、COSM584(NRAS_584)、COSM12378(EGFR_12378)並びにそれらの組合せを含む群から選択される複数の対象腫瘍バイオマーカー配列に結合する。ここで、識別子は、バイオマーカーのCOSMICデータベースID番号を意味する。一般的には、プローブハイブリダイゼーション又は富化ステップは、シーケンシングライブラリーを作成する前又はライブラリーを作成した後に行うことが可能である。
本発明の一実施形態では、シーケンシングライブラリーは、非ランダム断片化のホットスポット(HSNRF)などをカバーする1つ以上のプローブへのライブラリーのハイブリダイゼーションにより対象配列領域に関して富化され得る。かかるHSNFR領域は、cfDNA混合物中に存在する異なる組織起源型(例えば、癌及び正常)の同定を促進する数多くの核酸配列バリエーションを短距離内に含む確率が高い領域である。
HSNRFが位置する対象染色体上の対象領域は、HSNRFキャプチャープローブのプールをシーケンシングライブラリーにハイブリダイズすることにより、続いてプローブに結合するシーケンシングライブラリー内の配列の単離により、富化される。一実施形態では、プローブは、断片化細胞を含まない核酸の5’末端のみがプローブによりキャプチャーされるようにHSNRF部位をまたぐ。他の一実施形態では、プローブは、HSNRFから生じる、断片化細胞を含まない核酸の3’末端のみがプローブに結合可能であるようにHSNRF部位をまたぐ。他の好ましい一実施形態では、プローブは、所与のHSNRF部位に関連する無細胞核酸の5’及び3’末端の両方がプローブによりキャプチャーされるように、断片化核酸に関連する両方のHSNRF部位をまたぐ。
所望の富化配列(HSNRF)の単離を促進するために、典型的には、プローブ配列は、プローブにハイブリダイズする配列をプローブにハイブリダイズしない配列から分離できるように修飾される。典型的には、これは、プローブを担体に固定することにより達成される。これは、プローブに結合しない配列からのプローブに結合する配列の物理的分離を可能にする。例えば、プローブのプール内の各配列をビオチンで標識可能であり、次いで、ストレプトアビジンやアビジンなどのビオチン結合性物質で被覆されたビーズにプールを結合可能である。好ましい実施形態では、プローブをビオチンで標識してストレプトアビジン被覆磁気ビーズに結合すれば、ビーズの磁気的性質を活用することにより分離が可能になる。しかしながら、他の親和性結合システムが当技術分野で公知であり、ビオチン-ストレプトアビジン/アビジンの代わりに使用可能であることは、当業者であれば分かるであろう。例えば、プローブを抗原で標識し、次いで抗体被覆ビーズに結合する抗体ベースシステムを使用可能である。そのうえ、プローブは、一方の末端に配列タグを組込み可能であり、配列タグにハイブリダイズする担体上の相補的配列を介して担体に結合可能である。さらに、磁気ビーズに加えて、他のタイプの担体、例えばポリマービーズ、ガラスなどを使用可能である。
特定の実施形態では、プローブのプールに結合するシーケンシングライブラリーのメンバーは、プローブに十分に相補的である。他の実施形態では、プローブのプールに結合するシーケンシングライブラリーのメンバーは、プローブに部分的に相補的である。例えば、特定の状況では、必ずしも対象ゲノム領域に属するとは限らないが富化プロセスの生成物であり、而もシーケンスしたときにゲノム全体を通して非プローブ座標にわたり非常に低いカバレッジを生じ得る、DNA断片(すなわち、かかるDNA断片は、部分的相同性が原因でプローブに結合可能である)からのデータを利用し解析することが望ましいこともある。
プローブを用いた対象配列の富化によりHSNRF部位を有するDNAの富化ライブラリーを形成した後、富化HSNRFライブラリーのメンバーは溶出され、当技術分野で公知の標準的方法を用いて増幅されシーケンスされる。他の一実施形態では、プローブは、ストレプトアビジン被覆磁気ビーズと共に提供されるビオチン化プローブのように担体と共に提供される。
腫瘍バイオマーカーの検出のために、プローブは、本明細書に記載の設計基準並びに腫瘍バイオマーカー遺伝子の既知の配列及び癌に関連するそれに含まれるジェネティック変異に基づいて設計される。一実施形態では、本方法に使用される複数のプローブは、複数の対象腫瘍バイオマーカー配列に結合する。この際、プローブは、変異部位に隣接する非ランダム断片化のホットスポットに位置し得る。
本明細書では、核酸配列解析に次世代シーケンシング(NGS)を使用し得るが、配列情報に加えて非常に正確な計数を提供する他のシーケンシング技術も採用可能である。そのため、限定されるものではないが、ディジタルPCR、単一分子シーケンシング、ナノポアシーケンシング、DNAナノボールシーケンシング、ライゲーションシーケンシング、イオン半導体シーケンシング、合成シーケンシング、マイクロアレイなどの他の正確な計数方法もNGSの代わりに使用可能である。
一実施形態では、本発明は、検出されるか又はその起源が決定される核酸断片が同一ジェネティック座位からの、ただし異なる起源の核酸断片よりも低い濃度で混合物中に存在する場合の方法に関する。
本方法は、かかる低濃度の標的cfDNAを解析するのにとくに適している。本発明に係る方法では、検出されるか又はその起源が決定される核酸断片及び同一ジェネティック座位からの、ただし異なる起源の核酸断片は、1:2、1:4、1:10、1:20、1:50、1:100、1:200、1:500、1:1000、1:2000及び1:5000の群から選択される比で混合物中に存在する。比は、±30%、20%又は10%を意味するおおよその比として理解されるべきである。かかる比が厳密に以上で引用された数値で生じないことは、当業者の知るところである。比は、豊富なタイプの座位特異的分子の数に対する稀有なタイプの座位特異的分子の数を意味する。
データ解析
富化ライブラリーのシーケンシングから得られる情報は、革新的な生物数学的/生物統計学的データ解析パイプラインを用いて解析される。本方法は、参照ゲノム配列を用いて且つ真の消化部位を表さないおそれがあるため、観測されたcfDNA末端部位を除いて、末端座標に1bp以上隣接するすべての可能なモチーフの組合せを含むcfDNA断片の特徴を利用する。さらに、位置及びモチーフを含めてcfDNAの異なる特徴の解析を組み合わせることにより、本発明は、確度の改善、すなわち同一特異度レベルで感度の増加という予想外の技術的効果を達成した。
富化ライブラリーのシーケンシングから得られる情報は、革新的な生物数学的/生物統計学的データ解析パイプラインを用いて解析される。本方法は、参照ゲノム配列を用いて且つ真の消化部位を表さないおそれがあるため、観測されたcfDNA末端部位を除いて、末端座標に1bp以上隣接するすべての可能なモチーフの組合せを含むcfDNA断片の特徴を利用する。さらに、位置及びモチーフを含めてcfDNAの異なる特徴の解析を組み合わせることにより、本発明は、確度の改善、すなわち同一特異度レベルで感度の増加という予想外の技術的効果を達成した。
本発明の好ましい実施形態によれば、標的ペアエンド次世代シーケンシングが実施される。すべてのサンプルに対するマルチプレックスデータは、Illumina bcltofastqツールを用いてデマルチプレックスされる。前記サンプルのシーケンシングデータは、cutadaptソフトウェアを用いてアダプター配列及び品質不良リード(Qスコア<25)を除去するために処理される(Martin,M.et al.2011 EMB.netJournal 17.1)。
少なくとも25塩基長の処理リードは、Burrows-Wheelアライメントアルゴリズム(Li,H.and Durbin,R.(2009)Bioinformatics 25:1754-1760)を用いて、ヒト参照ゲノムビルドGRCh37(hg19)(UCSC Genome Bioinformatics)にアラインされた。閾値超のインサートサイズを有するペアリードは、除去された。前記閾値は、100~600の範囲である。該当する場合、アライメント後、デュプリケートリードを同定し、ユニーク分子識別子(UMI)ファミリーによりグループ化し、UMIファミリーごとのコンセンサスリードの生成に使用する。
適用可能であれば、同一サンプルに関する、ただし別々のシーケンシングレーン上で処理されたシーケンシングアウトプットは、単一シーケンシングアウトプットファイルにマージされた。デュプリケート及びマージング手順の利用は、fgbio、picardツールソフトウェアスイート(Broad Institute)及びSambambaツールソフトウェアスイート(Sambamba reference,Tarasov,Artem,et al.Sambamba:fast processing of NGS alignment formats.Bioinformatics 31.12(2015):2032-2034)を用いて実施された。マッピング位置(最外側及び近接座標)、対象座位の塩基ごとのリードデプス及び断片サイズに関する情報は、SAMtoolsソフトウェアスイートのmpileupオプション(これ以降では、mpileupファイルといわれる)を用いて得られ、Python及びRプログラミング言語(Python Software Foundation(2015)Python、The R Foundation(2015)The R Project for Statistical Computing)で記述されたカスタムビルドアプリケーションプログラミングインターフェース(API)を用いて処理された。
断片の末端座標は、断片がまたぐ参照ゲノムの最外側座標として定義される。すなわち、各アライン断片は、2つの末端座標(参照ゲノムを基準にした開始/最左側位置(5’末端)及び停止/最右側位置(3’末端)の座標)を有する。
本発明の各種実施形態では、標的パネルは、最小500標的ゲノミック塩基からなっていた。サンプル当たり必要とされる断片の最小数は、100,000である。
本明細書では、「診断スコア値」は、「実施例セクション」の実施例1、2及び3に記載のすべての頻度比の加重和として計算される。
本明細書では、「組合せ診断スコア値」は、実施例4に記載のように、本発明に記載のすべてのステップからの少なくとも2つ以上の頻度比の加重和として計算される。
本発明の一実施形態では、「参照スコア」は、1つ以上の「参照値」から計算され得る。
一実施形態では、参照値又は参照スコアは、1つ以上の正常又は参照サンプルから取得されたデータから計算され得る。一実施形態では、参照値又は参照スコア及びそれが比較される解析サンプルの値(例えば、核酸モチーフの頻度、開始及び/又は停止座標の頻度)又は解析サンプルの診断スコアは、本明細書に開示されるように、同一計算方法に従って計算される。
サンプル分類
本明細書では、サンプルの分類は、バイナリー分類(すなわち癌、癌なし、予後良好、予後劣悪/不良、再発、非再発)並びに低、中及び高へのcftDNA量の分類を含む。
本明細書では、サンプルの分類は、バイナリー分類(すなわち癌、癌なし、予後良好、予後劣悪/不良、再発、非再発)並びに低、中及び高へのcftDNA量の分類を含む。
サンプル分類のための臨床関連カテゴリーは、癌の存在又は不在、疾患又は癌の寛解、疾患又は癌の再発、早期癌ステージ及び予後であり得る。
訳抜け問い合わせ中
オンコロジー使用
本発明は、癌の処置において又は腫瘍負荷の評価、微小残留疾患の検出、処置アウトカムのモニタリング、患者アウトカムの長期モニタリングのために使用され得る。本発明は、標的療法に好適な変異の同定に並びに癌体細胞系及び生殖系変異の検出にさらに使用され得る。本方法は、他の方法により検出可能でない小腫瘍の早期検出を促進し、且つより標的化されカスタマイズされた処置アプローチを可能にする。
本発明は、癌の処置において又は腫瘍負荷の評価、微小残留疾患の検出、処置アウトカムのモニタリング、患者アウトカムの長期モニタリングのために使用され得る。本発明は、標的療法に好適な変異の同定に並びに癌体細胞系及び生殖系変異の検出にさらに使用され得る。本方法は、他の方法により検出可能でない小腫瘍の早期検出を促進し、且つより標的化されカスタマイズされた処置アプローチを可能にする。
キット
他の一態様では、本発明は、本発明の方法を実施するためのキットを提供する。一実施形態では、キットは、プローブのプールから構成される容器並びに本方法を実施するためのソフトウェア及び説明書を含む。
他の一態様では、本発明は、本発明の方法を実施するためのキットを提供する。一実施形態では、キットは、プローブのプールから構成される容器並びに本方法を実施するためのソフトウェア及び説明書を含む。
プローブのプールに加えて、キットは、(i)生物学的サンプルから無細胞DNAを単離するための1つ以上の成分、(ii)シーケンシングライブラリーを調製及び富化するための1つ以上の成分(例えば、プライマー、アダプター、緩衝剤、リンカー、DNA修飾性酵素、ライゲーション酵素、ポリメラーゼ酵素、プローブなど)、(iii)富化されたライブラリーを増幅及び/又はシーケンスするための1つ以上の成分の1つ以上、及び/又は(iv)統計解析を実施するためのソフトウェアを含み得る。(i)、(ii)及び(iii)で参照されたステップを行うのに好適な成分は、当業者に周知である。
一実施形態では、プローブは、ビオチン化プローブのように固形担体に結合させ得る形態で提供される。他の一実施形態では、プローブは、ストレプトアビジン被覆磁気ビーズと共に提供されるビオチン化プローブのように固形担体と共に提供される。
各種他の実施形態では、キットは、本方法の他の態様を行うための追加成分を含み得る。例えば、プローブのプールに加えて、キットは、(i)母体血漿サンプルから無細胞DNAを単離するための1つ以上の成分、(ii)シーケンシングライブラリーを調製するための1つ以上の成分(例えば、プライマー、アダプター、リンカー、制限酵素、ライゲーション酵素、ポリメラーゼ酵素)、(iii)富化されたライブラリーを増幅及び/又はシーケンスするための1つ以上の成分の1つ以上、及び/又は(iv)統計解析を実施するためのソフトウェアを含み得る。(i)、(ii)及び(iii)で参照されたステップを行うのに好適な成分は、当業者に周知である。
実施例1
サンプルに含まれる複数のcfDNA断片の開始及び/又は停止(+及び/又は-1塩基対)の決定は、参照配列へのアライメントにより達成された。続いて、サンプル中に含まれる複数のcfDNA断片の各決定された開始及び/又は停止配列座標の頻度が決定された。対応する参照頻度に対する各決定された参照ゲノム座標の頻度の比が決定され、得られたすべての頻度比の加重和(本明細書では「診断スコア」といわれる)が計算された。
サンプルに含まれる複数のcfDNA断片の開始及び/又は停止(+及び/又は-1塩基対)の決定は、参照配列へのアライメントにより達成された。続いて、サンプル中に含まれる複数のcfDNA断片の各決定された開始及び/又は停止配列座標の頻度が決定された。対応する参照頻度に対する各決定された参照ゲノム座標の頻度の比が決定され、得られたすべての頻度比の加重和(本明細書では「診断スコア」といわれる)が計算された。
本発明の一実施形態によれば、各塩基i(ここで、i=1、...、Bであり、Bは、前記パネル中の標的塩基の合計数に等しい)に対して、下記条件:
(A1)塩基iに開始位置座標を有すること、又は
(A2)塩基iに停止位置座標を有すること、又は
(A3)塩基iに開始-1塩基位置座標を有すること、又は
(A4)塩基iに開始+1塩基位置座標を有すること、又は
(A5)塩基iに停止-1塩基位置座標を有すること、又は
(A6)塩基iに停止+1塩基位置座標を有すること
の少なくとも1つを満たすマップリードの合計数として、ランダム変数Xiが定義された。
(A1)塩基iに開始位置座標を有すること、又は
(A2)塩基iに停止位置座標を有すること、又は
(A3)塩基iに開始-1塩基位置座標を有すること、又は
(A4)塩基iに開始+1塩基位置座標を有すること、又は
(A5)塩基iに停止-1塩基位置座標を有すること、又は
(A6)塩基iに停止+1塩基位置座標を有すること
の少なくとも1つを満たすマップリードの合計数として、ランダム変数Xiが定義された。
帰無仮説(すなわちバックグラウンドモデル)の下で、ゲノムの異なる塩基で条件A1~A6の少なくとも1つを満たす異なる、ただし定常の数のリードを観測することが予想される。前記塩基ごとのバックグラウンド確率分布モデルは、一群の正常サンプルから推定される。以上のXiの定義から、Xi~Bin(xi;ni,pi)を得る。ここで、niは、塩基iをまたぐリードの合計数に等しく、piは、すべてのiに対して推定され、例えば、
は、
の通りである。ここで、zi,jは、合計でN正常サンプルのうち、正常サンプルjに対して塩基iで条件A1~A6の少なくとも1つを満たすリードの観測数であり、且つni,jは、正常サンプルjに対して塩基iをまたぐリードの合計数である。非常に小さいp及び大きいnを有する2項分布は、npに等しいレートパラメーターを有するポアソン分布により近似可能である。そのため、塩基ごとのバックグラウンドモデルは、以下の数式:
により定義される。ここで、niは、塩基iをまたぐリードの合計数に等しい。本発明の他の一実施形態では、すべてのjに対してzi,j/ni,jにより定義されるランダム変数を各塩基iでモデルするためにワイブル又はベータ分布が使用される。
塩基ごとのバックグラウンドモデルをトレーニングした後、以下のように進めた。各サンプルkに対して、本発明の一実施形態では、下記を実施する。すなわち、各Xiに対して、観測値、例えばxiを推定された塩基ごとのバックグラウンドモデルと比較した。p値、すなわちP(Xi>xi)=1-P(Xi≦xi)が0.001未満であった場合、Xiの観測値を、塩基iをまたぐリードの合計数で除算した。すなわち、Yi=Xi/ni、さもなければYi=0である。続いて、サンプル特異的スコアは、
のように計算される。ここで、n2は、Yi>0を有する塩基の合計数である。次いで、S0,kは、以下の数式:
を用いて規格化され、規格化スコアS1,kを得る。ここで、m及びsは、正常参照サンプルからのすべてのS0値の平均及び標準偏差である(図1、2及び3)。
実施例2
cfDNA断片の開始及び/又は停止(+及び/又は-1塩基対)配列座標の決定後、参照ゲノムの参照配列中のすべての核酸モチーフが決定された。前記モチーフは、トリヌクレオチド、テトラヌクレオチド及び/又はペンタヌクレオチドで構成され、開始及び/又は停止座標の内側の、ただしそれに1塩基対以上隣接する塩基対の特異的範囲内にあった。対応する参照頻度に対する複数のcfDNA断片内の核酸モチーフ頻度の各々の頻度比が決定され、得られたすべての頻度比の加重和(本明細書では「診断スコア」といわれる)が計算された。
cfDNA断片の開始及び/又は停止(+及び/又は-1塩基対)配列座標の決定後、参照ゲノムの参照配列中のすべての核酸モチーフが決定された。前記モチーフは、トリヌクレオチド、テトラヌクレオチド及び/又はペンタヌクレオチドで構成され、開始及び/又は停止座標の内側の、ただしそれに1塩基対以上隣接する塩基対の特異的範囲内にあった。対応する参照頻度に対する複数のcfDNA断片内の核酸モチーフ頻度の各々の頻度比が決定され、得られたすべての頻度比の加重和(本明細書では「診断スコア」といわれる)が計算された。
本発明の一実施形態によれば、各サンプル、例えばkでは、hg19参照ゲノム上にアラインされた各cfDNA断片に対して2つの配列が決定され、前記配列は、アラインされたcfDNA断片の2つの末端から内側に1~5塩基対の範囲内のhg19ゲノム配列を含み(断片がまたぐ核酸配列を除く)、前記配列内のすべてのトリヌクレオチド(例えば、ACC、GGTなど)、テトラヌクレオチド及びペンタヌクレオチド配列モチーフの絶対頻度、例えばTij(ここで、i=1、...、njであり、j=3、4、5は、ヌクレオチドの数であり、且つnjは、すべての可能なj-ヌクレオチドモチーフの数である)が計算された(n3=64、n4=256、n5=1024)。サンプル特異的スコアS2,kは、
のように計算される。
以上の式中、Dkは、サンプルkのコンセンサス断片の合計数であり、rijは、ctDNAを含まないサンプルのトレーニングデータセットから計算されたfijの参照値であり、mij及びsijは、ctDNAを含まないサンプルのトレーニングデータセットから計算された
の参照平均及び標準偏差であり、wijは、正常及び異常サンプル間の最適分離を提供するようにトレーニングセットから最適化された加重
である。加重bjは、本発明の各種実施形態で変動可能であり、b3=1/12又は1/6又は1/3又は1/2、b4=1/12又は1/6又は1/3又は1/2及びb5=1-b3-b4(図1、2及び3)。
実施例3
cfDNA断片の開始及び/又は停止(+及び/又は-1塩基対)配列座標の決定後、参照ゲノムの参照配列中のすべての核酸モチーフが決定された。前記モチーフは、トリヌクレオチド、テトラヌクレオチド及び/又はペンタヌクレオチドで構成され、開始及び/又は停止座標の外側の、ただしそれに1塩基対以上隣接する塩基対の特異的範囲内にあった。対応する参照頻度に対する複数のcfDNA断片内の核酸モチーフ頻度の各々の頻度比が決定され、得られたすべての頻度比の加重和(本明細書では「診断スコア」といわれる)が計算された。
cfDNA断片の開始及び/又は停止(+及び/又は-1塩基対)配列座標の決定後、参照ゲノムの参照配列中のすべての核酸モチーフが決定された。前記モチーフは、トリヌクレオチド、テトラヌクレオチド及び/又はペンタヌクレオチドで構成され、開始及び/又は停止座標の外側の、ただしそれに1塩基対以上隣接する塩基対の特異的範囲内にあった。対応する参照頻度に対する複数のcfDNA断片内の核酸モチーフ頻度の各々の頻度比が決定され、得られたすべての頻度比の加重和(本明細書では「診断スコア」といわれる)が計算された。
本方法の一実施形態では、各サンプル、例えばkでは、hg19参照ゲノム上にアラインされた各cfDNA断片に対して2つの配列が決定され、前記配列は、アラインされたcfDNA断片の2つの末端から外側に1~5塩基対の範囲内のhg19ゲノム配列を含み(断片がまたぐ核酸配列を除く)、前記配列内のすべてのトリヌクレオチド(例えば、ACC、GGTなど)、テトラヌクレオチド及びペンタヌクレオチド配列モチーフの絶対頻度、例えばTij(ここで、i=1、...、njであり、j=3、4、5は、ヌクレオチドの数であり、且つnjは、すべての可能なj-ヌクレオチドモチーフの数である)が計算された(n3=64、n4=256、n5=1024)。サンプル特異的スコアS3,kは、
のように計算される。
以上の式中、Dkは、サンプルkのコンセンサス断片の合計数であり、rijは、ctDNAを含まないサンプルのトレーニングデータセットから計算されたfijの参照値であり、mij及びsijは、ctDNAを含まないサンプルのトレーニングデータセットから計算された
の参照平均及び標準偏差であり、wijは、正常及び異常サンプル間の最適分離を提供するようにトレーニングセットから最適化された加重
である。加重bjは、本発明の各種実施形態で変動可能であり、b3=1/12又は1/6又は1/3又は1/2、b4=1/12又は1/6又は1/3又は1/2及びb5=1-b3-b4(図1、2及び3)。
実施例4
本方法の一実施形態では、実施例1、2及び3で計算されたスコアの少なくとも2つの加重和が各サンプルについて計算された。前記加重和は、これ以降では「組合せ診断スコア」といわれる。サンプルkの診断スコア、例えばDSkは、以上の実施例1、2及び3に記載のスコアの少なくとも2つの加重平均として定義される。すなわち、
である。ここで、S1、S2及びS3は、それぞれ実施例1、2及び3で計算され、本発明の各種実施形態では、小数第1位に丸めてw1=0.5又は0.4又は0.3又は0.2又は0、小数第1位に丸めてw2=0.5又は0.4又は0.3又は0.2又は0、w3=1-w1-w2である。本方法の他の一実施形態では、サンプルkのDSスコアを計算するために{S1,S2,S3}の最大及び最小の加重平均が使用される。すなわち、DSk=zMAX(S1,k,S2,k,S3,k)+(1-z)MIN(S1,k,S2,k,S3,k)、0.5<z<1である。
本方法の一実施形態では、実施例1、2及び3で計算されたスコアの少なくとも2つの加重和が各サンプルについて計算された。前記加重和は、これ以降では「組合せ診断スコア」といわれる。サンプルkの診断スコア、例えばDSkは、以上の実施例1、2及び3に記載のスコアの少なくとも2つの加重平均として定義される。すなわち、
Claims (10)
- 無細胞腫瘍DNAを含むものとしてサンプルを分類する方法であって、
(i)複数の無細胞DNA(cfDNA)断片を含むサンプルにおいて、少なくとも100,000cfDNA断片の開始及び/又は停止の配列座標を参照配列へのアライメントによって決定するステップと、
(ii)a)(i)で決定された各開始及び/又は停止配列座標に対して内側の、ただしそれに隣接する1~5塩基対の範囲内、及び/又は
b)(i)で決定された各開始及び/又は停止配列座標に対して外側の、ただしそれに隣接する1~5塩基対の範囲内
において、トリヌクレオチド、テトラヌクレオチド及びペンタヌクレオチドで構成されるすべての核酸モチーフを前記参照配列中で決定するステップと、
(iii)a)前記サンプルに含まれる前記複数のcfDNA断片における、(i)で決定された各配列座標+及び/又は-1塩基対、
b)前記サンプルに含まれる前記複数のcfDNA断片における、(ii)a)及びb)で決定された前記核酸モチーフの各々
の頻度を決定するステップと、
(iv)対応する参照頻度に対する、(iii)a)及びb)で決定された前記頻度の各々の比を計算するステップと、
(v)ステップ(iv)で決定された各比について別々に診断スコアを計算するステップであって、前記スコアは、ステップ(iv)のすべてのそれぞれの頻度比のそれぞれの加重和である、ステップと、
(vi)(v)で決定された前記診断スコアの少なくとも2つ以上から組合せ診断スコアを計算するステップであって、前記スコアは、(v)で決定された前記2つ以上の診断スコアの加重和である、ステップと、
(vii)前記組合せ診断スコアと参照スコアとを比較することにより、前記サンプルの分類を決定するステップと
を含み、前記サンプルは、前記組合せ診断スコア値が前記参照スコアの平均よりも前記参照スコアの少なくとも1標準偏差だけ高い場合、腫瘍cfDNAを含むものとして分類され、前記参照スコアは、1つ以上の参照値から計算される、方法。 - 前記組合せ診断スコアは、請求項4のステップ(v)で計算された前記診断スコアのすべてから計算される、請求項1に記載の方法。
- 各開始及び/又は停止配列座標に対して内側の、ただしそれに隣接する塩基対の前記範囲は、各開始及び/又は停止座標から2bp~6bp、又は3bp~7bp、又は4bp~8bp、又は5bp~9bp、又は6bp~10bpであり得る、請求項1又は2に記載の方法。
- 解析されるサンプル中に含まれるcfDNA断片の最小量は、10万~50万、50万~100万、100万~200万、200万~500万、又は500万~1000万、又は1000万~2000万、又は2000万~5000万、又は5000万~5億である、請求項1~3のいずれか一項に記載の方法。
- 前記サンプル中の腫瘍cfDNAの量は、前記組合せ診断スコアが前記参照スコアの2~4標準偏差である場合には低として、前記組合せスコアが前記参照スコアの4~6.5標準偏差である場合には中として及び前記組合せスコアが前記参照スコアの6.5標準偏差超である場合には高として分類され得る、請求項1~4のいずれか一項に記載の方法。
- 前記参照サンプルは、癌のない患者、又は非再発患者、又は処置が成功した癌患者からのサンプルであり得る、請求項1~5のいずれか一項に記載の方法。
- ステップ(i)は、参照配列へのアライメント前に前記サンプル中の前記複数のcfDNA断片の少なくとも一部分の核酸配列を決定することを含む、請求項1~6のいずれか一項に記載の方法。
- ステップ(i)は、cfDNA断片の核酸配列の決定前にcfDNA断片を富化することをさらに含む、請求項1~7に記載の方法。
- 前記サンプルは、血液癌、肝癌、肺癌、膵癌、前立腺癌、乳癌、胃癌、膠芽細胞腫、結腸直腸癌、頭頸部癌、固形腫瘍、良性腫瘍、悪性腫瘍、進行ステージ癌、転移又は前癌組織の群から選択される腫瘍を起源とする腫瘍cfDNAを含むものとして分類される、請求項1~8のいずれか一項に記載の方法。
- (i)請求項1~9のいずれか一項に記載の方法を行うための成分であって、
a)生物学的サンプルから無細胞DNAを単離するための1つ以上の成分、
b)シーケンシングライブラリーを調製及び富化するための1つ以上の成分、及び/又は
c)前記富化されたライブラリーを増幅及び/又はシーケンスするための1つ以上の成分
を含む成分、
(ii)統計解析を実施するためのソフトウェア
を含むキット。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20215773 | 2020-12-18 | ||
EP20215773.1 | 2020-12-18 | ||
PCT/EP2021/086255 WO2022129370A1 (en) | 2020-12-18 | 2021-12-16 | Methods for classifying a sample into clinically relevant categories |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023554509A true JP2023554509A (ja) | 2023-12-27 |
Family
ID=73855985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023537605A Pending JP2023554509A (ja) | 2020-12-18 | 2021-12-16 | サンプルを臨床関連カテゴリーに分類する方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20240052424A1 (ja) |
EP (1) | EP4263867A1 (ja) |
JP (1) | JP2023554509A (ja) |
KR (1) | KR20230132785A (ja) |
CN (1) | CN116829736A (ja) |
AU (1) | AU2021399917A1 (ja) |
CA (1) | CA3202038A1 (ja) |
IL (1) | IL303827A (ja) |
MX (1) | MX2023007268A (ja) |
WO (1) | WO2022129370A1 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3421613B1 (en) * | 2013-03-15 | 2020-08-19 | The Board of Trustees of the Leland Stanford Junior University | Identification and use of circulating nucleic acid tumor markers |
AU2018296673A1 (en) * | 2017-07-07 | 2020-01-16 | Medicover Public Co Ltd | Target-enriched multiplexed parallel analysis for assessment of risk for genetic conditions |
US20210104297A1 (en) * | 2018-04-16 | 2021-04-08 | Grail, Inc. | Systems and methods for determining tumor fraction in cell-free nucleic acid |
-
2021
- 2021-12-16 US US18/267,622 patent/US20240052424A1/en active Pending
- 2021-12-16 MX MX2023007268A patent/MX2023007268A/es unknown
- 2021-12-16 KR KR1020237023875A patent/KR20230132785A/ko active Search and Examination
- 2021-12-16 EP EP21836194.7A patent/EP4263867A1/en active Pending
- 2021-12-16 AU AU2021399917A patent/AU2021399917A1/en active Pending
- 2021-12-16 CA CA3202038A patent/CA3202038A1/en active Pending
- 2021-12-16 IL IL303827A patent/IL303827A/en unknown
- 2021-12-16 WO PCT/EP2021/086255 patent/WO2022129370A1/en active Application Filing
- 2021-12-16 JP JP2023537605A patent/JP2023554509A/ja active Pending
- 2021-12-16 CN CN202180092239.4A patent/CN116829736A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240052424A1 (en) | 2024-02-15 |
EP4263867A1 (en) | 2023-10-25 |
AU2021399917A1 (en) | 2023-08-03 |
CA3202038A1 (en) | 2022-06-23 |
WO2022129370A1 (en) | 2022-06-23 |
KR20230132785A (ko) | 2023-09-18 |
MX2023007268A (es) | 2023-09-04 |
AU2021399917A9 (en) | 2024-09-19 |
CN116829736A (zh) | 2023-09-29 |
IL303827A (en) | 2023-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109880910B (zh) | 一种肿瘤突变负荷的检测位点组合、检测方法、检测试剂盒及系统 | |
CN106715723B (zh) | 测定样品中pik3ca突变状态的方法 | |
CN105779434A (zh) | 试剂盒及其用途 | |
EP2513330A1 (en) | Diagnostic methods based on somatically acquired rearrangement | |
WO2020243722A1 (en) | Methods and systems for improving patient monitoring after surgery | |
US12049672B2 (en) | Methods and systems for screening for conditions | |
AU2021291586B2 (en) | Multimodal analysis of circulating tumor nucleic acid molecules | |
WO2018231957A1 (en) | Tumor mutation burden | |
WO2022262831A1 (zh) | 用于评估肿瘤的物质及其方法 | |
JP2024530154A (ja) | 体細胞変異と異常にメチル化された断片との同時発生 | |
CN117418003A (zh) | 标志物、探针及其应用 | |
EP4015650A1 (en) | Methods for classifying a sample into clinically relevant categories | |
US20240052424A1 (en) | Methods for classifying a sample into clinically relevant categories | |
JP2023524681A (ja) | 分配された核酸を使用した配列決定のための方法 | |
JP2023529064A (ja) | ヒト対象における医学的状態を同定する方法 | |
Englert‑Golon et al. | Genomic mapping of pathways in endometrial adenocarcinoma and a gastrointestinal stromal tumor located in Meckel's diverticulum | |
Behrouzi et al. | Cell-free and extrachromosomal DNA profiling of small cell lung cancer | |
CN111201572A (zh) | 用于提高精确度的癌症患者的综合基因组转录组肿瘤-正常样基因组套分析 | |
WO2023230289A1 (en) | Methods and systems for cell-free nucleic acid processing | |
AU2023226165A1 (en) | Probe sets for a liquid biopsy assay | |
Gao et al. | Noninvasive Detection of Gastrointestinal Tumours: A Machine Learning Model Based on Circulating Cell-Free DNA Unique Pattern Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240412 |