JP7523353B2 - バリアント検出の改善 - Google Patents
バリアント検出の改善 Download PDFInfo
- Publication number
- JP7523353B2 JP7523353B2 JP2020546469A JP2020546469A JP7523353B2 JP 7523353 B2 JP7523353 B2 JP 7523353B2 JP 2020546469 A JP2020546469 A JP 2020546469A JP 2020546469 A JP2020546469 A JP 2020546469A JP 7523353 B2 JP7523353 B2 JP 7523353B2
- Authority
- JP
- Japan
- Prior art keywords
- patient
- sample
- reads
- variant
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title description 163
- 230000035772 mutation Effects 0.000 claims description 433
- 206010028980 Neoplasm Diseases 0.000 claims description 389
- 238000012163 sequencing technique Methods 0.000 claims description 260
- 108700028369 Alleles Proteins 0.000 claims description 222
- 238000000034 method Methods 0.000 claims description 201
- 210000002381 plasma Anatomy 0.000 claims description 171
- 239000012634 fragment Substances 0.000 claims description 112
- 238000004458 analytical method Methods 0.000 claims description 96
- 201000011510 cancer Diseases 0.000 claims description 90
- 210000004369 blood Anatomy 0.000 claims description 78
- 239000008280 blood Substances 0.000 claims description 78
- 201000001441 melanoma Diseases 0.000 claims description 67
- 238000002360 preparation method Methods 0.000 claims description 34
- 238000011282 treatment Methods 0.000 claims description 34
- 208000007660 Residual Neoplasm Diseases 0.000 claims description 33
- 108091033319 polynucleotide Proteins 0.000 claims description 30
- 102000040430 polynucleotide Human genes 0.000 claims description 30
- 239000002157 polynucleotide Substances 0.000 claims description 30
- 238000009826 distribution Methods 0.000 claims description 27
- 238000001574 biopsy Methods 0.000 claims description 22
- 210000001519 tissue Anatomy 0.000 claims description 22
- 210000002700 urine Anatomy 0.000 claims description 17
- 239000011324 bead Substances 0.000 claims description 15
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 15
- 238000000126 in silico method Methods 0.000 claims description 14
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 12
- 230000004931 aggregating effect Effects 0.000 claims description 12
- 201000005202 lung cancer Diseases 0.000 claims description 12
- 208000020816 lung neoplasm Diseases 0.000 claims description 12
- 230000002441 reversible effect Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 210000002966 serum Anatomy 0.000 claims description 10
- 206010006187 Breast cancer Diseases 0.000 claims description 9
- 208000026310 Breast neoplasm Diseases 0.000 claims description 9
- 230000037429 base substitution Effects 0.000 claims description 9
- 238000002271 resection Methods 0.000 claims description 8
- 238000000729 Fisher's exact test Methods 0.000 claims description 7
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 7
- 206010009944 Colon cancer Diseases 0.000 claims description 6
- 206010033128 Ovarian cancer Diseases 0.000 claims description 6
- 238000013442 quality metrics Methods 0.000 claims description 6
- 208000003174 Brain Neoplasms Diseases 0.000 claims description 5
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 5
- 238000001159 Fisher's combined probability test Methods 0.000 claims description 5
- 238000009595 pap smear Methods 0.000 claims description 5
- 206010005003 Bladder cancer Diseases 0.000 claims description 4
- 208000000461 Esophageal Neoplasms Diseases 0.000 claims description 4
- 206010030155 Oesophageal carcinoma Diseases 0.000 claims description 4
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 claims description 4
- 201000004101 esophageal cancer Diseases 0.000 claims description 4
- 239000012530 fluid Substances 0.000 claims description 4
- 210000001165 lymph node Anatomy 0.000 claims description 4
- 201000005112 urinary bladder cancer Diseases 0.000 claims description 4
- 206010036790 Productive cough Diseases 0.000 claims description 3
- 230000002380 cytological effect Effects 0.000 claims description 3
- 230000007423 decrease Effects 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 210000003802 sputum Anatomy 0.000 claims description 3
- 208000024794 sputum Diseases 0.000 claims description 3
- 238000005406 washing Methods 0.000 claims description 3
- 239000007788 liquid Substances 0.000 claims description 2
- 108020004414 DNA Proteins 0.000 description 238
- 239000000523 sample Substances 0.000 description 226
- 230000035945 sensitivity Effects 0.000 description 63
- 230000001629 suppression Effects 0.000 description 57
- 238000007482 whole exome sequencing Methods 0.000 description 55
- 238000010790 dilution Methods 0.000 description 38
- 239000012895 dilution Substances 0.000 description 38
- 238000012070 whole genome sequencing analysis Methods 0.000 description 38
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 36
- 201000010099 disease Diseases 0.000 description 33
- 230000010354 integration Effects 0.000 description 30
- 238000001356 surgical procedure Methods 0.000 description 25
- 238000012360 testing method Methods 0.000 description 25
- 238000003556 assay Methods 0.000 description 24
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 24
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 24
- 238000005070 sampling Methods 0.000 description 22
- 238000013459 approach Methods 0.000 description 20
- 238000012544 monitoring process Methods 0.000 description 20
- 238000002474 experimental method Methods 0.000 description 19
- 238000012512 characterization method Methods 0.000 description 17
- 238000013461 design Methods 0.000 description 17
- 239000000463 material Substances 0.000 description 16
- 230000008901 benefit Effects 0.000 description 15
- 239000013610 patient sample Substances 0.000 description 15
- 238000012545 processing Methods 0.000 description 15
- 108090000623 proteins and genes Proteins 0.000 description 15
- 210000004602 germ cell Anatomy 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 13
- 210000004027 cell Anatomy 0.000 description 13
- 238000011002 quantification Methods 0.000 description 13
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 12
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 12
- 238000007481 next generation sequencing Methods 0.000 description 12
- 230000004083 survival effect Effects 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 238000000605 extraction Methods 0.000 description 11
- 238000001914 filtration Methods 0.000 description 11
- 230000004044 response Effects 0.000 description 11
- 230000002829 reductive effect Effects 0.000 description 10
- 230000000717 retained effect Effects 0.000 description 9
- 102100030852 Run domain Beclin-1-interacting and cysteine-rich domain-containing protein Human genes 0.000 description 8
- 101710179516 Run domain Beclin-1-interacting and cysteine-rich domain-containing protein Proteins 0.000 description 8
- 238000011109 contamination Methods 0.000 description 8
- 238000012350 deep sequencing Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 7
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 7
- 230000003321 amplification Effects 0.000 description 7
- 238000011394 anticancer treatment Methods 0.000 description 7
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 7
- 238000002591 computed tomography Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 230000003902 lesion Effects 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 206010038389 Renal cancer Diseases 0.000 description 6
- 101710205841 Ribonuclease P protein component 3 Proteins 0.000 description 6
- 102100033795 Ribonuclease P protein subunit p30 Human genes 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000003205 genotyping method Methods 0.000 description 6
- 208000005017 glioblastoma Diseases 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 238000001558 permutation test Methods 0.000 description 6
- 238000013515 script Methods 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 241001552669 Adonis annua Species 0.000 description 5
- 238000001712 DNA sequencing Methods 0.000 description 5
- 208000008839 Kidney Neoplasms Diseases 0.000 description 5
- 241000283984 Rodentia Species 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 238000013170 computed tomography imaging Methods 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 238000009169 immunotherapy Methods 0.000 description 5
- 201000010982 kidney cancer Diseases 0.000 description 5
- 230000000869 mutational effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000002626 targeted therapy Methods 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 108091035707 Consensus sequence Proteins 0.000 description 4
- 238000007400 DNA extraction Methods 0.000 description 4
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 4
- 239000013068 control sample Substances 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 230000001605 fetal effect Effects 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 238000009121 systemic therapy Methods 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 3
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- 239000000654 additive Substances 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- 229960000397 bevacizumab Drugs 0.000 description 3
- 239000012472 biological sample Substances 0.000 description 3
- 238000002512 chemotherapy Methods 0.000 description 3
- 208000011654 childhood malignant neoplasm Diseases 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000007847 digital PCR Methods 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000008774 maternal effect Effects 0.000 description 3
- 206010061289 metastatic neoplasm Diseases 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 230000002611 ovarian Effects 0.000 description 3
- 238000001959 radiotherapy Methods 0.000 description 3
- 102200055464 rs113488022 Human genes 0.000 description 3
- 238000011896 sensitive detection Methods 0.000 description 3
- 238000010206 sensitivity analysis Methods 0.000 description 3
- 238000012421 spiking Methods 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 230000002485 urinary effect Effects 0.000 description 3
- 206010065163 Clonal evolution Diseases 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 206010027480 Metastatic malignant melanoma Diseases 0.000 description 2
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 2
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 208000009956 adenocarcinoma Diseases 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000011319 anticancer therapy Methods 0.000 description 2
- 239000013060 biological fluid Substances 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000012297 crystallization seed Substances 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 2
- 238000011528 liquid biopsy Methods 0.000 description 2
- 238000001325 log-rank test Methods 0.000 description 2
- 238000009593 lumbar puncture Methods 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000009401 metastasis Effects 0.000 description 2
- 208000021039 metastatic melanoma Diseases 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 238000009598 prenatal testing Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000008261 resistance mechanism Effects 0.000 description 2
- 102200124923 rs121913254 Human genes 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000011895 specific detection Methods 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 229960003862 vemurafenib Drugs 0.000 description 2
- GPXBXXGIAQBQNI-UHFFFAOYSA-N vemurafenib Chemical compound CCCS(=O)(=O)NC1=CC=C(F)C(C(=O)C=2C3=CC(=CN=C3NC=2)C=2C=CC(Cl)=CC=2)=C1F GPXBXXGIAQBQNI-UHFFFAOYSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- 102100023157 AT-rich interactive domain-containing protein 2 Human genes 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 206010055113 Breast cancer metastatic Diseases 0.000 description 1
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 238000013382 DNA quantification Methods 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 206010061819 Disease recurrence Diseases 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 208000006168 Ewing Sarcoma Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 206010019315 Heart transplant rejection Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000685261 Homo sapiens AT-rich interactive domain-containing protein 2 Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101000601770 Homo sapiens Protein polybromo-1 Proteins 0.000 description 1
- 101000771607 Homo sapiens WD repeat-containing protein 61 Proteins 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 238000010824 Kaplan-Meier survival analysis Methods 0.000 description 1
- 239000003798 L01XE11 - Pazopanib Substances 0.000 description 1
- 238000003657 Likelihood-ratio test Methods 0.000 description 1
- 108091036060 Linker DNA Proteins 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 206010025671 Malignant melanoma stage IV Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 208000035346 Margins of Excision Diseases 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 208000002454 Nasopharyngeal Carcinoma Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 208000034176 Neoplasms, Germ Cell and Embryonal Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 102000007530 Neurofibromin 1 Human genes 0.000 description 1
- 108010085793 Neurofibromin 1 Proteins 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 201000008199 Pleuropulmonary blastoma Diseases 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 244000088401 Pyrus pyrifolia Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 201000000582 Retinoblastoma Diseases 0.000 description 1
- 101100412089 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rec11 gene Proteins 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 102100033254 Tumor suppressor ARF Human genes 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 102100029449 WD repeat-containing protein 61 Human genes 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- 230000002745 absorbent Effects 0.000 description 1
- 239000002250 absorbent Substances 0.000 description 1
- 238000009098 adjuvant therapy Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000003467 cheek Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000019506 cigar Nutrition 0.000 description 1
- 108091092240 circulating cell-free DNA Proteins 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000007428 craniotomy Methods 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 229960002465 dabrafenib Drugs 0.000 description 1
- BFSMGDJOXZAERB-UHFFFAOYSA-N dabrafenib Chemical compound S1C(C(C)(C)C)=NC(C=2C(=C(NS(=O)(=O)C=3C(=CC=CC=3F)F)C=CC=2)F)=C1C1=CC=NC(N)=N1 BFSMGDJOXZAERB-UHFFFAOYSA-N 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011257 definitive treatment Methods 0.000 description 1
- 230000000779 depleting effect Effects 0.000 description 1
- 239000002274 desiccant Substances 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 235000021045 dietary change Nutrition 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 230000037437 driver mutation Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011985 exploratory data analysis Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 238000004374 forensic analysis Methods 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 210000003780 hair follicle Anatomy 0.000 description 1
- 208000006359 hepatoblastoma Diseases 0.000 description 1
- 230000002962 histologic effect Effects 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- -1 ipilimumab Chemical compound 0.000 description 1
- 229960005386 ipilimumab Drugs 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 201000005249 lung adenocarcinoma Diseases 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 238000007837 multiplex assay Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 201000011216 nasopharynx carcinoma Diseases 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 230000008789 oxidative DNA damage Effects 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- CUIHSIWYWATEQL-UHFFFAOYSA-N pazopanib Chemical compound C1=CC2=C(C)N(C)N=C2C=C1N(C)C(N=1)=CC=NC=1NC1=CC=C(C)C(S(N)(=O)=O)=C1 CUIHSIWYWATEQL-UHFFFAOYSA-N 0.000 description 1
- 229960000639 pazopanib Drugs 0.000 description 1
- 238000012831 peritoneal equilibrium test Methods 0.000 description 1
- 230000000886 photobiology Effects 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012636 positron electron tomography Methods 0.000 description 1
- 238000012877 positron emission topography Methods 0.000 description 1
- 208000037821 progressive disease Diseases 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000012950 reanalysis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 201000010174 renal carcinoma Diseases 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- 208000004124 rheumatic heart disease Diseases 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000012898 sample dilution Substances 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 238000002603 single-photon emission computed tomography Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 238000012420 spiking experiment Methods 0.000 description 1
- 208000037992 stage IV cutaneous melanoma Diseases 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 229960004066 trametinib Drugs 0.000 description 1
- LIRYPHYGHXZJBZ-UHFFFAOYSA-N trametinib Chemical compound CC(=O)NC1=CC=CC(N2C(N(C3CC3)C(=O)C3=C(NC=4C(=CC(I)=CC=4)F)N(C)C(=O)C(C)=C32)=O)=C1 LIRYPHYGHXZJBZ-UHFFFAOYSA-N 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 239000000107 tumor biomarker Substances 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 238000012447 xenograft mouse model Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Analytical Chemistry (AREA)
- Organic Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Data Mining & Analysis (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Description
(a)患者の腫瘍を表す少なくとも2、3、4、5、6、7、8、9、10、50、100、500、1000、2500、または少なくとも5000の変異含有座位(「患者特異的座位」)を含む目的の座位を用意するステップ、
(b)患者由来のDNA含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを取得するステップであり、前記配列リードがステップ(a)の前記少なくとも2、3、4、5、6、7、8、9、10、50、100、500、1000、2500、または5000の変異含有座位にまたがる、ステップ、
(c)任意選択で、配列決定ノイズ低減を実施する、例えばリードコラプシングを実施して配列リードをリードファミリーにグループ化するステップ、
(d)前記少なくとも2、3、4、5、6、7、8、9、10、50、100、500、1000、2500、または5000の患者特異的座位の一部または全てにわたる変異アレル割合を、任意選択で変異リードおよび総リードを集計することによって算出するステップ、
を含む方法、を提供する。特に、変異アレル割合を算出するステップは、式:
(e)試料を
(i)変異アレル割合が所定の閾値(例えばバックグラウンド配列決定エラー率)よりも大きいと見出される場合、cfDNA(例えばctDNA)を含有する、または
(ii)変異アレル割合が所定の閾値(例えばバックグラウンド配列決定エラー率)よりも大きいと見出されず、統計的に有意に大きいとも見出されない場合、cfDNA(例えばctDNA)を含有してもなく、未知のcfDNA(例えばctDNA)のステータスを有してもいない
と分類するステップ
をさらに含む。
式中、
AFコンテキストは所与の(例えばトリヌクレオチド)コンテキストのアレル頻度であり、腫瘍AFは腫瘍の分析によって(例えば腫瘍から直接取得したDNAを配列決定することによって)決定される座位のアレル頻度であり、MRD様座位は、患者の腫瘍から決定され、微小残存病変シグナルを選択するためにフィルタリングされた変異含有座位である。腫瘍アレル割合による加重の効果は、特に図15および18を比較する実施例11に見ることができる。図18においては行われたが図15においては行われなかった、上記式に従った腫瘍アレル割合による加重は、結果として変異シグナルの示差的エンリッチメントを生じる。
(i)患者から取得したポリヌクレオチド含有試料を配列決定して、試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを取得するステップであり、前記配列リードが、患者の癌細胞における変異保有座位であると決定された少なくとも2、3、4、5、6、7、8、9、10、50、100、500、1000、2500、または少なくとも5000の座位にまたがる、ステップ、
(ii)本発明の第1の態様の方法を、ステップ(i)において取得した配列データを使用して実行するステップ、
(iii)患者における癌の存在、成長、予後、退縮、処置応答、または再発を、少なくとも、試料を、ctDNAを含有する、ctDNAを含有しないと分類することに基づいて、またはバックグラウンドエラーを考慮に入れて算出したアレル割合に基づいて決定するステップ
を含み、任意選択で腫瘍切除後の癌の再発をモニタリングするためのものである、方法を提供する。
a)本発明の第1または第2の態様の方法を実行するステップ、および
b)(i)試料がcfDNA(例えばctDNA)を含有すると決定される場合(例えば変異アレル割合がバックグラウンド配列決定エラー率よりも大きい、例えば統計的に有意に大きいと見出される場合)、抗癌処置を患者に投与するステップ、または
(ii)試料がcfDNA(例えばctDNA)を含有しないかもしくは本発明の方法の検出の限界未満のcfDNA(例えばctDNA)レベルを有すると決定される場合(例えば変異アレル割合がバックグラウンド配列決定エラー率より大きくもなく、統計的に有意に大きくもないと見出される場合)、患者が癌を有しないかもしくは癌から寛解していると決定され得、抗癌療法が短縮され得ること
を含む、方法を提供する。
(a)少なくとも2、3、4、5、6、7、8、9、10、50、100、500、1000、2500、または少なくとも5000の座位であり、それぞれにおける少なくとも1つの塩基が標的ポリヌクレオチド配列と非標的ポリヌクレオチド配列との間で異なる、座位(「標的特異的座位」)を含む配列情報を取得するステップ、
(b)試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを取得するステップであり、前記配列リードが、ステップ(a)の前記少なくとも2、3、4、5、6、7、8、9、10、50、100、500、1000、2500、または5000の標的特異的座位にまたがる、ステップ、
(c)任意選択で、リードコラプシングを実施して配列リードをリードファミリーにグループ化するステップ、
(d)前記少なくとも2、3、4、5、6、7、8、9、10、50、100、500、1000、2500、または5000以上の標的特異的座位の一部または全てにわたる標的ポリヌクレオチド割合を算出するステップであり、任意選択で標的ポリヌクレオチド割合が式:
(e)試料を
(i)標的ポリヌクレオチド割合がバックグラウンド配列決定エラー率に基づいて予期され得る割合よりも統計的に有意に大きいと見出される場合、標的ポリヌクレオチドを含有する、または
(ii)標的ポリヌクレオチド割合がバックグラウンド配列決定エラー率に基づいて予期され得る割合よりも統計的に有意に大きいと見出されない場合、標的ポリヌクレオチドを含有してもなく、未知の標的ポリヌクレオチドのステータスを有してもいない
と分類するステップ
を含む、方法を提供する。
標的ポリヌクレオチド割合統計的有意性決定は、各塩基置換クラスに関する統計的有意性を、その塩基置換クラスのバックグラウンド配列決定エラー率を考慮に入れて計算すること、および計算した各塩基置換クラスの統計的有意性を組み合わせて、試料の全体標的ポリヌクレオチド割合に関する統計的有意性の尺度を得ることを含む。
本発明の任意の態様においては、患者は哺乳動物、好ましくはヒトである。患者は癌を有すると診断されていてもよい。場合によっては、患者は、癌のための1コースの処置を経験した場合がある、および/または癌を切り取る外科的処置を経験した場合がある。
(i)500μl未満、400未満、200未満、100μl未満、または75μl未満の血液、血清、または血漿試料(例えば約50μlの血液または血漿試料)、
(ii)穿刺吸引(FNA)、
(iii)リンパ節生検、
(iv)尿、脳脊髄液、喀痰、気管支洗浄、子宮頸部スメア、または細胞学的試料、
(v)患者からの収集時から1年、2年、3年、5年、または10年超保管された試料、および
(vi)以前に処理されており、DNAもしくは配列決定品質に関する品質測定基準を満たしていない試料、または1組の試料に属する試料であり、1組の試料からの他の試料が、以前に処理されており、DNAもしくは配列決定品質に関する品質測定基準を満たしていない、試料
からなる群から選択される有限容量試料である。
乾燥血斑試料、
穿刺血液試料、
患者からの収集後1日超(例えば少なくとも1か月)、または少なくとも1年間、または少なくとも10年間保管された、500μl未満である保存血液、血清、または血漿試料
である。
(i)500μl未満、400未満、200未満、100μl未満、または75μl未満の血液、血清、または血漿試料(例えば約50μlの血液または血漿試料)、
(ii)穿刺吸引(FNA)、
(iii)リンパ節生検、
(iv)尿、脳脊髄液、喀痰、気管支洗浄、子宮頸部スメア、または細胞学的試料、
(v)患者からの収集時から1年、2年、3年、5年、または10年超保管された試料、および
(vi)以前に処理されており、DNAもしくは配列決定品質に関する品質測定基準を満たしていない試料、または1組の試料に属する試料であり、1組の試料からの他の試料が、以前に処理されており、DNAもしくは配列決定品質に関する品質測定基準を満たしていない、試料
からなる群から選択される有限容量試料である。
(i)サイズ選択された試料もしくはサイズ選択された試料から生成されたライブラリをDNA配列決定して複数の配列リードを生成し、配列リードを分析してctDNAの存在を検出するステップ、または
(ii)メチル化等のDNA修飾を分析するステップ
を含む。
乾燥血斑試料、
穿刺血液試料、
患者からの収集後1日超(例えば少なくとも1か月)、少なくとも1年間、または少なくとも10年間保管された、500μl未満である保存血液、血清、または血漿試料
である。
本発明の第1から第4の態様のいずれかの方法を実施すること、
コピー数分析を実施すること、
配列リードを処理して、コピー数中立からのトリミングされた中央絶対偏差(t-MAD)スコアもしくはichorCNAスコアを決定すること、ならびに/または
配列リードを少なくとも2種の異なる参照ゲノム、例えばヒト参照ゲノムおよびげっ歯類参照ゲノムに対してアラインメントすること
から選択される配列リードの分析をさらに含む。
患者に移植されたドナー組織もしくは器官からのcfDNA、
患者の妊娠中の胎児からの胎児cfDNA、または
異常にメチル化したcfDNA
を含む。
少なくとも1つのプロセッサ、ならびに
少なくとも1つのプロセッサによって実行される場合、少なくとも1つのプロセッサに、
(a)患者由来のDNA含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを受け取るステップであり、前記配列リードが少なくとも2、3、4、5、6、7、8、9、10、50、100、500、1000、2500、または5000の変異含有座位にまたがる、ステップ、
(b)任意選択で、配列決定ノイズ低減を実施する、例えばリードコラプシングを実施して配列リードをリードファミリーにグループ化するステップ、
(c)前記少なくとも2、3、4、5、6、7、8、9、10、50、100、500、1000、2500、または5000の患者特異的座位の一部または全てにわたる変異アレル割合を算出するステップであり、任意選択で変異アレル割合が式:
(d)試料を、算出した変異アレル割合に基づいて、標的cfDNAを含有するまたは含有しないと分類するステップ
を含む操作を実施させる命令を含有する少なくとも1つの非一時的コンピュータ可読媒体
を含む、システムを提供する。
(a)患者由来のDNA含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを受け取るステップであり、前記配列リードが前記少なくとも2、3、4、5、6、7、8、9、10、50、100、500、1000、2500、または5000の変異含有座位にまたがる、ステップ、
(b)任意選択で、配列決定ノイズ低減を実施する、例えばリードコラプシングを実施して配列リードをリードファミリーにグループ化するステップ、
(c)前記少なくとも2、3、4、5、6、7、8、9、10、50、100、500、1000、2500、または5000の患者特異的座位の一部または全てにわたる変異アレル割合を算出するステップであり、任意選択で変異アレル割合が式:
(d)試料を、算出した変異アレル割合に基づいて、標的cfDNAを含有するまたは含有しないと分類するステップ
を含む操作を実施させる命令を含む、非一時的コンピュータ可読媒体を提供する。
本発明の一部の実施形態においては、患者の腫瘍に特異的な変異を保有する座位が同定され得る。場合によっては、腫瘍DNAは、平均で80%の塩基対が20個超のリードによって包含される、試料当たり平均8Gbのマッピングされた固有のリードを得るように配列決定される。場合によっては、一塩基バリアント(SNV)(例えばバフィーコート試料からの生殖細胞系列配列に対する)は、腫瘍試料から取得した配列データから選択され得る。場合によっては、患者特異的座位は、腫瘍配列決定から決定される、1個以上の変異リードと10個以上の総リードとに関するSNVを表示する座位である。場合によっては、座位は、生殖細胞系列配列(例えばバフィーコート試料)において(リード重複排除後に)1個の順方向(F)非参照リードと1個の逆方向(R)非参照リードとを示す場合、排除され得る。任意選択で、座位は、共通のSNPデータベース、例えば1000Genomesデータベースにおいて同定されたSNPである場合、排除され得る。
配列リードデータは、例えば、cfDNA試料もしくはライブラリを配列決定することによって、または既に生成されている配列決定データを取得するかもしくは用意する、例えば配列リードデータを不揮発性もしくは揮発性コンピュータメモリ、データストア、もしくはネットワークの場所から回収することによって、直接用意または取得され得る。配列リードが試料を配列決定することによって取得される場合、入力DNAの質量中央値は、場合によっては1~100ng、例えば2~50ngまたは3~10ngの範囲であり得る。DNAは、例えば100~1000ngのDNAを有するライブラリを取得するために増幅され得る。各患者特異的座位における配列リード(例えば品質フィルター処理された配列リード)の配列決定深度中央値は、500x~2000x、例えば750x~1500xまたはさらには1200x~1400xの範囲であり得る。配列リードはFASTQ等の好適なデータ形式であり得る。
配列リードデータ、例えばFASTQファイルは、リードファミリーへのリードコラプシングのステップの前にまたはそのステップの一部として、1つまたは複数の処理または整理ステップに供され得る。例えば、配列データファイルは、FastQC v0.11.5の場合、アダプター配列を取り除くツール(例えばcutadapt v1.9.1)から選択される1つまたは複数のツールを使用して処理され得る。配列リード(例えばトリミングした配列リード)は適切な参照ゲノム、例えば、ヒトゲノムhg19に対してアラインメントされ得る。
(i)2個超の変異分子を有する座位を排除すること、および
(ii)順(F)方向と逆(R)方向の両方において配列決定された断片のみを選択すること(すなわち含めること)
のうちの一方または両方を含み得る。
場合によっては、各患者特異的座位の両側(例えば両側の20、15、10、または5bp)の領域は、各変異クラスに関するエラー率を決定するために用いられ得る。場合によっては、非参照塩基は、順方向Fリードと逆方向Rリードの両方に存在すると見出される場合にのみ受容される。場合によっては、座位が3つ以上の別個のライブラリにおいてエラー抑制された変異ファミリーを表示する場合、その座位は、より高い座位特異的エラー率を有することを根拠にフィルター除去(「ブラックリストに登録」)され得る。
本発明の一部の実施形態においては、特定の患者特異的座位に関するバリアントリードは、観察されたバリアント(例えばSNV)がその座位の腫瘍配列において決定された変異と合致する場合にのみ受容され得る。例えば、C>T変異が腫瘍配列決定/遺伝子型同定に基づいて予期されたが、C>Aが変異リードにおいて観察される場合、変異リードは対象から外され得、患者特異的シグナルから排除され得る。代替的にまたは付加的に、座位は、少なくとも1つ以上のFリードファミリーと少なくとも1つ以上のRリードファミリーとがその位置に存在する場合にのみシグナルに寄与すると考えられ得る。このことは2つの利点:配列決定からの一本鎖アーチファクトを低減すること、およびある特定の配列決定プラットフォーム、例えばPE150配列決定においてFリードとRリードとの間により大きな重なりを有する短い断片に検出を偏らせることを有する。
式中、
AFコンテキストは所与の(例えばトリヌクレオチド)コンテキストのアレル頻度であり、腫瘍AFは腫瘍から直接取得したDNAを配列決定することによって決定される座位のアレル頻度であり、MRD様座位は、患者の腫瘍から決定され、微小残存病変シグナルを選択するためにフィルタリングされた変異含有座位である。
本発明の一部の実施形態では、各試料は、その座位において腫瘍配列決定から予期された変異クラスに基づいて複数の変異クラス(例えば以下のSNVクラス:C>G、G>C、T>G、A>C、C>A、G>T、T>C、A>G、T>A、A>T、C>T、およびT>Cのうちの2、3、4、5、6、7、8、9、10、11、または12個全て)に分割され得る。バリアントリードは上記のように各クラスに関して統合され得る。複数回のフィッシャーの片側正確確率検定は、観察された変異リードファミリーの数の有意性を、その変異クラスに関するバックグラウンドエラー率を考慮して決定するために使用され得る。この方法は、試料当たり12個のP値を生成することができ、これらのP値は次いで経験的なブラウンの方法を使用して組み合わされ得る。試料がクラスにおけるデータを有しなかった場合、そのクラスは0個の変異リード、したがって1のP値を有すると扱われ得る。
INVARによって取得した組み合わせたP値に関する有意性閾値は、場合によっては、患者特異的(試験)および非患者特異的(対照)試料に関する受信者操作特性分析を使用して決定され得る。例えば、分析は、分類確度を最大化する「MaxEfficiency」法を有するRでのOptimalCutpointsパッケージを用いてもよい。
場合によっては、バックグラウンドエラー率は観察されたアレル割合から減算され得る。このことは、クラスごとのエラー率の差を考慮に入れて実施することも、考慮に入れずに実施することもできる。観察された変異アレル割合がバックグラウンドエラー率よりも小さい場合、バックグラウンド減算アレル割合は0に設定され得る。試料に関する変異クラスごとのバックグラウンド減算の場合、クラスのそれぞれのエラー率は、そのクラスの変異アレル割合から減算され得る。次いで平均アレル割合が、そのクラスにおいて観察されたリードファミリーの総数によって加重された、個々のバックグラウンド減算アレル割合のそれぞれから算出され得る。
[実施例]
材料および方法
試料およびデータ収集
最大30mgの各新鮮凍結組織生検試料を600μLのRLT緩衝液(QIAGEN)と組み合わせ、次いでPrecellys CD14チューブ(Bertin Technologies)に入れ、5秒で区切られた2回の20秒のバーストの間6,500rpmで均質化した。次いでDNAを、AllPrep抽出キット(Qiagen)を製造業者のプロトコルに従って使用して抽出した。
CT撮像を標準治療の一部として各患者に関して獲得し、後ろ向きに検査した。スライス厚は全ての症例において5mmであった。約5mmを超える非常に大きな直径を有する全ての病変は、熟練した操作者によって、放射線科医の指導の下、MATLAB(登録商標)(Mathworks、Natick、MA)で書かれたカスタムソフトウェアを使用してCT画像上でスライスごとに輪郭抽出された。その後、輪郭を処理のためにNifTI形式でLIFExソフトウェアアプリケーション25にインポートした。次いで腫瘍体積をLIFExによって、テクスチャに基づく処理モジュールからの出力パラメータとして報告した。
各試料のcfDNA濃度を定量するために、デジタルPCRを、それぞれROXおよびFAMで標識した、ハウスキーピング遺伝子RPP30(Sigma Aldrich)および固有のXenT座位に関するTaq-manプローブを使用するBiomark HD(Fluidigm)を使用して実行した。55のPCRサイクルを使用した。RPP30アッセイは65bp長であった。溶出液1μL当たりの推定された数のRPP30 DNAコピーを使用して、元の試料におけるcfDNA濃度を決定した。
腫瘍およびバフィーコート(生殖細胞系列)ライブラリ調製、配列決定、ならびにバリアント呼び出しを、SureSelectXT Human All Exon 50Mb(Agilent)ベイトセットまたはカスタム標的化配列決定ベイトセットを使用して、Varelaら26によって記載されているように実施した。プール当たり8つの試料を多重化し、各プールをHiSeq 2000(Illumina)の2つのレーンに装填し、平均で80%の塩基対が20個超のリードによって包含されている、試料当たり平均8Gbのマッピングされた固有のリードを得た。標的化配列決定を、癌に関連する365の遺伝子に関するSanger CGP Cancer Genes V3パネルを使用して、これまでに記載されているように27実行した。この探索的分析に関して、腫瘍配列決定からの全ての変異コールをTAPASパネル設計に含めた(結果を参照のこと)。座位は、バフィーコート試料において(リード重複排除後に)1個の順方向(F)非参照リードと1個の逆方向(R)非参照リードとを示した場合、排除した。
10名の患者からのTAPASライブラリを、Rubicon ThruPLEX Tag-seqキットを使用して2連で調製した。血漿DNAライブラリに関する入力質量中央値は4.4ngであった(IQR 3.2~10.0ng)。分子バーコード化されたライブラリと分子バーコード化されていないライブラリとの間でエラー率を比較するために、追加の血漿ライブラリを、Rubicon ThruPLEX Plasma-seqキットを使用して調製した。必要な場合、cfDNA試料を、ライブラリ調製前にSpeedVac(ThemoFisher)を使用して30℃で真空濃縮した。
FastQC v0.11.5を全てのFASTQファイルに関して実行し、次いでcutadapt v1.9.1を使用して、アダプター配列の別個のFASTAにおいて指定された既知の5’および3’アダプター配列を取り除いた。トリミングしたFASTQファイルを、19のシード長を用いるBWA-mem v0.7.13を使用してhg19ゲノムに対してアラインメントした。重複を、Picardtools v2.2.4 MarkDuplicatesを使用してマーキングした。BAMファイルのインデックスを、Samtools v1.3.1を使用して作成した。既知の挿入欠失に関する局所再アラインメント、および塩基品質再較正を、GATK v3.7を使用して実行した。次に、ENCODEコンソーシアムによって同定された、高いレベルの配列決定ノイズを有することを根拠に対象から外される領域(「ブラックリスト登録領域」としても公知)をBAMファイルから取り除いた。
エラー抑制を、ThruPLEX Tag-seqライブラリBAMファイルに関して、断片開始および終了位置、ならびにカスタムインライン分子バーコードに基づいて複製配列決定リード間のコンセンサス配列を生成するConnor30を使用して実行した。エラー率対保持されたデータの比率に関する分析後、コンセンサス頻度閾値-fを0.9として設定し、最小ファミリーサイズ閾値-sを5として設定し、これらの閾値未満のリードファミリーを廃棄した。ThruPLEX Plasma-seqライブラリもまた、同じ設定を有するConnorに関する、カスタムシェルスクリプトを使用した入力として使用した。このスクリプトは偽のバーコードおよびステムを各リードの適切な末端に付加し、CIGAR文字列を修飾する。
Samtools mpileup v1.3.1を患者特異的座位において使用して、生データおよびエラー抑制されたデータに関する変異および野生型リード/リードファミリーの数を決定した。以下の設定を使用した:-d 10000(最大深度閾値)、--ff UNMAP(マッピングされないリードを排除)、-q 13(最小Phredマッピング品質スコア)、-Q 13(最小Phred塩基品質スコア)、-x(重なりを無視する)、-f ucsc.hg19.fasta。VCF Parser31 v1.6 --splitを使用して複アレルコールを分離し、SnpSift extractFieldsを使用して目的のカラムを抽出した。エラー抑制されていないTAPASデータの分析に関して、最小で5個のリードが座位において必要とされ、エラー抑制されたデータに関する閾値は最小で1リードファミリー(5つのメンバーからなる)であった。個々のデータ点(すなわち単一試料における単一座位)は、Samtools mpileupによって決定されるその座位におけるマッピング品質/ストランドバイアス(MQSB)が0.01未満であった場合、フィルタリングした。
TAPASを患者の第1の血漿時点に適用して、全体がタイリングされた目的の遺伝子における、または腫瘍エクソーム配列決定単独から見落とされた場合がある患者特異的バリアントの両側のベイト領域におけるバリアントを呼び出した。Mutect2(GATK)を初回変異呼び出しのために使用し、hg19 COSMICデータベースVCF、dbSNPデータベースVCF、ベイトセットBEDファイル(耐性座位および目的の遺伝子を含む)に対して実行した。適合バフィーコートエクソームBAMを生殖細胞系列試料として使用した。
バックグラウンドエラー率を求めるために、TAPASデータからの標的外塩基を使用した。生殖細胞系列事象はバフィーコートのエクソーム配列決定に基づいて取り除くことができ、既知の腫瘍座位は排除することができるため、患者からの配列決定データをこの目的のために使用した。したがって、各患者特異的バリアントの両側10bpを使用して、SNVの各クラスに関するエラー率を決定した。本発明者らは、非参照塩基はFリードとRリードの両方に存在しなければならないと規定した。考えられるエラー率の生物学的汚染を回避するために、COSMICにおいて1個以上の重なり合う変異を有した場合、座位を排除した。加えて、エラー抑制後、各座位を、同じ患者に属する全ての試料において個々に評価し、座位が3つ以上の別個のライブラリにおいてエラー抑制された変異ファミリーを示した場合、さらなる分析の対象から外した。リードファミリー当たりのバックグラウンドエラー率が約6×10-5であると仮定すると、座位当たり平均で200のリードファミリーに関して、同じ個体からの3つ以上の試料(患者当たり中央値で6つの試料のうち)の単一座位において変異リードファミリーを偶然に観察する確率は、約1×10-12の二項確率となる。
ctDNAの検出を、患者特異的座位のみに関して実行した、すなわち、C>T変異が腫瘍遺伝子型同定に基づいて予期されたが、C>Aが観察された場合、変異リードは無視され、患者特異的シグナルに寄与しなかった。さらに、座位は、少なくとも1つ以上のFリードファミリーと少なくとも1つ以上のRリードファミリーとがその位置に存在する場合にのみシグナルに寄与すると考えられた。このことは2つの利点:配列決定からの一本鎖アーチファクトを低減すること、およびPE150配列決定を使用してFリードとRリードとの間により大きな重なりを有する短い断片に検出を偏らせることを有する。
エラー率の差がSNVクラス間で観察されたため、各試料を、その座位において腫瘍配列決定から予期された変異クラスに基づいて12に分割した。バリアントリードを上記のように各クラスに関して統合した。フィッシャーの片側正確確率検定を複数回使用して、観察された変異リードファミリーの数の有意性を、その変異クラスに関するバックグラウンドエラー率を考慮して決定した。これは、試料当たり12個のP値を生成し、これらのP値を次いで、フィッシャーの方法の延長であり、従属的なP値を組み合わせるために使用することができる16、経験的なブラウンの方法を使用して組み合わせた。試料がクラスにおけるデータを有しなかった場合、そのクラスは0個の変異リード、したがって1のP値を有すると扱った。この手法の特異度をさらに改善するために、2つ以上の別個のクラスにおいて変異リードを有する試料を必要とした。このことは、検出が異なる種類のエラープロセスの対象となる複数の座位に存在するシグナルに基づくことを保証するためのものであった。
全ての患者を、同じ配列決定パネルを用いて配列決定し、99.9%のバリアントが各患者個人のもの(すなわちその個体のみに固有のもの)であったため、他の全ての患者を使用してctDNA検出に関する偽陽性を決定し、したがってコホートに関するP値閾値を設定することができた。この手法は、実施された冗長配列決定(redundant sequencing)を活用し、各個体からの配列決定された複数の試料を利用して生殖細胞系列バリアントを排除する。したがって、TAPASデータを、各座位が患者の腫瘍において変異しているか否かに基づいて、患者特異的および非患者特異的に分割した。非患者特異的データは、有意性閾値を決定するために使用した。
3.7ngの添加希釈実験
血漿cfDNAを1名の健康な個体から取得し(Seralab)、変異cfDNAを高腫瘍負荷時点の1名の患者(MR1004;2,746の患者特異的変異)から取得した。溶出液のcfDNA濃度を、水を使用して均等にし、次いで患者の試料を健康なcfDNAによって1:5の比で段階希釈して、元のcfDNA溶出液の15,625倍最終希釈液を得た。ライブラリ調製を、全てのライブラリに関して3.7ngの入力でThruPLEX Plasma-seqキットを使用して2連で実行した。
6名の患者からの等質量の血漿cfDNAをプールして、総計9,636の患者特異的バリアントを有する仮想患者を作出した。血漿cfDNAのプールを11名の健康な個体から生成した(Seralab)。患者試料プールおよび健康なプールのcfDNA濃度を、水を使用して均等にし、次いで患者試料を健康なcfDNAによって1:10の比で段階希釈して、元の1倍プール試料の100,000倍希釈液を得た。ライブラリ調製を、ライブラリ当たり最大50ngの入力量でThruPLEX Tag-seqキットを用いて2連で実行した。エラー抑制を伴わないTAPASの検出の限界よりも大きい、予期されたアレル割合を有するライブラリの場合、ライブラリ調製への入力材料を減少させ、検出されることが確実である患者血漿DNAを節約した。
多様な数の変異を用いてINVAR-TAPASの検出の限界を試験するために、患者特異的混合物実験と全ての非患者特異的データの両方を50~5,000の間の変異にダウンサンプリングした。BRAFを、サンプリングした変異の各セットに常に含め、BRAFmut患者に関するパネル設計を模擬した。変異を100回繰り返しサンプリングし、ctDNAの検出を、INVARを使用して試験した。
変異アレル割合を百万分率まで正確に決定するために、バックグラウンドエラー率を観察されたアレル割合から減算した。これは、クラスごとのエラー率の差を考慮に入れて実施することも、考慮に入れずに実施することもできる。観察された変異アレル割合がバックグラウンドエラー率未満であった場合、バックグラウンド減算アレル割合は0に設定した。
ブラックリストに登録することによって取り除かれる(すなわち、上に記載したようにより高い座位特異的エラー率を有することを根拠にフィルター除去される)バリアントは、生物学的シグナルであることに関する証拠を示すことを根拠に以前に排除した。既知の変異であったバリアントに関して、このブラックリストから変異を呼び出すことを試みた。したがって、データを、既知のドライバー変異に関するCOSMICデータベースと交差させた(重なり合う変異の数≧5)。各変異座位に関して、その座位に関するバックグラウンドエラー率を、非患者特異的データ(すなわち腫瘍がその変異に関して陰性と遺伝子型同定された患者)を使用して決定した。フィッシャーの片側正確検定を使用して、試料における変異リードの数の有意性を、その試料における総深度、ならびにバックグラウンドにおける変異リードおよび総深度を考慮して検定した。P値閾値を0.05として設定し、ボンフェローニ法によって複数の仮説に関して補正した。個々の変異コールを、複数の一時的に分離した試料にわたって変異リードを集計することによって確認した。
腫瘍および血漿からの患者特異的変異の同定
患者の腫瘍において変異している定義された座位において高い配列決定深度を達成するために、テイラードハイブリッド捕捉配列決定パネルを、腫瘍生検の配列決定において同定された一塩基バリアント(SNV)に基づいて設計した。1個以上の変異リードおよび10個以上の総リードを有するSNVを、ベースライン転移生検のエクソーム配列決定(9名の患者)または標的化配列決定(1名の患者)から選択した。患者当たりの同定されたSNVの数の中央値は673であった(IQR 250~1,209;図7a)。患者特異的バリアントを決定した(示していない)。加えて、血漿における変異の新たな同定を可能にするために、以下の遺伝子のコード配列および非翻訳領域をパネル設計に含めた:ARID2、BRAF、CDKN2A、NF1、PTEN、およびTP53、ならびに黒色腫において一般的に変異している37の追加の遺伝子におけるホットスポット座位(示していない)。最終パネル設計は1.527Mbpを包含した。
バックグラウンドエラー率の特性解析
TAPAS配列決定データにおいてエラー抑制を伴うおよび伴わないバックグラウンドエラー率(すなわち予期されなかった変異塩基を観察する率)を求めることを試みた。患者特異的バリアントの両側の塩基は、患者特異的バリアントに匹敵する配列決定深度を有し、同じ技術的な偏りの対象となり得るため、これらを研究した。患者試料のこの標的外配列決定を活用するために、生殖細胞系列事象および潜在的な生物学的シグナルは、同じ個体からの試料において複数回生じた場合、排除し(方法)、これらの座位は、その後の新たな変異呼び出しのために一時的に除いた。
INtegration of VAriant Reads(INVAR)
厳密なレベルのエラー抑制(5の最小ファミリーサイズで、90%のファミリーメンバーにおいて必要とされるコンセンサス)を使用して、中央値で4.4ngの入力に関して、それぞれがその患者の癌において変異している座位を包含する、中央値で3.2×105のリードファミリーを各時点において取得した(IQR 8.7×104~6.2×105)。したがって、そのようなリードファミリーのそれぞれが単一の分子に対応するという仮定に基づくと、出発物質がわずか約1300コピーのゲノムを含有する場合であっても各試料に関して数十万の標的分子を調べることができたことになる。
INVAR-TAPASの感度分析
INVAR-TAPASの感度を評価するために、2,743の変異がTAPASパネルに包含される患者からの血漿DNAを使用して、ライブラリ当たり3.7ngでの添加希釈実験を2連で生成した。内在性バーコードを用いたエラー抑制を使用して、最初にリードを変異クラスに分割せずにINVARを適用し、1.9×10-6の予期された変異アレル割合を有する試料を検出した(図8)。したがって、百万分率単位(ppm)の検出を達成した。この同じ入力(およそ1,100の一倍体ゲノム)での完全な単一座位アッセイは、1000倍以上高い2.7×10-3の変異アレル割合の検出の限界(95%の感度)を有し得る。1.9ppmの予期された変異アレル割合を有した検出された試料は、27ppmの観察された変異アレル割合を有した。観察されたアレル割合はバックグラウンドエラー率(6ppm)と真のシグナルとから構成されるため、バックグラウンドエラー率を観察されたアレル割合から減算し、予期された変異アレル割合よりもおよそ10倍大きい22ppmの「バックグラウンド減算」アレル割合を得た。低いレベルの入力において、配列決定ノイズとサンプリングエラーの両方は正確な定量を依然として妨げ得る。
In silicoサイズ選択
リードの開始および終了位置を使用して断片サイズ分布を決定した。全ての血漿試料からのエラー抑制されたデータを組み合わせ、断片の分布を算出した(図4a)。各5bpのサイズ区間に関して、変異の割り前と野生型の割り前との比を決定した(図4b)。ctDNAに関するエンリッチメントを、ヌクレオソームDNAサイズ(166bpの倍数)よりも約20~30bp短い断片において観察した。エンリッチメントの大きさは、モノヌクレオソームピークよりもジヌクレオソームピークにおいて大きかった。1名の患者は変異トリヌクレオソームDNAに関する証拠を示した(図9)。以前のデータは、変異断片が野生型断片よりも短いことを実証しているが13、14、17、これらのデータは、変異DNAがモノ、ジ、およびトリヌクレオソームDNAよりも一貫して短いことを示す。
残存腫瘍体積の検出
コホートにわたって、ctDNA変異アレル割合を体積測定CT撮像データに対して比較し、これは0.67のピアソン相関を示し(P=0.0002;図5d)、以前に公開された研究に一致した6、8。1名の患者(MR1014)は、国際RECIST規準18によって測定不能であった低体積皮下転移を有したため、この比較から排除したが、依然としてctDNAに寄与し得る。患者MR1004の検出されなかった時点(図5a)に関する考えられる最大の変異アレル割合は、ポアソン分布および完全なアッセイに基づいて1個の変異分子をサンプリングする95%の確率を得るように調整された、その試料におけるリードファミリーの数の逆数を取ることによって、3.4ppmと推測した。
新たな変異検出
ctDNAレベルが十分に高い場合、耐性変異は新たに同定され得、クローン進化は変異のアレル割合の変化を通してモニタリングされ得る9。1名の患者(MR1022)からの一例を図6に示し、これは、COSMICデータベース19において5つ以上の発生を有した個々の変異に関するアレル割合(図6a)を、個々の腫瘍病変体積(図6b)および腫瘍病変位置(図6c)と共に示す。ホットスポット変異座位を試験することによって(方法)、上昇するNRAS Q61K変異は、総計2名の患者からの血漿試料において新たに有意に検出され、これらの変異は、これらの患者のベースライン腫瘍生検において同定されなかった。個々の変異呼び出しに関して、検出を、試料当たりを基準として実行した。低いレベルのシグナルおよび入力材料のコンテキストでは、一連の試料からのバリアントリードを統合することは、各試料が収集および配列決定されるにつれて、閾値未満のctDNAレベルを有する複数の試料を集計することを可能にすることによって、感度を増強し得る。
数千の腫瘍由来変異の多重化ディープ配列決定とINtegration of VAriant Readsとの組合せは、0.3ppmまでのctDNAを検出することを可能にした。cfDNA配列決定データからのエラー率および断片化パターンの特性解析を通して、本発明者らはcfDNAのハイブリッド捕捉配列決定に関するワークフローを最適化した。本研究では、各患者に関する数多くの変異を、ベースライン腫瘍生検のエクソームまたは標的化配列決定によって同定された全ての変異を使用することによって分析した。このことは、他の高感度増幅産物およびハイブリッド捕捉法6、8のために使用された入力量のおよそ10分の1の、ライブラリ調製への限定されたDNA入力量にもかかわらず、高感度分析を可能にした。エラー抑制を使用してバックグラウンド配列決定エラーを低減し、in silicoサイズ選択を使用して変異シグナルを増強した。各患者に関する既知の腫瘍変異と重なる大量の患者特異的リードを生成することによって、TAPASは、少ない入力量と、エラー抑制およびサイズ選択によって引き起こされたデータ喪失とを補償する一方で、非常に高感度な検出に十分な変異リードを依然として保持する。結果として、高い感度(百万分率未満)と高い特異度(99.5%超)の両方を達成した。
トリヌクレオチドコンテキストの使用
腫瘍配列決定
患者の腫瘍において変異している定義された座位において高い配列決定深度を達成するために、テイラード配列決定パネルを、ステージII~IVの黒色腫を有する48名の患者からの新鮮凍結またはFFPE腫瘍生検の配列決定において同定された一塩基バリアント(SNV)に基づいて設計した。変異呼び出しを全ての腫瘍生検に関して実施し、バリアントコールをフィルタリングして、患者の適合生殖細胞系列DNAにおける、共通のSNP部位、反復領域、およびシグナルを有する座位を排除した(方法)。
本発明者らは、2の最小ファミリーサイズ閾値を有するエラー抑制されたデータを使用して、ハイブリッド捕捉配列決定からの血漿におけるバックグラウンドエラー率がトリヌクレオチドコンテキスト間で変動することを見出した(図13)。トリヌクレオチドコンテキストの使用は、コンテキストにわたるリードファミリーの集計により、1000万分の1までのバックグラウンドエラー率の決定を可能にするが、座位当たりのレベルに関する同じ確度のバックグラウンドエラー推定を達成することは、莫大な数の試料が配列決定されることを必要とし得る。トリヌクレオチドコンテキストの使用は、エラー抑制後のリードファミリーの最大限の保持を可能にするが(図2a)、100倍以上にまたがる広範囲のエラー率を有する。
ctDNAレベルが低い場合、多くの患者特異的座位はその位置に変異DNA断片を有することができない。したがって、サンプリングエラーを克服するために、全ての患者特異的リードファミリーを、INVARを使用して集計し、同時に分析した。各試料に関して、変異リードファミリーおよび総リードファミリーをトリヌクレオチドコンテキストごとに集計し、比率:
黒色腫に関するUV由来ジヌクレオチド変異の活用
皮膚黒色腫における高い変異率はほとんど完全に、UV誘導変異の特性であるシチジンからチミジンへの(C>T)転位の存在量を原因とすることができる(Hodisら、2012年)。本発明者らは、この変異シグネチャを本発明者らのデータにおいて確認する(図11)。C>T転位に関して、10の変異のうちの1つはCC>TTであり(Brash、2015年)、これは本発明者らのデータにおいてCCまたはGGを含有するコンテキストにおける変異の存在量と一致する(図11)。
INVAR-微小残存病変(MRD)シグナルの統合
残存疾患の検出のためにINVARを最適化するために、添加希釈系列を、患者のcfDNAと健康な個体のcfDNAとの混合物を使用して生成し、最低希釈倍率において生じるシグナルを特性解析した。この実験に関して、6名の患者からのcfDNAをプールして、総計9,636の患者特異的変異を有する理論的患者を創出した。次いで、このプールを健康な個体のDNAに段階希釈した(方法)。
INVAR腫瘍アレル割合加重
ctDNAが高い時点の血漿における変異の出現を評価した。腫瘍エクソームAFと血漿AFとの間に相関を見出した(図16)。したがって、血漿において所与の変異を観察する尤度は腫瘍AFに比例する。このことは、Jamal-Hanjaniら(2016年)によって実行された研究と一致する。
エクソーム配列決定データへのINVARの適用
次に、INVARをエクソーム配列決定データに適用して、非個別的配列決定データへのINVARの一般化可能性を実証した。血漿エクソーム配列決定を、ステージIVの疾患を有する患者からの試料のサブセットに関して実行した。
非標的化INVAR
個々の座位を呼び出すことと対照的なトリヌクレオチドコンテキストにわたるシグナルの集計は、INVARがアプリオリな腫瘍知識を伴わない血漿配列決定データに潜在的に一般化されることを可能にする。このことは、腫瘍配列決定が利用可能でない患者における適用可能性を有し得るが、その代価は、真の変異シグナルに決して寄与し得ない座位の存在量に起因する、より低い感度、およびctDNAレベルを定量する低下した能力であると予期され得る。
数千の変異した座位にわたるINtegration of VAriant Readsによる、低負荷癌におけるctDNAの百万分率までのモニタリング
患者コホート。試料を、MelResist(REC11/NE/0312)、AVAST-M(REC07/Q1606/15、ISRCTN81261306)30、およびLUCID(REC14/WM/1072)研究に登録された患者から収集した。研究に参加することへの同意は、調査に関して十分に訓練を受けたリサーチナース/専門看護師または臨床医によって得られた。MelResistは、ステージIVの黒色腫を有する患者におけるBRAF標的化療法および免疫療法を含む黒色腫の全身療法に対する応答および耐性機構の橋渡し研究である。AVAST-Mは、外科的処置後の再燃のリスクがあるステージIIB~IIIの黒色腫を有する患者におけるベバシズマブの有効性を評価した無作為化対照臨床試験であり、観察群からの患者のみをこの分析のために選択した。LUCIDは、治癒的目的で根治処置(外科的処置または放射線療法+/-化学療法)を受けることを予定しているステージI~IIIBの非小細胞肺癌患者(NSCLC)の前向きおよび観察研究である。Cambridge Cancer Trials Unit-Cancer Themeが全ての研究を統括し、患者背景および臨床成績を前向きに収集した。図41はこの研究を経験する患者の流れをREMARK図として示す。
1.バフィーコート変異アレル割合が0に等しい
2.変異が相同領域に存在しない
3.変異が複アレル座位に存在しない
4.1000Genomes ALLおよびEUR頻度が0に等しい
5.最小固有腫瘍深度が5。
加えて、黒色腫コホートにおけるFFPEデータに関して、Costelloら32によって提唱されたC/Aエラーに関するフィルターを適用してC/Aアーチファクトを抑制した。結果として、ステージII~IVの黒色腫およびステージI~IIIAの肺癌を有する64名の患者に関する患者特異的変異リストを生成した。黒色腫および肺癌を有する患者当たりそれぞれ中央値で625(IQR 411~1076)および388(IQR 230~600)の患者特異的変異を同定した(図31)。これらの変異リストは、カスタム捕捉配列決定パネルを設計するためにも、INVAR方法に関する入力としても使用した。
循環腫瘍DNA(ctDNA)は、複数のコピーが存在する場合は血漿において堅牢に検出することができるが、試料が数コピーの腫瘍DNAを有する場合は、個々の変異座位の分析が、アッセイが完全な分析性能を有する場合であっても、サンプリングノイズのために結果として偽陰性となる可能性がある(図23a)。血漿における低量のctDNAは、サンプリングの限定のために入力材料がほとんど存在しない場合、または初期癌を有する患者1、もしくは処置を受けている全てのステージの患者1、2等、より大量の血漿が存在するが、血漿において非常に低い腫瘍負荷が存在する場合に生じ得る(図29)。配列決定エラーは検出をさらに限定し得る。感度を改善するために、複数の研究は、複数の血液チューブからのより大容量の血漿を分析した3、4、および/または18~507の遺伝子(2kb~2Mbのゲノム)を包含する配列決定パネルを使用した。最大32の患者特異的変異(組織分析を介して予め同定された)の血漿における分析は、非小細胞肺癌(NSCLC)を有する患者において25,000コピー当たり1個の変異分子のレベルまでの検出を達成した5。ctDNAは、ステージIのNSCLCを有する患者の50%未満において6、7、および肺腺癌腫症例のわずか19%において6検出された。外科的処置を受けて後に再燃した初期患者では、ctDNAは、およそ50%の乳癌または結腸直腸癌患者4、8、ただしわずか15%の黒色腫患者9において外科的処置後に検出された。しかしながら、感度は原則として、より低量のctDNAを検出するために、分析される変異の数を増加させることによってさらに増加させることができる。
入力(hGA)または分析される変異のいずれかを増加させることによって有益なリードの数を増加することは、サンプリングエラーを解決する。高いIRにおける偽陽性検出の尤度を低下させるために、バックグラウンドエラーはIRの逆数未満でなければならない。INVARワークフロー(図24a)の一部として、内在性または外在性固有分子識別子14(UMI)に基づいてリードコラプシングすること、順方向リードと逆方向リードの両方によって支持されないシグナルを排除すること、異なる変異コンテキストに関するエラー率を評価する特注のエラーモデルを使用すること、その試料における残りの患者特異的変異シグナルの分布と一致しない座位における外れ値ノイズを抑制すること、すなわち「外れ値抑制」によって、バックグラウンドエラー率を低下させた(図32~34、補足的方法)。このことは、結果として異なるトリヌクレオチドコンテキストにわたって平均して131分の1に低下したバックグラウンドエラー率をもたらした(図24b、図24c)。
INVARの分析性能を、2名の健康な対照ボランティアからの血漿に、3.6×10-7と低い予期されたIMAFまで希釈され、2連で分析された、エクソーム配列決定によって5,073の変異を同定した(補足的方法)1名の黒色腫患者(ステージIV)からの血漿の希釈系列において、カスタム捕捉パネルからの配列決定の分析によって評価した。エラー抑制を用いない場合、0.85超の分析的特異度で検出された最低希釈倍率(方法)は、3.6×10-5の予期されたctDNA濃度を有した。この濃度において、2/2の複製物は4.7×10-5の平均IMAFで検出された(図24e)。エラー抑制およびサイズ加重後、1つを除く全ての試料は0.95超の分析的特異度で検出された。3.6×10-6(3.6百万分率、ppm)の予期されたIMAFまで希釈された両方の複製物は、4.3および5.2ppmのIMAF値で検出された。予期された3.6×10-7まで希釈された3つの複製物のうち、2つは3.9ppmおよび1.3ppmの測定されたIMAF値で検出された(それぞれ3.16×106および2.44×106個のIRを有した)。第3の試料は低いIR(370,381)を有し、変異リードは観察されず、多くのIRが低いctDNA濃度を検出するために必要であることを強調した。対照的に、検出の限界の近くに数個の変異リードで検出されたctDNA(例えば上記の例)は、成功バイアスに起因して人工的に増大されたIMAFを示す場合がある。
INVARを、47名のステージII~IVの黒色腫患者由来の125の血漿試料、および19名のステージI~IIIAのNSCLC患者由来の19の血漿試料からカスタム捕捉パネルを使用して生成された配列決定データに適用した。黒色腫を有する患者当たり中央値で625の変異、およびステージI~IIIAのNSCLCを有する患者当たり中央値で388の変異を分析し、結果として試料当たり最大2.9×106個のIR(中央値1.7×105個のIR)を生じ、したがって個々のまたはより少ない座位を分析する方法と比べて桁違いに多い無細胞DNA断片を分析した(図25a)。同じ入力DNAおよび配列決定データを使用した場合、最も高い深度を有する20の変異座位の分析は、結果としてほぼ全ての試料に関して20,000個未満のIRを生じ得たが、大きな変異リストの使用は大半の試料に関して20,000から106個のIRを生成した(図25b)。
ctDNAを検出し、IMAF値によって示されるそのレベルを定量したところ、2.5×10-6~0.25の範囲であった(図25dおよび25e)。これは10万倍の動的範囲、およびゲノムの1638コピーの入力材料中央値(5.46ngのDNA)からの、癌患者由来の血漿試料における微小レベルのctDNAの数ppm範囲までの検出を確認した(図26a)。144の分析された血漿試料のうち総計17において、ctDNAは、その患者の腫瘍のために変異していることが既知である座位の1%未満においてシグナルと共に検出され、これらの試料が単一の腫瘍細胞のごく小さな割合のゲノムを含有することを示した(図26b)。検出された変異の最低割合は1/714であり、5フェムトグラム未満の腫瘍DNAと等価であった。限定された入力であることを考慮すると、検出された低いctDNAレベルは、48%の症例において完全な単一座位アッセイに関する95%の検出の限界未満であり得る(図26b、図37a)。
新しく診断されたステージI~IIIAのNSCLCを有する19名の患者(ステージI/II/IIIAを有するそれぞれ11名、6名、および2名の患者からなる)から処置前に収集した血漿試料において、INVARによるctDNA検出を試験した。2つの試料では、ctDNAは検出されなかったが、適合組織のWESにおいて同定された少数の変異(各症例において59および93)のため、20,000個未満のIRを分析した(図25d)。これらの2名の患者を排除した場合(図25cを参照のこと)、有益なリードの数の中央値は7.2×104であった(IQR 3.9~10.3×104)。ctDNAは、17名の患者のうち12名において検出され(0.98超の分析的特異度、図36)(図26a、図26c)、1/5名のステージIAを有する患者、4/5名のステージIBを有する患者、5/5名のステージIIを有する患者、および2/2名のステージIII疾患を有する患者を含んだ(図38aおよび38b)。10名のステージIAおよびIB患者のうちの9名は腺癌腫の組織学的亜型を有し、これは他の方法を使用して検出することがこれまで困難であった6。コホートにわたって、ROC分析を、INVARによって生成された尤度比に適用し(補足的方法)、ステージIのみ、ステージI~IIIA、およびステージII~IIIAのみに関してそれぞれ0.73、0.82、および0.93の曲線下面積(AUC)値を得た(図26d)。0.003%の感度に達しなかった患者を排除した場合(66,666個未満のIR、図25d)、ctDNAは、14の試料のうち12において検出され、1/2名のステージIAを有する患者、4/5名のステージIBを有する患者、5/5名のステージIIを有する患者、および2/2名のステージIII疾患を有する患者を含んだ。
INVARを残存疾患環境において試験するために、治癒的目的の外科的処置の最大6か月後に収集した、UK AVAST-M臨床試験において募集された切除されたステージII~IIIの黒色腫を有する38名の患者からの試料を分析した(図38c)。中央値で3.6×105個のIR(IQR 0.64×105~4.03×105)を探査し、ctDNAを2.85ppmの最小IMAFまで検出した(0.98超の分析的特異度、図36)。5名の患者は未検出のctDNAおよび20,000個未満のIRを有し、排除した(図25d)。33名の評価可能な患者のうち、ctDNAは、50%の後に再発した患者において検出され、有意により短い無疾患期間(4.5か月対5年の追跡期間で中央値未到達;ハザード比(HR)=3.69;95%CI 1.44~9.46、P=0.007;図26d)および全生存期間(2.6年対中央値未到達、図38d)と関連した。同じ臨床試験からの切除されたBRAFまたはNRAS変異黒色腫を有する161名の患者からの血漿DNAの単一座位デジタルPCRアッセイを使用する以前の分析では、ctDNAは15.6%の後に再燃した患者のみにおいて検出された9。
臨床試料からのIMAF値を使用して、限定された数のIRを有する患者の異なるコホートに関する予期された検出率を推定し、線形モデルを適合させて(R2=0.95)、異なる検出率を達成するために必要とされ得るIRを予測した。ベースライン時点におけるステージIVの黒色腫患者では、ctDNAは105個のIRを使用して、100%の症例において検出された(図26e)。ctDNAレベルがより低い、処置を受けているステージIVの黒色腫を有する患者では、線形適合からの外挿は、106~107個のIRがほぼ全ての試料においてctDNAの検出を可能にし得ることを予測した(図38e)。初期NSCLCを有する患者では、本発明者らは、107個のIRを各試料に関して配列決定した場合、ほぼ全ての患者においてctDNAを検出することが可能であり得ることを示唆する。試料当たり107個超のIRに到達することは、配列決定費用、必要とされる入力DNAの量、および標的化される必要がある変異の数の全ての点で限定的となる。外科的処置を受けたステージII~IIIの黒色腫患者に関して、本発明者らのデータは結果として、107個のIRの分析でさえも、66.7%の再燃し得る患者のみにおいて外科的処置の6か月以内のctDNAの検出を生じ得ることを示唆する(図26e)。
患者特異的捕捉パネルは、より低い配列決定費用で患者特異的変異リストのディープ配列決定を可能にするが、時間のかかるステップを追加する。本発明者らは、INVARは、全エクソームまたはゲノム配列決定等の標準化されたワークフローに適用された場合であっても、有益なリードを集計することによって増加した感度を達成するために活用することができると仮説を立てた。これは、腫瘍-正常材料の配列決定を血漿配列決定に並行して生じさせることができ、結果として生じる腫瘍-正常データは、血漿無細胞DNAから生成された配列決定データに関するINVAR分析のために使用することができる(図27a)。
次に本発明者らは、ゲノムにわたって変異リードを統合することによって、ctDNAが、乾燥血斑(50μLの容量を有する、血液の単一の液滴)から抽出した数コピーのゲノムから生成された限定された配列決定データから検出することができると仮説を立てた。リアルタイムPCRはこれまで、母体乾燥血斑を使用して胎児RHD遺伝子型同定およびHIV検出を実行するために使用されてきたが20、21、血斑からの無細胞DNAのNGSはこれまで記載されていない。無細胞DNA配列決定ライブラリを血斑から生成することは、存在する少ない数の無細胞DNAコピーのため、および血液細胞によって放出された多量の長いゲノムDNA(gDNA)断片のために困難を伴う(図40a)。ctDNAが血斑から検出することができるか否かを決定するために、存在する限定された無細胞DNA分子から配列決定ライブラリを生成するワークフローを開発した(方法)。汚染gDNA断片を取り除くために、黒色腫を有する患者から収集した乾燥血斑から抽出したDNAにサイズ選択を適用した。次に、このサイズ選択されたDNAから配列決定ライブラリを生成し、sWGSを使用して複数のコピー数変化を明らかにし(図28a)、このコピー数変化は伝統的な方法によって単離された同じ患者からの適合血漿試料において見出されたコピー数変化と一致した(図40b)。INVARをこのデータに適用した場合、ctDNAは、配列決定データの6つのhGAから0.039のIMAFで検出された。統計的方法であるSPECIES22を使用して、配列決定ライブラリにおける一倍体ゲノムの総数を10hGAと推定し(図40c、補足的方法)、これはこのライブラリからより大きい配列決定深度で到達し得る。したがって、これは、乾燥血斑における小部分の癌細胞の単一ゲノムと等価のctDNAの検出を実証した。
INtegration of VAriant Readsは、サンプリングノイズの内在する限定を克服して、患者の腫瘍において同定された複数の変異にわたってシグナルを組み合わせることによって、1コピーよりはるかに少ない癌ゲノムを含有する試料におけるctDNAを検出する方法を提供する(図23)。本発明者らは、102~104の変異した座位にわたってシグナルを集計することによって、0.01コピー未満の癌ゲノムが、以前の研究3、5よりも10~100倍以上少ない、血漿における数百万分率の無細胞DNAを表す場合であっても、これを検出することができることを示した。このレベルの感度は、数多くの変異を標的として有益なリード(IR)の数を最大化することによってのみ達成することができるが、入力質量をこの程度まで増加することは、実際には実行可能ではないと考えられる(図23b)。腫瘍配列決定から取得される変異の数は、癌の種類および配列決定の範囲に依存する。この方法のこの第1の適用において、本発明者らは、エクソーム配列決定を使用して癌変異を同定し、いくつかの症例では、少ない有益なリードのために試料を分析から排除しなければならなかった。試料を少なくとも0.01%の感度で評価することによって、67%の外科的処置前のステージI~IIのNSCLC患者においてctDNAを検出した。これは、より厳密なIR閾値を使用した場合、83%まで増加し、事実上、0.003%(30ppm)の最小感度を必要とした。外科的処置後、ctDNAは、50%の後に再燃したステージII~IIIの黒色腫を有する患者において6か月以内に検出された。この所見は、患者が初回の処置の何年も後に再燃し得る臨床環境25における、外科的処置後のctDNAの検出に関する課題を反映する。追加の変異および入力材料によるIRのさらなる増加は、微小残存病変の検出に関するctDNAの感度をさらに押し上げ得る(図27e)。
1. Bettegowda, C. et al. Detection of circulating tumor DNA in early- and late-stage human malignancies. Sci. Transl. Med. 6, 224ra24 (2014).
2. Wan, J. C. M. et al. Liquid biopsies come of age: towards implementation of circulating tumour DNA. Nat Rev Cancer 17, 223-238 (2017).
3. Cohen, J. D. et al. Detection and localization of surgically resectable cancers with a multi-analyte blood test. Science (80-.). (2018).
4. Tie, J. et al. Circulating tumor DNA analysis detects minimal residual disease and predicts recurrence in patients with stage II colon cancer. Sci. Transl. Med. 8, 346ra92 (2016).
5. Newman, A. M. et al. Integrated digital error suppression for improved detection of circulating tumor DNA. Nat Biotechnol 34, 547-55 (2016).
6. Abbosh, C. et al. Phylogenetic ctDNA analysis depicts early-stage lung cancer evolution. Nature 545, 446-451 (2017).
7. Abbosh, C., Birkbak, N. J. & Swanton, C. Early stage NSCLC - challenges to implementing ctDNA-based screening and MRD detection. Nature Reviews Clinical Oncology 1-10 (2018). doi:10.1038/s41571-018-0058-3
8. Garcia-Murillas, I. et al. Mutation tracking in circulating tumor DNA predicts relapse in early breast cancer. Sci. Transl. Med. 7, (2015).
9. Lee, R. J. et al. Circulating tumor DNA predicts survival in patients with resected high risk stage II/III melanoma. (2017). doi:10.1093/annonc/mdx717/4589598
10. Phallen, J. et al. Direct detection of early-stage cancers using circulating tumor DNA. Sci. Transl. Med. 9, (2017).
11. De Vlaminck, I. et al. Circulating cell-free DNA enables noninvasive diagnosis of heart transplant rejection. Sci. Transl. Med. 6, 241ra77 (2014).
12. Forshew, T. et al. Noninvasive Identification and Monitoring of Cancer Mutations by Targeted Deep Sequencing of Plasma DNA. Sci. Transl. Med. 4, 136ra68-136ra68 (2012).
13. Murtaza, M. et al. Multifocal clonal evolution characterized using circulating tumour DNA in a case of metastatic breast cancer. Nat. Commun. 6, 8760 (2015).
14. Kinde, I., Wu, J., Papadopoulos, N., Kinzler, K. W. & Vogelstein, B. Detection and quantification of rare mutations with massively parallel sequencing. Proc. Natl. Acad. Sci. U. S. A. 108, 9530-5 (2011).
15. Jamal-Hanjani, M. et al. Detection of ubiquitous and heterogeneous mutations in cell-free DNA from patients with early-stage non-small-cell lung cancer. Ann. Oncol. 27, 862-867 (2016).
16. Mouliere, F. et al. High Fragmentation Characterizes Tumour-Derived Circulating DNA. PLoS One 6, e23418 (2011).
17. Underhill, H. R. et al. Fragment Length of Circulating Tumor DNA. PLoS Genet. 12, 426-37 (2016).
18. Mouliere, F. et al. Enhanced detection of circulating tumor DNA by fragment size analysis. Sci. Transl. Med. 4921, 1-14 (2018).
19. Newman, A. M. et al. An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage. Nat. Med. 20, 548-54 (2014).
20. Xiong, Y., Jeronis, S., Hoffman, B., Liebermann, D. A. & Geifman-Holtzman, O. First trimester noninvasive fetal RHD genotyping using maternal dried blood spots. Prenat. Diagn. 37, 311-317 (2017).
21. Luo, W., Yang, H., Rathbun, K., Pau, C. P. & Ou, C. Y. Detection of human immunodeficiency virus type 1 DNA in dried blood spots by a duplex real-time PCR assay. J. Clin. Microbiol. 43, 1851-1857 (2005).
22. Wang, J.-P. SPECIES: An R Package for Species Richness Estimation. J. Stat. Softw. 40, 1-15 (2011).
23. Rago, C. et al. Serial Assessment of Human Tumor Burdens in Mice by the Analysis of Circulating DNA. Cancer Res. 67, 9364-9370 (2007).
24. Lawrence, M. S. et al. Mutational heterogeneity in cancer and the search for new cancer-associated genes. Nature 499, 214-218 (2013).
25. Corrie, P. G. et al. Adjuvant bevacizumab for melanoma patients at high risk of recurrence: survival analysis of the AVAST-M trial. Ann. Oncol. 29, 1843-1852 (2018).
26. Chan, K. C. A. et al. Analysis of Plasma Epstein-Barr Virus DNA to Screen for Nasopharyngeal Cancer. N. Engl. J. Med. 377, 513-522 (2017).
27. Jiang, P. et al. Preferred end coordinates and somatic variants as signatures of circulating tumor DNA associated with hepatocellular carcinoma. Proc. Natl. Acad. Sci. U. S. A. 201814616 (2018). doi:10.1073/pnas.1814616115
28. Adalsteinsson, V. A. et al. Scalable whole-exome sequencing of cell-free DNA reveals high concordance with metastatic tumors. Nat. Commun. 8, 1324 (2017).
29. Belic, J. et al. Rapid Identification of Plasma DNA Samples with Increased ctDNA Levels by a Modified FAST-SeqS Approach. Clin. Chem. 61, 838-849 (2015).
30. Corrie, P. G. et al. Adjuvant bevacizumab in patients with melanoma at high risk of recurrence (AVAST-M): Preplanned interim results from a multicentre, open-label, randomised controlled phase 3 study. Lancet Oncol. 15, 620-630 (2014).
31. Varela, I. et al. Exome sequencing identifies frequent mutation of the SWI / SNF complex gene PBRM1 in renal carcinoma. Nature 469, 539-542 (2011).
32. Costello, M. et al. Discovery and characterization of artifactual mutations in deep coverage targeted capture sequencing data due to oxidative DNA damage during sample preparation. Nucleic Acids Res. 41, 1-12 (2013).
33. Rubicon Genomics. Targeted Capture of ThruPLEX(登録商標) Libraries with Agilent SureSelect(登録商標)XT Target Enrichment System. at <rubicongenomics.com/wp-content/uploads/2016/11/RDM-152-002-SureSelectXT.pdf>
34. University of Michigan. Connor - METHODS. (2016). at <https://github.com/umich-brcf-bioinf/Connor/blob/master/doc/METHODS.rst>
35. Schwarzenbach, H., Hoon, D. S. B. & Pantel, K. Cell-free nucleic acids as biomarkers in cancer patients. Nat. Rev. Cancer 11, 426-437 (2011).
36. Beckman Coulter. SPRIselect User Guide. Beckman 1-30 (2012).
37. Nioche, C. et al. A freeware for tumor heterogeneity characterization in PET, SPECT, CT, MRI and US to accelerate advances in radiomics. J. Nucl. Med. 58, 1316 (2017).
INVARパイプラインの概要
INVARパイプラインは、エラー抑制されたBAMファイル、患者特異的座位に関するBEDファイル、ならびに各変異の腫瘍アレル割合およびその変異がどの患者に属するかを示すCSVファイルを得る。INVARパイプラインはクラスタを実行するSlurmに関して最適化される。ワークフローを図30に示す。簡潔に述べると、パイプラインは、野生型および変異リードを全ての試料の患者特異的座位において評価し、このデータに、トリヌクレオチドエラー率、座位エラー率、変異がどの患者に属するか、腫瘍アレル割合、断片サイズ、FリードとRリードの両方における存在、およびその座位におけるシグナルがその試料における他の全ての患者特異的座位に比して外れ値であるか否か、を注釈付けする。データ注釈付け後、シグナルをその試料における全ての患者特異的座位にわたって集計して、尤度比を生成し、さらにそれを使用して特異度を定義する。統合変異アレル割合(IMAF)は別個に算出する。
SAMtools mpileup1.3.1を、変異に関するBEDファイルに基づいて患者特異的座位に、以下の設定:--ff UNMAP、-q 40(マッピング品質)、-Q 20(塩基品質)、-x、--d 10,000で使用し、次いで複アレルコールを、BCFtools1.3.1を使用して分割した。次に、全てのTSVファイルに、1,000Genomes SNPデータ、COSMICデータ、およびトリヌクレオチドコンテキストを、カスタムPythonスクリプトを使用して注釈付けした。次いで、出力ファイルを連結し、圧縮し、Rに読み込んだ。最初に、腫瘍配列決定データからの事前知識に基づいて、患者当たりの全ての座位に、患者特異的(患者の腫瘍に存在)または非患者特異的(患者の腫瘍に存在しないか、もしくは個体が癌を有しない)のいずれかであるかを注釈付けした。各非患者特異的試料は複数の患者からの座位を含有するため、あらゆる非患者特異的試料は、同じ配列決定パネルまたは方法(個体間で共有される座位を排除する)を用いて分析される他の全ての患者と照合することができる。
以下のフィルターを、座位あたりを基準としてINVARデータに適用した:
1. MQSB<0.01(マッピング品質/ストランドバイアス)の場合、座位を排除した。
2. 複アレル座位を同定し、3つの異なる代替アレルがエラー抑制されたリードファミリーを有するデータセットにおいて観察された場合、ブラックリストに登録した。データセットにおいて観察された2つの別個の代替アレルを有する座位は、重要でない代替アレルのエラー抑制されたリードが3個以上存在する場合にのみ排除した。
3. 10%超の非患者特異的(患者対照)試料において変異シグナルを示した、または1%超の座位当たり平均変異アレル割合を示した座位をブラックリストに登録した。このフィルターを用いてブラックリストに登録された座位の比率は0.21%~3.53%の範囲であった(図33)。99.8%の変異が各患者個人のものであったため、患者試料を使用して、座位当たりのノイズ(患者試料に所属しなかった座位における)を特性解析することができる。
4. 変異シグナルは、そのリード対のFリードとRリードの両方において表されなければならなかった(図33)。このことは、配列決定エラーを低減することに役立ち、断片に関するサイズ選択を引き起こして、PE150配列決定を実施した場合に300bp未満の断片を保持する(FリードおよびRリードの重なり合う領域における変異シグナルのみが保持され得る)。結果として生じるエラー抑制は、ペアエンドリードを結合するツール1と同様である。
データフィルタリング後、データに座位ノイズフィルターとトリヌクレオチドエラー率の両方を注釈付けした。座位ノイズフィルターはその座位における対照試料およびcfDNA分子の数によって限定されるため、トリヌクレオチドエラー率も評価した。トリヌクレオチドエラー率は、あらゆる患者特異的座位の両側最大10bpの領域(患者特異的座位それ自体を排除する)から決定し、データはトリヌクレオチドコンテキストごとにプールした。この方法においてデータをプールした後、トリヌクレオチドコンテキスト当たり中央値で3.0×108個の有益なリード(または重複排除リード)を分析した。トリヌクレオチドエラー率を、各特異的変異コンテキストに関する非適合率として算出した。トリヌクレオチドコンテキストが変異重複排除リードを有しなかった場合、エラー率はそのコンテキストにおけるIR/重複排除リードの数の逆数に設定した。
患者特異的配列決定データは、複数の既知の患者特異的座位における有益なリードからなり、エラー抑制の手段として座位にわたる変異アレル割合を比較する機会を提供する。座位にわたるシグナルの分布は、全体のシグナル分布と一致しないノイズを含む座位の同定を潜在的に可能にする。各座位を、全ての座位にわたる平均シグナルを考慮した、観察された変異リードを有する確率に関して試験した(図34)。残りの座位よりも有意に大きなシグナルを有すると観察された座位は、その座位におけるノイズ、汚染、または誤って遺伝子型同定されたSNP座位に起因すると考えられ得る。誤って遺伝子型同定されたSNPの可能性は、数多くの変異座位がINVARによって標的化される場合ますます高くなる。各試料に関して、IMAFを、INVAR前データ処理フィルターを通過した、その座位において0.25未満の変異アレル割合を有する全ての座位にわたって決定した。0.25超の変異アレル割合のシグナルを有する座位は、(i)残存疾患環境において、座位はそのような高い変異アレル割合を有すると予期され得ない(誤って遺伝子型同定されたSNPでない限り)ため、および(ii)試料の真のIMAFが0.25超である場合に数多くの座位が試験される場合、座位は、シグナルを有する多くの低アレル割合座位を有することによって検出が支持されるようなアレル割合の分布を示すことができるため、算出に含めなかった。
本発明者らは、複数の患者特異的座位における変異リードの数をモデル化する統計的方法であって、患者特異的配列決定から入手可能な事前情報、例えばトリヌクレオチドコンテキストのバックグラウンドエラー、座位における腫瘍アレル割合、および断片長を組み込む、統計的方法を開発した。この手法は、エラー抑制後の複数の患者特異的変異にわたってシグナルを集計する。各座位に関して、そのコンテキストのトリヌクレオチドエラー率を考慮して変異リードの数の有意性を検定する。トリヌクレオチドエラー率を、座位特異的エラー率の代わりに使用して、バックグラウンドエラー率のより正確な推定を10-7まで決定した(図24c)。
qi=AFi・(1-ei)・p+(1-AFi)・ei・p+ei・(1-p) (1)
で生じる。ここで、ctDNAの存在を検定することは、統計的仮説H0:p=0を検定することと等価である。観察された変異リードの数は座位間で独立であると仮定して、以下の尤度関数:
他の患者を使用して、非共有座位において互いに照合した(図23c)。同じ配列決定パネル(すなわち同じカスタム配列決定パネル設計)に関して、同じエラー抑制設定を用いて実行され、同じ変異リストを標的とする試料のみを使用して互いに照合した。
26名の健康な個体の血漿からのcfDNAを、ステージIVの黒色腫カスタム捕捉パネルおよびステージI~IIIAのNSCLCカスタム捕捉パネルを使用して分析した。これらの試料は、「患者」試料として扱い、したがってパイプラインにおけるフィルターに対する影響を有せず、LR閾値の決定に関して使用しなかった。LR閾値の決定(上に記載したように)後、健康な個体の試料からのLRをctDNAの偽陽性検出に関して評価した。これらのコホートのそれぞれに関して、健康な個体における臨床的特異度の値を決定した(図36)。
この節では、期待値最大化(EM)アルゴリズムを導いて、INVAR法の一部としてのpを推定する。起源の腫瘍zijを潜在変数として扱い、それが既知であると仮定する場合、Z、M(mijは座位iのリードjにおける変異に関する指示記号である)、L(lijは座位jのリードiの長さである)、AF(AFiは座位iにおける腫瘍アレル割合である)、e(eiは座位iのコンテキストにおけるバックグラウンドエラーである)の結合尤度は:
INVARを用いたサイズ加重は、加重を実施するための変異および野生型リードのサイズの既知の分布を最初に有することに依存する。リード長分布を最大の確度で推定するために、そのコホートにおける全ての試料からの全ての野生型および変異リードを使用し、試験された1つの試料を省き、カーネル密度推定を使用してそれぞれの確率を平滑化した。
試料に関する有益なリード(IR)の数は、標的化された変異の数(すなわち変異リストの長さ)と配列決定によって分析された一倍体ゲノム(hGA)の数(リードコラプシング後の重複排除カバレッジと等価)との積である。したがって、あらゆる試料に関する検出の限界は、1/IRに基づいて(二項確率に基づいた、変異分子をサンプリングすることに関する調整を含む)算出することができる。検出されなかった試料の場合、1/IRの値はその試料におけるctDNAの上限の推定値を提供し、これは、変異分子が存在しない場合であっても試料の定量を可能にし、図27dにおいて、sWGSデータを使用して約10-4までの上側信頼限界を定義するために利用される。また、限定された感度を有する試料は、INVAR法がIRの数によって限定される「低感度」または「非評価可能」群として同定および分類することができる(図25)。本研究では、他の方法よりも大きい感度でctDNAを定量することを目的とし、20,000個未満のIRを有する、検出されなかったctDNAを有する試料を低感度、したがって非評価可能と分類した。本研究におけるコホートにわたって、6名の患者がこれらの規準で非評価可能であった。
複数の変異座位にわたってctDNAを定量するために、「統合変異アレル割合」を以下のように算出した:
a)試料における各トリヌクレオチドコンテキストに関して、全ての患者特異的座位にわたる重複排除深度加重平均アレル割合を算出した
b)対照データにおけるトリヌクレオチドコンテキスト当たりのバックグラウンドエラー率を、(a)において算出した平均アレル割合から減算した。減算後に負の変異アレル割合を有するトリヌクレオチドコンテキストは0に設定した。
(c)各トリヌクレオチドコンテキストにおける重複排除深度によって加重された、トリヌクレオチドコンテキストにわたる平均バックグラウンド減算アレル割合を取った。
総計5,073の患者特異的バリアントを有する1名の患者からの血漿DNAを、11名の健康な個体からの血漿cfDNA(Seralab)のプールに各ステップ10倍で段階希釈して、1~100,000倍にまたがる希釈系列を得た。ライブラリ調製を、方法に記載されているように、希釈液当たり50ngの入力を用いて実施した。希釈系列における、感度を評価するのに十分に多い数の分子を探査するために、最低希釈倍率(100,000倍)を3連で生成した。健康対照cfDNAプールを、座位エラー率の決定のための対照試料として含め、潜在的SNP座位を同定および排除した(図24e)。腫瘍アレル割合と血漿変異出現との関係を考慮すると(図35b)、INVARのための任意のより小さなパネルは、最も高い優先度を有するクローン変異に基づき、より低いアレル割合は、血漿配列決定データが十分に広範である場合にのみ含めるべきである。したがって、希釈系列配列決定ライブラリのそれぞれから復元抽出を用いてデータを繰り返しサンプリングし(50回の繰り返し)、次いで上位N個の変異(1から5,000の変異にまたがる)を選択した。最も高い変異アレル割合を有する座位はBRAF V600E変異であった。座位の数をダウンサンプリングした後、外れ値抑制を、単一BRAF V600E座位データを除くすべての試料に関して反復した。
検出された試料のIMAFに基づいて、より少ないIRが完全に高感度なアッセイを用いて達成された場合の検出率を推定することができる。所与の数のIR(r)に関して、ctDNAに関する95%の検出の限界(p)は以下:
1. Zhang, J., Kobert, K., Flouri, T. & Stamatakis, A. PEAR: A fast and accurate Illumina Paired-End reAd mergeR. Bioinformatics 30, 614-620 (2014).
2. Fan, H. C., Blumenfeld, Y. J., Chitkara, U., Hudgins, L. & Quake, S. R. Analysis of the size distributions of fetal and maternal cell-free DNA by paired-end sequencing. Clin. Chem. 56, 1279-1286 (2010).
3. Lopez-Raton, M., Rodriguez-Alvarez, M. X., Suarez, C. C. & Sampedro, F. G. OptimalCutpoints: An R Package for Selecting Optimal Cutpoints in Diagnostic Tests. J. Stat. Softw. 61, 1-36 (2014).
4. University of Michigan. Connor - METHODS. (2016). at <https://github.com/umich-brcf-bioinf/Connor/blob/master/doc/METHODS.rst>
5. Forshew, T. et al. Noninvasive Identification and Monitoring of Cancer Mutations by Targeted Deep Sequencing of Plasma DNA. Sci. Transl. Med. 4, 136ra68-136ra68 (2012).
6. Newman, A. M. et al. An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage. Nat. Med. 20, 548-54 (2014).
7. Abbosh, C. et al. Phylogenetic ctDNA analysis depicts early stage lung cancer evolution. Nature 22364, 1-25 (2017).
8. Wang, J.-P. SPECIES: An R Package for Species Richness Estimation. J. Stat. Softw. 40, 1-15 (2011).
さらなる癌の種類へのINVARの適用
下記に概略を述べる全てのコホートに関して、ctDNA検出のために0.1のINVARスコア閾値を適用した。その閾値未満の試料は不検出(ND)として示す。0.1未満のINVARスコアおよび20,000個未満の総IRを有する試料は評価不能と分類した(プロットに示していない)。
総計90の試料を、INVARを用いて分析した。4例は、十分な有益なリードを生じなかったため、「評価不能」と分類した(示していない)。残りの86の試料のうち、60の試料においてctDNAが検出され、70%の総検出率を得た。現在、本発明者らはこれらの患者のステージについて依然として盲検化されているが、コホートは60%がステージIの患者である初期患者(33%がステージIA、および27%がステージIB)に大いに偏る。
INVARを39の血漿試料に適用し、そのうちの7つは評価不能であった(示していない)。残りの32の試料のうち、22は0.1超のINVARスコアに達した(69%)。INVARを尿試料にも適用した。分析した23の試料のうち、6つは評価不能であった(示していない)。残りの17の試料のうち、6つは0.1超のINVARスコアに達した(35%)。試料は異なる疾患亜型から由来する。
尿試料を外科的処置前に収集した(平均8.6、外科的処置の0~35日前の範囲)。同じ尿試料から、下に記載するように、尿上清(USN)と尿細胞ペレット(UCP)の両方を単離した。
膠芽腫患者における血漿および脳脊髄液(CSF)のINVARを使用した検出。CSF試料において、2つの試料は、不十分な数の有益なリードのため分析から排除した(示していない)。残りの6つ全ての試料は、0.1超のINVARスコアで検出された。血漿において、12の試料のうち11はこのINVAR閾値に達した(92%)。
腰椎穿刺を、腫瘍減量のための開頭術の直前に実施した。滅菌野調製後、硬膜嚢に、0.61mmゲージの腰椎穿刺針を使用してL3とL5の間の椎間空間でカニューレを挿入し、10mlのCSFを採った。収集後、CSF試料を直ちに氷上に置き、次いで処理のために事前に冷却した遠心分離機に急速に移した。試料を1500g、4Cで10分間遠心分離し、上清を取り除き、20,000gで10分間さらに遠心分離し、-80Cでの保管のために2mLマイクロチューブ(Sarstedt、Germany)に等分した。
INVARを乳癌試料に適用した。35の試料のうち34は0.1以上のINVARスコアに達し、検出と分類した(97%)。本研究における腫瘍変異をエクソン領域のみではなくゲノム全体にわたって同定した。試料を7名の患者から経時的に採取し、時間経過にわたるctDNA濃度の増減は処置に対する応答を表す可能性が高い。
1. Wan JCM, Massie C, Garcia-Corbacho J, et al. Liquid biopsies come of age: towards implementation of circulating tumour DNA. Nat Rev Cancer 2017;17:223-38.
2. Siravegna G, Marsoni S, Siena S, Bardelli A. Integrating liquid biopsies into the management of cancer. Nat Rev Clin Oncol 2017;
3. Bettegowda C, Sausen M, Leary RJ, et al. Detection of circulating tumor DNA in early- and late-stage human malignancies. Sci Transl Med 2014;6(224):224ra24.
4. Diehl F, Li M, Dressman D, et al. Detection and quantification of mutations in the plasma of patients with colorectal tumors. Proc Natl Acad Sci U S A 2005;102(45):16368-73.
5. Forshew T, Murtaza M, Parkinson C, et al. Noninvasive Identification and Monitoring of Cancer Mutations by Targeted Deep Sequencing of Plasma DNA. Sci Transl Med 2012;4(136):136ra68-136ra68.
6. Abbosh C, Birkbak NJ, Wilson GA, et al. Phylogenetic ctDNA analysis depicts early stage lung cancer evolution. Nature 2017;22364:1-25.
7. Newman AM, Lovejoy AF, Klass DM, et al. Integrated digital error suppression for improved detection of circulating tumor DNA. Nat Biotechnol 2016;34(5):547-55.
8. Newman AM, Bratman S V, To J, et al. An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage. Nat Med 2014;20(5):548-54.
9. Murtaza M, Dawson S-J, Tsui DWY, et al. Non-invasive analysis of acquired resistance to cancer therapy by sequencing of plasma DNA. Nature 2013;497(7447):108-12.
10. Hodis E, Watson IR, Kryukov G V., et al. A Landscape of Driver Mutations in Melanoma. Cell 2013;150(2):251-63.
11. Kinde I, Wu J, Papadopoulos N, Kinzler KW, Vogelstein B. Detection and quantification of rare mutations with massively parallel sequencing. Proc Natl Acad Sci 2011;108(23):9530-5.
12. Hoang ML, Kinde I, Tomasetti C, et al. Genome-wide quantification of rare somatic mutations in normal human tissues using massively parallel sequencing. Proc Natl Acad Sci 2016;113(35):9846-51.
13. Underhill HR, Kitzman JO, Hellwig S, et al. Fragment Length of Circulating Tumor DNA. PLOS Genet 2016;12(7):426-37.
14. Mouliere F, Rosenfeld N. Circulating tumor-derived DNA is shorter than somatic DNA in plasma. Proc Natl Acad Sci 2015;112(11):201501321.
15. Thierry AR, Mouliere F, Gongora C, et al. Origin and quantification of circulating DNA in mice with human colorectal cancer xenografts. Nucleic Acids Res 2010;38(18):6159-75.
16. Poole W, Gibbs DL, Shmulevich I, Bernard B, Knijnenburg TA. Combining dependent P-values with an empirical adaptation of Brown’s method. Bioinformatics 2016;32(17):i430-6.
17. Mouliere F, Piskorz AM, Chandrananda D, et al. Selecting Short DNA Fragments In Plasma Improves Detection Of Circulating Tumour DNA. bioRxiv 2017;
18. Eisenhauer EA, Therasse P, Bogaerts J, et al. New response evaluation criteria in solid tumours: Revised RECIST guideline (version 1.1). Eur J Cancer 2009;45(2):228-47.
19. Forbes SA, Beare D, Gunasekaran P, et al. COSMIC: Exploring the world’s knowledge of somatic mutations in human cancer. Nucleic Acids Res 2015;43(D1):D805-11.
20. Jiang P, Chan CWM, Chan KCA, et al. Lengthening and shortening of plasma DNA in hepatocellular carcinoma patients. Proc Natl Acad Sci 2015;112(11):E1317-25.
21. Jiang P, Lo YMD. The Long and Short of Circulating Cell-Free DNA and the Ins and Outs of Molecular Diagnostics. Trends Genet 2016;32(6):360-71.
22. Fan HC, Blumenfeld YJ, Chitkara U, Hudgins L, Quake SR. Analysis of the size distributions of fetal and maternal cell-free DNA by paired-end sequencing. Clin Chem 2010;56(8):1279-86.
23. Chan KCA, Zhang J, Hui ABY, et al. Size Distributions of Maternal and Fetal DNA in Maternal Plasma. Clin Chem 2004;50(1):88-92.
24. Alexandrov LB, Jones PH, Wedge DC, Sale JE, Peter J. Clock-like mutational processes in human somatic cells. Nat Publ Gr 2015;47(12):1402-7.
25. Nioche C, Orlhac F, Boughdad S, et al. A freeware for tumor heterogeneity characterization in PET, SPECT, CT, MRI and US to accelerate advances in radiomics. J Nucl Med 2017;58(supplement 1):1316.
26. Varela I, Tarpey P, Raine K, et al. Exome sequencing identifies frequent mutation of the SWI / SNF complex gene PBRM1 in renal carcinoma. Nature 2011;469(7331):539-42.
27. Manson-Bahr D, Ball R, Gundem G, et al. Mutation detection in formalin-fixed prostate cancer biopsies taken at the time of diagnosis using next-generation DNA sequencing. J Clin Pathol 2015;68(3):212-7.
28. Rubicon Genomics. ThruPLEX(登録商標) Tag-seq Kit Instruction Manual [インターネット]. 2016;Available from: http://rubicongenomics.com/wp-content/uploads/2016/08/QAM-328-001-ThruPLEX-Tag-seq-Kit-Instruction-Manual.pdf
29. Rubicon Genomics. Targeted Capture of ThruPLEX(登録商標) Libraries with Agilent SureSelect(登録商標)XT Target Enrichment System [インターネット]. Available from: rubicongenomics.com/wp-content/uploads/2016/11/RDM-152-002-SureSelectXT.pdf
30. University of Michigan. Connor - METHODS [インターネット]. 2016 [2017 Mar 27引用];Available from: https://github.com/umich-brcf-bioinf/Connor/blob/master/doc/METHODS.rst
31. moonso. VCF Parser [インターネット]. [2016 2017 May 8,引用];Available from: https://github.com/moonso/vcf_parser
Brash DE. UV Signature Mutations. Photochemistry and photobiology. 2015;91(1):15-26. doi:10.1111/php.12377.
Hodis E, Watson IR, Kryukov GV, et al. A Landscape of Driver Mutations in Melanoma. Cell. 2012;150(2):251-263. doi:10.1016/j.cell.2012.06.024.
Jamal-Hanjani GA et al. Detection of ubiquitous and heterogeneous mutations in cell-free DNA from patients with early-stage non-small-cell lung cancer, Annals of Oncology, Volume 27, Issue 5, 1 May 2016, Pages 862-867, https://doi.org/10.1093/annonc/mdw037
Shyr C, Tarailo-Graovac M, Gottlieb M, Lee JJ, van Karnebeek C, Wasserman WW. FLAGS, frequently mutated genes in public exomes. BMC Medical Genomics. 2014;7:64. doi:10.1186/s12920-014-0064-y.
Claims (15)
- 患者から取得したDNA含有試料における、バリアント無細胞DNA(cfDNA)を検出するためのコンピュータ実装方法であって、
(a)前記患者の腫瘍を表す少なくとも2つの座位(「標的特異的座位」)を含むリストを用意するステップであって、それぞれの前記座位における少なくとも1つの塩基が、前記バリアント無細胞DNAと、対応するバックグラウンドのポリヌクレオチド配列との間で異なる、ステップと、
(b)前記患者由来の無細胞DNA含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを用意するステップであり、前記配列リードが前記ステップ(a)の前記少なくとも2つの標的特異的座位にまたがる、ステップと、
(c)前記少なくとも2つの標的特異的座位にわたるバリアントアレル割合を算出するステップであり、前記バリアントアレル割合が式(1):
に従ってバリアントリードおよび総リードを集計することによって算出される、ステップと、
(d)前記試料を
(i)前記バリアントアレル割合がバックグラウンド配列決定エラー率よりも大きいか、もしくは統計的に有意に大きいと見出される場合、バリアントcfDNAを含有する、または
(ii)前記バリアントアレル割合が前記バックグラウンド配列決定エラー率よりも大きいと見出されず、統計的に有意に大きいとも見出されない場合、バリアントcfDNAを含有してもなく、未知のバリアントcfDNAのステータスを有してもいない
と分類するステップと
を含む、コンピュータ実装方法。 - 患者から取得したDNA含有試料における、バリアント無細胞DNA(cfDNA)を検出するためのコンピュータ実装方法であって、
(a)前記患者の腫瘍を表す少なくとも2つの座位(「標的特異的座位」)を含むリストを用意するステップであって、それぞれの前記座位における少なくとも1つの塩基が、前記バリアント無細胞DNAと、対応するバックグラウンドのポリヌクレオチド配列との間で異なる、ステップと、
(b)前記患者由来の無細胞DNA含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを用意するステップであり、前記配列リードが前記ステップ(a)の前記少なくとも2つの標的特異的座位にまたがる、ステップと、
(c)リードコラプシングを実施して前記配列リードをリードファミリーにグループ化するステップと、
(d)前記少なくとも2つの標的特異的座位にわたるバリアントアレル割合を算出するステップであり、前記バリアントアレル割合が次式(2):
(e)前記試料を
(i)前記バリアントアレル割合がバックグラウンド配列決定エラー率よりも大きいか、もしくは統計的に有意に大きいと見出される場合、バリアントcfDNAを含有する、または
(ii)前記バリアントアレル割合が前記バックグラウンド配列決定エラー率よりも大きいと見出されず、統計的に有意に大きいとも見出されない場合、バリアントcfDNAを含有してもなく、未知のバリアントcfDNAのステータスを有してもいない
と分類するステップと
を含み、
前記リードコラプシングを実施する前記ステップが、
(i)2個より多いバリアント分子を有する座位を排除すること、および
(ii)順(F)方向と逆(R)方向との両方において配列決定された断片のみを選択すること、
のうちの少なくとも1つの微小残存病変(MRD)フィルターを適用することをさらに含み、
前記バリアントアレル割合を算出するステップ(d)では、前記式(2)中、アレル頻度は、所与のコンテキストに対して算出され、腫瘍AFは前記腫瘍から直接取得したDNAを配列決定することによって決定される前記座位のアレル頻度であり、前記バリアントリードは、MRD様座位である標的特異的座位におけるバリアントリードであり、前記総リードはMRD様座位である標的特異的座位における総リードであり、MRD様座位は、前記患者の前記腫瘍から決定され、その後前記MRDフィルターが適用された変異含有座位である、
コンピュータ実装方法。 - 前記バリアントアレル割合に関する統計的有意性の計算が、前記試料からのバリアントリードの数、前記試料からのリードの総数、および前記バックグラウンド配列決定エラー率から予期されたバリアントリードの数を含む分割表を考慮して、フィッシャーの片側正確確率検定を実行することを含む、及び/又は、
前記方法は、変異シグナルが前記試料における標的特異的変異シグナルの残りの分布と一致しない標的特異的座位を同定することで、外れ値ノイズを抑制するステップを含み、及び/又は、
前記試料におけるバリアントcfDNA存在の尤度が、一般化尤度比:
- 前記バックグラウンド配列決定エラー率が、前記少なくとも2つの標的特異的座位において表される塩基置換の各クラス(「変異クラス」)について決定されており、
前記バリアントアレル割合を算出するステップにおける前記バリアントアレル割合算出が各変異クラスに関して実施され、
前記バリアントアレル割合の統計的有意性計算が、各変異クラスに関する統計的有意性を、該変異クラスの前記バックグラウンド配列決定エラー率を考慮に入れて計算すること、および計算した各変異クラスの前記統計的有意性を組み合わせて、前記試料の前記バリアントアレル割合に関する統計的有意性の尺度を得ることを含む、
請求項1から3のいずれか1項に記載の方法。 - 前記バリアントアレル割合の統計的有意性計算が、フィッシャーの片側正確確率検定を複数回実行して、観察されたバリアントリードの数の統計的有意性を、該変異クラスに関するバックグラウンド配列決定エラー率を考慮して決定し、それにより各変異クラスに関してp値を生成し、フィッシャーの方法の延長であり、従属的なp値を組み合わせるために使用することができる、経験的なブラウンの方法を使用して前記p値を組み合わせて、前記試料の前記バリアントアレル割合に関する統計的有意性の尺度を得ることを含み、及び/又は、
前記変異クラスが、以下の変異クラス:C>G、G>C、T>G、A>C、C>A、G>T、T>C、A>G、T>A、A>T、C>T、およびT>Cのうちの少なくとも5個を含む、請求項4に記載の方法。 - 前記ステップ(b)において取得される配列リードを含む前記配列データが、テイラードパネル配列決定(TAPAS)配列リード、焦点化エクソーム配列リード、全エクソーム配列リード、または全ゲノム配列リードを表し、及び/又は、
前記ステップ(b)において用意される配列リードを含む前記配列データが、前記患者由来の無細胞の液体試料からの複数のDNA断片の配列リードを表し、及び/又は、
前記患者が健康であるかもしくは疾患を有する、および/または前記患者がヒトもしくは非ヒト動物であり、および/または前記患者が異種移植されたヒト腫瘍組織を有する前記非ヒト動物である、請求項1から5のいずれか一項に記載の方法。 - 前記バリアント無細胞DNAが、循環腫瘍DNAであり、前記標的特異的座位は、前記患者の腫瘍を表す変異含有座位であり、前記患者の腫瘍を表す前記少なくとも2つの変異含有座位が、前記患者由来の腫瘍試料から直接取得したDNAを配列決定するか、または前記患者由来の液体の試料から取得したDNAを配列決定することによって取得されている、請求項1から6のいずれか一項に記載の方法。
- 前記ステップ(b)において取得される配列リードを含む前記配列データが、前記患者が前記腫瘍の一連の処置を開始した後および/または前記患者が前記腫瘍の外科的切除を行った後に前記患者から取得した試料からの複数のポリヌクレオチド断片の配列リードを表し、及び/又は、
前記患者が、黒色腫、肺癌、膀胱癌、食道癌、結腸直腸癌、卵巣癌、脳癌、および/または乳癌を有するかまたは有していたことがあり、及び/又は、
前記配列リードが、115~160bp、115~190bp、250~400bp、および440~460bpのサイズ範囲内のリードにin silicoでサイズ選択され、ctDNAを表すリードをエンリッチし、及び/又は、前記方法は、プロセッサが、前記試料が前記バリアントcfDNAを含有すると分類した場合に、前記患者において癌が存在すると決定し、前記バリアントアレル割合が第1の時点から第2の時点までに増加している場合に、前記患者において前記癌が成長していると決定し、前記バリアントアレル割合が第1の時点から第2の時点までに減少している場合に、前記患者において前記癌が退縮していると決定し、または、前記試料が前記バリアントcfDNAを含有すると分類した場合に、前記患者において前記癌が再発したと決定するステップを含む、請求項7に記載の方法。 - 前記方法が、さらに、前記バリアントアレル割合を算出するステップの前に、リードコラプシングを実施して前記配列リードをリードファミリーにグループ化するステップを含み、または、
前記方法が、さらに、前記バリアントアレル割合を算出するステップの前に、リードコラプシングを実施して前記配列リードをリードファミリーにグループ化するステップを含み、
前記リードコラプシングの前記ステップが、断片開始および終了位置、ならびに少なくとも1つの分子バーコードに基づいて、リードをリードファミリーにグループ化することを含み、
全てのファミリーメンバー間で最低でも60%のコンセンサスが必要とされ、
2つの最小ファミリーサイズが必要とされる、請求項1に記載の方法。 - 前記リードコラプシングを実施する前記ステップが、
(i)2個より多いバリアント分子を有する座位を排除すること、および
(ii)順(F)方向と逆(R)方向との両方において配列決定された断片のみを選択すること、
のうちの少なくとも1つの微小残存病変(MRD)フィルターを適用することをさらに含む、請求項9に記載の方法。 - (i)前記コンテキストがトリヌクレオチドコンテキストであり、最も有意なp値を有する6つのトリヌクレオチドコンテキストのみが組み合わされ、及び/又は、
n個の最も有意なトリヌクレオチドコンテキストp値が、式:
式中、n=1、2、3、4、5、6、8、10、または12であり、及び/又は、
(ii)
全体アレル割合が、式:
- 前記試料の分析が、異なる断片サイズのDNAを分けるサイズ選択ステップを含み、前記サイズ選択ステップが配列決定ライブラリ調製前または配列決定ライブラリ調製後に実行され、及び/又は、前記サイズ選択ステップが、gDNA断片のビーズに基づいた捕捉を用いる右側サイズ選択であり、及び/又は、
分析される前記試料が、200bp超のゲノムDNA(gDNA)断片が分析前にフィルター除去されるか、枯渇されるか、または取り除かれるサイズ選択ステップに供されて、サイズ選択された試料を生成する、請求項1から11のいずれか一項に記載の方法。 - 前記患者から取得した前記試料が、
(i)1つ未満の腫瘍由来一倍体ゲノムを含む有限容量試料である、または前記試料からの配列決定データが20未満の一倍体ゲノムの配列決定カバレッジを表し、及び/又は、(ii)500μl未満の血液、血清、または血漿試料、
穿刺吸引(FNA)、
リンパ節生検、
尿、脳脊髄液、喀痰、気管支洗浄液、子宮頸部スメア、または細胞学的試料、
前記患者からの収集時から1年超保管された試料、および
以前に処理されており、DNAもしくは配列決定品質に関する品質測定基準を満たしていない試料、または1組の試料に属する試料であり、前記1組の試料からの他の試料が、以前に処理されており、DNAもしくは配列決定品質に関する品質測定基準を満たしていない、試料、
からなる群から選択される有限容量試料であり、及び/又は、
(iii)乾燥血斑試料、
穿刺血液試料、又は、
前記患者からの収集後1日超保管された、500μl未満である保存血液、血清、または血漿試料
である、請求項1から12のいずれか一項に記載の方法。 - 患者から取得したDNA含有試料におけるバリアント無細胞DNA(cfDNA)を検出するためのシステムであって、
少なくとも1つのプロセッサ、ならびに
前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサに、請求項1から11のいずれか一項又は請求項13に記載の方法を実行させる命令を含有する少なくとも1つの非一時的コンピュータ可読媒体
を含む、システム。 - 患者から取得したDNA含有試料におけるバリアント無細胞DNA(cfDNA)を検出するための非一時的コンピュータ可読媒体であって、少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサに、請求項1から11のいずれか一項又は請求項13に記載の方法を実行させる命令を含む、非一時的コンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB1803596.4A GB201803596D0 (en) | 2018-03-06 | 2018-03-06 | Improvements in variant detection |
GB1803596.4 | 2018-03-06 | ||
GB1819134.6 | 2018-11-23 | ||
GBGB1819134.6A GB201819134D0 (en) | 2018-11-23 | 2018-11-23 | Improvements in variant detection |
PCT/EP2019/055610 WO2019170773A1 (en) | 2018-03-06 | 2019-03-06 | Improvements in variant detection |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021516962A JP2021516962A (ja) | 2021-07-15 |
JPWO2019170773A5 JPWO2019170773A5 (ja) | 2022-03-15 |
JP7523353B2 true JP7523353B2 (ja) | 2024-07-26 |
Family
ID=65685355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020546469A Active JP7523353B2 (ja) | 2018-03-06 | 2019-03-06 | バリアント検出の改善 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20200402613A1 (ja) |
EP (1) | EP3762512A1 (ja) |
JP (1) | JP7523353B2 (ja) |
CN (1) | CN112020563A (ja) |
AU (1) | AU2019229606A1 (ja) |
CA (1) | CA3093092A1 (ja) |
WO (1) | WO2019170773A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018208856A1 (en) | 2017-05-08 | 2018-11-15 | Gritstone Oncology, Inc. | Alphavirus neoantigen vectors |
EP3976075A4 (en) | 2019-05-30 | 2023-08-16 | Gritstone bio, Inc. | MODIFIED ADENOVIRUS |
WO2021092231A1 (en) * | 2019-11-06 | 2021-05-14 | Chan Zuckerberg Biohub, Inc. | User interface and backend system for pathogen analysis |
CN111048152B (zh) * | 2019-11-26 | 2022-04-01 | 深圳市人民医院 | 评价cfDNA检测对胶质瘤治疗疗效的实验方法 |
CN113053460A (zh) * | 2019-12-27 | 2021-06-29 | 分子健康有限责任公司 | 用于基因组和基因分析的系统和方法 |
EP4087940A4 (en) * | 2020-01-10 | 2024-04-10 | Gritstone bio, Inc. | CELLULAR DNA MONITORING |
IL298458A (en) | 2020-05-22 | 2023-01-01 | Aqtual Inc | Methods for characterizing cell-free nucleic acid fragments |
US12093803B2 (en) | 2020-07-01 | 2024-09-17 | International Business Machines Corporation | Downsampling genomic sequence data |
KR20230046313A (ko) | 2020-08-06 | 2023-04-05 | 그릿스톤 바이오, 인코포레이티드 | 다중에피토프 백신 카세트 |
CN112397150B (zh) * | 2021-01-20 | 2021-04-20 | 臻和(北京)生物科技有限公司 | 基于目标区域捕获测序的ctDNA甲基化水平预测装置及方法 |
EP4302301A1 (en) * | 2021-03-05 | 2024-01-10 | Guardant Health, Inc. | Methods and related aspects for analyzing molecular response |
CN114596918B (zh) * | 2022-03-11 | 2023-03-24 | 苏州吉因加生物医学工程有限公司 | 一种检测突变的方法及装置 |
GB202208273D0 (en) * | 2022-06-06 | 2022-07-20 | Invitae Corp | Techniques for detecting minimum residual disease |
CN115376612B (zh) * | 2022-09-13 | 2023-10-13 | 郑州思昆生物工程有限公司 | 一种数据评测方法、装置、电子设备及存储介质 |
WO2024129844A1 (en) * | 2022-12-14 | 2024-06-20 | Invitae Corporation | Techniques for designing patient-specific panels and methods of use thereof for detecting minimal residual disease |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016040901A1 (en) | 2014-09-12 | 2016-03-17 | The Board Of Trustees Of The Leland Stanford Junior University | Identification and use of circulating nucleic acids |
WO2017024784A1 (zh) | 2015-08-10 | 2017-02-16 | 北京吉因加科技有限公司 | 一种血浆中游离的目标dna低频突变富集测序方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3421613B1 (en) * | 2013-03-15 | 2020-08-19 | The Board of Trustees of the Leland Stanford Junior University | Identification and use of circulating nucleic acid tumor markers |
CA3010418A1 (en) * | 2016-01-22 | 2017-07-27 | Grail, Inc. | Variant based disease diagnostics and tracking |
-
2019
- 2019-03-06 AU AU2019229606A patent/AU2019229606A1/en active Pending
- 2019-03-06 US US16/978,518 patent/US20200402613A1/en active Pending
- 2019-03-06 CN CN201980026704.7A patent/CN112020563A/zh active Pending
- 2019-03-06 CA CA3093092A patent/CA3093092A1/en active Pending
- 2019-03-06 JP JP2020546469A patent/JP7523353B2/ja active Active
- 2019-03-06 EP EP19709043.4A patent/EP3762512A1/en active Pending
- 2019-03-06 WO PCT/EP2019/055610 patent/WO2019170773A1/en unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016040901A1 (en) | 2014-09-12 | 2016-03-17 | The Board Of Trustees Of The Leland Stanford Junior University | Identification and use of circulating nucleic acids |
WO2017024784A1 (zh) | 2015-08-10 | 2017-02-16 | 北京吉因加科技有限公司 | 一种血浆中游离的目标dna低频突变富集测序方法 |
Non-Patent Citations (1)
Title |
---|
Gerber, B. et al.,Circulating tumor DNA as a liquid biopsy in plasma cell dyscrasias,Haematologica,2018年02月22日,103(6),e245-e248 |
Also Published As
Publication number | Publication date |
---|---|
EP3762512A1 (en) | 2021-01-13 |
CA3093092A1 (en) | 2019-09-12 |
US20200402613A1 (en) | 2020-12-24 |
AU2019229606A1 (en) | 2020-10-15 |
WO2019170773A1 (en) | 2019-09-12 |
CN112020563A (zh) | 2020-12-01 |
JP2021516962A (ja) | 2021-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7523353B2 (ja) | バリアント検出の改善 | |
US20220017891A1 (en) | Improvements in variant detection | |
Hasenleithner et al. | A clinician’s handbook for using ctDNA throughout the patient journey | |
JP7119014B2 (ja) | まれな変異およびコピー数多型を検出するためのシステムおよび方法 | |
Newman et al. | Integrated digital error suppression for improved detection of circulating tumor DNA | |
EP3322816A2 (en) | System and methodology for the analysis of genomic data obtained from a subject | |
US20210104297A1 (en) | Systems and methods for determining tumor fraction in cell-free nucleic acid | |
US20210065842A1 (en) | Systems and methods for determining tumor fraction | |
CN115443341A (zh) | 分析无细胞核酸的方法及其应用 | |
van der Laan et al. | Liquid biopsies in sarcoma clinical practice: where do we stand? | |
Widman et al. | Ultrasensitive plasma-based monitoring of tumor burden using machine-learning-guided signal enrichment | |
EP4150117A1 (en) | System and method for gene expression and tissue of origin inference from cell-free dna | |
Adams et al. | Global mutational profiling of formalin-fixed human colon cancers from a pathology archive | |
Cheng et al. | Whole genome error-corrected sequencing for sensitive circulating tumor DNA cancer monitoring | |
Nordentoft et al. | Whole genome mutational analysis for tumor-informed ctDNA based MRD surveillance, treatment monitoring and biological characterization of urothelial carcinoma | |
US20230144221A1 (en) | Methods and systems for detecting alternative splicing in sequencing data | |
Poletti | TiMMing: developing an innovative suite of bioinformatic tools to harmonize and track the origin of copy number alterations in the evolutive history of multiple myeloma | |
Fisher et al. | Section I: integrating laboratory medicine with tissue specimens | |
Heider | Detection of trace levels of circulating tumour DNA in early stage non-small cell lung cancer | |
Yuan | Analysis of somatic copy number alterations in liquid biopsies from cancer patients | |
CN118451200A (zh) | 用于从细胞游离dna推断基因表达和起源组织的系统和方法 | |
Robertson et al. | Profiling copy number alterations in cell-free tumour DNA using a single-reference | |
WO2024038396A1 (en) | Method of detecting cancer dna in a sample | |
Brors | Analysis of somatic copy number alterations in liquid biopsies from cancer patients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220307 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220307 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240401 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240624 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240716 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7523353 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |