CN117561340A - 使用全基因组cfDNA片段化图谱检测癌症的方法 - Google Patents
使用全基因组cfDNA片段化图谱检测癌症的方法 Download PDFInfo
- Publication number
- CN117561340A CN117561340A CN202280027033.8A CN202280027033A CN117561340A CN 117561340 A CN117561340 A CN 117561340A CN 202280027033 A CN202280027033 A CN 202280027033A CN 117561340 A CN117561340 A CN 117561340A
- Authority
- CN
- China
- Prior art keywords
- cancer
- cfdna
- subject
- score
- fragments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 202
- 201000011510 cancer Diseases 0.000 title claims abstract description 186
- 238000000034 method Methods 0.000 title claims abstract description 156
- 238000013467 fragmentation Methods 0.000 title claims description 81
- 238000006062 fragmentation reaction Methods 0.000 title claims description 81
- 239000012634 fragment Substances 0.000 claims abstract description 157
- 230000004083 survival effect Effects 0.000 claims abstract description 42
- 238000004458 analytical method Methods 0.000 claims abstract description 23
- 238000012544 monitoring process Methods 0.000 claims abstract description 17
- 238000011282 treatment Methods 0.000 claims description 31
- 238000012163 sequencing technique Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 14
- 238000012070 whole genome sequencing analysis Methods 0.000 claims description 13
- 206010035226 Plasma cell myeloma Diseases 0.000 claims description 10
- 238000010801 machine learning Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 9
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 8
- 210000000349 chromosome Anatomy 0.000 claims description 8
- 238000009169 immunotherapy Methods 0.000 claims description 8
- 201000005202 lung cancer Diseases 0.000 claims description 8
- 208000020816 lung neoplasm Diseases 0.000 claims description 8
- 238000001959 radiotherapy Methods 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000002560 therapeutic procedure Methods 0.000 claims description 6
- 208000003950 B-cell lymphoma Diseases 0.000 claims description 5
- 206010006187 Breast cancer Diseases 0.000 claims description 5
- 208000026310 Breast neoplasm Diseases 0.000 claims description 5
- 206010009944 Colon cancer Diseases 0.000 claims description 5
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 5
- 208000000461 Esophageal Neoplasms Diseases 0.000 claims description 5
- 208000028018 Lymphocytic leukaemia Diseases 0.000 claims description 5
- 208000034578 Multiple myelomas Diseases 0.000 claims description 5
- 206010030155 Oesophageal carcinoma Diseases 0.000 claims description 5
- 206010033128 Ovarian cancer Diseases 0.000 claims description 5
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 5
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 5
- 206010060862 Prostate cancer Diseases 0.000 claims description 5
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 5
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 5
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 5
- 208000002495 Uterine Neoplasms Diseases 0.000 claims description 5
- 201000007455 central nervous system cancer Diseases 0.000 claims description 5
- 208000006990 cholangiocarcinoma Diseases 0.000 claims description 5
- 201000004101 esophageal cancer Diseases 0.000 claims description 5
- 201000003444 follicular lymphoma Diseases 0.000 claims description 5
- 206010017758 gastric cancer Diseases 0.000 claims description 5
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 claims description 5
- 201000007270 liver cancer Diseases 0.000 claims description 5
- 208000014018 liver neoplasm Diseases 0.000 claims description 5
- 208000003747 lymphoid leukemia Diseases 0.000 claims description 5
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 5
- 208000025113 myeloid leukemia Diseases 0.000 claims description 5
- 201000000050 myeloid neoplasm Diseases 0.000 claims description 5
- 201000002528 pancreatic cancer Diseases 0.000 claims description 5
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 5
- 201000011549 stomach cancer Diseases 0.000 claims description 5
- 206010046766 uterine cancer Diseases 0.000 claims description 5
- 201000009030 Carcinoma Diseases 0.000 claims description 4
- 206010025323 Lymphomas Diseases 0.000 claims description 4
- 206010039491 Sarcoma Diseases 0.000 claims description 4
- 238000011226 adjuvant chemotherapy Methods 0.000 claims description 4
- 238000002659 cell therapy Methods 0.000 claims description 4
- 231100000433 cytotoxic Toxicity 0.000 claims description 4
- 230000001472 cytotoxic effect Effects 0.000 claims description 4
- 238000001794 hormone therapy Methods 0.000 claims description 4
- 238000011227 neoadjuvant chemotherapy Methods 0.000 claims description 4
- 238000001356 surgical procedure Methods 0.000 claims description 4
- 238000002626 targeted therapy Methods 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims 4
- 230000002489 hematologic effect Effects 0.000 claims 3
- 108091027544 Subgenomic mRNA Proteins 0.000 claims 2
- 238000012252 genetic analysis Methods 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 23
- 108020004414 DNA Proteins 0.000 description 22
- 238000009826 distribution Methods 0.000 description 16
- 210000004369 blood Anatomy 0.000 description 14
- 239000008280 blood Substances 0.000 description 14
- 201000010099 disease Diseases 0.000 description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 12
- 238000001514 detection method Methods 0.000 description 10
- 241000124008 Mammalia Species 0.000 description 9
- 238000003556 assay Methods 0.000 description 8
- 239000012472 biological sample Substances 0.000 description 7
- 239000002246 antineoplastic agent Substances 0.000 description 6
- 229940127089 cytotoxic agent Drugs 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 5
- 210000002381 plasma Anatomy 0.000 description 5
- 230000008685 targeting Effects 0.000 description 5
- 230000004075 alteration Effects 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000011269 treatment regimen Methods 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000002405 diagnostic procedure Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 229940043355 kinase inhibitor Drugs 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 150000007523 nucleic acids Chemical group 0.000 description 3
- 239000003757 phosphotransferase inhibitor Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- AOJJSUZBOXZQNB-TZSSRYMLSA-N Doxorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1C[C@H](N)[C@H](O)[C@H](C)O1 AOJJSUZBOXZQNB-TZSSRYMLSA-N 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 210000002939 cerumen Anatomy 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 210000003097 mucus Anatomy 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 238000013077 scoring method Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 210000004243 sweat Anatomy 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 210000001138 tear Anatomy 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- FDKXTQMXEQVLRF-ZHACJKMWSA-N (E)-dacarbazine Chemical compound CN(C)\N=N\c1[nH]cnc1C(N)=O FDKXTQMXEQVLRF-ZHACJKMWSA-N 0.000 description 1
- VSNHCAURESNICA-NJFSPNSNSA-N 1-oxidanylurea Chemical compound N[14C](=O)NO VSNHCAURESNICA-NJFSPNSNSA-N 0.000 description 1
- OTDJAMXESTUWLO-UUOKFMHZSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-oxolanyl]-3H-purine-6-thione Chemical compound C12=NC(N)=NC(S)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OTDJAMXESTUWLO-UUOKFMHZSA-N 0.000 description 1
- NDMPLJNOPCLANR-UHFFFAOYSA-N 3,4-dihydroxy-15-(4-hydroxy-18-methoxycarbonyl-5,18-seco-ibogamin-18-yl)-16-methoxy-1-methyl-6,7-didehydro-aspidospermidine-3-carboxylic acid methyl ester Natural products C1C(CC)(O)CC(CC2(C(=O)OC)C=3C(=CC4=C(C56C(C(C(O)C7(CC)C=CCN(C67)CC5)(O)C(=O)OC)N4C)C=3)OC)CN1CCC1=C2NC2=CC=CC=C12 NDMPLJNOPCLANR-UHFFFAOYSA-N 0.000 description 1
- AOJJSUZBOXZQNB-VTZDEGQISA-N 4'-epidoxorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1C[C@H](N)[C@@H](O)[C@H](C)O1 AOJJSUZBOXZQNB-VTZDEGQISA-N 0.000 description 1
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 1
- STQGQHZAVUOBTE-UHFFFAOYSA-N 7-Cyan-hept-2t-en-4,6-diinsaeure Natural products C1=2C(O)=C3C(=O)C=4C(OC)=CC=CC=4C(=O)C3=C(O)C=2CC(O)(C(C)=O)CC1OC1CC(N)C(O)C(C)O1 STQGQHZAVUOBTE-UHFFFAOYSA-N 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- COVZYZSDYWQREU-UHFFFAOYSA-N Busulfan Chemical compound CS(=O)(=O)OCCCCOS(C)(=O)=O COVZYZSDYWQREU-UHFFFAOYSA-N 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- GAGWJHPBXLXJQN-UORFTKCHSA-N Capecitabine Chemical compound C1=C(F)C(NC(=O)OCCCCC)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](C)O1 GAGWJHPBXLXJQN-UORFTKCHSA-N 0.000 description 1
- GAGWJHPBXLXJQN-UHFFFAOYSA-N Capecitabine Natural products C1=C(F)C(NC(=O)OCCCCC)=NC(=O)N1C1C(O)C(O)C(C)O1 GAGWJHPBXLXJQN-UHFFFAOYSA-N 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 1
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 1
- 206010052358 Colorectal cancer metastatic Diseases 0.000 description 1
- CMSMOCZEIVJLDB-UHFFFAOYSA-N Cyclophosphamide Chemical compound ClCCN(CCCl)P1(=O)NCCCO1 CMSMOCZEIVJLDB-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 1
- HTIJFSOGRVMCQR-UHFFFAOYSA-N Epirubicin Natural products COc1cccc2C(=O)c3c(O)c4CC(O)(CC(OC5CC(N)C(=O)C(C)O5)c4c(O)c3C(=O)c12)C(=O)CO HTIJFSOGRVMCQR-UHFFFAOYSA-N 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- XDXDZDZNSLXDNA-TZNDIEGXSA-N Idarubicin Chemical compound C1[C@H](N)[C@H](O)[C@H](C)O[C@H]1O[C@@H]1C2=C(O)C(C(=O)C3=CC=CC=C3C3=O)=C3C(O)=C2C[C@@](O)(C(C)=O)C1 XDXDZDZNSLXDNA-TZNDIEGXSA-N 0.000 description 1
- XDXDZDZNSLXDNA-UHFFFAOYSA-N Idarubicin Natural products C1C(N)C(O)C(C)OC1OC1C2=C(O)C(C(=O)C3=CC=CC=C3C3=O)=C3C(O)=C2CC(O)(C(C)=O)C1 XDXDZDZNSLXDNA-UHFFFAOYSA-N 0.000 description 1
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000037984 Inhibitory immune checkpoint proteins Human genes 0.000 description 1
- 108091008026 Inhibitory immune checkpoint proteins Proteins 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- GQYIWUVLTXOXAJ-UHFFFAOYSA-N Lomustine Chemical compound ClCCN(N=O)C(=O)NC1CCCCC1 GQYIWUVLTXOXAJ-UHFFFAOYSA-N 0.000 description 1
- 206010050017 Lung cancer metastatic Diseases 0.000 description 1
- 229930192392 Mitomycin Natural products 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 1
- ZDZOTLJHXYCWBA-VCVYQWHSSA-N N-debenzoyl-N-(tert-butoxycarbonyl)-10-deacetyltaxol Chemical compound O([C@H]1[C@H]2[C@@](C([C@H](O)C3=C(C)[C@@H](OC(=O)[C@H](O)[C@@H](NC(=O)OC(C)(C)C)C=4C=CC=CC=4)C[C@]1(O)C3(C)C)=O)(C)[C@@H](O)C[C@H]1OC[C@]12OC(=O)C)C(=O)C1=CC=CC=C1 ZDZOTLJHXYCWBA-VCVYQWHSSA-N 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 229930012538 Paclitaxel Natural products 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 208000005228 Pericardial Effusion Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 206010039101 Rhinorrhoea Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 108091008874 T cell receptors Proteins 0.000 description 1
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 1
- JXLYSJRDGCGARV-WWYNWVTFSA-N Vinblastine Natural products O=C(O[C@H]1[C@](O)(C(=O)OC)[C@@H]2N(C)c3c(cc(c(OC)c3)[C@]3(C(=O)OC)c4[nH]c5c(c4CCN4C[C@](O)(CC)C[C@H](C3)C4)cccc5)[C@@]32[C@H]2[C@@]1(CC)C=CCN2CC3)C JXLYSJRDGCGARV-WWYNWVTFSA-N 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 102000035181 adaptor proteins Human genes 0.000 description 1
- 108091005764 adaptor proteins Proteins 0.000 description 1
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 229960001220 amsacrine Drugs 0.000 description 1
- XCPGHVQEEXUHNC-UHFFFAOYSA-N amsacrine Chemical compound COC1=CC(NS(C)(=O)=O)=CC=C1NC1=C(C=CC=C2)C2=NC2=CC=CC=C12 XCPGHVQEEXUHNC-UHFFFAOYSA-N 0.000 description 1
- 229940124650 anti-cancer therapies Drugs 0.000 description 1
- 238000011319 anticancer therapy Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000001742 aqueous humor Anatomy 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- 208000037979 autoimmune inflammatory disease Diseases 0.000 description 1
- 229960002756 azacitidine Drugs 0.000 description 1
- 229960002170 azathioprine Drugs 0.000 description 1
- LMEKQMALGUDUQG-UHFFFAOYSA-N azathioprine Chemical compound CN1C=NC([N+]([O-])=O)=C1SC1=NC=NC2=C1NC=N2 LMEKQMALGUDUQG-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229960000397 bevacizumab Drugs 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 229960002092 busulfan Drugs 0.000 description 1
- 229960004117 capecitabine Drugs 0.000 description 1
- 229960004562 carboplatin Drugs 0.000 description 1
- 190000008236 carboplatin Chemical compound 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- JCKYGMPEJWAADB-UHFFFAOYSA-N chlorambucil Chemical compound OC(=O)CCCC1=CC=C(N(CCCl)CCCl)C=C1 JCKYGMPEJWAADB-UHFFFAOYSA-N 0.000 description 1
- 229960004630 chlorambucil Drugs 0.000 description 1
- 210000001268 chyle Anatomy 0.000 description 1
- DQLATGHUWYMOKM-UHFFFAOYSA-L cisplatin Chemical compound N[Pt](N)(Cl)Cl DQLATGHUWYMOKM-UHFFFAOYSA-L 0.000 description 1
- 229960004316 cisplatin Drugs 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 229960004397 cyclophosphamide Drugs 0.000 description 1
- 229960000684 cytarabine Drugs 0.000 description 1
- 229960003901 dacarbazine Drugs 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 229960000975 daunorubicin Drugs 0.000 description 1
- STQGQHZAVUOBTE-VGBVRHCVSA-N daunorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(C)=O)[C@H]1C[C@H](N)[C@H](O)[C@H](C)O1 STQGQHZAVUOBTE-VGBVRHCVSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229960003668 docetaxel Drugs 0.000 description 1
- ZWAOHEXOSAUJHY-ZIYNGMLESA-N doxifluridine Chemical compound O[C@@H]1[C@H](O)[C@@H](C)O[C@H]1N1C(=O)NC(=O)C(F)=C1 ZWAOHEXOSAUJHY-ZIYNGMLESA-N 0.000 description 1
- 229950005454 doxifluridine Drugs 0.000 description 1
- 229960004679 doxorubicin Drugs 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- -1 elements Substances 0.000 description 1
- 210000003060 endolymph Anatomy 0.000 description 1
- 229960001904 epirubicin Drugs 0.000 description 1
- GTTBEUCJPZQMDZ-UHFFFAOYSA-N erlotinib hydrochloride Chemical compound [H+].[Cl-].C=12C=C(OCCOC)C(OCCOC)=CC2=NC=NC=1NC1=CC=CC(C#C)=C1 GTTBEUCJPZQMDZ-UHFFFAOYSA-N 0.000 description 1
- 229960005073 erlotinib hydrochloride Drugs 0.000 description 1
- 229960005420 etoposide Drugs 0.000 description 1
- VJJPUSNTGOMMGY-MRVIYFEKSA-N etoposide Chemical compound COC1=C(O)C(OC)=CC([C@@H]2C3=CC=4OCOC=4C=C3[C@@H](O[C@H]3[C@@H]([C@@H](O)[C@@H]4O[C@H](C)OC[C@H]4O3)O)[C@@H]3[C@@H]2C(OC3)=O)=C1 VJJPUSNTGOMMGY-MRVIYFEKSA-N 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000012953 feeding on blood of other organism Effects 0.000 description 1
- 229960000390 fludarabine Drugs 0.000 description 1
- GIUYCYHIANZCFB-FJFJXFQQSA-N fludarabine phosphate Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O GIUYCYHIANZCFB-FJFJXFQQSA-N 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 210000004211 gastric acid Anatomy 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 210000004051 gastric juice Anatomy 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 210000004251 human milk Anatomy 0.000 description 1
- 235000020256 human milk Nutrition 0.000 description 1
- 229960000908 idarubicin Drugs 0.000 description 1
- HOMGKSMUEGBAAB-UHFFFAOYSA-N ifosfamide Chemical compound ClCCNP1(=O)OCCCN1CCCl HOMGKSMUEGBAAB-UHFFFAOYSA-N 0.000 description 1
- 229960001101 ifosfamide Drugs 0.000 description 1
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 229960004768 irinotecan Drugs 0.000 description 1
- UWKQSNNFCGGAFS-XIFFEERXSA-N irinotecan Chemical compound C1=C2C(CC)=C3CN(C(C4=C([C@@](C(=O)OC4)(O)CC)C=4)=O)C=4C3=NC2=CC=C1OC(=O)N(CC1)CCC1N1CCCCC1 UWKQSNNFCGGAFS-XIFFEERXSA-N 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 229960002247 lomustine Drugs 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- HAWPXGHAZFHHAD-UHFFFAOYSA-N mechlorethamine Chemical class ClCCN(C)CCCl HAWPXGHAZFHHAD-UHFFFAOYSA-N 0.000 description 1
- 229960004961 mechlorethamine Drugs 0.000 description 1
- SGDBTWWWUNNDEQ-LBPRGKRZSA-N melphalan Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N(CCCl)CCCl)C=C1 SGDBTWWWUNNDEQ-LBPRGKRZSA-N 0.000 description 1
- 229960001924 melphalan Drugs 0.000 description 1
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 1
- 229960001428 mercaptopurine Drugs 0.000 description 1
- 208000037819 metastatic cancer Diseases 0.000 description 1
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 229960004857 mitomycin Drugs 0.000 description 1
- 229960001156 mitoxantrone Drugs 0.000 description 1
- KKZJGLLVHKMTCM-UHFFFAOYSA-N mitoxantrone Chemical compound O=C1C2=C(O)C=CC(O)=C2C(=O)C2=C1C(NCCNCCO)=CC=C2NCCNCCO KKZJGLLVHKMTCM-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 208000010753 nasal discharge Diseases 0.000 description 1
- 238000013188 needle biopsy Methods 0.000 description 1
- 210000002445 nipple Anatomy 0.000 description 1
- 210000004882 non-tumor cell Anatomy 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- DWAFYCQODLXJNR-BNTLRKBRSA-L oxaliplatin Chemical compound O1C(=O)C(=O)O[Pt]11N[C@@H]2CCCC[C@H]2N1 DWAFYCQODLXJNR-BNTLRKBRSA-L 0.000 description 1
- 229960001756 oxaliplatin Drugs 0.000 description 1
- 229960001592 paclitaxel Drugs 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 229960005079 pemetrexed Drugs 0.000 description 1
- QOFFJEBXNKRSPX-ZDUSSCGKSA-N pemetrexed Chemical compound C1=N[C]2NC(N)=NC(=O)C2=C1CCC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 QOFFJEBXNKRSPX-ZDUSSCGKSA-N 0.000 description 1
- 210000004912 pericardial fluid Anatomy 0.000 description 1
- 210000004049 perilymph Anatomy 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- CPTBDICYNRMXFX-UHFFFAOYSA-N procarbazine Chemical compound CNNCC1=CC=C(C(=O)NC(C)C)C=C1 CPTBDICYNRMXFX-UHFFFAOYSA-N 0.000 description 1
- 229960000624 procarbazine Drugs 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 210000004908 prostatic fluid Anatomy 0.000 description 1
- 210000004915 pus Anatomy 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 229930002330 retinoic acid Natural products 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 210000002374 sebum Anatomy 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 229960001052 streptozocin Drugs 0.000 description 1
- ZSJLQEPLLKMAKR-GKHCUFPYSA-N streptozocin Chemical compound O=NN(C)C(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O ZSJLQEPLLKMAKR-GKHCUFPYSA-N 0.000 description 1
- 238000011477 surgical intervention Methods 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- RCINICONZNJXQF-MZXODVADSA-N taxol Chemical compound O([C@@H]1[C@@]2(C[C@@H](C(C)=C(C2(C)C)[C@H](C([C@]2(C)[C@@H](O)C[C@H]3OC[C@]3([C@H]21)OC(C)=O)=O)OC(=O)C)OC(=O)[C@H](O)[C@@H](NC(=O)C=1C=CC=CC=1)C=1C=CC=CC=1)O)C(=O)C1=CC=CC=C1 RCINICONZNJXQF-MZXODVADSA-N 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 229960000303 topotecan Drugs 0.000 description 1
- UCFGDBYHRUNTLO-QHCPKHFHSA-N topotecan Chemical compound C1=C(O)C(CN(C)C)=C2C=C(CN3C4=CC5=C(C3=O)COC(=O)[C@]5(O)CC)C4=NC2=C1 UCFGDBYHRUNTLO-QHCPKHFHSA-N 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 229960003048 vinblastine Drugs 0.000 description 1
- JXLYSJRDGCGARV-XQKSVPLYSA-N vincaleukoblastine Chemical compound C([C@@H](C[C@]1(C(=O)OC)C=2C(=CC3=C([C@]45[C@H]([C@@]([C@H](OC(C)=O)[C@]6(CC)C=CCN([C@H]56)CC4)(O)C(=O)OC)N3C)C=2)OC)C[C@@](C2)(O)CC)N2CCC2=C1NC1=CC=CC=C21 JXLYSJRDGCGARV-XQKSVPLYSA-N 0.000 description 1
- 229960004528 vincristine Drugs 0.000 description 1
- OGWKCGZFUXNPDA-XQKSVPLYSA-N vincristine Chemical compound C([N@]1C[C@@H](C[C@]2(C(=O)OC)C=3C(=CC4=C([C@]56[C@H]([C@@]([C@H](OC(C)=O)[C@]7(CC)C=CCN([C@H]67)CC5)(O)C(=O)OC)N4C=O)C=3)OC)C[C@@](C1)(O)CC)CC1=C2NC2=CC=CC=C12 OGWKCGZFUXNPDA-XQKSVPLYSA-N 0.000 description 1
- OGWKCGZFUXNPDA-UHFFFAOYSA-N vincristine Natural products C1C(CC)(O)CC(CC2(C(=O)OC)C=3C(=CC4=C(C56C(C(C(OC(C)=O)C7(CC)C=CCN(C67)CC5)(O)C(=O)OC)N4C=O)C=3)OC)CN1CCC1=C2NC2=CC=CC=C12 OGWKCGZFUXNPDA-UHFFFAOYSA-N 0.000 description 1
- 229960004355 vindesine Drugs 0.000 description 1
- UGGWPQSBPIFKDZ-KOTLKJBCSA-N vindesine Chemical compound C([C@@H](C[C@]1(C(=O)OC)C=2C(=CC3=C([C@]45[C@H]([C@@]([C@H](O)[C@]6(CC)C=CCN([C@H]56)CC4)(O)C(N)=O)N3C)C=2)OC)C[C@@](C2)(O)CC)N2CCC2=C1N=C1[C]2C=CC=C1 UGGWPQSBPIFKDZ-KOTLKJBCSA-N 0.000 description 1
- 229960002066 vinorelbine Drugs 0.000 description 1
- GBABOYUKABKIAF-GHYRFKGUSA-N vinorelbine Chemical compound C1N(CC=2C3=CC=CC=C3NC=22)CC(CC)=C[C@H]1C[C@]2(C(=O)OC)C1=CC([C@]23[C@H]([C@]([C@H](OC(C)=O)[C@]4(CC)C=CCN([C@H]34)CC2)(O)C(=O)OC)N2C)=C2C=C1OC GBABOYUKABKIAF-GHYRFKGUSA-N 0.000 description 1
- 210000004127 vitreous body Anatomy 0.000 description 1
- 210000004916 vomit Anatomy 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/165—Mathematical modelling, e.g. logarithm, ratio
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Genetics & Genomics (AREA)
- Pathology (AREA)
- Organic Chemistry (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Public Health (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Immunology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本公开提供了利用对从患者获得的样品中的游离DNA(cfDNA)片段的分析来诊断和预测癌症状态的方法和系统。本公开提供了一种检测受试者的癌症的方法。本公开还提供了一种确定患有癌症的受试者的总体存活率的方法。本公开进一步提供了一种监测受试者的癌症的方法。还提供了用于遗传分析的系统。
Description
相关申请的交叉引用
本申请根据35 U.S.C.§119(E)要求于2021年4月8日提交的美国临时专利申请序列号63/172,493的优先权权益。在先申请的公开内容被视为本申请的公开的一部分并且通过引用的方式并入本申请的公开中。
技术领域
本发明总体上涉及遗传分析,并且更具体地涉及用于分析游离DNA(cfDNA)片段以检测受试者的癌症和/或评估受试者的总体存活率的方法和系统。
背景技术
世界范围内人类癌症的发病率和死亡率很大程度上是由于这些疾病的诊断较晚,在这种情况下治疗效果较差。不幸的是,临床证实的可以用于广泛诊断和治疗早期癌症患者的生物标记物并不广泛可得。
对游离DNA(cfDNA)的分析表明,此类方法可以为早期诊断和治疗提供新的途径。已经表明循环肿瘤DNA(ctDNA)片段平均比来自非肿瘤细胞的其它cfDNA更短。先前的工作已经探索了将片段分成由与组蛋白核心或接头蛋白结合引起的不同大小的组(例如,短和长,或相互排斥的大小组)并且使用这些片段的计数来量化ctDNA和/或将各个样品分类为存在/不存在肿瘤。然而,先前的研究缺乏确定被诊断患有癌症的患者的总体存活率以及在癌症检测中提供稳健的灵敏度和特异性的能力。
发明内容
本公开提供了利用对cfDNA的分析来检测和预测受试者的总体存活率的方法和系统,所述检测和预测通过对通过分析从受试者获得的样品中的cfDNA片段而获得的cfDNA片段化图谱进行评分来进行。评分方法提供了对受试者的总体生存能力的度量。
照此,在一个实施例中,本发明提供了一种检测受试者的癌症的方法。所述方法包含:
a)确定来自所述受试者的样品的游离DNA(cfDNA)片段化图谱,所述cfDNA片段化图谱通过以下确定:
从所述受试者获得cfDNA片段并进行分离,
对所述cfDNA片段进行测序以获得测序片段,
将所述测序片段映射到基因组以获得映射序列窗口,以及
分析所述映射序列窗口以确定cfDNA片段长度并生成所述cfDNA片段化图谱;以及
b)通过基于所述cfDNA片段化图谱计算评分来将所述受试者分类为患有癌症或未患癌症,所述评分指示所述受试者体内存在癌症的概率,由此检测到所述受试者的癌症。在一些方面,所述癌症不包含肺癌。在一些方面,向所述受试者施用化疗剂、放射疗法、免疫疗法或其它治疗方案。
在一些方面,计算评分包含:i)确定短cfDNA片段与长cfDNA片段的比率,ii)通过染色体臂确定所述cfDNA片段的Z评分,iii)使用计算混合模型分析来量化cfDNA片段密度,以及iv)使用机器学习模型来处理i)-iii)的输出以定义所述评分。
在另一实施例中,本发明提供了一种确定患有癌症的受试者的总体存活率的方法。
所述方法包含:
a)确定来自所述受试者的样品的游离DNA(cfDNA)片段化图谱;
b)基于所述cfDNA片段化图谱计算评分,其中计算所述评分包括:i)确定所述样品的短cfDNA片段与长cfDNA片段的比率,ii)通过染色体臂确定所述样品的cfDNA片段的Z评分,iii)使用计算混合模型分析来量化cfDNA片段密度,以及iv)使用机器学习模型来处理i)-iii)的输出以定义所述评分;以及
c)基于所述评分确定所述受试者总体存活的概率,由此确定所述受试者的总体存活率。
在又一方面,本发明提供了一种治疗患有癌症的受试者的方法。所述方法包含:
a)使用本发明的方法来检测所述受试者的癌症,或使用本发明的方法来确定所述受试者的总体存活率;以及
b)向所述受试者施用癌症治疗,由此治疗所述受试者。在一些方面,向所述受试者施用化疗剂、放射疗法、免疫疗法或其它治疗方案。
在仍另一实施例中,本发明提供了一种监测受试者的癌症的方法。所述方法包含:
a)使用本发明的方法来检测所述受试者的癌症,和/或使用本发明的方法来确定所述受试者的总体存活率;以及
b)向所述受试者施用癌症治疗;以及
c)在施用所述癌症治疗后使用本发明的方法来确定所述受试者的总体存活率,由此监测所述受试者的癌症。在一些方面,向所述受试者施用化疗剂、放射疗法、免疫疗法或其它治疗方案。
在另一实施例中,本发明提供了用计算机程序编码的非暂时性计算机可读存储介质。所述计算机程序包含指令,所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行操作以执行本发明的方法。
在又一实施例中,本发明提供了计算系统。所述系统包含存储器和耦接到所述存储器的一个或多个处理器,其中所述一个或多个处理器被配置成执行实施本发明的方法的操作。
在又一实施例中,本发明提供了一种用于遗传分析和评估癌症的系统,所述系统包含:(a)测序仪,所述测序仪被配置成生成样品的全基因组测序(WGS)数据集;以及(b)本发明的非暂时性计算机可读存储介质和/或计算机系统。
附图说明
图1是展示在本发明的一个实施例中使用本公开的方法的示例性DELFI方法的示意图。从一组健康个体和癌症患者中收集血液。从血浆级分中提取cfDNA,将其加工成测序文库,通过全基因组测序进行检查,映射到基因组,并进行分析以确定跨基因组的cfDNA片段化图谱。使用机器学习方法来生成DELFI评分,并将个体分类为健康或患有癌症。
图2是示出用于非侵入性癌症检测的cfDNA片段化测定的性能的表。在3个月内(包含3个月),74名患者被诊断为患有16种不同实体癌中的1种,而207名患者没有癌症。
图3是示出在本发明的一个实施例中使用本公开的方法生成的数据的曲线图。所述图示出了癌症检测的cfDNA片段化测定的总体性能。
图4是示出在本发明的一个实施例中使用本公开的方法生成的数据的曲线图。所述图示出了与DELFI评分相关的受试者存活率。较高的DELFI评分与总体存活率下降相关联,与癌症分期或其它临床特性无关。
图5是示出在本发明的一个实施例中使用本公开的方法生成的数据曲线的一系列曲线图。计算出的DELFI评分将所描绘的患有癌症(不包含肺癌)的个体的卡普兰-梅尔曲线(Kaplan-Meier curve)分开,而不论用于定义高分(>0.5)与低分(<0.5)的截断值如何。每个分图顶部的数字指示所确定的截断值。
图6是示出在本发明的一个实施例中使用本公开的方法生成的数据的曲线图。图6示出了cox比例风险模型在两种设置中的结果。在第一设置中(图的左分图),DELFI评分被视为连续的。在第二设置中(图的右分图),DELFI评分被视为高(>0.5)或低(<0.5)。在任一种设置中,DELFI评分都是强有力的存活率预测因子,即使在对抽血年龄和分期进行调整时也是如此。注意,所述分期是相对于1期而言的。
具体实施方式
本文描述了一种用于癌症的早期检测以及对患有癌症的受试者的总体存活率的预测的非侵入性方法。血液中的cfDNA可以为癌症患者提供非侵入性诊断途径。如本文所证明的,使用早期拦截的DNA片段评估(DELFI)来评估患有各种类型癌症的患者以及健康个体的cfDNA的全基因组片段化模式。对cfDNA的评估包含评分方法。确定了使用与总体存活率相关的给定患者样品的cfDNA片段获得的cfDNA片段化图谱的定义评分(本文也称为“DELFI评分”)。使用本文所描述的方法评估cfDNA可以提供用于癌症的早期检测和评估的筛查方法,这可以增加成功治疗癌症患者的机会。评估cfDNA还可以提供用于监测癌症的方法,这可以增加成功治疗的机会并改善癌症患者的结局。
在描述本发明的组合物和方法之前,应当理解本发明不限于所描述的特定方法和系统,因为此类方法和系统可以变化。还应理解,本文中所使用的术语仅出于描述特定实施例的目的,并且不旨在为限制性的,因为本发明的范围仅受所附权利要求限制。
如在本说明书和所附权利要求中所使用的,除非上下文另外明确指示,否则单数形式“一个(a)”、“一种(an)”以及“所述(the)”包含复数指代物。因此,例如,对“所述方法”的提及包含本文所描述的类型的一种或多种方法和/或步骤,在阅读本公开等后,所述一种或多种方法和/或步骤对于本领域的技术人员而言将变得显而易见。
除非另外定义,否则本文所使用的所有技术术语和科学术语的含义与本发明所属领域的普通技术人员通常所理解的含义相同。虽然可以在本发明的实践或测试中使用类似于或等效于本文所描述的方法和材料的任何方法和材料,但现在描述优选的方法和材料。
本公开提供了用于分析cfDNA以检测或在其它方面评估癌症的创新方法和系统。如先前研究所指示,平均而言,无癌症个体具有较长的cfDNA片段(平均大小为167.09bp),而患有癌症的个体具有较短的cfDNA片段(平均大小为164.88bp)。本文所描述的方法允许通过对cfDNA片段化模式的全基因组分析来同时分析cfDNA中的大量异常。
照此,在一个实施例中,本发明提供了一种检测受试者的癌症的方法。所述方法包含:
a)确定来自所述受试者的样品的游离DNA(cfDNA)片段化图谱;以及
b)通过基于所述cfDNA片段化图谱计算评分来将所述受试者分类为患有癌症或未患癌症,所述评分指示所述受试者体内存在癌症的概率,条件是所述癌症不包含肺癌,由此检测到所述受试者的癌症。
在另一实施例中,本发明提供了一种确定患有癌症的受试者的总体存活率的方法。
所述方法包含:
a)确定来自所述受试者的样品的游离DNA(cfDNA)片段化图谱;
b)基于所述cfDNA片段化图谱计算评分,其中计算所述评分包含:i)确定所述样品的短cfDNA片段与长cfDNA片段的比率,ii)通过染色体臂确定所述样品的cfDNA片段的Z评分,iii)使用计算混合模型分析来量化cfDNA片段密度,以及iv)使用机器学习模型来处理i)-iii)的输出以定义所述评分;以及
c)基于所述评分确定所述受试者总体存活的概率,由此确定所述受试者的总体存活率。
在实施例中,本发明提供了一种治疗患有癌症的受试者的方法。所述方法包含:
a)使用本发明的方法来检测所述受试者的癌症,或使用本发明的方法来确定所述受试者的总体存活率;以及
b)向所述受试者施用癌症治疗,由此治疗所述受试者。在一些方面,向所述受试者施用化疗剂、放射疗法、免疫疗法或其它治疗方案。
在另一实施例中,本发明提供了一种监测受试者的癌症的方法。所述方法包含:
a)使用本发明的方法来检测所述受试者的癌症,或使用本发明的方法来确定所述受试者的总体存活率;
b)向所述受试者施用癌症治疗;以及
c)在施用所述癌症治疗后使用本发明的方法来确定所述受试者的总体存活率,由此监测所述受试者的癌症。
本文所描述的方法利用cfDNA片段化图谱。如本文所使用的,术语“片段化图谱”(在一些方面,确定哺乳动物中的cfDNA片段化图谱)可以用于将哺乳动物鉴定为患有癌症。例如,可以对从哺乳动物获得的cfDNA片段(例如,来自从哺乳动物获得的样品)进行低覆盖率全基因组测序,并且可以将测序片段映射到基因组(例如,在非重叠窗口中)并进行评估以确定cfDNA片段化图谱。患有癌症的哺乳动物的cfDNA片段化图谱比健康哺乳动物(例如,未患癌症的哺乳动物)的cfDNA片段化图谱更具异质性(例如,在片段长度方面)。
cfDNA片段化图谱可以包含一个或多个cfDNA片段化模式。cfDNA片段化模式可以包含任何适当cfDNA片段化模式。cfDNA片段化模式的实例包含但不限于片段大小密度、中值片段大小、片段大小分布、小cfDNA片段与大cfDNA片段的比率以及cfDNA片段的覆盖范围。在一些方面,cfDNA片段化图谱可以是全基因组cfDNA图谱(例如,整个基因组中的窗口中的全基因组cfDNA图谱)。在一些方面,cfDNA片段化图谱可以是靶向区域图谱。靶向区域可以是基因组的任何适当部分(例如,染色体区域)。可以如本文所述确定cfDNA片段化图谱的染色体区域的实例包含但不限于染色体的一部分(例如,2q、4p、5p、6q、7p、8q、9q、10q、11q、12q和/或14q的一部分)和染色体臂(例如,8q、13q、11q和/或3p的染色体臂)。在一些情况下,cfDNA片段化图谱可以包含两个或更多个靶区域图谱。
在各个方面,分离从样品获得的cfDNA,并在分析中利用特定大小范围的片段。在一些方面,分析排除了小于约10、50、100或105bp和大于约220、250、300、350bp或更多的片段大小。在一些方面,分析排除了小于105bp和大于170bp的片段大小。在一些方面,分析排除了小于约230、240、250、260bp和大于约420、430、440、450bp或更大的片段大小。在一些方面,分析排除了小于260bp和大于440bp的片段大小。
在一些方面,cfDNA片段化图谱可以通过以下来确定:将来自受试者的包括cfDNA片段的样品处理成测序文库;使测序文库经受低覆盖率全基因组测序以获得测序片段;将测序片段映射到基因组以获得映射序列窗口;以及分析映射序列窗口以确定cfDNA片段长度。
在一些方面,cfDNA片段化图谱可以通过以下来确定:从受试者获得cfDNA片段并进行分离,对cfDNA片段进行测序以获得测序片段,将测序片段映射到基因组以获得映射序列窗口,以及分析映射序列窗口以确定cfDNA片段长度并生成cfDNA片段化图谱。
本发明的方法基于对分离的cfDNA的低覆盖率全基因组测序和分析。在一方面,用于开发本发明方法的数据基于浅层全基因组序列数据(1-2x覆盖范围)。
在一些方面,在覆盖基因组的非重叠窗口中分析映射序列。从概念上讲,窗口大小的范围可能为数千至数百万个碱基,从而导致基因组中有数百至数千个窗口。5Mb窗口用于评估cfDNA片段化模式,因为即使在有限数量的1-2x基因组覆盖范围内,这些窗口也能提供超过每窗口20,000个读数。在每个窗口内,检查cfDNA片段的覆盖范围和大小分布。在一些方面,可以将来自个体的全基因组模式与参考群体进行比较,以确定所述模式是可能健康的或还是源自癌症的。
在某些方面,映射序列包含数十至数千个基因组窗口,如10、50、100至1,000、5,000、10,000或更多个窗口。此类窗口可以是非重叠的或重叠的,并且包含约100万、200万、300万、400万、500万、600万、700万、800万、900万或1000万个碱基对。
在各个方面,在每个窗口内确定cfDNA片段化图谱。照此,本发明提供了用于确定受试者体内(例如,从受试者获得的样品中的)cfDNA片段化图谱的方法。
在一些方面,cfDNA片段化图谱可以用于鉴定cfDNA片段长度的变化(例如,改变)。改变可以是全基因组改变或一个或多个靶向区域/基因座的改变。靶区域可以是含有一个或多个癌症特异性改变的任何区域。在一些方面,cfDNA片段化图谱可以用于鉴定(例如,同时鉴定)约10个改变至约500个改变(例如,约25个至约500个、约50个至约500个、约100个至约500个、约200个至约500个、约300个至约500个、约10个至约400个、约10个至约300个、约10个至约200个、约10个至约1 00个、约10个至约50个、约20个至约400个、约30个至约300个、约40个至约200个、约50个至约100个、约20个至约1 00个、约25个至约75个、约50个至250个或约1 00个至约200个改变)。
在各个方面,cfDNA片段化图谱可以包含cfDNA片段大小模式。cfDNA片段可以具有任何适当大小。例如,在一些方面,cfDNA片段的长度可以为约50个碱基对(bp)至约400bp。如本文所述,患有癌症的受试者的cfDNA片段大小模式可以包含比健康受试者的中值cfDNA片段大小更短的中值cfDNA片段大小。健康受试者(例如,未患有癌症的受试者)可以具有中值cfDNA片段大小为约166.6bp至约167.2bp(例如,约166.9bp)的cfDNA片段大小。在一些方面,患有癌症的受试者可以具有比健康受试者的cfDNA片段大小平均短约1.28bp至约2.49bp(例如,约1.88bp)的cfDNA片段大小。例如,患有癌症的受试者可以具有中值cfDNA片段大小为约164.11bp至约165.92bp(例如,约165.02bp)的cfDNA片段大小。
在一些方面,二核小体cfDNA片段的长度可以为约230个碱基对(bp)至约450bp。如本文所述,患有癌症的受试者的二核小体cfDNA片段大小模式可以包含比健康受试者的中值二核小体cfDNA片段大小更短的中值二核小体cfDNA片段大小。在一些方面,平均而言,无癌症受试者在二核小体范围内具有较长的cfDNA片段(平均大小为334.75bp),而患有癌症的受试者具有较短的二核小体cfDNA片段(平均大小为329.6bp)。照此,健康受试者(例如,未患有癌症的受试者)可以具有中值cfDNA片段大小为约334.75bp的二核小体cfDNA片段大小。在一些方面,患有癌症的受试者可以具有比健康受试者的二核小体cfDNA片段大小更短的二核小体cfDNA片段大小。例如,患有癌症的受试者可以具有中值cfDNA片段大小为约329.6bp的二核小体cfDNA片段大小。
cfDNA片段化图谱可以包含cfDNA片段大小分布。如本文所述,患有癌症的受试者可以具有比健康受试者的cfDNA片段大小分布更多变的cfDNA大小分布。在一些方面,大小分布可以在靶向区域内。健康受试者(例如,未患癌症的受试者)的靶区域cfDNA片段大小分布可以为约1或小于约1。在一些方面,患有癌症的受试者可以具有比健康受试者的靶向区域cfDNA片段大小分布更长(例如,长10、15、20、25、30、35、40、45、50或更多bp,或这些数目之间的任何数目的碱基对)的靶向区域cfDNA片段大小分布。在一些方面,患有癌症的受试者可以具有比健康受试者的靶向区域cfDNA片段大小分布更短(例如,短10、15、20、25、30、35、40、45、50或更多bp,或这些数目之间的任何数目的碱基对)的靶向区域cfDNA片段大小分布。在一些方面,患有癌症的受试者可以具有比健康受试者的靶向区域cfDNA片段大小分布小约47bp至长约30bp的靶向区域cfDNA片段大小分布。在一些方面,患有癌症的受试者可以具有cfDNA片段的长度平均相差10、11、12、13、14、15、15、17、18、19、20或更多bp的靶向区域cfDNA片段大小分布。例如,患有癌症的受试者可以具有cfDNA片段的长度平均相差约13bp的靶向区域cfDNA片段大小分布。在一些方面,大小分布可以是全基因组大小分布。
cfDNA片段化图谱可以包含小cfDNA片段与大cfDNA片段的比率以及片段比率与参考片段比率的相关性。如本文所用,关于小cfDNA片段与大cfDNA片段的比率,小cfDNA片段的长度可以为约100bp至约150bp。如本文所使用的,关于小cfDNA片段与大cfDNA片段的比率,大cfDNA片段的长度可以为约151bp至220bp。如本文所述,患有癌症的受试者的片段比率相关性(例如,cfDNA片段比率与参考DNA片段比率如来自一个或多个健康受试者的DNA片段比率的相关性)可以比健康受试者的片段比率相关性低(例如,低2倍、低3倍、低4倍、低5倍、低6倍、低7倍、低8倍、低9倍、低10倍或更多倍)。健康受试者(例如,未患有癌症的受试者)可以具有约1(例如,约0.96)的片段比率相关性(例如,cfDNA片段比率与参考DNA片段比率如来自一个或多个健康受试者的DNA片段比率的相关性)。在一些方面,患有癌症的受试者的片段比率相关性(例如,cfDNA片段比率与参考DNA片段比率如来自一个或多个健康受试者的DNA片段比率的相关性)可以比健康受试者的片段比率相关性(例如,cfDNA片段比率与参考DNA片段比率如来自一个或多个健康受试者的DNA片段比率的相关性)平均低约0.19至约0.30(例如,约0.25)。
本发明的方法进一步包含基于cfDNA片段化图谱计算评分(例如,DELFI评分)。在一些方面,计算评分包含:i)确定样品的短cfDNA片段与长cfDNA片段的比率,ii)通过染色体臂确定样品的cfDNA片段的Z评分,iii)使用计算混合模型分析来量化cfDNA片段密度,以及iv)使用机器学习模型来处理i)-iii)的输出以定义评分。在各个方面,评分用于确定受试者总体存活的概率。
在一个说明性实例(实例1)中,在多种癌症群组中,本发明人通过低覆盖率全基因组测序计算了每个个体的5MB库的短片段与长片段的比率、染色体臂的Z评分和cfDNA片段大小的混合模型。使用这些特征作为输入,本发明人使交叉验证的梯度增强机器适合于每个人的癌症状态(癌症/非癌症)。此模型的输出是范围为0至1的评分,其中高数值指示癌症的信号更强,并且低数值指示与非癌症更相似。一旦完成,只保留诊断为癌症的样品。
在一些方面,所输出的评分分析如下。使用随访时间、患者在随访结束时是否存活以及来自上述机器学习模型的评分,确定了cfDNA的片段化与存活率之间的关系。如图5所示,在患有癌症的个体中,确定了卡普兰-梅尔曲线中具有高分与低分的强分离。另外地,通过拟合cox比例风险模型,对评分、癌症分期和患者年龄进行回归,评估此评分与其它临床特征的独立性。
参考图5,如以上所讨论的,计算出的DELFI评分将所描绘的患有癌症(不包含肺癌)的个体的卡普兰-梅尔曲线分开,而不论用于定义高分(>0.5)与低分(<0.5)的截断值如何。每个分图顶部的数字指示所确定的截断值。
图6示出了cox比例风险模型在两种设置中的结果。在第一设置中(图的左分图),DELFI评分被视为连续的。在第二设置中(图的右分图),DELFI评分被视为高(>0.5)或低(<0.5)。在任一种设置中,DELFI评分都是强有力的存活率预测因子,即使在对抽血年龄和分期进行调整时也是如此。注意,所述分期是相对于1期而言的。
目前描述的方法和系统可用于检测、预测、治疗和/或监测受试者体内癌症状态。可以如本文所述评估、监测和/或治疗任何适当受试者,如哺乳动物。可以如本文所述评估、监测和/或治疗的一些哺乳动物的实例包含但不限于人、灵长类,如猴子、狗、猫、马、牛、猪、羊、小鼠和大鼠。例如,可以使用本文所述的方法评估患有或疑似患有癌症的人,并且任选地可以用如本文所述的一种或多种癌症治疗对其进行治疗。
可以使用本文所述的方法和系统评估和/或治疗患有或疑似患有任何适当类型的癌症的受试者(例如,通过向受试者施用一种或多种癌症治疗)。癌症可以是任何分期的癌症。在一些方面,癌症可以是早期癌症。在一些方面,癌症可以是无症状的癌症。在一些方面,癌症可以是残留疾病和/或复发(例如,在外科手术切除后和/或在癌症疗法后)。癌症可以是任何类型的癌症。可以如本文所述进行评估、监测和/或治疗的癌症类型的实例包含但不限于肺癌、结直肠癌、前列腺癌、乳腺癌、胰腺癌、胆管癌、肝癌、CNS癌、胃癌、食道癌、胃肠道间质瘤(GIST)、子宫癌和卵巢癌。另外的类型的癌症包含但不限于骨髓瘤、多发性骨髓瘤、B细胞淋巴瘤、滤泡性淋巴瘤、淋巴细胞性白血病、白血病和骨髓性白血病。在一些方面,癌症是实体瘤。在一些方面,癌症是肉瘤、癌或淋巴瘤。在一些方面,癌症是肺癌、结直肠癌、前列腺癌、乳腺癌、胰腺癌、胆管癌、肝癌、CNS癌、胃癌、食道癌、胃肠道间质瘤(GIST)、子宫癌或卵巢癌。在一些方面,癌症是血液癌。在一些方面,癌症是骨髓瘤、多发性骨髓瘤、B细胞淋巴瘤、滤泡性淋巴瘤、淋巴细胞性白血病、白血病或骨髓性白血病。
当治疗患有或疑似患有如本文所述的癌症的受试者时,可以向受试者施用一种或多种癌症治疗。癌症治疗可以是任何适当癌症治疗。可以以任何适当频率(例如,在数天至数周的时间段内一次或多次)向受试者施用本文所述的一种或多种癌症治疗。癌症治疗的实例包含但不限于外科手术干预、辅助化学疗法、新辅助化学疗法、放射疗法、激素疗法、细胞毒性疗法、免疫疗法、过继性T细胞疗法(例如,嵌合抗原受体和/或具有野生型或经修饰的T细胞受体的T细胞)、靶向疗法,如施用激酶抑制剂(例如,靶向如易位或突变等特定遗传损伤的激酶抑制剂)(例如,激酶抑制剂、抗体、双特异性抗体)、信号转导抑制剂、双特异性抗体或抗体片段(例如,BiTEs)、单克隆抗体、免疫检查点抑制剂、外科手术(例如,外科手术切除),或以上的任何组合。在一些方面,癌症治疗可以降低癌症的严重性、减轻癌症的症状,和/或减少受试者体内存在的癌细胞的数目。
在一些方面,癌症治疗可以是化疗剂。化疗剂的非限制性实例包含:安吖啶、阿扎胞苷、硫唑嘌呤、贝伐单抗(或其抗原结合片段)、博来霉素、白消安、卡铂、卡培他滨、苯丁酸氮芥、顺铂、环磷酰胺、阿糖胞苷、达卡巴嗪、柔红霉素、多西他赛、去氧氟尿苷、阿霉素、表柔比星、盐酸埃罗替尼、依托泊苷、氟达拉滨、氟尿苷、氟达拉滨、氟尿嘧啶、吉西他滨、羟基脲、伊达比星、异环磷酰胺、伊立替康、洛莫司汀、氮芥、美法仑、巯嘌呤、甲氨蝶呤、丝裂霉素、米托蒽醌、奥沙利铂、紫杉醇、培美曲塞、丙卡巴肼、全反式维甲酸、链佐星、他氟平、替莫唑胺、替尼泊苷、硫鸟嘌呤、拓扑替康、乌拉莫司汀、戊柔比星、长春碱、长春新碱、长春地辛、长春瑞滨,及其组合。抗癌疗法的另外的实例是本领域已知的;参见例如美国临床肿瘤学会(ASCO)、欧洲肿瘤医学学会(ESMO)或国家综合癌症网络(NCCN)中的疗法指南。
当监测患有或疑似患有如本文所述的癌症的受试者时,监测可以在癌症治疗的历程之前、期间和/或之后进行。本文提供的监测方法可以用于确定一种或多种癌症治疗的功效和/或选择进行增强监测的受试者。
在一些方面,监测可以包含能够监测一种或多种癌症治疗(例如,一种或多种癌症治疗的功效)的常规技术。在一些方面,与未被选择进行增强监测的受试者相比,可以以增加的频率向被选择进行增强监测的受试者施用诊断测试(例如,本文公开的诊断测试中的任一种)。例如,可以以每天两次、每天一次、每周两次、每周一次、每月两次、每月一次、每季度一次、每半年一次、每年一次或其中的任何频率向被选择进行增强监测的受试者施用诊断测试。
在各个方面,DNA存在于取自受试者的生物样品中并在本发明的方法中使用。生物样品实际上可以是包含DNA的任何类型的生物样品。生物样品通常是流体,如全血或其具有循环cfDNA的一部分。在实施例中,样品包含来自肿瘤或液体活检的DNA,所述液体活检如但不限于羊水、房水、玻璃体液、血液、全血、分级血液、血浆、血清、母乳、脑脊液(CSF)、耵聍(耳垢)、乳糜、鸡眼、内淋巴液、外淋巴液、粪便、呼吸、胃酸、胃液、淋巴液、粘液(包含鼻引流液和粘液)、心包液、腹膜液、胸膜液、脓液、鼻涕、唾液、呼出气冷凝液、皮脂、精液、痰、汗水、滑液、眼泪、呕吐物、前列腺液、乳头抽吸液、泪液、汗液、颊拭子、细胞溶解产物、胃肠液、活检组织和尿液或其它生物流体。在一方面,样品包含来自循环肿瘤细胞的DNA。
如以上所公开的,生物样品可以是血液样品。血液样品可以使用本领域已知的方法获得,如手指穿刺或静脉切开术。合适地,血液样品为大约0.1至20ml,或替代地大约1至15ml,其中血液的体积为大约10ml。也可以使用较少的量,以及血液中的循环游离DNA。微量采样和通过针吸活组织检查、导管、排泄或产生含有DNA的体液的采样也是潜在的生物样品来源。
本公开的方法和系统利用核酸序列信息,并且因此可以包含任何方法或测序装置以用于执行核酸测序,包含核酸扩增、聚合酶链反应(PCR)、纳米孔测序、454测序、插入标签测序。在一些方面,本公开的方法或系统利用如以下公司提供的系统:依诺米那公司(Illumina,Inc)(包含但不限于HiSeqTM X10、HiSeqTM 1000、HiSeqTM 2000、HiSeqTM 2500、Genome AnalyzersTM、MiSeqTM、NextSeq、NovaSeq 6000系统)、应用生物系统生命技术公司(SOLiDTM系统、Ion PGMTM测序仪、ion ProtonTM测序仪)或Genapsys公司或BGI MGI公司,以及其它系统。核酸分析也可以通过由以下公司提供的系统进行:牛津纳米孔技术公司(OxfordNanopore Technologies)(GridiONTM、MiniONTM)或太平洋生物科学公司(PacificBiosciences)(PacbioTM RS II或Sequel I或II)。
本发明包含用于执行所公开的方法的步骤的系统,并且部分地根据功能组件和各种处理步骤来描述。可以通过被配置成执行指定功能并实现各种结果的任何数量的组件、操作和技术来实现此类功能组件和处理步骤。例如,本发明可以采用可以执行各种功能的各种生物样品、生物标志物、元件、材料、计算机、数据源、存储系统和介质、信息收集技术和过程、数据处理标准、统计分析、回归分析等。
因此,本发明还提供了用于检测、分析和/或评估癌症的系统。在各个方面,所述系统包含:(a)测序仪,所述测序仪被配置成生成样品的低覆盖率全基因组测序数据集;以及(b)具有执行本发明方法的功能的计算机系统和/或处理器。
在一些方面,计算机系统进一步包含一个或多个另外的模块。例如,所述系统可以包含可操作以选择合适的遗传组分分析(例如,特定大小的cfDNA片段)的提取和/或分离单元中的一个或多个。
在一些方面,计算机系统进一步包含视觉显示装置。所述视觉显示装置可以可操作以显示曲线拟合线、参考曲线拟合线和/或两者的比较。
可以以任何合适的方式(例如使用在计算机系统上操作的计算机程序)实施根据本发明的各方面的用于数据分析的方法。如本文所讨论的,根据本发明的各个方面的示范性系统可以结合计算机系统来实施,该计算机系统为例如包括处理器和随机存取存储器的常规计算机系统,如远程可访问的应用服务器、网络服务器、个人计算机或工作站。计算机系统还适当地包含另外的存储器装置或信息存储系统,如大容量存储系统和用户界面,例如常规监测器、键盘和跟踪装置。然而,计算机系统可以包含任何合适的计算机系统和相关联的设备,并且可以以任何合适的方式来配置。在一个实施例中,计算机系统包括独立系统。在另一实施例中,计算机系统是包含服务器和数据库的计算机网络的一部分。
接收、处理和分析信息所需的软件可以在单个装置中实施或在多个装置中实施。可以通过网络来访问软件,使得信息的存储和处理相对于用户远程发生。根据本发明的各个方面的系统及其各种元件提供便于检测和/或分析的功能和操作,如数据收集、处理、分析、报告和/或诊断。例如,在本方面,计算机系统执行计算机程序,其可以接收、存储、搜索、分析和报告与人类基因组或其区域相关的信息。计算机程序可以包括执行各种功能或操作的多个模块,如用于处理原始数据并生成补充数据的处理模块以及用于分析原始数据和补充数据以生成疾病状态模型和/或诊断信息的定量评估的分析模块。
由系统执行的程序可以包括任何合适的过程以便于分析和/或癌症诊断。在一个实施例中,系统被配置成建立疾病状态模型和/或确定患者的疾病状态。确定或鉴定疾病状态可以包含生成关于患者相对于疾病的状况的任何有用信息,如执行诊断、提供有助于诊断的信息、评估疾病的分期或进程、鉴定可以指示对疾病的易感性的状况、鉴定是否会推荐进一步的测试、预测和/或评估一个或多个治疗程序的功效,或以其它方式评估患者的疾病状态、疾病的概率或其它健康方面。
提供以下实例以进一步绘示本发明的优点和特征,但其不旨在限制本发明的范围。虽然该实例是可以使用的实例中的典型实例,但是也可以替代地使用本领域技术人员已知的其它程序、方法或技术。
实例1
在前瞻性诊断队列中使用全基因组cfDNA片段化检测癌症
己证实全基因组cfDNA片段化模式以高灵敏度和特异性区分来自患有和未患癌症的个体的血浆样品。
在此实施例中,本公开的方法用于检测癌症并预测患者的总体存活率。
研究的目的是将cfDNA片段化测定作为基于血液的筛查试验进行评估,以检测多种不同的实体瘤并通过使用计算评分方案来预测患者的总体存活率。
方法
血浆样品:从281名因非器官特异性癌症体征和症状而转诊至赫勒福和根措夫特医院(the Herlev and Gentofte Hospital)(哥本哈根大学医院,丹麦哥本哈根)的诊断门诊的患者收集样品。
cfDNA片段化方法:cfDNA片段化方法在图1中概述。从血浆中提取cfDNA,将其加工成测序文库,通过低覆盖率全基因组测序(WGS)进行检查,映射到基因组,并进行分析以确定跨基因组的cfDNA片段化图谱。
使用机器学习来生成DELFI评分,并将个体分类为健康或患有癌症,并预测患者的总体存活率。
结果
用于非侵入性癌症检测的cfDNA片段化测定的性能:在3个月内(包含3个月),74名患者被诊断为患有16种不同实体癌中的1种,而207名患者没有癌症。另外的结果在图2中示出。使用10次重复、10倍交叉验证确定局部和转移性癌症以及结直肠癌、肺癌和所有其它癌症的所有期的曲线下面积(AUC)。
用于癌症检测的cfDNA片段化测定的总体性能:结果在图3中概述。用于分析74名患有I-IV期癌症的个体和207名非癌症对照的接受者操作特性(ROC)的AUC。
通过DELFI评分来分析的存活率:如图4所示,较高的DELFI评分与总体存活率下降相关,与癌症分期或其它临床特性无关。图4示出了与DELFI评分相关的受试者存活率。较高的DELFI评分与总体存活率下降相关联,与癌症分期或其它临床特性无关。
结论
对前瞻性纳入的个体的此研究证明了cfDNA片段化测定区分患有和未患癌症的个体的能力。本发明的测定仅使用从低覆盖率WGS获得的片段化相关信息即可在多种癌症环境中表现出高性能。
结果表明,尽管存在常见的非恶性疾病(包含心血管疾病、自身免疫性疾病或炎性疾病),但机器学习模型可以使用cfDNA片段化图谱来区分癌症和非癌症。另外地,独立于其它特性,具有较高DELFI评分的个体预后较差。
这些数据支持全基因组cfDNA片段化分析的开发,以用于单种和多种癌症的非侵入性检测。
尽管已经参考以上实例描述了本发明,但应当理解,修改和变化均涵盖在本发明的精神和范围之内。因此,本发明仅由以下权利要求限制。
Claims (59)
1.一种检测受试者的癌症的方法,所述方法包括:
a)确定来自所述受试者的样品的游离DNA(cfDNA)片段化图谱,所述cfDNA片段化图谱通过以下确定:
从所述受试者获得cfDNA片段并进行分离,
对所述cfDNA片段进行测序以获得测序片段,
将所述测序片段映射到基因组以获得映射序列窗口,以及
分析所述映射序列窗口以确定cfDNA片段长度并生成所述cfDNA片段化图谱;以及
b)通过基于所述cfDNA片段化图谱计算评分来将所述受试者分类为患有癌症或未患癌症,所述评分指示所述受试者体内存在癌症的概率,由此检测到所述受试者的癌症。
2.根据权利要求1所述的方法,其中计算所述评分包括:i)确定短cfDNA片段与长cfDNA片段的比率,ii)通过染色体臂确定所述cfDNA片段的Z评分,iii)使用计算混合模型分析来量化cfDNA片段密度,以及iv)使用机器学习模型来处理i)-iii)的输出以定义所述评分。
3.根据权利要求2所述的方法,其中所述评分的范围为0至1。
4.根据权利要求3所述的方法,其中所述受试者体内存在癌症的所述概率随着评分值的增加而增加。
5.根据权利要求4所述的方法,其中对于被分类为患有癌症的受试者,所述方法进一步包括基于所述评分确定所述受试者总体存活的概率。
6.根据权利要求5所述的方法,其中所述受试者总体存活的所述概率随着评分值的增加而降低。
7.根据权利要求6所述的方法,其进一步包括将所述评分分类为高评分或低评分,其中高评分的值大于0.5并且低评分的值小于0.5,并且其中高评分指示所述受试者的总体存活率下降。
8.根据权利要求1所述的方法,其中测序包括使所述cfDNA片段经受低覆盖率全基因组测序以获得所述测序片段。
9.根据权利要求1所述的方法,其中分离cfDNA片段包括排除小于105bp和大于170bp的片段大小。
10.根据权利要求1所述的方法,其中所述映射序列窗口包括几十至几千个窗口。
11.根据权利要求10所述的方法,其中所述窗口是非重叠窗口。
12.根据权利要求11所述的方法,其中所述窗口各自包括约500万个碱基对。
13.根据权利要求12所述的方法,其中在每个窗口内确定cfDNA片段化图谱。
14.根据权利要求1所述的方法,其中所述cfDNA片段化图谱包括所述映射序列窗口中的小cfDNA片段与大cfDNA片段的比率。
15.根据权利要求1所述的方法,其中所述cfDNA片段化图谱包括跨所述基因组的窗口中小cfDNA片段和大cfDNA片段的序列覆盖率。
16.根据权利要求1所述的方法,其中所述cfDNA片段化图谱覆盖整个基因组。
17.根据权利要求1所述的方法,其中所述cfDNA片段化图谱覆盖亚基因组区间。
18.根据权利要求1所述的方法,其中分类包括将所述cfDNA片段化图谱与参考cfDNA片段化进行比较。
19.根据权利要求18所述的方法,其中参考cfDNA片段化图谱是健康受试者的cfDNA片段化图谱。
20.根据权利要求1所述的方法,其中所述癌症是实体瘤。
21.根据权利要求20所述的方法,其中所述癌症是肉瘤、癌或淋巴瘤。
22.根据权利要求20所述的方法,其中所述癌症选自由以下组成的组:结直肠癌、前列腺癌、乳腺癌、胰腺癌、胆管癌、肝癌、CNS癌、胃癌、食道癌、胃肠道间质瘤(GIST)、子宫癌和卵巢癌。
23.根据权利要求1所述的方法,其中所述癌症是血液癌。
24.根据权利要求23所述的方法,其中所述癌症选自由以下组成的组:骨髓瘤、多发性骨髓瘤、B细胞淋巴瘤、滤泡性淋巴瘤、淋巴细胞性白血病、白血病和骨髓性白血病。
25.根据权利要求1所述的方法,其进一步包括向所述受试者施用癌症治疗。
26.根据权利要求25所述的方法,其中所述癌症治疗选自由以下组成的组:外科手术、辅助化学疗法、新辅助化学疗法、放射疗法、激素疗法、细胞毒性疗法、免疫疗法、过继性T细胞疗法、靶向疗法或其任何组合。
27.一种确定患有癌症的受试者的总体存活率的方法,所述方法包括:
a)确定来自所述受试者的样品的游离DNA(cfDNA)片段化图谱;
b)基于所述cfDNA片段化图谱计算评分,其中计算所述评分包括:i)确定所述样品的短cfDNA片段与长cfDNA片段的比率,ii)通过染色体臂确定所述样品的cfDNA片段的Z评分,iii)使用计算混合模型分析来量化cfDNA片段密度,以及iv)使用机器学习模型来处理i)-iii)的输出以定义所述评分;以及
c)基于所述评分确定所述受试者总体存活的概率,由此确定所述受试者的总体存活率。
28.根据权利要求27所述的方法,其中所述评分的范围为0至1。
29.根据权利要求28所述的方法,其中所述受试者总体存活的所述概率随着评分值的增加而降低。
30.根据权利要求29所述的方法,其进一步包括将所述评分分类为高评分或低评分,其中高评分的值大于0.5并且低评分的值小于0.5,并且其中高评分指示所述受试者的总体存活率下降。
31.根据权利要求27所述的方法,其中所述cfDNA片段化图谱通过以下确定:
从所述受试者获得cfDNA片段并进行分离,
对所述cfDNA片段进行测序以获得测序片段,
将所述测序片段映射到基因组以获得映射序列窗口,以及
分析所述映射序列窗口以确定cfDNA片段长度并生成所述cfDNA片段化图谱。
32.根据权利要求31所述的方法,其中测序包括使所述cfDNA片段经受低覆盖率全基因组测序以获得所述测序片段。
33.根据权利要求31所述的方法,其中分离cfDNA片段包括排除小于105bp和大于170bp的片段大小。
34.根据权利要求31所述的方法,其中所述映射序列窗口包括几十至几千个窗口。
35.根据权利要求34所述的方法,其中所述窗口是非重叠窗口。
36.根据权利要求35所述的方法,其中所述窗口各自包括约500万个碱基对。
37.根据权利要求36所述的方法,其中在每个窗口内确定cfDNA片段化图谱。
38.根据权利要求31所述的方法,其中所述cfDNA片段化图谱包括所述映射序列窗口中的小cfDNA片段与大cfDNA片段的比率。
39.根据权利要求31所述的方法,其中所述cfDNA片段化图谱包括跨所述基因组的窗口中小cfDNA片段和大cfDNA片段的序列覆盖率。
40.根据权利要求31所述的方法,其中所述cfDNA片段化图谱覆盖整个基因组。
41.根据权利要求31所述的方法,其中所述cfDNA片段化图谱覆盖亚基因组区间。
42.根据权利要求27所述的方法,其中所述癌症是实体瘤。
43.根据权利要求42所述的方法,其中所述癌症是肉瘤、癌或淋巴瘤。
44.根据权利要求42所述的方法,其中所述癌症选自由以下组成的组:肺癌、结直肠癌、前列腺癌、乳腺癌、胰腺癌、胆管癌、肝癌、CNS癌、胃癌、食道癌、胃肠道间质瘤(GIST)、子宫癌和卵巢癌。
45.根据权利要求27所述的方法,其中所述癌症是血液癌。
46.根据权利要求45所述的方法,其中所述癌症选自由以下组成的组:骨髓瘤、多发性骨髓瘤、B细胞淋巴瘤、滤泡性淋巴瘤、淋巴细胞性白血病、白血病和骨髓性白血病。
47.根据权利要求27所述的方法,其进一步包括向所述受试者施用癌症治疗。
48.根据权利要求47所述的方法,其中所述癌症治疗选自由以下组成的组:外科手术、辅助化学疗法、新辅助化学疗法、放射疗法、激素疗法、细胞毒性疗法、免疫疗法、过继性T细胞疗法、靶向疗法或其任何组合。
49.一种治疗患有癌症的受试者的方法,所述方法包括:
a)使用根据权利要求1至19中任一项所述的方法来检测所述受试者的癌症,或使用根据权利要求27至41中任一项所述的方法来确定所述受试者的总体存活率;以及
b)向所述受试者施用癌症治疗,由此治疗所述受试者。
50.根据权利要求49所述的方法,其中所述癌症是实体瘤。
51.根据权利要求50所述的方法,其中所述癌症是肉瘤、癌或淋巴瘤。
52.根据权利要求50所述的方法,其中所述癌症选自由以下组成的组:肺癌、结直肠癌、前列腺癌、乳腺癌、胰腺癌、胆管癌、肝癌、CNS癌、胃癌、食道癌、胃肠道间质瘤(GIST)、子宫癌和卵巢癌。
53.根据权利要求49所述的方法,其中所述癌症是血液癌。
54.根据权利要求53所述的方法,其中所述癌症选自由以下组成的组:骨髓瘤、多发性骨髓瘤、B细胞淋巴瘤、滤泡性淋巴瘤、淋巴细胞性白血病、白血病和骨髓性白血病。
55.根据权利要求49所述的方法,其中所述癌症治疗选自由以下组成的组:外科手术、辅助化学疗法、新辅助化学疗法、放射疗法、激素疗法、细胞毒性疗法、免疫疗法、过继性T细胞疗法、靶向疗法或其任何组合。
56.根据权利要求47所述的方法,其中所述受试者是人。
57.一种监测受试者的癌症的方法,所述方法包括:
a)使用根据权利要求1至19中任一项所述的方法来检测所述受试者的癌症,或使用根据权利要求27至41中任一项所述的方法来确定所述受试者的总体存活率;
b)向所述受试者施用癌症治疗;以及
c)在施用所述癌症治疗后使用根据权利要求27至41中任一项所述的方法来确定所述受试者的总体存活率,由此监测所述受试者的癌症。
58.一种用计算机程序编码的非暂时性计算机可读存储介质,所述程序包括指令,所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行操作以执行根据权利要求1至24或27至46中任一项所述的方法。
59.一种计算系统,其包括:存储器;以及耦接到所述存储器的一个或多个处理器,所述一个或多个处理器被配置成执行操作以执行根据权利要求1至24或27至46中任一项所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163172493P | 2021-04-08 | 2021-04-08 | |
US63/172,493 | 2021-04-08 | ||
PCT/US2022/023907 WO2022216981A1 (en) | 2021-04-08 | 2022-04-07 | Method of detecting cancer using genome-wide cfdna fragmentation profiles |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117561340A true CN117561340A (zh) | 2024-02-13 |
Family
ID=83546571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280027033.8A Pending CN117561340A (zh) | 2021-04-08 | 2022-04-07 | 使用全基因组cfDNA片段化图谱检测癌症的方法 |
Country Status (9)
Country | Link |
---|---|
EP (1) | EP4320277A1 (zh) |
JP (1) | JP2024515558A (zh) |
KR (1) | KR20240015624A (zh) |
CN (1) | CN117561340A (zh) |
AU (1) | AU2022254718A1 (zh) |
BR (1) | BR112023020307A2 (zh) |
CA (1) | CA3214321A1 (zh) |
IL (1) | IL307524A (zh) |
WO (1) | WO2022216981A1 (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017522908A (ja) * | 2014-07-25 | 2017-08-17 | ユニヴァーシティ オブ ワシントン | セルフリーdnaを生じる組織及び/又は細胞タイプを決定する方法、並びにそれを用いて疾患又は異常を識別する方法 |
AU2019269679A1 (en) * | 2018-05-18 | 2020-12-17 | The Johns Hopkins University | Cell-free DNA for assessing and/or treating cancer |
GB201818159D0 (en) * | 2018-11-07 | 2018-12-19 | Cancer Research Tech Ltd | Enhanced detection of target dna by fragment size analysis |
US11643693B2 (en) * | 2019-01-31 | 2023-05-09 | Guardant Health, Inc. | Compositions and methods for isolating cell-free DNA |
JP2023541368A (ja) * | 2020-08-18 | 2023-10-02 | デルフィ ダイアグノスティックス インコーポレイテッド | がんを評価するための無細胞dna断片サイズ密度のための方法及びシステム |
-
2022
- 2022-04-07 EP EP22785477.5A patent/EP4320277A1/en active Pending
- 2022-04-07 IL IL307524A patent/IL307524A/en unknown
- 2022-04-07 CA CA3214321A patent/CA3214321A1/en active Pending
- 2022-04-07 JP JP2023561634A patent/JP2024515558A/ja active Pending
- 2022-04-07 CN CN202280027033.8A patent/CN117561340A/zh active Pending
- 2022-04-07 AU AU2022254718A patent/AU2022254718A1/en active Pending
- 2022-04-07 BR BR112023020307A patent/BR112023020307A2/pt unknown
- 2022-04-07 KR KR1020237035747A patent/KR20240015624A/ko unknown
- 2022-04-07 WO PCT/US2022/023907 patent/WO2022216981A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
KR20240015624A (ko) | 2024-02-05 |
AU2022254718A1 (en) | 2023-11-16 |
BR112023020307A2 (pt) | 2023-11-21 |
JP2024515558A (ja) | 2024-04-10 |
IL307524A (en) | 2023-12-01 |
EP4320277A1 (en) | 2024-02-14 |
CA3214321A1 (en) | 2022-10-13 |
WO2022216981A1 (en) | 2022-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2024069295A (ja) | 癌を査定および/または処置するためのセルフリーdna | |
Carlsson et al. | Circulating tumor microemboli diagnostics for patients with non–small-cell lung cancer | |
Melchardt et al. | Clonal evolution in relapsed and refractory diffuse large B-cell lymphoma is characterized by high dynamics of subclones | |
JP2023541368A (ja) | がんを評価するための無細胞dna断片サイズ密度のための方法及びシステム | |
US20200219587A1 (en) | Systems and methods for using fragment lengths as a predictor of cancer | |
CN112088220B (zh) | 替代标志物及用于肿瘤突变负荷测定的方法 | |
AU2020364225B2 (en) | Fragment size characterization of cell-free DNA mutations from clonal hematopoiesis | |
EP4305211A1 (en) | Predicting response to treatments in patients with clear cell renal cell carcinoma | |
EP3502280A1 (en) | Pre-surgical risk stratification based on pde4d7 expression and pre-surgical clinical variables | |
US20210262016A1 (en) | Methods and systems for somatic mutations and uses thereof | |
Chen et al. | Cell-free DNA detection of tumor mutations in heterogeneous, localized prostate cancer via targeted, multiregion sequencing | |
Bittla et al. | Exploring Circulating Tumor DNA (CtDNA) and Its Role in Early Detection of Cancer: A Systematic Review | |
CN111833963A (zh) | 一种cfDNA分类方法、装置和用途 | |
KR20220060493A (ko) | 비기능성 전사체를 이용한 parp 저해제 또는 dna 손상 약물 감수성 판정방법 | |
CN110004229A (zh) | 多基因作为egfr单克隆抗体类药物耐药标志物的应用 | |
CN117561340A (zh) | 使用全基因组cfDNA片段化图谱检测癌症的方法 | |
CN114807370A (zh) | 一种新型的用于乳腺癌免疫治疗疗效精准预测的模型及其应用 | |
EP4318493A1 (en) | Artificial-intelligence-based method for detecting tumor-derived mutation of cell-free dna, and method for early diagnosis of cancer, using same | |
WO2023177901A1 (en) | Method of monitoring cancer using fragmentation profiles | |
Prelaj et al. | Machine Learning to Improve Treatment Selection for NSCLC Patients Treated with Immunotherapy using Real World and Translational Data | |
CN117512108A (zh) | 用于多种肿瘤筛查、诊断的基因组合标志物及其应用 | |
WO2024076769A1 (en) | Incorporating clinical risk into biomarker-based assessment for cancer pre-screening | |
CN117165679A (zh) | 肝癌肝移植术后复发标志物及其应用 | |
WO2024015493A1 (en) | Methods and systems for malignancy prediction of indeterminate pulmonary nodules |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |