ES2923602T3 - Detección y tratamiento de enfermedades que muestran heterogeneidad celular de enfermedad y sistemas y métodos para comunicar los resultados de las pruebas - Google Patents
Detección y tratamiento de enfermedades que muestran heterogeneidad celular de enfermedad y sistemas y métodos para comunicar los resultados de las pruebas Download PDFInfo
- Publication number
- ES2923602T3 ES2923602T3 ES20179648T ES20179648T ES2923602T3 ES 2923602 T3 ES2923602 T3 ES 2923602T3 ES 20179648 T ES20179648 T ES 20179648T ES 20179648 T ES20179648 T ES 20179648T ES 2923602 T3 ES2923602 T3 ES 2923602T3
- Authority
- ES
- Spain
- Prior art keywords
- cancer
- tumor
- dna
- cells
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 111
- 238000011282 treatment Methods 0.000 title claims description 96
- 238000012360 testing method Methods 0.000 title claims description 66
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title description 92
- 201000010099 disease Diseases 0.000 title description 87
- 238000001514 detection method Methods 0.000 title description 27
- 230000001413 cellular effect Effects 0.000 title description 3
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 334
- 201000011510 cancer Diseases 0.000 claims abstract description 153
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 98
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 98
- 239000002157 polynucleotide Substances 0.000 claims abstract description 98
- 238000012163 sequencing technique Methods 0.000 claims abstract description 75
- 230000001225 therapeutic effect Effects 0.000 claims abstract description 68
- 230000002068 genetic effect Effects 0.000 claims description 113
- 230000008569 process Effects 0.000 claims description 37
- 230000004075 alteration Effects 0.000 claims description 36
- 210000004369 blood Anatomy 0.000 claims description 36
- 239000008280 blood Substances 0.000 claims description 36
- 238000004458 analytical method Methods 0.000 claims description 33
- 230000004044 response Effects 0.000 claims description 18
- 210000004602 germ cell Anatomy 0.000 claims description 16
- 230000003321 amplification Effects 0.000 claims description 15
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 12
- 230000000392 somatic effect Effects 0.000 claims description 10
- 210000002700 urine Anatomy 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 8
- 238000001712 DNA sequencing Methods 0.000 claims description 6
- 238000001574 biopsy Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000002411 adverse Effects 0.000 claims description 4
- 230000036961 partial effect Effects 0.000 claims description 4
- 238000012706 support-vector machine Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000009534 blood test Methods 0.000 claims description 3
- 230000008261 resistance mechanism Effects 0.000 claims description 3
- 238000012417 linear regression Methods 0.000 claims 2
- 238000003066 decision tree Methods 0.000 claims 1
- 238000000638 solvent extraction Methods 0.000 claims 1
- 206010069754 Acquired gene mutation Diseases 0.000 abstract description 28
- 230000037439 somatic mutation Effects 0.000 abstract description 28
- 230000001747 exhibiting effect Effects 0.000 abstract description 6
- 210000004027 cell Anatomy 0.000 description 174
- 108020004414 DNA Proteins 0.000 description 140
- 102000053602 DNA Human genes 0.000 description 135
- 239000000523 sample Substances 0.000 description 87
- 229940079593 drug Drugs 0.000 description 81
- 239000003814 drug Substances 0.000 description 81
- 108090000623 proteins and genes Proteins 0.000 description 72
- 230000035772 mutation Effects 0.000 description 48
- 239000002773 nucleotide Substances 0.000 description 39
- 125000003729 nucleotide group Chemical group 0.000 description 39
- 239000012634 fragment Substances 0.000 description 35
- 210000004881 tumor cell Anatomy 0.000 description 20
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 19
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 19
- 238000002560 therapeutic procedure Methods 0.000 description 19
- 230000010076 replication Effects 0.000 description 18
- 108700028369 Alleles Proteins 0.000 description 17
- 229920002521 macromolecule Polymers 0.000 description 16
- 238000005259 measurement Methods 0.000 description 16
- 230000015654 memory Effects 0.000 description 16
- 150000007523 nucleic acids Chemical class 0.000 description 16
- 230000004077 genetic alteration Effects 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 13
- 102000039446 nucleic acids Human genes 0.000 description 13
- 108020004707 nucleic acids Proteins 0.000 description 13
- 230000036541 health Effects 0.000 description 12
- 238000003860 storage Methods 0.000 description 12
- 108091035707 Consensus sequence Proteins 0.000 description 10
- 102100039788 GTPase NRas Human genes 0.000 description 10
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 10
- 210000001124 body fluid Anatomy 0.000 description 10
- 231100000118 genetic alteration Toxicity 0.000 description 10
- 230000001575 pathological effect Effects 0.000 description 10
- 102000004169 proteins and genes Human genes 0.000 description 10
- 230000002829 reductive effect Effects 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- 206010068052 Mosaicism Diseases 0.000 description 9
- 239000010839 body fluid Substances 0.000 description 9
- 238000002512 chemotherapy Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 210000001082 somatic cell Anatomy 0.000 description 9
- 230000002159 abnormal effect Effects 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 8
- 206010009944 Colon cancer Diseases 0.000 description 7
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 7
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 description 7
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 description 7
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 7
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 206010006187 Breast cancer Diseases 0.000 description 6
- 208000026310 Breast neoplasm Diseases 0.000 description 6
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 6
- 102100030708 GTPase KRas Human genes 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 229960002465 dabrafenib Drugs 0.000 description 6
- BFSMGDJOXZAERB-UHFFFAOYSA-N dabrafenib Chemical compound S1C(C(C)(C)C)=NC(C=2C(=C(NS(=O)(=O)C=3C(=CC=CC=3F)F)C=CC=2)F)=C1C1=CC=NC(N)=N1 BFSMGDJOXZAERB-UHFFFAOYSA-N 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 6
- 230000004545 gene duplication Effects 0.000 description 6
- 208000015181 infectious disease Diseases 0.000 description 6
- 206010061289 metastatic neoplasm Diseases 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 6
- 230000004544 DNA amplification Effects 0.000 description 5
- 239000002144 L01XE18 - Ruxolitinib Substances 0.000 description 5
- 206010035226 Plasma cell myeloma Diseases 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 108091092240 circulating cell-free DNA Proteins 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 239000013068 control sample Substances 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 229940000406 drug candidate Drugs 0.000 description 5
- 239000003777 experimental drug Substances 0.000 description 5
- 239000012530 fluid Substances 0.000 description 5
- -1 for example Chemical class 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 208000032839 leukemia Diseases 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000011987 methylation Effects 0.000 description 5
- 238000007069 methylation reaction Methods 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 230000000284 resting effect Effects 0.000 description 5
- 102200055464 rs113488022 Human genes 0.000 description 5
- HFNKQEVNSGCOJV-OAHLLOKOSA-N ruxolitinib Chemical compound C1([C@@H](CC#N)N2N=CC(=C2)C=2C=3C=CNC=3N=CN=2)CCCC1 HFNKQEVNSGCOJV-OAHLLOKOSA-N 0.000 description 5
- 229960000215 ruxolitinib Drugs 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 108700024394 Exon Proteins 0.000 description 4
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 4
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 208000020584 Polyploidy Diseases 0.000 description 4
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 4
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 4
- 208000036878 aneuploidy Diseases 0.000 description 4
- 231100001075 aneuploidy Toxicity 0.000 description 4
- 230000032823 cell division Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 210000001840 diploid cell Anatomy 0.000 description 4
- 208000035475 disorder Diseases 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000001973 epigenetic effect Effects 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000007481 next generation sequencing Methods 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 230000005855 radiation Effects 0.000 description 4
- 210000003296 saliva Anatomy 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- LIRYPHYGHXZJBZ-UHFFFAOYSA-N trametinib Chemical compound CC(=O)NC1=CC=CC(N2C(N(C3CC3)C(=O)C3=C(NC=4C(=CC(I)=CC=4)F)N(C)C(=O)C(C)=C32)=O)=C1 LIRYPHYGHXZJBZ-UHFFFAOYSA-N 0.000 description 4
- 229960004066 trametinib Drugs 0.000 description 4
- 206010005003 Bladder cancer Diseases 0.000 description 3
- 208000003174 Brain Neoplasms Diseases 0.000 description 3
- 206010061818 Disease progression Diseases 0.000 description 3
- 206010059866 Drug resistance Diseases 0.000 description 3
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 3
- 229940124602 FDA-approved drug Drugs 0.000 description 3
- 206010025323 Lymphomas Diseases 0.000 description 3
- 208000003445 Mouth Neoplasms Diseases 0.000 description 3
- 208000034578 Multiple myelomas Diseases 0.000 description 3
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 3
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 3
- 206010060862 Prostate cancer Diseases 0.000 description 3
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 3
- 108020005091 Replication Origin Proteins 0.000 description 3
- 206010039491 Sarcoma Diseases 0.000 description 3
- 208000000453 Skin Neoplasms Diseases 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000005750 disease progression Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 201000004101 esophageal cancer Diseases 0.000 description 3
- 230000007614 genetic variation Effects 0.000 description 3
- 208000014829 head and neck neoplasm Diseases 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 210000002865 immune cell Anatomy 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000009533 lab test Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000013610 patient sample Substances 0.000 description 3
- 238000011458 pharmacological treatment Methods 0.000 description 3
- 230000002250 progressing effect Effects 0.000 description 3
- 238000001959 radiotherapy Methods 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 238000002604 ultrasonography Methods 0.000 description 3
- 201000005112 urinary bladder cancer Diseases 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 102000002804 Ataxia Telangiectasia Mutated Proteins Human genes 0.000 description 2
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 description 2
- 201000009030 Carcinoma Diseases 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 2
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 2
- 101150029707 ERBB2 gene Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 208000008839 Kidney Neoplasms Diseases 0.000 description 2
- 101150105104 Kras gene Proteins 0.000 description 2
- 239000005551 L01XE03 - Erlotinib Substances 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 208000000172 Medulloblastoma Diseases 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 208000015634 Rectal Neoplasms Diseases 0.000 description 2
- 201000000582 Retinoblastoma Diseases 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 208000005718 Stomach Neoplasms Diseases 0.000 description 2
- 208000024770 Thyroid neoplasm Diseases 0.000 description 2
- 208000037280 Trisomy Diseases 0.000 description 2
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 2
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 2
- 102100033254 Tumor suppressor ARF Human genes 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 238000007622 bioinformatic analysis Methods 0.000 description 2
- 239000013060 biological fluid Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010322 bone marrow transplantation Methods 0.000 description 2
- 108091092259 cell-free RNA Proteins 0.000 description 2
- 210000003169 central nervous system Anatomy 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 239000003596 drug target Substances 0.000 description 2
- 229960001433 erlotinib Drugs 0.000 description 2
- AAKJLRGGTJKAMG-UHFFFAOYSA-N erlotinib Chemical compound C=12C=C(OCCOC)C(OCCOC)=CC2=NC=NC=1NC1=CC=CC(C#C)=C1 AAKJLRGGTJKAMG-UHFFFAOYSA-N 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000003925 fat Substances 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 150000004665 fatty acids Chemical class 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000011331 genomic analysis Methods 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 201000010536 head and neck cancer Diseases 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 206010024627 liposarcoma Diseases 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 230000001394 metastastic effect Effects 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 201000005962 mycosis fungoides Diseases 0.000 description 2
- 201000000050 myeloid neoplasm Diseases 0.000 description 2
- 201000008968 osteosarcoma Diseases 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000012175 pyrosequencing Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000004043 responsiveness Effects 0.000 description 2
- 102200048955 rs121434569 Human genes 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 208000000649 small cell carcinoma Diseases 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 210000004243 sweat Anatomy 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 230000007306 turnover Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 208000030507 AIDS Diseases 0.000 description 1
- 101150023956 ALK gene Proteins 0.000 description 1
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 description 1
- 102100034580 AT-rich interactive domain-containing protein 1A Human genes 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 1
- 206010061424 Anal cancer Diseases 0.000 description 1
- 208000007860 Anus Neoplasms Diseases 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 102000052609 BRCA2 Human genes 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010004146 Basal cell carcinoma Diseases 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 1
- 206010006143 Brain stem glioma Diseases 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 208000011691 Burkitt lymphomas Diseases 0.000 description 1
- 101710098191 C-4 methylsterol oxidase ERG25 Proteins 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- ZEOWTGPWHLSLOG-UHFFFAOYSA-N Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F Chemical compound Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F ZEOWTGPWHLSLOG-UHFFFAOYSA-N 0.000 description 1
- 108091007854 Cdh1/Fizzy-related Proteins 0.000 description 1
- 102000038594 Cdh1/Fizzy-related Human genes 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 208000037051 Chromosomal Instability Diseases 0.000 description 1
- 206010065163 Clonal evolution Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 208000009798 Craniopharyngioma Diseases 0.000 description 1
- 108010058546 Cyclin D1 Proteins 0.000 description 1
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 1
- 108010025468 Cyclin-Dependent Kinase 6 Proteins 0.000 description 1
- 102000009512 Cyclin-Dependent Kinase Inhibitor p15 Human genes 0.000 description 1
- 108010009356 Cyclin-Dependent Kinase Inhibitor p15 Proteins 0.000 description 1
- 102100036252 Cyclin-dependent kinase 4 Human genes 0.000 description 1
- 102100026804 Cyclin-dependent kinase 6 Human genes 0.000 description 1
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 1
- 102100031480 Dual specificity mitogen-activated protein kinase kinase 1 Human genes 0.000 description 1
- 102100023266 Dual specificity mitogen-activated protein kinase kinase 2 Human genes 0.000 description 1
- 101150039808 Egfr gene Proteins 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 201000008228 Ependymoblastoma Diseases 0.000 description 1
- 206010014967 Ependymoma Diseases 0.000 description 1
- 206010014968 Ependymoma malignant Diseases 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- 208000006168 Ewing Sarcoma Diseases 0.000 description 1
- 101710105178 F-box/WD repeat-containing protein 7 Proteins 0.000 description 1
- 102100028138 F-box/WD repeat-containing protein 7 Human genes 0.000 description 1
- 102100023593 Fibroblast growth factor receptor 1 Human genes 0.000 description 1
- 101710182386 Fibroblast growth factor receptor 1 Proteins 0.000 description 1
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 1
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 1
- 102100027842 Fibroblast growth factor receptor 3 Human genes 0.000 description 1
- 101710182396 Fibroblast growth factor receptor 3 Proteins 0.000 description 1
- 206010053717 Fibrous histiocytoma Diseases 0.000 description 1
- 102100024165 G1/S-specific cyclin-D1 Human genes 0.000 description 1
- 102100024185 G1/S-specific cyclin-D2 Human genes 0.000 description 1
- 102100027541 GTP-binding protein Rheb Human genes 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 1
- 201000003741 Gastrointestinal carcinoma Diseases 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 102100025334 Guanine nucleotide-binding protein G(q) subunit alpha Human genes 0.000 description 1
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 1
- 102100036738 Guanine nucleotide-binding protein subunit alpha-11 Human genes 0.000 description 1
- 102100022057 Hepatocyte nuclear factor 1-alpha Human genes 0.000 description 1
- 102100035108 High affinity nerve growth factor receptor Human genes 0.000 description 1
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 101000779641 Homo sapiens ALK tyrosine kinase receptor Proteins 0.000 description 1
- 101000924266 Homo sapiens AT-rich interactive domain-containing protein 1A Proteins 0.000 description 1
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 1
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 1
- 101000967216 Homo sapiens Eosinophil cationic protein Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101000980741 Homo sapiens G1/S-specific cyclin-D2 Proteins 0.000 description 1
- 101000738568 Homo sapiens G1/S-specific cyclin-E1 Proteins 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101000857888 Homo sapiens Guanine nucleotide-binding protein G(q) subunit alpha Proteins 0.000 description 1
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 1
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 1
- 101001072407 Homo sapiens Guanine nucleotide-binding protein subunit alpha-11 Proteins 0.000 description 1
- 101001045751 Homo sapiens Hepatocyte nuclear factor 1-alpha Proteins 0.000 description 1
- 101000596894 Homo sapiens High affinity nerve growth factor receptor Proteins 0.000 description 1
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 description 1
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 1
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 101000716729 Homo sapiens Kit ligand Proteins 0.000 description 1
- 101000916644 Homo sapiens Macrophage colony-stimulating factor 1 receptor Proteins 0.000 description 1
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 1
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 1
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 1
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 1
- 101000883798 Homo sapiens Probable ATP-dependent RNA helicase DDX53 Proteins 0.000 description 1
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 1
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 description 1
- 101000579425 Homo sapiens Proto-oncogene tyrosine-protein kinase receptor Ret Proteins 0.000 description 1
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 description 1
- 101000712530 Homo sapiens RAF proto-oncogene serine/threonine-protein kinase Proteins 0.000 description 1
- 101000932478 Homo sapiens Receptor-type tyrosine-protein kinase FLT3 Proteins 0.000 description 1
- 101000742859 Homo sapiens Retinoblastoma-associated protein Proteins 0.000 description 1
- 101000771237 Homo sapiens Serine/threonine-protein kinase A-Raf Proteins 0.000 description 1
- 101000628562 Homo sapiens Serine/threonine-protein kinase STK11 Proteins 0.000 description 1
- 101000819111 Homo sapiens Trans-acting T-cell-specific transcription factor GATA-3 Proteins 0.000 description 1
- 101000823316 Homo sapiens Tyrosine-protein kinase ABL1 Proteins 0.000 description 1
- 101000934996 Homo sapiens Tyrosine-protein kinase JAK3 Proteins 0.000 description 1
- 101001087416 Homo sapiens Tyrosine-protein phosphatase non-receptor type 11 Proteins 0.000 description 1
- 101001125402 Homo sapiens Vitamin K-dependent protein C Proteins 0.000 description 1
- 206010021042 Hypopharyngeal cancer Diseases 0.000 description 1
- 206010056305 Hypopharyngeal neoplasm Diseases 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 208000037396 Intraductal Noninfiltrating Carcinoma Diseases 0.000 description 1
- 206010073094 Intraductal proliferative breast lesion Diseases 0.000 description 1
- 206010061252 Intraocular melanoma Diseases 0.000 description 1
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 1
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 1
- 208000007766 Kaposi sarcoma Diseases 0.000 description 1
- 102100020880 Kit ligand Human genes 0.000 description 1
- 239000002138 L01XE21 - Regorafenib Substances 0.000 description 1
- 206010023825 Laryngeal cancer Diseases 0.000 description 1
- 206010061523 Lip and/or oral cavity cancer Diseases 0.000 description 1
- 206010062038 Lip neoplasm Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 108010068342 MAP Kinase Kinase 1 Proteins 0.000 description 1
- 108010068353 MAP Kinase Kinase 2 Proteins 0.000 description 1
- 102100028198 Macrophage colony-stimulating factor 1 receptor Human genes 0.000 description 1
- 208000006644 Malignant Fibrous Histiocytoma Diseases 0.000 description 1
- 208000032271 Malignant tumor of penis Diseases 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 1
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 1
- 102000013609 MutL Protein Homolog 1 Human genes 0.000 description 1
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- 108010071382 NF-E2-Related Factor 2 Proteins 0.000 description 1
- 206010028729 Nasal cavity cancer Diseases 0.000 description 1
- 206010028767 Nasal sinus cancer Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 102000007530 Neurofibromin 1 Human genes 0.000 description 1
- 108010085793 Neurofibromin 1 Proteins 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 208000010505 Nose Neoplasms Diseases 0.000 description 1
- 102000001759 Notch1 Receptor Human genes 0.000 description 1
- 108010029755 Notch1 Receptor Proteins 0.000 description 1
- 102100031701 Nuclear factor erythroid 2-related factor 2 Human genes 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 206010031096 Oropharyngeal cancer Diseases 0.000 description 1
- 206010057444 Oropharyngeal neoplasm Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 1
- 206010061332 Paraganglion neoplasm Diseases 0.000 description 1
- 208000003937 Paranasal Sinus Neoplasms Diseases 0.000 description 1
- 208000000821 Parathyroid Neoplasms Diseases 0.000 description 1
- 208000002471 Penile Neoplasms Diseases 0.000 description 1
- 206010034299 Penile cancer Diseases 0.000 description 1
- 208000037581 Persistent Infection Diseases 0.000 description 1
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 1
- 206010034811 Pharyngeal cancer Diseases 0.000 description 1
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 208000007641 Pinealoma Diseases 0.000 description 1
- 208000007913 Pituitary Neoplasms Diseases 0.000 description 1
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102100038236 Probable ATP-dependent RNA helicase DDX53 Human genes 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 description 1
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 description 1
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 1
- 102100033479 RAF proto-oncogene serine/threonine-protein kinase Human genes 0.000 description 1
- 101150020518 RHEB gene Proteins 0.000 description 1
- 101150111584 RHOA gene Proteins 0.000 description 1
- 102100029981 Receptor tyrosine-protein kinase erbB-4 Human genes 0.000 description 1
- 101710100963 Receptor tyrosine-protein kinase erbB-4 Proteins 0.000 description 1
- 102100020718 Receptor-type tyrosine-protein kinase FLT3 Human genes 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 102100038042 Retinoblastoma-associated protein Human genes 0.000 description 1
- 230000018199 S phase Effects 0.000 description 1
- 108700028341 SMARCB1 Proteins 0.000 description 1
- 101150008214 SMARCB1 gene Proteins 0.000 description 1
- 102000001332 SRC Human genes 0.000 description 1
- 108060006706 SRC Proteins 0.000 description 1
- 102100025746 SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily B member 1 Human genes 0.000 description 1
- 208000004337 Salivary Gland Neoplasms Diseases 0.000 description 1
- 206010061934 Salivary gland cancer Diseases 0.000 description 1
- 208000003837 Second Primary Neoplasms Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 102100029437 Serine/threonine-protein kinase A-Raf Human genes 0.000 description 1
- 102100026715 Serine/threonine-protein kinase STK11 Human genes 0.000 description 1
- 208000009359 Sezary Syndrome Diseases 0.000 description 1
- 208000021388 Sezary disease Diseases 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000013380 Smoothened Receptor Human genes 0.000 description 1
- 101710090597 Smoothened homolog Proteins 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 208000031673 T-Cell Cutaneous Lymphoma Diseases 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 206010043515 Throat cancer Diseases 0.000 description 1
- 102100021386 Trans-acting T-cell-specific transcription factor GATA-3 Human genes 0.000 description 1
- 102100022387 Transforming protein RhoA Human genes 0.000 description 1
- 206010066901 Treatment failure Diseases 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 102100022596 Tyrosine-protein kinase ABL1 Human genes 0.000 description 1
- 102100025387 Tyrosine-protein kinase JAK3 Human genes 0.000 description 1
- 102100033019 Tyrosine-protein phosphatase non-receptor type 11 Human genes 0.000 description 1
- 208000015778 Undifferentiated pleomorphic sarcoma Diseases 0.000 description 1
- 206010046431 Urethral cancer Diseases 0.000 description 1
- 206010046458 Urethral neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 201000005969 Uveal melanoma Diseases 0.000 description 1
- 108010053099 Vascular Endothelial Growth Factor Receptor-2 Proteins 0.000 description 1
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 102100029477 Vitamin K-dependent protein C Human genes 0.000 description 1
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 208000020990 adrenal cortex carcinoma Diseases 0.000 description 1
- 208000007128 adrenocortical carcinoma Diseases 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 230000009876 antimalignant effect Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 201000011165 anus cancer Diseases 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 229910052788 barium Inorganic materials 0.000 description 1
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 208000001119 benign fibrous histiocytoma Diseases 0.000 description 1
- 208000026900 bile duct neoplasm Diseases 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 238000007469 bone scintigraphy Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000002648 combination therapy Methods 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 201000007241 cutaneous T cell lymphoma Diseases 0.000 description 1
- 238000002574 cystoscopy Methods 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 208000022602 disease susceptibility Diseases 0.000 description 1
- 206010013663 drug dependence Diseases 0.000 description 1
- 208000028715 ductal breast carcinoma in situ Diseases 0.000 description 1
- 201000007273 ductal carcinoma in situ Diseases 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 108700021358 erbB-1 Genes Proteins 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 208000024519 eye neoplasm Diseases 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 201000010175 gallbladder cancer Diseases 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 210000002980 germ line cell Anatomy 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 201000009277 hairy cell leukemia Diseases 0.000 description 1
- 201000010235 heart cancer Diseases 0.000 description 1
- 208000024348 heart neoplasm Diseases 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 201000006866 hypopharynx cancer Diseases 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 201000002313 intestinal cancer Diseases 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 206010023841 laryngeal neoplasm Diseases 0.000 description 1
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 1
- 201000006721 lip cancer Diseases 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 238000002624 low-dose chemotherapy Methods 0.000 description 1
- 238000009593 lumbar puncture Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 238000010339 medical test Methods 0.000 description 1
- 238000002483 medication Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003990 molecular pathway Effects 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002417 nutraceutical Substances 0.000 description 1
- 235000021436 nutraceutical agent Nutrition 0.000 description 1
- 201000008106 ocular cancer Diseases 0.000 description 1
- 201000002575 ocular melanoma Diseases 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 201000005443 oral cavity cancer Diseases 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 201000006958 oropharynx cancer Diseases 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 208000029211 papillomatosis Diseases 0.000 description 1
- 208000007312 paraganglioma Diseases 0.000 description 1
- 201000007052 paranasal sinus cancer Diseases 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 208000020943 pineal parenchymal cell neoplasm Diseases 0.000 description 1
- 208000010916 pituitary tumor Diseases 0.000 description 1
- 208000010626 plasma cell neoplasm Diseases 0.000 description 1
- 238000012123 point-of-care testing Methods 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 238000002600 positron emission tomography Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 208000025638 primary cutaneous T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000029340 primitive neuroectodermal tumor Diseases 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000000575 proteomic method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 229960004836 regorafenib Drugs 0.000 description 1
- FNHKPVJBJVTLMP-UHFFFAOYSA-N regorafenib Chemical compound C1=NC(C(=O)NC)=CC(OC=2C=C(F)C(NC(=O)NC=3C=C(C(Cl)=CC=3)C(F)(F)F)=CC=2)=C1 FNHKPVJBJVTLMP-UHFFFAOYSA-N 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 208000015347 renal cell adenocarcinoma Diseases 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- 102200048928 rs121434568 Human genes 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 201000002314 small intestine cancer Diseases 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 208000011117 substance-related disease Diseases 0.000 description 1
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 208000008732 thymoma Diseases 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 208000037965 uterine sarcoma Diseases 0.000 description 1
- 206010046885 vaginal cancer Diseases 0.000 description 1
- 208000013139 vaginal neoplasm Diseases 0.000 description 1
- 210000005166 vasculature Anatomy 0.000 description 1
- 229960003862 vemurafenib Drugs 0.000 description 1
- GPXBXXGIAQBQNI-UHFFFAOYSA-N vemurafenib Chemical compound CCCS(=O)(=O)NC1=CC=C(F)C(C(=O)C=2C3=CC(=CN=C3NC=2)C=2C=CC(Cl)=CC=2)=C1F GPXBXXGIAQBQNI-UHFFFAOYSA-N 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 210000003905 vulva Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Pathology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
Esta divulgación proporciona, entre otras cosas, métodos para generar y aplicar intervenciones terapéuticas. Los métodos implican, por ejemplo, (a) secuenciar polinucleótidos de células cancerosas de un sujeto; (b) identificar y cuantificar mutaciones somáticas en los polinucleótidos; (c) desarrollar un perfil de heterogeneidad tumoral en el sujeto que indique la presencia y la cantidad relativa de una pluralidad de mutaciones somáticas en los polinucleótidos, en el que diferentes cantidades relativas indican heterogeneidad tumoral; y (d) determinar una intervención terapéutica para un cáncer que presenta la heterogeneidad del tumor, en el que la intervención terapéutica es eficaz contra un cáncer que tiene el perfil de heterogeneidad del tumor determinado. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Detección y tratamiento de enfermedades que muestran heterogeneidad celular de enfermedad y sistemas y métodos para comunicar los resultados de las pruebas
ANTECEDENTES
La atención de salud recién ahora está empezando a utilizar eficazmente la información del genoma humano para diagnosticar y tratar la enfermedad. En ninguna parte es esto más crucial que en el tratamiento del cáncer, del cual mueren 7,6 millones de personas en los EE.UU. cada año, y para el cual EE.UU. gasta 87 mil millones de dólares al año en tratamiento. El cáncer se refiere a cualquier trastorno de diversas neoplasias malignas caracterizadas por la proliferación de células anaplásicas que tienden a invadir el tejido circundante y metastatizar a nuevos sitios corporales y las condiciones patológicas caracterizadas por tales crecimientos.
Una de las razones que el cáncer es difícil de tratar es que los métodos de prueba actuales no pueden ayudar a que los médicos hagan coincidir cánceres específicos con tratamientos farmacológicos eficaces. Y es un objetivo en movimiento: las células cancerosas cambian y mutan constantemente. Los cánceres pueden acumular variantes genéticas mediante, por ejemplo, mutación de células somáticas. Tales variantes incluyen, por ejemplo, variantes de secuencia y variantes de número de copia. El análisis de tumores ha indicado que diferentes células de un tumor pueden tener diferentes variantes genéticas. Tal diferenciación entre células tumorales se ha denominado heterogeneidad tumoral.
Los cánceres pueden evolucionar con el tiempo, llegando a ser resistentes a una intervención terapéutica. Se sabe que ciertas variantes se correlacionan con la capacidad de respuesta o la resistencia a intervenciones terapéuticas específicas. Serían beneficiosos tratamientos más eficaces para los cánceres que presentan heterogeneidad tumoral. Dichos cánceres pueden tratarse con una segunda intervención terapéutica diferente a la que responde el cáncer.
Métodos de secuenciación de ADN permiten la detección de variantes genéticas en el ADN de las células tumorales. Los tumores cancerosos arrojan continuamente su material genómico único al torrente sanguíneo. Desafortunadamente, estas "señales" genómicas reveladoras son tan débiles que las tecnologías de análisis genómico actuales, incluida la secuenciación de próxima generación, solo pueden detectar tales señales esporádicamente o en pacientes con una carga tumoral terminal alta. La razón principal de esto es que estas tecnologías están plagadas de tasas de error y sesgos que pueden ser órdenes de magnitud más altas que las que se requieren para detectar de manera confiable las alteraciones genómicas de novo asociadas con el cáncer.
En una tendencia paralela, para entender el significado clínico de una prueba genética, el tratamiento de los profesionales debe tener un conocimiento práctico de los principios básicos de la herencia genética y facilidades razonables, con la interpretación de probabilísticas de datos. Algunos estudios sugieren que muchos profesionales tratantes no están adecuadamente preparados para interpretar las pruebas genéticas de susceptibilidad a enfermedades. Algunos médicos tienen dificultades para interpretar datos probabilísticos relacionados con la utilidad clínica de las pruebas de diagnóstico, como el valor predictivo positivo o negativo de una prueba de laboratorio.
Las tasas de error y el sesgo en la detección de alteraciones novo genómicas asociadas con el cáncer, junto con inadecuada explicación o las implicaciones de las pruebas genéticas para el cáncer, han reducido la calidad del cuidado de pacientes con cáncer. Las sociedades profesionales, como el College of American Pathologists (CAP) y el American College of Medical Genetics (ACMG), han publicado estándares o pautas para los laboratorios que brindan pruebas genéticas, que requieren que los informes que contienen información genética incluyan contenido interpretativo que sea comprensible para médicos generalistas.
La WO 2014/121117 (Univ Leland Stanford Junior) se refiere a la "identificación y uso de marcadores de tumores de ácidos nucleicos circulantes" (título). La WO 2012/024543 ((aris Life Sciences Luxembourg Holdings) se refiere a "biomarcadores circulantes para enfermedad" (título).
SUMARIO
La invención proporciona un método que comprende usar una base de datos informática para identificar una o más intervenciones terapéuticamente eficaces para un sujeto que tiene cáncer, en donde la base de datos informática incluye, para cada uno de la pluralidad de sujetos que tiene cáncer: (i) datos de pruebas genómicas de tumores, incluyendo alteraciones somáticas, recogidas en dos o más intervalos de tiempo por sujeto mediante biopsia en serie de a Dn libre de células; (ii) una o más intervenciones terapéuticas administradas a cada uno de los sujetos en uno o más momentos; y (iii) eficacia de las intervenciones terapéuticas.
A continuación se exponen detalles adicionales del método, que incluyen métodos para obtener los datos incluidos en una base de datos informática, por ejemplo, datos de pruebas genómicas de tumores y de eficacia de
tratamiento.
En algunas realizaciones, la determinación de una intervención terapéutica tiene en cuenta las frecuencias relativas de las alteraciones genéticas relacionadas con el tumor. En algunas realizaciones, la intervención terapéutica comprende administrar, en combinación o en serie, una pluralidad de fármacos, en donde cada fármaco es relativamente más eficaz contra un cáncer que se presenta con una diferente de las mutaciones somáticas que ocurren con diferente frecuencia relativa. En algunas realizaciones, se administra en mayor cantidad un fármaco que es relativamente más eficaz contra un cáncer que se presenta con una mutación somática que se produce con una frecuencia relativa más alta. En algunas realizaciones, los fármacos se administran en dosis que se estratifican para reflejar las cantidades relativas de las variantes en el ADN. En algunas realizaciones, los cánceres que se presentan con al menos una de las variantes genéticas son resistentes a al menos uno de los fármacos. En algunas realizaciones, la determinación de una intervención terapéutica tiene en cuenta el tejido de origen del cáncer. En algunas realizaciones, la intervención terapéutica se determina basándose en una base de datos de intervenciones que han demostrado ser terapéuticas para cánceres que tienen heterogeneidad tumoral caracterizada por cada una de las mutaciones somáticas.
En algunas realizaciones, el cáncer se selecciona de carcinomas, sarcomas, leucemias, linfomas, mielomas y cánceres del sistema nervioso central (por ejemplo, cáncer de mama, cáncer de próstata, cáncer colorrectal, cáncer de cerebro, cáncer del esófago, cáncer de cabeza y cuello, cáncer de la vejiga, cáncer ginecológico, liposarcoma y mieloma múltiple). En algunas realizaciones, las células cancerosas del tumor se derivan de una célula patológica parental común. En algunas realizaciones, las células cancerosas del tumor se derivan de diferentes células cancerosas parentales del mismo o diferente tipo de cáncer. En algunas realizaciones, el método comprende además determinar una medida de las mutaciones somáticas en una o más referencias de control para determinar la cantidad relativa.
La invención reivindicada puede usarse como parte de un método que comprende: (a) realizar análisis biomolecular de polímeros biomoleculares de células de enfermedad (por ejemplo, células de enfermedad espacialmente distintas) de un sujeto; (b) identificar y cuantificar variantes biomoleculares en las macromoléculas biomoleculares; (c) desarrollar un perfil de heterogeneidad de células de enfermedad en el sujeto que indique la presencia y cantidad relativa de una pluralidad de variantes en las macromoléculas biomoleculares, en donde diferentes cantidades relativas indican heterogeneidad de células de enfermedad; y (d) determinar una intervención terapéutica para una enfermedad que muestra la heterogeneidad de las células de enfermedad, en donde la intervención terapéutica es eficaz contra una enfermedad que tiene el perfil determinado de heterogeneidad de las células de enfermedad, y en donde la intervención terapéutica se determina de acuerdo con la invención reivindicada, en base a una base de datos de intervenciones que han demostrado ser terapéuticas para cánceres que tienen heterogeneidad tumoral caracterizada por cada una de las mutaciones somáticas.
De acuerdo con la invención reivindicada, puede proporcionarse una intervención terapéutica en donde la intervención terapéutica se determina a partir de un perfil de heterogeneidad de células enfermas en el sujeto, en donde el perfil indica la presencia y la cantidad relativa de una pluralidad de las mutaciones somáticas en los polinucleótidos, en donde las cantidades relativas diferentes indican heterogeneidad de células de enfermedad; y en donde la intervención terapéutica es eficaz, según se determina por la invención reivindicada, contra una enfermedad que tiene el perfil de heterogeneidad de células de enfermedad determinado, por ejemplo, más eficaz contra una enfermedad que presenta la pluralidad de mutaciones somáticas que contra una enfermedad con cualquiera, pero no todas, de las mutaciones somáticas.
Una base de datos informática como se define en las reivindicaciones puede compilarse. La base de datos es útil para inferir la eficacia de las intervenciones terapéuticas en sujetos con un perfil genómico tumoral. En algunas realizaciones, la pluralidad de sujetos es por lo menos 50, por lo menos 500 o por lo menos 5000. En algunas realizaciones, los datos de pruebas genómicas tumorales se recopilan mediante biopsia en serie, ADN libre de células, ARN libre de células o células tumorales circulantes. En algunas realizaciones, se usan frecuencias relativas de variantes genéticas detectadas para clasificar la eficacia del tratamiento. En algunas realizaciones, se usa información adicional para ayudar a clasificar la eficacia del tratamiento incluyendo, pero no limitada a, el peso, los efectos adversos del tratamiento, las pruebas histológicas, las pruebas de sangre, la información radiográfica, los tratamientos anteriores y el tipo de cáncer. En algunas realizaciones, se recopila y clasifica cuantitativamente mediante pruebas adicionales la respuesta al tratamiento por paciente. En algunas realizaciones, la prueba adicional es una prueba basada en sangre u orina.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
La Figura 1 muestra un diagrama de flujo de un método ejemplar de determinación y uso de una intervención terapéutica.
La Figura 2 muestra un diagrama de flujo de un método ejemplar para determinar la frecuencia de variantes en una muestra corregida en base a CNV en un locus.
La Figura 3 muestra un diagrama de flujo de un método ejemplar para proporcionar ciclos de terapia pulsada
que pueden retrasar la resistencia a los fármacos.
La Figura 4 muestra un diagrama de flujo de un método ejemplar para detectar la carga tumoral usando CNV en los orígenes de la replicación para detectar el ADN de las células en división.
La Figura 5 muestra un sistema informático ejemplar.
La Figura 6 muestra un escaneo ejemplar de CNV a través de una región de un genoma de muestras que contienen células en estado de reposo y en estado de división celular. No se observa NVC genómica en los loci a y b, pero el locus c muestra duplicación de genes. En las células en estado de reposo, el número de copias es relativamente igual en todos los intervalos de la región, excepto aquellos intervalos que se superponen al locus de la duplicación de genes. En la muestra que contiene ADN de células tumorales, que están experimentando división celular, el número de copias parece aumentar inmediatamente después de los orígenes de la replicación, lo que proporciona una variación en el CNV en la región. La desviación es particularmente dramática en un locus que exhibe NVC en un origen de replicación (c).
La Figura 7 muestra un curso ejemplar de seguimiento y tratamiento de una enfermedad en un sujeto. La Figura 8 muestra un panel ejemplar de 70 genes que exhiben variación genética en el cáncer.
La Figura 9A muestra un sistema ejemplar para comunicar los resultados de las pruebas de cáncer.
La Figura 9B muestra un proceso ejemplar para reducir las tasas de error y el sesgo en las lecturas de secuencias de ADN y generar informes genéticos para los usuarios.
Las Figuras 10A-10C muestran procesos ejemplares para informar los resultados de las pruebas genéticas a los usuarios.
La Figura 10D-10I-2 muestra páginas de un informe de prueba genética ejemplar.
La Figura 10J-10P muestra varios gráficos de flujo modificados ejemplares.
La Figura 11A-11B muestra procesos ejemplares para detectar mutaciones y notificar los resultados de las pruebas a los usuarios.
DESCRIPCIÓN DETALLADA
Puede detectarse en una muestra biológica el mosaicismo biomolecular (por ejemplo, mosaicismo genético), como una población genómica heterogénea de células de ácido desoxirribonucleico (ADN). El mosaicismo genético puede existir a nivel de organismo. Por ejemplo, las variantes genéticas que surgen temprano en el desarrollo pueden dar como resultado que diferentes células somáticas tengan diferentes genomas. Un individuo puede ser una quimera, por ejemplo, producida por la fusión de dos cigotos. El trasplante de órganos de un donante alogénico puede dar como resultados mosaicos genéticos, que también pueden detectarse examinando polinucleótidos vertidos en la sangre del órgano trasplantado. La heterogeneidad de las células enfermas, en donde las células enfermas tienen diferentes variantes genéticas, es otra forma de mosaicismo genético. Puede detectar el mosaicismo y, en el caso de enfermedad, puede proporcionarse una intervención terapéutica. La realización de perfiles en todo el cuerpo del mosaicismo biomolecular puede realizase mediante el uso de polinucleótidos circulantes, que pueden derivarse u originarse de otro modo a partir de células en diversas ubicaciones del cuerpo de un sujeto.
Las células enfermas, tales como tumores, pueden evolucionar con el tiempo, resultando en diferentes sub poblaciones clonales que tienen nuevas características genéticas y fenotípicas. Esto puede resultar de mutaciones naturales a medida que las células se dividen, o pueden ser impulsadas por tratamientos que se dirigen a ciertas subpoblaciones clonales, permitiendo que los clones más resistentes al tratamiento proliferen por selección negativa. La existencia de subpoblaciones de células enfermas que tienen diferentes características genotípicas o fenotípicas se denomina aquí heterogeneidad de células enfermas o, en el caso de cáncer, heterogeneidad tumoral.
En la actualidad, los cánceres se tratan en base a formas mutantes encontradas en una biopsia de cáncer. Por ejemplo, el hallazgo de Her2+ incluso en pequeñas cantidades de células de cáncer de mama puede ser indicativo de cáncer de mama, que puede seguirse con un tratamiento que utilice una terapia anti-Her2+. Como otro ejemplo, un cáncer colorrectal en donde se encuentra un mutante de KRAS en pequeñas cantidades puede tratarse con una terapia para la que responde KRAS.
Las herramientas para el análisis fino de células enfermas (por ejemplo, tumores) permiten la detección de la heterogeneidad de las células enfermas. Además, el análisis de polinucleótidos procedentes de células enfermas ubicadas en todo el cuerpo permite un perfil de heterogeneidad de células enfermas en todo el cuerpo. El uso de ADN libre de células, o ADN circulante, es particularmente poderoso porque los polinucleótidos en la sangre no provienen de células localizadas físicamente. Más bien, incluyen células de sitios metastásicos en todo el cuerpo. Por ejemplo, el análisis puede mostrar que una población de células de cáncer de mama incluye un 90% que son Her2+ y un 10% que son Her2-. Esto puede determinarse, por ejemplo, cuantificando el ADN para cada forma en una muestra, por ejemplo, ADN libre de células (cfADN), detectando así la heterogeneidad en el tumor.
Esta información puede ser utilizada por un profesional de la salud, por ejemplo, un médico, para desarrollar intervenciones terapéuticas. Por ejemplo, un sujeto que tiene un tumor heterogéneo puede tratarse como si tuviera dos tumores, y una intervención terapéutica puede tratar cada uno de los tumores. La intervención terapéutica podría incluir, por ejemplo, una terapia de combinación que incluye un primer fármaco eficaz contra el primer tipo de tumor y un segundo fármaco eficaz contra el segundo tipo de tumor. Los fármacos se pueden administrar en cantidades que
reflejen las cantidades relativas de las formas mutantes detectadas. Por ejemplo, un fárma
mutante que se encuentra en cantidades relativas más altas puede administrarse a una dosis mayor que un fármaco para tratar la forma mutante en menor cantidad relativa. O bien, el tratamiento para el mutante en menor cantidad relativa puede retrasarse o escalonarse con respecto al mutante en mayor cantidad.
La monitorización de los cambios en el perfil de la heterogeneidad de las células patológicas a lo largo del tiempo permite calibrar la intervención terapéutica para un tumor en evolución. Por ejemplo, el análisis puede mostrar cantidades crecientes de polinucleótidos que portan mutantes de resistencia a fármacos. En este caso, la intervención terapéutica puede modificarse para disminuir la cantidad de fármaco eficaz para tratar un tumor que no porta el mutante de resistencia y aumentar la administración de un fármaco que sí trata un tumor que porta el marcador de resistencia.
Las intervenciones terapéuticas pueden ser determinadas por un profesional médico o por un algoritmo de ordenador, o una combinación de los dos. Una base de datos de acuerdo con la invención reivindicada puede contener los resultados de intervenciones terapéuticas contra enfermedades que tienen varios perfiles de heterogeneidad de células de enfermedad. La base de datos se puede consultar para determinar una intervención terapéutica para una enfermedad con un perfil particular.
Los métodos de la invención pueden ser útiles para determinar una intervención terapéutica para un sujeto que tienen un cáncer que muestra heterogeneidad de células de enfermedad, por ejemplo, heterogeneidad de tumores. Esto puede implicar analizar macromóleculas biológicas (por ejemplo, polinucleótidos de secuenciación) de células de enfermedad (por ejemplo, células de enfermedad espacialmente distintas) de un sujeto que tiene la enfermedad. Se desarrolla un perfil de heterogeneidad de las células enfermas que indica la existencia de variantes genéticas específicas de las células enfermas y la cantidad de estas variantes entre sí. Esta información, a su vez, se utiliza para determinar una intervención terapéutica que tenga en cuenta el perfil.
Células de la enfermedad
Un objeto de los métodos de esta descripción es cualquier organismo multicelular. Más específicamente, el sujeto puede ser una planta o un animal, un vertebrado, un mamífero, un ratón, un primate, un simio o un ser humano. Los animales incluyen, pero no se limitan a, animales de granja, animales deportivos y mascotas. Un sujeto puede ser un paciente, por ejemplo, un sujeto bajo el cuidado de un profesional sanitario.
A las células que presentan patología de la enfermedad se hace referencia en la presente como células enfermas.
En particular, la enfermedad es un cáncer. El cáncer es una afección caracterizada por células anormales que se dividen sin control. Los cánceres incluyen, sin limitación, carcinomas, sarcomas, leucemias, linfomas, mielomas y cánceres del sistema nervioso central. Ejemplos más específicos de cánceres son cáncer de mama, cáncer de próstata, cáncer colorrectal, cáncer de cerebro, cáncer de esófago, cáncer de cabeza y cuello, cáncer de vejiga, cáncer ginecológico, liposarcoma y mieloma múltiple.
Otros tipos de cáncer incluyen, por ejemplo, leucemia linfoblástica aguda (LLA), leucemia mieloide aguda (LMA), carcinoma adrenocortical, Sarcoma de Kaposi, cáncer anal, carcinoma de células basales, cáncer del conducto biliar, cáncer de vejiga, cáncer de hueso, osteosarcoma, maligno histiocitoma fibroso, glioma de tronco encefálico, cáncer de cerebro, craneofaringioma, ependimoblastoma, ependimoma, meduloblastoma, meduloeptitelioma, tumor del parénquima pineal, cáncer de mama, tumor bronquial, linfoma de Burkitt, linfoma no Hodgkin, cáncer de cuello uterino, leucemia LLC), leucemia mielógena crónica (LMC), cáncer de colon, cáncer colorrectal, linfoma cutáneo de células T, carcinoma ductal in situ, cáncer de endometrio, cáncer de esófago, sarcoma de Ewing, cáncer de ojo, melanoma intraocular, retinoblastoma, histiocitoma fibroso, cáncer de vesícula biliar, cáncer gástrico, glioma, leucemia de células pilosas, cáncer de cabeza y cuello, cáncer de corazón, cáncer hepatocelular (hígado), linfoma de Hodgkin, cáncer de hipofaringe, cáncer de riñón, cáncer de laringe, cáncer de labio, cáncer de cavidad oral, cáncer de pulmón, carcinoma de células microcíticas, carcinoma de células pequeñas, melanoma, cáncer de boca, síndromes mielodisplásicos, mieloma múltiple, meduloblastoma, cáncer de cavidad nasal, cáncer de seno paranasal, neuroblastoma, nasofaríngeo cáncer, cáncer oral, cáncer de orofaringe, osteosarcoma, cáncer de ovario, cáncer de páncreas, papilomatosis, paraganglioma, cáncer de paratiroides, cáncer de pene, cáncer de faringe, tumor pituitario, neoplasia de células plasmáticas, cáncer de próstata, cáncer de recto, cáncer de células renales, rabdomiosarcoma, glándula salival cáncer, síndrome de Sezary, cáncer de piel, no melanoma, cáncer de intestino delgado, sarcoma de tejidos blandos, carcinoma de células escamosas, cáncer de testículo, cáncer de garganta, timoma, cáncer de tiroides, cáncer de uretra, cáncer de útero, sarcoma de útero, cáncer de vagina, cáncer de vulva, macroglobulinemia de Waldenstrom y/o tumor de Wilms.
Un tumor es una colección de células cancerosas (células de la enfermedad de cáncer). Esto incluye, por ejemplo, una colección de células en una sola masa de células (por ejemplo, un tumor sólido), una colección de células de diferentes sitios tumorales metastásicos (tumores metastásicos) y tumores difusos (por ejemplo, células tumorales circulantes). Un tumor puede incluir células de un solo cáncer (p. ej., cáncer colorrectal) o cánceres múltiples (p. ej.,
cáncer colorrectal y cáncer de páncreas). Un tumor puede incluir células que se originan a partir de una única célula somática original o de diferentes células somáticas.
Las células de la enfermedad en el sujeto son espacialmente distintas. Las células de enfermedad son espacialmente distintas si las células están ubicadas al menos 1 cm, al menos 2 cm, al menos 5 cm o al menos 10 cm de distancia en un cuerpo, por ejemplo, en diferentes tejidos u órganos, o en el mismo tejido u órgano. En el caso del cáncer, los ejemplos de células cancerosas espacialmente distintas incluyen células cancerosas de cánceres difusos (como leucemias), células cancerosas en diferentes sitios metastásicos y células cancerosas de la misma masa de células tumorales que están separadas por al menos 1 cm.
La carga de células enfermas (por ejemplo, "carga tumoral") es una medida cuantitativa de la cantidad de células enfermas en un sujeto. Una medida de la carga de células patológicas es la fracción de macromoléculas biológicas totales en una muestra que son macromoléculas biológicas patológicas, por ejemplo, la cantidad relativa de polinucleótidos tumorales en una muestra de polinucleótidos libres de células. Por ejemplo, si el ADNc de un primer sujeto tiene un 10% de polinucleótidos cancerosos, se puede decir que el sujeto tiene una carga tumoral libre de células del 10%. Si el ADNc de un segundo sujeto tiene un 5% de polinucleótidos cancerosos, se puede decir que el segundo sujeto tiene la mitad de la carga tumoral libre de células que el primer sujeto. Estas medidas son mucho más relevantes sobre una base intrasujeto que entre sujetos, ya que la carga tumoral libre de células en un individuo puede ser mucho mayor o menor que en otro individuo a pesar de los diferentes niveles de carga de la enfermedad. Sin embargo, estas medidas pueden usarse de manera bastante efectiva para monitorear la carga de enfermedad dentro de un individuo, por ejemplo, un aumento de un 5% a un 15% de carga tumoral de ADN libre de células puede indicar una progresión significativa de la enfermedad, mientras que una disminución del 10% a 1% puede indicar una respuesta parcial al tratamiento.
Los polinucleótidos que se van a secuenciar pueden obtenerse de sitios espacialmente distintos. Esto incluye polinucleótidos obtenidos de biopsias de diferentes lugares en una sola masa tumoral. También incluye polinucleótidos procedentes de células en diferentes sitios de tumores metastásicos. Las células arrojan polinucleótidos a la sangre donde se pueden detectar como polinucleótidos libres de células (por ejemplo, ADN tumoral circulante). Los polinucleótidos libres de células también se pueden encontrar en otros fluidos corporales como la orina. Por lo tanto, cfADN proporciona un perfil más preciso de heterogeneidad tumoral en toda la población de células de la enfermedad que el A d N procedente de una única ubicación tumoral. El ADN extraído de las células de la población de células de la enfermedad en un cuerpo se denomina "ADN de carga de enfermedad" o, en el caso del cáncer, "ADN de carga de tumor".
Las células enfermas, como los tumores, pueden compartir perfiles biomoleculares iguales o similares. Por ejemplo, los tumores pueden compartir una, dos, tres o más variantes genéticas. Dichas variantes pueden compartir la misma estratificación, por ejemplo, la frecuencia más alta, la segunda frecuencia más alta, etc. Los perfiles también pueden compartir cargas de células de enfermedad similares, por ejemplo, cargas de cfADN, por ejemplo, dentro del 15%, dentro del 10%, dentro del 5% o dentro del 2%.
Analitos
Como se usa en el presente documento, una macromolécula es una molécula formada a partir de subunidades monoméricas. Las subunidades monoméricas que forman macromoléculas biológicas incluyen, por ejemplo, nucleótidos, aminoácidos, monosacáridos y ácidos grasos. Las macromoléculas biológicas incluyen, por ejemplo, biopolímeros y macromoléculas no poliméricas.
Un polinucleótido es una macromolécula que comprende un polímero de nucleótidos. Los polinucleótidos incluyen, por ejemplo, polidesoxirribonucleótidos (ADN) y polirribonucleótidos (ARN). Un polipéptido es una macromolécula que comprende un polímero de aminoácidos. Un polisacárido es una macromolécula que comprende un polímero de monosacáridos. Los lípidos son un grupo diverso de compuestos orgánicos que incluyen, por ejemplo, grasas, aceites y hormonas que comparten la característica funcional de no interactuar apreciablemente con el agua. Por ejemplo, un triglicérido es una grasa formada por tres cadenas de ácidos grasos.
Un polinucleótido cáncer (por ejemplo, ADN de cáncer) es un polinucleótido (por ejemplo, ADN) derivado de una célula de cáncer. El ADN y/o ARN del cáncer se pueden extraer de tumores, de células cancerosas aisladas o de fluidos biológicos (por ejemplo, saliva, suero, sangre u orina) en forma de ADN libre de células (cfADN) o ARN libre de células.
ADN libre de células es el ADN situado fuera de una célula en un fluido corporal, por ejemplo, en la sangre o la orina. Los ácidos nucleicos circulantes (ANC) son ácidos nucleicos que se encuentran en el torrente sanguíneo. El ADN libre de células en la sangre es una forma de ácido nucleico circulante. ADN libre de células se cree que surge de las células que mueren que arrojan su ADN en la sangre. Debido a que las células cancerosas espacialmente distintas arrojarán ADN a los fluidos corporales, como la sangre, el ADNc de los sujetos cancerosos generalmente comprende ADN canceroso de células cancerosas espacialmente distintas.
Muestras biológicas
Los analitos pueden derivar de una muestra biológica, por ejemplo, una muestra que comprende una macromolécula biológica. Una muestra biológica puede derivarse de cualquier órgano, tejido o fluido biológico. Una muestra biológica puede comprender, por ejemplo, un fluido corporal o una muestra de tejido sólido. Un ejemplo de una muestra de tejido sólido es una muestra de tumor, por ejemplo, de una biopsia de tumor sólido. Los fluidos corporales incluyen, por ejemplo, sangre, suero, células tumorales, saliva, orina, fluido linfático, fluido prostético, fluido seminal, leche, esputo, heces y lágrimas. Los fluidos corporales son fuentes particularmente buenas de macromoléculas biológicas a partir de células enfermas espacialmente distintas, ya que tales células de muchos lugares del cuerpo pueden verter estas moléculas en el fluido corporal. Por ejemplo, la sangre y la orina son buenas fuentes de polinucleótidos libres de células. Las macromoléculas de tales fuentes pueden proporcionar un perfil más preciso de las células enfermas que las macromoléculas derivadas de una masa de células enfermas localizadas.
Las cantidades de los polinucleótidos de la enfermedad en una muestra de fluido corporal pueden ser aumentadas. Dichos aumentos pueden aumentar la sensibilidad de detección de polinucleótidos patológicos. Una intervención, como una intervención terapéutica, a un sujeto que provoca la lisis de las células enfermas, vaciando su ADN en el fluido circundante. Tales intervenciones pueden incluir la administración de quimioterapia. También puede incluir la administración de radiación o ultrasonido a todo el cuerpo de un sujeto, o a una parte del cuerpo de un sujeto, como dirigirse a un tumor o un órgano enfermo. Después de la administración de la intervención y cuando aumenta la cantidad de polinucleótidos de la enfermedad en el líquido, se recoge una muestra de líquido para su análisis. El intervalo entre la administración de la intervención y la recolección puede ser lo suficientemente largo para que aumenten los polinucleótidos de la enfermedad, pero no tanto como para que se eliminen del cuerpo. Por ejemplo, se puede administrar una dosis baja de quimioterapia aproximadamente una semana antes de la recolección de la muestra.
Métodos analíticos
Hay varios tipos de análisis biomolecular incluyendo, por ejemplo, genómico, epigenético (por ejemplo, metilación), expresión de ARN y proteómica. El análisis genómico se puede realizar, por ejemplo, con un analizador genético, por ejemplo, usando secuenciación de ADN. El análisis de metilación se puede realizar, por ejemplo, mediante conversión de bases metiladas seguido de secuenciación de ADN. El análisis de expresión de ARN se puede realizar, por ejemplo, mediante hibridación de matriz de polinucleótidos. El análisis proteómico se puede realizar, por ejemplo, mediante espectrometría de masas.
Como se usa en este documento, el término "analizador genético" se refiere a un sistema que incluye un secuenciador de ADN para generar información de la secuencia de ADN y un ordenador que comprende software que realiza el análisis bioinformático en la secuencia de ADN de la información. El análisis bioinformático puede incluir, sin limitación, ensamblar datos de secuencia, detectar y cuantificar variantes genéticas en una muestra, incluidas variantes de la línea germinal (por ejemplo, heterocigosidad) y variantes de células somáticas (por ejemplo, variantes de células cancerosas).
Métodos analíticos pueden incluir la generación y la captura de la información genética. La información genética puede incluir información de secuencia genética, estados de ploidía, la identidad de una o más variantes genéticas, así como una medida cuantitativa de las variantes. El término "medida cuantitativa" se refiere a cualquier medida de cantidad, incluidas las medidas absolutas y relativas. Una medida cuantitativa puede ser, por ejemplo, un número (por ejemplo, un recuento), un porcentaje, una frecuencia, un grado o una cantidad umbral.
Los polinucleótidos se pueden analizar mediante cualquier método conocido en la técnica. Normalmente, el secuenciador de ADN empleará la secuenciación de próxima generación (por ejemplo, Illumina, 454, Ion torrent, SOLiD). El análisis de secuencia se puede realizar mediante secuenciación masivamente paralela, es decir, secuenciando simultáneamente (o en rápida sucesión) cualquiera de al menos 100.000, 1 millón, 10 millones, 100 millones o mil millones de moléculas de polinucleótidos. Los métodos de secuenciación pueden incluir, pero no se limitan a: secuenciación de alto rendimiento, pirosecuenciación, secuenciación por síntesis, secuenciación de molécula única, secuenciación de nanoporos, secuenciación de semiconductores, secuenciación por ligación, secuenciación por hibridación, ARN-Seq (Illumina), expresión génica digital (Helicos), secuenciación de próxima generación, secuenciación de una sola molécula por síntesis (SMSS) (Helicos), secuenciación paralela masiva, matriz clonal de una sola molécula (Solexa), secuenciación rápida, Maxam-Gilbert o Secuenciación de Sanger, caminata de cebadores, secuenciación usando plataformas PacBio, SOLiD, Ion Torrent, Genius (GenapSys) o Nanopore (por ejemplo, Oxford Nanopore) y cualquier otro método de secuenciación conocido en la técnica.
El secuenciador de ADN puede aplicar el método de secuenciación de Gilbert basado en la modificación química de ADN seguida por la escisión en bases específicas, o se puede aplicar la técnica de Sanger que se basa en la terminación de cadena de didesoxinucleótidos. El método Sanger se hizo popular debido a su mayor eficiencia y baja radiactividad. El secuenciador de ADN puede utilizar técnicas que no requieren amplificación de ADN (reacción
en cadena de la polimerasa - RCP), lo que acelera la preparación de la muestra antes de la secuenciación y reduce los errores. Además, se recopilan datos de secuenciación de las reacciones provocadas por la adición de nucleótidos en la hebra complementaria en tiempo real. Por ejemplo, los secuenciadores de ADN pueden utilizar un método llamado Monolécula en tiempo real (SMRT), donde los datos de secuenciación son producidos por la luz (capturada por una cámara) emitida cuando se agrega un nucleótido a la hebra complementaria por enzimas que contienen colorantes fluorescentes.
La secuenciación del genoma puede ser selectiva, por ejemplo, dirigida a porciones del genoma de interés. Por ejemplo, se sabe que muchos genes (y formas mutantes de estos genes) están asociados con varios cánceres. La secuenciación de genes seleccionados o porciones de genes puede ser suficiente para el análisis deseado. Los polinucleótidos que mapean en loci específicos en el genoma que son el tema de interés pueden aislarse para secuenciarlos, por ejemplo, mediante captura de secuencia o amplificación específica de sitio.
Una secuencia de nucleótidos (por ejemplo, secuencia de ADN) se puede referir a lecturas de secuencias en bruto o lecturas de secuencias procesadas, tales como recuentos moleculares únicos inferidos de lecturas de secuencias en bruto.
Las lecturas de secuencias generadas a partir de la secuenciación son objeto de análisis incluyendo, por ejemplo, la identificación de variantes genéticas. Esto puede incluir identificar variantes de secuencias y cuantificar el número de llamadas de bases en cada locus. La cuantificación puede implicar, por ejemplo, contar el número de lecturas mapeadas a un locus genético particular. Diferentes números de lecturas en diferentes loci pueden indicar variación en el número de copias (CNV).
Los métodos de secuenciación y bioinformática que reducen el ruido y la distorsión son particularmente útiles cuando el número de polinucleótidos diana en una muestra es pequeño en comparación con polinucleótidos no diana. Cuando las moléculas diana son pocas, la señal de la diana puede ser débil. Esto puede ser el caso, por ejemplo, en el caso del ADN libre de células, donde un pequeño número de polinucleótidos tumorales puede mezclarse con un número mucho mayor de polinucleótidos de células sanas. Los métodos de seguimiento molecular pueden ser útiles en tales situaciones. El seguimiento molecular implica el seguimiento de las lecturas de secuencia de un protocolo de secuenciación hasta las moléculas de una muestra original (por ejemplo, antes de la amplificación y/o secuenciación) de las que se derivan las lecturas. Ciertos métodos implican marcar moléculas de tal manera que múltiples lecturas de secuencias producidas a partir de moléculas originales se pueden agrupar en familias de secuencias derivadas de moléculas originales. De esta forma, se pueden filtrar las llamadas de base que representan ruido. Tales métodos se describen con más detalle en, por ejemplo, WO 2013/142389 (Schmitt et al.), US 2014/0227705 (Vogelstein et al.) y WO 2014/149134 (Talasaz et al.). Los métodos de muestreo ascendente también son útiles para determinar con mayor precisión los recuentos de moléculas en una muestra.Los métodos de muestreo superior implican determinar una medida cuantitativa de moléculas de ADN individuales para las que se detectan ambas cadenas (cadenas de Watson y Crick); determinar una medida cuantitativa de moléculas de ADN individuales para las que solo se detecta una de las cadenas de ADN; inferir de estas medidas una medida cuantitativa de moléculas de ADN individuales para las que no se detectó ninguna hebra; y utilizar estas medidas para determinar la medida cuantitativa indicativa de una serie de moléculas de ADN de doble hebra individuales en la muestra. Este método se describe en más detalle en el documento PCT/US2014/072383, presentada el 24 de diciembre de 2014.
Variantes genéticas
A las variantes genéticas también se hace referencia como "alteraciones genéticas". Las variantes genéticas son formas alternativas en un locus genético. En el genoma humano, aproximadamente el 0,1% de las posiciones de nucleótidos son polimórficas, es decir, existen en una segunda forma genética que se presenta en al menos el 1% de la población. Las mutaciones pueden introducir variantes genéticas en la línea germinal y también en las células enfermas, como el cáncer. Las secuencias de referencia, como hg19 o NCBI Build 37 o Build 38, pretenden representar un genoma de "tipo salvaje" o "normal". Sin embargo, en la medida en que tengan una sola secuencia, no identifican polimorfismos comunes que también pueden considerarse normales.
Las variantes genéticas incluyen las variantes de secuencia, número de copias de las variantes y variantes de modificación de nucleótido. Una variante de secuencia es una variación en una secuencia de nucleótidos genética. Una variante del número de copias es una desviación del tipo salvaje en el número de copias de una parte de un genoma. Las variantes genéticas incluyen, por ejemplo, variaciones de un solo nucleótido (SNP), inserciones, deleciones, inversiones, transversiones, translocaciones, fusiones de genes, fusiones de cromosomas, truncamientos de genes, variaciones en el número de copias (por ejemplo, aneuploidía, aneuploidía parcial, poliploidía, amplificación de genes), cambios anormales en las modificaciones químicas del ácido nucleico, cambios anormales en los patrones epigenéticos y cambios anormales en la metilación del ácido nucleico.
Variantes genéticas pueden ser detectadas mediante la comparación de secuencias de polinucleótidos en una muestra con una referencia, por ejemplo, a una secuencia de referencia del genoma, a un índice o a una base de datos de mutaciones conocidas. La secuencia de referencia es una secuencia de referencia disponible públicamente,
como la secuencia del genoma humano HG-19 o NCBI Build 37. La secuencia de referencia es una secuencia en una base de datos no pública. La secuencia de referencia es una secuencia de línea germinal de un organismo inferida o determinada a partir de la secuenciación de polinucleótidos del organismo.
Una mutación somática o alteración somática es una variante genética que surge en una célula somática. Las mutaciones somáticas se distinguen de las mutaciones que surgen en el genoma de una célula de la línea germinal (es decir, un espermatozoide u óvulo) o un cigoto, de un individuo. Las mutaciones somáticas, por ejemplo, las que se encuentran en las células cancerosas, se distinguen del genoma de la línea germinal de un sujeto en donde surgió el cáncer. También se pueden detectar comparando el genoma del cáncer con el genoma de la línea germinal o con un genoma de referencia. También existen variantes genéticas conocidas que son comunes en las células cancerosas. Se puede encontrar una base de datos de SNV en cáncer humano en el sitio web: cancer.sanger.ac.uk/cancergenome/projects/cosmic/.
La Figura 8 muestra genes conocidos, en cáncer, por exhibir mutaciones puntuales, amplificaciones, fusiones e indeles.
Desviación de CNV en células que se dividen rápidamente
Durante la fase S del ciclo celular, la célula replica el ADN. Una célula diploide que tiene cromosomas 2N con ADN replicado puede corresponder a aproximadamente un contenido de ADN 4x , mientras que una célula diploide que tiene cromosomas 2N sin ADN replicado puede corresponder a un contenido de ADN aproximadamente 2x . La replicación procede de los orígenes de la replicación. En los mamíferos, los orígenes de replicación están espaciados a intervalos de aproximadamente 15 kb a 300 kb. Durante este período, existen porciones del genoma en forma poliploide. Aquellas áreas entre los orígenes de replicación y la posición de la polimerasa están duplicadas, mientras que aquellas áreas más allá de la posición de la polimerasa (o justo antes del origen de replicación) todavía están en número de copia única en la hebra sometida a replicación. Cuando se escanea a través del genoma, el número de copias parece desigual o distorsionado, con regiones que existen en forma de poliploidía y regiones que existen en forma diploide. Tal escaneo parece ruidoso. Esto es cierto incluso para las células que no presentan variaciones en el número de copias en el genoma en estado de reposo. Por el contrario, una exploración de CNV en células en Go muestra un perfil en donde el número de copias es relativamente plano o no está distorsionado en todo el genoma. Debido a que las células cancerosas se dividen rápidamente, su perfil de CNV a través del genoma exhibe distorsión, independientemente de que el genoma también lleve CNV en ciertos loci.
Se puede aprovechar este hecho para detectar la carga tumoral en el ADN a partir de muestras que comprenden ADN heterogénea, por ejemplo, una mezcla de ADN de la enfermedad y el ADN saludable, como cfADN. Una manera de detectar la carga tumoral implica determinar la variación del número de copias debido a la proximidad del locus o loci examinados a varios orígenes de replicación. Las regiones que incluyen un origen de replicación tendrán muy cerca de 4 copias de ADN en ese locus (en una célula diploide), mientras que las regiones que están muy alejadas de un origen de replicación tendrán más de 2 copias (en una célula diploide). El locus o loci examinados incluyen, al menos 1 kb, al menos 10 kb, al menos 100 kb, al menos 1 mb, al menos 10 mb, al menos 100 mb, a través de un cromosoma completo o a través de un genoma completo. Se determina una medida del CNV del origen de replicación (ROCNV) en la región. Esto puede ser, por ejemplo, una medida de desviación en el número de copias de un valor de tendencia central. El valor de la tendencia central puede ser, por ejemplo, media, mediana o moda. La medida de la desviación puede ser, por ejemplo, varianza o desviación estándar. Esta medida puede compararse con una medida de ROCNV en la misma región en una muestra de control, por ejemplo, de un individuo sano o células en estado de reposo. Los ROCNV se pueden determinar dividiendo la región o regiones analizadas en particiones no superpuestas de varias longitudes y tomando una medida de CNV en esta partición. Esta medida de CNV puede derivarse del número de lecturas o fragmentos determinados para mapear en esas regiones después de la secuenciación. Las particiones pueden tener varios tamaños, para producir varios niveles de resolución, por ejemplo, un solo nivel de base (base por base), 10 bases, 100 bases, 1 kb, 10 kb o 100 kb. Las desviaciones que son mayores que un control indican la presencia de ADN en replicación, lo que, a su vez, indica malignidad. Cuanto mayor sea el grado de desviación, mayor será la cantidad de ADN de las células sometidas a división celular en la muestra.
Las variaciones del número de copias genéticas verdaderas que difieren de origen de replicación basadas en la distorsión pueden calcularse de varias maneras. Por ejemplo, las posiciones de SNP heterocigotos en los loci de CNV afectados se pueden usar para inferir la variación del número de copias calculando la desviación del 50% o el desequilibrio alélico en esos loci. La distorsión debida a la proximidad del origen de la replicación no debería afectar este desequilibrio, ya que ambas copias generalmente se copiarían a intervalos de tiempo similares y, por lo tanto, se normalizarían automáticamente (aunque los cambios alélicos podrían cambiar la replicación del origen entre las dos variantes alélicas). Por ejemplo, la duplicación de un segmento cromosómico que contiene un SNP podría detectarse en aproximadamente el 67% de las lecturas, mientras que la duplicación resultante de ROCNV se detectaría en aproximadamente el 50% de las lecturas. Se utilizan técnicas basadas en recuento que utilizan la densidad de fragmentos detectados o lecturas en un determinado lugar para calcular el número relativo de copias. Estas técnicas están generalmente limitadas por el ruido de Poisson y el sesgo sistemático debido a la preparación de la muestra de ADN y al sesgo de secuenciación. Una combinación de estos métodos también puede ser para obtener una precisión
aún mayor.
El ROCNV puede calcularse para una muestra dada y usarse para dar un valor sobre la carga tumoral libre de células a pesar de la falta de detección de variantes somáticas tradicionales, tales como SNV, NVC específicos de genes, reordenamientos genómicos, variantes epigenéticas, pérdida de heterocigosidad, etc. Los ROCNV también se pueden usar para restar la distorsión de una muestra determinada para aumentar la sensibilidad y/o especificidad de un método de estimación/detección de CNV dado al eliminar la variación que está relacionada con la proximidad del origen de replicación en lugar de debido a cambios reales en el número de copias en una célula. Las líneas celulares con cambios de número de copia conocidos o sin cambios sobre una referencia también se pueden utilizar como referencia de los ROCNV para estimar su contribución a una muestra determinada.
Puede determinarse un nivel de referencia de copias de moléculas de ADN en uno o más loci de una o más muestras de control, cada una que contiene ADN de las células sometidas a un nivel predeterminado de células de división, por ejemplo, células en estado de reposo o células tumorales que se dividen rápidamente. También se determina una medida de copias de moléculas de ADN en una muestra de prueba. La medida en las muestras de prueba puede ser de uno o más loci divididos en una o más particiones. En cada caso, una pluralidad de loci incluye cada uno un origen o replicación. La medida de copias de la muestra de prueba puede ser un promedio en todas las particiones o un nivel de varianza entre los loci. Se compara una medida de tendencia central o de variación (por ejemplo, varianza o desviación estándar) en el número de copias en la muestra de prueba con la muestra de control. Una medida que es mayor en una muestra de prueba que en un control de células en estado de reposo, o dividiéndose lentamente, indica que las células que generan el ADN en la muestra de prueba se están dividiendo más rápidamente que las células que proporcionan ADN a la muestra de control, por ejemplo, son cancerosas. De manera similar, las medidas que son similares entre una muestra de prueba y un control de células en estado de división activa indican que las células que generan el ADN en la muestra de prueba se están dividiendo a una velocidad similar a las células que se dividen rápidamente, por ejemplo, son cancerosas.
Heterogeneidad de células enfermas
Heterogeneidad de células enfermas, por ejemplo, la heterogeneidad tumoral, es la aparición de células enfermas que tienen diferentes variantes genéticas. La heterogeneidad de las células enfermas se puede determinar examinando polinucleótidos aislados de células enfermas y detectando diferencias en sus genomas. La heterogeneidad de las células enfermas también se puede inferir a partir del examen de polinucleótidos de una muestra que contiene polinucleótidos tanto de células enfermas como de células sanas basándose en diferencias en la frecuencia relativa de mutaciones somáticas. Por ejemplo, el cáncer se caracteriza por cambios a nivel genético, por ejemplo, a través de la acumulación de mutaciones somáticas en diferentes grupos clonales de células. Estos cambios pueden contribuir al crecimiento no regulado de las células cancerosas o funcionar como marcadores de capacidad de respuesta o falta de respuesta a diversas intervenciones terapéuticas.
Heterogeneidad tumoral es una condición en donde un tumor caracterizado por las células cancerosas que contienen diferentes combinaciones de variantes genéticas, por ejemplo, diferentes combinaciones de mutaciones somáticas. Es decir, el tumor puede tener diferentes células que contengan alteraciones en diferentes genes o que contengan diferentes alteraciones en el mismo gen. Por ejemplo, una primera célula podría incluir una forma mutante de BRAF, mientras que una segunda célula podría incluir formas mutantes de BRAF y ERBB2. Alternativamente, una primera célula cancerosa podría incluir el polimorfismo de un solo nucleótido EGRF 55249063 G>A, mientras que una segunda célula podría incluir el polimorfismo de un solo nucleótido EGRF 55238874 T>A. (Los números se refieren a la posición del nucleótido en la secuencia de referencia genómico.)
Por ejemplo, una célula de tumor original puede incluir una variante genética en un gen, por ejemplo, un oncogén. A medida que las células continúan dividiéndose, algunas células de la progenie, que portan la mutación original, pueden desarrollar independientemente variantes genéticas en otros genes o en diferentes partes del mismo gen. En divisiones posteriores, las células tumorales pueden acumular aún más variantes genéticas.
Perfil de la heterogeneidad de enfermedad
Pueden realizarse perfiles cuantitativos así como cualitativos de mosaicismo de enfermedad, por ejemplo, heterogeneidad tumoral. El perfil incluye información de polinucleótidos de células patológicas espacialmente distintas. El perfil es un perfil de cuerpo entero que contiene información de células distribuidas por todo el cuerpo. El análisis de polinucleótidos en cfADN permite el muestreo de ADN en toda la extensión geográfica de un tumor, en contraste con el muestreo de un área localizada de un tumor. En particular, permite el muestreo de tumores difusos y metastásicos. Esto contrasta con los métodos que detectan la mera existencia de heterogeneidad tumoral a través del muestreo localizado de un tumor. El perfil puede indicar la secuencia de nucleótidos exacta de la variante, o puede indicar simplemente un gen que porta la mutación somática.
Un perfil de heterogeneidad de las células de la enfermedad, tales como la heterogeneidad de las células tumorales, puede identificar variaciones genéticas y las cantidades relativas de cada variante. A partir de esta
información, se pueden inferir posibles distribuciones de las variantes en diferentes subpoblaciones de células. Por ejemplo, un cáncer puede comenzar con una célula que porta la mutación somática X. Como resultado de la evolución clonal, alguna progenie de esta célula puede desarrollar la variante Y. Otra progenie puede desarrollar la variante Z. A nivel celular, después del análisis, el tumor puede caracterizarse como 50% X, 35% XY y 15% XZ. A nivel de ADN (y considerando solo el ADN de las células tumorales), el perfil puede indicar 100% X, 35% Y y 15% Z. También se pueden detectar CNV en un primer locus y variantes de secuencia en un segundo locus.
La heterogeneidad tumoral puede ser detectada a partir del análisis de las secuencias de polinucleótidos de cáncer, basándose en la existencia de variaciones genómicas en diferentes loci que se producen a diferentes frecuencias. Por ejemplo, en una muestra de ADN libre de células (que probablemente contenga ADN de la línea germinal así como ADN del cáncer), se puede encontrar que una variante de secuencia de BRAF ocurre con una frecuencia del 17%, ocurre una variante de secuencia de CDKN2A. a una frecuencia del 6%, se produce una variante de secuencia de ERBB2 a una frecuencia del 3% y una variante de secuencia de ATM se produce a una frecuencia del 1%. Estas diferentes frecuencias de variantes de secuencia indican heterogeneidad tumoral. De manera similar, las secuencias genéticas que exhiben diferentes cantidades de variación en el número de copias también indican heterogeneidad tumoral. Por ejemplo, el análisis de una muestra puede mostrar diferentes niveles de amplificación para los genes EGFR y CCNE1. Esto también indica heterogeneidad tumoral.
En el caso de ADN libre de células, la detección de mutaciones somáticas se puede realizar mediante la comparación de base de las llamadas en la muestra a una secuencia de referencia o, internamente, como base de las llamadas menos frecuentes, a base de las llamadas más comunes, que se presumen en la secuencia de línea germinal. En cualquier caso, la existencia de formas subdominantes (p. ej., menos del 40% de las llamadas de bases totales) en diferentes loci y con diferente frecuencia indica heterogeneidad de células patológicas.
ADN libre de células comprende típicamente una preponderancia de ADN de las células normales que tienen el genoma de la línea germinal de secuencia y, en el caso de una enfermedad, tal como cáncer, un pequeño porcentaje de ADN de las células de cáncer y que tiene una secuencia de genoma del cáncer. Las secuencias generadas a partir de polinucleótidos en una muestra de cfADN se pueden comparar con una secuencia de referencia para detectar diferencias entre la secuencia de referencia y los polinucleótidos en el cfADN. En cualquier locus, todos o casi todos los polinucleótidos de una muestra de prueba pueden ser idénticos a un nucleótido en la secuencia de referencia. Alternativamente, un nucleótido detectado con una frecuencia cercana al 100% en una muestra puede ser diferente de un nucleótido en la secuencia de referencia. Lo más probable es que esto indique una forma polimórfica normal en este locus. Si se detecta un primer nucleótido que coincide con un nucleótido de referencia en aproximadamente el 50% y se detecta un segundo nucleótido que es diferente de un nucleótido de referencia en aproximadamente el 50%, lo más probable es que esto indique heterocigosidad normal. La heterocigosidad puede presentarse en proporciones de alelos divergentes de 50:50, por ejemplo, 60:40 o incluso 70:30. Sin embargo, si la muestra comprende un nucleótido detectable por encima del ruido a una frecuencia por debajo (de arriba) de un rango inequívocamente heterocigoto (por ejemplo, menos del 45%, menos del 40%, menos del 30%, menos del 20%, menos del 10% o menos del 5%), esto se puede atribuir a la existencia de mutaciones somáticas en un porcentaje de las células que aportan ADN a la población de cfADN. Estos pueden provenir de células enfermas, por ejemplo, células cancerosas. (El porcentaje exacto es una función de la carga tumoral). Si la frecuencia de mutaciones somáticas en dos loci genéticos diferentes es diferente, por ejemplo, 16% en un locus y 5% en otro locus, esto indica que las células de la enfermedad, por ejemplo, las células cancerosas son heterogéneas.
En el caso de ADN de tumores sólidos, que se espera que comprenden ADN tumoral predominantemente, mutaciones somáticas también pueden ser detectadas por comparación con una secuencia de referencia. Detección de mutaciones somáticas que existen en el 100% de las células tumorales puede requerir referencia a una secuencia estándar o información sobre mutantes conocidos. Sin embargo, la existencia de secuencias subdominantes entre el conjunto de polinucleótidos en diferentes loci y en diferentes frecuencias relativas, indica heterogeneidad tumoral.
El perfil puede incluir variantes genéticas en genes que se sabe que son accionables. El conocimiento de tales variantes puede contribuir a seleccionar intervenciones terapéuticas, ya que las terapias pueden dirigirse a tales variantes. En el caso del cáncer, ya se conocen muchas variantes genéticas procesables.
CNV y SNV en la heterogeneidad de células enfermas
En general, el estado del número de copias de un gen debe reflejarse en la frecuencia de una forma genética del gen en la muestra. Por ejemplo, una variante de secuencia puede detectarse a una frecuencia consistente con la homocigosidad o heterocigosidad (por ejemplo, aproximadamente el 100% o aproximadamente el 50%, respectivamente) sin variación en el número de copias. Esto es consistente con un polimorfismo o mutación de la línea germinal. Se puede detectar una variante de secuencia con una frecuencia de aproximadamente el 67% (o, alternativamente, aproximadamente el 33%) de polinucleótidos en un locus, y también en un gen medido con un mayor número de copias (generalmente, n = 2). Esto es consistente con duplicación de genes en la línea germinal. Por ejemplo, una trisomía se presentaría de esta manera. Sin embargo, si se detecta una variante de secuencia a un nivel consistente con homocigosidad (por ejemplo, aproximadamente 100%) pero en cantidades consistentes con la
variación del número de copias, es más probable que esto refleje la presencia de polinucleótidos de células enfermas que han sufrido amplificación génica. De manera similar, si se detecta una variante de secuencia a un nivel no incompatible con la heterocigosidad (p. ej., desviándose algo del 50%) pero en cantidades consistentes con la variación del número de copias, esto también es más probable que refleje la presencia de polinucleótidos de células enfermas; los polinucleótidos enfermos crean algún nivel de desequilibrio en la frecuencia de los alelos lejos de 50:50.
Esta observación puede utilizarse para inferir si una variante de secuencia es más probable presente en el nivel de línea germinal o el resultado de una mutación de células somáticas, por ejemplo, en una célula de cáncer. Por ejemplo, una variante de secuencia en un gen detectada a niveles posiblemente consistentes con heterocigosidad en la línea germinal es más probablemente el producto de una mutación somática en células enfermas si también se detecta variación en el número de copias en ese gen.
Además, en la medida en que esperamos que una duplicación de genes en la línea germinal debe soportar una variante consistente con aumento de la dosis genética (por ejemplo, aproximadamente 67% para la trisomía en un locus), la amplificación del gen de detección con una variante de secuencia dosis que se desvía significativamente de esta cantidad esperada indica que es más probable que el CNV esté presente como resultado de una mutación de células somáticas.
El hecho de que las mutaciones somáticas en diferentes loci pueden estar presentes en el número único o múltiple de copias en la misma célula de la enfermedad también puede ser utilizado para inferir la heterogeneidad tumoral. Más específicamente, se puede inferir la heterogeneidad tumoral cuando se detectan dos genes con diferente frecuencia pero su número de copias es relativamente igual. Alternativamente, se puede inferir la homogeneidad del tumor cuando la diferencia de frecuencia entre dos variantes de secuencia es coherente con la diferencia en el número de copias de los dos genes. Por lo tanto, si se detecta una variante de EGFR al 11% y una variante de KRAS al 5%, y no se detecta NVC en estos genes, la diferencia en la frecuencia probablemente refleja la heterogeneidad del tumor (p. ej., todas las células tumorales portan un mutante EGFR y la mitad de las células tumorales también portan un mutante KRAS). Alternativamente, si el gen EGFR que lleva el mutante se detecta en un número de copias aumentado, una interpretación consistente es una población homogénea de células tumorales, cada célula porta un mutante en los genes EGFR y KRAS, pero en donde el gen KRAS está duplicado. Por consiguiente, se pueden determinar tanto la frecuencia de una variante de secuencia como una medida de CNV en el locus de la variante de secuencia en una muestra. La frecuencia puede entonces corregirse para reflejar el número relativo de células que llevan la variante ponderando la frecuencia en base a la dosis por célula determinada a partir de la medida de c Nv . Este resultado es ahora más comparable en términos de número de células que llevan la variante a una variante de secuencia que no varía en número de copias.
Prueba de comunicación de los resultados
Un informe de los resultados de análisis de variante genética (por ejemplo, variantes de secuencia, CNV, heterogeneidad de las células de la enfermedad, y combinaciones de las mismas) puede ser proporcionado por un generador de informes, por ejemplo a un profesional de la salud, por ejemplo, un médico, para ayudar en la interpretación de los resultados de la prueba (por ejemplo, datos) y la selección de opciones de tratamiento. Un informe generado por un generador de informes puede proporcionar información adicional, como resultados de laboratorio clínico, que puede ser útil para diagnosticar enfermedades y seleccionar opciones de tratamiento.
Con referencia ahora a la Figura 9A, se ilustra esquemáticamente un sistema con un generador de informes 1 para informar, por ejemplo, sobre los resultados de las pruebas de cáncer y las opciones de tratamiento de los mismos. El sistema generador de informes puede ser un sistema de procesamiento de datos central configurado para establecer comunicaciones directamente con: un laboratorio o sitio de datos remoto 2, un consultorio médico/proveedor de atención médica (profesional tratante) 4 y/o un paciente/sujeto 6 a través de enlaces de comunicación. El laboratorio 2 puede ser un laboratorio médico, un laboratorio de diagnóstico, una instalación médica, una práctica médica, un dispositivo de prueba en el punto de atención o cualquier otro sitio de datos remoto capaz de generar información clínica del sujeto. La información clínica del sujeto incluye, entre otros, datos de pruebas de laboratorio, por ejemplo, análisis de variantes genéticas; datos de imágenes y rayos X; resultados de los exámenes; y diagnóstico. El proveedor de atención médica o la práctica 6 puede incluir proveedores de servicios médicos, como médicos, enfermeras, asistentes de salud en el hogar, técnicos y asistentes médicos, y la práctica puede ser cualquier centro de atención médica con proveedores de atención médica. El proveedor de atención médica o la práctica también es un sitio de datos remoto. Cuando el cáncer es una enfermedad a tratar, el sujeto puede padecer cáncer, entre otras posibles enfermedades o trastornos.
Otra información clínica para un sujeto con cáncer 6 puede incluir los resultados de pruebas de laboratorio, por ejemplo, análisis de variantes genéticas, panel metabólico, hemograma completo, etc.; datos de imágenes médicas; y/o procedimientos médicos dirigidos a diagnosticar la condición, proporcionar un pronóstico, monitorear la progresión de la enfermedad, determinar la recaída o remisión, o combinaciones de las mismas. La lista de fuentes apropiadas de información clínica para el cáncer incluye, entre otros, tomografías computarizadas, resonancias magnéticas, ecografías, gammagrafías óseas, tomografías por emisión de positrones, pruebas de médula ósea,
radiografías con bario, endoscopias, linfangiogramas, UIV (urograma intravenoso) o IVP (pielograma intravenoso), punciones lumbares, cistoscopia, pruebas inmunológicas (detección de anticuerpos anti-malignina) y pruebas de marcadores de cáncer.
La información clínica del sujeto 6 puede obtenerse del laboratorio 2 de forma manual o automática. Cuando se desee la simplicidad del sistema, la información se puede obtener automáticamente a intervalos de tiempo predeterminados o regulares. Un intervalo de tiempo regular puede referirse a un intervalo de tiempo en donde la recopilación de datos de laboratorio se lleva a cabo automáticamente en función de una medición de tiempo como horas, días, semanas, meses, años, etc. La recopilación de datos y el procesamiento se lleva a cabo al menos una vez al día. La transferencia y recopilación de datos se lleva a cabo aproximadamente de forma mensual, quincenal, semanal, varias veces a la semana o diariamente. Alternativamente, la recuperación de información puede realizarse a intervalos de tiempo predeterminados, que pueden no ser intervalos de tiempo regulares. Por ejemplo, un primer paso de recuperación puede ocurrir después de una semana y un segundo paso de recuperación puede ocurrir después de un mes. La transferencia y recopilación de datos se puede personalizar de acuerdo con la naturaleza del trastorno que se está manejando y la frecuencia de las pruebas y exámenes médicos requeridos de los sujetos.
La FIG. 9B muestra un proceso ejemplar para generar informes genéticos, que incluye un mapa de respuesta tumoral y un resumen asociado de alteraciones. Un mapa de respuesta tumoral es una representación gráfica de información genética que indica cambios a lo largo del tiempo en la información genética de un tumor, por ejemplo, cambios cualitativos y cuantitativos. Tales cambios pueden reflejar la respuesta de un sujeto a una intervención terapéutica. Este proceso puede reducir las tasas de error y el sesgo que pueden ser órdenes de magnitud superiores a lo que se requiere para detectar de manera confiable variantes genéticas de novo asociadas con el cáncer. El proceso puede comprender, en primer lugar, capturar información genética mediante la recolección de muestras de fluidos corporales como fuentes de material genético (por ejemplo, sangre, saliva, sudor, orina, etc.). Entonces, el proceso puede comprender secuenciar los materiales (11). Por ejemplo, los polinucleótidos en una muestra se pueden secuenciar, produciendo una pluralidad de lecturas de secuencia. La carga tumoral en una muestra que comprende polinucleótidos puede estimarse como el número relativo de lecturas de secuencia que llevan una variante del número total de lecturas de secuencia generadas a partir de la muestra. Cuando se analizan variantes del número de copias, la carga tumoral se puede estimar como el exceso relativo (p. ej., en el caso de la duplicación de genes) o el déficit relativo (p. ej., en el caso de eliminación de genes) del número total de lecturas de secuencia en la prueba y loci de control. Por ejemplo, una ejecución puede producir 1000 lecturas mapeadas a un locus oncogénico de las cuales 900 corresponden al tipo salvaje y 100 corresponden a un mutante de cáncer, lo que indica una variante del número de copias en este gen. Más detalles sobre la colección de muestras ejemplares y la secuenciación de los materiales genéticos se discuten a continuación en las FIGS. 10-11.
A continuación, se puede procesar la información genética (12). Entonces se pueden identificar variantes genéticas. El proceso puede comprender determinar la frecuencia de variantes genéticas en la muestra que contiene el material genético. El proceso puede comprender separar la información del ruido (13) si este proceso es ruidoso.
Los métodos de secuenciación para análisis genético pueden tener tasas de error. Por ejemplo, el sistema mySeq de Illumina puede producir tasas de error porcentuales en los dígitos bajos de un solo dígito. Para 1000 lecturas de secuencia mapeadas a un locus, se puede esperar que alrededor de 50 lecturas (alrededor del 5%) incluyan errores. Ciertas metodologías, como las descritas en el documento WO 2014/149134, pueden reducir significativamente la tasa de error. Los errores crean ruido que puede ocultar las señales del cáncer presente en niveles bajos en una muestra. Por ejemplo, si una muestra tiene una carga tumoral en un nivel cercano a la tasa de error del sistema de secuenciación, por ejemplo, alrededor del 0,1% al 5%, puede ser difícil distinguir una señal correspondiente a una variante genética debida al cáncer de una debida al ruido.
El análisis de variantes genéticas se pueden utilizar para el diagnóstico en presencia de ruido. El análisis puede basarse en la frecuencia de las variantes de secuencia o el nivel de NVC (14) y se puede establecer una indicación de confianza en el diagnóstico o un nivel para detectar variantes genéticas en el intervalo de ruido (15).
A continuación, el procedimiento puede comprender el aumento de la confianza diagnóstica. Esto se puede hacer usando una pluralidad de mediciones para aumentar la confianza del diagnóstico (16), o alternativamente utilizar mediciones en una pluralidad de puntos de tiempo para determinar si el cáncer está avanzando, en remisión o estabilizado (17). La confianza del diagnóstico se puede utilizar para identificar estados de enfermedad. Por ejemplo, los polinucleótidos libres de células tomados de un sujeto pueden incluir polinucleótidos derivados de células normales, así como polinucleótidos derivados de células enfermas, tales como células cancerosas. Los polinucleótidos de las células cancerosas pueden tener variantes genéticas, como mutaciones de células somáticas y variantes del número de copias. Cuando se secuencian polinucleótidos libres de células de una muestra de un sujeto, estos polinucleótidos cancerosos se detectan como variantes de secuencia o como variantes de número de copias.
Las mediciones de un parámetro, estén o no en el intervalo de ruido, pueden proporcionarse con un intervalo de confianza. Probado a lo largo del tiempo, se puede determinar si un cáncer está avanzando, estabilizado o en remisión comparando los intervalos de confianza a lo largo del tiempo. Cuando los intervalos de confianza se
superponen, es posible que no se pueda saber si la enfermedad está aumentando o disminuyendo, porque no existe una diferencia estadísticamente significativa entre las medidas. Sin embargo, cuando los intervalos de confianza no se superponen, esto indica la dirección de la enfermedad. Por ejemplo, comparar el punto más bajo en un intervalo de confianza en un punto temporal y el punto más alto en un intervalo de confianza en un segundo punto temporal indica la dirección.
A continuación, el proceso puede comprender generar Informe/Diagnóstico genético. El proceso puede comprender generar un gráfico genético para una pluralidad de mediciones que muestren la tendencia de mutación (18) y generar un informe que muestre los resultados y las opciones del tratamiento (19).
Las FIGS. 10A-10C muestran con más detalle una manera de generar informes genéticos y diagnóstico (por ejemplo, Informe/Diagnóstico). En una implementación, la Figura 10C muestra un pseudocódigo ejemplar ejecutado por el sistema de la Figura 9A para procesar frecuencias de alelos mutantes no informados por CNV. Sin embargo, el sistema también puede procesar frecuencias de alelos mutantes informadas por CNV.
Las muestras que comprenden material genético, tal como cfADN, se pueden recoger de un sujeto a una pluralidad de puntos de tiempo, es decir, en serie. El material genético puede secuenciarse, por ejemplo, usando un sistema de secuenciación de alto rendimiento. La secuenciación puede apuntar a loci de interés para detectar variantes genéticas, tales como genes portadores de mutaciones somáticas, genes que experimentan variación en el número de copias o genes implicados en fusiones de genes, por ejemplo, en el cáncer. En cada momento se puede determinar una medida cuantitativa de las variantes genéticas encontradas. Por ejemplo, en el caso de cfADN, la medida cuantitativa puede ser la frecuencia o el porcentaje de una variante genética entre los polinucleótidos que mapean un locus, o el número absoluto de lecturas de secuencia o polinucleótidos que mapean un locus. Las variantes genéticas que tienen una cantidad distinta de cero en al menos un punto de tiempo pueden representarse gráficamente a través de todos los puntos de tiempo. Por ejemplo, en una colección de 1000 secuencias, la variante 1 puede encontrarse en los puntos temporales 1, 2 y 3 en cantidades de 50, 30 y 0, respectivamente. La variante 2 se puede encontrar en cantidades 0, 10 y 20 en estos momentos. Estos importes se pueden normalizar, para la variante 1, al 5%, 3% y 0%, y, para la variante 2, 0%, 1% y 2%. Una representación gráfica que muestre la unión de todos los resultados distintos de cero puede indicar estas cantidades para ambas variantes en todos los puntos de tiempo. Las cantidades normalizadas se pueden escalar de modo que cada porcentaje esté representado por una capa, por ejemplo, que tenga una altura de 1 mm. Así, por ejemplo, en este caso las alturas estarían en el momento 1: alturas 5 mm (variante 1) y 0 mm (variante 2); en el momento 2: alturas 3 mm (variante 1) y 1 mm (variante 2), en el momento 3: alturas 0 mm (variante 1) y 2 mm (variante 2). La representación gráfica puede tener la forma de un gráfico de áreas apiladas, como un gráfico de flujo. Un punto de tiempo "cero" (antes del primer punto de tiempo) puede ser representado por un punto, con todos los valores en 0. La altura de la cantidad de variantes en la representación gráfica puede ser, por ejemplo, relativa o proporcional entre sí. Por ejemplo, una frecuencia de variante del 5% en un momento determinado podría representarse con una altura del doble de la de una variante con una frecuencia del 2,5% en el mismo momento. El orden de apilamiento se puede elegir para facilitar la comprensión. Por ejemplo, las variantes se pueden apilar en orden de cantidad de mayor a menor, de abajo hacia arriba. O pueden apilarse en un gráfico de flujo con la variante de mayor cantidad inicial en el medio y otras variantes de cantidad decreciente en ambos lados. Las áreas se pueden codificar por colores según la variante. Las variantes del mismo gen se pueden mostrar en diferentes tonalidades del mismo color. Por ejemplo, los mutantes KRAS se pueden mostrar en diferentes tonos de azul, los mutantes EGFR en diferentes tonos de rojo.
Pasando ahora a la Figura 10A, el proceso puede comprender recibir información genética de un secuenciador de ADN (30). Entonces, el proceso puede comprender determinar alteraciones genéticas específicas y cantidades de las mismas (32).
A continuación, se genera un mapa de respuesta tumoral. Para generar el mapa, el proceso puede comprender la normalización de las cantidades para cada alteración genética para la representación en todos los puntos de prueba y luego genera un factor de escala (34). Como se usa en este documento, el término "normalizar" generalmente se refiere a medios que ajustan valores medidos en diferentes escalas a una escala teóricamente común. Por ejemplo, los datos medidos en diferentes puntos se convierten/ajustan para que todos los valores se puedan cambiar de tamaño a una escala común. Como se usa en este documento, el término "factor de escala" generalmente se refiere a un número que escala, o multiplica, alguna cantidad. Por ejemplo, en la ecuación y = Cx, C es el factor de escala para x. C es también el coeficiente de x, y puede llamarse constante de proporcionalidad de y a x. Los valores están normalizados para permitir el trazado en una escala común que sea visualmente amigable. Y el factor de escala se usa para conocer las alturas exactas que corresponden a los valores que se trazarán (por ejemplo, el 10% de la frecuencia de alelos mutantes puede representar 1 cm en el informe donde la altura total es de 10 cm). El factor de escala se aplica a todos los puntos de prueba y, por lo tanto, se considera un factor de escala universal. Para cada punto de prueba, el proceso puede comprender la presentación de información en un mapa de respuesta tumoral (36). En la operación 36, el proceso puede comprender renderizar alteraciones y alturas relativas utilizando el factor de escala determinado (38) y asigna un indicador visual único para cada alteración (40). Además del mapa de respuesta, el proceso puede comprender generar un resumen de alteraciones y opciones de tratamiento (42). Además, se presenta información de ensayos clínicos que puede ayudar a las alteraciones genéticas particulares y otras
sugerencias de tratamiento útiles, junto con explicaciones de terminología, metodología de prueba y otra información que se agrega al informe y se presenta al usuario.
La variación del número de copia puede ser reportada como gráfico, indicando varias posiciones en el genoma y un correspondiente aumento o disminución o mantenimiento de la variación del número de copias en cada posición respectiva. Además, la variación del número de copias puede usarse para informar una puntuación porcentual que indique cuánto material patológico (o ácidos nucleicos que tienen una variación del número de copias) existe en la muestra de polinucleótido libre de células.
El informe incluye anotaciones para ayudar a los médicos a interpretar los resultados y recomendar opciones de tratamiento. La anotación puede incluir la anotación de un informe para una afección en las NCCN Clinical Practice Guidelines in Oncology™ o las pautas de práctica clínica de la American Society of Clinical Oncology (ASCO). La anotación puede incluir una lista de uno o más medicamentos aprobados por la FDA para uso no indicado en la etiqueta, uno o más medicamentos enumerados en un compendio de tratamiento contra el cáncer de los Centros de Servicios de Medicare y Medicaid (CMS) y/o uno o más medicamentos experimentales que se encuentran en literatura científica, en el informe. La anotación puede incluir conectar una opción de tratamiento farmacológico enumerada con una referencia que contenga información científica sobre la opción de tratamiento farmacológico. La información científica puede provenir de un artículo revisado por pares de una revista médica. La anotación puede incluir proporcionar un enlace a información sobre un ensayo clínico para una opción de tratamiento farmacológico en el informe. La anotación puede incluir la presentación de información en un cuadro emergente o en un cuadro flotante cerca de las opciones de tratamiento farmacológico proporcionadas en un informe electrónico. La anotación puede incluir agregar información a un informe seleccionado del grupo que consta de una o más opciones de tratamiento farmacológico, información científica sobre una o más opciones de tratamiento farmacológico, uno o más enlaces a información científica sobre una o más opciones de tratamiento farmacológico, uno o más enlaces a citas para obtener información científica sobre una o más opciones de tratamiento farmacológico e información sobre ensayos clínicos sobre una o más opciones de tratamiento farmacológico.
FIG. 10B muestra un proceso ejemplar para generar una ruta de mapa de respuesta tumoral que puede ser utilizada por un médico, por ejemplo, un médico, por ejemplo, para tomar decisiones sobre el cuidado del paciente. El proceso puede comprender primero determinar un factor de escala global (43). Para todas las frecuencias de alelos mutantes notificadas que no son CNV (variación del número de copias), el proceso puede comprender transformar el valor absoluto en una métrica/escala relativa que puede ser más fácil de graficar (por ejemplo, multiplicar la frecuencia de alelos mutantes por 100 y tomar log de ese valor) y determina un factor de escala global utilizando el valor máximo observado. Luego, el proceso implica la visualización de información del primer conjunto de datos de prueba (44). La visualización puede comprender representar gráficamente la información en una interfaz de usuario (por ejemplo, una pantalla de computadora) o en forma tangible (por ejemplo, en una hoja de papel). Para cada alteración que no sea de CNV, el proceso puede comprender multiplicar el factor de escala por un valor transformado para cada gen y usarlo como indicador de cantidad para graficar esa variante, y luego asigna un color/indicador visual único para cada alteración. Luego, el proceso puede comprender la visualización de información para los puntos de prueba posteriores (45) utilizando el siguiente pseudocódigo:
Si la composición de los resultados de la prueba no ha cambiado, continuar visualizando la fecha del panel anterior en el nuevo panel
Si las alteraciones siguen siendo las mismas, pero las cantidades han cambiado
Vuelva a calcular el indicador de cantidad para trazar esa variante y volver a trazar todos
los valores actualizados en los paneles existentes y el nuevo panel para la última fecha de prueba.
Si se agregan nuevas alteraciones
Agregue las alteraciones a la parte superior de todas las alteraciones existentes Calcule los valores de transformación
Vuelva a calcular el factor de escala
Vuelva a dibujar el mapa de respuesta, volviendo a trazar las alteraciones en la fecha de prueba anterior que aún se detectan en la fecha de prueba actual así como las nuevas alteraciones emergentes
Si la alteración existente anterior no se encuentra entre el conjunto de alteraciones detectadas
Utilice una altura de cero y grafique la cantidad de alteración para todas las fechas de prueba subsiguientes Incluir aún el color es un conjunto de colores no disponibles.
Cada panel posterior que denota una fecha de prueba también puede incluir información adicional del paciente o la intervención que puede correlacionarse con los cambios de alteración que se ven en el resto del mapa. También se pueden implementar escalas, gráficos y transformaciones similares en CNV y otros tipos de alteraciones del ADN (por ejemplo, metilación) para mostrar estas cantidades en gráficos separados o combinados. Estas anotaciones adicionales también pueden ser cuantificables y trazarse de manera similar en el mapa.
[0126] El proceso puede entonces comprender determinar un resumen de las alteraciones y las opciones de tratamiento (46). Para la alteración con las frecuencias máximas de los alelos mutantes, se realizan las siguientes acciones:
Informar todas las alteraciones para ese gen en orden decreciente de frecuencia de alelos mutantes de las alteraciones que no son de CNV
Informar todas las alteraciones de CNV para ese gen en orden decreciente de valor de CNV
Repetir para el siguiente gen con la siguiente frecuencia de alelo mutante no CNV más alta que aún no se ha informado.
Para cada alteración informada, el proceso puede comprender la inclusión de un indicador de tendencia para esa alteración en los diferentes puntos de fecha de prueba.
La agrupación de máximas frecuencias de los alelos mutantes también se puede extender más allá de los genes que se albergaron en mayores anotaciones de encapsulación tales como vías biológicas, nivel de evidencia, etc.
Las FIGS. 10D-10I muestran un informe ejemplar generado por el sistema de la FIG. 9A. En la FIG. 10D, una sección 52 de identificación del paciente proporciona información del paciente, fecha de informe e información de contacto del médico. Un mapa 54 de respuesta tumoral incluye un diagrama de flujo 56 modificado que muestra las actividades tumorales con colores únicos para cada gen mutante. El gráfico 56 tiene un cuadro de texto de explicación resumida adjunto 58. Se proporcionan más detalles en la sección 60 de un resumen de las alteraciones y opciones de tratamiento. Las alteraciones 62 y 64 se presentan en la sección 60, junto con la tendencia de mutación, la frecuencia del alelo mutante, la amplificación sin células, Indicación de medicamentos aprobados por la FDA, medicamentos aprobados por la FDA con otras indicaciones e información sobre ensayos clínicos de medicamentos. Figura 10D-1, 10D-2 y 10D-3 proporcionan vistas ampliadas de la Figura 10D.
La FIG. 10E muestra una sección de informe ejemplar que proporciona definiciones, comentarios e interpretación de las pruebas. FIGS. 10E-1 y 10E-2 proporcionan vistas ampliadas de la FIG. 10E. La FIG. 10F muestra una parte de resultado de terapia detallada ejemplar del informe. Las FIGS. 10F-1 y 10F-2 proporcionan vistas ampliadas de la FIG. 10F. La FIG. 10G muestra una discusión ejemplar de la relevancia clínica de las alteraciones detectadas. Las FIGS. 10G-1 y 10G-2 proporcionan vistas ampliadas de la FIG. 10G. La FIG. 10H muestra los medicamentos potencialmente disponibles que están pasando por ensayos clínicos. La FIG. 10I muestra los métodos de prueba y las limitaciones de los mismos. Las FIGS. 10I-1 y 10I-2 proporcionan vistas ampliadas de la FIG. 10I.
La FIG. 10J-10P muestra varios ejemplos de gráficos de flujo modificados 56. Un gráfico de flujo, o gráfico de flujo, es un tipo de gráfico de áreas apiladas que se desplaza alrededor de un eje central, dando como resultado una forma orgánica fluida. Los gráficos de flujo son una generalización de los gráficos de áreas apiladas donde la línea de base es gratuita. Al cambiar la línea de base, es posible minimizar el cambio en pendiente (o "meneo") en series individuales, lo que facilita la percepción del grosor de cualquier capa dada a través de los datos.
Por ejemplo, programas de la FIG. 10J muestran siete capas que representan al menos 8 mutantes más de tres períodos de tiempo, y un punto de tiempo "0" (todos los valores "0"). La FIG. 10K muestra un solo mutante durante 4 períodos de tiempo. No se detectan mutantes en el segundo, tercer y cuarto punto de tiempo. La FIG. 10L indica la frecuencia del alelo dominante en cada momento. La FIG. 10M muestra un único punto de tiempo con un total de cuatro mutantes en dos genes. Los mutantes se identifican por aminoácidos en una posición cambiada (es decir, EGFR T790M).
Puede renderizarse un gráfico de flujo para que no sea reflectante del eje x. El gráfico modificado aplica una escala única para denotar atributos proporcionales. El gráfico puede indicar la adición de nuevos atributos a lo largo del tiempo. La presencia o ausencia de una mutación puede reflejarse en forma gráfica, indicando varias posiciones en el genoma y un correspondiente aumento o disminución o mantenimiento de una frecuencia de mutación en cada posición respectiva. Además, pueden usarse mutaciones para informar una puntuación porcentual que indique cuánto material patológico existe en la muestra de polinucleótido libre de células. Una puntuación de confianza puede acompañar a cada mutación detectada, dadas las estadísticas conocidas de variaciones típicas en posiciones informadas en secuencias de referencia que no son enfermedades. Las mutaciones también pueden clasificarse en orden de abundancia en el sujeto o clasificarse por importancia clínicamente procesable.
El mapeo de las posiciones del genoma y la variación del número de copias para el sujeto con cáncer puede indicar que un cáncer particular es agresivo y resistente al tratamiento. El sujeto puede ser monitoreado por un período y reevaluado. Si al final del período, el perfil de variación del número de copias, por ejemplo, como se muestra en un mapa de respuesta tumoral, comienza a aumentar dramáticamente, esto puede indicar que el tratamiento actual no está funcionando. También se puede hacer una comparación con perfiles genéticos de otros sujetos. Por ejemplo, si se determina que este aumento en la variación del número de copias indica que el cáncer está avanzando, entonces el régimen de tratamiento original prescrito ya no trata el cáncer y se prescribe un nuevo tratamiento.
Estos informes se pueden enviar y acceder a ellos electrónicamente a través de Internet. El análisis de los datos de la secuencia puede ocurrir en un sitio que no sea la ubicación del sujeto. El informe se puede generar y transmitir a la ubicación del sujeto. A través de una computadora con acceso a Internet, el sujeto puede acceder a los informes que reflejan su carga tumoral.
A continuación, se describen detalles de los procesos ejemplares de prueba de genes. Pasando ahora a la FIG. 11A, un proceso ejemplar recibe materiales genéticos de una muestra de sangre u otras muestras corporales (1102). El proceso puede comprender convertir los polinucleótidos de los materiales genéticos en nucleótidos parentales marcados (1104). Los nucleótidos parentales marcados se amplifican para producir polinucleótidos de la progenie amplificados (1106). Un subconjunto de los polinucleótidos amplificados se secuencia para producir lecturas de secuencia (1108), que se agrupan en familias, cada una generada a partir de un nucleótido original marcado único (1110). En un locus seleccionado, el proceso puede comprender asignar a cada familia una puntuación de confianza para cada familia (1112). A continuación, se determina un consenso utilizando lecturas anteriores. Esto se hace revisando la puntuación de confianza previa para cada familia y, si existen puntuaciones de confianza previas consistentes, se aumenta la puntuación de confianza actual (1114). Si hay puntuaciones de confianza previas, pero son inconsistentes, la puntuación de confianza actual no se modifica en una realización (1116). La puntuación de confianza se ajusta de una manera predeterminada para las puntuaciones de confianza previas inconsistentes. Si es la primera vez que se detecta la familia, se puede reducir la puntuación de confianza actual, ya que puede ser una lectura falsa (1118). El proceso puede comprender inferir la frecuencia de la familia en el locus en el conjunto de polinucleótidos parentales marcados basándose en la puntuación de confianza. Luego, se generan informes de pruebas genéticas como se discutió anteriormente (1120).
Mientras que la información temporal se ha utilizado en las FIGS. 11A-11B para mejorar la información para la detección de mutaciones o variaciones en el número de copias, se pueden aplicar otros métodos de consenso. La comparación histórica se puede usar junto con otras secuencias de consenso que mapean una secuencia de referencia particular para detectar casos de variación genética. El mapeo de secuencias de consenso a secuencias de referencia particulares se puede medir y normalizar frente a muestras de control. Las medidas de las moléculas que mapean las secuencias de referencia se pueden comparar en un genoma para identificar áreas en el genoma en las que el número de copias varía o se pierde la heterocigosidad. Los métodos de consenso incluyen, por ejemplo, métodos lineales o no lineales para construir secuencias de consenso (p. ej., votación, promediado, estadístico, detección de máxima probabilidad a posteriori o máxima, programación dinámica, métodos Bayesianos, Markov ocultos o de máquinas de vectores de soporte, etc.) derivado de la teoría de la comunicación digital, la teoría de la información o la bioinformática. Una vez que se ha determinado la cobertura de lectura de la secuencia, se aplica un algoritmo de modelado estocástico para convertir la cobertura de lectura de la secuencia de ácido nucleico normalizada para cada región de la ventana en los estados del número de copias discretas. En algunos casos, este algoritmo puede comprender uno o más de los siguientes: modelo de Markov oculto, programación dinámica, máquina de vectores de soporte, red bayesiana, decodificación de trellis, decodificación de Viterbi, maximización de expectativas, metodologías de filtrado de Kalman y redes neuronales.
Como se muestra en la FIG. 11B, una comparación de la cobertura de la secuencia con una muestra de control o una secuencia de referencia puede ayudar en la normalización entre ventanas. Aquí, los ADN libres de células se extraen y aíslan de un fluido corporal fácilmente accesible, como sangre, sudor, saliva, orina, etc. Por ejemplo, los ADN libres de células se pueden extraer usando una variedad de métodos conocidos en la técnica, que incluyen pero sin limitarse a precipitación con isopropanol y/o purificación basada en sílice. Los ADN libres de células se pueden extraer de cualquier número de sujetos, tales como sujetos sin cáncer, sujetos con riesgo de cáncer o sujetos que se sabe que tienen cáncer (por ejemplo, por otros medios).
Después de la etapa de aislamiento/extracción, cualquiera de un número de diferentes operaciones de secuenciación se puede realizar en la muestra de polinucleótido libre de células. Las muestras se pueden procesar antes de secuenciarlas con uno o más reactivos (por ejemplo, enzimas, identificadores únicos (por ejemplo, códigos de barras), sondas, etc.). En algunos casos, si la muestra se procesa con un identificador único, como un código de barras, las muestras o fragmentos de muestras pueden etiquetarse individualmente o en subgrupos con el identificador único. La muestra etiquetada se puede usar luego en una aplicación posterior, como una reacción de secuenciación, y las moléculas individuales se pueden rastrear hasta las moléculas originales.
Los polinucleótidos libres de células pueden marcarse o rastrearse para permitir la posterior identificación y origen del polinucleótido particular. La asignación de un identificador a un individuo o subgrupos de polinucleótidos puede permitir que se asigne una identidad única a secuencias individuales o fragmentos de secuencias. Esto puede permitir la adquisición de datos de muestras individuales y no se limita a promedios de muestras. Los ácidos nucleicos u otras moléculas derivadas de una sola hebra pueden compartir una etiqueta o identificador común y, por lo tanto, pueden identificarse posteriormente como derivados de esa hebra. De manera similar, todos los fragmentos de una sola hebra de ácido nucleico pueden etiquetarse con el mismo identificador o etiqueta, permitiendo así la identificación posterior de fragmentos de la hebra parental. En otros casos, los productos de expresión génica (p. ej., ARNm) pueden marcarse para cuantificar la expresión. Se puede contar un código de barras o un código de barras en combinación con la secuencia a la que se adjunta. En otros casos más, los sistemas y métodos pueden usarse como control de
amplificación por RCP. En tales casos, múltiples productos de amplificación de una reacción de RCP pueden etiquetarse con la misma etiqueta o identificador. Si los productos se secuencian posteriormente y muestran diferencias de secuencia, las diferencias entre productos con el mismo identificador pueden atribuirse a un error de RCP. Además, las secuencias individuales pueden identificarse basándose en las características de los datos de secuencia para la propia lectura. Por ejemplo, la detección de datos de secuencia única al principio (inicio) y final (final) de las lecturas de secuenciación individuales se puede utilizar, solo o en combinación, con la longitud o el número de pares de bases de cada lectura de secuencia para asignar identidades únicas a moléculas individuales. Los fragmentos de una sola hebra de ácido nucleico, a los que se les ha asignado una identidad única, pueden permitir así la identificación posterior de fragmentos de la hebra parental. Esto se puede utilizar junto con el cuello de botella del material genético de partida inicial para limitar la diversidad.
Además, el uso de datos de secuencias únicas en las porciones de comienzo (inicio) y final (parada) de lecturas de secuenciación individual y la longitud de lectura de secuenciación se pueden usar, solos o combinados, con el uso de códigos de barras. En algunos casos, los códigos de barras pueden ser únicos. En otros casos, los códigos de barras en sí mismos pueden no ser únicos. En este caso, el uso de códigos de barras no únicos, en combinación con datos de secuencia al principio (inicio) y parada (final) de las lecturas de secuenciación individuales y la longitud de lectura de secuenciación puede permitir la asignación de una identidad única a secuencias individuales. De manera similar, los fragmentos de una sola hebra de ácido nucleico a los que se les ha asignado una identidad única pueden permitir así la identificación posterior de los fragmentos de la hebra parental.
En general, pueden prepararse secuencias de polinucleótidos libres de células para una reacción de secuenciación de aplicación corriente abajo. A menudo, un método de secuenciación es la secuenciación clásica de Sanger. Los métodos de secuenciación pueden incluir, pero no se limitan a: secuenciación de alto rendimiento, pirosecuenciación, secuenciación por síntesis, secuenciación de una sola molécula, secuenciación de nanoporos, secuenciación de semiconductores, secuenciación por ligación, secuenciación por hibridación, ARN-Seq (Illumina), Expresión génica digital (Helicos), secuenciación de próxima generación, secuenciación de molécula única por síntesis (SMSS) (Helicos), secuenciación masivamente paralela, matriz de molécula única clonal (Solexa), secuenciación rápida, secuenciación de Maxim-Gilbert, marcha de cebadores y cualquier otro método de secuenciación conocido en la técnica.
Los métodos de secuenciación implican típicamente la preparación de la muestra, la secuenciación de polinucleótidos en la muestra preparada para producir lecturas de secuencia y la manipulación bioinformática de las lecturas de secuencia para producir información genética cuantitativa y/o cualitativa sobre la muestra. La preparación de muestras típicamente implica convertir polinucleótidos en una muestra en una forma compatible con la plataforma de secuenciación utilizada. Esta conversión puede implicar marcar polinucleótidos. Las etiquetas pueden comprender etiquetas de secuencia de polinucleótidos. Las metodologías de conversión utilizadas en la secuenciación pueden no ser 100% eficientes. Por ejemplo, no es raro convertir polinucleótidos en una muestra con una eficiencia de conversión de aproximadamente 1-5%, es decir, aproximadamente 1-5% de los polinucleótidos en una muestra se convierten en polinucleótidos marcados. Los polinucleótidos que no se convierten en moléculas etiquetadas no se representan en una biblioteca etiquetada para secuenciar. Por consiguiente, los polinucleótidos que tienen variantes genéticas representadas con baja frecuencia en el material genético inicial pueden no estar representados en la biblioteca etiquetada y, por lo tanto, pueden no ser secuenciados o detectados. Al aumentar la eficiencia de conversión, aumenta la probabilidad de que un polinucleótido en el material genético inicial esté representado en la biblioteca etiquetada y, en consecuencia, se detecte mediante secuenciación. Además, en lugar de abordar directamente el problema de la baja eficiencia de conversión de la preparación de bibliotecas, la mayoría de los protocolos hasta la fecha requieren más de 1 microgramo de ADN como material de entrada. Sin embargo, cuando el material de muestra de entrada es limitado o se desea la detección de polinucleótidos con baja representación, una alta eficiencia de conversión puede secuenciar eficientemente la muestra y/o detectar adecuadamente tales polinucleótidos.
Generalmente, la detección de mutaciones se puede realizar en regiones enriquecidas selectivamente del genoma o transcriptoma purificado y aislado (1302). Las regiones específicas, que pueden incluir pero no se limitan a genes, oncogenes, genes supresores de tumores, promotores, elementos de secuencia reguladora, regiones no codificantes, miARN, snARN y similares, pueden amplificarse selectivamente de una población total de polinucleótidos libres de células. Esto se puede realizar como se describe en este documento. Por ejemplo, puede usarse secuenciación multiplex, con o sin etiquetas de código de barras para secuencias de polinucleótidos individuales. En otros ejemplos, la secuenciación se puede realizar usando cualquier plataforma de secuenciación de ácidos nucleicos conocida en la técnica. Este paso genera una pluralidad de lecturas de secuencias de fragmentos genómicos (1304). Además, se obtiene una secuencia de referencia de una muestra de control, tomada de otro sujeto. En algunos casos, el sujeto de control puede ser un sujeto que se sabe que no tiene aberraciones o enfermedades genéticas conocidas. En algunos casos, estas lecturas de secuencia pueden contener información de códigos de barras. En otros ejemplos, no se utilizan códigos de barras.
Después de la secuenciación, se puede asignar una puntuación de calidad a las lecturas. Una puntuación de calidad puede ser una representación de lecturas que indica si esas lecturas pueden ser útiles en análisis posteriores basados en un umbral. En algunos casos, algunas lecturas no son de suficiente calidad o longitud para realizar el
siguiente paso de mapeo. Las lecturas de secuenciación con una puntuación de calidad de al menos el 90%, 95%, 99%, 99,9%, 99,99% o 99,999% pueden filtrarse fuera del conjunto de datos. En otros casos, las lecturas de secuenciación asignadas a una calidad puntuada al menos 90%, 95%, 99%, 99,9%, 99,99% o 99,999% se pueden filtrar fuera del conjunto de datos. En el paso 1306, las lecturas del fragmento genómico que cumplen con un umbral de puntuación de calidad especificado se mapean en un genoma de referencia, o una secuencia de referencia que se sabe que no contiene mutaciones. Después de mapear la alineación, las lecturas de secuencia reciben una puntuación de mapeo. Una puntuación de mapeo puede ser una representación o lecturas mapeadas de nuevo a la secuencia de referencia que indica si cada posición es o no mapeable de forma única. Las lecturas pueden ser secuencias no relacionadas con el análisis de mutaciones. Por ejemplo, algunas lecturas de secuencia pueden originarse a partir de polinucleótidos contaminantes. Las lecturas de secuenciación con una puntuación de mapeo de al menos 90%, 95%, 99%, 99,9%, 99,99% o 99,999% pueden filtrarse del conjunto de datos. En otros casos, las lecturas de secuenciación asignadas una puntuación de mapeo por debajo del 90%, 95%, 99%, 99,9%, 99,99% o 99,999% se pueden filtrar fuera del conjunto de datos.
Para cada base mapeable, las bases que no cumplen el umbral mínimo de mapeo, o bases de baja calidad, pueden ser reemplazadas por las bases correspondientes que se encuentran en la secuencia de referencia.
La frecuencia de bases variante puede ser calculada como el número de lecturas que contiene la variante dividida por el número total de lecturas 1308 después de comprobar la cobertura de lecturas e identificar bases de variantes de la identificación con respecto a la secuencia de control en cada lectura. Esto puede expresarse como una proporción para cada posición mapeable en el genoma.
Para cada posición de base, las frecuencias de los cuatro nucleótidos, citosina, guanina, timina, adenina pueden analizarse en comparación con la secuencia de referencia. Se puede aplicar un algoritmo de modelado estocástico o estadístico para convertir las relaciones normalizadas para cada posición mapeable para reflejar los estados de frecuencia para cada variante base. En algunos casos, este algoritmo puede comprender uno o más de los siguientes: modelo de Markov oculto, programación dinámica, máquina de vectores de soporte, modelado bayesiano o probabilístico, decodificación de trellis, decodificación de Viterbi, maximización de expectativas, metodologías de filtrado de Kalman y redes neuronales.
Los estados de mutación discretos de cada posición de la base se pueden utilizar para identificar una variante de base con alta frecuencia de la varianza en comparación con la línea base de la secuencia de referencia. En algunos casos, la línea de base puede representar una frecuencia de al menos 0,0001%, 0,001%, 0,01%, 0,1%, 1,0%, 2,0%, 3,0%, 4,0% 5,0%, 10% o 25%. En otros casos, la línea de base podría representar una frecuencia de al menos 0,0001%, 0,001%, 0,01%, 0,1%, 1,0%, 2,0%, 3,0%, 4,0% 5,0%, 10% o 25%. En algunos casos, todas las posiciones de bases adyacentes con la variante de base o la mutación pueden fusionarse en un segmento para informar la presencia o ausencia de una mutación. En algunos casos, se pueden filtrar varias posiciones antes de fusionarlas con otros segmentos.
Después del cálculo de las frecuencias de varianza para cada posición de base, la variante con una desviación más grande para una posición específica en la secuencia derivada del sujeto en comparación con la secuencia de referencia puede ser identificada como una mutación. En algunos casos, una mutación puede ser una mutación cancerosa. En otros casos, una mutación puede estar correlacionada con un estado de enfermedad.
[0150] Una mutación o variante pueden comprender una aberración genética que incluye, pero no se limita a una única base de sustitución, o pequeños indeles, transversiones, translocaciones, inversión, deleciones, truncamientos o truncamientos de genes. En algunos casos, una mutación puede tener como máximo 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 o 20 nucleótidos de longitud. En otros casos, una mutación puede tener al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 o 20 nucleótidos de longitud.
A continuación, un consenso se determina usando las lecturas previas. Esto se hace revisando el puntaje de confianza previo para las bases correspondientes, y si existen puntajes de confianza previos consistentes, entonces el puntaje de confianza actual aumenta (1314). Si hay puntuaciones de confianza previas, pero son inconsistentes, la puntuación de confianza actual no se modifica (1316). En otros casos, la puntuación de confianza se ajusta de una manera predeterminada para las puntuaciones de confianza previas inconsistentes. Si es la primera vez que se detecta la familia, la puntuación de confianza actual puede reducirse ya que puede ser una lectura falsa (1318). El proceso puede comprender luego convertir la frecuencia de variación por cada base en estados variantes discretos para cada posición base (1320).
Pueden detectarse numerosos cánceres. Las células cancerosas, como la mayoría de las células, pueden caracterizarse por una tasa de renovación, en donde las células viejas mueren y son reemplazadas por células más nuevas. Generalmente, las células muertas, en contacto con la vasculatura de un sujeto determinado, pueden liberar ADN o fragmentos de ADN al torrente sanguíneo. Esto también se aplica a las células cancerosas durante varias etapas de la enfermedad. Las células cancerosas también pueden caracterizarse, dependiendo de la etapa de la enfermedad, por diversas aberraciones genéticas, como la variación del número de copias y las mutaciones. Este
fenómeno puede usarse para detectar la presencia o ausencia de cánceres en individuos usando los métodos y sistemas descritos en este documento.
Por ejemplo, la sangre de los sujetos con riesgo de cáncer puede ser extraida y preparada para generar una población de polinucleótidos libres de células. Pueden detectarse mutaciones o variaciones en el número de copias que pueden existir en ciertos cánceres presentes. Puede detectarse la presencia de células cancerosas en el cuerpo, a pesar de la ausencia de síntomas u otras características de la enfermedad.
Los tipos y número de cánceres que se pueden detectar pueden incluir, pero no se limitan a cánceres de la sangre, cánceres del cerebro, cánceres de pulmón, cáncer de piel, cáncer de la nariz, cánceres de garganta, cáncer de hígado, cánceres de hueso, linfomas, cánceres pancreáticos, cánceres de la piel, cánceres del intestino, cánceres de recto, cánceres de tiroides, cánceres de vejiga, cánceres de riñón, cánceres de boca, cánceres de estómago, tumores de estado sólido, tumores heterogéneos, tumores homogéneos y similares.
Puede detectarse cualquier número de aberraciones genéticas que pueden causar o resultar de cánceres. Estos pueden incluir, entre otros, mutaciones, mutaciones, indeles, variaciones en el número de copias, transversiones, translocaciones, inversión, deleciones, aneuploidía, aneuploidía parcial, poliploidía, inestabilidad cromosómica, alteraciones de la estructura cromosómica, fusiones de genes, fusiones de cromosomas, truncamientos de genes, amplificación, duplicaciones de genes, lesiones cromosómicas, lesiones del ADN, cambios anormales en las modificaciones químicas del ácido nucleico, cambios anormales en los patrones epigenéticos, cambios anormales en la infección por metilación del ácido nucleico y cáncer.
Además, pueden caracterizarse ciertos tipos de cáncer. Los datos genéticos pueden permitir a los médicos ayudar a caracterizar mejor una forma específica de cáncer. A menudo, los cánceres son heterogéneos tanto en composición como en estadios. Los datos del perfil genético pueden permitir la caracterización de subtipos específicos de cáncer que pueden ser importantes en el diagnóstico o tratamiento de ese subtipo específico. Esta información también puede proporcionar pistas al sujeto o al médico con respecto al pronóstico de un tipo específico de cáncer.
Pueden monitorizarse cánceres ya conocidos, u otras enfermedades en un sujeto particular. Esto puede permitir que el sujeto o el médico adapten las opciones de tratamiento de acuerdo con el progreso de la enfermedad. Pueden construirse perfiles genéticos de un sujeto particular del curso de la enfermedad. Los cánceres pueden progresar, volviéndose más agresivos y genéticamente inestables. En otros ejemplos, los cánceres pueden permanecer benignos, inactivos o latentes. Puede determinarse la progresión de la enfermedad.
Además, puede determinarse de la eficacia de una determinada opción de tratamiento. En un ejemplo, las opciones de tratamiento exitosas pueden aumentar la cantidad de variación en el número de copias o mutaciones detectadas en la sangre del sujeto si el tratamiento es exitoso, ya que más cánceres pueden morir y perder ADN. En otros ejemplos, esto puede no ocurrir. En otro ejemplo, quizás ciertas opciones de tratamiento pueden estar correlacionadas con perfiles genéticos de cánceres a lo largo del tiempo. Esta correlación puede resultar útil para seleccionar una terapia. Además, si se observa que un cáncer está en remisión después del tratamiento, puede monitorizarse la enfermedad residual o la recurrencia de la enfermedad.
□Varias otras enfermedades e infecciones pueden dar lugar a otros tipos de afecciones que pueden ser adecuadas para la detección y el seguimiento tempranos. Por ejemplo, en determinados casos, los trastornos genéticos o las enfermedades infecciosas pueden provocar un cierto mosaicismo genético dentro de un sujeto. Este mosaicismo genético puede causar variaciones en el número de copias y mutaciones que podrían observarse. También pueden monitorizarse los genomas de las células inmunes dentro del cuerpo. Las células inmunes, como las células B, pueden experimentar una rápida expansión clonal ante la presencia de ciertas enfermedades. Las expansiones clonales pueden monitorearse usando la detección de variación del número de copias y pueden monitorearse ciertos estados inmunes. En este ejemplo, se puede realizar un análisis de variación del número de copias a lo largo del tiempo para producir un perfil de cómo puede estar progresando una enfermedad en particular.
Además, también pueden monitorizarse infecciones sistémicas, como pueden causarse por un patógeno tal como una bacteria o virus. Se puede utilizar la variación del número de copias o incluso la detección de mutaciones para determinar cómo está cambiando una población de patógenos durante el curso de la infección. Esto puede ser particularmente importante durante infecciones crónicas, como las infecciones por VIH/SIDA o hepatitis, en las que los virus pueden cambiar el estado del ciclo de vida y/o mutar en formas más virulentas durante el curso de la infección.
También puede monitorizarse a los sujetos con trasplantes. Generalmente, el tejido trasplantado sufre un cierto grado de rechazo por parte del cuerpo tras el trasplante. Pueden determinarse o realizarse perfiles de las actividades de rechazo del cuerpo huésped, cuando las células inmunes intentan destruir el tejido trasplantado. Esto puede ser útil para controlar el estado del tejido trasplantado, así como para alterar el curso del tratamiento o la prevención del rechazo.
Además, puede caracterizarse la heterogeneidad de una condición anormal en un sujeto, comprendiendo la
generación de un perfil genético de polinucleótidos extracelulares en el sujeto, en donde el perfil genético comprende una pluralidad de datos que resultan de análisis de variación y mutación del número de copias. En algunos casos, incluidos, entre otros, el cáncer, una enfermedad puede ser heterogénea. Las células de la enfermedad pueden no ser idénticas. En el ejemplo del cáncer, se sabe que algunos tumores comprenden diferentes tipos de células tumorales, algunas células en diferentes etapas del cáncer. En otros ejemplos, la heterogeneidad puede comprender múltiples focos de enfermedad. Nuevamente, en el ejemplo del cáncer, puede haber múltiples focos tumorales, quizás donde uno o más focos son el resultado de metástasis que se han diseminado desde un sitio primario.
Puede generarse un perfil, huella o conjunto de datos que es una suma de la información genética procedente de diferentes células en una enfermedad heterogénea. Este conjunto de datos puede comprender la variación del número de copias y los análisis de mutaciones solos o en combinación.
Además, pueden diagnosticarse, pronosticarse, monitorizarse u observarse cánceres u otras enfermedades de origen fetal. Es decir, estas metodologías pueden emplearse en una paciente embarazada para diagnosticar, pronosticar, monitorear u observar cánceres u otras enfermedades en un sujeto por nacer cuyo ADN y otros polinucleótidos pueden co-circular con moléculas maternas.
Además, estos informes se envían y se accede a ellos electrónicamente a través de Internet. El análisis de los datos de la secuencia se produce en un sitio diferente al del sujeto. El informe se genera y se transmite a la ubicación del sujeto. A través de una computadora con acceso a Internet, el sujeto accede a los informes que reflejan su carga tumoral.
La información anotada puede ser utilizada por un proveedor de atención médica para seleccionar otras opciones de tratamiento con medicamentos y/o proporcionar información sobre opciones de tratamiento con medicamentos a una compañía de seguros. Pueden anotarse las opciones de tratamiento farmacológico para una afección en, por ejemplo, las NCCN Clinical Practice Guidelines in Oncology™ o las pautas de práctica clínica de la Sociedad Estadounidense de Oncología Clínica (ASCO).
Las opciones de tratamiento de drogas que se estratifican en un informe se pueden anotar en el informe haciendo una lista de opciones de tratamiento de fármacos adicionales. Un tratamiento farmacológico adicional puede ser un medicamento aprobado por la FDA para un uso no indicado en la etiqueta. Una disposición de la 1993 Omnibus Budget Reconciliation Act (OBRA) requiere que Medicare cubra los usos no aprobados de medicamentos contra el cáncer que están incluidos en los compendios médicos estándar. Los medicamentos utilizados para anotar listas se pueden encontrar en los compendios aprobados por CMS, incluido el National Comprehensive Cancer Network (NCCN) Drugs and Biologics Compendium™, Thomson Micromedex DrugDex®, el compendio de Elsevier Gold Standard's Clinical Pharmacology y el American Hospital Formulary Service-Drug Information Compendium®.
Las opciones de tratamiento de drogas se pueden anotar enumerando un fármaco experimental que puede ser útil en el tratamiento de un cáncer con uno o más marcadores moleculares de un estado particular. El fármaco experimental puede ser un fármaco para el que se dispone de datos in vitro, datos in vivo, datos de modelos animales, datos de ensayos preclínicos o datos de ensayos clínicos. Los datos se pueden publicar en literatura médica revisada por pares que se encuentra en revistas incluidas en el CMS Medicare Benefit Policy Manual, que incluyen, por ejemplo, American Journal of Medicine, Annals of Internal Medicine, Annals of Oncology, Annals of Surgical Oncology, Biology of Blood y trasplante de médula ósea, sangre, trasplante de médula ósea, British Journal of Cancer, British Journal of Hematology, British Medical Journal, Cancer, Clinical Cancer Research, Drugs, European Journal of Cancer (anteriormente European Journal of Cancer and Clinical Oncology), Gynecologic Oncology, International Journal of Radiation, Oncology, Biology, and Physics, The Journal of the American Medical Association, Journal of Clinical Oncology, Journal of the National Cancer Institute, Journal of the National Comprehensive Cancer Network (NCCN), Journal of Urology, Lancet, Lancet Oncology, Leukemia, The New England Journal of Medicine, y Radiation Oncology.
Las opciones de tratamiento farmacológico se pueden anotar proporcionando un enlace en un informe electrónico que conecte un medicamento listado con información científica sobre el medicamento. Por ejemplo, se puede proporcionar un enlace a información sobre un ensayo clínico de un medicamento (clinicaltrials.gov). Si el informe se proporciona a través de una computadora o un sitio web informático, el enlace puede ser una nota al pie de página, un hipervínculo a un sitio web, un cuadro emergente o un cuadro desplegable con información, etc. El informe y la información anotada pueden ser proporcionados en un formulario impreso, y las anotaciones pueden ser, por ejemplo, una nota al pie de una referencia.
La información para anotar una o más opciones de tratamiento farmacológico en un informe puede ser proporcionada por una entidad comercial que almacena información científica. Un proveedor de atención médica puede tratar a un sujeto, como un paciente con cáncer, con un fármaco experimental incluido en la información anotada, y el proveedor de atención médica puede acceder a la opción de tratamiento farmacológico anotado, recuperar la información científica (p. ej., imprimir un artículo de revista médica) y enviarlo (por ejemplo, un artículo de una revista impresa) a una compañía de seguros junto con una solicitud de reembolso por proporcionar el tratamiento para la drogadicción. Los médicos pueden utilizar cualquiera de una variedad de códigos de grupo relacionados con
el diagnóstico (DRG) para permitir el reembolso.
Una opción de tratamiento de drogas en un informe también puede ser anotado con información con respecto a otros componentes moleculares en una vía que afecta un fármaco (por ejemplo, la información sobre un fármaco que se dirige una quinasa corriente abajo de un receptor de superficie celular que es un objetivo de drogas). La opción de tratamiento farmacológico se puede anotar con información sobre medicamentos que se dirigen a uno o más componentes de la ruta molecular. La identificación y/o anotación de información relacionada con las rutas puede ser subcontratada a otra empresa.
La información anotada puede ser, por ejemplo, el nombre de un medicamento (por ejemplo, un medicamento aprobado por la FDA para uso no indicado en la etiqueta; un medicamento que se encuentra en un compendio aprobado por CMS y/o un medicamento descrito en un artículo de una revista científica (médica)), información científica sobre una o más opciones de tratamiento farmacológico, uno o más enlaces a información científica sobre uno o más medicamentos, información sobre ensayos clínicos sobre uno o más medicamentos (por ejemplo, información de Clinicaltrials.gov/), uno o más enlaces a citas de información científica respecto a las drogas, etc.
La información anotada se puede insertar en cualquier lugar en un informe. La información anotada se puede insertar en varias ubicaciones en un informe. Se puede insertar información anotada en un informe cerca de una sección sobre opciones de tratamiento farmacológico estratificado. La información anotada se puede insertar en un informe en una página separada de las opciones estratificadas de tratamiento farmacológico. Un informe que no contenga opciones estratificadas de tratamiento farmacológico se puede anotar con información.
[0174] También pueden incluirse informes sobre los efectos de los fármacos sobre la muestra (por ejemplo, células tumorales) aislados de un sujeto (por ejemplo, paciente de cáncer). Puede establecerse un cultivo in vitro usando un tumor de un paciente con cáncer usando técnicas conocidas por los expertos en la técnica. Puede incluirse un cribado de alto rendimiento de fármacos no aprobados por la FDA o fármacos experimentales utilizando dicho cultivo in vitro y/o modelo de xenoinjerto. El sistema también puede incluir la monitorización del antígeno tumoral para la detección de recurrencia.
Puede proporcionarse acceso habilitado por Internet de informes de un sujeto con cáncer. El sistema puede utilizar un secuenciador de ADN portátil o un secuenciador de ADN de escritorio. El secuenciador de ADN es un instrumento científico que se utiliza para automatizar el proceso de secuenciación del ADN. Dado una muestra de ADN, se utiliza un secuenciador de ADN para determinar el orden de las cuatro bases: adenina, guanina, citosina y timina. El orden de las bases de ADN se informa como una cadena de texto, llamada lectura. Algunos secuenciadores de ADN también pueden considerarse instrumentos ópticos, ya que analizan señales de luz que se originan en fluorocromos unidos a nucleótidos.
Los secuenciadores de ADN envían los datos a través de una conexión directa o por Internet a una computadora para su procesamiento. Los aspectos de procesamiento de datos del sistema se pueden implementar en circuitos electrónicos digitales, o en hardware, firmware, software o en combinaciones de ellos. El aparato de procesamiento de datos se puede implementar en un producto de programa informático incorporado de manera tangible en un dispositivo de almacenamiento legible por máquina para su ejecución mediante un procesador programable; y los pasos del método de procesamiento de datos de la invención pueden ser realizados por un procesador programable que ejecuta un programa de instrucciones para realizar funciones de la invención operando con datos de entrada y generando salida. Los datos de procesamiento de aspectos pueden implementarse ventajosamente en uno o más programas de ordenador que son ejecutables en un sistema programable que incluye al menos un procesador programable acoplado para recibir datos e instrucciones desde y a los datos de transmisión y las instrucciones para un sistema de almacenamiento de datos, al menos un dispositivo de entrada y al menos un dispositivo de salida. Cada programa de computadora puede implementarse en un lenguaje de programación orientado a objetos o de procedimiento de alto nivel, o en lenguaje ensamblador o de máquina, si se desea; y, en todo caso, el lenguaje puede ser un lenguaje compilado o interpretado. Los procesadores adecuados incluyen, a modo de ejemplo, microprocesadores de uso general y especial. Generalmente, un procesador recibirá instrucciones y datos de una memoria de solo lectura y/o una memoria de acceso aleatorio. Los dispositivos de almacenamiento adecuados para incorporar de forma tangible instrucciones y datos de programas informáticos incluyen todas las formas de memoria no volátil, incluyendo, a modo de ejemplo, dispositivos de memoria semiconductores, tales como EPROM, EEPROM y dispositivos de memoria flash; discos magnéticos como discos duros internos y discos extraíbles; discos magnetoópticos; y discos CD-ROM. Cualquiera de los anteriores se puede complementar o incorporar en ASIC (circuitos integrados específicos de la aplicación).
Para proporcionar interacción con un usuario, puede usarse un sistema informático que tiene un dispositivo de visualización como un monitor o pantalla LCD (pantalla de cristal líquido) para la visualización de información al usuario y dispositivos de entrada mediante los cuales el usuario puede proporcionar información al sistema informático, como un teclado, un dispositivo señalador bidimensional como un ratón o una bola de seguimiento, o un dispositivo señalador tridimensional, como un guante de datos o un ratón giroscópico. El sistema informático se puede programar para proporcionar una interfaz gráfica de usuario a través de la cual los programas informáticos interactúan con los
usuarios. El sistema informático se puede programar para proporcionar una interfaz de visualización tridimensional de realidad virtual.
Intervención terapéutica
Los métodos de esta invención permiten que se proporciona intervenciones terapéuticas dirigidas con más precisión a la forma de una enfermedad en un sujeto, y para calibrar estas intervenciones terapéuticas en el tiempo. Esta precisión refleja, en parte, la precisión con la que se puede perfilar el estado tumoral de todo el cuerpo de un sujeto, tal como se refleja en la heterogeneidad del tumor. Por tanto, la intervención terapéutica es más eficaz contra cánceres con este perfil que contra cánceres con cualquiera de estas variantes.
Una intervención terapéutica es una intervención que produce un efecto terapéutico (por ejemplo, es terapéuticamente eficaz). Las intervenciones terapéuticamente eficaces previenen, ralentizan la progresión, mejoran el estado de (p. ej., provoca la remisión) o curan una enfermedad, como el cáncer. Una intervención terapéutica puede incluir, por ejemplo, la administración de un tratamiento, como quimioterapia, radioterapia, cirugía, inmunoterapia, administración de un fármaco o nutracéutico, o un cambio de comportamiento, como la dieta. Una medida de la eficacia terapéutica es la eficacia para al menos el 90% de los sujetos que se someten a la intervención en al menos 100 sujetos.
Dianas de fármacos en el cáncer y fármacos eficaces contra estas dianas se exponen en las Tablas 1 y 2 (tomadas de Bailey et al., Discovery Medicine, v. 18 n° 92, 2/7/14).
(Continuación)
(Continuación)
(Continuación)
En una realización, basándose en el perfil de heterogeneidad de la enfermedad, se determina una intervención terapéutica que tiene en cuenta tanto el tipo de variantes genéticas encontradas en las células de la enfermedad como sus cantidades relativas (por ejemplo, proporción). La intervención terapéutica puede tratar al sujeto como si cada variante clonal fuera un cáncer diferente a tratar de forma independiente. En algunos casos, cuando se detectan una o más variantes genéticas en cantidades inferiores a las subclínicas, por ejemplo, al menos 5 veces más bajas, al menos 10 veces más bajas o al menos 100 veces más bajas que los clones detectados dominantes, estas variantes pueden quedar fuera de la intervención terapéutica hasta que alcancen un umbral clínico o una frecuencia relativa significativa (por ejemplo, mayor que el umbral indicado anteriormente).
Cuando una pluralidad de diferentes variantes genéticas se encuentra en diferentes cantidades, por ejemplo, diferentes números o diferentes cantidades relativas, una intervención terapéutica puede incluir tratamientos eficaces contra las enfermedades con cada uno de los genéticos variantes. Por ejemplo, en el caso del cáncer, pueden detectarse variantes genéticas, tales como formas mutantes de un gen o amplificación de genes, en varios genes (por ejemplo, un clon principal y un clon menor). Cada una de estas formas puede ser procesable, es decir, puede conocerse un tratamiento para el que responden los cánceres con la variante particular. Sin embargo, el perfil de heterogeneidad tumoral puede indicar que una de las variantes está presente en los polinucleótidos, por ejemplo, cinco veces el nivel de cada una de las otras dos variantes. Puede determinarse una intervención terapéutica que implica administrar tres fármacos diferentes al sujeto, cada fármaco relativamente más eficaz contra los cánceres que portan cada una de las variantes. Los medicamentos se pueden administrar como cóctel o secuencialmente.
Los fármacos se pueden administrar en dosis estratificadas para reflejar las cantidades relativas de las variantes en el ADN. Por ejemplo, un fármaco eficaz contra la variante más común puede administrarse en mayor cantidad que los fármacos eficaces contra las dos variantes menos comunes.
Alternativamente, el perfil de la heterogeneidad tumoral puede mostrar la presencia de una subpoblación de células cancerosas que llevan una variante genética que es resistente a un fármaco a la que la enfermedad responde típicamente. En este caso, la intervención terapéutica puede implicar la inclusión tanto de un primer fármaco eficaz contra las células tumorales sin la variante de resistencia como de un segundo fármaco eficaz contra las células tumorales con la variante resistente. Nuevamente, las dosis se pueden estratificar para reflejar las cantidades relativas de cada variante detectada en el perfil.
Los cambios en el perfil de la heterogeneidad tumoral se examinan con el tiempo, e intervenciones terapéuticas se han desarrollado para tratar el tumor cambiante. Por ejemplo, la heterogeneidad de la enfermedad se puede determinar en una pluralidad de momentos diferentes. Usando los métodos de elaboración de perfiles de esta divulgación, se pueden hacer inferencias más precisas sobre la evolución del tumor. Esto permite al médico controlar la evolución de la enfermedad, en particular a medida que surgen nuevas subpoblaciones clonales después de la remisión efectuada por una primera ola de terapia. En este caso, las intervenciones terapéuticas se pueden calibrar con el tiempo para tratar el tumor cambiante. Por ejemplo, un perfil puede mostrar que un cáncer tiene una forma que responde a un determinado tratamiento. Se administra el tratamiento y se observa que la carga tumoral disminuye con el tiempo. En algún momento, se encuentra una variante genética en el tumor que indica la presencia de una población de células cancerosas que no responde al tratamiento. Se determina una nueva intervención terapéutica que se dirige a las células que portan el marcador de falta de respuesta.
En respuesta a la quimioterapia, una forma de tumor dominante puede eventualmente dar paso a través de la selección darwiniana a células cancerosas que portan mutantes que hacen que el cáncer no responda al régimen de terapia. La aparición de estos mutantes de resistencia puede retrasarse. Por ejemplo, un sujeto puede someterse a uno o más ciclos de terapia pulsada, cada ciclo de terapia pulsada comprende un primer período durante el cual se administra un fármaco en una primera cantidad y un segundo ciclo durante el cual el fármaco se administra en una segunda cantidad reducida. El primer período se caracteriza por una carga tumoral detectada por encima de un primer nivel clínico. El segundo período se caracteriza por una carga tumoral detectada por debajo de un segundo nivel clínico. Los niveles clínicos primero y segundo pueden ser diferentes en diferentes ciclos de terapia pulsada. Entonces, por ejemplo, el primer nivel clínico puede ser menor en los ciclos sucesivos. Una pluralidad de ciclos puede incluir al menos 2, 3, 4, 5, 6, 7, 8 o más ciclos. Por ejemplo, el V600E mutante de BRAF puede detectarse en polinucleótidos de células enfermas en una cantidad que indica una carga tumoral del 5% en cfADN. La quimioterapia puede comenzar con dabrafenib. Las pruebas posteriores pueden mostrar que la cantidad del mutante BRAF en el cfADN cae por debajo del 0,5% o hasta niveles indetectables. En este punto, la terapia con dabrafenib puede interrumpirse o reducirse significativamente. Pruebas posteriores posteriores pueden encontrar que el ADN que lleva la mutación BRAF ha aumentado al 2,5% de los polinucleótidos en el ADNc. En este punto, la terapia con dabrafenib se vuelve a iniciar, por ejemplo, al mismo nivel que el tratamiento inicial. Las pruebas posteriores pueden encontrar que el ADN que lleva la mutación BRAF ha disminuido al 0,5% de los polinucleótidos en el cfADN. Nuevamente, la terapia con dabrafenib se detiene o se reduce. El ciclo se puede repetir varias veces.
La Figura 7 muestra un curso ejemplar de seguimiento y tratamiento de una enfermedad en un sujeto. Un sujeto analizado en el momento de la extracción de sangre 1 tiene una carga tumoral del 1,4% y presenta alteraciones genéticas en los genes 1, 2 y 3. El sujeto es tratado con el fármaco A. Después de un tiempo, se interrumpe el tratamiento. En un segundo momento posterior, una segunda extracción de sangre muestra que el cáncer está en remisión. En un tercer momento posterior, una tercera extracción de sangre indica que el cáncer ha reaparecido, en este caso, presentando una variante genética en el Gen 4. El sujeto ahora recibe un tratamiento con el Medicamento B, al cual responden los cánceres que tienen esta variante.
Una intervención terapéutica se puede cambiar después de la detección de la aparición de una forma mutante resistente a un medicamento original. Por ejemplo, los cánceres con la mutación EGFR L858R responden a la terapia con erlotinib. Sin embargo, los cánceres con la mutación EGFR T790M son resistentes a erlotinib. Sin embargo,
responden al ruxolitinib. Un método de esta divulgación implica controlar los cambios en el perfil del tumor y cambiar una intervención terapéutica cuando una variante genética asociada con la resistencia a los fármacos se eleva a un nivel clínico predeterminado.
Base de datos
Se construye una base de datos como se define en las reivindicaciones en donde se registra la información genética a partir de muestras de serie recogidas de pacientes con cáncer. Esta base de datos también puede contener tratamientos intermedios y otra información clínicamente relevante, como peso, efectos adversos, pruebas histológicas, análisis de sangre, información radiográfica, tratamientos previos, tipo de cáncer, etc. Los resultados de las pruebas seriadas se pueden utilizar para inferir la eficacia del tratamiento. especialmente cuando se usa con muestras de sangre, lo que puede dar una estimación más imparcial de la carga tumoral que la autoevaluación o el reporte radiográfico de un médico. La eficacia del tratamiento se puede agrupar por aquellos con perfiles genómicos similares y viceversa. Los perfiles genómicos pueden organizarse en torno, por ejemplo, a una alteración genética primaria, una alteración o alteraciones genéticas secundarias, cantidades relativas de estas alteraciones genéticas y carga tumoral. Esta base de datos se puede utilizar para apoyar la decisión de pacientes posteriores. Tanto la línea germinal como alteraciones somáticas se pueden utilizar para determinar la eficacia del tratamiento también. Alteraciones de resistencia adquiridas que también se pueden inferir de la base de datos cuando los tratamientos que inicialmente fueron efectivos comienzan a fallar. Este fallo puede detectarse mediante radiografías, sangre u otros medios. Los datos primarios utilizados para la inferencia de los mecanismos de resistencia adquiridos son los perfiles de tumores genómicos recopilados después del tratamiento por paciente. Estos datos también se pueden utilizar para establecer límites cuantitativos en la respuesta probable al tratamiento, así como para predecir el tiempo hasta el fracaso del tratamiento. Con base en las probables alteraciones de resistencia adquiridas para un tratamiento dado y un perfil genómico tumoral, se puede modificar un régimen de tratamiento para suprimir la adquisición de las alteraciones de resistencia más probables.
Sistemas de computación
Los métodos de la presente divulgación se pueden implementar utilizando, o con la ayuda de, los sistemas informáticos. FIG. 5 muestra un sistema informático 1501 que está programado o configurado de otro modo para implementar los métodos de la presente divulgación. El sistema informático 1501 incluye una unidad central de procesamiento (CPU, también "procesador" y "procesador informático" en este documento) 1505. El sistema informático 1501 también incluye memoria o ubicación de memoria 1510 (por ejemplo, memoria de acceso aleatorio, memoria de sólo lectura, memoria flash), unidad de almacenamiento electrónico 1515 (por ejemplo, disco duro), interfaz de comunicación 1520 (por ejemplo, adaptador de red) para comunicarse con uno o más de otros sistemas, y dispositivos periféricos 1525, como caché, otra memoria, almacenamiento de datos y/o adaptadores de pantalla. La memoria 1510, la unidad de almacenamiento 1515, la interfaz 1520 y los dispositivos periféricos 1525 están en comunicación con la CPU 1505 a través de un bus de comunicación (líneas continuas). La unidad de almacenamiento 1515 puede ser una unidad de almacenamiento de datos (o depósito de datos) para almacenar datos. El sistema informático 1501 puede acoplarse operativamente a una red informática ("red") 1530 con la ayuda de la interfaz de comunicación 1520. La red 1530 puede ser Internet, un internet y/o extranet, o una intranet y/o extranet que está en comunicación con Internet. La red 1530 en algunos casos es una red de telecomunicaciones y/o datos. La red 1530 puede incluir uno o más servidores informáticos, que pueden permitir la informática distribuida, como la informática en la nube. La CPU 1505 puede ejecutar una secuencia de instrucciones legibles por máquina, que se pueden incorporar en un programa o software. Las instrucciones pueden almacenarse en una ubicación de memoria, como la memoria 1510. La unidad de almacenamiento 1515 puede almacenar archivos, como controladores, bibliotecas y programas guardados. El sistema informático 1501 puede comunicarse con uno o más sistemas informáticos remotos a través de la red 1530. Los métodos de la invención pueden implementarse mediante un código ejecutable de máquina (por ejemplo, procesador informático) almacenado en una ubicación de almacenamiento electrónico del sistema informático 1501, tal como, por ejemplo, en la memoria 1510 o la unidad de almacenamiento electrónica 1515. El código ejecutable o legible por máquina puede proporcionarse en forma de software. En la programación pueden realizarse varios aspectos como el sistema informático 1501. Varios aspectos de la tecnología se pueden considerar como "productos" o "artículos manufacturados" típicamente en forma de código ejecutable de máquina (o procesador) y/o datos asociados que se llevan o incorporan en un tipo de medio legible por máquina. El código ejecutable por máquina se puede almacenar en una unidad de almacenamiento electrónico, tal memoria (por ejemplo, la memoria de sólo lectura, memoria de acceso aleatorio, memoria flash) o un disco duro. Los medios de tipo "almacenamiento" pueden incluir parte o toda la memoria tangible de los ordenadores, procesadores o similares, o módulos asociados de los mismos, como varias memorias de semiconductores, unidades de cinta, unidades de disco y similares, que pueden proporcionar almacenamiento no transitorio en cualquier momento para la programación del software. En ocasiones, todo el software o partes del mismo pueden comunicarse a través de Internet o de otras redes de telecomunicaciones. El sistema informático 1501 puede incluir o estar en comunicación con una pantalla electrónica que comprende una interfaz de usuario (IU) para proporcionar, por ejemplo, uno o más resultados del análisis de muestras.
EJEMPLOS
Posiciones de nucleótidos (por ejemplo, loci) en el genoma pueden ser designadas por el número, tal como se representa en la Figura 2. Las posiciones en donde aproximadamente el 100% de las llamadas de base son idénticas a la secuencia de referencia o en donde aproximadamente el 100% de las llamadas de bases son diferentes a las de la secuencia de referencia y se infiere que representan la homocigosidad del cfADN (se presume normal). Se infiere que las posiciones en las que aproximadamente el 50% de las llamadas de bases son idénticas a la secuencia de referencia representan la heterocigosidad del cfADN (también se presume normal). Se infiere que las posiciones en las que el porcentaje de llamadas de bases en un locus están sustancialmente por debajo del 50% y por encima del límite de detección del sistema de llamadas de bases representan variantes genéticas asociadas a tumores.
Ejemplo 1. Métodos para la variación del número de copias de detección de
Recogida de sangre
Muestras de sangre de 10-30 ml se recogen a temperatura ambiente. Las muestras se centrifugan para eliminar las células. El plasma se recoge después de la centrifugación.
Extracción de cfADN
La muestra se somete a digestión con proteinasa K. El ADN se precipita con isopropanol. El ADN se captura en una columna de purificación de ADN (por ejemplo, un QlAamp DNA Blood Mini Kit) y se eluye en 100 pl de solución. Los ADN por debajo de 500 pb se seleccionan con captura de cuentas magnéticas Ampure SPRI (PEG/sal). La producción resultante se suspende en 30 pL H2O. La distribución de tamaño se comprueba (pico principal = 166 nucleótidos; pico menor = 330 nucleótidos) y se cuantifica. 5 ng de ADN extraído contienen aproximadamente 1700 equivalentes de genoma haploide ("HGE"). La correlación general entre la cantidad de ADN y HGE es la siguiente: 3 pg de ADN = 1 HGE; 3 ng de ADN = 1K HGE; 3 pg de ADN = 1M HGE; 10 pg de ADN = 3 HGE; 10 ng de ADN = 3K HGE; 10 pg de ADN = 3M HGE.
Prep de biblioteca de "molécula única"
Etiquetado de ADN de alta eficiencia (>80%) se realiza mediante la reparación final, cola A y ligación de extremos pegajosos con 2 diferentes octómeros (es decir, 4 combinaciones) con adaptadores de horquilla sobrecargados. Se utilizan 2,5 ng de ADN (es decir, aproximadamente 800 HGE) como material de partida. Cada adaptador de horquilla comprende una secuencia aleatoria en su parte no complementaria. Ambos extremos de cada fragmento de ADN están unidos con adaptadores de horquilla. Cada fragmento etiquetado puede identificarse mediante una combinación de la secuencia octomérica en los adaptadores de horquilla y porciones endógenas de la secuencia del inserto.
El ADN marcado se amplifica mediante 12 ciclos de RCP para producir aproximadamente 1-7 pg de ADN que contiene aproximadamente 500 copias de cada uno de los 800 h Ge en el material de partida.
Optimización de tampón, optimización de la polimerasa y la reducción de ciclo se puede realizar para optimizar las reacciones de RCP. El sesgo de amplificación, por ejemplo, el sesgo no específico, el sesgo de GC y/o el sesgo de tamaño también se reducen mediante la optimización. Los ruidos (p. ej., errores introducidos por la polimerasa) se reducen utilizando polimerasas de alta fidelidad.
Las secuencias se pueden enriquecer de la siguiente manera: los ADN con regiones de interés (ROI) se capturan usando una perla marcada con biotina con sonda para ROI. Las ROI se amplifican con 12 ciclos de RCP para generar una amplificación de 2000 veces.
Secuenciación masivamente paralela
0,1 a 1% de la muestra (aproximadamente 100 pg) se utilizan para la secuenciación. A continuación, el ADN resultante se desnaturaliza y se diluye a 8 pM y se carga en un secuenciador Illumina.
Bioinformática digital
Las lecturas de secuencia se agrupan en familias, con aproximadamente 10 lecturas de secuencia en cada familia. Las familias se colapsan en secuencias de consenso mediante votación (por ejemplo, votación sesgada) cada posición en una familia. Se pide una base para la secuencia de consenso si 8 o 9 miembros están de acuerdo. No se requiere una base para la secuencia de consenso si no más del 60% de los miembros están de acuerdo.
Las secuencias de consenso resultantes se asignan a un genoma de referencia, tales como hg19. Cada base en una secuencia de consenso está cubierta por aproximadamente 3000 familias diferentes. Se calcula una puntuación de calidad para cada secuencia y las secuencias se filtran en función de sus puntuaciones de calidad. Las llamadas de base en cada posición en una secuencia de consenso se comparan con la secuencia de referencia de HG-19. En
cada posición en donde una llamada de base difiere de la secuencia de referencia, se determina e informa la identidad de las diferentes base o bases y su porcentaje en función de las llamadas de bases totales en el locus.
La variación de secuencia se detecta contando la distribución de bases en cada locus. Si el 98% de las lecturas tienen la misma base (homocigotas) y el 2% tiene una base diferente, es probable que el locus tenga una variante de secuencia, presumiblemente del ADN del cáncer. El CNV se detecta contando el número total de secuencias (bases) mapeadas a un locus y comparándolas con un locus de control. Para aumentar la detección de CNV, el análisis de CNV se realiza en regiones específicas, incluidas regiones en ALK, APC, BRAF, CDKN2A, EGFR, ERBB2, FBXW7, KRAS, MYC, NOTCH1, NRAS, PIK3CA, PTEN, RB1, TP53, MET, AR, ABL1, AKT1, ATM, CDH1, CSF1R, CTNNB1, ERBB4, EZH2, FGFR1, FGFR2, FGFR3, FLT3, GNA11, GNAQ, GNAS, HNF1A, HRAS, IDH1, IDH2, JAK2, JAK3, KDR, KITL, MLH1, PDGFRA, PROC, PTPN11, RET, SMAD4, SMARCB1, SMO, SRC, STK11, VHL, TERT, CCND1, CDK4, CDKN2B, RAF1, BRCA1, CCND2, CDK6, NF1, TP53, ARID1A, BRCA2, CCNEIT1, ESR, GATA3, MAP2K1, RHEB, ROS1, ARAF, MAP2K2, NFE2L2, RHOA o NTRK1.
Ejemplo 2. Método para corregir base llamando por determinar el número total de moléculas no vistas en una muestra
Después de fragmentos se amplifican y las secuencias de los fragmentos amplificados se leen y se alinean, los fragmentos se someten a la llamada de base. Las variaciones en el número de fragmentos amplificados y fragmentos amplificados no vistos pueden introducir errores en la llamada de bases. Estas variaciones se corrigen calculando el número de fragmentos amplificados no vistos.
Al llamar de base para locus A (un locus arbitrario), se supone primero que hay N fragmentos amplificados. Las lecturas de secuencia pueden provenir de dos tipos de fragmentos: fragmentos bicatenarios y fragmentos monocatenarios. El siguiente es un ejemplo teórico de cómo calcular el número total de moléculas no vistas en una muestra.
N es el número total de moléculas en la muestra.
Suponiendo que 1000 es el número de dúplex detectados.
Suponiendo que 500 es el número de moléculas monocatenarias detectadas.
P es la probabilidad de ver una hebra.
Q es la probabilidad de no detectar una hebra.
Al ser Q = 1 -P.
1000 = NP (2).
500 = N2PQ.
1000 / P(2) = N.
500-2 PQ = N.
1000 / P(2) = 500-2PQ.
1000 * 2 PQ = 500 P(2),
2000 PQ = 500 P (2).
2000 Q = 500 P.
2000 (l-P) = 500P
2000-2000 P = 500P.
2000 = 500P 2000 P
2000 = 2500 P.
2000-2500 = P.
0,8 = P.
1000/ P(2) = N
1000-0.64 = N.
1562 = N.
Número de fragmentos no vistos = 62.
Ejemplo 3. Identificación de variantes genéticas en variantes somáticas asociadas al cáncer en un paciente
Se utiliza un ensayo para analizar un panel de genes para identificar variantes genéticas en variantes somáticas asociadas al cáncer con alta sensibilidad.
El ADN libre de células se extrae del plasma de un paciente y se amplifica mediante RCP. Las variantes genéticas se analizan mediante secuenciación masivamente paralela de los genes diana amplificados. Para un conjunto de genes, todos los exones se secuencian, ya que se ha demostrado que la cobertura de secuenciación tiene utilidad clínica (Tabla 3). Para otro conjunto de genes, la cobertura de secuenciación incluyó aquellos exones con una mutación somática informada previamente (Tabla 4). El alelo mutante mínimo detectable (límite de detección) depende de la concentración de ADN libre de células de la muestra del paciente, que varió de menos de 10 a más de 1000 equivalentes genómicos por ml de sangre periférica. Es posible que la amplificación no se detecte en muestras con cantidades más bajas de ADN libre de células y/o amplificación de copias de genes de bajo nivel. Ciertas características de la muestra o variantes dieron como resultado una sensibilidad analítica reducida, como una muestra de baja calidad o una recolección incorrecta.
El porcentaje de variantes genéticas encontradas en el ADN libre de células que circulan en la sangre está relacionada con la biología única tumoral de este paciente. Los factores que afectaron a la cantidad/porcentajes de variantes genéticas detectadas en el ADN libre de células circulante en la sangre incluyen el crecimiento, recambio, tamaño, heterogeneidad, vascularización, progresión de la enfermedad o tratamiento del tumor. La Tabla 5 anota el porcentaje, o la frecuencia alélica, de ADN libre de células circulante alterado (% cfADN) detectado en este paciente. Algunas de las variantes genéticas detectadas se enumeran en orden descendente por % cfADN.
Las variantes genéticas se detectan en el ADN libre de células circulante aislado de muestra de sangre de este paciente. Estas variantes genéticas son variantes somáticas asociadas al cáncer, algunas de las cuales se han asociado con una respuesta clínica aumentada o reducida a un tratamiento específico. Las "alteraciones menores" se definen como aquellas alteraciones detectadas a menos del 10% de la frecuencia alélica de las "alteraciones mayores". Una alteración mayor es la alteración predominante en un locus. Se anotan las frecuencias alélicas detectadas de estas alteraciones (Tabla 5) y los tratamientos asociados para este paciente.
Todos los genes enumerados en las Tablas 3 y 4 se analizan como parte de la prueba. No se detecta amplificación para ERBB2, EGFR o MET en el ADN libre de células circulante aislado de la muestra de sangre de este paciente.
Resultados de las pruebas de paciente que comprenden las variantes genéticas se enumeran en la Tabla 6.
En referencia a la Tabla 4, en 13 posiciones, un nucleótido detectado en al menos 98,8% de frecuencia en la muestra es diferente de un nucleótido en la secuencia de referencia, indicando homocigosidad en estos loci. Por ejemplo, en el gen KRAS, en la posición 25346462, se detectó T en lugar del nucleótido C de referencia en el 100% de los casos.
En 35 posiciones, un nucleótido detectado en entre 41,4% y 55% de frecuencia en la muestra es diferente de un nucleótido en la secuencia de referencia, lo que indica heterocigosidad en estos loci. Por ejemplo, en el gen ALK, en la posición 29455267, se detectó G en lugar del nucleótido A de referencia en el 50% de los casos.
A las 3 posiciones un nucleótido detectado en menos de 9% de frecuencia es diferente de un nucleótido en la referencia de secuencia. Estos incluyen variantes en BRAF (140453136 A>T, 8,9%), NRAS (115256530 G>T 2,6%) y JAK2 (5073770 G>T 1,5%). Se presume que son mutaciones somáticas del ADN del cáncer.
Se calculan las cantidades relativas de variantes genéticas asociadas a tumores. La proporción de cantidades de BRAF:NRAS:JAK2 es 8,9: 2,6: 1,5 o 1: 0,29: 0,17. De este resultado se puede inferir la presencia de heterogeneidad tumoral. Por ejemplo, una posible interpretación es que el 100% de las células tumorales contienen una variante en BRAF, el 83% contienen variantes en BRAF y NRAS, y el 17% contienen variantes en BRAF, NRAS y JAK2. Sin embargo, el análisis de CNV puede mostrar amplificación de BRAF, en cuyo caso el 100% de las células tumorales
pueden tener variantes tanto en BRAF como en NRAS.
Tabla 3. Genes en los que se secuencian todos los exones
Tabla 4. Genes en los que se encuentran exones con una mutación somática informada previamente secuenciado
Tabla 5. Frecuencia de alelos de ADN libre de células circulante detectado en este paciente
Ejemplo 4. Determinación de los lím ites específicos del paciente de la detección de los genes analizados mediante ensayos
Usando el método del Ejemplo 3, se detectan alteraciones genéticas en el ADN libre de células de un paciente. Las lecturas de secuencias de estos genes incluyen secuencias de exones y/o intrones.
Ejemplo 5. Corrección de errores de secuencia que comparan de secuencias de Watson y Crick
ADN libre de células de hebra doble está aislado del plasma de un paciente. Los fragmentos de ADN libres de células se etiquetan utilizando 16 adaptadores diferentes que contienen burbujas, cada uno de los cuales comprende un código de barras distintivo. Los adaptadores que contienen burbujas se unen a ambos extremos de cada fragmento de ADN libre de células mediante ligación. Después de la ligación, cada uno de los fragmentos de ADN libre de células se puede identificar de forma distinta mediante la secuencia de códigos de barras distintos y dos secuencias endógenas de 20 pb en cada extremo del fragmento de ADN libre de células.
Los fragmentos de ADN libres de células etiquetadas se amplifican por RCP. Los fragmentos amplificados se enriquecen usando cuentas que comprenden sondas de oligonucleótidos que se unen específicamente a un grupo de genes asociados al cáncer. Por tanto, los fragmentos de ADN libres de células del grupo de genes asociados al cáncer se enriquecen selectivamente.
Los adaptadores de secuenciación, cada uno de los cuales comprende un sitio de unión del cebador de secuenciación, un código de barras de muestra y una secuencia de flujo celular, se unen a las moléculas de ADN enriquecidas. Las moléculas resultantes se amplifican mediante RCP.
Las dos hebras de los fragmentos amplificados se secuencian. Debido a que cada adaptador que contiene burbujas comprende una parte no complementaria (por ejemplo, la burbuja), la secuencia de una hebra del adaptador que contiene burbujas es diferente de la secuencia de la otra hebra (complemento). Por lo tanto, las lecturas de secuencia de amplicones derivados de la hebra de Watson de un ADN libre de células original se pueden distinguir de los amplicones de la hebra de Crick del ADN libre de células original por las secuencias adaptadoras que contienen burbujas adjuntas.
Las lecturas de secuencias de una hebra de un fragmento de ADN libre de células originales se comparan con las lecturas de secuencias de la otra hebra del fragmento de ADN libre de células originales. Si una variante ocurre solo en la secuencia que se lee de una hebra, pero no de otra hebra, del fragmento de ADN libre de células original, esta variante se identificará como un error (p. ej., resultado de RCP y/o amplificación), en lugar de una verdadera variante genética.
Las lecturas de secuencia se agrupan en familias. Se corrigen los errores en la secuencia de lecturas. La secuencia de consenso de cada familia se genera colapsando.
Ejemplo 6. Intervención terapéutica
Se determina una intervención terapéutica para tratar el cáncer. Los cánceres con mutantes BRAF responden al tratamiento con vemurafenib, regorafenib, tranetinib y dabrafenib. Los cánceres con mutantes NRAS responden al tratamiento con trametinib. Los cánceres con mutantes JAK2 responden al tratamiento con ruxolitinib. Se determina que una intervención terapéutica que incluye la administración de trametinib y ruxolitinib es más eficaz contra este cáncer que el tratamiento con cualquiera de los fármacos mencionados anteriormente solo. El sujeto se trata con una combinación de trametinib y ruxolitinib en una proporción de dosis de 5:1.
Después de varias rondas de tratamiento, el cfADN del sujeto se prueba de nuevo por la presencia de la heterogeneidad tumoral. Los resultados muestran que la proporción de BRAF:NRAS:JAK2 es ahora de aproximadamente 4:2:1,5. Esto indica que la intervención terapéutica ha reducido el número de células con mutantes BRAF y NRAS, y ha detenido el crecimiento de células con mutantes JAK2. Se determina una segunda intervención terapéutica en donde se determina que trametinib y ruxolitinib son eficaces en una proporción de dosis de 1:1. El sujeto recibe un curso de quimioterapia en cantidades en esta proporción. Las pruebas posteriores muestran que los mutantes BRAF, NRAS y JAK2 están presentes en el cfADN en cantidades inferiores al 1%.
Ejemplo 7. Intervención terapéutica
Una muestra de sangre se obtiene de un individuo con melanoma pre-tratamiento y se determina que el paciente tiene una mutación BRAF V600E a una concentración de 2,8% y no hay mutaciones NRAS detectables utilizando análisis de ADN libre de células. El paciente recibe una terapia anti-BRAF (dabrafenib). Después de 3 semanas, se recolecta y analiza otra muestra de sangre. Se determina que el nivel de BRAF V600E ha bajado al 0,1%. Se interrumpe la terapia y se repite la prueba cada 2 semanas. El nivel de BRAF V600E aumenta de nuevo y la terapia se reinicia cuando el nivel de BRAF V600E aumenta al 1,5%. La terapia se detiene de nuevo cuando el nivel vuelve a
bajar al 0,1%. Este ciclo se repite.
Ejemplo 8. Corrección de CNV basado en mediciones ROCNV
Se determinan variaciones de número de copias en una muestra del paciente. Los métodos para determinar pueden incluir seguimiento molecular y muestreo superior, como se describió anteriormente. Se utiliza un modelo de markov oculto basado en ubicaciones esperadas de los orígenes de replicación para eliminar el efecto de la proximidad del origen de replicación de las variaciones estimadas del número de copias en la muestra del paciente. La desviación estándar de las variaciones del número de copias para cada gen se reduce posteriormente en un 40%. El modelo de proximidad del origen de replicación también se utiliza para inferir la carga tumoral libre de células en el paciente.
En muchos casos, el nivel de tumor sin células derivado puede ser bajo o por debajo del límite de detección de una tecnología particular. Este puede ser el caso cuando el número de equivalentes de genoma humano de ADN derivado de tumor en plasma es inferior a 1 copia por 5 ml. Se ha demostrado que la radiación y las quimioterapias afectan a las células que se dividen rápidamente más que a las células sanas estables, de ahí su eficacia en el tratamiento de pacientes con cáncer avanzado. Por tanto, se administra un procedimiento con efectos adversos mínimos a un paciente antes de la extracción de sangre para aumentar preferentemente la fracción de ADN derivado del tumor recolectado. Por ejemplo, se podría administrar una dosis baja de quimioterapia al paciente y se podría recolectar una muestra de sangre dentro de las 24 horas, 48 horas, 72 horas o menos de 1 semana. Para quimioterapias efectivas, esta muestra de sangre contiene concentraciones más altas de ADN derivado de tumores sin células debido a tasas potencialmente más altas de muerte celular de las células cancerosas. Alternativamente, la radioterapia de dosis baja se aplica a través de un instrumento radiográfico de cuerpo entero o localmente a las regiones afectadas en lugar de la quimioterapia de dosis baja. Se prevén otros procedimientos, que incluyen someter a un paciente a ultrasonidos, ondas sonoras, ejercicio, estrés, etc.
Claims (15)
1. Un método implementado por ordenador que comprende el uso de una base de datos informática para identificar una o más intervenciones terapéuticas eficaces para un sujeto que tiene cáncer, en donde la base de datos informática incluye, para cada uno de una pluralidad de sujetos que tienen cáncer:
(i) datos de pruebas genómicas tumorales, incluyendo las alteraciones somáticas, recopilados en dos o más intervalos de tiempo por sujeto mediante biopsias en serie de ADN libre de células;
(ii) una o más intervenciones terapéuticas administradas a cada uno de los sujetos en uno o más momentos; y (iii) eficacia de las intervenciones terapéuticas.
2. El método de la reivindicación 1, en el que las intervenciones terapéuticas identificadas se estratifican por eficacia.
3. El método de la reivindicación 2, en el que se informa de los límites cuantitativos sobre la eficacia prevista de la intervención terapéutica o la ausencia de la misma.
4. El método de cualquiera de las reivindicaciones 1-3, en el que las intervenciones terapéuticas usan información de la evolución genómica tumoral prevista o mecanismos de resistencia adquiridos en sujetos similares en respuesta al tratamiento.
5. El método de una cualquiera de las reivindicaciones 1-4, en el que la pluralidad de sujetos es de por lo menos 50, por lo menos 500 o por lo menos 5000 sujetos.
6. El método de una cualquiera de las reivindicaciones 1-5, en el que para clasificar la eficacia del tratamiento se usan frecuencias relativas de variantes genéticas detectadas.
7. Los métodos de cualquiera de las reivindicaciones 1-6, en los que se usan el peso, los efectos adversos del tratamiento, las pruebas histológicas, los análisis de sangre, la información radiográfica, los tratamientos anteriores y/o el tipo de cáncer para ayudar a clasificar la eficacia del tratamiento.
8. Los métodos de cualquiera de las reivindicaciones 1-7, en los que la respuesta al tratamiento por sujeto se recopila y clasifica cuantitativamente a través de pruebas adicionales, en donde las pruebas adicionales son pruebas basadas en sangre u orina.
9. El método de cualquiera de las reivindicaciones 1-8, en donde el método comprende clasificar la eficacia del tratamiento usando un algoritmo de clasificación, como:
(i) procesos de regresión lineal como regresión lineal múltiple, mínimos cuadrados parciales, regresión y regresión de componentes principales;
(ii) árboles de decisión binarios, como procesos de partición recursivos como árboles de clasificación y regresión; (iii) redes neurales artificiales como redes de retropropagación;
(iv) análisis discriminantes como el clasificador bayesiano o el análisis de Fischer;
(v) clasificadores logísticos; y/o
(vi) clasificadores de vectores de soporte, como máquinas de vectores de soporte.
10. El método de cualquiera de las reivindicaciones 1-9, en el que se usan alteraciones tanto de la línea germinal como somáticas para determinar la eficacia del tratamiento.
11. El método de una cualquiera de las reivindicaciones 1-10, en el que las alteraciones de resistencia adquiridas se infieren de la base de datos cuando los tratamientos que fueron eficaces en la pluralidad de sujetos inicialmente comenzaron a fallar.
12. El método de cualquiera de las reivindicaciones 1-11, en el que los mecanismos de resistencia adquiridos se infieren usando perfiles genómicos tumorales recopilados después del tratamiento por sujeto.
13. El método de cualquiera de las reivindicaciones 1-12, en el que los datos de las pruebas genómicas tumorales son datos de secuenciación de ADN.
14. El método de la reivindicación 13, en el que los datos de secuenciación de ADN incluyen el mapeo de polinucleótidos en loci específicos en el genoma que son la materia de interés, y han sido aislados para la secuenciación por captura de secuencias o amplificación específica del sitio.
15. El método de cualquiera de las reivindicaciones 1-14, en el que el ADN libre de células ha sido marcado o rastreado para permitir la posterior identificación y el origen del polinucleótido particular.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201462098426P | 2014-12-31 | 2014-12-31 | |
| US201562155763P | 2015-05-01 | 2015-05-01 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2923602T3 true ES2923602T3 (es) | 2022-09-28 |
Family
ID=56284976
Family Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES15876120T Active ES2828279T3 (es) | 2014-12-31 | 2015-12-28 | Detección y tratamiento de enfermedades que muestran heterogeneidad celular de enfermedad y sistemas y métodos para comunicar los resultados de las pruebas |
| ES22176398T Active ES3017068T3 (en) | 2014-12-31 | 2015-12-28 | Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results |
| ES20179648T Active ES2923602T3 (es) | 2014-12-31 | 2015-12-28 | Detección y tratamiento de enfermedades que muestran heterogeneidad celular de enfermedad y sistemas y métodos para comunicar los resultados de las pruebas |
Family Applications Before (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES15876120T Active ES2828279T3 (es) | 2014-12-31 | 2015-12-28 | Detección y tratamiento de enfermedades que muestran heterogeneidad celular de enfermedad y sistemas y métodos para comunicar los resultados de las pruebas |
| ES22176398T Active ES3017068T3 (en) | 2014-12-31 | 2015-12-28 | Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results |
Country Status (9)
| Country | Link |
|---|---|
| US (5) | US20170260590A1 (es) |
| EP (5) | EP3240911B1 (es) |
| JP (4) | JP6783768B2 (es) |
| CN (2) | CN113930507A (es) |
| AU (3) | AU2015374259B2 (es) |
| ES (3) | ES2828279T3 (es) |
| GB (1) | GB2552267B (es) |
| PL (1) | PL4574996T3 (es) |
| WO (1) | WO2016109452A1 (es) |
Families Citing this family (73)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| PL3246416T3 (pl) | 2011-04-15 | 2024-09-30 | The Johns Hopkins University | Bezpieczny system sekwencjonowania |
| US9892230B2 (en) | 2012-03-08 | 2018-02-13 | The Chinese University Of Hong Kong | Size-based analysis of fetal or tumor DNA fraction in plasma |
| CN109457030B (zh) | 2012-10-29 | 2022-02-18 | 约翰·霍普金斯大学 | 卵巢和子宫内膜癌的帕帕尼科拉乌测试 |
| HK1213944A1 (zh) | 2012-12-10 | 2016-07-15 | Resolution Bioscience, Inc. | 用於靶向基因组分析 |
| US11062789B2 (en) | 2014-07-18 | 2021-07-13 | The Chinese University Of Hong Kong | Methylation pattern analysis of tissues in a DNA mixture |
| US20160053301A1 (en) | 2014-08-22 | 2016-02-25 | Clearfork Bioscience, Inc. | Methods for quantitative genetic analysis of cell free dna |
| EP3240911B1 (en) * | 2014-12-31 | 2020-08-26 | Guardant Health, Inc. | Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results |
| US10364467B2 (en) | 2015-01-13 | 2019-07-30 | The Chinese University Of Hong Kong | Using size and number aberrations in plasma DNA for detecting cancer |
| JP6829211B2 (ja) | 2015-02-10 | 2021-02-10 | ザ チャイニーズ ユニバーシティ オブ ホンコン | 癌スクリーニング及び胎児分析のための変異検出 |
| PT3325664T (pt) | 2015-07-23 | 2022-03-03 | Univ Hong Kong Chinese | Análise de padrões de fragmentação de adn sem células |
| US11286531B2 (en) | 2015-08-11 | 2022-03-29 | The Johns Hopkins University | Assaying ovarian cyst fluid |
| EP4462438A3 (en) | 2015-10-09 | 2025-02-26 | Guardant Health, Inc. | Population based treatment recommender using cell free dna |
| JP6913089B2 (ja) | 2015-11-11 | 2021-08-04 | レゾリューション バイオサイエンス, インコーポレイテッド | Dnaライブラリーの高効率構築 |
| WO2017106768A1 (en) | 2015-12-17 | 2017-06-22 | Guardant Health, Inc. | Methods to determine tumor gene copy number by analysis of cell-free dna |
| KR102850460B1 (ko) | 2016-08-25 | 2025-08-27 | 레졸루션 바이오사이언스, 인크. | Dna 샘플 중 게놈 카피 변화의 검출을 위한 방법 |
| KR20240155386A (ko) | 2016-09-30 | 2024-10-28 | 가던트 헬쓰, 인크. | 무세포 핵산의 다중-해상도 분석 방법 |
| US9850523B1 (en) | 2016-09-30 | 2017-12-26 | Guardant Health, Inc. | Methods for multi-resolution analysis of cell-free nucleic acids |
| KR102921023B1 (ko) | 2016-11-30 | 2026-01-30 | 더 차이니즈 유니버시티 오브 홍콩 | 소변 및 기타 샘플에서의 무세포 dna의 분석 |
| MX393780B (es) | 2017-01-17 | 2025-03-24 | Heparegenix Gmbh | Inhibidores de proteina cinasa para promover la regeneracion hepatica o reducir o prevenir la muerte de hepatocitos |
| CA3051509A1 (en) | 2017-01-25 | 2018-08-02 | The Chinese University Of Hong Kong | Diagnostic applications using nucleic acid fragments |
| KR102083501B1 (ko) * | 2017-02-09 | 2020-03-02 | 사회복지법인 삼성생명공익재단 | 종양 치료를 위한 표적 유전자 판별 방법 |
| WO2018201072A2 (en) | 2017-04-28 | 2018-11-01 | 4D Path Inc. | Apparatus, systems, and methods for rapid cancer detection |
| ES2991960T3 (es) * | 2017-05-16 | 2024-12-05 | Guardant Health Inc | Identificación del origen somático o germinal del ADN libre de células |
| US10636512B2 (en) | 2017-07-14 | 2020-04-28 | Cofactor Genomics, Inc. | Immuno-oncology applications using next generation sequencing |
| EP4234723A3 (en) | 2017-07-26 | 2023-09-20 | The Chinese University Of Hong Kong | Enhancement of cancer screening using cell-free viral nucleic acids |
| EP3665308A1 (en) | 2017-08-07 | 2020-06-17 | The Johns Hopkins University | Methods and materials for assessing and treating cancer |
| JP7072825B2 (ja) * | 2017-09-13 | 2022-05-23 | 三菱電機ソフトウエア株式会社 | コピー数計測装置、コピー数計測プログラムおよびコピー数計測方法 |
| SG11202002381TA (en) * | 2017-09-20 | 2020-04-29 | Guardant Health Inc | Methods and systems for differentiating somatic and germline variants |
| EP3704268B1 (en) | 2017-11-03 | 2025-01-22 | Guardant Health, Inc. | Normalizing tumor mutation burden |
| EP3717662A1 (en) * | 2017-11-28 | 2020-10-07 | Grail, Inc. | Models for targeted sequencing |
| AU2018375008B2 (en) | 2017-12-01 | 2024-06-27 | Illumina, Inc. | Methods and systems for determining somatic mutation clonality |
| CA3083787A1 (en) | 2017-12-01 | 2019-06-06 | Personal Genome Diagnositics Inc. | Process for microsatellite instability detection |
| CN108491689B (zh) * | 2018-02-01 | 2019-07-09 | 杭州纽安津生物科技有限公司 | 基于转录组的肿瘤新抗原鉴定方法 |
| CN111684078B (zh) * | 2018-02-12 | 2024-04-19 | 豪夫迈·罗氏有限公司 | 通过评价肿瘤遗传异质性来预测对治疗的应答的方法 |
| KR102929212B1 (ko) * | 2018-02-27 | 2026-02-20 | 코넬 유니버시티 | 잔류 질환의 검출을 위한 시스템 및 방법 |
| JP2021519607A (ja) * | 2018-02-27 | 2021-08-12 | コーネル・ユニバーシティーCornell University | ゲノムワイド統合による循環腫瘍dnaの超音波感受性検出 |
| GB2587939B (en) | 2018-04-02 | 2023-06-14 | Grail Llc | Methylation markers and targeted methylation probe panels |
| WO2019195769A1 (en) * | 2018-04-06 | 2019-10-10 | The Brigham And Women's Hospital, Inc. | Methods of diagnosing and treating aggressive cutaneous t-cell lymphomas |
| CN112218957B (zh) * | 2018-04-16 | 2025-08-08 | 格里尔公司 | 用于确定在无细胞核酸中的肿瘤分数的系统及方法 |
| US20240254547A1 (en) * | 2018-04-27 | 2024-08-01 | Kao Corporation | Highly accurate sequencing method |
| JP7274504B2 (ja) * | 2018-05-08 | 2023-05-16 | エフ. ホフマン-ラ ロシュ アーゲー | 多様度指数を確立することで腫瘍バリアント多様度を評価することによるがん予後診断の方法 |
| CN120193081A (zh) * | 2018-07-23 | 2025-06-24 | 夸登特健康公司 | 用于通过肿瘤分数和覆盖率调整肿瘤突变负荷的方法和系统 |
| CA3111887A1 (en) | 2018-09-27 | 2020-04-02 | Grail, Inc. | Methylation markers and targeted methylation probe panel |
| GB2577548B (en) * | 2018-09-28 | 2022-10-26 | Siemens Healthcare Gmbh | Method for determining a subject's genetic copy number value |
| CN113168885B (zh) * | 2018-11-13 | 2024-07-16 | 麦利亚德基因公司 | 用于体细胞突变的方法和系统及其用途 |
| CA3118742A1 (en) * | 2018-11-21 | 2020-05-28 | Karius, Inc. | Detection and prediction of infectious disease |
| CN109712671B (zh) * | 2018-12-20 | 2020-06-26 | 北京优迅医学检验实验室有限公司 | 基于ctDNA的基因检测装置、存储介质及计算机系统 |
| WO2020146727A1 (en) * | 2019-01-10 | 2020-07-16 | Selim Olcum | Identifying cancer therapies |
| EP3918089B1 (en) | 2019-01-31 | 2025-01-15 | Guardant Health, Inc. | Method for isolating and sequencing cell-free dna |
| EP3984037A1 (en) * | 2019-06-13 | 2022-04-20 | F. Hoffmann-La Roche AG | Systems and methods with improved user interface for interpreting and visualizing longitudinal data |
| CN110428905B (zh) * | 2019-07-02 | 2022-03-29 | 江南大学附属医院 | 一种肿瘤生长趋势预测方法 |
| JP7342239B2 (ja) * | 2019-07-22 | 2023-09-11 | エフ. ホフマン-ラ ロシュ アーゲー | バリアント呼び出しデータからの起始細胞決定のためのシステムおよび方法 |
| AU2020345621A1 (en) * | 2019-09-09 | 2022-04-07 | University Of Utah Research Foundation | Targeted sequencing to detect and quantify low levels of methylated DNA |
| EP3809414A1 (en) * | 2019-10-15 | 2021-04-21 | Koninklijke Philips N.V. | Method and apparatus for assessing patient's response to therapy |
| CN110895963A (zh) * | 2019-10-31 | 2020-03-20 | 深圳兰丁医学检验实验室 | 一种基于人工智能的细胞dna定量检测系统 |
| BR112022015909A2 (pt) | 2020-02-14 | 2022-10-04 | Univ Johns Hopkins | Métodos e materiais para avaliação de ácidos nucleicos |
| US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
| US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
| US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
| WO2021243303A1 (en) * | 2020-05-29 | 2021-12-02 | Children's National Medical Center | Genetic diagnostic tool for facioscapulohumeral muscular dystrophy (fshd) |
| DE112021004478T5 (de) | 2020-08-25 | 2023-09-14 | Seer, Inc. | Zusammensetzungen und verfahren zur bestimmung von proteinen und nukleinsäuren |
| US20240006080A1 (en) * | 2020-12-07 | 2024-01-04 | Hoffmann-La Roche Inc. | Techniques for generating predictive outcomes relating to oncological lines of therapy using artificial intelligence |
| US12423593B2 (en) * | 2021-06-11 | 2025-09-23 | Massachusetts Institute Of Technology | Systems and methods for synthetic interventions |
| WO2023009857A2 (en) * | 2021-07-30 | 2023-02-02 | Guardant Health, Inc. | Computer architecture for identifying lines of therapy |
| CN114267445B (zh) * | 2021-12-23 | 2024-09-06 | 众阳健康科技集团有限公司 | 一种诊断一致性检验方法、系统、设备及介质 |
| JP7365656B1 (ja) | 2022-02-18 | 2023-10-20 | Dic株式会社 | 硫化オレフィンの製造方法 |
| EP4496905A4 (en) * | 2022-03-23 | 2026-03-18 | Found Medicine Inc | METHODS AND SYSTEMS FOR DETERMINING TUMOR HETEROGENEITY |
| TW202436625A (zh) * | 2023-03-01 | 2024-09-16 | 體學生物科技股份有限公司 | 核酸分子的檢測方法、檢測套組及檢測卡匣 |
| CN116403644B (zh) * | 2023-03-03 | 2023-12-05 | 深圳吉因加信息科技有限公司 | 一种用于癌症风险预测的方法及装置 |
| US20240339215A1 (en) * | 2023-04-06 | 2024-10-10 | Board Of Regents, The University Of Texas System | System and method for drug selection |
| US20240363198A1 (en) * | 2023-04-27 | 2024-10-31 | Cardiai Technologies | System for identifying genetic variants and method thereof |
| CN117219162B (zh) * | 2023-09-12 | 2024-07-02 | 四川大学 | 针对肿瘤组织str图谱进行身源鉴定的证据强度评估方法 |
| USD1118634S1 (en) * | 2023-10-11 | 2026-03-17 | Open Text Inc. | Display screen or portion thereof with graphical user interface for visualizing connections between base entities of a story corresponding to a security issue |
Family Cites Families (27)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7385605B2 (en) * | 2003-12-04 | 2008-06-10 | International Business Machines Corporation | Computer display system for dynamically modifying stacked area line graphs to change the order or presence of a set of stacked areas in the graph respectively representative of the proportions contributed to a total by each of a set of time dependent variables |
| US20060199189A1 (en) * | 2005-03-07 | 2006-09-07 | Bradford Sherry A | Low-dose, sequenced, individualized chemotherapy dosing method |
| US10095829B2 (en) * | 2009-07-08 | 2018-10-09 | Worldwide Innovative Network | Computer implemented methods of treating lung cancer |
| US20140148350A1 (en) * | 2010-08-18 | 2014-05-29 | David Spetzler | Circulating biomarkers for disease |
| PL3246416T3 (pl) | 2011-04-15 | 2024-09-30 | The Johns Hopkins University | Bezpieczny system sekwencjonowania |
| CA2840149C (en) | 2011-07-08 | 2021-10-26 | Epigenomics Ag | Methods and nucleic acids for determining the prognosis of a cancer subject |
| EP2563937A1 (en) * | 2011-07-26 | 2013-03-06 | Verinata Health, Inc | Method for determining the presence or absence of different aneuploidies in a sample |
| US20130110407A1 (en) * | 2011-09-16 | 2013-05-02 | Complete Genomics, Inc. | Determining variants in genome of a heterogeneous sample |
| SG190466A1 (en) * | 2011-11-18 | 2013-06-28 | Agency Science Tech & Res | Methods for diagnosis and/or prognosis of ovarian cancer |
| DK2828218T3 (da) | 2012-03-20 | 2020-11-02 | Univ Washington Through Its Center For Commercialization | Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing |
| US11261494B2 (en) * | 2012-06-21 | 2022-03-01 | The Chinese University Of Hong Kong | Method of measuring a fractional concentration of tumor DNA |
| IL269097B2 (en) * | 2012-09-04 | 2024-01-01 | Guardant Health Inc | Systems and methods to detect rare mutations and copy number variation |
| SMT202100256T1 (it) * | 2012-09-20 | 2021-05-07 | Univ Hong Kong Chinese | Determinazione non invasiva di metiloma di tumore dal plasma |
| US20140287937A1 (en) | 2013-02-21 | 2014-09-25 | Toma Biosciences, Inc. | Methods for assessing cancer |
| EP3795696B1 (en) * | 2013-03-15 | 2023-04-26 | The Board of Trustees of the Leland Stanford Junior University | Identification and use of circulating nucleic acid tumor markers |
| EP4439566A3 (en) | 2013-03-15 | 2024-12-04 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
| WO2014165549A1 (en) | 2013-04-01 | 2014-10-09 | University Of Florida Research Foundation, Incorporated | Determination of methylation state and chromatin structure of target genetic loci |
| EP3003377A1 (en) * | 2013-05-31 | 2016-04-13 | Novartis AG | Combination therapy containing a pi3k-alpha inhibitor and fgfr kinase inhibitor for treating cancer |
| EP3240911B1 (en) * | 2014-12-31 | 2020-08-26 | Guardant Health, Inc. | Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results |
| EP4462438A3 (en) * | 2015-10-09 | 2025-02-26 | Guardant Health, Inc. | Population based treatment recommender using cell free dna |
| WO2017106768A1 (en) | 2015-12-17 | 2017-06-22 | Guardant Health, Inc. | Methods to determine tumor gene copy number by analysis of cell-free dna |
| US11384382B2 (en) * | 2016-04-14 | 2022-07-12 | Guardant Health, Inc. | Methods of attaching adapters to sample nucleic acids |
| USD810111S1 (en) * | 2016-09-08 | 2018-02-13 | Sap Se | Electronic display screen with a graphical user interface |
| EP3785269A4 (en) | 2018-03-29 | 2021-12-29 | Freenome Holdings, Inc. | Methods and systems for analyzing microbiota |
| USD1013704S1 (en) * | 2021-07-09 | 2024-02-06 | The Regents Of The University Of Colorado, A Body Corporate | Display screen or portion thereof with graphical user interface |
| US20240052419A1 (en) * | 2022-08-10 | 2024-02-15 | Guardant Health, Inc. | Methods and systems for detecting genetic variants |
| US20240071628A1 (en) * | 2022-08-24 | 2024-02-29 | Guardant Health, Inc. | Database for therapeutic interventions |
-
2015
- 2015-12-28 EP EP15876120.5A patent/EP3240911B1/en active Active
- 2015-12-28 ES ES15876120T patent/ES2828279T3/es active Active
- 2015-12-28 PL PL25155747.6T patent/PL4574996T3/pl unknown
- 2015-12-28 WO PCT/US2015/067717 patent/WO2016109452A1/en not_active Ceased
- 2015-12-28 EP EP25213401.0A patent/EP4715065A2/en active Pending
- 2015-12-28 EP EP25155747.6A patent/EP4574996B1/en active Active
- 2015-12-28 CN CN202111138455.6A patent/CN113930507A/zh active Pending
- 2015-12-28 EP EP22176398.0A patent/EP4123032B1/en active Active
- 2015-12-28 CN CN201580077268.8A patent/CN107406876B/zh active Active
- 2015-12-28 ES ES22176398T patent/ES3017068T3/es active Active
- 2015-12-28 ES ES20179648T patent/ES2923602T3/es active Active
- 2015-12-28 AU AU2015374259A patent/AU2015374259B2/en active Active
- 2015-12-28 GB GB1712299.5A patent/GB2552267B/en active Active
- 2015-12-28 EP EP20179648.9A patent/EP3766986B1/en active Active
- 2015-12-28 JP JP2017535008A patent/JP6783768B2/ja active Active
-
2017
- 2017-02-13 US US15/431,395 patent/US20170260590A1/en active Pending
-
2020
- 2020-04-17 JP JP2020073957A patent/JP7145907B2/ja active Active
- 2020-08-21 US US17/000,010 patent/US20210040565A1/en active Pending
- 2020-11-04 AU AU2020264326A patent/AU2020264326B2/en active Active
-
2021
- 2021-02-02 US US29/768,979 patent/USD1077824S1/en active Active
- 2021-08-31 US US17/462,906 patent/US20210395837A1/en active Pending
- 2021-11-11 JP JP2021184052A patent/JP7458360B2/ja active Active
-
2022
- 2022-03-21 US US17/699,968 patent/US20240141432A9/en active Pending
-
2023
- 2023-07-20 AU AU2023206196A patent/AU2023206196A1/en active Pending
-
2024
- 2024-01-04 JP JP2024000141A patent/JP2024029174A/ja active Pending
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7458360B2 (ja) | 疾患細胞不均一性を示す疾患の検出および処置、ならびに通信試験結果のためのシステムおよび方法 | |
| JP7689557B2 (ja) | 相同組換え欠損を推定するための統合された機械学習フレームワーク | |
| EP4008005B1 (en) | Methods and systems for detecting microsatellite instability of a cancer in a liquid biopsy assay | |
| ES2989374T3 (es) | Sistemas y procedimientos para predecir el estado de deficiencia de recombinación homóloga de una muestra | |
| ES2660989T3 (es) | Métodos y sistemas para detectar variantes genéticas | |
| JP6987786B2 (ja) | がんの進化の検出および診断 | |
| ES2969767T3 (es) | Métodos de diagnóstico | |
| JP2025158958A (ja) | 腫瘍情報に基づいた循環腫瘍割合の推定のための方法およびシステム | |
| JP2025124606A (ja) | 液体生検アッセイにおける血液腫瘍遺伝子変異量を決定するための方法およびシステム | |
| US20240071628A1 (en) | Database for therapeutic interventions | |
| US20240052419A1 (en) | Methods and systems for detecting genetic variants | |
| CA2972433C (en) | Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results |









