KR20240053637A - 개선된 암 진단 및 치료법 선택을 위한 차세대 시퀀싱 및 인공 지능-기반 접근법 - Google Patents
개선된 암 진단 및 치료법 선택을 위한 차세대 시퀀싱 및 인공 지능-기반 접근법 Download PDFInfo
- Publication number
- KR20240053637A KR20240053637A KR1020247011239A KR20247011239A KR20240053637A KR 20240053637 A KR20240053637 A KR 20240053637A KR 1020247011239 A KR1020247011239 A KR 1020247011239A KR 20247011239 A KR20247011239 A KR 20247011239A KR 20240053637 A KR20240053637 A KR 20240053637A
- Authority
- KR
- South Korea
- Prior art keywords
- fusion
- cancer
- alteration
- gene
- transcriptomic
- Prior art date
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 134
- 201000011510 cancer Diseases 0.000 title claims abstract description 89
- 238000011282 treatment Methods 0.000 title claims description 23
- 238000003745 diagnosis Methods 0.000 title claims description 9
- 238000013459 approach Methods 0.000 title description 15
- 238000007481 next generation sequencing Methods 0.000 title description 11
- 238000013473 artificial intelligence Methods 0.000 title description 7
- 238000000034 method Methods 0.000 claims abstract description 65
- 239000000203 mixture Substances 0.000 claims abstract description 20
- 230000004927 fusion Effects 0.000 claims description 339
- 108090000623 proteins and genes Proteins 0.000 claims description 139
- 230000004075 alteration Effects 0.000 claims description 93
- 230000037442 genomic alteration Effects 0.000 claims description 91
- 239000000523 sample Substances 0.000 claims description 86
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 59
- 230000002068 genetic effect Effects 0.000 claims description 58
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 57
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 57
- 201000002528 pancreatic cancer Diseases 0.000 claims description 56
- 238000012163 sequencing technique Methods 0.000 claims description 32
- 210000004027 cell Anatomy 0.000 claims description 26
- 210000001519 tissue Anatomy 0.000 claims description 21
- 108091034117 Oligonucleotide Proteins 0.000 claims description 19
- 230000002759 chromosomal effect Effects 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 15
- 108020004414 DNA Proteins 0.000 claims description 13
- 238000001574 biopsy Methods 0.000 claims description 12
- 238000002560 therapeutic procedure Methods 0.000 claims description 12
- 208000026310 Breast neoplasm Diseases 0.000 claims description 11
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 11
- 206010006187 Breast cancer Diseases 0.000 claims description 10
- 206010009944 Colon cancer Diseases 0.000 claims description 10
- 206010027476 Metastases Diseases 0.000 claims description 10
- 206010060862 Prostate cancer Diseases 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 239000007788 liquid Substances 0.000 claims description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 9
- 150000007523 nucleic acids Chemical class 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 201000009030 Carcinoma Diseases 0.000 claims description 8
- 208000008839 Kidney Neoplasms Diseases 0.000 claims description 8
- 206010038389 Renal cancer Diseases 0.000 claims description 8
- 238000004166 bioassay Methods 0.000 claims description 8
- 210000000481 breast Anatomy 0.000 claims description 8
- 210000000349 chromosome Anatomy 0.000 claims description 8
- 201000010982 kidney cancer Diseases 0.000 claims description 8
- 206010025323 Lymphomas Diseases 0.000 claims description 7
- 208000020816 lung neoplasm Diseases 0.000 claims description 7
- 206010061289 metastatic neoplasm Diseases 0.000 claims description 7
- 206010005003 Bladder cancer Diseases 0.000 claims description 6
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 6
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 6
- 206010039491 Sarcoma Diseases 0.000 claims description 6
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 claims description 6
- 230000003426 interchromosomal effect Effects 0.000 claims description 6
- 201000005202 lung cancer Diseases 0.000 claims description 6
- 201000001441 melanoma Diseases 0.000 claims description 6
- 230000009401 metastasis Effects 0.000 claims description 6
- 238000011275 oncology therapy Methods 0.000 claims description 6
- 230000028327 secretion Effects 0.000 claims description 6
- 201000005112 urinary bladder cancer Diseases 0.000 claims description 6
- 208000031261 Acute myeloid leukaemia Diseases 0.000 claims description 5
- 208000003174 Brain Neoplasms Diseases 0.000 claims description 5
- 206010008342 Cervix carcinoma Diseases 0.000 claims description 5
- 208000022072 Gallbladder Neoplasms Diseases 0.000 claims description 5
- 206010030155 Oesophageal carcinoma Diseases 0.000 claims description 5
- 206010033128 Ovarian cancer Diseases 0.000 claims description 5
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 5
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 claims description 5
- 230000001154 acute effect Effects 0.000 claims description 5
- 201000005188 adrenal gland cancer Diseases 0.000 claims description 5
- 208000024447 adrenal gland neoplasm Diseases 0.000 claims description 5
- 230000003321 amplification Effects 0.000 claims description 5
- 201000010881 cervical cancer Diseases 0.000 claims description 5
- 201000010175 gallbladder cancer Diseases 0.000 claims description 5
- 238000007901 in situ hybridization Methods 0.000 claims description 5
- 201000007270 liver cancer Diseases 0.000 claims description 5
- 208000014018 liver neoplasm Diseases 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 108020004707 nucleic acids Proteins 0.000 claims description 5
- 102000039446 nucleic acids Human genes 0.000 claims description 5
- 208000000461 Esophageal Neoplasms Diseases 0.000 claims description 4
- 206010017993 Gastrointestinal neoplasms Diseases 0.000 claims description 4
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 claims description 4
- 208000002495 Uterine Neoplasms Diseases 0.000 claims description 4
- 208000029742 colonic neoplasm Diseases 0.000 claims description 4
- 201000004101 esophageal cancer Diseases 0.000 claims description 4
- 201000010536 head and neck cancer Diseases 0.000 claims description 4
- 208000014829 head and neck neoplasm Diseases 0.000 claims description 4
- 208000011645 metastatic carcinoma Diseases 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 206010046766 uterine cancer Diseases 0.000 claims description 4
- 238000009007 Diagnostic Kit Methods 0.000 claims description 3
- 239000003153 chemical reaction reagent Substances 0.000 claims description 3
- 230000000977 initiatory effect Effects 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 210000002307 prostate Anatomy 0.000 claims description 3
- 208000016691 refractory malignant neoplasm Diseases 0.000 claims description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 2
- 238000009396 hybridization Methods 0.000 claims description 2
- 210000005267 prostate cell Anatomy 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 201000008129 pancreatic ductal adenocarcinoma Diseases 0.000 description 20
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 19
- 239000003795 chemical substances by application Substances 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 13
- 210000000496 pancreas Anatomy 0.000 description 12
- 230000004083 survival effect Effects 0.000 description 12
- 150000001875 compounds Chemical class 0.000 description 9
- 239000003814 drug Substances 0.000 description 9
- 238000002271 resection Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000004393 prognosis Methods 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 7
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 230000008707 rearrangement Effects 0.000 description 6
- 230000005945 translocation Effects 0.000 description 6
- 102000001301 EGF receptor Human genes 0.000 description 5
- 108060006698 EGF receptor Proteins 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 230000001575 pathological effect Effects 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 241000699670 Mus sp. Species 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000002512 chemotherapy Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000009099 neoadjuvant therapy Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 238000001959 radiotherapy Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 206010014733 Endometrial cancer Diseases 0.000 description 3
- 206010014759 Endometrial neoplasm Diseases 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- 238000003559 RNA-seq method Methods 0.000 description 3
- 208000009956 adenocarcinoma Diseases 0.000 description 3
- 150000001413 amino acids Chemical group 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000000527 lymphocytic effect Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000001394 metastastic effect Effects 0.000 description 3
- 238000002638 palliative care Methods 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 238000013268 sustained release Methods 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 229940124597 therapeutic agent Drugs 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 206010052747 Adenocarcinoma pancreas Diseases 0.000 description 2
- 208000024678 Complex chromosomal rearrangement Diseases 0.000 description 2
- 102100037579 D-3-phosphoglycerate dehydrogenase Human genes 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 208000007990 Giant Cell Tumor of Tendon Sheath Diseases 0.000 description 2
- 206010069755 K-ras gene mutation Diseases 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 108010038555 Phosphoglycerate dehydrogenase Proteins 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 201000008754 Tenosynovial giant cell tumor Diseases 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 238000009098 adjuvant therapy Methods 0.000 description 2
- 208000035269 cancer or benign tumor Diseases 0.000 description 2
- 230000008711 chromosomal rearrangement Effects 0.000 description 2
- 210000001072 colon Anatomy 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 238000013265 extended release Methods 0.000 description 2
- 230000037406 food intake Effects 0.000 description 2
- 208000005017 glioblastoma Diseases 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000869 mutational effect Effects 0.000 description 2
- 201000002094 pancreatic adenocarcinoma Diseases 0.000 description 2
- 210000004923 pancreatic tissue Anatomy 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 238000010837 poor prognosis Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000012913 prioritisation Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 239000012730 sustained-release form Substances 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- 230000005748 tumor development Effects 0.000 description 2
- 102100024363 Arf-GAP with dual PH domain-containing protein 1 Human genes 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 208000003950 B-cell lymphoma Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 208000017897 Carcinoma of esophagus Diseases 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 101150059169 FAM120A gene Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 208000021309 Germ cell tumor Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000876352 Homo sapiens Alpha-endosulfine Proteins 0.000 description 1
- 101000832765 Homo sapiens Arf-GAP with dual PH domain-containing protein 1 Proteins 0.000 description 1
- 101000706557 Homo sapiens SUN domain-containing protein 1 Proteins 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 206010023825 Laryngeal cancer Diseases 0.000 description 1
- 102000017274 MDM4 Human genes 0.000 description 1
- 108050005300 MDM4 Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010027406 Mesothelioma Diseases 0.000 description 1
- 206010027457 Metastases to liver Diseases 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 208000034176 Neoplasms, Germ Cell and Embryonal Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 206010033645 Pancreatitis Diseases 0.000 description 1
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 102100031130 SUN domain-containing protein 1 Human genes 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 206010041067 Small cell lung cancer Diseases 0.000 description 1
- 208000034254 Squamous cell carcinoma of the cervix uteri Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 206010042971 T-cell lymphoma Diseases 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 208000008385 Urogenital Neoplasms Diseases 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 201000008395 adenosquamous carcinoma Diseases 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 208000030961 allergic reaction Diseases 0.000 description 1
- 238000005267 amalgamation Methods 0.000 description 1
- 201000007436 apocrine adenocarcinoma Diseases 0.000 description 1
- 229920002988 biodegradable polymer Polymers 0.000 description 1
- 239000004621 biodegradable polymer Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 201000000053 blastoma Diseases 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000005907 cancer growth Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 208000019065 cervical carcinoma Diseases 0.000 description 1
- 201000006612 cervical squamous cell carcinoma Diseases 0.000 description 1
- 210000003679 cervix uteri Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000011260 co-administration Methods 0.000 description 1
- 201000010989 colorectal carcinoma Diseases 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 210000000188 diaphragm Anatomy 0.000 description 1
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 1
- 235000019621 digestibility Nutrition 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 230000002500 effect on skin Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 201000008184 embryoma Diseases 0.000 description 1
- 201000003683 endocervical adenocarcinoma Diseases 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 201000005619 esophageal carcinoma Diseases 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 230000008826 genomic mutation Effects 0.000 description 1
- 201000003911 head and neck carcinoma Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 201000005264 laryngeal carcinoma Diseases 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005249 lung adenocarcinoma Diseases 0.000 description 1
- 201000005243 lung squamous cell carcinoma Diseases 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 201000010879 mucinous adenocarcinoma Diseases 0.000 description 1
- 201000005962 mycosis fungoides Diseases 0.000 description 1
- 208000025113 myeloid leukemia Diseases 0.000 description 1
- 238000011227 neoadjuvant chemotherapy Methods 0.000 description 1
- 201000011682 nervous system cancer Diseases 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000000955 neuroendocrine Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 210000002747 omentum Anatomy 0.000 description 1
- 238000011369 optimal treatment Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 238000011338 personalized therapy Methods 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 238000011458 pharmacological treatment Methods 0.000 description 1
- 210000004224 pleura Anatomy 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229940124606 potential therapeutic agent Drugs 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000008261 resistance mechanism Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000011451 sequencing strategy Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 208000000587 small cell lung carcinoma Diseases 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- -1 solubility Chemical class 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 238000011477 surgical intervention Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 239000000439 tumor marker Substances 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 230000004222 uncontrolled growth Effects 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/40—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mechanical, radiation or invasive therapies, e.g. surgery, laser therapy, dialysis or acupuncture
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/60—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
- G16H40/67—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Public Health (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Pathology (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Theoretical Computer Science (AREA)
- Urology & Nephrology (AREA)
- Surgery (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medicinal Chemistry (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
Abstract
무증상 대상체 또는 암을 앓고 있는 대상체에서 암 상태의 진행을 식별하고 예측하는 방법; 및 이와 관련된 조성물 및 키트가 본 명세서에서 제공된다.
Description
관련 출원
본 출원은 2021년 9월 8일자로 출원된 미국 가출원 제63/241813호의 이익을 주장한다. 상기 출원의 전체 교시내용은 본 명세서에 참조에 의해 원용된다.
대부분의 국가에서, 인구 구조 변화와 노령화로 인해, 매년 암 진단 빈도가 증가하고 있다. 2015년, 스위스에서는 암 진단 사례가 연간 40,000건 이상으로 증가하였으며, 5년 생존율은 전체의 60% 미만이었다(Swiss Federal Statistics Office, 2019). 유방암과 전립선암은 가장 많이 진단되는 암 중 하나이며, 췌장암은 10가지 가장 빈번한 암 유형 중에서 생존율이 가장 낮고, 5년 생존율이 대략 10%인 것으로 나타난다. 연구 노력에도 불구하고, 현재의 병리학적 조직학 및 분자 분석을 사용하여 이용 가능한 치료법에 대한 진화, 중증도, 및 반응은 평가하기가 여전히 어렵다. 따라서, 병리학적 반응의 부족은 대부분의 요법에서 전형적으로 약 50%로 유지되어, 환자에 대한 예후와 삶의 질이 저하되고, 동시에 비용이 증가하게 된다.
췌장암의 경우, 무증상 초기 종양의 수술적 절제를 제외하고는, 질환은 여전히 대부분 치료가 불가능한 것으로 간주된다. 췌장암은 수술의 효능이 단지 제한적이고, 효율적이고 구체적인 약리학적 치료가 여전히 부족한 후기 전이 단계에서 가장 흔히 진단된다. 결과적으로, 비-특이적 및 비-치료적 화학요법 및 방사선요법이 기대 수명을 증가시키는 데 종종 사용되며, 이는 환자의 삶의 질에 심각한 결과를 가져온다. 췌장 도관 선암종(PDCA)과 같은 췌장암의 공격적인 형태는 주변 조직으로 확산 및/또는 전이를 형성한 후 더 이상 절제할 수 없는 말기 단계에 가장 빈번하게 진단된다. PDCA의 초기 단계는 대부분 증상이 없고 현재 혈청-기반 분석법은 무통성 췌장염과 점액성 췌장 선암종을 구별할 수 없다(Carmicheal et al., 2019). KRAS와 EGFR의 돌연변이 또는 상향 조절과 같은 돌연변이 부하에 대한 현재 분석은 이들이 많은 암에 대해 공통적이기 때문에 췌장암 유형을 진단하고 적절하게 분류하기에 충분하지 않다. 현재, 일상적으로 사용될 수 있는 효율적이고 민감하며 비-침습적인 무증상 진단 접근법은 없다. 말기 단계의 PDCA는, 재발로 인해 수술이 종종 장기적으로 비효율적인 것으로 판명되고, 특정 치료법이 부족하기 때문에 치료하기가 어려운 것으로 악명이 높다. 화학요법 및/또는 방사선요법은 종종 보조 요법의 완화 치료로 사용되지만, 대부분의 경우에 치료 효과가 없을 것이다. 따라서, 수술적 절제에 의해 치료 가능하면서, 더 효율적이고 특이적인 요법을 개발하고 적용하기 위해, 암, 예를 들어 췌장암을 초기 단계에서 검출하기 위한 비-침습적이고 민감하며 저렴한 진단 방법에 대한 명확하고 충족되지 않은 요구가 존재한다(Carmicheal et al., 2019). 유사하게, 유방암 및 전립선암은 진행 및 약물 반응의 측면에서 적절하게 진단하기 어려운 종양의 다른 예이다(Davidson et al., 2019; Ponde et al., 2019).
하기 단계를 포함하는, 무증상 대상체가 암 상태로 진행될 가능성을 예측하는 방법이 본 명세서에서 제공된다:
(a) 상기 대상체로부터의 샘플에서 상기 대상체의 게놈의 적어도 일부를 시퀀싱하는 단계 및
(b) 상기 샘플의 시퀀싱으로부터 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체(neotranscript)를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 암 발병 위험의 증가를 나타내는, 상기 식별하는 단계.
특정 양태에서, 하기 단계를 포함하는, 개별화 암 요법을 위해 무증상 대상체를 식별하는 방법이 본 명세서에서 제공된다:
(a) 상기 대상체로부터의 샘플에서 상기 대상체의 게놈의 적어도 일부를 시퀀싱하는 단계,
(b) 상기 샘플의 시퀀싱으로부터 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 대상체를 개별화 암 요법을 위한 후보자로서 식별하는, 상기 식별하는 단계 및
(c) 상기 요법을 개시하고/하거나 대상체에 대한 요법의 투여를 모니터링하는 단계.
본 명세서에서 제공된 바와 같은 본 발명의 양태는, 하기 단계를 포함하는, 암을 앓고 있는 대상체에서 종양 반응 또는 내성을 예측하는 방법을 포함한다:
(a) 상기 대상체의 샘플에서 하나 이상의 세포의 게놈의 적어도 일부를 시퀀싱하는 단계;
(b) 상기 샘플에서 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 내성 암 위험의 증가를 나타내는, 상기 식별하는 단계.
특정 양태에서, 하기 단계를 포함하는, 암을 앓고 있는 대상체에서 전이 가능성을 예측하는 방법이 본 명세서에서 제공된다:
(a) 상기 대상체의 샘플에서 하나 이상의 세포의 게놈의 적어도 일부를 시퀀싱하는 단계;
(b) 상기 샘플에서 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 전이 위험의 증가를 나타내는, 상기 식별하는 단계.
또한, 대상체 유래의 샘플에서 표 1에 제시된 유전자 중 적어도 하나를 포함하거나 이로부터 전사되는 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체를 검출하기 위한 생물검정을 수행하는 단계, 생물검정의 결과를 컴퓨터 시스템으로 수신하는 단계, 결과를 처리하여 출력을 결정하는 단계, 판독 가능한 매체에 출력을 제시하는 단계를 포함하는 방법이 본 명세서에서 제공되되, 상기 출력은 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 존재 또는 부재에 기반하여 대상체에게 권장되는 치료 옵션을 식별하고, 샘플은 액체 또는 조직 생검이다.
본 발명의 일부 양태에서, 대상체 유래의 샘플에서 적어도 하나의 유전자 융합체 또는 비-유전자 융합체의 검출을 가능하게 하는 적어도 하나의 시약을 포함하는 암 진단 키트가 본 명세서에서 제공되되, 상기 융합체는 표 1에 제시된 유전자 중 적어도 하나를 포함하거나 이로부터 전사된다.
특정 양태에서, (a) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 접합부에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 검출 프로브; (b) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제1 표지된 프로브 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제2 표지된 프로브; (c) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 서열을 포함하는 제1 증폭 올리고뉴클레오타이드, 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 서열을 포함하는 제2 증폭 올리고뉴클레오타이드; (d) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열에 의해 인코딩되는 아미노산 서열에 특이적으로 결합하는 항체 및 (e) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 검출하기 위한 동일계내 혼성화 프로브(in situ hybridization probe) 중 적어도 하나를 포함하는 조성물이 본 명세서에서 제공된다.
도 1은 췌장암 환자에 대한 결과를 나타낸다. 환자 결과의 3가지 부문이 수 년에 걸쳐 확립되었다. 환자의 약 10 내지 20%를 차지하는 절제 가능한 부문에 절제를 수행하거나 절제 전 선행보조 치료(Neoadjuvant treatment: Neoadj. Tx)를 수행하였다. 절제 후 보조 치료(Adjuvant treatment: Adj Tx)를 적용하였을 때(환자의 76 내지 92%가 이 경로를 따름), 생존은 20.1 내지 23.6개월의 범위인 한편, 보조 치료를 받지 않은 환자에 대해서는 16.9 내지 20.2개월의 생존이 관찰되었다. 절제 전 선행보조 치료는 절제 가능 그룹 내 환자의 생존을 향상시켜(환자의 73.6%가 해당 경로를 따름), 평균 23.3개월의 생존을 야기한다. 환자의 30 내지 40%에 관한 제2 부문은 선행보조 치료 후 절제로 이루어지며, 사례의 33.2%에 대해서는 20.5개월 생존을 가능하게 하는 반면, 비-절제된 환자는 10.2개월의 기대 수명을 갖는다. 선행보조 치료 대신에 완화 치료가 제공된 경우, 평균 생존이 6 내지 11개월의 범위이다. 마지막으로 전이성 췌장암은 평균 생존이 5 내지 9개월인 완화 치료를 받은 환자의 50 내지 60%를 차지한다.
도 2는 신규 융합체의 검출 및 특성화를 가능하게 하는 발견 엔진 파이프라인을 나타낸다. 다양한 시퀀싱 기술에 대해 유래된 RNA 및 DNA 시퀀싱 데이터를 사용 가능한 증거 기반 융합체로 변환하기 위해 여러 소프트웨어에 의해 파이프라인을 조립하였다. 단계 1은 수득한 원시 시퀀스의 평가, 품질 관리 및 필터링으로 이루어졌다. 이어서, 판독 원점(마우스/인간 또는 알려지지 않음)을 단계 2에서 수행한 다음, 단계 2a로 분기하였으며, 이는 인간 게놈 참조 카탈로그(예를 들어, Refseq)에서 각각의 서열을 인덱싱하는 것으로 이루어진 맵핑 전략이었다. 2개의 게놈 위치를 연결하는 것으로 밝혀진 서열을 검출하고 알려진 융합체(즉, 과학 문헌 또는 진단 실무에서 이미 확립됨) 또는 이전에 알려지지 않은 경우 신규 융합체 기준으로 분류하였다. 알려졌거나 신규 융합체로 인식되지 않은 게놈 또는 RNA 서열의 경우, 신규 유전자 및/또는 비-유전자 융합 서열을 검출할 수 있도록 이들 서열을 조립하기 위한 다음 단계를 수행하였다. 단계 2b는 모든 융합체에 대한 포괄적인 평가를 가능하게 하는 새로운 조립-기반 접근법으로 이루어졌다. 이는 길고 짧은 시퀀싱 판독물 둘 다에서 수행되었으며, 샘플에 존재하는 다양한 유기체(마우스 및 인간) 사이의 융합체를 분류하는 데 사용되었다. RNA 서열을 이용하여 수행할 경우, 신규 신전사체 융합체를 발견하기 위한 기초의 역할을 하는 범-전사체 데이터베이스가 구축되었다.
도 3은 신전사체 및 게놈 융합체의 채점 및 우선순위 지정, 및 분류 특징 영향을 나타낸다. 융합체 식별에서 유래된 특징에 대한 기계 학습 접근법을 사용하여, 각각의 후보 융합체에 대한 발생 가능성을 정렬하고 평가할 수 있는 우선순위 지정 체계를 식별하였다. 방법의 성능은 하모닉 F1 스코어로 평가 시 94%로 결정되었으며, 이는 우수한 성능을 나타낸다. 각각의 융합을 사정하고 평가하는 데 사용된 측정값은 알려진 융합체/전사체에 대해 기준점이 되거나, 인실리코 원시 서열 데이터세트에서 스파이킹되거나, 실험적으로 다양한 농도로 RNA/DNA 준비에 도입되었다. 사용된 특징은 2개의 파트너 사이의 유전자 거리, 융합 점수(시퀀싱 판독의 여러 내부 측정기준에서 파생됨), 오픈 리딩 프레임(ORF) 길이(존재하는 경우), 융합체의 길이, 융합 지점을 지지하는 분할 쌍(Split Pair) 및 분할 판독물(Split Read)의 식별, 기원 또는 시작 부위(발생 시, 임의의 코딩 유전자 산물의 경우), 커버리지(샘플에서 융합 빈도 추정을 나타냄), 접합부의 품질을 설명하는 Orf의 접합부 측정값, 전사체당 발현 수준, 및 융합 신뢰도(파생된 신뢰도 측정기준임)이었다. 모든 특징을 높음부터 낮음까지 점수를 매기므로, 따라서 평가 선택이 각각의 융합체에 자동적으로 적용될 수 있다. 예측 점수 값에 긍정적 또는 부정적 영향을 미치는 특징 유형이 식별된 신전사체/게놈 융합체에 대해 설명된다.
도 4는 신규 게놈/전사체 융합체를 발견하기 위한 독특한 시퀀싱 기술의 사용을 나타낸다. 다양한 시퀀싱 기술은 뚜렷한 장점 및 단점을 갖는다. 이는 PDX 췌장암으로부터 얻은 단일 또는 결합 시퀀싱 데이터세트를 사용하여 문서화되었다. 표시된 데이터베이스로부터 수득한 신전사체/융합체는 각각의 열로 표시되고, 식별된 후보 융합체의 수는 y-축에 있다. 선택된 433개의 검증된 융합체는 마지막 2개의 열로 나타낸 후보 융합체의 합으로 이루어진다.
도 5는 알려진 게놈 변경을 사용하여 PDX 췌장암 융합 서열 데이터세트의 검증을 나타낸다. X 축 상에 표시된 돌연변이는 Y 축 상에 나타낸 136개의 췌장암 PDX 모델로부터 수득한 데이터세트를 사용하여 EGFR(좌측 패널) 및 KRAS(우측 패널) 코딩 서열에서 분석되었다. 췌장암의 전형적인 KRAS 돌연변이를 함유하는 종양 샘플의 큰 부분이 박스로 표시되어 있다.
도 6은 췌장암 샘플 중 후보 게놈 융합 및 발생의 히트맵을 나타낸다. 136개의 PDX 췌장암 샘플에서 신전사체/융합체 발생의 클러스터링이 민족성(아시아인/서양인), 하위유형(선암종, 선평편상피암종, 점액성 선암종, 신경내분비 선암종 로시스(rosis), 및 불명확), 생검 부위(횡경막, 간, 림프절, 대망(omentum), 췌장, 복수천자, 늑막, 위 및 불명) 및 병리학 등급(중등도, 중등도 내지 불량, 불량, 불명확, 양호) 범위에 걸쳐, 여러 분류와 관련하여 상부 행에 표시되어 있다. 우측 히스토그램은 특정 신전사체/융합체를 보유하는 PDX 췌장암의 수를 나타낸다. 분류는 매우 빈번하거나 드문(1 내지 2개의 PDX 췌장 모델에서만 관찰됨) 융합체에 기반한다.
도 7은 다른 암 유형과 공유되는 췌장암 신전사체/융합체의 일부를 나타낸다. PDX 암 샘플에서 식별된 433개의 신전사체/융합체의 발생 가능성을 췌장암 보델에서의 발생과 비교하여 다양한 PDX 암 샘플에서 평가하였다. 각각의 췌장암 신전사체/융합체는 선으로 표시되는 반면, 평가된 암 유형은 열로 표시되어 있다(MK=메르켈 암종 , AM=급성 골수성 백혈병, MC=전이성 암종, XX=알 수 없음, PR=전립선, AD= 부신암, MU= 뮬러리안(Mullerian), UT=자궁, KI=신장, GL=담낭, CV=자궁경부, BL=방광, OV=난소, BR=유방, HN=두경부, ES=식도, LU=폐, Li=간, CC=결장, GA=위장, CR=결장직장, PA= 췌장, Al=급성 림프구성, LY=림프종 , SA=육종, ME=흑색종, BN=뇌). 융합체를 함유하는 샘플의 일부(0 내지 100%)는 밝은 회색(암 유형의 100%에서 발생, 예를 들어 상단 선) 내지 검정색(암 유형의 1% 이하에서 발생, 예를 들어 하단 선)으로 표시되어 있다. 대략 47개의 신전사체/융합체는 폐암에도 존재하는 것을 제외하고, 췌장암에서만 배타적으로 발생하는 것으로 밝혀졌다.
도 8은 췌장암 세포 성장 및 배가율의 히트맵 및 분류를 나타낸다. 배가 성장률, 즉 이식된 암 조직의 부피를 두 배로 늘리는 데 필요한 시간을 5 내지 30일 범위의 배가 시간을 표시한 48개 샘플로 이루어진 PDX 모델의 하위집합에 대해 측정하였다. 빠른 성장자의 경우 임의의 10일 미만의 임계값, 그리고 느린 성장자의 경우 10일 초과 임계값을 고려하여, 신전사체/융합체 함량에 대한 배가 성장률의 비교를 평가하였다. 이는 공격적이고 빠른 성장자로 예측되는 결정되지 않은 샘플 중 일부의 분류를 가능하게 하였다(이중 점선).
도 9는 PDX PDAC(1) 및 GTEX 췌장 환자(2+3)에서 가장 차등적으로 조절되는 400개의 유전자의 PCA를 나타낸다. 흰색(3)으로 강조된 부분은 PDAC에 대한 후보 융합체로부터 유전자 융합체를 보유한 GTEX 환자의 하위집합이다.
도 10은 상이한 코호트에서 각각의 샘플에 대해 발견된 총 발현 유전자의 수(>= 1 TPM)를 나타낸다.
도 11은 췌장 샘플에서 융합 사건의 수를 나타낸다. 도 11a는 상이한 코호트에서 각각의 샘플에 대해 발견된 총 유전자-융합 사건의 수를 나타내고, 도 11b는 샘플당 높은 신뢰도의 사건 수를 나타낸다. 높은 신뢰도는 다중 판독 지원, 정확성 및 추가적인 증거로 정의된다.
도 2는 신규 융합체의 검출 및 특성화를 가능하게 하는 발견 엔진 파이프라인을 나타낸다. 다양한 시퀀싱 기술에 대해 유래된 RNA 및 DNA 시퀀싱 데이터를 사용 가능한 증거 기반 융합체로 변환하기 위해 여러 소프트웨어에 의해 파이프라인을 조립하였다. 단계 1은 수득한 원시 시퀀스의 평가, 품질 관리 및 필터링으로 이루어졌다. 이어서, 판독 원점(마우스/인간 또는 알려지지 않음)을 단계 2에서 수행한 다음, 단계 2a로 분기하였으며, 이는 인간 게놈 참조 카탈로그(예를 들어, Refseq)에서 각각의 서열을 인덱싱하는 것으로 이루어진 맵핑 전략이었다. 2개의 게놈 위치를 연결하는 것으로 밝혀진 서열을 검출하고 알려진 융합체(즉, 과학 문헌 또는 진단 실무에서 이미 확립됨) 또는 이전에 알려지지 않은 경우 신규 융합체 기준으로 분류하였다. 알려졌거나 신규 융합체로 인식되지 않은 게놈 또는 RNA 서열의 경우, 신규 유전자 및/또는 비-유전자 융합 서열을 검출할 수 있도록 이들 서열을 조립하기 위한 다음 단계를 수행하였다. 단계 2b는 모든 융합체에 대한 포괄적인 평가를 가능하게 하는 새로운 조립-기반 접근법으로 이루어졌다. 이는 길고 짧은 시퀀싱 판독물 둘 다에서 수행되었으며, 샘플에 존재하는 다양한 유기체(마우스 및 인간) 사이의 융합체를 분류하는 데 사용되었다. RNA 서열을 이용하여 수행할 경우, 신규 신전사체 융합체를 발견하기 위한 기초의 역할을 하는 범-전사체 데이터베이스가 구축되었다.
도 3은 신전사체 및 게놈 융합체의 채점 및 우선순위 지정, 및 분류 특징 영향을 나타낸다. 융합체 식별에서 유래된 특징에 대한 기계 학습 접근법을 사용하여, 각각의 후보 융합체에 대한 발생 가능성을 정렬하고 평가할 수 있는 우선순위 지정 체계를 식별하였다. 방법의 성능은 하모닉 F1 스코어로 평가 시 94%로 결정되었으며, 이는 우수한 성능을 나타낸다. 각각의 융합을 사정하고 평가하는 데 사용된 측정값은 알려진 융합체/전사체에 대해 기준점이 되거나, 인실리코 원시 서열 데이터세트에서 스파이킹되거나, 실험적으로 다양한 농도로 RNA/DNA 준비에 도입되었다. 사용된 특징은 2개의 파트너 사이의 유전자 거리, 융합 점수(시퀀싱 판독의 여러 내부 측정기준에서 파생됨), 오픈 리딩 프레임(ORF) 길이(존재하는 경우), 융합체의 길이, 융합 지점을 지지하는 분할 쌍(Split Pair) 및 분할 판독물(Split Read)의 식별, 기원 또는 시작 부위(발생 시, 임의의 코딩 유전자 산물의 경우), 커버리지(샘플에서 융합 빈도 추정을 나타냄), 접합부의 품질을 설명하는 Orf의 접합부 측정값, 전사체당 발현 수준, 및 융합 신뢰도(파생된 신뢰도 측정기준임)이었다. 모든 특징을 높음부터 낮음까지 점수를 매기므로, 따라서 평가 선택이 각각의 융합체에 자동적으로 적용될 수 있다. 예측 점수 값에 긍정적 또는 부정적 영향을 미치는 특징 유형이 식별된 신전사체/게놈 융합체에 대해 설명된다.
도 4는 신규 게놈/전사체 융합체를 발견하기 위한 독특한 시퀀싱 기술의 사용을 나타낸다. 다양한 시퀀싱 기술은 뚜렷한 장점 및 단점을 갖는다. 이는 PDX 췌장암으로부터 얻은 단일 또는 결합 시퀀싱 데이터세트를 사용하여 문서화되었다. 표시된 데이터베이스로부터 수득한 신전사체/융합체는 각각의 열로 표시되고, 식별된 후보 융합체의 수는 y-축에 있다. 선택된 433개의 검증된 융합체는 마지막 2개의 열로 나타낸 후보 융합체의 합으로 이루어진다.
도 5는 알려진 게놈 변경을 사용하여 PDX 췌장암 융합 서열 데이터세트의 검증을 나타낸다. X 축 상에 표시된 돌연변이는 Y 축 상에 나타낸 136개의 췌장암 PDX 모델로부터 수득한 데이터세트를 사용하여 EGFR(좌측 패널) 및 KRAS(우측 패널) 코딩 서열에서 분석되었다. 췌장암의 전형적인 KRAS 돌연변이를 함유하는 종양 샘플의 큰 부분이 박스로 표시되어 있다.
도 6은 췌장암 샘플 중 후보 게놈 융합 및 발생의 히트맵을 나타낸다. 136개의 PDX 췌장암 샘플에서 신전사체/융합체 발생의 클러스터링이 민족성(아시아인/서양인), 하위유형(선암종, 선평편상피암종, 점액성 선암종, 신경내분비 선암종 로시스(rosis), 및 불명확), 생검 부위(횡경막, 간, 림프절, 대망(omentum), 췌장, 복수천자, 늑막, 위 및 불명) 및 병리학 등급(중등도, 중등도 내지 불량, 불량, 불명확, 양호) 범위에 걸쳐, 여러 분류와 관련하여 상부 행에 표시되어 있다. 우측 히스토그램은 특정 신전사체/융합체를 보유하는 PDX 췌장암의 수를 나타낸다. 분류는 매우 빈번하거나 드문(1 내지 2개의 PDX 췌장 모델에서만 관찰됨) 융합체에 기반한다.
도 7은 다른 암 유형과 공유되는 췌장암 신전사체/융합체의 일부를 나타낸다. PDX 암 샘플에서 식별된 433개의 신전사체/융합체의 발생 가능성을 췌장암 보델에서의 발생과 비교하여 다양한 PDX 암 샘플에서 평가하였다. 각각의 췌장암 신전사체/융합체는 선으로 표시되는 반면, 평가된 암 유형은 열로 표시되어 있다(MK=메르켈 암종 , AM=급성 골수성 백혈병, MC=전이성 암종, XX=알 수 없음, PR=전립선, AD= 부신암, MU= 뮬러리안(Mullerian), UT=자궁, KI=신장, GL=담낭, CV=자궁경부, BL=방광, OV=난소, BR=유방, HN=두경부, ES=식도, LU=폐, Li=간, CC=결장, GA=위장, CR=결장직장, PA= 췌장, Al=급성 림프구성, LY=림프종 , SA=육종, ME=흑색종, BN=뇌). 융합체를 함유하는 샘플의 일부(0 내지 100%)는 밝은 회색(암 유형의 100%에서 발생, 예를 들어 상단 선) 내지 검정색(암 유형의 1% 이하에서 발생, 예를 들어 하단 선)으로 표시되어 있다. 대략 47개의 신전사체/융합체는 폐암에도 존재하는 것을 제외하고, 췌장암에서만 배타적으로 발생하는 것으로 밝혀졌다.
도 8은 췌장암 세포 성장 및 배가율의 히트맵 및 분류를 나타낸다. 배가 성장률, 즉 이식된 암 조직의 부피를 두 배로 늘리는 데 필요한 시간을 5 내지 30일 범위의 배가 시간을 표시한 48개 샘플로 이루어진 PDX 모델의 하위집합에 대해 측정하였다. 빠른 성장자의 경우 임의의 10일 미만의 임계값, 그리고 느린 성장자의 경우 10일 초과 임계값을 고려하여, 신전사체/융합체 함량에 대한 배가 성장률의 비교를 평가하였다. 이는 공격적이고 빠른 성장자로 예측되는 결정되지 않은 샘플 중 일부의 분류를 가능하게 하였다(이중 점선).
도 9는 PDX PDAC(1) 및 GTEX 췌장 환자(2+3)에서 가장 차등적으로 조절되는 400개의 유전자의 PCA를 나타낸다. 흰색(3)으로 강조된 부분은 PDAC에 대한 후보 융합체로부터 유전자 융합체를 보유한 GTEX 환자의 하위집합이다.
도 10은 상이한 코호트에서 각각의 샘플에 대해 발견된 총 발현 유전자의 수(>= 1 TPM)를 나타낸다.
도 11은 췌장 샘플에서 융합 사건의 수를 나타낸다. 도 11a는 상이한 코호트에서 각각의 샘플에 대해 발견된 총 유전자-융합 사건의 수를 나타내고, 도 11b는 샘플당 높은 신뢰도의 사건 수를 나타낸다. 높은 신뢰도는 다중 판독 지원, 정확성 및 추가적인 증거로 정의된다.
환자-유래 이종이식(patient-derived xenograft; PDX) 모델이라고 불리는 면역력이 약화된 마우스에 이종이식에 의해 전파된 인간 종양에 대한 대규모 게놈 연구는 정밀 의학의 약물 반응 예측과 여러 암 환자에 대한 번역 측면에서 유망한 결과를 나타내었다. 그러한 모델은 또한 저항성 메커니즘을 확립하는 데에도 유용한 것으로 입증되어, 따라서 세포주 모델보다 더 많은 정보를 제공하는 것으로 입증되었다(Gao et al., 2015). 그러나, 복제 수 변이 및 큰 염색체 변경과 같은 잠재적으로 관련이 있는 일부 마커는 그러한 연구에서 포착되지 않았다. 이는 유방암이나 췌장 도관 선암종(PDAC)에서는 발견되지 않는 p53 조절인자 MDM4 또는 포스포글리세레이트 탈수소효소(PHGDH) 유전자의 증폭으로 예시된다. 이는 제한된 PDX 샘플 수, 충분한 차세대 시퀀싱(NGS) 깊이 부족, 및/또는 불충분한 데이터 채굴(mining) 및 분석으로 인한 것일 수 있다(Gao et al., 2015; Kim et al., 2019).
진전에도 불구하고, 빈번하거나 특히 치명적인 암(예를 들어, 전립선암과 유방 종양, 예컨대, 췌장암)에 대한 효율적인 진단 도구는 종종 최선의 치료 접근법을 예측하지 못하며, 요법은 이환된 환자 중 일부에 대하여 여전히 비효율적이다. 지금까지 시험관 내 진단 및 치료 접근법의 개발은 신뢰할 수 있는 임상 데이터베이스와 연관된 대규모 종양 샘플 집합이 부족하고, 대규모 데이터 세트를 처리할 수 있는 포괄적인 분자 데이터 세트 및 분석 도구의 필요성으로 인해 제한된다. 따라서, 초기 무증상 진단뿐만 아니라, 종양학에서 효율적이고 구체적인 치료 접근법을 가능하게 하는 데이터세트와 접근법 측면에서 충족되지 않은 요구가 분명히 존재한다.
암 환자-유래 이종이식(PDX) 종양 샘플의 가장 큰 집합 중 하나의 게놈과 전사체를 뮤린 모델에 이식 및 전파한 후 분석한 것이 본 명세서에 개시되어 있다. 환자 임상 데이터 및 종양 특성과 관련하여 DNA 및 RNA 차세대 시퀀싱(NGS) 데이터세트를 수집하고 채굴하였다. 암 진행과 연관된 게놈 및 전사체 변경은 인공 지능(AI) 기반 모델을 사용하여 식별되고 특성화되었다. 효율적인 진단과 치료가 부족하거나(예를 들어, 췌장암) 또는 정확한 진단과 예후를 아는 것이 여전히 어려운(예를 들어, 유방암 및 전립선암) 빈번한 암에 초점을 맞춰, NGS 데이터를 채굴하고 종양 유형 및 환자 임상 데이터뿐만 아니라, 치료법에 대한 종양 병리학적 반응과 상관 관계를 보였다. 인공 지능-기반 모델에 의해 분석될 때 다양한 종양 유형을 설명할 수 있는 특정 세트의 게놈 및 전사체 변경이 식별되어, 별개의 암을 서로 구별할 수 있을 뿐만 아니라, 동족의 건강한 조직과 구별할 수 있다. 또한, 임상 혈액 샘플 또는 종양 생검으로부터 분석될 수 있는 바와 같이, 이들 마커의 하위집합은 식별되어 주어진 종양 유형의 공격성을 예측할 수 있다. 따라서, 그러한 암 마커의 식별에 의해 가능해진 첫 번째 결과는 환자로부터 수득한 임상 샘플을 사용하여 종양 발생에 대한 더 민감하고 구체적인 조기 진단이다. 그러한 포괄적인 NGS 및 AI-기반 시험관 내 진단(IVD) 접근법을 사용하여 수술적 개입이 적합한지 여부를 평가하고 이용 가능한 치료법에 대한 종양 반응 또는 내성을 예측하는 데 필요할 수 있으므로, 종양 진화의 개선된 예후도 또한 달성될 수 있다.
추가적으로, 암 발생, 종양 공격성, 및 이용 가능한 치료법에 대한 반응 또는 내성의 진단을 제공하기 위해 적용될 수 있는 도구를 구성하는 특정 세트의 게놈 및 전사체 마커와 신규한 AI 기반 알고리즘이 본 명세서에서 제공된다. 그러한 도구는 암의 조기 무증상 진단을 가능하게 하여, 다양한 암 유형을 더 잘 구별할 수 있게 하고, 암의 진화에 대해 더 정확하게 예후를 알 수 있게 한다. 그러한 미커는 또한 이용 가능한 치료법에 대한 환자 반응의 보다 신뢰할 수 있는 예측을 제공하고, 이에 의해 각각의 환자에 대하여 가장 적절한 요법의 선택을 가능하게 한다. 이용 가능한 치료법은 분석된 각각의 PDX 샘플의 임상 주석(annotation)에 의해 부분적으로 포함된다. 전반적으로, 본 명세서에 개시된 도구 및 방법의 결과는 종양학 분야에서 시험관 내 진단(IVD), 정밀 의학, 및 개별화 요법을 위한 개선된 전략을 제공하는 것이다.
따라서, 하기 단계를 포함하는, 무증상 대상체가 암 상태로 진행될 가능성을 예측하는 방법이 본 명세서에서 제공된다:
(a) 상기 대상체로부터의 샘플에서 상기 대상체의 게놈의 적어도 일부를 시퀀싱하는 단계 및
(b) 상기 샘플의 시퀀싱으로부터 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 암 발병 위험의 증가를 나타내는, 상기 식별하는 단계.
특정 양태에서, 하기 단계를 포함하는, 개별화 암 요법을 위해 무증상 대상체를 식별하는 방법이 본 명세서에서 제공된다:
(a) 상기 대상체로부터의 샘플에서 상기 대상체의 게놈의 적어도 일부를 시퀀싱하는 단계,
(b) 상기 샘플의 시퀀싱으로부터 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 대상체를 개별화 암 요법을 위한 후보자로서 식별하는, 상기 식별하는 단계 및
(c) 상기 요법을 개시하고/하거나 대상체에 대한 요법의 투여를 모니터링하는 단계.
본 명세서에서 제공된 바와 같은 본 발명의 양태는, 하기 단계를 포함하는, 암을 앓고 있는 대상체에서 종양 반응 또는 내성을 예측하는 방법을 포함한다:
(a) 상기 대상체의 샘플에서 하나 이상의 세포의 게놈의 적어도 일부를 시퀀싱하는 단계;
(b) 상기 샘플에서 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 내성 암 위험의 증가를 나타내는, 상기 식별하는 단계.
특정 양태에서, 하기 단계를 포함하는, 암을 앓고 있는 대상체에서 전이 가능성을 예측하는 방법이 본 명세서에서 제공된다:
(a) 상기 대상체의 샘플에서 하나 이상의 세포의 게놈의 적어도 일부를 시퀀싱하는 단계;
(b) 상기 샘플에서 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 전이 위험의 증가를 나타내는, 상기 식별하는 단계.
융합체
일반적으로 융합체는 염색체간 및 염색체내 재배열(예를 들어, 전좌, 결실, 역위, 복제 등)을 통해 생성되고 코딩 및 비-코딩 서열의 복수의 조합을 생성할 수 있다. 본 명세서에 개시된 DNA 또는 RNA 서열 융합체는 암 세포에서는 함께 융합되지만 정상적인 참조 세포의 세트에서는 분리되어 있는 DNA 또는 RNA 서열로 이루어진다. 그러한 융합체는 코딩, 예를 들어 단백질-코딩 서열을 포함하는 경우 유전자 융합체로 추가로 분류될 수 있는 반면, 비-유전자 융합체는 비-코딩 서열, 예를 들어 아미노산을 코딩하지 않는 DNA 서열을 포함하며, 비-제한적인 예로서 염색체의 유전자 외부 및/또는 사이에 존재하는 DNA; 인트론; 및 유전자 발현의 조절에서 역할을 하는 DNA 요소를 포함할 수 있다. 일부 유전자 융합체는 코딩 잠재력을 가지며 암 발생 또는 진행과 연관될 수 있는 새롭거나 변경된 기능을 갖는 프레임 내(in-frame) 단백질 코딩 서열 또는 비-코딩 조절 RNA를 생산할 수 있다. 예를 들어, 임의의 특정 이론 또는 방법론에 의해 구속받고자 하지 않지만, 그러한 융합체는 암-연관 유전자 또는 유전자 산물을 조절하는 단백질 및/또는 조절 RNA를 생산할 수 있다. 그러한 융합체가 염색체 내(예를 들어, 복제/증폭, 삽입, 결실, 역위 등과 같은 당업계에 알려진 바와 같이 염색체 내부에서 발생하는 재배열로부터 발생하는 융합체) 또는 염색체간(예를 들어, 전좌와 같은 2개 이상 염색체 사이에서 발생하는 재배열 또는 삽입-전좌, 복제수 변이와 연관된 역위, 2개 초과의 염색체에 영향을 미치는 전좌, 및 이들의 조합과 같은 복잡한 염색체 재배열을 포함하지만 이에 제한되지 않는, 당업계에 알려진 바와 같은 더 복잡한 구조적 게놈 변이로부터 발생하는 융합체)에 이루어진 것일 수 있다는 것이 당업자에 의해 이해될 것이다. 따라서, 일부 실시형태에서, 본 명세서에 개시된 융합체는 하나 이상의 염색체간 융합체, 하나 이상의 염색체내 융합체, 또는 임의의 이들의 조합을 포함할 수 있다. 일부 그러한 실시형태에서, 본 명세서에서 고려되고 개시된 융합체는 코딩 및/또는 비-코딩 DNA 서열을 포함할 수 있다.
알려진 융합체라고 불리는 일부 융합체는 이전에 특정 암 세포에서 발생하는 것으로 관찰된 반면(Tembe et al., 2014 or Haas et al., 2019), 본 명세서에서 식별된 알려지지 않은 융합체 또는 신규 융합체는 이전에 본 발명자들의 지식에 보고되지 않았다. 세포에서 전사될 때, 신규 융합체를 구성하는 유전자 융합체는 신전사체 융합체로 식별되거나 검출될 수 있다.
후보 융합체는 융합 지점 및 유전자 융합 파트너(코딩 유전자인 경우)와 같은 계산적으로 포착되거나, 인코딩 조절 RNA(예를 들어, lnRNA)와 같은 별개의 특징을 보유하는 경우 다른 주석에 의해 여러 특징을 갖는다. 알려지지 않은 융합체가 신뢰할 수 있고 유사한 유형의 암에서 빈번하게 발생하는지 여부를 평가하기 위해, 예측된 융합체의 예측된 정확도를 평가하는 점수가 개발되었다.
예시적인 융합체는 NGSAI-NEOTX-1 내지 NGSAI-NEOTX-69 형태의 NGSAI-ID 식별자로 본 명세서에 개시되어 있다. (표 1 참조)
NGSAI-NEOTX-ID 융합체는 융합 지점 주위의 서열, 존재하는 경우 융합 파트너(예를 들어, 유전자 명칭), 및 융합의 예측된 정확도를 설명하는 점수에 의해 특성화될 수 있다.
상기 융합체의 추가적인 파생 특징은 다음과 같다:
본 발명의 일부 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 단일 유전자/비-유전자의 융합체이다. 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 다중 염색체 유전자좌의 융합체이다. 예를 들어, 본 명세서에서 고려되고 개시된 융합체는 적어도 2, 3, 4, 5, 6개, 또는 그 이상의 별개의 염색체 유전자좌를 포함할 수 있다. 그러한 유전자좌는 코딩 또는 비-코딩 영역을 포함할 수 있다. 유사하게, 그러한 유전자좌는 유전자 또는 유전자 간의 영역을 포함할 수 있다. 일부 바람직한 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 2개의 별개의 염색체 유전자좌의 융합체이다. 대안적으로, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 3개의 별개의 염색체 유전자좌의 융합체이다. 추가 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 4개의 별개의 염색체 유전자좌의 융합체이다.
일부 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 유전자 세트 중 적어도 하나를 포함하거나 이로부터 전사된다. 일부 그러한 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 제공된 유전자 중 적어도 하나와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사된다. 바람직하게는, 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 서열번호 1 내지 47로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사된다. 일부 그러한 실시형태에서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 서열번호 1 내지 47의 유전자와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사된다.
일부 실시형태에서, 본 명세서에 개시된 유전자 융합체 또는 비-유전자 융합체는 암 세포에서 전사되어, 적어도 하나의 신전사체의 전사체 변경 및/또는 합성을 초래한다. 본 명세서에 개시된 융합체는 염색체 내(예를 들어, 복제/증폭, 삽입, 결실, 역위 등과 같은 당업계에 알려진 바와 같이 염색체 내부에서 발생하는 재배열로부터 발생하는 융합체) 또는 염색체간(예를 들어, 전좌와 같은 2개 이상 염색체 사이에서 발생하는 재배열 또는 삽입-전좌, 복제수 변이와 연관된 역위, 2개 초과의 염색체에 영향을 미치는 전좌, 및 이들의 조합과 같은 복잡한 염색체 재배열을 포함하지만 이에 제한되지 않는, 당업계에 알려진 바와 같은 더 복잡한 구조적 게놈 변이로부터 발생하는 융합체)에 이루어진 것일 수 있다.
일부 실시형태에서, 샘플은 액체 또는 조직 생검이다.
정의
본 명세서에서 달리 정의되지 않는 한, 본 출원에서 사용되는 과학 및 기술 용어는 당업자에 의해 일반적으로 이해되는 의미를 가질 것이다. 일반적으로 본 명세서에 기재된 화학, 세포 및 조직 배양, 분자 생물학, 세포 및 암 생물학, 신경생물학, 신경화학, 바이러스학, 면역학, 미생물학, 약리학, 유전학 및 단백질과 핵산 화학과 관련하여 사용되는 명명법 및 기법은 당업계에 잘 알려지고 일반적으로 사용되는 것들이다.
본 개시내용의 방법 및 기법은 일반적으로 달리 나타내지 않는 한, 당업계에 잘 알려진 통상적인 방법에 따라 그리고 본 명세서 전반에 걸쳐 인용되고 논의되는 다양한 일반적이고 보다 구체적인 참조문헌에 기재된 바와 같이 수행된다. 예를 들어, 제한 없이 문헌["Principles of Neural Science", McGraw-Hill Medical, New York, N.Y. (2000); Motulsky, "Intuitive Biostatistics", Oxford University Press, Inc. (1995); Lodish et al., "Molecular Cell Biology, 4th ed.", W. H. Freeman & Co., New York (2000); Griffiths et al., "Introduction to Genetic Analysis, 7th ed.", W. H. Freeman & Co., N.Y. (1999); 및 Gilbert et al., "Developmental Biology, 6th ed.", Sinauer Associates, Inc., Sunderland, MA (2000)]을 참조한다. 유사하게, 본 명세서에서 사용되는 화학 용어는 본 명세서에 달리 정의되지 않는 한, 당업계의 통상적인 용법에 따라 사용된다.
본 출원에서 언급된 상기 모든 내용, 및 임의의 다른 간행물, 특허 및 공개된 특허 출원은 구체적으로 본 명세서에 참조에 의해 원용된다.
"환자", "대상체", 또는 "개체"는 호환 가능하게 사용되며 인간 또는 비-인간 동물을 지칭한다. 이들 용어는 포유동물, 예컨대, 인간, 영장류, 가축 동물(소, 돼지 등을 포함함), 반려 동물(예를 들어, 개, 고양이 등) 및 설치류(예를 들어, 마우스 및 래트)를 포함한다.
병태 또는 환자를 "치료하는" 것은 임상 결과를 포함하여 유익하거나 원하는 결과를 얻기 위한 조치를 취하는 것을 지칭한다. 본 명세서에서 사용되는 바와 같고 당업계에서 잘 이해되는 바와 같이, "치료"는 임상 결과를 포함하여 유익하거나 원하는 결과를 얻기 위한 접근법이다. 유익하거나 원하는 임상적 결과는, 검출 가능하거나 검출 가능하지 않은지 여부에 관계 없이, 하나 이상의 증상 또는 병태의 경감 또는 개선, 질환 정도의 약화, 질환 상태의 안정화(예를 들어, 악화하지 않음), 질환 확산의 예방, 질환 진행의 지연 또는 둔화, 질환 상태의 개선 또는 완화, 및 관해(부분적이거나 전체적인지 여부는 관계 없음)를 포함할 수 있지만 이에 제한되지 않는다. "치료"는 또한 치료를 받지 않은 경우 예상되는 생존과 비교하여 생존을 연장시키는 것을 의미할 수 있다.
용어 "예방하는"은 당업계에서 인정되는 것이며, 국소 재발(예를 들어, 통증)과 같은 상태, 암과 같은 질환, 심부전과 같은 증후군 또는 임의의 다른 의학적 상태와 관련하여 사용될 때 당업계에서 잘 이해되고, 조성물을 받지 않은 대상체에 비해 대상체에서 의학적 상태의 증상의 빈도를 감소시키거나, 의학적 상태의 증상의 발생을 지연시키는 조성물의 투여를 포함한다. 따라서, 암의 예방은, 예를 들어 통계적으로 및/또는 임상적으로 유의한 양으로, 예를 들어 비치료 대조군 집단에 비해 예방적 치료를 받는 환자의 집단에서 검출 가능한 암 성장의 수를 감소시키는 것, 및/또는 치료받은 집단 대 비치료 대조군 집단에서 검출 가능한 암 성장의 출현을 지연시키는 것을 포함한다.
대상체에게 물질, 화합물 또는 작용제를 "투여하는 것" 또는 이의 "투여"는 당업자에게 알려진 다양한 방법 중 하나를 사용하여 수행될 수 있다. 예를 들어, 화합물 또는 작용제는 정맥내, 동맥내, 피내, 근육내, 복강내, 피하, 안구, 설하, 구강(섭취에 의함), 비강내(흡입에 의함), 척수내, 뇌내 및 경피(흡수, 예를 들어 피부관을 통한 흡수에 의함)로 투여될 수 있다. 화합물 또는 작용제는 또한 재충전 가능하거나 생분해성 중합체 장치 또는 기타 장치, 예를 들어 패치 및 펌프, 또는 화합물 또는 작용제의 연장, 서방 또는 제어 방출을 제공하는 제형에 의해 적절하게 도입될 수 있다. 투여하는 것은 또한, 예를 들어 1회, 복수 회 및/또는 1회 이상의 연장된 기간에 걸쳐 수행될 수 있다.
대상체에게 물질, 화합물 또는 작용제를 투여하는 적절한 방법은 또한, 예를 들어 대상체의 연령 및/또는 신체적 상태 및 화합물 또는 작용제의 화학적 및 생물학적 특성(예를 들어, 용해도, 소화성, 생체이용률, 안정성 및 독성)에 따라 달라질 것이다. 일부 실시형태에서, 화합물 또는 작용제는 경구로, 예를 들어 섭취에 의해 대상체에게 투여된다. 일부 실시형태에서, 경구로 투여되는 화합물 또는 작용제는 연장 방출 또는 서방형 제형으로 존재하거나, 서방 또는 연장 방출을 위한 장치를 사용하여 투여된다.
본 명세서에서 사용되는 바와 같이, 어구 "공동 투여"는 이전에 투여된 치료제가 체내에서 여전히 효과적인 동안 제2 작용제가 투여되도록 2가지 이상 상이한 치료제의 임의의 투여 형태를 지칭한다(예를 들어, 2가지 작용제가 환자에서 동시에 효과적이며, 이는 2가지 작용제의 상승 효과를 포함할 수 있음). 예를 들어, 상이한 치료용 화합물이 동일한 제형으로 또는 별도의 제형으로, 동시에 또는 순차적으로 투여될 수 있다. 따라서, 그러한 치료를 받는 개체는 상이한 치료제의 조합 효과로부터 이익을 얻을 수 있다.
약물 또는 작용제의 "치료적 유효량" 또는 "치료적 유효 용량"은 대상체에게 투여될 때 의도된 치료 효과를 갖게 될 약물 또는 작용제의 양이다. 전체 치료 효과는 반드시 1회 용량의 투여에 의해 일어나는 것은 아니며, 일련의 용량의 투여 후에만 일어날 수 있다. 따라서, 치료적 유효량은 1회 이상의 투여로 투여될 수 있다. 대상체에게 필요한 정확한 유효량은, 예를 들어 대상체의 크기, 건강 및 연령, 그리고 암 또는 MDS와 같은 치료될 병태의 성질 및 정도에 따라 달라질 것이다. 숙련된 작업자는 일상적인 실험에 의해 주어진 상황에 대한 유효량을 쉽게 결정할 수 있다.
어구 "약제학적으로 허용 가능한"은 당업계에서 인정되는 것이다. 특정 실시형태에서, 상기 용어는 적절한 의학적 판단의 범주 내에서, 합리적인 이득/위험 비에 부합하면서, 과도한 독성, 자극, 알레르기 반응, 또는 다른 문제 또는 합병증 없이 인간 및 동물의 조직과 접촉하여 사용하기에 적합한 조성물, 부형제, 아쥬반트, 중합체 및 기타 물질 및/또는 투약 형태를 포함한다.
개시된 발명의 암은 조절되지 않는 성장, 침윤, 또는 전이를 겪고 있는 대상체에서의 임의의 세포일 수 있다. 본 명세서에 개시된 바와 같은 암은, 예를 들어 교모세포종을 포함한 뇌암, 힘줄 윤활막 거대세포 종양(TSGCT), 육종, 흑색종, 중피종, 자궁암, 전립선암, 신장암(kidney cancer), 담낭암, 자궁경부암, 방광암, 난소암, 폐암, 폐의 선암종, 갑상선암, 방광암, 유방암, 식도암, 자궁내막암, 위암, 위장암, 신장암(renal cancer), 부신암, 뮬러리안암, 메르켈 암종, 급성 림프구성 암, 결장직장암, 췌장암, 간세포 암종을 포함한 간암, AML, DLBCL, 림프종, 다발성 골수종 등을 포함하는 고형 및 액체 암을 둘 다 포함한다. 일부 실시형태에서, 암은 담낭암, 외분비 선암종, 또는 아포크린 선암종이다. 바람직하게는, 암은 유방암, 전립선암, 또는 췌장암이다. 가장 바람직하게는, 췌장암.
일부 실시형태에서, 암은 방사선요법 또는 화학요법이 현재 사용되는 임의의 신생물 또는 종양일 수 있다. 대안적으로, 암은 표준 방법을 사용하는 방사선요법 또는 화학요법에 대해 충분히 민감하지 않은 신생물 또는 종양일 수 있다. 따라서, 암은 육종, 림프종, 백혈병, 암종, 모세포종, 또는 생식 세포 종양일 수 있다. 개시된 발명의 대표적이지만 비-제한적인 암 목록은 간세포 암종, 림프종, B 세포 림프종, T 세포 림프종, 균상식육종, 호지킨병, 골수성 백혈병, 방광암, 뇌암, 신경계암, 두경부암, 두경부의 편평세포 암종, 신장암(kidney cancer), 폐암(예컨대, 소세포 폐암 및 비-소세포 폐암), 신경모세포종/교모세포종, 난소암, 췌장암, 전립선암, 피부암, 간암, 흑색종, 구강, 인후, 후두, 및 폐의 편평세포 암종, 자궁내막암, 자궁경부암, 자궁경부 암종, 유방암, 상피암, 신장암(renal cancer), 비뇨생식기암, 폐암(pulmonary cancer), 식도 암종, 두경부 암종, 대장암, 조혈암; 고환암; 결장 및 직장암, 신장암(renal cancer), 전립선암, 및 췌장암을 포함한다.
또한, 대상체 유래의 샘플에서 표 1에 제시된 유전자 중 적어도 하나를 포함하거나 이로부터 전사되는 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체를 검출하기 위한 생물검정을 수행하는 단계, 생물검정의 결과를 컴퓨터 시스템으로 수신하는 단계, 결과를 처리하여 출력을 결정하는 단계, 판독 가능한 매체에 출력을 제시하는 단계를 포함하는 방법이 본 명세서에서 제공되되, 상기 출력은 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 존재 또는 부재에 기반하여 대상체에게 권장되는 치료 옵션을 식별하고, 샘플은 액체 또는 조직 생검이다. 일부 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 유전자 중 적어도 하나와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사된다. 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체는 본 명세서에 기재된 바와 같은 적어도 2, 3, 4, 5 또는 6개의 별개의 염색체 유전자좌의 융합체일 수 있다. 일부 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 2개의 별개의 염색체 유전자좌의 융합체이다. 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 3개의 별개의 염색체 유전자좌의 융합체일 수 있다. 다른 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 4개의 별개의 염색체 유전자좌의 융합체이다. 바람직한 실시형태에서, 생물검정은 표 1에 제시된 서열을 포함하는 융합 유전자좌에 특이적인 프로브를 포함한다.
본 발명의 일부 양태에서, 대상체 유래의 샘플에서 적어도 하나의 유전자 융합체 또는 비-유전자 융합체의 검출을 가능하게 하는 적어도 하나의 시약을 포함하는 암 진단 키트가 본 명세서에서 제공되되, 상기 융합체는 표 1에 제시된 유전자 중 적어도 하나를 포함하거나 이로부터 전사된다. 일부 구현예에서, 융합체는 표 1에 제시된 유전자 중 적어도 하나와 적어도 80% 상동성인 DNA 서열을 포함한다. 다른 실시형태에서, 융합체는 표 3에 제시된 적어도 하나의 서열을 포함하거나 이로부터 전사된다. 융합체는 표 3에 제시된 유전자와 적어도 80% 상동성인 적어도 하나의 서열을 포함할 수 있거나 이로부터 전사될 수 있다. 일부 실시형태에서, 융합체는 암 세포에서 전사되어, 적어도 하나의 전사체 변경, 또는 신전사체의 합성을 초래한다. 일부 실시형태에서, 융합체는 염색체내 또는 염색체간 융합체이다. 일부 그러한 실시형태에서, 상기 융합체는 본 명세서에 개시된 바와 같은 염색체 재배열로부터 발생한다.
일부 실시형태에서, 키트는 프로브 세트를 포함하며, 여기서 각각의 프로브는 표 1 또는 표 3에 제시된 서열을 포함하는 핵산에 특이적으로 혼성화한다. 일부 그러한 실시형태에서, 프로브는 융합 유전자좌(예를 들어, 표 1 또는 표 3에 제시된 서열을 포함하는 유전자좌)에 혼성화하거나 달리 결합할 수 있다. 바람직하게는, 그러한 프로브는 융합 유전자좌를 포함하는 핵산에 특이적으로 혼성화하도록 구성된 핵산 서열, 및 핵산 서열에 공유 결합된 검출 가능한 모이어티를 포함한다. 바람직한 실시형태에서, 융합 유전자좌는 표 1 또는 표 3에 제시된 적어도 하나의 서열을 포함한다. 일부 실시형태에서, 샘플은 액체 또는 조직 생검이다. 일부 실시형태에서, 암은 췌장암, 메르켈 암종, 급성 골수성 백혈병, 전이성 암종, 전립선암, 부신암, 뮬러리안암, 자궁암, 신장암, 담낭암, 경부암, 방광암, 난소암, 유방암, 두경부암, 식도암, 폐암, 간암, 결장암, 위장암, 결장직장암, 급성 림프구성암, 림프종, 육종, 흑색종 및 뇌암으로부터 선택된다.
특정 양태에서, (a) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 접합부에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 검출 프로브; (b) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제1 표지된 프로브, 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제2 표지된 프로브; (c) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 서열을 포함하는 제1 증폭 올리고뉴클레오타이드, 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 서열을 포함하는 제2 증폭 올리고뉴클레오타이드; (d) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열에 의해 인코딩되는 아미노산 서열에 특이적으로 결합하는 항체 및 (e) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 검출하기 위한 동일계내 혼성화 프로브 중 적어도 하나를 포함하는 조성물이 본 명세서에서 제공된다. 일부 실시형태에서, 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 전립선 세포 또는 분획, 전립선 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래된다. 다른 실시형태에서, 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 유방 세포 또는 분획, 유방 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래된다. 추가 실시형태에서, 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 췌장 세포 또는 분획, 췌장 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래된다. 바람직한 실시형태에서, 샘플은 액체 또는 조직 생검이다.
일부 실시형태에서 본 발명의 검출 프로브, 표지된 프로브, 동일계내 혼성화 프로브, 또는 증폭 올리고뉴클레오타이드는 엄격한 혼성화 조건 하에 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 일부가 아니거나 이로부터 생성되는 DNA 또는 RNA에 혼성화하지 않는다.
일부 실시형태에서, 제1 및 제2 증폭 올리고뉴클레오타이드는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 일부가 아니거나 이로부터 생성되는 DNA 또는 RNA를 증폭시키지 않는다. 또한 본 발명의 조성물을 포함하는 키트 및 포장된 분석물이 본 명세서에서 제공된다.
실시예
본 발명은 이제 일반적으로 설명되며, 이는 단지 본 발명의 특정 양태 및 실시형태를 설명하기 위한 목적으로 포함되고 본 발명을 제한하려는 것으로 의도되지 않는, 다음 실시예를 참조하여 더 쉽게 이해될 것이다.
실시예 1:
물질 및 방법
신전사체/융합체를 검출하는 방법 및 파이프라인
도구 세트를 사용하여 도 2에 설명된 분석 파이프라인을 생성하였다. 이들 도구를 파이프라인 재현 가능 표준(NextFlow®, Seqera Labs, 스페인 소재)에 의해 관리하였다. 파이프라인은 사용 가능한 데이터세트에서 원시 데이터를 변환한 다음 여러 제어 및 발견 도구에 제출되도록 실행되는 명령 집합이다. 모든 소프트웨어의 집합은 신전사체/융합체에 대한 발견 도구로 간주된다.
좋은 품질의 데이터를 식별하기 위해, FastQC, BBMap, SeqTK, Bedtools, Samtools, PacBio-CCS, Lima, Isoseq3과 같은 소프트웨어를 사용하여 원시 시퀀싱 데이터를 사용 가능하고 신뢰할 수 있는 데이터로 변환하였다. 그 다음 이들 데이터를 Kallisto 및 Mininmap2와 같은 신전사체/융합체를 정량화하고 평가하는 여러 소프트웨어에 제출하였다. 유전자의 코딩 능력을 식별하기 위해, CD-Hit 소프트웨어를 사용하여 모든 신규 신전사체/융합체에 대한 완전성과 코딩 잠재력을 평가하였다. 마지막으로, 데이터 표현, 시각화 및 평가는 R-stat 및 IGV 둘 다에 의해 이루어졌다. 그러한 분석에서 사용된 이들 및 기타 소프트웨어는 표 2에 제시되어 있다.
실시예 2:
실험 설계
종합적으로, 환자-유래 이종이식(PDX)이라고 하는 2500개 인간 종양 집합을 분리하고 마우스에서 이식에 의해 생체 내에서 증식시켰다. 이러한 PDX 샘플의 하위집합을 게놈 DNA 및 전사체 RNA의 차세대 시퀀싱에 의해 분석하여, 해당 종양 중 1500개 초과에 대한 게놈 및 추론된 후성적 특성에 대한 데이터베이스를 생성하였다.
도 2에 설명된 바와 같이, 마우스에서 체외 이식된 인간 종양을 오염시키는 뮤린 DNA 및 RNA를 제거하기 위하여, 수득한 원시 서열을 먼저 인간 및 마우스 게놈과 비교하였다. 그 다음 선택된 인간 또는 알려지지 않은 서열을 이전에 보고된 인간 유전자 또는 RNA 서열에 대해 정렬하거나 새로 조립하였다. 이에 의해 알려진 융합체뿐만 아니라 분석된 인간 종양 세포에 특이적일 수 있는 알려지지 않은 인간 유전자 또는 비-유전자 후보 융합체의 서열 집합을 산출하였다.
융합 선택 과정의 견고성을 평가하고 후보 융합체에 대한 신뢰도 점수를 제공하기 위해, 기계 학습 접근법을 사용하여 융합 특징이 알려진 융합체를 고려할 때 후보 신전사체 및/또는 게놈 융합체의 예측 값에 대해 긍정적(어두운 회색) 또는 부정적(밝은 회색) 영향을 미치는지를 결정하였다(도 3). 이는 주어진 융합체 서열 후보가 시퀀싱 인공물이 아닌 암 세포에서 실제로 발생하는 융합체를 나타낼 가능성을 나타내는 점수를 제공하였다.
특정 DNA 시퀀싱 기술과 연관될 수 있는 융합 인공물 서열을 추가로 제외하기 위해, 여러 시퀀싱 접근법을 사용하여 분석을 수행하였다. 136개의 PDX 췌장암 모델에서 얻은 2가지 별개의 NGS 접근법, 즉 Illumina® RNAseq 짧은 RNA 판독물과 PacBio® 긴 게놈 DNA 및 RNA 판독물을 비교하였다. 어느 한쪽 시퀀싱 전략으로부터 얻은 서열 데이터베이스의 사용으로 각각 20,811개 또는 81,466개의 후보 융합체를 산출하였다(도 4). 그러나, 두 데이터베이스의 조합 사용으로 총 433개의 보다 신뢰할 수 있는 후보 융합체 서열을 산출하였다.
융합체 서열의 선택된 접근법 및 데이터베이스를 추가로 검증하기 위해, 췌장암 생검에서 발생하는 것으로 알려진 게놈 변경을 433개 융합체 서열 데이터베이스에서 검색하였다. 예상한 대로, 표피 성장 인자 수용체(EGFR) 및 커스텐 RAS(Kirsten Ras: KRAS) 유전자에서 돌연변이가 발견되었으며, KRAS 돌연변이가 명확하게 과하게 나타났다(도 5). 이는 인간 췌장암의 90% 초과가 KRAS 변경을 보유하는 한편, EGFR과 KRAS 돌연변이 혼선은 가장 공격적인 암 유형에서 전이 형성에 관여한다는 것을 나타내는 이전 보고와 상관 관계가 있으며(Fitzgerald et al., 2015), 따라서 PDX 모델 및 신전사체/융합체 데이터세트의 추가 검증을 제공하였다. 신규한 암-특이적 신전사체/융합체 데이터세트를 검증한 다음, IVD 사용에 대해 다양한 암 유형 및 하위유형에 특이적인 마커의 식별을 위한 기초를 구성할 수 있는지 여부를 평가하였다.
실시예 3:
식별된 신전사체/게놈 융합체의 유병률
136개의 췌장암 샘플 중 식별된 433개 신전사체/게놈 융합체의 유병률을 평가하였으며, 일부는 거의 모든 췌장암 유형에서 발생하는 반면, 다른 일부는 소수의 샘플에서만 발생한다는 것을 나타내었다(각각 도 6의 상단 및 하단 라인 참조). 따라서, 특정한 융합체의 하위집합은 모든 췌장암 샘플의 거의 100%에 존재하였다(도 6의 우측에 있는 빈도 다이어그램 참조).
일부 암 샘플은 다른 것보다 그러한 융합체의 더 높은 부하를 보유하는 것으로 밝혀졌는데, 이는 췌장암의 다양한 하위유형 중에서 예상되는 이질성과 일치하며, 췌장암 하위유형을 설명하는 데 사용될 수 있다. 초기 진단 분석법이 부족하고 이용 가능한 치료법에 대해 제한된 반응을 나타내는 매우 공격적인 치명적 췌장 악성종양인 췌장 도관 선암종(PDAC)(Sarantis et al., 2020)은 종종 아시아인 환자에서 진단되고 함께 클러스터링되는 경향을 나타내었다. 이러한 융합체는, 대부분 함께 클러스터링되고 별개의 융합체 세트의 높은 발생률을 나타낸 서양인 환자의 췌장 선암종에서 관찰된 것과는 클러스터링되지 않았다(도 6의 좌측 열 참조). 일관되게, 다양한 인종 기원의 종양을 고려할 때, 불량한 예후와 연관된 샘플의 클러스터는 상이하였다(도 6의 상단의 클러스터링 아래 병리학 설명 라인 참조). 특정한 융합체 세트는 환자 인종 기원과 같은 다른 매개변수와 함께 사용될 때, 췌장암 하위유형의 하위유형 분류를 가능하게 할 수 있다.
실시예 4:
췌장암에 대한 특이성
유사한 돌연변이 또는 염색체 이상이 종종 다양한 종양 유형에서 발생하므로, 이들 433개 신전사체/게놈 융합체 중 일부가 췌장암에 특이적일 수 있는지 여부를 평가하였다. 47개 신전사체/융합체의 세트는 췌장암에서만 배타적으로 발생하고 다른 PDX 암 유형에서는 발생하지 않는 것으로 관찰되었다(도 7). 이는 혈액 샘플과 같은 임상 추출물에서 이러한 마커의 검출이 환자의 IVD 또는 예후 평가에서 췌장암 발병의 조기 징후로 간주될 수 있음을 나타내었다.
실시예 5:
보다 공격적인 췌장암과의 상관 관계
일부 췌장암-특이적 신전사체/융합체의 발생은 종양 성장의 측면에서 보다 공격적인 췌장암과 상관 관계가 있을 수 있다. 이는 종양 공격성의 대용 마커로서 PDX 이식의 성장 특성을 평가하고, 이의 배가 시간을 점수화함으로써 조사되었다. 다양한 췌장암 유형의 발생 및 종양 샘플의 PDX 집합에서의 공격성에서 예상된 대로, 광범위하게 다양한 성장률이 관찰되었다(도 8). 짧은 배가 시간을 나타내는 샘플의 클러스터링은 특정 신전사체/융합체 세트의 발견이 종양 진행 및 예후의 지표를 제공할 수 있으며, 따라서 수술적 절제 이전에 선행보조 화학요법이 지시될 수 있는지 여부와 같은 유용한 정보를 제공할 수 있음을 나타내었다.
실시예 6:
PDX 집합 논의
PDX 집합에서 얻은 DNA 및 RNA 서열의 포괄적인 분석, 및 정상적인 인간 조직의 서열과의 비교는, 결실, 전좌, 재조합, 또는 기타 염색체 재배열 사건으로부터 생성된 유전자 융합체와 같은 종양 샘플에서 이전에 알려지지 않은 대규모 게놈 변경의 식별을 가능하게 하여, 암 이질성의 포괄적인 모델의 기초를 형성하였다. 이러한 신전사체 및/또는 게놈 변성의 하위집합은 종양학에서 충족되지 않은 필요성에 답하기 위해 신규 진단, 예후 및 치료 분석 도구 및 알고리즘을 생성하는 기초를 형성한다. 췌장암이 본 명세서에서 예시되어 있지만, 본 명세서에서 제공된 방법이 다른 암 유형 및 하위유형의 진단 및 예후에 적용될 수 있음이 당업자에 의해 이해될 것이다. 특히, 복수 및/또는 모든 알려진 암 유형, 즉 범-암 융합체와 연관된 신전사체 및/또는 게놈 변경이 식별되었다(표 4 참조).
본 명세서에서 상기 입증된 바와 같이, NGS 및 AI-기반 시험관 내 진단(IVD) 분석은 종양 발생 및 진화의 예후를 더 잘 알 수 있게 하고, 이용 가능한 치료법에 대한 개별 환자의 종양 반응 또는 내성을 예측하기 위한 기초를 형성할 수 있다. NGS 및 AI 기반 모델은 종양 유형 및 하위유형의 후보 마커의 식별, 및 치료법에 대한 진행 및 반응과 같은 일부 특성의 식별을 가능하게 하였다. 이들 특성은 유전체학, 생물정보학, 분자/세포 생물학 및 임상 과학 분야 전반에 설쳐 실험적 검증 및 추가 분석의 대상이 될 수 있다. 이들 NGS-AI 모델의 적용은 암의 사전 증상 검출 및 비-침습적 혈액 샘플로부터 암 유형 및 하위유형의 식별일 수 있다. 이는 각각의 특정 환자 및 암에 대한 최적의 치료법을 선택하기 위한 권장사항뿐만 아니라, 이용 가능한 치료법에 대한 치료 반응과 진화에 대한 예측으로 이러질 수 있다.
본 명세서에 개시된 방법에 의해 이용 가능한 치료법에 대한 종양 내성과 인과적으로 연관되는 생물학적 마커의 식별은 초기 무증상 진단뿐만 아니라, 효율적이고 특이적인 치료 전략의 준비를 가능하게 한다. 예를 들어 제한 없이, 종양 내성의 유전적 및 후성적 마커의 식별은 그러한 내성의 원인이 될 수 있는 특정 단백질의 식별 및 실험적 검증으로 이어진다. 유사하게, 후보 치료제에 대한 병리학적 반응 또는 내성의 예측을 가능하게 하는 게놈 마커의 발견은 환자 계층화, 즉 가장 민감한 환자, 예를 들어 임상 시험에서 잠재적인 치료제를 이용한 치료 시 완전한 병리학적 반응을 나타내는 환자의 선택을 가능하게 한다.
실시예 7:
상업용 암 바이오뱅크의 췌장 샘플
본 명세서에 기재된 PDX PDAC 샘플을 넘어서는 췌장암 마커 유전자-융합체를 테스트하기 위해, 제2 코호트에 대한 접근권을 얻었다. 이용 가능한 코호트의 대부분은 주로 서양 출신인 반면, PDX PDAC 집합 결과는 아시아 출신 민족의 비율이 더 높다. 아시아 유전적 배경의 췌장암 환자 유래 췌장 조직 샘플 100개를 Cureline(미국 캘리포니아주 브리즈베인 소재)에서 구입하였다. 이들은 포르말린-고정, 파라핀-포매(FFPE) 조직으로 이용 가능하였으며, 이들 모두에 대해 RNA 추출 및 시퀀싱을 수행하였다. 동일한 접근법을 사용하여 발현 및 융합체 발현을 수행하고 표 1, 3, 및 4에 제공된 후보 표와 비교하였다. 전체적으로, 유전자 융합체 후보 중 4개가 이러한 제2 코호트에 존재하였다.
췌장 특이적 세트
췌장 특이적 융합체 중에서, NGSAI_NEOTX_42(MRPS18A―NA; 서열번호 42) 및 NGSAI_NEOTX_47(NA―MUC20; 서열번호 47)이 각각 20개 샘플과 8개 샘플에서 나타났다.
범-암 세트
범-암 후보는 8개의 Cureline 샘플에서 나타나는 NGSAI_NEOTX_52(LOC107987295, AF127936.7―NRIP1; 서열번호 50) 및 2개의 샘플에 존재하는 NGSAI_NEOTX_61(ADAP1―SUN1; 서열번호 59)이었다.
NGSAI_NEOTX_52의 파트너를 둘 다 함유하는 융합체는 이전에 베이징 대학교 인민 병원에서 자궁내막암 환자 III기 환자 28명에서 식별되었다. (Yao et al., 2019). 본 연구는 이 융합체가 28명의 개체 중 12명에서 매우 널리 퍼져 있고 유전자 발현이 상승된 것을 밝혔다.
NGSAI_NEOTX_61의 파트너를 둘 다 함유하는 융합체는 이전에 일본의 야마구치 대학교 병원에서 결장직장 암종에 대한 연구에서 식별되었다. (Oga et al., 2019) 이 연구에서 12명의 간 전이 환자와 16명의 대조군 환자를 분석하였다. ADAP1와 SUN1 간의 융합이 전이성 환자에서 식별되었으며, RT-PCR 및 뉴클레오타이드 시퀀싱으로 확인되었다. 이러한 융합 쌍은 백인 라틴계 환자의 자궁경부 편평세포 암종 및 자궁경내 선암종(TCGA, 샘플 DS.A7WH.01A)의 맥락에서 발견되었다.
실시예 8:
공공 암 바이오맹크의 췌장 샘플
유전자형-조직 발현(Genotype-Tissue Expression: GTEx) 프로젝트는 조직-특이적 유전자 발현 및 조절을 연구하기 위한 포괄적인 공공 자원이다. GTEx는 상이한 조직 유형 및 환자로부터의 데이터를 함유하여 상기 데이터를 잠재적인 비-암 개체와 비교할 수 있는 기회를 제공한다(Lonsdale et al., 2013). GTEX 원시 시퀀싱 데이터에 대한 접근을 요청하였으며 이어서 안전한 클라우드 플랫폼에서 분석하여 유전자 융합 분석을 수행하였다. 전체적으로, 340개의 췌장 조직 RNA-seq 샘플을 분석하였으며 췌장 암 유전자 융합 후보의 목록과 비교한 결과는 본 명세서의 표 1, 3, 및 4에 제공되어 있다.
췌장 특이적 세트
PDX PDAC 세트로부터, GTEX에서 NGSAI_NEOTX_25(서열번호 25), NGSAI_NEOTX_42(서열번호 42), 및 NGSAI_NEOTX_47(서열번호 47)이 발견되었다.
융합체 NGSAI_NEOTX_25는 GTEX의 샘플 1개에서 관찰되었다. 융합 파트너 CHS.3009.1(표 1 및 3 참조; 잠재적인 신규 전사체로서 포괄적인 인간 발현 서열 프로젝트(Comprehensive Human Expressed SequenceS project: CHESS; 존스홉킨스 대학교 계산 생물학 센터가 인도함)에 의해 식별됨) 중 하나는 유전자 ENSA와 중첩된다. 융합 파트너로서 FAM120A 유전자와 함께 그러한 융합체는 문헌에서 설명된 바 없다.
NGSAI_NEOTX_42는 GTEX 샘플 340개 중 4개에서 검출된 반면, NGSAI_NEOTX_47은 18개 샘플에서 발견되었다.
범-암 세트
GTEX 샘플에 존재하는 이들 세트로부터의 3가지 융합체 후보, 즉 NGSAI_NEOTX_52(서열번호 50), NGSAI_NEOTX_58(서열번호 56), 및 NGSAI_NEOTX_61(서열번호 59)이 존재하였다. 이들은 각각 6, 1, 및 1개 사례에 존재하였다.
Cureline 샘플에 대해 기재된 바와 같이, NGSAI_NEOTX_52와 NGSAI_NEOTX_61 융합체는 명확하게 암과 관련이 있는 것으로 발표되었다. GTEX 샘플은 자연적으로 사망하고 연구를 위해 장기를 기증한 개체로부터 유래되었다. 이들 중 어느 것도 표준 암 검출 방법에 의해 진단되지 않았으며, 이에 대해 어느 것도 검출 가능한 암으로 보고되지 않았다. 따라서 소수의 GTEX 췌장 데이터에는 진단되지 않은 암을 보유하고 있을 가능성이 있다.
GTEX 췌장과 췌장암 샘플의 유전자 발현 비교
본 명세서에서 논의된 바와 같이, 일부 유전자 융합 마커 후보는 췌장 GTEX 샘플의 하위집합에서 검출되었다. 이는 이러한 GTEX 샘플이 진단되지 않은 췌장암을 가질 수 있거나 암 발병을 나타낼 가능성을 높인다. 전자의 가능성을 조사하기 위해, GTEX 췌장 샘플과 본 명세서에서 제공된 PDX PDAC 코호트 간의 유전자 발현 프로파일을 비교하였다. 마커 융합 후보를 함유한 췌장 GTEX 샘플의 하위집합에 초점이 맞춰져 있다. 도 9는 이들 샘플 중 가장 차등적으로 조절되는 400개의 유전자의 주성분 분석(PCA)을 나타내며, GTEX 하위집합은 추가적으로 강조표시되어 있다. GTEX 하위집합 샘플은 다른 GTEX 췌장 샘플 내에서 클러스터링되었으며, 췌장암 샘플과 상이하거나 훨씬 더 근접한 샘플에서는 그렇지 않았다. 이들 개체는 아직 췌장암이 진행되지 않았을 가능성이 있지만, 일반적인 유전자 발현 변화가 아직 발생하지 않은 초기 단계 췌장암일 가능성을 배제할 수 없다.
본 명세서에 개시된 관찰을 고려하여, 본 명세서에서 제공된 검출 방법은 초기 췌장암을 검출할 수 있다.
실시예 9:
전체적인 유전자 융합 코호트 비교에 대한 설명
본 명세서에 개시된 다양한 코호트에 대해 적용된 프로토콜은 상이하며 이후 코호트간 비교의 수준에 대한 특정 제한을 가한다. PDX PDAC 샘플의 경우 조직 준비부터, RNA 추출, 시퀀싱까지 모든 단계를 내부에서 수행하였다.
대조적으로, Cureline PDAC 샘플 라이브러리는 준비 및 시퀀싱뿐만 아니라 샘플의 성질도 상이하다. 상기 샘플은 PDX 샘플에 대한 경우에서와 같이 신선한 조직에 기반한 것이 아니고, FFPE의 슬라이스에 기반하였다. 이는 더 높은 수준의 RNA 분해를 함유하여, 변이의 증가 및 RNA 단편 감소를 야기하는 것으로 알려져 있다. 이는 또한 그러한 샘플에서 잘 발현된 유전자와 이후 유전자 융합 사건을 검출하는 능력을 방해할 수 있다(Williams et al., 1999).
둘째, 공개 데이터세트, 즉 GTEX(유전자형 조직 발현 프로젝트)를 사용하는 성질로 인해, 상기 실험 단계 중 임의의 것에 대한 제어가 가능하지 않았다. 영향과 제한을 이해하기 위해, 샘플당 코호트 각각에서 발현된 유전자 수의 비교를 수행하였다(도 10). FFPE Cureline PDAC 샘플에서 총 발현 유전자 수가 상승된 것으로 관찰되었다. GTEX와 PDX PDAC 샘플 둘 다 발현된 총 유전자의 수가 더 적었지만, 발현 편차로 평가 시 더 안정적인 견고한 수치를 나타내었다. 이러한 샘플에서 유전자 융합 사건의 수를 비교하였으며, PDAC Cureline 샘플과 PDAC PDX 샘플은 많은 유사성을 나타낸 반면, GTEX 샘플은 훨씬 더 적은 수의 사건을 나타내었다(도 11a 및 도 11b).
참조에 의한 원용
본 명세서에 언급된 모든 간행물 및 특허는 각각의 개별 간행물 또는 특허가 참조에 의해 원용된 것으로 구체적이면서 개별적으로 표시된 것처럼 본 명세서에 전문이 참조에 의해 원용된다. 상충하는 경우, 본 명세서의 임의의 정의를 포함하여 본 출원이 우선할 것이다.
균등물
주제 발명의 특정 실시형태가 논의되었지만, 상기 명세서는 예시적이며 제한적이지 않는다. 본 명세서 및 하기 청구범위를 검토하면 본 발명의 많은 변형이 당업자에게 명백하게 될 것이다. 본 발명의 전체 범주는 청구범위를 이의 균등물의 전체 범주와 함께, 그리고 명세서를 이러한 변형과 함께 참조하여 결정되어야 한다.
Claims (43)
- 무증상 대상체가 암 상태로 진행될 가능성을 예측하는 방법으로서,
(a) 상기 대상체로부터의 샘플에서 상기 대상체의 게놈의 적어도 일부를 시퀀싱하는 단계 및
(b) 상기 샘플의 시퀀싱으로부터 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체(neotranscript)를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 암 발병 위험의 증가를 나타내는, 상기 식별하는 단계
를 포함하는, 방법. - 개별화 암 요법을 위해 무증상 대상체를 식별하는 방법으로서,
(a) 상기 대상체로부터의 샘플에서 상기 대상체의 게놈의 적어도 일부를 시퀀싱하는 단계,
(b) 상기 샘플의 시퀀싱으로부터 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 대상체를 개별화 암 요법을 위한 후보자로서 식별하는, 상기 식별하는 단계 및
(c) 상기 요법을 개시하고/하거나 대상체에 대한 요법의 투여를 모니터링하는 단계
를 포함하는, 방법. - 암을 앓고 있는 대상체에서 종양 반응 또는 내성을 예측하는 방법으로서,
(a) 상기 대상체의 샘플에서 하나 이상의 세포의 게놈의 적어도 일부를 시퀀싱하는 단계;
(b) 상기 샘플에서 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 내성 암 위험의 증가를 나타내는, 상기 식별하는 단계
를 포함하는, 방법. - 암을 앓고 있는 대상체에서 전이 가능성을 예측하는 방법으로서,
(a) 상기 대상체의 샘플에서 하나 이상의 세포의 게놈의 적어도 일부를 시퀀싱하는 단계;
(b) 상기 샘플에서 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 전이 위험의 증가를 나타내는, 상기 식별하는 단계
를 포함하는, 방법. - 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 단일 유전자/비-유전자의 융합체인, 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 2, 3, 4, 5 또는 6개의 별개의 염색체 유전자좌의 융합체인, 방법.
- 제6항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 2개의 별개의 염색체 유전자좌의 융합체인, 방법.
- 제6항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 3개의 별개의 염색체 유전자좌의 융합체인, 방법.
- 제6항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 4개의 별개의 염색체 유전자좌의 융합체인, 방법.
- 제5항 또는 제6항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 유전자 세트 중 적어도 하나를 포함하거나 이로부터 전사되는, 방법.
- 제5항 또는 제6항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 제공된 유전자 중 적어도 하나와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 방법.
- 제5항 내지 제11항 중 어느 한 항에 있어서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 서열번호 1 내지 47로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 방법.
- 제5항 내지 제12항 중 어느 한 항에 있어서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 서열번호 1 내지 47의 유전자와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 방법.
- 제5항 내지 제13항 중 어느 한 항에 있어서, 상기 유전자 융합체 또는 비-유전자 융합체는 암 세포에서 전사되어, 적어도 하나의 신전사체의 전사체 변경 및/또는 합성을 초래하는, 방법.
- 제5항 내지 제14항 중 어느 한 항에 있어서, 상기 유전자 융합체 또는 비-유전자 융합체는 염색체내 또는 염색체간 융합체인, 방법.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 샘플은 액체 또는 조직 생검인, 방법.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 암은 췌장암, 메르켈 암종, 급성 골수성 백혈병, 전이성 암종, 전립선암, 부신암, 뮬러리안암, 자궁암, 신장암, 담낭암, 경부암, 방광암, 난소암, 유방암, 두경부암, 식도암, 폐암, 간암, 결장암, 위장암, 결장직장암, 급성 림프구성암, 림프종, 육종, 흑색종 및 뇌암으로부터 선택되는, 방법.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 암은 췌장암인, 방법.
- 방법으로서, 대상체 유래의 샘플에서 표 1에 제시된 유전자 중 적어도 하나를 포함하거나 이로부터 전사되는 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체를 검출하기 위한 생물검정을 수행하는 단계, 상기 생물검정의 결과를 컴퓨터 시스템으로 수신하는 단계, 상기 결과를 처리하여 출력을 결정하는 단계, 판독 가능한 매체에 상기 출력을 제시하는 단계를 포함하되, 상기 출력은 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 존재 또는 부재에 기반하여 상기 대상체에게 권장되는 치료 옵션을 식별하고, 상기 샘플은 액체 또는 조직 생검인, 방법.
- 제19항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 유전자 중 적어도 하나와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 방법.
- 제19항 또는 제20항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체는 적어도 2, 3, 4, 5 또는 6개의 별개의 염색체 유전자좌의 융합체인, 방법.
- 제21항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 2개의 별개의 염색체 유전자좌의 융합체인, 방법.
- 제21항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 3개의 별개의 염색체 유전자좌의 융합체인, 방법.
- 제21항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 4개의 별개의 염색체 유전자좌의 융합체인, 방법.
- 제19항 내지 제21항 중 어느 한 항에 있어서, 상기 생물검정은 표 1에 제시된 서열을 포함하는 융합 유전자좌에 특이적인 프로브를 포함하는, 방법.
- 암 진단 키트로서, 대상체 유래의 샘플에서 적어도 하나의 유전자 융합체 또는 비-유전자 융합체의 검출을 가능하게 하는 적어도 하나의 시약을 포함하되, 상기 융합체는 표 1에 제시된 유전자 중 적어도 하나를 포함하는, 암 진단 키트.
- 제26항에 있어서, 상기 융합체는 표 1에 제시된 유전자 중 적어도 하나와 적어도 80% 상동성인 DNA 서열을 포함하는, 키트.
- 제26항 또는 제27항에 있어서, 상기 융합체는 표 3에 제시된 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 키트.
- 제26항 또는 제27항에 있어서, 상기 융합체는 표 3에 제시된 유전자와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 키트.
- 제26항 내지 제29항 중 어느 한 항에 있어서, 상기 융합체는 암 세포에서 전사되어, 적어도 하나의 전사체 변경, 또는 신전사체의 합성을 초래하는, 키트.
- 제26항 내지 제30항 중 어느 한 항에 있어서, 상기 융합체는 염색체내 또는 염색체간 융합체인, 키트.
- 제26항 내지 제31항 중 어느 한 항에 있어서, 상기 키트는 프로브 세트를 포함하되, 각각의 프로브는 표 3에 제시된 서열을 포함하는 핵산에 특이적으로 혼성화하는, 키트.
- 제26항 내지 제32항 중 어느 한 항에 있어서, 각각의 프로브는 융합 유전자좌를 포함하는 핵산에 특이적으로 혼성화하도록 구성된 핵산 서열, 및 상기 핵산 서열에 공유 결합된 검출 가능한 모이어티를 포함하는, 키트.
- 제26항 내지 제31항 중 어느 한 항에 있어서, 상기 샘플은 액체 또는 조직 생검인, 키트.
- 제26항 내지 제32항 중 어느 한 항에 있어서, 상기 암은 췌장암, 메르켈 암종, 급성 골수성 백혈병, 전이성 암종, 전립선암, 부신암, 뮬러리안암, 자궁암, 신장암, 담낭암, 경부암, 방광암, 난소암, 유방암, 두경부암, 식도암, 폐암, 간암, 결장암, 위장암, 결장직장암, 급성 림프구성암, 림프종, 육종, 흑색종 및 뇌암으로부터 선택되는, 키트.
- 조성물로서,
(a) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 접합부에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 검출 프로브;
(b) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제1 표지된 프로브, 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제2 표지된 프로브;
(c) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 서열을 포함하는 제1 증폭 올리고뉴클레오타이드, 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 서열을 포함하는 제2 증폭 올리고뉴클레오타이드;
(d) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열에 의해 인코딩되는 아미노산 서열에 특이적으로 결합하는 항체; 및
(e) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 검출하기 위한 동일계내 혼성화 프로브(in situ hybridization probe)
중 적어도 하나를 포함하는, 조성물. - 제36항에 있어서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 전립선 세포 또는 분획, 전립선 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래되는, 조성물.
- 제36항에 있어서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 유방 세포 또는 분획, 유방 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래되는, 조성물.
- 제36항에 있어서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 췌장 세포 또는 분획, 췌장 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래되는, 조성물.
- 제37항 내지 제39항 중 어느 한 항에 있어서, 상기 샘플은 액체 또는 조직 생검인, 조성물.
- 제36항에 있어서, 상기 검출 프로브, 표지된 프로브, 동일계내 혼성화 프로브, 또는 증폭 올리고뉴클레오타이드는 엄격한 혼성화 조건 하에 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 일부가 아니거나 이로부터 생성되는 DNA 또는 RNA에 혼성화하지 않는, 조성물.
- 제36항에 있어서, 상기 제1 및 제2 증폭 올리고뉴클레오타이드는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 일부가 아니거나 이로부터 생성되는 DNA 또는 RNA를 증폭시키지 않는, 조성물.
- 제36항 내지 제42항 중 어느 한 항의 조성물을 포함하는 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163241813P | 2021-09-08 | 2021-09-08 | |
US63/241,813 | 2021-09-08 | ||
PCT/US2022/042899 WO2023039058A2 (en) | 2021-09-08 | 2022-09-08 | Next generation sequencing and artificial intelligence-based approaches for improved cancer diagnostics and therapeutic treatment selection |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240053637A true KR20240053637A (ko) | 2024-04-24 |
Family
ID=85507021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247011239A KR20240053637A (ko) | 2021-09-08 | 2022-09-08 | 개선된 암 진단 및 치료법 선택을 위한 차세대 시퀀싱 및 인공 지능-기반 접근법 |
Country Status (4)
Country | Link |
---|---|
KR (1) | KR20240053637A (ko) |
AU (1) | AU2022342002A1 (ko) |
CA (1) | CA3229981A1 (ko) |
WO (1) | WO2023039058A2 (ko) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080242606A1 (en) * | 2006-06-06 | 2008-10-02 | Zhong Jiang | Use of IMP3 as a Prognostic Marker for Cancer |
MX2020001575A (es) * | 2017-08-07 | 2020-11-18 | Univ Johns Hopkins | Materiales y métodos para evaluar y tratar el cáncer. |
-
2022
- 2022-09-08 AU AU2022342002A patent/AU2022342002A1/en active Pending
- 2022-09-08 WO PCT/US2022/042899 patent/WO2023039058A2/en active Application Filing
- 2022-09-08 CA CA3229981A patent/CA3229981A1/en active Pending
- 2022-09-08 KR KR1020247011239A patent/KR20240053637A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
AU2022342002A1 (en) | 2024-03-14 |
CA3229981A1 (en) | 2023-03-16 |
WO2023039058A2 (en) | 2023-03-16 |
WO2023039058A3 (en) | 2023-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6854792B2 (ja) | ゲノムモデルに関するデータ統合を用いたパスウェイ認識アルゴリズム(paradigm) | |
AU2020223754B2 (en) | Methods and materials for assessing loss of heterozygosity | |
Chapuy et al. | Molecular subtypes of diffuse large B cell lymphoma are associated with distinct pathogenic mechanisms and outcomes | |
Riester et al. | Combination of a novel gene expression signature with a clinical nomogram improves the prediction of survival in high-risk bladder cancer | |
Zhan et al. | Gene-expression signature of benign monoclonal gammopathy evident in multiple myeloma is linked to good prognosis | |
Chatila et al. | Genomic and transcriptomic determinants of response to neoadjuvant therapy in rectal cancer | |
Goovaerts et al. | A comprehensive overview of genomic imprinting in breast and its deregulation in cancer | |
CN113228190B (zh) | 分类和/或鉴定癌症亚型的系统和方法 | |
Conesa‐Zamora et al. | Expression profiling shows differential molecular pathways and provides potential new diagnostic biomarkers for colorectal serrated adenocarcinoma | |
Kazandjian et al. | Molecular underpinnings of clinical disparity patterns in African American vs. Caucasian American multiple myeloma patients | |
WO2017077499A1 (en) | Biomarkers of squamous cell carcinoma of head and neck, prognostic markers of recurrence in squamous cell carcinoma of head and neck, and methods thereof | |
WO2019197816A1 (en) | Biomarkers in clear cell renal cell carcinoma | |
JP2023514851A (ja) | 癌の病態を判別または示すメチル化パターンの同定 | |
WO2020092101A1 (en) | Consensus molecular subtypes sidedness classification | |
KR20240053637A (ko) | 개선된 암 진단 및 치료법 선택을 위한 차세대 시퀀싱 및 인공 지능-기반 접근법 | |
CN117701709A (zh) | 用于改进的癌症诊断和治疗性治疗选择的下一代测序和基于人工智能的方法 | |
KR20200044123A (ko) | 암 환자에서의 향상된 정밀도를 위한 포괄적 게놈 트랜스크립톰 종양-정상 유전자 패널 분석 (comprehensive genomic transcriptomic tumor-normal gene panel analysis for enhanced precision in patients with cancer) | |
WO2023125787A1 (en) | Biomarkers for colorectal cancer treatment | |
WO2023125788A1 (en) | Biomarkers for colorectal cancer treatment | |
US20230416841A1 (en) | Inferring transcription factor activity from dna methylation and its application as a biomarker | |
US20160201131A1 (en) | Method for Identifying Drug Resistance Related Mutations | |
CN111919257B (zh) | 降低测序数据中的噪声的方法和系统及其实施和应用 | |
US20220298565A1 (en) | Method Of Determining PIK3CA Mutational Status In A Sample | |
Niogret et al. | Does large NGS panel analysed using exome tumour sequencing improve the management of advanced non-small-cell lung cancers? | |
Vandekerkhove | Circulating tumour DNA as a biomarker in metastatic bladder cancer |