JP2023524627A - 核酸のメチル化分析による結腸直腸癌を検出するための方法およびシステム - Google Patents
核酸のメチル化分析による結腸直腸癌を検出するための方法およびシステム Download PDFInfo
- Publication number
- JP2023524627A JP2023524627A JP2022559477A JP2022559477A JP2023524627A JP 2023524627 A JP2023524627 A JP 2023524627A JP 2022559477 A JP2022559477 A JP 2022559477A JP 2022559477 A JP2022559477 A JP 2022559477A JP 2023524627 A JP2023524627 A JP 2023524627A
- Authority
- JP
- Japan
- Prior art keywords
- methylated
- methylation
- genomic regions
- tables
- colorectal cancer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010009944 Colon cancer Diseases 0.000 title claims abstract description 293
- 208000001333 Colorectal Neoplasms Diseases 0.000 title claims abstract description 279
- 230000011987 methylation Effects 0.000 title claims abstract description 236
- 238000007069 methylation reaction Methods 0.000 title claims abstract description 236
- 238000000034 method Methods 0.000 title claims abstract description 202
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 150
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 120
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 120
- 238000004458 analytical method Methods 0.000 title claims description 35
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 151
- 230000002062 proliferating effect Effects 0.000 claims abstract description 114
- 238000010801 machine learning Methods 0.000 claims abstract description 62
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000012164 methylation sequencing Methods 0.000 claims abstract description 12
- 108020004414 DNA Proteins 0.000 claims description 133
- 102000053602 DNA Human genes 0.000 claims description 130
- 208000035475 disorder Diseases 0.000 claims description 117
- 239000000523 sample Substances 0.000 claims description 112
- 239000012472 biological sample Substances 0.000 claims description 98
- 238000005259 measurement Methods 0.000 claims description 73
- 210000004027 cell Anatomy 0.000 claims description 54
- 238000003752 polymerase chain reaction Methods 0.000 claims description 52
- 238000011282 treatment Methods 0.000 claims description 45
- 108091029430 CpG site Proteins 0.000 claims description 42
- 210000001072 colon Anatomy 0.000 claims description 39
- 230000003321 amplification Effects 0.000 claims description 37
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 37
- 238000004422 calculation algorithm Methods 0.000 claims description 36
- 239000012634 fragment Substances 0.000 claims description 36
- 230000015654 memory Effects 0.000 claims description 31
- 238000006243 chemical reaction Methods 0.000 claims description 28
- 208000003200 Adenoma Diseases 0.000 claims description 27
- 206010001233 Adenoma benign Diseases 0.000 claims description 27
- 108091029523 CpG island Proteins 0.000 claims description 25
- 206010048832 Colon adenoma Diseases 0.000 claims description 24
- 102100027118 Engulfment and cell motility protein 1 Human genes 0.000 claims description 24
- 101001057862 Homo sapiens Engulfment and cell motility protein 1 Proteins 0.000 claims description 24
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 24
- 210000004369 blood Anatomy 0.000 claims description 24
- 239000008280 blood Substances 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 21
- 208000029742 colonic neoplasm Diseases 0.000 claims description 18
- 102100037799 DNA-binding protein Ikaros Human genes 0.000 claims description 16
- 101000599038 Homo sapiens DNA-binding protein Ikaros Proteins 0.000 claims description 16
- 238000012706 support-vector machine Methods 0.000 claims description 16
- 101000994656 Homo sapiens Potassium voltage-gated channel subfamily KQT member 5 Proteins 0.000 claims description 15
- 102100034365 Potassium voltage-gated channel subfamily KQT member 5 Human genes 0.000 claims description 15
- 208000015634 Rectal Neoplasms Diseases 0.000 claims description 14
- 210000002381 plasma Anatomy 0.000 claims description 14
- 206010038038 rectal cancer Diseases 0.000 claims description 14
- 201000001275 rectum cancer Diseases 0.000 claims description 14
- 206010007275 Carcinoid tumour Diseases 0.000 claims description 13
- 206010025323 Lymphomas Diseases 0.000 claims description 13
- 206010039491 Sarcoma Diseases 0.000 claims description 13
- 208000002458 carcinoid tumor Diseases 0.000 claims description 13
- 208000004804 Adenomatous Polyps Diseases 0.000 claims description 12
- 206010007279 Carcinoid tumour of the gastrointestinal tract Diseases 0.000 claims description 12
- 206010052360 Colorectal adenocarcinoma Diseases 0.000 claims description 12
- 206010058314 Dysplasia Diseases 0.000 claims description 12
- 201000002758 colorectal adenoma Diseases 0.000 claims description 12
- 201000004528 gastrointestinal lymphoma Diseases 0.000 claims description 12
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 claims description 12
- 102100038781 Carbohydrate sulfotransferase 2 Human genes 0.000 claims description 11
- 102100030334 Friend leukemia integration 1 transcription factor Human genes 0.000 claims description 11
- 101000883009 Homo sapiens Carbohydrate sulfotransferase 2 Proteins 0.000 claims description 11
- 101001062996 Homo sapiens Friend leukemia integration 1 transcription factor Proteins 0.000 claims description 11
- 101000893493 Homo sapiens Protein flightless-1 homolog Proteins 0.000 claims description 11
- 101001051767 Homo sapiens Protein kinase C beta type Proteins 0.000 claims description 11
- 102100024923 Protein kinase C beta type Human genes 0.000 claims description 11
- 238000007637 random forest analysis Methods 0.000 claims description 11
- 210000000601 blood cell Anatomy 0.000 claims description 10
- 108091092259 cell-free RNA Proteins 0.000 claims description 9
- 230000000295 complement effect Effects 0.000 claims description 9
- 210000002966 serum Anatomy 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 210000002700 urine Anatomy 0.000 claims description 8
- 102100028742 CAP-Gly domain-containing linker protein 4 Human genes 0.000 claims description 7
- 102100027098 CMP-N-acetylneuraminate-beta-galactosamide-alpha-2,3-sialyltransferase 1 Human genes 0.000 claims description 7
- 102100032052 Elongation of very long chain fatty acids protein 5 Human genes 0.000 claims description 7
- 101000767061 Homo sapiens CAP-Gly domain-containing linker protein 4 Proteins 0.000 claims description 7
- 101000836774 Homo sapiens CMP-N-acetylneuraminate-beta-galactosamide-alpha-2,3-sialyltransferase 1 Proteins 0.000 claims description 7
- 101000921361 Homo sapiens Elongation of very long chain fatty acids protein 5 Proteins 0.000 claims description 7
- 101000848919 Homo sapiens Protein FAM72B Proteins 0.000 claims description 7
- 101000671855 Homo sapiens Ubiquitin-associated and SH3 domain-containing protein A Proteins 0.000 claims description 7
- 102100034521 Protein FAM72B Human genes 0.000 claims description 7
- 210000001124 body fluid Anatomy 0.000 claims description 7
- 230000000112 colonic effect Effects 0.000 claims description 6
- 108020004711 Nucleic Acid Probes Proteins 0.000 claims description 5
- 239000002853 nucleic acid probe Substances 0.000 claims description 5
- 238000000513 principal component analysis Methods 0.000 claims description 5
- 238000013135 deep learning Methods 0.000 claims description 4
- 238000013179 statistical model Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 201000009030 Carcinoma Diseases 0.000 claims 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims 2
- 206010028980 Neoplasm Diseases 0.000 abstract description 250
- 201000011510 cancer Diseases 0.000 abstract description 164
- 238000012163 sequencing technique Methods 0.000 abstract description 89
- 238000001514 detection method Methods 0.000 abstract description 49
- 201000010099 disease Diseases 0.000 abstract description 33
- -1 cell-free DNA Chemical class 0.000 abstract description 19
- 238000012216 screening Methods 0.000 abstract description 15
- 230000004044 response Effects 0.000 abstract description 7
- 238000002560 therapeutic procedure Methods 0.000 abstract description 6
- 238000011161 development Methods 0.000 abstract description 4
- 108090000623 proteins and genes Proteins 0.000 description 48
- 229920002477 rna polymer Polymers 0.000 description 48
- 238000012360 testing method Methods 0.000 description 45
- 238000003556 assay Methods 0.000 description 43
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 39
- 238000003860 storage Methods 0.000 description 30
- 230000000875 corresponding effect Effects 0.000 description 28
- 238000012545 processing Methods 0.000 description 28
- 239000002585 base Substances 0.000 description 27
- 230000035945 sensitivity Effects 0.000 description 26
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 24
- 230000001225 therapeutic effect Effects 0.000 description 21
- 101000994375 Homo sapiens Integrin alpha-4 Proteins 0.000 description 20
- 102100032818 Integrin alpha-4 Human genes 0.000 description 20
- 238000012544 monitoring process Methods 0.000 description 20
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 18
- 238000002591 computed tomography Methods 0.000 description 18
- 238000003745 diagnosis Methods 0.000 description 18
- 230000014509 gene expression Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 18
- 229940104302 cytosine Drugs 0.000 description 17
- 101000665140 Homo sapiens Scm-like with four MBT domains protein 2 Proteins 0.000 description 16
- 101000645402 Homo sapiens Transmembrane protein 163 Proteins 0.000 description 16
- 102100038691 Scm-like with four MBT domains protein 2 Human genes 0.000 description 16
- 102100025764 Transmembrane protein 163 Human genes 0.000 description 16
- 238000009396 hybridization Methods 0.000 description 16
- 230000002550 fecal effect Effects 0.000 description 15
- 238000007481 next generation sequencing Methods 0.000 description 15
- 125000003729 nucleotide group Chemical group 0.000 description 15
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 15
- 238000011144 upstream manufacturing Methods 0.000 description 14
- 102100021627 BEN domain-containing protein 4 Human genes 0.000 description 13
- 101000971217 Homo sapiens BEN domain-containing protein 4 Proteins 0.000 description 13
- 238000009534 blood test Methods 0.000 description 13
- 239000003814 drug Substances 0.000 description 13
- 210000001519 tissue Anatomy 0.000 description 13
- 101000802337 Homo sapiens Zinc finger protein 543 Proteins 0.000 description 12
- 102100034658 Zinc finger protein 543 Human genes 0.000 description 12
- 239000003153 chemical reaction reagent Substances 0.000 description 12
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 12
- 239000002773 nucleotide Substances 0.000 description 12
- 229940035893 uracil Drugs 0.000 description 12
- 102100032145 Carbohydrate sulfotransferase 10 Human genes 0.000 description 11
- 101000775595 Homo sapiens Carbohydrate sulfotransferase 10 Proteins 0.000 description 11
- 101001122742 Homo sapiens Protein phosphatase 1 regulatory inhibitor subunit 16B Proteins 0.000 description 11
- 102100028740 Protein phosphatase 1 regulatory inhibitor subunit 16B Human genes 0.000 description 11
- 230000009471 action Effects 0.000 description 11
- 238000013145 classification model Methods 0.000 description 11
- 229940079593 drug Drugs 0.000 description 11
- 230000035772 mutation Effects 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 10
- 238000013459 approach Methods 0.000 description 10
- 238000001369 bisulfite sequencing Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 102100025176 Cyclin-A1 Human genes 0.000 description 9
- 101000934314 Homo sapiens Cyclin-A1 Proteins 0.000 description 9
- 101001026914 Homo sapiens Protein KRBA1 Proteins 0.000 description 9
- 101000693265 Homo sapiens Sphingosine 1-phosphate receptor 1 Proteins 0.000 description 9
- 102100037318 Protein KRBA1 Human genes 0.000 description 9
- 102100025750 Sphingosine 1-phosphate receptor 1 Human genes 0.000 description 9
- 238000004590 computer program Methods 0.000 description 9
- 230000002255 enzymatic effect Effects 0.000 description 9
- 208000007660 Residual Neoplasm Diseases 0.000 description 8
- 201000010989 colorectal carcinoma Diseases 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000007067 DNA methylation Effects 0.000 description 7
- 108700024394 Exon Proteins 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000003753 real-time PCR Methods 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 229940113082 thymine Drugs 0.000 description 7
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 6
- 102100032146 Carbohydrate sulfotransferase 11 Human genes 0.000 description 6
- 101000775587 Homo sapiens Carbohydrate sulfotransferase 11 Proteins 0.000 description 6
- 108091092195 Intron Proteins 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 239000000090 biomarker Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 210000000038 chest Anatomy 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 238000003384 imaging method Methods 0.000 description 6
- 238000011835 investigation Methods 0.000 description 6
- 238000002595 magnetic resonance imaging Methods 0.000 description 6
- 238000002600 positron emission tomography Methods 0.000 description 6
- 238000004393 prognosis Methods 0.000 description 6
- 238000012175 pyrosequencing Methods 0.000 description 6
- 238000002604 ultrasonography Methods 0.000 description 6
- 206010006187 Breast cancer Diseases 0.000 description 5
- 208000026310 Breast neoplasm Diseases 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000007847 digital PCR Methods 0.000 description 5
- 238000011304 droplet digital PCR Methods 0.000 description 5
- 230000001973 epigenetic effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000007477 logistic regression Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 230000004043 responsiveness Effects 0.000 description 5
- 238000010839 reverse transcription Methods 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 102100023287 2-acylglycerol O-acyltransferase 3 Human genes 0.000 description 4
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 4
- 230000005778 DNA damage Effects 0.000 description 4
- 231100000277 DNA damage Toxicity 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 4
- 102100033417 Glucocorticoid receptor Human genes 0.000 description 4
- 101001115709 Homo sapiens 2-acylglycerol O-acyltransferase 3 Proteins 0.000 description 4
- 101001052060 Homo sapiens Beta-1,4-mannosyl-glycoprotein 4-beta-N-acetylglucosaminyltransferase Proteins 0.000 description 4
- 101000926939 Homo sapiens Glucocorticoid receptor Proteins 0.000 description 4
- 101001011441 Homo sapiens Interferon regulatory factor 4 Proteins 0.000 description 4
- 101000829542 Homo sapiens Polypeptide N-acetylgalactosaminyltransferase 14 Proteins 0.000 description 4
- 101000723833 Homo sapiens Zinc finger E-box-binding homeobox 2 Proteins 0.000 description 4
- 101000818806 Homo sapiens Zinc finger protein 264 Proteins 0.000 description 4
- 102100030126 Interferon regulatory factor 4 Human genes 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 102100023208 Polypeptide N-acetylgalactosaminyltransferase 14 Human genes 0.000 description 4
- 238000003559 RNA-seq method Methods 0.000 description 4
- 102100028458 Zinc finger E-box-binding homeobox 2 Human genes 0.000 description 4
- 102100021367 Zinc finger protein 264 Human genes 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 4
- 238000002052 colonoscopy Methods 0.000 description 4
- 238000000205 computational method Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 108091033409 CRISPR Proteins 0.000 description 3
- 238000010354 CRISPR gene editing Methods 0.000 description 3
- 206010061818 Disease progression Diseases 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- NNTOJPXOCKCMKR-UHFFFAOYSA-N boron;pyridine Chemical compound [B].C1=CC=NC=C1 NNTOJPXOCKCMKR-UHFFFAOYSA-N 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000009615 deamination Effects 0.000 description 3
- 238000006481 deamination reaction Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000005750 disease progression Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000006911 enzymatic reaction Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000005194 fractionation Methods 0.000 description 3
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 230000003211 malignant effect Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 230000002980 postoperative effect Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 229920001621 AMOLED Polymers 0.000 description 2
- 102100033377 Carbohydrate sulfotransferase 15 Human genes 0.000 description 2
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 2
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 2
- 238000007399 DNA isolation Methods 0.000 description 2
- 230000030933 DNA methylation on cytosine Effects 0.000 description 2
- 102100032064 EMILIN-2 Human genes 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 101000943842 Homo sapiens Carbohydrate sulfotransferase 15 Proteins 0.000 description 2
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 2
- 101000921278 Homo sapiens EMILIN-2 Proteins 0.000 description 2
- 101001037989 Homo sapiens LON peptidase N-terminal domain and RING finger protein 2 Proteins 0.000 description 2
- 101000712956 Homo sapiens Ras association domain-containing protein 2 Proteins 0.000 description 2
- 101000932478 Homo sapiens Receptor-type tyrosine-protein kinase FLT3 Proteins 0.000 description 2
- 101001009087 Homo sapiens Tyrosine-protein kinase HCK Proteins 0.000 description 2
- 101000818450 Homo sapiens Zinc finger protein 82 homolog Proteins 0.000 description 2
- 238000007397 LAMP assay Methods 0.000 description 2
- 102100040392 LON peptidase N-terminal domain and RING finger protein 2 Human genes 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 208000008589 Obesity Diseases 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 206010033307 Overweight Diseases 0.000 description 2
- 208000002193 Pain Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 102100033242 Ras association domain-containing protein 2 Human genes 0.000 description 2
- 102100020718 Receptor-type tyrosine-protein kinase FLT3 Human genes 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 102100027389 Tyrosine-protein kinase HCK Human genes 0.000 description 2
- 102100021138 Zinc finger protein 82 homolog Human genes 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 238000011226 adjuvant chemotherapy Methods 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- 239000002246 antineoplastic agent Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 229940127089 cytotoxic agent Drugs 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 239000003596 drug target Substances 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000006607 hypermethylation Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000011528 liquid biopsy Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 230000036210 malignancy Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 230000000869 mutational effect Effects 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 239000013610 patient sample Substances 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 230000035790 physiological processes and functions Effects 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000002579 sigmoidoscopy Methods 0.000 description 2
- 239000010454 slate Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- SBHSUMUTJOPRIK-HPFNVAMJSA-N 5-(beta-D-glucosylmethyl)cytosine Chemical compound NC1=NC(=O)NC=C1CO[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 SBHSUMUTJOPRIK-HPFNVAMJSA-N 0.000 description 1
- BLQMCTXZEMGOJM-UHFFFAOYSA-N 5-carboxycytosine Chemical compound NC=1NC(=O)N=CC=1C(O)=O BLQMCTXZEMGOJM-UHFFFAOYSA-N 0.000 description 1
- FHSISDGOVSHJRW-UHFFFAOYSA-N 5-formylcytosine Chemical compound NC1=NC(=O)NC=C1C=O FHSISDGOVSHJRW-UHFFFAOYSA-N 0.000 description 1
- 101150008021 80 gene Proteins 0.000 description 1
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 1
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 239000012623 DNA damaging agent Substances 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 206010072082 Environmental exposure Diseases 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 206010018429 Glucose tolerance impaired Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000653374 Homo sapiens Methylcytosine dioxygenase TET2 Proteins 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 102100030803 Methylcytosine dioxygenase TET2 Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 102100026456 POU domain, class 3, transcription factor 3 Human genes 0.000 description 1
- 101710133393 POU domain, class 3, transcription factor 3 Proteins 0.000 description 1
- 208000037062 Polyps Diseases 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 208000001280 Prediabetic State Diseases 0.000 description 1
- 206010065918 Prehypertension Diseases 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108091028733 RNTP Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 239000012830 cancer therapeutic Substances 0.000 description 1
- 230000025084 cell cycle arrest Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006326 desulfonation Effects 0.000 description 1
- 238000005869 desulfonation reaction Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- WBZKQQHYRPRKNJ-UHFFFAOYSA-L disulfite Chemical compound [O-]S(=O)S([O-])(=O)=O WBZKQQHYRPRKNJ-UHFFFAOYSA-L 0.000 description 1
- 230000001819 effect on gene Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007812 electrochemical assay Methods 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000000416 exudates and transudate Anatomy 0.000 description 1
- 206010016256 fatigue Diseases 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 125000004029 hydroxymethyl group Chemical group [H]OC([H])([H])* 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000007855 methylation-specific PCR Methods 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 230000036407 pain Effects 0.000 description 1
- 238000010238 partial least squares regression Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 201000009104 prediabetes syndrome Diseases 0.000 description 1
- 238000012628 principal component regression Methods 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012340 reverse transcriptase PCR Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000013106 supervised machine learning method Methods 0.000 description 1
- 238000004416 surface enhanced Raman spectroscopy Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000002235 transmission spectroscopy Methods 0.000 description 1
- 238000013107 unsupervised machine learning method Methods 0.000 description 1
- 238000011311 validation assay Methods 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 208000016261 weight loss Diseases 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Biochemistry (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Oncology (AREA)
- Microbiology (AREA)
- Hospice & Palliative Care (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
Abstract
Description
本出願は、2020年3月31日に出願された米国仮特許出願第63/002,878号の利益を主張し、その内容は参照によりその全体が本明細書に組み込まれる。
本明細書で言及されるすべての刊行物、特許、および特許出願は、あたかも各個々の刊行物、特許、または特許出願が参照により組み込まれることが具体的かつ個別に示されているのと同程度に、参照により本明細書に組み込まれる。参照により組み込まれる刊行物および特許または特許出願が本明細書に含まれる開示と矛盾する範囲において、本明細書は、そのような矛盾する資料を更新、および/またはそれに優先することを意図している。
本明細書および特許請求の範囲で使用される場合、単数形「a」、「an」、および「the」は、文脈上他に明確に指示されない限り、複数の言及を含む。例えば、「核酸」という用語は、それらの混合物を含む複数の核酸を含む。
無細胞生物学的試料は、ヒト対象から得ても、またはそれに由来してもよい。無細胞生物学的試料は、処理前に様々な保存条件、例えば、異なる温度(例えば、室温、冷蔵または冷凍条件下、25°C、4°C、-18°C、-20°C、または-80°C)で、または異なる懸濁液(例えば、EDTAコレクションチューブ、無細胞RNAコレクションチューブ、または無細胞DNAコレクションチューブ)で保存することができる。
本開示は、生物学的試料を分析して、結腸細胞増殖性障害の発症に関連する試料中のDNA中の高メチル化領域の組み合わせから測定可能な特徴を得て、領域のシグネチャパネルを同定する方法およびシステムを提供する。シグネチャパネルからの特徴を、トレーニングされたアルゴリズム(例えば、機械学習モデル)を使用して処理して、結腸細胞増殖性障害を有する個体の集団を階層化するように構成された分類子を作成することができる。方法は、シーケンシングの前に同定された領域内のメチル化CpGジヌクレオチドと非メチル化CpGジヌクレオチドとを識別することができる試薬または一連の試薬と接触させられる、シグネチャパネルに記載されるメチル化領域を有する1つ以上の核酸を使用することを特徴とする。
A.核酸処理
核酸配列中のメチル化シトシンと非メチル化シトシンとを識別するための核酸塩基の化学ベースおよび酵素ベースの変換を含む、メチル化シーケンシングのための様々な方法が利用可能である。これらのアッセイは、DNA配列内の1つまたは複数のCpGジヌクレオチド(例えば、CpGアイランド)のメチル化状態の決定を可能にする。そのようなアッセイは、数ある技術の中でも、亜硫酸水素塩処理DNAまたは酵素処理DNAのDNAシーケンシング、ポリメラーゼ連鎖反応(PCR)(配列特異的増幅用)、定量的PCR(qPCR)またはデジタル液滴PCR(ddPCR)、サザンブロット分析を含み得る。様々な例において、生物学的試料中のDNAは、5’位でメチル化されていないシトシン塩基が、ウラシル、チミン、またはハイブリダイゼーション挙動に関してシトシンとは異なる別の塩基に変換されるように処理される。これは、「変換」と呼ばれ得る。
いくつかの実施形態では、シーケンシングリードの生成は次世代シーケンシングによって行われる。これにより、所与の領域に対して高深度のリードを達成することが可能になり得る。これらは、例えば、Illumina(登録商標)(Solexa)シーケンシング、DNB-Sequencer T7(DNBSEQ(登録商標))またはG400(MGI Tech Co.,Ltd)、GenapSys(登録商標)シーケンシング(GenapSys,Inc.)、Roche 454シーケンシング(Roche Sequencing Solutions,Inc.)、Ion Torrentシーケンシング(Thermo Fisher Scientific)、およびSOLiDシーケンシング(Thermo Fisher Scientific(登録商標))を含むハイスループット法であり得る。シーケンシングリードの数は、DNA投入量および分析に必要なデータの深度に応じて調整することができる。
標的メチル化シーケンシングアプローチでは、標的遺伝子配列のメチル化状態を決定するために、cfDNAなどの生物学的試料中の標的領域が分析される。いくつかの実施形態では、標的領域は、目的の標的領域の連続するヌクレオチド、例えば目的の標的領域の少なくとも約16個の連続するヌクレオチドを含むか、またはストリンジェントな条件下それらにハイブリダイズする。異なる例では、標的シーケンシングは、ハイブリダイゼーション捕捉およびアンプリコンシーケンシングアプローチを使用して達成され得る。
本明細書で提供されるハイブリダイゼーション方法は、核酸ハイブリダイゼーションの様々な形式、例えば、溶液中ハイブリダイゼーションおよび固体支持体上でのハイブリダイゼーション(例えば、膜、マイクロアレイおよび細胞/組織スライド上でのノーザンハイブリダイゼーション、サザンハイブリダイゼーションおよびインサイチュハイブリダイゼーション)で使用され得る。特に、方法は、標的化次世代シーケンシングに使用される特定のタイプのゲノムDNA配列(例えば、エクソン)の標的富化のための溶液中ハイブリッド捕捉に適している。ハイブリッド捕捉アプローチのために、無細胞核酸試料をライブラリー調製に供する。本明細書で使用される場合、「ライブラリー調製」は、その後のDNAシーケンシングを可能にするために無細胞DNAに対して行われる末端修復、Aテーリング、アダプターライゲーション、または任意の他の調製を含む。ある特定の例において、調製された無細胞核酸ライブラリー配列は、無細胞核酸試料分子上にライゲーションされるアダプター、配列タグ、インデックスバーコードを含む。次世代シーケンシングアプローチ用のライブラリー調製を容易にするための、様々な市販のキットが利用可能である。次世代シーケンシングライブラリーの構築は、調整された一連の酵素反応を使用して核酸標的を調製し、ハイスループットシーケンシングのための、特定のサイズのDNA断片のランダムな集合を生成することを含み得る。様々なライブラリー調製技術の進歩および開発により、次世代シーケンシングのトランスクリプトミクスおよびエピジェネティクスなどの分野への応用が拡大している。
変換されたDNAの断片は増幅され得る。いくつかの実施形態では、増幅することは、その中に少なくとも1つのメチル化部位を有する、メチル化変換された標的配列にアニーリングするように設計されたプライマーを用いて行われる。メチル化シーケンシング変換により、非メチル化シトシンがウラシルに変換されるが、5-メチルシトシンは影響を受けない。したがって、「変換された標的配列」は、メチル化部位であることが知られているシトシンが「C」(シトシン)として固定されている一方で、メチル化されていないことが知られているシトシンが「U」(ウラシル;プライマー設計目的のために「T」(チミン)として扱ってもよい)として固定されている配列であると理解される。
様々な例において、メチル化シーケンシング特徴を、トレーニングされたアルゴリズム(例えば、機械学習モデルまたは分類子)への入力データセットとして使用して、配列組成と患者群との間の相関を見出す。そのような患者群の例としては、疾患または状態の存在、ステージ、サブタイプ、応答者対非応答者、および発症者対非発症者が挙げられる。様々な例では、特徴行列を生成して、既知の状態または特徴を有する個体から得られた試料を比較する。いくつかの実施形態では、試料は、健康な個体、または既知の指標のいずれも有さない個体から、および癌を有することが知られている患者からの試料から得られる。
いくつかの例では、本開示は、ソフトウェアアプリケーション、コンピューティングハードウェア、またはその両方で実現されるデータ分析を有するシステム、方法、またはキットを提供する。様々な例において、分析アプリケーションまたはシステムは、少なくともデータ受信モジュール、データ前処理モジュール、データ分析モジュール(1つまたは複数のタイプのゲノムデータに対して操作することができる)、データ解釈モジュール、またはデータ視覚化モジュールを含む。いくつかの実施形態では、データ受信モジュールは、実験室ハードウェアまたは計装を、実験室データを処理するコンピュータシステムと接続するコンピュータシステムを含むことができる。いくつかの実施形態では、データ前処理モジュールは、分析の準備中のデータに対して操作を実行するハードウェアシステムまたはコンピュータソフトウェアを備えることができる。前処理モジュール内のデータに適用され得る操作の例は、アフィン変換、ノイズ除去操作、データクリーニング、リフォーマット、またはサブサンプリングを含む。1つ以上のゲノム材料からのゲノムデータを分析するために特殊化され得るデータ分析モジュールは、例えば、集合したゲノム配列を取得し、確率的および統計的分析を実施して、疾患、病態、状態、リスク、状態または表現型に関連する異常パターンを識別することができる。データ解釈モジュールは、例えば統計学、数学、または生物学から引き出された分析方法を使用して、識別された異常パターンと健康状態、機能的状態、予後、またはリスクとの間の関係の理解を裏付けることができる。データ視覚化モジュールは、数学的モデリング、コンピュータグラフィックス、またはレンダリングの方法を使用して、結果の理解または解釈を容易にすることができるデータの視覚的表現を作成することができる。
一態様では、開示されるシステムおよび方法は、cfDNAの生物学的試料からのメチル化配列分析に由来する特徴情報に基づいて生成された分類子を提供する。分類子は、cfDNAなどの生物学的試料で特定された配列特徴に基づいて集団内の群を区別するための予測エンジンの一部を形成する。
いくつかの例では、本明細書に記載の主題は、デジタル処理デバイスまたはその使用を含むことができる。いくつかの例では、デジタル処理デバイスは、デバイスの機能を実行する1つまたは複数のハードウェアセントラルプロセシングユニット(CPU)、グラフィックスプロセシングユニット(GPU)、またはテンソルプロセシングユニット(TPU)を含むことができる。いくつかの例では、デジタル処理デバイスは、実行可能命令を実行するように構成されたオペレーティングシステムを含むことができる。
いくつかの例では、本明細書に開示される主題は、場合によりネットワーク化されたデジタル処理デバイスのオペレーティングシステムによって実行可能な命令を含むプログラムで符号化された、1つまたは複数の非一時的コンピュータ可読記憶媒体を含むことができる。いくつかの例では、コンピュータ可読記憶媒体は、デジタル処理デバイスの有形の構成要素であってもよい。いくつかの例では、コンピュータ可読記憶媒体は、場合によりデジタル処理デバイスから取り外し可能であってもよい。いくつかの例では、コンピュータ可読記憶媒体は、例えば、CD-ROM、DVD、フラッシュメモリデバイス、ソリッドステートメモリ、磁気ディスクドライブ、磁気テープドライブ、光ディスクドライブ、クラウドコンピューティングシステムおよびサービスなどを含むことができる。いくつかの例では、プログラムおよび命令は、媒体上に永続的に、実質的に永続的に、半永続的に、または非一時的に符号化されてもよい。
本開示は、本明細書に記載の方法を実施するようにプログラムされたコンピュータシステムを提供する。図1は、患者データ、生物学的データ、生物学的配列、および参照配列を記憶、処理、識別、または解釈するようにプログラムされた、またはそうでなければ構成されたコンピュータシステム(101)を示す。コンピュータシステム(101)は、本開示の患者データ、生物学的データ、生物学的配列、または参照配列の様々な態様を処理することができる。コンピュータシステム(101)は、ユーザの電子デバイス、または電子デバイスに対して遠隔に配置されたコンピュータシステムであってもよい。電子デバイスは、モバイル電子デバイスであってもよい。
いくつかの例では、本明細書に開示される主題は、患者データ、生物学的データ、生物学的配列、または参照配列を記憶するための1つまたは複数のデータベース、またはその使用を含むことができる。参照配列は、データベースから導出され得る。本明細書中に提供される開示を考慮すると、多くのデータベースが配列情報の保存および読み出しに適している場合がある。いくつかの例では、適切なデータベースは、例えば、リレーショナルデータベース、非リレーショナルデータベース、オブジェクト指向データベース、オブジェクトデータベース、実体関連モデルデータベース、連想データベース、およびXMLデータベースを含むことができる。いくつかの例では、データベースはインターネットベースであってもよい。いくつかの例では、データベースはウェブベースであってもよい。いくつかの例では、データベースはクラウドコンピューティングベースであってもよい。いくつかの例では、データベースは、1つまたは複数のローカルコンピュータ記憶デバイスに基づくことができる。
開示される方法は、対象におけるcfDNAの分析を介して、結腸細胞増殖障害に関連するゲノムDNAの遺伝的および/またはエピジェネティックパラメータを確認することに関する。方法は、結腸細胞増殖性障害の、より具体的には、前記障害のステージまたはサブクラスおよび前記障害に対する遺伝的素因の特定、およびそれらの識別の改善を可能にすることによって改善された診断、治療およびモニタリングにおいて使用するためのものである。
本明細書で提供される方法およびシステムは、人工知能ベースのアプローチを使用する予測分析を実行して、対象(患者)から取得されたデータを分析し、癌(例えば、結腸直腸癌)を有する対象の診断の出力を生成することができる。例えば、アプリケーションは、取得されたデータに予測アルゴリズムを適用して、癌を有する対象の診断を生成することができる。予測アルゴリズムは、人工知能ベースの予測子、例えば取得データを処理して、癌を有する対象の診断を生成するように構成された機械学習ベースの予測子を含み得る。
本明細書に記載の予測分類子、システム、および方法は、いくつかの臨床用途のための個体の集団の分類に適用することができる(例えば、本明細書中に記載されるシグネチャパネルを使用するメチル化アッセイの、個体の生物学的試料に対する実施に基づく)。そのような臨床用途の例としては、早期癌の検出、癌の診断、癌の特定のステージへの分類、癌治療用の治療剤に対する応答性または耐性の決定が挙げられる。
トレーニングされたアルゴリズムを使用してデータセットを処理した後、対象において結腸直腸癌を特定またはモニタリングすることができる。特定は、結腸直腸癌関連ゲノム遺伝子座のパネルでのデータセットの配列リードの定量的測定値(例えば、結腸直腸癌関連ゲノム遺伝子座におけるRNA転写物またはDNAの定量的測定値)に少なくとも部分的に基づき得る。
本開示は、対象の癌を特定またはモニタリングするためのキットを提供する。キットは、対象の無細胞生物学的試料中の複数の癌関連ゲノム遺伝子座のそれぞれにおける配列の定量的測定値(例えば、存在、非存在、または相対量の表示)を特定するためのプローブを含み得る。無細胞生物学的試料中の複数の癌関連ゲノム遺伝子座の各々における配列の定量的測定値(例えば、存在、非存在、または相対量の表示)は、1つ以上の癌を示し得る。プローブは、無細胞生物学的試料中の複数の癌関連ゲノム遺伝子座における配列に対して選択的であり得る。キットは、プローブを使用して無細胞生物学的試料を処理し、対象の無細胞生物学的試料中の複数の癌関連ゲノム遺伝子座のそれぞれにおける配列の定量的測定値(例えば、存在、非存在、または相対量を示す)を示すデータセットを生成するための説明書を含み得る。
結腸直腸癌について、本開示のシステムおよび方法を使用して、腫瘍において高度にメチル化されているが、複数の正常組織がこれらの領域のメチル化を示さないゲノム内の20個の領域を特定した。これらの領域を、バックグラウンドシグナルがほとんどまたは全くない、腫瘍の存在についての高度に特異的なマーカーとして使用した。
TOGAデータベースからの複数の結腸直腸癌試料において広範なメチル化を示すが、複数の正常組織および血球(末梢血単核細胞など)においてメチル化がないかまたは最小限であることが示されたゲノム中の様々な領域に対して、PCRプライマー対を開発した。
本開示のシステムおよび方法を使用して、機械学習分類モデルを構築し、人工知能ベースのアプローチを使用してトレーニングして、対象から取得されたcfDNAデータを分析した(結腸直腸癌を有する対象の診断の出力を生成した)。
本開示のシステムおよび方法を使用して、人工知能ベースのアプローチを使用して予測分析を実行して、対象から取得されたcfDNAデータを分析して結腸直腸癌を有する対象の診断の出力を生成した。
Claims (49)
- 結腸細胞増殖性障害に特徴的なメチル化シグネチャパネルであって、
表11からなる群から選択される1つまたは複数のメチル化ゲノム領域を含み、前記1つまたは複数の領域が、結腸細胞増殖性障害または結腸細胞増殖性障害サブタイプを有する個体からの生物学的試料においてメチル化の程度が高く、結腸細胞増殖性障害を有しない個体における正常組織および正常血球においてメチル化の程度が低い、メチル化シグネチャパネル。 - 前記生物学的試料が、核酸、DNA、RNAまたは無細胞核酸(cfDNAまたはcfRNA)である、請求項1記載のメチル化シグネチャパネル。
- 前記シグネチャパネルが、表11からなる群より選択される2つ以上のゲノム領域におけるメチル化の増加を含む、請求項1記載のメチル化シグネチャパネル。
- 前記結腸細胞増殖性障害が、腺腫(腺腫様ポリープ)、無茎性鋸歯状腺腫(SSA)、進行した腺腫、結腸直腸異形成、結腸直腸腺腫、結腸直腸癌、結腸癌、直腸癌、結腸直腸癌腫、結腸直腸腺癌、カルチノイド腫瘍、消化管カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫および肉腫からなる群より選択される、請求項1記載のメチル化シグネチャパネル。
- 前記結腸細胞増殖性障害が、ステージ1結腸直腸癌、ステージ2結腸直腸癌、ステージ3結腸直腸癌、およびステージ4結腸直腸癌からなる群から選択される、請求項1記載のメチル化シグネチャパネル。
- 前記シグネチャパネルが、表1~11の2つ以上のメチル化ゲノム領域、表1~11の3つ以上のメチル化ゲノム領域、表1~11の4つ以上のメチル化ゲノム領域、表1~11の5つ以上のメチル化ゲノム領域、表1~11の6つ以上のメチル化ゲノム領域、表1~11の7つ以上のメチル化ゲノム領域、表1~11の8つ以上のメチル化ゲノム領域、表1~11の9つ以上のメチル化ゲノム領域、表1~11の10個以上のメチル化ゲノム領域、表1~11の11個以上のメチル化ゲノム領域、表1~11の12個以上のメチル化ゲノム領域、または表1~11の13個以上のメチル化ゲノム領域を含む、請求項1記載のメチル化シグネチャパネル。
- 前記シグネチャパネルが、IKZF1、KCNQ5、ELMO1、CHST2、PRKCBおよびFLI1からなる群から選択される1つまたは複数のゲノム領域中のメチル化領域を含む、結腸直腸癌でメチル化されたゲノム領域を含む、請求項1記載のメチル化シグネチャパネル。
- 結腸直腸癌でメチル化された前記領域が、IKZF1、KCNQ5およびELMO1ゲノム領域からなる群から選択されるメチル化領域を含む、請求項1記載のメチル化シグネチャパネル。
- 結腸直腸癌でメチル化された前記領域が、IKZF1、KCNQ5、ELMO1、CHST2、PRKCB、FLI1、CLIP4、ELOVL5、FAM72BおよびST3GAL1からなる群から選択される1つまたは複数のゲノム領域のメチル化領域を含む、請求項1記載のメチル化シグネチャパネル。
- 前記シグネチャパネルが、表1、表2、表3、表4、表5、表6、表7、表8、表9、表10および表11からなる群より選択されるメチル化ゲノム領域を含む、請求項1記載のメチル化シグネチャパネル。
- 結腸細胞増殖性障害に特徴的なメチル化シグネチャパネルであって、
表1~11からなる群から選択される2つ以上のメチル化ゲノム領域を含み、前記2つ以上の領域が、結腸細胞増殖性障害または結腸細胞増殖性障害サブタイプを有する個体からの生物学的試料においてメチル化の程度が高く、結腸細胞増殖性障害を有しない個体における正常組織および正常血球においてメチル化の程度が低い、メチル化シグネチャパネル。 - 前記生物学的試料が、核酸、DNA、RNAまたは無細胞核酸である、請求項11記載のメチル化シグネチャパネル。
- 前記シグネチャパネルが、表1~11からなる群より選択される6つ以上のゲノム領域におけるメチル化の増加を含む、請求項11記載のメチル化シグネチャパネル。
- 前記結腸細胞増殖性障害が、腺腫(腺腫様ポリープ)、無茎性鋸歯状腺腫(SSA)、進行した腺腫、結腸直腸異形成、結腸直腸腺腫、結腸直腸癌、結腸癌、直腸癌、結腸直腸癌腫、結腸直腸腺癌、カルチノイド腫瘍、消化管カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫および肉腫からなる群より選択される、請求項11記載のメチル化シグネチャパネル。
- 前記結腸細胞増殖性障害が、ステージ1結腸直腸癌、ステージ2結腸直腸癌、ステージ3結腸直腸癌、およびステージ4結腸直腸癌からなる群から選択される、請求項11記載のメチル化シグネチャパネル。
- 前記シグネチャパネルが、表1~11の3つ以上のメチル化ゲノム領域、表1~11の4つ以上のメチル化ゲノム領域、表1~11の5つ以上のメチル化ゲノム領域、表1~11の6つ以上のメチル化ゲノム領域、表1~11の7つ以上のメチル化ゲノム領域、表1~11の8つ以上のメチル化ゲノム領域、表1~11の9つ以上のメチル化ゲノム領域、表1~11の10個以上のメチル化ゲノム領域、表1~11の11個以上のメチル化ゲノム領域、表1~11の12個以上のメチル化ゲノム領域、または表1~11の13個以上のメチル化ゲノム領域を含む、請求項11記載のメチル化シグネチャパネル。
- 前記シグネチャパネルが、IKZF1、KCNQ5、ELMO1、CHST2、PRKCBおよびFLI1からなる群から選択される1つまたは複数のゲノム領域中のメチル化領域を含む、結腸直腸癌でメチル化されたゲノム領域を含む、請求項11記載のメチル化シグネチャパネル。
- 結腸直腸癌でメチル化された前記領域が、IKZF1、KCNQ5およびELMO1ゲノム領域からなる群から選択されるメチル化領域を含む、請求項11記載のメチル化シグネチャパネル。
- 結腸直腸癌でメチル化された前記領域が、IKZF1、KCNQ5、ELMO1、CHST2、PRKCB、FLI1、CLIP4、ELOVL5、FAM72BおよびST3GAL1からなる群から選択される1つまたは複数のゲノム領域のメチル化領域を含む、請求項11記載のメチル化シグネチャパネル。
- 前記シグネチャパネルが、表1、表2、表3、表4、表5、表6、表7、表8、表9、表10および表11からなる群より選択されるメチル化ゲノム領域を含む、請求項11記載のメチル化シグネチャパネル。
- 結腸細胞増殖性障害を有する個体から健康な個体の集団を識別することができる機械学習分類子であって、
a)請求項1記載の差次的にメチル化されたゲノム領域を表す測定値のセットを含み、前記測定値が、健康な対象および結腸細胞増殖性障害を有する対象からのメチル化シーケンシングデータから得られ、
b)前記測定値が、前記差次的にメチル化されたゲノム領域の特性に対応する特徴のセットを生成するために使用され、そこで前記特徴が機械学習モデルまたは統計モデルに入力され、
c)前記モデルが、健康な個体の集団を結腸細胞増殖性障害を有する個体から識別することができる分類子として有用な特徴ベクトルを提供する、機械学習分類子。 - 前記測定値のセットが、CpG、CHG、CHHについてのベースワイズ(base wise)メチル化率、領域内のメチル化CpGの異なるカウントまたは割合を有する断片を観察するカウントまたは割合、変換効率(100-CHHについての平均メチル化率)、低メチル化ブロック、メチル化レベル(CPG、CHH、CHGの全体平均メチル化、断片長、断片中間点、断片あたりのメチル化CpG数、断片あたりの総CpGに対するCpGメチル化の割合、領域あたりの総CpGに対するCpGメチル化の割合、パネル内の総CpGに対するCpGメチル化の割合、ジヌクレオチドカバレッジ(ジヌクレオチドの正規化されたカバレッジ)、カバレッジの均一性(1xおよび10xの平均ゲノムカバレッジ(S4ランについて)での固有のCpG部位、全体的な平均CpGカバレッジ(深度)、ならびにCpGアイランド、CGIシェルフおよびCGIショアでの平均カバレッジからなる群から選択されるメチル化領域の特徴を説明する、請求項21記載の分類子。
- 結腸細胞増殖性障害を検出するための機械学習モデル分類子を含むシステムであって、
a)メチル化シグネチャパネルに基づいて、前記結腸細胞増殖性障害を有するものとして、または前記結腸細胞増殖性障害を有しないものとして対象を分類するように操作可能な分類子を含むコンピュータ可読媒体、および
b)前記コンピュータ可読媒体に記憶された命令を実行するための1つまたは複数のプロセッサを含む、システム。 - コンピュータシステムのメモリにロードされた請求項21に記載の分類子を含み、前記機械学習モデルが、トレーニング生物学的試料、結腸細胞増殖性障害を有すると同定された前記トレーニング生物学的試料の第1のサブセット、および結腸細胞増殖性障害を有さないと同定された前記トレーニング生物学的試料の第2のサブセットから得られたトレーニングベクトルを使用してトレーニングされる、請求項23記載のシステム。
- 個体からの無細胞デオキシリボ核酸(cfDNA)試料のメチル化プロファイルを決定する方法であって、
a)前記cfDNA試料の核酸分子において非メチル化シトシンをウラシルに変換することができる条件を提供して、複数の変換された核酸を生成すること、
b)前記複数の変換された核酸を、表1~11からなる群から選択される少なくとも2つの差次的にメチル化された領域の予め同定されたメチル化シグネチャパネルに相補的な核酸プローブと接触させて、前記シグネチャパネルに対応する配列を富化すること、
c)前記複数の変換された核酸分子の核酸配列を決定すること、および
d)前記複数の変換された核酸分子の核酸配列を参照核酸配列にアラインメントし、それにより前記個体のメチル化プロファイルを決定することを含む、方法。 - 前記複数の変換された核酸を増幅することをさらに含む、請求項25記載の方法。
- 前記増幅がポリメラーゼ連鎖反応(PCR)を含む、請求項26記載の方法。
- 前記変換された核酸分子の核酸配列を、1000x超、2000x超、3000x超、4000x超または5000x超の深度で決定することをさらに含む、請求項25記載の方法。
- 前記参照核酸配列が、ヒト参照ゲノムの少なくとも一部である、請求項25記載の方法。
- 前記ヒト参照ゲノムがhg18である、請求項29記載の方法。
- 前記予め同定されたメチル化シグネチャパネルが、表1~11の3つ以上のメチル化ゲノム領域、表1~11の4つ以上のメチル化ゲノム領域、表1~11の5つ以上のメチル化ゲノム領域、表1~11の6つ以上のメチル化ゲノム領域、表1~11の7つ以上のメチル化ゲノム領域、表1~11の8つ以上のメチル化ゲノム領域、表1~11の9つ以上のメチル化ゲノム領域、表1~11の10個以上のメチル化ゲノム領域、表1~11の11個以上のメチル化ゲノム領域、表1~11の12個以上のメチル化ゲノム領域、または表1~11の13個以上のメチル化ゲノム領域を含む、請求項25記載の方法。
- 前記予め同定されたメチル化シグネチャパネルが、表11における1つ以上のメチル化ゲノム領域、表11における2つ以上のメチル化ゲノム領域、または表11における3つのメチル化ゲノム領域を含む、請求項31記載の方法。
- 前記メチル化プロファイルが、前記個体における結腸細胞増殖性障害の存在または非存在を示す、請求項25記載の方法。
- 前記結腸細胞増殖性障害が、腺腫(腺腫様ポリープ)、無茎性鋸歯状腺腫(SSA)、進行した腺腫、結腸直腸異形成、結腸直腸腺腫、結腸直腸癌、結腸癌、直腸癌、結腸直腸癌腫、結腸直腸腺癌、カルチノイド腫瘍、消化管カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫および肉腫からなる群より選択される、請求項33記載の方法。
- 前記結腸細胞増殖性障害が、ステージ1結腸直腸癌、ステージ2結腸直腸癌、ステージ3結腸直腸癌、またはステージ4結腸直腸癌からなる群から選択される、請求項33記載の方法。
- 対象における結腸細胞増殖性障害の存在または非存在を検出する方法であって、
a)前記対象から得られた、または由来する生物学的試料の核酸分子において非メチル化シトシンをウラシルに変換することができる条件を提供して、複数の変換された核酸を生成すること、
b)前記複数の変換された核酸を、表1~11からなる群から選択される少なくとも2つの差次的にメチル化された領域の予め同定されたメチル化シグネチャパネルに相補的な核酸プローブと接触させて、前記シグネチャパネルに対応する配列を富化すること、
c)前記変換された核酸分子の核酸配列を決定すること、
d)前記複数の変換された核酸分子の核酸配列を参照核酸配列にアラインメントし、それにより前記個体のメチル化プロファイルを決定すること、および
e)トレーニングされた機械学習分類子を前記メチル化プロファイルに適用することを含み、前記機械学習分類子が、健康な個体と結腸細胞増殖性障害を有する個体とを識別して、結腸細胞増殖性障害の存在に関連する出力値を提供し、それによって前記対象における前記結腸細胞増殖性障害の存在または非存在を検出することができるようにトレーニングされる、方法。 - 前記対象から得られる生物学的試料が、無細胞DNA、無細胞RNA、体液、便、結腸排出物、尿、血漿、血清、全血、単離血液細胞、血液から単離された細胞、およびそれらの組み合わせからなる群から選択される、請求項36記載の方法。
- 前記複数の変換された核酸を増幅することをさらに含む、請求項36記載の方法。
- 前記増幅がポリメラーゼ連鎖反応(PCR)を含む、請求項38記載の方法。
- 前記変換された核酸分子の核酸配列を、1000x超、2000x超、3000x超、4000x超または5000x超の深度で決定することをさらに含む、請求項36記載の方法。
- 前記参照核酸配列が、ヒト参照ゲノムの少なくとも一部である、請求項36記載の方法。
- 前記ヒト参照ゲノムがhg18である、請求項41記載の方法。
- 前記予め同定されたメチル化シグネチャパネルが、表1~11の3つ以上のメチル化ゲノム領域、表1~11の4つ以上のメチル化ゲノム領域、表1~11の5つ以上のメチル化ゲノム領域、表1~11の6つ以上のメチル化ゲノム領域、表1~11の7つ以上のメチル化ゲノム領域、表1~11の8つ以上のメチル化ゲノム領域、表1~11の9つ以上のメチル化ゲノム領域、表1~11の10個以上のメチル化ゲノム領域、表1~11の11個以上のメチル化ゲノム領域、表1~11の12個以上のメチル化ゲノム領域、または表1~11の13個以上のメチル化ゲノム領域を含む、請求項36記載の方法。
- 前記予め同定されたメチル化シグネチャパネルが、表11における1つ以上のメチル化ゲノム領域、表11における2つ以上のメチル化ゲノム領域、または表11における3つのメチル化ゲノム領域を含む、請求項43記載の方法。
- 前記個体における前記結腸細胞増殖性障害の存在の検出に基づいて、前記結腸細胞増殖性障害の治療を前記個体に投与することをさらに含む、請求項36記載の方法。
- 前記結腸細胞増殖性障害が、腺腫(腺腫様ポリープ)、無茎性鋸歯状腺腫(SSA)、進行した腺腫、結腸直腸異形成、結腸直腸腺腫、結腸直腸癌、結腸癌、直腸癌、結腸直腸癌腫、結腸直腸腺癌、カルチノイド腫瘍、消化管カルチノイド腫瘍、消化管間質腫瘍(GIST)、リンパ腫および肉腫からなる群より選択される、請求項36記載の方法。
- 前記結腸細胞増殖性障害が結腸直腸癌を含む、請求項36記載の方法。
- 前記結腸細胞増殖性障害が、ステージ1結腸直腸癌、ステージ2結腸直腸癌、ステージ3結腸直腸癌、およびステージ4結腸直腸癌からなる群から選択される、請求項36記載の方法。
- 前記トレーニングされた機械学習分類子が、深層学習分類子、ニューラルネットワーク分類子、線形判別分析(LDA)分類子、二次判別分析(QDA)分類子、サポートベクターマシン(SVM)分類子、ランダムフォレスト(RF)分類子、線形カーネルサポートベクターマシン分類子、一次または二次多項式カーネルサポートベクターマシン分類子、リッジ回帰分類子、弾性ネットアルゴリズム分類子、逐次最小問題最適化アルゴリズム分類子、ナイーブベイズアルゴリズム分類子、および主成分分析分類子からなる群から選択される、請求項36記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063002878P | 2020-03-31 | 2020-03-31 | |
US63/002,878 | 2020-03-31 | ||
PCT/US2021/024604 WO2021202351A1 (en) | 2020-03-31 | 2021-03-29 | Methods and systems for detecting colorectal cancer via nucleic acid methylation analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023524627A true JP2023524627A (ja) | 2023-06-13 |
JPWO2021202351A5 JPWO2021202351A5 (ja) | 2024-04-02 |
Family
ID=77929568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022559477A Pending JP2023524627A (ja) | 2020-03-31 | 2021-03-29 | 核酸のメチル化分析による結腸直腸癌を検出するための方法およびシステム |
Country Status (8)
Country | Link |
---|---|
US (2) | US20230101485A1 (ja) |
EP (1) | EP4127215A1 (ja) |
JP (1) | JP2023524627A (ja) |
KR (1) | KR20230017169A (ja) |
CN (1) | CN115667554A (ja) |
AU (1) | AU2021245992A1 (ja) |
CA (1) | CA3178302A1 (ja) |
WO (1) | WO2021202351A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019060716A1 (en) | 2017-09-25 | 2019-03-28 | Freenome Holdings, Inc. | SAMPLE EXTRACTION METHODS AND SYSTEMS |
US11788152B2 (en) | 2022-01-28 | 2023-10-17 | Flagship Pioneering Innovations Vi, Llc | Multiple-tiered screening and second analysis |
WO2023164017A2 (en) * | 2022-02-22 | 2023-08-31 | Flagship Pioneering Innovations Vi, Llc | Intra-individual analysis for presence of health conditions |
WO2023225560A1 (en) | 2022-05-17 | 2023-11-23 | Guardant Health, Inc. | Methods for identifying druggable targets and treating cancer |
WO2024031097A2 (en) * | 2022-08-05 | 2024-02-08 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods for cancer screening |
CN115497561B (zh) * | 2022-09-01 | 2023-08-29 | 北京吉因加医学检验实验室有限公司 | 一种甲基化标志物分层筛选的方法及装置 |
WO2024056008A1 (zh) * | 2022-09-16 | 2024-03-21 | 江苏鹍远生物科技股份有限公司 | 鉴别癌症的甲基化标志物及应用 |
WO2024105132A1 (en) * | 2022-11-16 | 2024-05-23 | Universal Diagnostics, S.A. | Methods for stratification and early detection of advanced adenoma and/or colorectal cancer using dna methylation markers |
CN116298295B (zh) * | 2023-05-18 | 2023-09-01 | 上海秤信生物科技有限公司 | 用于结直肠癌早期检测的肿瘤自身抗原/抗体组合及应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8383338B2 (en) * | 2006-04-24 | 2013-02-26 | Roche Nimblegen, Inc. | Methods and systems for uniform enrichment of genomic regions |
WO2012174256A2 (en) * | 2011-06-17 | 2012-12-20 | The Regents Of The University Of Michigan | Dna methylation profiles in cancer |
EP4234721A3 (en) * | 2013-03-14 | 2023-10-18 | Mayo Foundation for Medical Education and Research | Detecting neoplasm |
EP3775198A4 (en) * | 2018-04-02 | 2022-01-05 | Grail, Inc. | METHYLATION MARKERS AND TARGETED METHYLATION PROBE PANELS |
JP7455757B2 (ja) * | 2018-04-13 | 2024-03-26 | フリーノーム・ホールディングス・インコーポレイテッド | 生体試料の多検体アッセイのための機械学習実装 |
-
2021
- 2021-03-29 CN CN202180039398.8A patent/CN115667554A/zh active Pending
- 2021-03-29 CA CA3178302A patent/CA3178302A1/en active Pending
- 2021-03-29 JP JP2022559477A patent/JP2023524627A/ja active Pending
- 2021-03-29 EP EP21780407.9A patent/EP4127215A1/en active Pending
- 2021-03-29 KR KR1020227037982A patent/KR20230017169A/ko unknown
- 2021-03-29 AU AU2021245992A patent/AU2021245992A1/en active Pending
- 2021-03-29 WO PCT/US2021/024604 patent/WO2021202351A1/en unknown
-
2022
- 2022-09-28 US US17/954,576 patent/US20230101485A1/en active Pending
-
2023
- 2023-02-01 US US18/163,138 patent/US20230220492A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3178302A1 (en) | 2021-10-07 |
US20230101485A1 (en) | 2023-03-30 |
KR20230017169A (ko) | 2023-02-03 |
AU2021245992A1 (en) | 2022-11-10 |
US20230220492A1 (en) | 2023-07-13 |
WO2021202351A1 (en) | 2021-10-07 |
EP4127215A1 (en) | 2023-02-08 |
CN115667554A (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210230684A1 (en) | Methods and systems for high-depth sequencing of methylated nucleic acid | |
US20230101485A1 (en) | Methods and systems for detecting colorectal cancer via nucleic acid methylation analysis | |
US20230178181A1 (en) | Methods and systems for detecting cancer via nucleic acid methylation analysis | |
US20230175058A1 (en) | Methods and systems for abnormality detection in the patterns of nucleic acids | |
US20230160019A1 (en) | Rna markers and methods for identifying colon cell proliferative disorders | |
US20210108274A1 (en) | Pancreatic ductal adenocarcinoma evaluation using cell-free dna hydroxymethylation profile | |
CN113574602A (zh) | 从循环无细胞核酸中灵敏地检测拷贝数变异(cnv) | |
JP2023540257A (ja) | がんを分類するためのサンプルの検証 | |
WO2023003851A1 (en) | Compositions and methods for improved 5-hydroxymethylated cytosine resolution in nucleic acid sequencing | |
US11746385B2 (en) | Methods of detecting tumor progression via analysis of cell-free nucleic acids | |
US20240055073A1 (en) | Sample contamination detection of contaminated fragments with cpg-snp contamination markers | |
WO2023183468A2 (en) | Tcr/bcr profiling for cell-free nucleic acid detection of cancer | |
WO2023250441A2 (en) | Methods and compositions of nucleic acid molecule enrichment for sequencing | |
WO2024077080A1 (en) | Systems and methods for multi-analyte detection of cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221129 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20230217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20230217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240321 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240321 |