CN114317736B - 用于泛癌种检测的甲基化标志物组合及其应用 - Google Patents
用于泛癌种检测的甲基化标志物组合及其应用 Download PDFInfo
- Publication number
- CN114317736B CN114317736B CN202110956754.4A CN202110956754A CN114317736B CN 114317736 B CN114317736 B CN 114317736B CN 202110956754 A CN202110956754 A CN 202110956754A CN 114317736 B CN114317736 B CN 114317736B
- Authority
- CN
- China
- Prior art keywords
- cancer
- methylation
- methylation marker
- detecting
- pan
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007069 methylation reaction Methods 0.000 title claims abstract description 139
- 230000011987 methylation Effects 0.000 title claims abstract description 136
- 239000003550 marker Substances 0.000 title claims abstract description 62
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 61
- 201000011510 cancer Diseases 0.000 title claims abstract description 44
- 238000001514 detection method Methods 0.000 title claims abstract description 30
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims abstract description 20
- 201000005202 lung cancer Diseases 0.000 claims abstract description 19
- 208000020816 lung neoplasm Diseases 0.000 claims abstract description 19
- 206010006187 Breast cancer Diseases 0.000 claims abstract description 18
- 208000026310 Breast neoplasm Diseases 0.000 claims abstract description 18
- 206010060862 Prostate cancer Diseases 0.000 claims abstract description 14
- 201000007270 liver cancer Diseases 0.000 claims abstract description 14
- 208000014018 liver neoplasm Diseases 0.000 claims abstract description 14
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims abstract description 13
- 206010005003 Bladder cancer Diseases 0.000 claims abstract description 12
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 claims abstract description 12
- 201000005112 urinary bladder cancer Diseases 0.000 claims abstract description 12
- 238000012216 screening Methods 0.000 claims abstract description 10
- 238000003745 diagnosis Methods 0.000 claims abstract description 8
- 239000003153 chemical reaction reagent Substances 0.000 claims description 23
- 238000002360 preparation method Methods 0.000 claims description 10
- 206010009944 Colon cancer Diseases 0.000 claims description 5
- 201000009030 Carcinoma Diseases 0.000 claims description 4
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 4
- 206010030155 Oesophageal carcinoma Diseases 0.000 claims description 4
- 208000024770 Thyroid neoplasm Diseases 0.000 claims description 4
- 206010017758 gastric cancer Diseases 0.000 claims description 4
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 4
- 201000002510 thyroid cancer Diseases 0.000 claims description 4
- 208000031261 Acute myeloid leukaemia Diseases 0.000 claims description 3
- 206010008342 Cervix carcinoma Diseases 0.000 claims description 3
- 208000030808 Clear cell renal carcinoma Diseases 0.000 claims description 3
- 206010014733 Endometrial cancer Diseases 0.000 claims description 3
- 206010014759 Endometrial neoplasm Diseases 0.000 claims description 3
- 208000000461 Esophageal Neoplasms Diseases 0.000 claims description 3
- 201000010915 Glioblastoma multiforme Diseases 0.000 claims description 3
- 206010027406 Mesothelioma Diseases 0.000 claims description 3
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 claims description 3
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 3
- 206010061332 Paraganglion neoplasm Diseases 0.000 claims description 3
- 206010039491 Sarcoma Diseases 0.000 claims description 3
- 208000000102 Squamous Cell Carcinoma of Head and Neck Diseases 0.000 claims description 3
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 3
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 claims description 3
- 201000005969 Uveal melanoma Diseases 0.000 claims description 3
- 208000026900 bile duct neoplasm Diseases 0.000 claims description 3
- 208000014581 breast ductal adenocarcinoma Diseases 0.000 claims description 3
- 201000003714 breast lobular carcinoma Diseases 0.000 claims description 3
- 201000010881 cervical cancer Diseases 0.000 claims description 3
- 206010073251 clear cell renal cell carcinoma Diseases 0.000 claims description 3
- 208000030381 cutaneous melanoma Diseases 0.000 claims description 3
- 201000004101 esophageal cancer Diseases 0.000 claims description 3
- 208000005017 glioblastoma Diseases 0.000 claims description 3
- 201000000459 head and neck squamous cell carcinoma Diseases 0.000 claims description 3
- 206010073096 invasive lobular breast carcinoma Diseases 0.000 claims description 3
- 208000030173 low grade glioma Diseases 0.000 claims description 3
- 201000005249 lung adenocarcinoma Diseases 0.000 claims description 3
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 3
- 201000010302 ovarian serous cystadenocarcinoma Diseases 0.000 claims description 3
- 201000002528 pancreatic cancer Diseases 0.000 claims description 3
- 208000007312 paraganglioma Diseases 0.000 claims description 3
- 208000028591 pheochromocytoma Diseases 0.000 claims description 3
- 201000003708 skin melanoma Diseases 0.000 claims description 3
- 201000011549 stomach cancer Diseases 0.000 claims description 3
- 206010044412 transitional cell carcinoma Diseases 0.000 claims description 3
- 208000037965 uterine sarcoma Diseases 0.000 claims description 3
- 208000006468 Adrenal Cortex Neoplasms Diseases 0.000 claims description 2
- 208000024313 Testicular Neoplasms Diseases 0.000 claims description 2
- 206010057644 Testis cancer Diseases 0.000 claims description 2
- 208000000728 Thymus Neoplasms Diseases 0.000 claims description 2
- 210000003734 kidney Anatomy 0.000 claims description 2
- 210000004072 lung Anatomy 0.000 claims description 2
- 206010041823 squamous cell carcinoma Diseases 0.000 claims description 2
- 201000003120 testicular cancer Diseases 0.000 claims description 2
- 201000009377 thymus cancer Diseases 0.000 claims description 2
- 201000001441 melanoma Diseases 0.000 claims 1
- 230000035945 sensitivity Effects 0.000 abstract description 9
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 210000001519 tissue Anatomy 0.000 description 45
- 108020004414 DNA Proteins 0.000 description 27
- 238000006243 chemical reaction Methods 0.000 description 24
- 239000000523 sample Substances 0.000 description 22
- 238000000034 method Methods 0.000 description 21
- 150000007523 nucleic acids Chemical class 0.000 description 20
- 108020004707 nucleic acids Proteins 0.000 description 19
- 102000039446 nucleic acids Human genes 0.000 description 19
- 238000012163 sequencing technique Methods 0.000 description 19
- 241000894007 species Species 0.000 description 18
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 14
- 125000003729 nucleotide group Chemical group 0.000 description 12
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 238000013145 classification model Methods 0.000 description 9
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 9
- 238000003766 bioinformatics method Methods 0.000 description 8
- 230000003321 amplification Effects 0.000 description 7
- 239000008280 blood Substances 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 238000007400 DNA extraction Methods 0.000 description 6
- 239000011324 bead Substances 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 230000007067 DNA methylation Effects 0.000 description 5
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 239000013615 primer Substances 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- 238000007622 bioinformatic analysis Methods 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 238000012165 high-throughput sequencing Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 239000011534 wash buffer Substances 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 3
- 208000005016 Intestinal Neoplasms Diseases 0.000 description 3
- 206010056342 Pulmonary mass Diseases 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 239000000090 biomarker Substances 0.000 description 3
- 238000007664 blowing Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 238000010828 elution Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 201000002313 intestinal cancer Diseases 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 125000000714 pyrimidinyl group Chemical group 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- 108091029430 CpG site Proteins 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 238000009004 PCR Kit Methods 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000003480 eluent Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 239000012188 paraffin wax Substances 0.000 description 2
- 238000010827 pathological analysis Methods 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 206010006272 Breast mass Diseases 0.000 description 1
- 208000017897 Carcinoma of esophagus Diseases 0.000 description 1
- 208000010667 Carcinoma of liver and intrahepatic biliary tract Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 206010073069 Hepatic cancer Diseases 0.000 description 1
- 101001134216 Homo sapiens Macrophage scavenger receptor types I and II Proteins 0.000 description 1
- 101000630267 Homo sapiens Probable glutamate-tRNA ligase, mitochondrial Proteins 0.000 description 1
- 102100034184 Macrophage scavenger receptor types I and II Human genes 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 102100026125 Probable glutamate-tRNA ligase, mitochondrial Human genes 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 101100024330 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MSB1 gene Proteins 0.000 description 1
- 201000009365 Thymic carcinoma Diseases 0.000 description 1
- 208000033781 Thyroid carcinoma Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 208000020990 adrenal cortex carcinoma Diseases 0.000 description 1
- 208000007128 adrenocortical carcinoma Diseases 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 208000011803 breast fibrocystic disease Diseases 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 208000019065 cervical carcinoma Diseases 0.000 description 1
- 239000012295 chemical reaction liquid Substances 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 201000010240 chromophobe renal cell carcinoma Diseases 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 201000010989 colorectal carcinoma Diseases 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical class O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 201000003914 endometrial carcinoma Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 201000005619 esophageal carcinoma Diseases 0.000 description 1
- 208000021045 exocrine pancreatic carcinoma Diseases 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 208000010749 gastric carcinoma Diseases 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 201000002250 liver carcinoma Diseases 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 201000005296 lung carcinoma Diseases 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012164 methylation sequencing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 201000001514 prostate carcinoma Diseases 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 201000000498 stomach carcinoma Diseases 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- CSABAZBYIWDIDE-UHFFFAOYSA-N sulfino hydrogen sulfite Chemical compound OS(=O)OS(O)=O CSABAZBYIWDIDE-UHFFFAOYSA-N 0.000 description 1
- WQDSRJBTLILEEK-UHFFFAOYSA-N sulfurous acid Chemical compound OS(O)=O.OS(O)=O WQDSRJBTLILEEK-UHFFFAOYSA-N 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 208000013077 thyroid gland carcinoma Diseases 0.000 description 1
- 238000007039 two-step reaction Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 208000023747 urothelial carcinoma Diseases 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及一种用于泛癌种诊断、检测或筛查的甲基化标志物组合和应用,该标志物组合可以用于检测肺癌、乳腺癌、肝癌、前列腺癌、膀胱癌等33种癌的标记物。本发明提供的标志物在癌症检测中同时具有很高的敏感性和特异性,适用于肿瘤的无创筛查、辅助诊断以及复发监测等。
Description
技术领域
本发明属于生物技术领域,具体涉及用于泛癌种检测的甲基化标志物及其组合和应用。
背景技术
众所周知,癌症已成为威胁人类健康的头号杀手。据世卫组织国际癌症研究机构,2020年中国新发癌症人数全球最多,约457万人,其中新发病例数前十的是:肺癌、结直肠癌、胃癌、乳腺癌、肝癌、食管癌、甲状腺癌、胰腺癌、前列腺癌和宫颈癌。世界卫生组织提出,近一半的癌症是可以预防的。三分之一的癌症可以通过癌症筛查及早发现、明确诊断。
DNA甲基化在调节基因表达中起重要作用。DNA甲基化的异常改变与很多疾病的发生和维持有着紧密联系。大量研究表明DNA甲基化在癌症的诱发和维持中起着重要作用,使之成为泛癌种检测的很好的生物标志物。
发明内容
本发明的目的之一是提供泛癌种之一的肺癌的甲基化标志物组合。
一种用于检测肺癌的甲基化标志物组合,该组合包括以下标记物:cg08089301,cg13795264,cg14458834,cg26327071,cg25832771,cg21901718,cg07438617,cg21546671,cg04167903,cg02978421,cg17839237,cg25365565,cg03257575,cg26049726,cg19081437,cg25092681,cg26744375,cg17003293,cg08869573,和cg00466108。
本发明的目的之二是提供泛癌种之一的乳腺癌的甲基化标志物组合。
一种用于检测乳腺癌的甲基化标志物组合,该组合包括以下标记物:cg01016662,cg01313313,cg11267829,cg17652435,cg23855505,cg09695735,cg03562044,cg17093995,cg02435495,cg25832771,cg11856078,cg08382226,cg02474799,cg03257575,cg22260952。
本发明的目的之三是提供泛癌种之一的乳腺癌的甲基化标志物组合。
一种用于检测肝癌的甲基化标志物组合,该组合包括以下标记物:cg18233405,cg14263942,cg14570307,cg11176990,cg03757145,cg03468349,cg20353496,cg21825027,cg14251622,cg04148762。
本发明的目的之四是提供泛癌种之一的乳腺癌的甲基化标志物组合。
一种用于检测前列腺癌的甲基化标志物组合,该组合包括以下标记物:cg23855505,cg17498803,cg16232979,cg26149167,cg17355294,cg22260952,cg05402599,cg14210694,cg15233183,cg23095615。
本发明的目的之五是提供泛癌种之一的乳腺癌的甲基化标志物组合。
一种用于检测膀胱癌的甲基化标志物组合,该组合包括以下标记物:cg26970841,cg21901718,cg25160978,cg03978375,cg08382226,cg25927164,cg25832771,cg14665813,cg15906409,cg01556502。
本发明的目的之六是提供泛癌种之一的乳腺癌的甲基化标志物组合。
一种用于泛癌种诊断、检测或筛查的甲基化标志物组合,包括上述用于肺癌检测的甲基化标志物组合和选自目的2至5中的至少一种所述的甲基化标志物组合。
在其中一些实施例中,用于泛癌种诊断、检测或筛查的甲基化标志物组合包括全部上述的甲基化标志物组合。
在其中一些实施例中,用于泛癌种诊断、检测或筛查的甲基化标志物组合包括本发明的说明书中表1的全部甲基化标志物。
本发明的目的之七是提供上述甲基化标志物组合的应用,包括以下技术方案。
检测上述甲基化标志物组合(cg08089301,cg13795264,cg14458834,cg26327071,cg25832771,cg21901718,cg07438617,cg21546671,cg04167903,cg02978421,cg17839237,cg25365565,cg03257575,cg26049726,cg19081437,cg25092681,cg26744375,cg17003293,cg08869573,和cg00466108)的甲基化水平的试剂在制备肺癌检测试剂盒中的应用。
检测上述甲基化标志物组合(cg01016662,cg01313313,cg11267829,cg17652435,cg23855505,cg09695735,cg03562044,cg17093995,cg02435495,cg25832771,cg11856078,cg08382226,cg02474799,cg03257575,cg22260952)的甲基化水平的试剂在制备乳腺癌检测试剂盒中的应用。
检测上述甲基化标志物组合(cg18233405,cg14263942,cg14570307,cg11176990,cg03757145,cg03468349,cg20353496,cg21825027,cg14251622,cg04148762)的甲基化水平的试剂在制备肝癌癌检测试剂盒中的应用。
检测上所述甲基化标志物组合(cg23855505,cg17498803,cg16232979,cg26149167,cg17355294,cg22260952,cg05402599,cg14210694,cg15233183,cg23095615)的甲基化水平的试剂在制备前列腺癌检测试剂盒中的应用。
检测上述甲基化标志物组合(cg26970841,cg21901718,cg25160978,cg03978375,cg08382226,cg25927164,cg25832771,cg14665813,cg15906409,cg01556502)的甲基化水平的试剂在制备膀胱癌检测试剂盒中的应用。
检测上述甲基化标志物组合的甲基化水平的试剂在制备泛癌检测试剂盒中的应用。
本发明的目的之八是提供检测泛癌种的试剂盒,包括以下技术方案。
一种检测肺癌的试剂盒,包括检测上述肺癌所述甲基化标志物组合(cg08089301,cg13795264,cg14458834,cg26327071,cg25832771,cg21901718,cg07438617,cg21546671,cg04167903,cg02978421,cg17839237,cg25365565,cg03257575,cg26049726,cg19081437,cg25092681,cg26744375,cg17003293,cg08869573,和cg00466108)的甲基化水平的试剂。
一种检测乳腺癌的试剂盒,包括检测上述甲基化标志物组合(cg01016662,cg01313313,cg11267829,cg17652435,cg23855505,cg09695735,cg03562044,cg17093995,cg02435495,cg25832771,cg11856078,cg08382226,cg02474799,cg03257575,cg22260952)的甲基化水平的试剂。
一种检测肝癌的试剂盒,包括有检测所述甲基化标志物组合(cg18233405,cg14263942,cg14570307,cg11176990,cg03757145,cg03468349,cg20353496,cg21825027,cg14251622,cg04148762)的甲基化水平的试剂。
一种检测前列腺癌的试剂盒,包括有检测所述甲基化标志物组合(cg23855505,cg17498803,cg16232979,cg26149167,cg17355294,cg22260952,cg05402599,cg14210694,cg15233183,cg23095615)的甲基化水平的试剂。
一种检测膀胱癌的试剂盒,包括有所述甲基化标志物组合(cg26970841,cg21901718,cg25160978,cg03978375,cg08382226,cg25927164,cg25832771,cg14665813,cg15906409,cg01556502)的甲基化水平的试剂。
一种检测泛癌种的试剂盒,包括有上述任一所述甲基化标志物组合的甲基化水平的试剂。
在其中一些实施例中,所述泛癌种包括肺癌、乳腺癌、肝癌、膀胱癌、急性粒细胞白血病、肾上腺皮质癌、膀胱尿路上皮癌、乳腺导管癌、乳腺小叶癌、子宫颈癌、胆管癌、结直肠癌、食道癌、胃癌、多形性胶质母细胞瘤、头颈鳞状细胞癌、肝癌、肾嫌色细胞癌、肾透明细胞癌、肾乳头状细胞癌、低级别胶质瘤、间皮瘤、肺腺癌、肺鳞癌、卵巢浆液性囊腺癌、胰腺癌、嗜铬细胞瘤和副神经节瘤、前列腺癌、肉瘤、皮肤黑色素瘤、睾丸癌、胸腺癌、甲状腺癌、子宫肉瘤、子宫内膜癌、葡萄膜黑色素瘤。
本发明的目的之八是提供一种泛癌种的检测方法。
一种泛癌种的检测方法,包括以下步骤:
提取将待测的生物样品基因组DNA和/或游离DNA;
对所述DNA进行亚硫酸氢盐转化;
对所述经过亚硫酸氢盐转化的DNA进行如上述所述DNA甲基化标记物组合的共甲基化检测。
在其中一些实施例中,所述生物样品为血液、粪便、组织、尿液或其它可提取DNA的生物样本,例如肿瘤组织、痰液、脑脊液。
本发明提供的上万个甲基化标志物及其组合能够检测33种癌症:急性粒细胞白血病、肾上腺皮质癌、膀胱尿路上皮癌、乳腺导管癌、乳腺小叶癌、子宫颈癌、胆管癌、结直肠癌、食道癌、胃癌、多形性胶质母细胞瘤、头颈鳞状细胞癌、肝癌、肾嫌色细胞癌、肾透明细胞癌、肾乳头状细胞癌、低级别胶质瘤、间皮瘤、肺腺癌、肺鳞癌、卵巢浆液性囊腺癌、胰腺癌、嗜铬细胞瘤和副神经节瘤、前列腺癌、肉瘤、皮肤黑色素瘤、睾丸癌、胸腺癌、甲状腺癌、子宫肉瘤、子宫内膜癌、葡萄膜黑色素瘤。本发明提供的标志物在癌症检测中同时具有很高的敏感性和特异性,适用于肿瘤的无创筛查、辅助诊断以及复发监测等。
附图说明
图1以本发明实施例1中所述的上万个甲基化标志物构建的诊断模型在区分肠癌组织样本和正常癌旁组织样本中的ROC曲线。
图2以本发明实施例2中所述的20个肺癌特异的甲基化标志物构建的诊断模型在区分肺癌组织样本和良性肺结节样本中的ROC曲线。
图3以本发明实施例3中所述的15个乳腺癌特异的甲基化标志物构建的诊断模型在区分乳腺癌组织样本和良性乳腺结节样本中的ROC曲线。
图4以本发明实施例4中所述的10个肝癌特异的甲基化标志物构建的诊断模型在区分肝癌组织样本和癌旁正常组织样本中的ROC曲线。
图5以本发明实施例5中所述的10个前列腺癌特异的甲基化标志物构建的诊断模型在区分前列腺癌组织样本和癌旁正常组织样本中的ROC曲线
图6以本发明实施例6中所述的10个膀胱癌特异的甲基化标志物构建的诊断模型在区分膀胱癌组织样本和癌旁正常组织样本中的ROC曲线。
具体实施方式
为了便于理解本发明,下面将对本发明进行更全面的描述。本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明公开内容的理解更加透彻全面。
下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。实施例中所用到的各种常用化学试剂,均为市售产品。
除非另有定义,本发明所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不用于限制本发明。本发明所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
定义为了便于理解本技术,下面定义了一些术语和短语。
术语“互补”和“互补性”是指与碱基配对规则相关的核苷酸(例如,1个核苷酸)或多核苷酸(例如核苷酸的序列)。例如,序列5′-A-G-T-3′与序列3′-T-C-A-5′互补。互补可以是“部分的”,其中仅一些核酸碱基根据碱基配对规则进行匹配。或者,核酸之间可能存在“完全”或“总”互补。核酸链之间的互补程度影响核酸链之间杂交的效率和强度。这在扩增反应和依赖核酸之间的结合的检测方法中尤其重要。
术语“聚合酶链式反应”用于扩增靶序列,该方法由以下步骤组成:将大量过量的两种寡核苷酸引物引入到含有期望靶序列的DNA混合物中,随后在DNA聚合酶存在下进行精确的热循环顺序。两种引物与双链靶序列的相应链互补。为了进行扩增,将混合物变性,然后引物与靶分子内的其互补序列退火。退火后,用聚合酶扩增引物,形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可以重复多次(即,变性、退火和延伸构成一个“循环”;可以有许多“循环”)以获得高浓度的期望靶序列的扩增片段。期望靶序列的扩增片段的长度由引物相对于彼此的相对位置确定,因此该长度是可控参数。由于该方法的重复方面,该方法被称为“聚合酶链式反应”(“PCR”)。由于靶序列的期望扩增片段成为混合物中的主要序列(以浓度计),所以称其被“PCR扩增”,是“PCR产物”或“扩增子”。
如本发明所用,术语“核酸检测”是指确定目标核酸的核苷酸组成的任何方法。核酸检测测定包括但不限于DNA测序方法、探针杂交方法。
术语“可扩增核酸”是指可以通过任何扩增方法扩增的核酸。预期“可扩增核酸”通常将包含“样品模板”。
术语“样品模板”是指来源于样品的用于分析“靶”(下文定义)的存在的核酸。相比之下,“背景模板”用于指样品模板以外的核酸,其可能存在或可能不存在于样品中。背景模板通常是无意的。这可能是遗留的结果,或者可能是由于试图从样品中纯化走的核酸污染物的存在。例如,来自生物体的待检测核酸以外的核酸可以作为测试样品的背景存在。
如本文所用,“甲基化”是指胞嘧啶位置C5或N4的胞嘧啶甲基化,腺嘌呤的N6位点或其他类型的核酸甲基化。体外扩增的DNA通常是未甲基化的,因为通常体外DNA扩增方法不能保留扩增模板的甲基化模式。然而,“未甲基化DNA”或“甲基化DNA”也可以分别指原始模板未甲基化或甲基化的扩增DNA。
因此,如本文所用,“甲基化核苷酸”或“甲基化核苷酸碱基”是指在核苷酸碱基上存在甲基部分,其中甲基部分不存在于公认的典型核苷酸碱基中。例如,胞嘧啶在其嘧啶环上不包含甲基部分,但是5-甲基胞嘧啶在其嘧啶环的5位包含甲基部分。因此,胞嘧啶不是甲基化核苷酸,5-甲基胞嘧啶是甲基化核苷酸。在另一个实例中,胸腺嘧啶在其嘧啶环的5位含有甲基部分;然而,为了本文的目的,当存在于DNA中时不认为胸腺嘧啶是甲基化核苷酸,因为胸腺嘧啶是DNA的典型核苷酸碱基。
甲基化状态可任选地由“甲基化值”表示或指示(例如,表示甲基化频率、分数、比例、百分比等)。甲基化值可以例如在用甲基化依赖性限制酶限制性消化之后定量存在的完整核酸的量,或者通过比较亚硫酸氢盐反应后的扩增谱,或者通过比较亚硫酸氢盐处理和未处理的核酸的序列来产生。因此,诸如甲基化值的值代表甲基化状态,因此可用作基因座的多个拷贝中甲基化状态的定量指标。共甲基化程度由多于一个甲基化位点的甲基化状态表示或指示,在一段甲基化区域内,当多于一个甲基化位点的甲基化状态均为甲基化时定义为共甲基化。
如本文所用,术语“亚硫酸氢盐试剂”是指在一些实施方案中包含亚硫酸氢盐(bisulfite)、亚硫酸氢盐(disulfite)、亚硫酸氢盐(hydrogen sulfite)或其组合的试剂,经过亚硫酸氢盐试剂处理的DNA,其未经过甲基化的胞嘧啶核苷酸将转化为尿嘧啶,而甲基化的胞嘧啶及其他碱基维持不变,因此可以区分例如CpG二核苷酸序列中的甲基化和未甲基化胞苷。
术语“甲基化测定”或“甲基化水平检测”是指用于确定核酸序列内的一个或多个CpG二核苷酸序列的甲基化状态的任何测定。
泛癌(pan-cancer)就是多种癌症的简称。在本发明中具体指在不同肿瘤类型中发现的甲基化标志物的相似性和差异性。
本发明所涉及到的生物标志物,具体见表1。
表1:本发明所述泛癌检测的甲基化生物标志物
本发明一些实施例中,还涉及了一种用于泛癌种检测的甲基化标志物及其组合,通过提取生物样本(包括但不限于肿瘤组织、血清、血浆、尿液、痰液、粪便、脑脊液)中的DNA,然后进行文库制备,接着对测序文库利用Illumina的Hiseq X ten进行高通量测序从而一次检测上万个甲基化标志物,并通过机器学习算法构建分类模型,实现癌症患者和非癌症个体(良性疾病患者或者健康对照)的准确分类。
本发明的实施例中,检测标志物甲基化水平的方法包括如下步骤:
步骤1DNA的亚硫酸盐转化
1.取10ng DNA至200μL low bind PCR管中,DNA体积不足20μL则加EB补足;
2.加入130μL Lightning Conversion Reagent(闪电转换试剂),涡流充分混匀,离心10秒;
3.将移液器调至75μL,混匀液体10次,转移75μL混合液至新的200μL lowbind PCR管中,将两个PCR管一起进行PCR反应;
4.PCR程序:98℃8min→54℃60min→4℃ Hold(Hold<20h),热盖105℃,体积75μL;
5.将Zymo-SpinTMIC Column(柱)放入收集管中,再加入600μL的M-BindingBuffer到Zymo-SpinTMIC Column中;
6.从PCR仪中取出反应后的PCR管并简单离心30s,加入150μL反应后的样品到Zymo-SpinTMIC Column中;
7.压紧收集管和Column并上下颠倒混匀至少12次,于12000g离心30s;
8.用1mL移液枪将下面收集管中的液体重新加入Zymo-SpinTMIC Column中
9. 12000g离心30s,弃下清,并于擦镜纸上拍干收集管;
10.加入100μL M-Wash Buffer到Zymo-SpinTMIC Column中,于12000g离心30s;
11.重复步骤10一次;
12.加入200μL L-Desulphonation Buffer(缓冲液)到Zymo-SpinTMIC Column中,室温静置孵育17min;
13.准备相应数量1.5ml离心管(非low bind)及并剪去管盖,1.5ml low bind离心管写好编号;
14.孵育结束后,于12000g离心30s;
15.加入200μLM-Wash Buffer到Zymo-SpinTMIC Column中,于12000g离心30s;
16.加入150μL M-Wash Buffer到Zymo-SpinTMIC Column中,于12000g离心30s,弃收集管;
17.将Zymo-SpinTMIC Column放入已剪盖的新的1.5ml离心管中,于12000g空甩离心1min;
18.观察柱子内是否还有残留的M-wash Buffer,若有液滴残留则用2.5μL细长枪头将液滴摊开,并开盖晾干至Column无残留液滴;
19.Zymo-SpinTMIC Column放入已做好标记的新1.5ml low bind(LoBind)离心管;
20.小心向Column中间白色柱体滤膜上加入10μL已经加热到47℃的M-ElutionBuffer,放于47℃孵育5min,于12000g离心1min;
21.重复步骤20一次,2次离心得到的洗脱液即为转化后的DNA;
22.量取17ul洗脱液进行后续实验。
步骤2DNA测序文库构建
在完成了DNA样本的亚硫酸氢盐转化处理后,我们利用AnchorDx EpiVisioTMMethylation Library Prep Kit、AnchorDx EpiVisioTM Indexing PCR Kit、AgencourtAMPure XP Magnetic Beads,经过3’端适配体连接反向互补(adaptor ligation ofreverse DNA)和indexing PCR两步反应进行了靶向DNA甲基化测序文库构建。该过程又可以分为如下几个子步骤:
1.末端修复
1.1.将转化后的17ul样本加入以下试剂进行反应:
1.2置于PCR仪中按照以下程序进行反应:
温度 | 时间 |
37℃ | 30min |
95℃ | 5min |
热盖 | 105℃ |
1.3当PCR反应第二步(95℃)达到5min时,立即将样本从PCR仪中取出,直接插入冰中,放置2min以上再进行下一步操作。
2.连接I
2.1配制如下反应液
2.2置于PCR仪中按照以下程序进行反应:
温度 | 时间 |
37℃ | 30min |
95℃ | 5min |
10℃ | hold |
热盖 | 105℃ |
3.扩增I
3.1配制如下反应液
3.2置于PCR仪中按照以下程序进行反应:
3.3纯化I:加入166ul 1:6倍稀释的Agencourt AMPure Beads(需提前于室温平衡半小时)的对Amplification I反应后的产物进行纯化,用21ul EB进行洗脱,纯化具体步骤如下:
a.取上一步反应产物并进行离心,每个样本加入166ul(1:6倍稀释AgencourtAMPure Beads,用移液器吹打混匀。
b.室温孵育5min。
c.瞬离,置于磁力架上静置5min,待液体澄清后,吸弃上清
d.加入200ul 80%无水乙醇,静置30s,吸走乙醇。
e.重复步骤d)一次。
f.瞬离,将PCR管置于磁力架上,吸走剩余乙醇。
g.开盖干燥磁珠2-3min,注意不要过干。
h.加入21ul EB进行洗脱,用移液器充分吹打混匀,室温静置3min。
I.瞬离,将PCR管置于磁力架上,静置3min。
J.吸取20ul上清于新的200ul PCR管中。
4.连接II
4.1配制如下反应液:
组分 | 体积(ul) |
上一步反应体积 | 20 |
H<sub>2</sub>O | 4 |
MSB1 Buffer | 8 |
MSR1 Reagent | 2 |
MSR5 Reagent | 2 |
MSE1 Enzyme | 2 |
MSE5 Enzyme | 2 |
总体积 | 40 |
4.2置于PCR仪中按照以下程序进行反应
温度 | 时间 | 循环数 |
37℃ | 30min | 1 |
95℃ | 5min | 1 |
10℃ | Hold | 1 |
5.Indexing PCR:
5.1配制如下反应液:
5.2置于PCR仪中按照以下程序进行反应
5.3纯化II
加入Agencourt AMPure Beads(需提前于室温平衡半小时)对Indexing PCR反应后的产物进行纯化,用41ul EB进行洗脱,纯化具体步骤如下:
a.取上一步反应产物并进行离心,每个样本加入71ul Agencourt AMPure Beads,用移液器吹打混匀。
b.室温孵育5min。
c.瞬离,置于磁力架上静置5min,待液体澄清后,吸弃上清
d.加入200ul 80%无水乙醇,静置30s,吸走乙醇。
e.重复步骤d)一次。
f.瞬离,将PCR管置于磁力架上,吸走剩余乙醇。
g.开盖干燥磁珠2-3min,注意不要过干。
h.加入55ul EB进行洗脱,用移液器充分吹打混匀,室温静置3min。
I.瞬离,将PCR管置于磁力架上,静置3min。
J.吸取54ul上清于新的1.5mL离心管中。
L.Qubit定量:
取2ul用Qubit dsDNA BR Assay Kit对文库进行定量。
步骤3 DNA测序文库的高通量测序
我们通过Illumina HiSeq X Ten Sequencing System,采用150bp双端测序,上机数据量为60M,对杂交捕获的DNA测序文库进行高通量测序。
步骤4高通量测序数据的生物信息学分析
测序数据的生物信息学分析主要包含如下几个步骤:
1.测序数据的预处理
原始的测序数据首先用fastp软件去除低质量碱基以及测序接头序列以得到可以用于比对的高质量测序数据。
2.将经过预处理的测序数据比对至人类基因组参考序列
经过预处理的测序数据利用Bismark软件比对至人类基因组参考序列(UCSC hg19版本)。
3.上万个甲基化标志物的甲基化水平测定
利用Bismark软件计算甲基化标志物面板(methylation marker panel)的上万个甲基化标志物的甲基化水平。
4.基于上万个甲基化标志物及其各种组合的甲基化水平构建可以区分癌症样本和非癌症样本的分类模型用一组癌症样本和一组非癌症样本(比如良性病变样本或者正常对照样本)基于上万个甲基化标志物或其各种组合构建可以准确诊断各类癌症的分类模型。
5.分类模型的性能评估
用另外一组完全独立的癌症样本和非癌症样本对分类模型进行诊断性能评估。我们拟计算受试者操作特征曲线下面积,并利用youden指数作为阈值,计算敏感性和特异性。
本发明涉及的用于泛癌种检测的上万个甲基化标志物及其基因组位置(参考UCSChg19基因组坐标)信息见表1。
以下通过具体实施例对本申请做进一步的阐述,但不用于限制本发明的保护范围。
实施例1
本实施例以70例结肠癌组织和91例癌旁组织为检测对象(剔除了肿瘤纯度小于10%的癌组织样本),采用Qiagen的DNA提取试剂盒(Qiagen DNeasy Blood&Tissue Kit)提取-80摄氏度冰箱中保存的新鲜冰冻结直肠癌病人肿瘤组织和癌旁正常组织的DNA,具体步骤参考产品说明书。然后参考发明内容中所描述的实验步骤及生物信息分析方法对待测样本进行本发明所述表1中的所有甲基化标志物的甲基化水平测定。之后,随机选取60%的样本作为训练集,用支持向量机构建分类模型,并在剩余40%的样本中进行预测,评估分类模型性能。ROC曲线如图1所示,AUC为0.997,以youden index作为阈值,得到模型的敏感性为96.4%,特异性为100%,准确性为98.5%。表明本发明的甲基化标志物能够准确区分肠癌样本和正常癌旁样本。
实施例2
我们选取了123例肺癌组织样本和294例良性肺结节组织样本,采用Qiagen的DNA提取试剂盒(Qiagen DNeasy Blood&Tissue Kit)提取福尔马林固定石蜡包埋(FFPE)组织样本的DNA,具体步骤参考产品说明书。然后用亚硫酸盐进行转化,通过两步连接反应构建测序文库,之后参考本发明所描述的实验步骤及生物信息分析方法对待测样本进行本发明表1中的所有甲基化标志物的甲基化水平测定。测序数据经过生物信息学分析之后,我们提取了肺癌特异的20个甲基化标志物组合(cg08089301,cg13795264,cg14458834,cg26327071,cg25832771,cg21901718,cg07438617,cg21546671,cg04167903,cg02978421,cg17839237,cg25365565,cg03257575,cg26049726,cg19081437,cg25092681,cg26744375,cg17003293,cg08869573,cg00466108)的甲基化水平测定值。之后,我们随机选取60%的样本作为训练集,用支持向量机构建分类模型,然后在剩余40%的样本中进行模型评估。ROC曲线如图2所示,AUC为0.93,以youden index作为阈值,得到模型的敏感性为84%,特异性为96%,准确性为92%。表明本发明的甲基化标志物能够准确区分肺癌组织样本和良性肺结节组织样本。
实施例3
本实施例选取了224例经手术切除组织病理确认为乳腺癌的组织样本和33例病理确认为良性的组织样本,采用Qiagen的DNA提取试剂盒(Qiagen DNeasy Blood&TissueKit)提取福尔马林固定石蜡包埋(FFPE)组织样本的DNA,具体步骤参考产品说明书。然后用亚硫酸盐进行转化,通过两步连接反应构建测序文库,之后参考本发明所描述的实验步骤及生物信息分析方法对待测样本进行本发明表1中的所有甲基化标志物的甲基化水平测定测序数据经过生物信息学分析之后,我们提取了乳腺癌特异的15个甲基化标志物(cg01016662,cg01313313,cg11267829,cg17652435,cg23855505,cg09695735,cg03562044,cg17093995,cg02435495,cg25832771,cg11856078,cg08382226,cg02474799,cg03257575,cg22260952)的甲基化水平测定值。之后,我们随机选取50%的样本作为训练集,用随机森林算法构建分类模型,然后在剩余50%的样本中进行模型性能评估。ROC曲线如图3所示,AUC为0.95,以youden index作为阈值,得到模型的敏感性为79.5%,特异性为100%,准确性为82%。表明本发明的甲基化标志物能够准确区分乳腺癌组织样本和良性乳腺疾病组织样本。
实施例4
本实施例选取了50例病理确诊为肝癌的组织样本和50例癌旁的正常组织样本,采用Qiagen的DNA提取试剂盒(Qiagen DNeasy Blood&Tissue Kit)提取福尔马林固定石蜡包埋(FFPE)组织样本的DNA,具体步骤参考产品说明书。然后用亚硫酸盐进行转化,通过两步连接反应构建测序文库,之后参考本发明所描述的实验步骤及生物信息分析方法对待测样本进行本发明表1中的所有甲基化标志物的甲基化水平测定测序数据经过生物信息学分析之后,我们提取了肝癌特异的10个甲基化标志物(cg18233405,cg14263942,cg14570307,cg11176990,cg03757145,cg03468349,cg20353496,cg21825027,cg14251622,cg04148762)的甲基化水平测定值。之后,我们采用逻辑回归算法,通过5折交叉验证进行模型的性能评估。ROC曲线如图4所示,AUC为0.998,以youden index作为阈值,得到模型的敏感性为98%,特异性为100%,准确性为99%。表明本发明的甲基化标志物能够准确区分肝癌样本和癌旁正常肝组织样本。
实施例5
本实施例选取了50例前列腺癌的组织样本和50例配对的癌旁正常组织样本,采用Qiagen的DNA提取试剂盒(Qiagen DNeasy Blood&Tissue Kit)提取福尔马林固定石蜡包埋(FFPE)组织样本的DNA,具体步骤参考产品说明书。然后用亚硫酸盐进行转化,通过两步连接反应构建测序文库,之后参考发明内容中所描述的实验步骤及生物信息分析方法对待测样本进行表1中的所有甲基化标志物的甲基化水平测定测序数据经过生物信息学分析之后,我们提取了前列腺癌特异的10个甲基化标志物(cg23855505,cg17498803,cg16232979,cg26149167,cg17355294,cg22260952,cg05402599,cg14210694,cg15233183,cg23095615)的甲基化水平测定值。之后,我们采用逻辑回归算法,通过5折交叉验证进行模型的性能评估。ROC曲线如图5所示,AUC为0.94,以youden index作为阈值,得到模型的敏感性为92%,特异性为96%,准确性为94%。表明本发明的甲基化标志物能够准确区分前列腺癌样本和癌旁正常前列腺组织样本。
实施例6
本实施例选取了21例病理确诊为膀胱癌的组织样本和21例癌旁的正常组织样本,采用Qiagen的DNA提取试剂盒(Qiagen DNeasy Blood&Tissue Kit)提取福尔马林固定石蜡包埋(FFPE)组织样本的DNA,具体步骤参考产品说明书。然后用亚硫酸盐进行转化,通过两步连接反应构建测序文库,之后参考本发明所描述的实验步骤及生物信息分析方法对待测样本进行本发明表1中的所有甲基化标志物的甲基化水平测定测序数据经过生物信息学分析之后,我们提取了膀胱癌特异的10个甲基化标志物(cg26970841,cg21901718,cg25160978,cg03978375,cg08382226,cg25927164,cg25832771,cg14665813,cg15906409,cg01556502)的甲基化水平测定值。之后,我们采用逻辑回归算法,通过5折交叉验证进行模型的性能评估。ROC曲线如图6所示,AUC为0.995,以youden index作为阈值,得到模型的敏感性为95.2%,特异性为100%,准确性为97.6%。表明本发明的甲基化标志物能够准确区分膀胱癌样本和癌旁正常组织样本。
尽管本发明的实施方案仅列举了本发明的甲基化标志物可以准确诊断常见的一些癌症,包括肠癌、肺癌、乳腺癌、肝癌、前列癌、膀胱癌。正如在发明内容中所述,本发明的甲基化标志物及其组合可以诊断发明内容所述的33种癌症。进一步地,本发明并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种用于检测肺癌的甲基化标志物组合,其特征在于,该组合包括以下标记物:cg08089301, cg13795264, cg14458834, cg26327071, cg25832771, cg21901718,cg07438617, cg21546671, cg04167903, cg02978421, cg17839237, cg25365565,cg03257575, cg26049726, cg19081437, cg25092681, cg26744375, cg17003293,cg08869573,和 cg00466108。
2.一种用于泛癌种诊断、检测或筛查的甲基化标志物组合,其特征在于,包括权利要求1所述的甲基化标志物组合和选自以下4组甲基化标志物组合中的至少一组:
cg01016662, cg01313313, cg11267829, cg17652435, cg23855505, cg09695735,cg03562044, cg17093995, cg02435495, cg25832771, cg11856078, cg08382226,cg02474799, cg03257575, 和cg22260952;
cg18233405, cg14263942, cg14570307, cg11176990, cg03757145, cg03468349,cg20353496, cg21825027, cg14251622, 和cg04148762;
cg23855505, cg17498803, cg16232979, cg26149167, cg17355294, cg22260952,cg05402599, cg14210694,cg15233183, 和cg23095615;
cg26970841, cg21901718, cg25160978, cg03978375, cg08382226, cg25927164,cg25832771, cg14665813, cg15906409, 合cg01556502。
3.根据权利要求2所述的用于泛癌种诊断、检测或筛查的甲基化标志物组合,其特征在于,包括4组甲基化标志物组合中全部所述的甲基化标志物组合。
4.根据权利要求3所述的用于泛癌种诊断、检测或筛查的甲基化标志物组合,其特征在于,包括说明书中表1的全部甲基化标志物。
5.检测权利要求1所述甲基化标志物组合的甲基化水平的试剂在制备肺癌检测试剂盒中的应用。
6.检测权利要求2-4任一项所述甲基化标志物组合的甲基化水平的试剂在制备泛癌检测试剂盒中的应用。
7.一种检测肺癌的试剂盒,其特征在于,包括检测权利要求1所述甲基化标志物组合的甲基化水平的试剂。
8.一种检测泛癌种的试剂盒,其特征在于,包括检测权利要求2-4任一项所述甲基化标志物组合的甲基化水平的试剂。
9.根据权利要求8所述的试剂盒,其特征在于,所述泛癌种包括肺癌、乳腺癌、肝癌、膀胱癌、急性粒细胞白血病、肾上腺皮质癌、膀胱尿路上皮癌、乳腺导管癌、乳腺小叶癌、子宫颈癌、胆管癌、结直肠癌、食道癌、胃癌、多形性胶质母细胞瘤、头颈鳞状细胞癌、肾嫌色细胞癌、肾透明细胞癌、肾乳头状细胞癌、低级别胶质瘤、间皮瘤、肺腺癌、肺鳞癌、卵巢浆液性囊腺癌、胰腺癌、嗜铬细胞瘤和副神经节瘤、前列腺癌、肉瘤、皮肤黑色素瘤、睾丸癌、胸腺癌、甲状腺癌、子宫肉瘤、子宫内膜癌、葡萄膜黑色素瘤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110956754.4A CN114317736B (zh) | 2021-08-19 | 2021-08-19 | 用于泛癌种检测的甲基化标志物组合及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110956754.4A CN114317736B (zh) | 2021-08-19 | 2021-08-19 | 用于泛癌种检测的甲基化标志物组合及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114317736A CN114317736A (zh) | 2022-04-12 |
CN114317736B true CN114317736B (zh) | 2022-09-13 |
Family
ID=81044909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110956754.4A Active CN114317736B (zh) | 2021-08-19 | 2021-08-19 | 用于泛癌种检测的甲基化标志物组合及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114317736B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW202403054A (zh) * | 2022-07-04 | 2024-01-16 | 大陸商江蘇鵾遠生物科技股份有限公司 | 癌症特異性甲基化標誌物及其應用 |
CN116287266A (zh) * | 2023-03-07 | 2023-06-23 | 江苏先声医学诊断有限公司 | Dna复制晚期区域在泛癌种诊断中的应用 |
CN117165689A (zh) * | 2023-10-26 | 2023-12-05 | 深圳市睿法生物科技有限公司 | 一种用于泛实体瘤早期筛查的甲基化标志物及其应用 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018009709A1 (en) * | 2016-07-06 | 2018-01-11 | Youhealth Biotech, Limited | Lung cancer methylation markers and uses thereof |
WO2019068082A1 (en) * | 2017-09-29 | 2019-04-04 | Arizona Board Of Regents On Behalf Of The University Of Arizona | DNA METHYLATION BIOMARKERS FOR THE DIAGNOSIS OF CANCER |
CN112538529B (zh) * | 2019-11-14 | 2021-11-30 | 广州市基准医疗有限责任公司 | 血液中结直肠癌的分子标记物及其检测试剂盒和方法 |
CN110724743B (zh) * | 2019-11-15 | 2021-02-26 | 广州市基准医疗有限责任公司 | 人血液中结直肠癌诊断相关的甲基化生物标记物及其应用 |
CN110872631B (zh) * | 2019-12-26 | 2021-08-10 | 广州市基准医疗有限责任公司 | Dna甲基化生物标志物组合、检测方法和试剂盒 |
CN110923322B (zh) * | 2019-12-26 | 2020-12-01 | 广州市基准医疗有限责任公司 | 膀胱癌相关的dna甲基化生物标志物组合和检测试剂盒 |
CN112391466A (zh) * | 2020-05-19 | 2021-02-23 | 广州市基准医疗有限责任公司 | 用于检测乳腺癌的甲基化生物标记物或其组合和应用 |
CN112375822B (zh) * | 2020-06-01 | 2021-11-02 | 广州市基准医疗有限责任公司 | 用于检测乳腺癌的甲基化生物标记物及其应用 |
CN112899359B (zh) * | 2021-01-27 | 2023-06-23 | 广州市基准医疗有限责任公司 | 用于肺结节良恶性检测的甲基化标记物或其组合及应用 |
-
2021
- 2021-08-19 CN CN202110956754.4A patent/CN114317736B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114317736A (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114317736B (zh) | 用于泛癌种检测的甲基化标志物组合及其应用 | |
CN110872631B (zh) | Dna甲基化生物标志物组合、检测方法和试剂盒 | |
CN114277135B (zh) | 胃癌淋巴结转移相关的甲基化生物标记物及其组合和检测试剂盒 | |
CN114317738B (zh) | 用于检测胃癌淋巴结节转移相关的甲基化生物标记物或其组合及应用 | |
EP3083993A2 (en) | Gene methylation based colorectal cancer diagnosis | |
CN112899359A (zh) | 用于肺结节良恶性检测的甲基化标记物或其组合及应用 | |
CN111534600A (zh) | 食管癌基因甲基化检测引物探针组合及其试剂盒与应用 | |
CN107630093B (zh) | 用于诊断肝癌的试剂、试剂盒、检测方法及用途 | |
JP2024020392A (ja) | 特定の遺伝子のcpgメチル化変化を利用した肝癌診断用組成物およびその使用 | |
US11535897B2 (en) | Composite epigenetic biomarkers for accurate screening, diagnosis and prognosis of colorectal cancer | |
CN111100866A (zh) | 鉴别甲状腺良恶性结节的基因片段及其应用 | |
CN115851923A (zh) | 用于检测结直肠癌淋巴结转移的甲基化生物标记物及其应用 | |
US11542559B2 (en) | Methylation-based biomarkers in breast cancer screening, diagnosis, or prognosis | |
CN115094139B (zh) | 检测甲基化水平的试剂在制备膀胱癌诊断产品中的应用以及膀胱癌诊断试剂盒 | |
CN114657248B (zh) | 用于检测早期结直肠癌的血浆游离dna甲基化生物标记物或其组合物、应用及试剂盒 | |
CN116064797B (zh) | 一种子宫内膜癌基因甲基化水平检测试剂及其应用 | |
CN117344010B (zh) | 用于诊断胃癌的dna甲基化生物标记物、试剂盒及用途 | |
CN116064798B (zh) | 一种子宫内膜癌基因甲基化检测试剂及其应用 | |
CN113528657B (zh) | 用于检测食管癌的组合物及其试剂盒和应用 | |
CN115838798A (zh) | 检测甲基化水平的试剂在制备结直肠癌诊断产品中的应用 | |
CN116179694A (zh) | 检测甲基化水平的试剂在制备前列腺癌诊断产品中的应用以及前列腺癌诊断试剂盒 | |
CN115927644A (zh) | 一种新型多靶点胃癌检测的标志物组合及其应用 | |
CN115772564A (zh) | 用于辅助检测肺癌体细胞atm基因融合突变的甲基化生物标记物及其应用 | |
CN114410792A (zh) | 用于肾癌筛查的标志物、探针组合物及其应用 | |
CN115927629A (zh) | 一种尿液脱落细胞膀胱癌多靶点甲基化基因检测试剂及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |