CN110747274A - 用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒 - Google Patents
用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒 Download PDFInfo
- Publication number
- CN110747274A CN110747274A CN201911127606.0A CN201911127606A CN110747274A CN 110747274 A CN110747274 A CN 110747274A CN 201911127606 A CN201911127606 A CN 201911127606A CN 110747274 A CN110747274 A CN 110747274A
- Authority
- CN
- China
- Prior art keywords
- colorectal cancer
- gene methylation
- myo1g
- methylation
- panel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 236
- 230000011987 methylation Effects 0.000 title claims abstract description 199
- 238000007069 methylation reaction Methods 0.000 title claims abstract description 199
- 206010009944 Colon cancer Diseases 0.000 title claims abstract description 151
- 208000001333 Colorectal Neoplasms Diseases 0.000 title claims abstract description 151
- 238000004393 prognosis Methods 0.000 title claims abstract description 34
- 230000000694 effects Effects 0.000 title abstract description 16
- 101001000116 Homo sapiens Unconventional myosin-Ig Proteins 0.000 claims abstract description 87
- 102100035824 Unconventional myosin-Ig Human genes 0.000 claims abstract description 75
- 102000007372 Ataxin-1 Human genes 0.000 claims abstract description 69
- 108010032963 Ataxin-1 Proteins 0.000 claims abstract description 69
- 102100025423 Bone morphogenetic protein receptor type-1A Human genes 0.000 claims abstract description 61
- 101000934638 Homo sapiens Bone morphogenetic protein receptor type-1A Proteins 0.000 claims abstract description 61
- 101000934376 Homo sapiens T-cell differentiation antigen CD6 Proteins 0.000 claims abstract description 54
- 102100025131 T-cell differentiation antigen CD6 Human genes 0.000 claims abstract description 54
- 101001099865 Homo sapiens Cellular retinoic acid-binding protein 1 Proteins 0.000 claims abstract description 26
- 101001096332 Homo sapiens Retinol-binding protein 5 Proteins 0.000 claims abstract description 26
- 102100037876 Retinol-binding protein 5 Human genes 0.000 claims abstract description 26
- 102100027400 A disintegrin and metalloproteinase with thrombospondin motifs 4 Human genes 0.000 claims abstract description 16
- 108091005664 ADAMTS4 Proteins 0.000 claims abstract description 16
- 102100036338 Calmodulin-like protein 4 Human genes 0.000 claims abstract description 15
- 102100030479 Germinal center-associated signaling and motility protein Human genes 0.000 claims abstract description 15
- 101000714684 Homo sapiens Calmodulin-like protein 4 Proteins 0.000 claims abstract description 15
- 101000862655 Homo sapiens Germinal center-associated signaling and motility protein Proteins 0.000 claims abstract description 15
- 101001139136 Homo sapiens Krueppel-like factor 3 Proteins 0.000 claims abstract description 15
- 102100020678 Krueppel-like factor 3 Human genes 0.000 claims abstract description 15
- 238000003745 diagnosis Methods 0.000 claims description 32
- -1 LGAP5 Proteins 0.000 claims description 10
- 230000001225 therapeutic effect Effects 0.000 claims description 3
- 238000013399 early diagnosis Methods 0.000 abstract description 9
- 230000002265 prevention Effects 0.000 abstract description 3
- 238000011156 evaluation Methods 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 56
- 239000000523 sample Substances 0.000 description 41
- 238000012549 training Methods 0.000 description 34
- 238000010200 validation analysis Methods 0.000 description 24
- 238000001514 detection method Methods 0.000 description 22
- 230000035945 sensitivity Effects 0.000 description 21
- 238000012163 sequencing technique Methods 0.000 description 21
- 238000006243 chemical reaction Methods 0.000 description 16
- 238000012795 verification Methods 0.000 description 16
- 238000012216 screening Methods 0.000 description 13
- 238000007477 logistic regression Methods 0.000 description 12
- 239000000243 solution Substances 0.000 description 12
- 208000005016 Intestinal Neoplasms Diseases 0.000 description 9
- 206010028980 Neoplasm Diseases 0.000 description 9
- 238000007405 data analysis Methods 0.000 description 9
- 201000002313 intestinal cancer Diseases 0.000 description 9
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000007637 random forest analysis Methods 0.000 description 6
- 208000003200 Adenoma Diseases 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 239000011535 reaction buffer Substances 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 4
- 238000012350 deep sequencing Methods 0.000 description 4
- 230000002550 fecal effect Effects 0.000 description 4
- 239000002480 mineral oil Substances 0.000 description 4
- 235000010446 mineral oil Nutrition 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 238000002591 computed tomography Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000001704 evaporation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000007899 nucleic acid hybridization Methods 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 230000004083 survival effect Effects 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 206010001233 Adenoma benign Diseases 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 238000009534 blood test Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 101150106774 9 gene Proteins 0.000 description 1
- 102000012406 Carcinoembryonic Antigen Human genes 0.000 description 1
- 108010022366 Carcinoembryonic Antigen Proteins 0.000 description 1
- 101150091846 MYO1G gene Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011119 multifactor regression analysis Methods 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000002636 symptomatic treatment Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 208000009540 villous adenoma Diseases 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Medical Informatics (AREA)
- Pathology (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Epidemiology (AREA)
- Immunology (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒。该基因甲基化面板包括第一组甲基化基因和/或第二组甲基化基因,所述第一组甲基化基因选自MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20中的一种或几种,所述第二组甲基化基因选自MYO1G、GCET2、CALML4、KLF3、ATXN1中的一种或几种。该基因甲基化面板及含有该基因甲基化面板的试剂盒,可用于快速、低成本的进行结直肠癌早期诊断、早期评估和早期预防。
Description
技术领域
本发明涉及基因表观遗传学技术领域,尤其涉及一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒,以及利用该基因甲基化面板诊断肠癌、预测疗效和复发情况,以及预测肠癌预后和死亡风险的方法。
背景技术
作为一种常见的恶性肿瘤,结直肠癌在我国所有恶性肿瘤中,发病率居第三位。结直肠癌在发病初期症状并不显著,难以及时发现、及时治疗,故通过技术革新在结直肠癌初期阶段即发现病症、对症治疗,将对结直肠癌的有效治疗具有重要意义。
目前对结直肠癌的检测方法主要有结直肠镜镜检、粪便隐血试验、计算机扫描断层成像(CT)、粪便DNA检测等。其中,结直肠镜镜检是检出高危人群和早期患者的有效手段,但由于其需要专业操作、价格昂贵,且为侵入性检查,人群顺应性差,导致我国结直肠癌早诊率极低(不足10%)。粪便隐血试验虽然快速,但检测结果假阳性多,且检测结果易受饮食和药物干扰。计算机扫描断层成像方法只能检测到中晚期的癌症,因此无法在早期筛查中应用。目前,美国FDA批准的FIT+粪便DNA多靶标DNA检测,可以检出92%的结直肠癌和43%进展期腺瘤,但是该方法价格高达600多美金,而且在检测过程中需要同时进行多个反应检测,因此操作也十分复杂,并不适合像中国这样的发展中国家应用。由此可见,上述结直肠癌的检测方法均存在一定弊端,难以帮助我国结直肠癌的普及性筛查。然而,早期诊断、早期发现、早期治疗对于提高结直肠癌生存率具有重要意义,因此目前亟需挖掘结直肠癌诊断相关的分子标记物,研发用于早期诊断的、基于外周血的液体活检技术(ctDNA甲基化等),形成产业化试剂盒并推广应用,并建立适合中国国情、符合卫生经济学的筛查方案。此外,除了早期诊断,开发新的技术对结直肠癌的早期评估、早期预防和早期治疗也十分必要。
发明内容
本发明要解决的技术问题是提供一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒,以解决现有结直肠癌检测方法在操作方便性、结果准确性、检测成本等方面难以兼顾的问题。
第一个方面,本发明提供一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板,所述基因甲基化面板包括第一组甲基化基因和/或第二组甲基化基因,所述第一组甲基化基因选自MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20中的一种或几种,所述第二组甲基化基因选自MYO1G、GCET2、CALML4、KLF3、ATXN1中的一种或几种。
进一步地,所述基因甲基化面板包括所述第一组甲基化基因和所述第二组甲基化基因,所述第一组甲基化基因包括MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20,所述第二组甲基化基因包括MYO1G、GCET2、CALML4、KLF3、ATXN1。
更进一步地,所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变,以预测结直肠癌的治疗疗效;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、GCET2、CALML4、KLF3、ATXN1的基因甲基化水平的改变,以预测肠癌患者的预后和死亡风险。
进一步地,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
进一步地,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A、CD6、Chr13:10、LGAP5、ATXN1和Chr 8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
进一步地,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
进一步地,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A、CD6、ATXN1和Chr 8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
进一步地,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A、CD6和Chr8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
进一步地,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A和Chr 8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
进一步地,所述基因甲基化面板包括以下甲基化基因:MYO1G和ATXN1;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G和ATXN1的基因甲基化水平的改变,以判断结直肠癌的发生。
进一步地,所述基因甲基化面板包括以下甲基化基因:MYO1G;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G的基因甲基化水平的改变,以判断结直肠癌的发生。
第二个方面,本发明提供一种用于诊断、预测结直肠癌疗效和预后的试剂盒,所述试剂盒包括上述基因甲基化面板。
第三个方面,本发明提供一种上述用于诊断、预测结直肠癌疗效和预后的基因甲基化面板的检测方法,包括以下步骤:
第一步,在血浆中提取ctDNA;
第二步,将提取的所述ctDNA进行亚硫酸盐转化,使所述ctDNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变,得到亚硫酸盐转化ctDNA;
第三步,用深度测序的方法测定所述亚硫酸盐转化ctDNA的甲基化水平的改变;
第四步,探针的设计和合成;
第五步,通过所述探针对所述亚硫酸盐转化ctDNA进行捕获扩增并进行测序;
第六步,数据的分析和模型的建立。
在本发明的检测方法的第一步中,血浆可以是正常人的血浆或者结直肠癌患者的血浆。ctDNA(circulating tumor DNA)是指循环肿瘤DNA。在本发明中,深度测序也称高通量测序技术,为本领域技术人员所知晓的一种测序技术。
在上述检测方法中,第四步所述探针的设计和合成具体包括以下步骤:
首先,对TCGA和GSE数据库里的肠癌组织样本和正常人血浆样本的450K基因甲基化芯片数据进行分析,找出甲基化水平明显差异的基因;
针对筛选出来的基因设计探针并合成。
在本发明中,采用常规探针设计软件设计探针,如采用ppDesigner软件设计上述方法筛选出来的甲基化水平差异明显的基因探针。探针的合成方法则采用现有成熟技术,如采用核酸杂交技术,用单独的寡核苷酸进行探针合成。
在本发明中,可以通过本领域常用方法使用探针捕获亚硫酸盐转化ctDNA,经扩增后进行相应测序。或者,优选地,采用以下步骤进行捕获扩增后并测序:
首先,将所述亚硫酸盐转化ctDNA与第四步中合成的所述探针混合于反应缓冲液,在所述反应液中加矿物油;
然后,对所述反应液进行退火、变性、扩增并给每个血浆样本附上条码,PCR反应建立文库,并保留有效的捕获,去除空白的捕获;
最后,根据Illumina公司所提供的PCR方法纯化所建文库,采用Illumina公司的Miseq和Hiseq2500系统测序,得到测序结果。
其中,所述反应缓冲液采用本领域常用于DNA捕获的反应缓冲液。
优先地,所述亚硫酸盐转化ctDNA与所述探针按照1:20000的摩尔比混合。所述矿物油是为了防止反应液蒸发。
进一步地,第五步中对所述亚硫酸盐转化ctDNA进行捕获扩增,是因为测序的原始捕获实验结果(即测序结果)在高效率的探针和低效率的探针中读取的结果有显著差异,为了优化,故需要进行捕获,使测序的覆盖更加均匀、测序结果更加合理。
进一步地,第六步中,所述数据的分析和模型的建立采取以下步骤:
首先,通过将结直肠癌血浆样本和正常对照的血浆样本随机按2:1的比例分为训练集和验证集,用LASSO和随机森林的方法进行基因筛选,两种方法重叠的基因有9个,分别为MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20;
然后,通过逻辑回归方法,采用这9个甲基化基因中的一个或多个作为协变量建立诊断预测模型,计算联合诊断指数,并在所述验证集中进行验证;
同样,将肠癌血浆样本分为训练集和验证集,先通过对每一个基因作为协变量建立一个单变量COX比例风险模型,筛选出与患者预后相关的基因进行下一步分析;
接着,采用LASSO-COX多因素回归分析,最终筛选出甲基化基因进行预后的分析,分别为MYO1G、GCET2、CALML4、KLF3、ATXN1;
最后,通过拟合多变量COX比例风险模型,在训练集确定这5个甲基化基因中每一个基因的系数,计算合并后的预后评分指数,并在验证集中进行验证。
在本发明中,联合诊断指数(combined diagnosis score)定义为cd-score。预后评分指数(combined prognostic score)定义为cp-score。
优先地,所述LASSO方法采用二次抽样方法不重复抽样75%的数据集500次,选择出现频率超过450次的甲基化基因共13个;所述随机森林方法采用OOB误差最小化准则,通过设置变量每次重复的分数下降0.3的原则进行随机变量的消除,最后筛选出22个甲基化基因。其中OOB是指out-of-bag,泛指误差估计的方法。
可选地,在所述第六步的步骤中,采用甲基化基因MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20作为协变量建立诊断预测模型,计算联合诊断指数,并在所述验证集中进行验证。
可选地,在所述第六步的步骤中,采用甲基化基因MYO1G、BMPR1A、CD6、RBP5、Chr13:10、LGAP5、ATXN1、Chr 8:20作为协变量建立诊断预测模型,计算联合诊断指数,并在所述验证集中进行验证。
可选地,在所述第六步的步骤中,采用甲基化基因MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1、Chr 8:20作为协变量建立诊断预测模型,计算联合诊断指数,并在所述验证集中进行验证。
可选地,在所述第六步的步骤中,采用甲基化基因MYO1G、BMPR1A、CD6、LGAP5、ATXN1、Chr 8:20作为协变量建立诊断预测模型,计算联合诊断指数,并在所述验证集中进行验证。
可选地,在所述第六步的步骤中,采用甲基化基因MYO1G、BMPR1A、CD6、ATXN1、Chr8:20作为协变量建立诊断预测模型,计算联合诊断指数,并在所述验证集中进行验证。
可选地,在所述第六步的步骤中,采用甲基化基因MYO1G、BMPR1A、CD6和Chr 8:20作为协变量建立诊断预测模型,计算联合诊断指数,并在所述验证集中进行验证。
可选地,在所述第六步的步骤中,采用甲基化基因MYO1G、BMPR1A和Chr 8:20作为协变量建立诊断预测模型,计算联合诊断指数,并在所述验证集中进行验证。
可选地,在所述第六步的步骤中,采用甲基化基因MYO1G和ATXN1作为协变量建立诊断预测模型,计算联合诊断指数,并在所述验证集中进行验证。
可选地,在所述第六步的步骤中,采用甲基化基因MYO1G作为协变量建立诊断预测模型,计算联合诊断指数,并在所述验证集中进行验证。
第四个方面,本发明提供一种用于预测结直肠癌复发的方法,包括以下步骤:
提供如上所述的基因甲基化面板,以所述第一组甲基化基因构建诊断预测模型,所述第一组甲基化基因包括MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20;
提供结直肠癌血浆样本,根据所述诊断预测模型计算出肠癌血浆样本的联合诊断指数,以预测结直肠癌的复发情况。
第五个方面,本发明提供一种用于预测结直肠癌预后的方法,包括以下步骤:
提供如上所述的基因甲基化面板,以所述第二组甲基化基因构建预后风险模型,所述第二组甲基化基因包括MYO1G、GCET2、CALML4、KLF3、ATXN1;
提供结直肠癌血浆样本,根据所述预后风险模型计算出结直肠癌血浆样本的预后评分指数,以预测结直肠癌的预后情况。
与现有技术相比,本发明具有以下有益效果:
本发明提供的是一种可用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒,同时提供了利用该基因甲基化面板诊断、预测结直肠癌复发和预后的方法,可用于快速、低成本的进行结直肠癌早期诊断、早期评估和早期预防。首先,该基因甲基化面板可通过检测患者血浆中MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20中的一个或者多个基因甲基化水平的改变,来进行结直肠癌的诊断,这意味着早期结直肠癌患者可及时确诊并治疗。尤为重要的,本发明通过对上述基因甲基化表达与结直肠癌之间关系的大量研究,经过不断检测与诊断确认,实现了用较少的基因仍能较准确的诊断结直肠癌,进而大幅降低基因甲基化面板及其试剂盒的经济成本,使本发明的基因甲基化面板及试剂盒具有更好的推广应用价值,更适用于结直肠癌早期诊断,适用于结直肠癌的普及性筛查。其次,该基因甲基化面板通过检测患者血浆中MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20共9个基因甲基化水平的改变,可以用于诊断结直肠癌和预测结直肠癌的疗效,这意味着早期结直肠癌患者可及时确诊并治疗。通过检测患者血浆中MYO1G、GCET2、CALML4、KLF3、ATXN1共5个基因甲基化水平的改变,可以用于预测结直肠癌患者的预后和死亡风险,这有利于指导医生对不同患者进行个体化的精准治疗。本发明提供的是一种可用于诊断、预测结直肠癌疗效和预后的基因甲基化面板,提高了通过结直肠癌患者血液诊断和预后预测的准确性。
附图说明
图1是实施例一基因甲基化面板在应用中的数据分析图。
图2是实施例二基因甲基化面板在应用中的数据分析图。
图3是实施例三基因甲基化面板在应用中的数据分析图。
图4是实施例四基因甲基化面板在应用中的数据分析图。
图5是实施例五基因甲基化面板在应用中的数据分析图。
图6是实施例六基因甲基化面板在应用中的数据分析图。
图7是实施例七基因甲基化面板在应用中的数据分析图。
图8是实施例八基因甲基化面板在应用中的数据分析图。
图9至图11是实施例九基因甲基化面板在应用中的数据分析图。
具体实施方式
以下结合说明书附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。除非特别说明,以下实施例所用试剂和材料均为市购。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
本实施例公开了一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板,该基因甲基化面板由第一组甲基化基因组成,这些甲基化基因是MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20。该基因甲基化面板测定结直肠癌患者血浆中MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平改变,用于诊断结直肠癌的发生。
本实施例还公开了上述用于诊断结直肠癌的基因甲基化面板的检测方法,包括以下步骤:
第一步,在血浆中提取ctDNA;
第二步,将提取的ctDNA进行亚硫酸盐转化,使其ctDNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变,得到亚硫酸盐转化ctDNA;
第三步,用深度测序的方法测定所述亚硫硫酸盐转化ctDNA的甲基化水平的改变;
第四步,探针的设计和合成;具体是:首先,对TCGA和GSE数据库里的肠癌组织样本和正常人血浆样本的450K基因甲基化芯片数据进行分析,找到甲基化水平明显差异的基因;然后,用ppDesigner软件设计上述方法筛选出来的甲基化水平差异明显的基因探针,并进行合成,如采用核酸杂交技术,用单独的寡核苷酸进行探针合成。
第五步,通过所述探针对所述亚硫酸盐转化ctDNA进行捕获扩增并进行测序;具体是:将10ng亚硫酸盐转化ctDNA与第四步中合成的所述探针按照1:20000的摩尔比混合于20μl反应缓冲液中形成反应液,并在反应液中加矿物油防止反应液蒸发;对反应液进行退火、变性、扩增并给每个血浆样本附上条码,PCR反应建立文库,并保留有效的捕获,去除空白的捕获;根据Illumina公司所提供的PCR方法纯化所建文库,采用Illumina公司的Miseq和Hiseq2500系统测序,得到测序结果。
由于测序的原始捕获实验结果(即测序结果)在高效率的探针和低效率的探针中读取的结果有显著差异,为了优化,故对原始的测序结果进行相对效率计算,混合探针时根据调节后的摩尔比率进行混合。
第六步,数据的分析和模型的建立。具体是:首先,通过将肠癌血浆样本和正常对照的血浆样本随机按2:1的比例分为训练集和验证集,选用LASSO和随机森林的方法进行基因筛选;
其中,LASSO方法采用二次抽样方法不重复抽样75%的数据集500次,选择出现频率超过450次的甲基化基因共13个。随机森林方法采用OOB误差最小化准则,通过设置变量每次重复的分数下降0.3的原则进行随机变量的消除,最后筛选出22个甲基化基因。
上述两种方法重叠的甲基化基因有8个(如表1所示),分别是MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20。
然后,通过逻辑回归方法,采用这8个重叠的甲基化基因作为协变量建立诊断预测模型,计算联合诊断指数(cd-score),并在所述验证集中进行验证。
表1:8个用于诊断结直肠癌的基因
本实施例还提供一种用于结直肠癌诊断的试剂盒,该试剂盒包括上述基因甲基化面板。
本实施例还提供对上述基因甲基化面板的应用。具体是,通过逻辑回归方法,用基因甲基化面板(包括8个甲基化基因:MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌,在训练集中的敏感性86.93%,特异性90.80%,总体正确率89.10%。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC=0.956)和验证数据集(AUC=0.957)(如图1、表2所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。
表2:实施例一基因甲基化面板在训练集中的敏感性和特异性结果
实施例二
本实施例与实施例一的区别仅在于,本实施例的基因甲基化面板中甲基化基因是MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1和Chr 8:20。
通过逻辑回归方法,用基因甲基化面板(包括7个甲基化基因:MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1和Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌,在训练集中的敏感性87.69%,特异性89.91%,总体正确率88.94%。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC=0.956)和验证数据集(AUC=0.955)(如图2、表3所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。
表3:实施例二基因甲基化面板在训练集中的敏感性和特异性结果
实施例三
本实施例与实施例一的区别仅在于,本实施例的基因甲基化面板中甲基化基因是MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20。
通过逻辑回归方法,用基因甲基化面板(包括6个甲基化基因:MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌,在训练集中的敏感性85.61%,特异性92.14%,总体正确率89.27%。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC=0.954)和验证数据集(AUC=0.954)(如图3、表4所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。
表4:实施例三基因甲基化面板在训练集中的敏感性和特异性结果
实施例四
本实施例与实施例一的区别仅在于,本实施例的基因甲基化面板中甲基化基因是MYO1G、BMPR1A、CD6、ATXN1和Chr 8:20。
通过逻辑回归方法,用基因甲基化面板(包括5个甲基化基因:MYO1G、BMPR1A、CD6、ATXN1和Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌,在训练集中的敏感性92.23%,特异性83.68%,总体正确率87.44%。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC=0.952)和验证数据集(AUC=0.952)(如图4、表5所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。
表5:实施例四基因甲基化面板在训练集中的敏感性和特异性结果
实施例五
本实施例与实施例一的区别仅在于,本实施例的基因甲基化面板中甲基化基因是MYO1G、BMPR1A、CD6和Chr 8:20。
通过逻辑回归方法,用基因甲基化面板(包括4个甲基化基因:MYO1G、BMPR1A、CD6和Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌,在训练集中的敏感性84.57%,特异性90.65%,总体正确率88.06%。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC=0.945)和验证数据集(AUC=0.952)(如图5、表6所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。
表6:实施例五基因甲基化面板在训练集中的敏感性和特异性结果
实施例六
本实施例与实施例一的区别仅在于,本实施例的基因甲基化面板中甲基化基因是MYO1G、BMPR1A和Chr 8:20。
通过逻辑回归方法,用基因甲基化面板(包括3个甲基化基因:MYO1G、BMPR1A和Chr8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌,在训练集中的敏感性82.58%,特异性93.47%,总体正确率88.69%。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC=0.943)和验证数据集(AUC=0.947)(如图6、表7所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。
表7:实施例六基因甲基化面板在训练集中的敏感性和特异性结果
实施例七
本实施例与实施例一的区别仅在于,本实施例的基因甲基化面板中甲基化基因是MYO1G和ATXN1。
通过逻辑回归方法,用基因甲基化面板(包括2个甲基化基因:MYO1G和ATXN1)构建了一个诊断预测模型。应用该模型诊断结直肠癌,在训练集中的敏感性80.44%,特异性92.43%,总体正确率87.09%。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC=0.927)和验证数据集(AUC=0.919)(如图7、表8所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。
表8:实施例七基因甲基化面板在训练集中的敏感性和特异性结果
实施例八
本实施例与实施例一的区别仅在于,本实施例的基因甲基化面板中甲基化基因是MYO1G。
通过逻辑回归方法,用基因甲基化面板(包括1个甲基化基因:MYO1G)构建了一个诊断预测模型。应用该模型诊断结直肠癌,在训练集中的敏感性82.10%,特异性85.76%,总体正确率84.13%。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC=0.904)和验证数据集(AUC=0.91)(如图8、表9所示)。证实这个基因甲基化面板可以用于区分结直肠癌患者与正常人。
表9:实施例八基因甲基化面板在训练集中的敏感性和特异性结果
为了验证上述基因甲基化面板对结直肠癌的诊断效果,在前瞻性大型筛查队列中,在16890例筛查人群中,通过问卷调查找出1493名结直肠高危分险人群,对这1493名被评估为结直肠癌高危患者分别采用常规的肠镜检查、本实施例的一个MYO1G基因甲基化进行检测,检测的结果如下表2所示。检测结果具体为:检测出26例早期肠癌患者、检测出26例进展期腺瘤;对癌症的检出率敏感性高达89.7%、特异性达86.8%,对进展期腺瘤的检出率敏感性达33.3%。上述敏感性和特异性结果与现有的筛查方法相比有大幅度提高。
本实施例中仅利用1个甲基化基因来实现对早期结直肠癌的快速检测,在检测成本方面也节省很多。
表10:不同结直肠癌检测方法的结果比较
需要说明的是,上述表格中,进展期腺瘤为:绒毛状腺瘤,腺瘤>1.0cm,无柄锯齿状息肉>1.0cm。
实施例九
本实施例公开了一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板,该基因甲基化面板包括第一组甲基化基因和第二组甲基化基因,第一组甲基化基因包括MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20,第二组甲基化基因包括MYO1G、GCET2、CALML4、KLF3、ATXN1。该基因甲基化面板测定结直肠癌患者血浆中MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平改变,用于诊断肠癌和预测结直肠癌的疗效和复发。该基因甲基化面板测定结直肠癌患者血浆中MYO1G、GCET2、CALML4、KLF3、ATXN1的基因甲基化水平改变,用于预测结直肠癌患者的预后和死亡风险。
本实施例还公开了上述用于诊断、预测结直肠癌复发和预后的基因甲基化面板的检测方法,包括以下步骤:
第一步,在血浆中提取ctDNA;
第二步,将提取的ctDNA进行亚硫酸盐转化,使其ctDNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变,得到亚硫酸盐转化ctDNA;
第三步,用深度测序的方法测定所述亚硫硫酸盐转化ctDNA的甲基化水平的改变;
第四步,探针的设计和合成;具体是:首先,对TCGA和GSE数据库里的肠癌组织样本和正常人血浆样本的450K基因甲基化芯片数据进行分析,找到甲基化水平明显差异的基因;然后,用ppDesigner软件设计上述方法筛选出来的甲基化水平差异明显的基因探针,并进行合成,如采用核酸杂交技术,用单独的寡核苷酸进行探针合成。
第五步,通过所述探针对所述亚硫酸盐转化ctDNA进行捕获扩增并进行测序;具体是:将10ng亚硫酸盐转化ctDNA与第四步中合成的所述探针按照1:20000的摩尔比混合于20μl反应缓冲液中形成反应液,并在反应液中加矿物油防止反应液蒸发;对反应液进行退火、变性、扩增并给每个血浆样本附上条码,PCR反应建立文库,并保留有效的捕获,去除空白的捕获;根据Illumina公司所提供的PCR方法纯化所建文库,采用Illumina公司的Miseq和Hiseq2500系统测序,得到测序结果。
由于测序的原始捕获实验结果(即测序结果)在高效率的探针和低效率的探针中读取的结果有显著差异,为了优化,故对原始的测序结果进行相对效率计算,混合探针时根据调节后的摩尔比率进行混合。
第六步,数据的分析和模型的建立。具体是:首先,通过将肠癌血浆样本和正常对照的血浆样本随机按2:1的比例分为训练集和验证集,选用LASSO和随机森林的方法进行基因筛选;
其中,LASSO方法采用二次抽样方法不重复抽样75%的数据集500次,选择出现频率超过450次的甲基化基因共13个。随机森林方法采用OOB误差最小化准则,通过设置变量每次重复的分数下降0.3的原则进行随机变量的消除,最后筛选出22个甲基化基因。
上述两种方法重叠的甲基化基因有9个(如表11所示),分别是MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20。
然后,通过逻辑回归方法,采用这9个重叠的甲基化基因作为协变量建立诊断预测模型,计算联合诊断指数(cd-score),并在所述验证集中进行验证;
同样,将结直肠癌血浆样本分为训练集和验证集,先通过对每一个基因作为协变量建立一个单变量COX比例风险模型,筛选出与患者预后相关的基因进行下一步分析;
接着,采用LASSO-COX多因素回归分析,最终筛选出5个甲基化基因进行预后的分析(如表12所示),分别为MYO1G、GCET2、CALML4、KLF3、ATXN1;
最后,通过拟合多变量COX比例风险模型,在训练集确定这5个甲基化基因中每一个基因的系数,计算合并后的预后评分指数(cp-score),并在验证集中进行验证(如表13所示)。
表11:9个用于诊断早期结直肠癌的基因
表12:5个用于预测结直肠癌预后的基因
表13:结直肠癌患者多变量生存分析
通过逻辑回归方法,用基因甲基化面板(包括9个甲基化基因:MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌,在训练集中的敏感性87.5%,特异性89.9%,验证集中的敏感性为87.9%,特异性89.6%。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(AUC=0.9571)和验证数据集(AUC=0.9569)(如图9所示)。证实这9个基因甲基化面板可以用于区分结直肠癌患者与正常人。
采用上述建立的诊断预测模型,计算出每个样本的联合诊断指数(cd-score),采用这个联合诊断指数,可以很好地预测结直肠癌患者的治疗疗效和复发(如图10所示)。有肿瘤负荷的患者的cd-scores值明显高于正常对照组(p<0.0001,如图10a所示)。同样,手术后病人的cd-scores值较手术前明显降低,患者术后出现肿瘤复发,cd-scores值则会再度升高(p<0.001,如图10b所示)。此外,cd-scores值与肿瘤分期有关。早期患者(I,II期)的cd-scores值明显低于晚期(III,IV期)患者(p<0.0001,如图10c所示)。说明根据这9个基因甲基化水平建立的模型可用于结直肠癌的早期诊断、治疗疗效的判断、预测肿瘤的复发。
通过拟合多变量COX比例风险模型,用基因甲基化面板(包括5个甲基化基因:MYO1G、GCET2、CALML4、KLF3、ATXN1)构建了一个预后风险模型,并计算出每个样本的预后评分指数(cp-score)。选取cp-score的中位值为cut-off值,将结直肠癌患者分为低风险组和高风险值。无论在训练集还是验证集,低风险组患者的生存均明显优于高风险组(如图11所示)。多元变量分析表明,cp-score与死亡风险显著相关,并且cp-score是一个独立的预后危险因素(如表13所示)。联合cp-score和分期、肿瘤部位、癌胚抗原等临床指标,可进一步的改进对结直肠癌患者预后的预测能力。
基于上述技术方案,本发明所述的用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及其试剂盒,可有效的用于诊断结直肠癌、预测结直肠癌疗效和预后。该基因甲基化面板通过检测患者血浆中MYO1G、ADAMTS4、Chr 8:20、BMPR1A、CD6、ATXN1、LGAP5、Chr 13:10和RBP5这9个基因中一个或多个基因的甲基化水平改变,可用于诊断结直肠癌和预测结直肠癌的治疗疗效;该基因甲基化面板通过检测患者血浆中MYO1G、GCET2、CALML4、KLF3、ATXN1共5个基因甲基化水平的改变,可用于预测结直肠癌的预后和死亡风险,并通过检测方法来实现。本发明一方面提高了通过受测者血液诊断其是否患有结直肠癌的准确性,另一方面通过对基因甲基化面板的不断优化来使用更少数量、更低成本的基因甲基化面板及试剂盒进行结直肠癌诊断,对结直肠癌早期诊断、普及性筛查具有重要意义。
以上对本发明实施例公开的一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板,其特征在于,所述基因甲基化面板包括第一组甲基化基因和/或第二组甲基化基因,所述第一组甲基化基因选自MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20中的一种或几种,所述第二组甲基化基因选自MYO1G、GCET2、CALML4、KLF3、ATXN1中的一种或几种。
2.根据权利要求1所述的基因甲基化面板,其特征在于,所述基因甲基化面板包括所述第一组甲基化基因和所述第二组甲基化基因,所述第一组甲基化基因包括MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1、Chr 8:20,所述第二组甲基化基因包括MYO1G、GCET2、CALML4、KLF3、ATXN1;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、ADAMTS4、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变,以预测结直肠癌的治疗疗效;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、GCET2、CALML4、KLF3、ATXN1的基因甲基化水平的改变,以预测肠癌患者的预后和死亡风险。
3.根据权利要求1所述的基因甲基化面板,其特征在于,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、RBP5、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
4.根据权利要求1所述的基因甲基化面板,其特征在于,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1和Chr 8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、Chr 13:10、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
5.根据权利要求1所述的基因甲基化面板,其特征在于,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
6.根据权利要求1所述的基因甲基化面板,其特征在于,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A、CD6、ATXN1和Chr 8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6、LGAP5、ATXN1和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
7.根据权利要求1所述的基因甲基化面板,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A、CD6和Chr 8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A、CD6和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
8.根据权利要求1所述的基因甲基化面板,所述基因甲基化面板包括以下甲基化基因:MYO1G、BMPR1A和Chr 8:20;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G、BMPR1A和Chr 8:20的基因甲基化水平的改变,以判断结直肠癌的发生。
9.根据权利要求1所述的基因甲基化面板,其特征在于,所述基因甲基化面板包括以下甲基化基因:MYO1G和ATXN1,所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G和ATXN1的基因甲基化水平的改变,以判断结直肠癌的发生;或者,所述基因甲基化面板包括以下甲基化基因:MYO1G;所述基因甲基化面板测定结直肠癌患者血浆中的MYO1G的基因甲基化水平的改变,以判断结直肠癌的发生。
10.一种用于诊断、预测结直肠癌疗效和预后的试剂盒,其特征在于,所述试剂盒包括权利要求1至9所述的基因甲基化面板。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911127606.0A CN110747274B (zh) | 2019-11-18 | 2019-11-18 | 用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911127606.0A CN110747274B (zh) | 2019-11-18 | 2019-11-18 | 用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110747274A true CN110747274A (zh) | 2020-02-04 |
CN110747274B CN110747274B (zh) | 2023-12-22 |
Family
ID=69283579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911127606.0A Active CN110747274B (zh) | 2019-11-18 | 2019-11-18 | 用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110747274B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111816315A (zh) * | 2020-05-28 | 2020-10-23 | 上海生物信息技术研究中心 | 胰腺导管癌状态评估模型构建方法及应用 |
CN111961721A (zh) * | 2020-04-15 | 2020-11-20 | 南方医科大学 | 血浆sfmbt2基因甲基化在结直肠癌中转移预测及动态监测中的应用 |
CN112992354A (zh) * | 2021-03-15 | 2021-06-18 | 南方医科大学 | 一种基于甲基标志物组合评估结直肠癌转移复发风险和动态监测的方法以及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108977539A (zh) * | 2018-07-24 | 2018-12-11 | 中山大学肿瘤防治中心 | 用于预测结直肠癌疗效和预后的基因甲基化面板 |
WO2019071161A1 (en) * | 2017-10-06 | 2019-04-11 | Youhealth Biotech, Limited | METHYLATION MARKERS FOR THE DIAGNOSIS OF CANCER |
CN110438228A (zh) * | 2019-07-31 | 2019-11-12 | 南通大学附属医院 | 结直肠癌dna甲基化标志物 |
-
2019
- 2019-11-18 CN CN201911127606.0A patent/CN110747274B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019071161A1 (en) * | 2017-10-06 | 2019-04-11 | Youhealth Biotech, Limited | METHYLATION MARKERS FOR THE DIAGNOSIS OF CANCER |
CN108977539A (zh) * | 2018-07-24 | 2018-12-11 | 中山大学肿瘤防治中心 | 用于预测结直肠癌疗效和预后的基因甲基化面板 |
CN110438228A (zh) * | 2019-07-31 | 2019-11-12 | 南通大学附属医院 | 结直肠癌dna甲基化标志物 |
Non-Patent Citations (1)
Title |
---|
郝世佳等: "结直肠癌肿瘤标志物研究进展", 《齐鲁工业大学学报》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111961721A (zh) * | 2020-04-15 | 2020-11-20 | 南方医科大学 | 血浆sfmbt2基因甲基化在结直肠癌中转移预测及动态监测中的应用 |
CN111961721B (zh) * | 2020-04-15 | 2022-06-07 | 南方医科大学 | 血浆sfmbt2基因甲基化在结直肠癌中转移预测及动态监测中的应用 |
CN111816315A (zh) * | 2020-05-28 | 2020-10-23 | 上海生物信息技术研究中心 | 胰腺导管癌状态评估模型构建方法及应用 |
CN111816315B (zh) * | 2020-05-28 | 2023-10-13 | 上海市生物医药技术研究院 | 胰腺导管癌状态评估模型构建方法及应用 |
CN112992354A (zh) * | 2021-03-15 | 2021-06-18 | 南方医科大学 | 一种基于甲基标志物组合评估结直肠癌转移复发风险和动态监测的方法以及系统 |
CN112992354B (zh) * | 2021-03-15 | 2024-01-19 | 南方医科大学 | 一种基于甲基标志物组合评估结直肠癌转移复发风险和动态监测的方法以及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110747274B (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7531217B2 (ja) | 癌を査定および/または処置するためのセルフリーdna | |
Bratulic et al. | The translational status of cancer liquid biopsies | |
CN110168099B (zh) | 用于疾病和病症分析的无细胞dna甲基化模式 | |
CN113454219B (zh) | 用于肝癌检测和诊断的甲基化标志物 | |
US9051616B2 (en) | Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing | |
CN106947830B (zh) | 用于诊断、预测肝癌疗效和预后的基因甲基化面板 | |
CN113286881A (zh) | 甲基化标记和标靶甲基化探针板 | |
KR20150082228A (ko) | 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정 | |
CN113728115A (zh) | 侦测癌症、癌症来源组织及/或癌症细胞类型 | |
Kandimalla et al. | EpiPanGI Dx: a cell-free DNA methylation fingerprint for the early detection of gastrointestinal cancers | |
US20210065842A1 (en) | Systems and methods for determining tumor fraction | |
CN110747274B (zh) | 用于诊断、预测结直肠癌疗效和预后的基因甲基化面板及试剂盒 | |
CN114026255A (zh) | 侦测癌症、癌症来源组织及/或一癌症细胞类型 | |
WO2016112488A1 (en) | Biomarkers for colorectal cancer related diseases | |
WO2020237184A1 (en) | Systems and methods for determining whether a subject has a cancer condition using transfer learning | |
CN116287355A (zh) | 上消化道肿瘤化疗疗效及不良反应的肠道菌群预测模型 | |
JP2022501033A (ja) | 膵臓病変の評価における無細胞dnaヒドロキシメチル化プロファイル | |
CN115820860A (zh) | 基于增强子甲基化差异的非小细胞肺癌标志物筛选方法及其标志物和应用 | |
Kwon et al. | Advances in methylation analysis of liquid biopsy in early cancer detection of colorectal and lung cancer | |
Bian et al. | Genome-wide methylation profiling identified methylated KCNA3 and OTOP2 as promising diagnostic markers for esophageal squamous cell carcinoma | |
CN117062915A (zh) | 用于癌症诊断和预后的甲基化生物标志的分层分析 | |
Moradi et al. | Application of next-generation sequencing in the diagnosis of gastric cancer | |
CN113817822B (zh) | 一种基于甲基化检测的肿瘤诊断试剂盒及其应用 | |
Wong et al. | Epigenetic modifications of cfDNA in liquid biopsy for the cancer care continuum | |
WO2022255944A2 (en) | Method for detection and quantification of methylated dna |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |