CN112813155A - 预测抗精神病药物疗效的dna甲基化标记物及筛选方法和应用 - Google Patents
预测抗精神病药物疗效的dna甲基化标记物及筛选方法和应用 Download PDFInfo
- Publication number
- CN112813155A CN112813155A CN202110075081.1A CN202110075081A CN112813155A CN 112813155 A CN112813155 A CN 112813155A CN 202110075081 A CN202110075081 A CN 202110075081A CN 112813155 A CN112813155 A CN 112813155A
- Authority
- CN
- China
- Prior art keywords
- methylated cpg
- treatment
- methylation
- efficacy
- methylated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007067 DNA methylation Effects 0.000 title claims abstract description 39
- 230000000561 anti-psychotic effect Effects 0.000 title claims abstract description 37
- 239000003550 marker Substances 0.000 title claims abstract description 37
- 238000012216 screening Methods 0.000 title claims abstract description 33
- 239000003814 drug Substances 0.000 title claims abstract description 31
- 229940079593 drug Drugs 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000001225 therapeutic effect Effects 0.000 title abstract description 10
- 230000011987 methylation Effects 0.000 claims abstract description 70
- 238000007069 methylation reaction Methods 0.000 claims abstract description 70
- 239000000164 antipsychotic agent Substances 0.000 claims abstract description 31
- 230000000694 effects Effects 0.000 claims abstract description 14
- 238000009007 Diagnostic Kit Methods 0.000 claims abstract description 6
- 108091029430 CpG site Proteins 0.000 claims description 122
- 238000011282 treatment Methods 0.000 claims description 71
- 210000000349 chromosome Anatomy 0.000 claims description 31
- 238000002790 cross-validation Methods 0.000 claims description 17
- 210000003917 human chromosome Anatomy 0.000 claims description 13
- 238000012706 support-vector machine Methods 0.000 claims description 12
- 201000000980 schizophrenia Diseases 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 7
- 239000000032 diagnostic agent Substances 0.000 claims description 6
- 229940039227 diagnostic agent Drugs 0.000 claims description 6
- 238000012353 t test Methods 0.000 claims description 6
- 238000007405 data analysis Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000010200 validation analysis Methods 0.000 claims description 4
- 238000000585 Mann–Whitney U test Methods 0.000 claims description 3
- 238000000528 statistical test Methods 0.000 claims description 3
- 101150000051 ATP6V1C1 gene Proteins 0.000 claims description 2
- 101150112854 C5orf38 gene Proteins 0.000 claims description 2
- 101150016456 Hexa gene Proteins 0.000 claims description 2
- 101100072427 Homo sapiens ILDR2 gene Proteins 0.000 claims description 2
- 101000667262 Homo sapiens von Willebrand factor A domain-containing protein 7 Proteins 0.000 claims description 2
- 101150028523 Med28 gene Proteins 0.000 claims description 2
- 101150054526 PRDM7 gene Proteins 0.000 claims description 2
- 101150078257 rarg gene Proteins 0.000 claims description 2
- 239000003153 chemical reaction reagent Substances 0.000 abstract description 4
- 208000024891 symptom Diseases 0.000 description 16
- 238000012360 testing method Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 6
- 210000004556 brain Anatomy 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 4
- 229960001534 risperidone Drugs 0.000 description 4
- RAPZEAPATHNIPO-UHFFFAOYSA-N risperidone Chemical compound FC1=CC=C2C(C3CCN(CC3)CCC=3C(=O)N4CCCCC4=NC=3C)=NOC2=C1 RAPZEAPATHNIPO-UHFFFAOYSA-N 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 229940005529 antipsychotics Drugs 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 230000000698 schizophrenic effect Effects 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- 102100025669 CUGBP Elav-like family member 6 Human genes 0.000 description 1
- 208000028698 Cognitive impairment Diseases 0.000 description 1
- 102000006441 Dopamine Plasma Membrane Transport Proteins Human genes 0.000 description 1
- 108010044266 Dopamine Plasma Membrane Transport Proteins Proteins 0.000 description 1
- 108050004812 Dopamine receptor Proteins 0.000 description 1
- 102000015554 Dopamine receptor Human genes 0.000 description 1
- 206010058314 Dysplasia Diseases 0.000 description 1
- 101001045440 Homo sapiens Beta-hexosaminidase subunit alpha Proteins 0.000 description 1
- 101000914150 Homo sapiens CUGBP Elav-like family member 6 Proteins 0.000 description 1
- 101001132658 Homo sapiens Retinoic acid receptor gamma Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102100033912 Retinoic acid receptor gamma Human genes 0.000 description 1
- 239000000935 antidepressant agent Substances 0.000 description 1
- 229940005513 antidepressants Drugs 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 229960004170 clozapine Drugs 0.000 description 1
- QZUDBNBUXVUHMW-UHFFFAOYSA-N clozapine Chemical compound C1CN(C)CCN1C1=NC2=CC(Cl)=CC=C2NC2=CC=CC=C12 QZUDBNBUXVUHMW-UHFFFAOYSA-N 0.000 description 1
- 208000010877 cognitive disease Diseases 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 230000006718 epigenetic regulation Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 210000001320 hippocampus Anatomy 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000004050 mood stabilizer Substances 0.000 description 1
- 229940127237 mood stabilizer Drugs 0.000 description 1
- 230000003988 neural development Effects 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000001272 neurogenic effect Effects 0.000 description 1
- 238000002610 neuroimaging Methods 0.000 description 1
- 229960005017 olanzapine Drugs 0.000 description 1
- KVWDHTXUZHCGIO-UHFFFAOYSA-N olanzapine Chemical compound C1CN(C)CCN1C1=NC2=CC=CC=C2NC2=C1C=C(C)S2 KVWDHTXUZHCGIO-UHFFFAOYSA-N 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000036299 sexual function Effects 0.000 description 1
- 230000002739 subcortical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013106 supervised machine learning method Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Abstract
本发明提供了一种用于预测抗精神病药物疗效的DNA甲基化标记物。本发明还提供上述甲基化标记物在制备用于预测抗精神病药物疗效的诊断试剂和/或辅助诊断试剂和/或诊断试剂盒中的用途。本发明进一步提供上述甲基化标记物的筛选方法。用于预测抗精神病药物疗效的DNA甲基化标记物预测抗精神病药物治疗疗效,可以提高抗精神病药物疗效的预测准确率,节约成本,适于推广应用,具有较好的应用前景;本发明甲基化标记物的筛选方法,简单、科学、可靠。
Description
技术领域
本发明专利涉及生物技术领域,具体是指一种用于预测抗精神病药物疗效的DNA甲基化标记物及其筛选方法和应用。
背景技术
精神分裂症是一种重型精神障碍,多发病于青少年及青年早期,表现为阳性症状、阴性症状及认知功能损害等症状群。该病发病率约为1%,致残率高,相当比例的患者存在症状迁延不愈或渐进性功能衰退的现象。抗精神病药物治疗仍是精神分裂症的主要治疗方法。早期抗精神病药物治疗应答情况是该病长期症状和功能结局的最强有力的预测因素之一。然而,迄今仍缺乏客观的生物学标记物来预测患者的早期治疗应答。目前已有初步的脑结构协变连接研究显示精神分裂症患者可能存在皮层下脑结构同步发育异常,且与患者的行为学表型相关。目前借助“在体”脑影像技术从脑结构及功能网络水平上发现了可预测抗精神病药物早期疗效的神经生物学标记物。然而,脑网络连接是从宏观角度预判抗精神病药早期疗效,微观上,脑网络连接可能受基因表达及神经可塑性变化的影响,而基因表达又在很大程度上受表观遗传的调控。已有研究证实表观遗传学变化与脑结构体积变化之间存在关联。因此我们进一步推测表观遗传或有预判精神分裂症患者早期治疗应答的潜在价值。表观遗传是指DNA序列无改变,但基因表达发生变化,进而改变基因功能并引起表型变化。在表观遗传修饰中,DNA甲基化是研究得较深入且较重要的调节基因表达的方式之一。目前,已有研究初步揭示抗精神病药物治疗可影响DNA甲基化水平,如奥氮平可引起大鼠海马、小脑中编码多巴胺受体、转运体等基因甲基化水平普遍增高;氯氮平可引起小鼠神经发育相关基因甲基化水平改变等。然而,仍未有研究探讨DNA甲基化在预判抗精神病药早期疗效中的作用。
因此,找到准确的DNA甲基化标记物是预测抗精神病药物疗效转归的至关重要的一步。
发明内容
本发明旨在至少在一定程度上解决现有技术中存在的技术问题之一,为此,提供一种用于预测抗精神病药物疗效的DNA甲基化标记物,本发明还提供上述甲基化标记物在制备用于预测抗精神病药物疗效的诊断试剂和/或辅助诊断试剂和/或诊断试剂盒中的用途。本发明进一步提供上述甲基化标记物的筛选方法。用于预测抗精神病药物疗效的DNA甲基化标记物预测抗精神病药物治疗疗效,可以提高抗精神病药物疗效的预测准确率,节约成本,适于推广应用,具有较好的应用前景;本发明甲基化标记物的筛选方法,简单、科学、可靠。通过对DNA甲基化数据分析,发现与抗精神病药物疗效预测相关的新的生物标记物。
在本发明的第一方面,本发明提供一种用于预测抗精神病药物疗效的DNA甲基化标记物,所述用于预测抗精神病药物疗效的DNA甲基化标记物选自人第1号染色体上的甲基化CpG位点cg08348962、第4号染色体上的甲基化CpG位点cg27184628、第5号染色体上的甲基化CpG位点cg19679633、第6号染色体上的甲基化CpG位点cg10652641、第8号染色体上的甲基化CpG位点cg21442626、第12号染色体上的甲基化CpG位点cg09265000、第15号染色体上的甲基化CpG位点cg27079104、第16号染色体上的甲基化CpG位点cg06295223、第19号染色体上的甲基化CpG位点cg07237326中的一个或多个。
优选地,所述标记物选自人第1号染色体上的甲基化CpG位点cg08348962、第4号染色体上的甲基化CpG位点cg27184628、第5号染色体上的甲基化CpG位点cg19679633、第6号染色体上的甲基化CpG位点cg10652641、第8号染色体上的甲基化CpG位点cg21442626、第12号染色体上的甲基化CpG位点cg09265000、第15号染色体上的甲基化CpG位点cg27079104、第16号染色体上的甲基化CpG位点cg06295223中的一个或多个。
更优选地,所述甲基化CpG位点cg08348962位于ILDR2基因上;所述甲基化CpG位点cg27184628位于MED28基因上;所述甲基化CpG位点cg19679633位于C5orf38基因上;所述甲基化CpG位点cg10652641位于C6orf27基因上;所述甲基化CpG位点cg21442626位于ATP6V1C1基因上;所述甲基化CpG位点cg09265000位于RARG基因上;所述甲基化CpG位点cg27079104位于HEXA基因上;所述甲基化CpG位点cg06295223位于PRDM7基因上。
在本发明的第二方面,本发明提供一种上述甲基化标记物在制备用于预测抗精神病药物疗效的诊断试剂和/或辅助诊断试剂和/或诊断试剂盒中的用途。
在本发明的第三方面,本发明提供一种试剂盒,其将上述甲基化标记物作为抗精神病药物疗效的标记物。
在本发明的第四方面,本发明提供一种上述用于预测抗精神病药物疗效的DNA甲基化标记物的筛选方法,包括如下步骤:
步骤1)、基于甲基化Beta值筛选:采用Illumina 450K甲基化芯片检测精神分裂症患者治疗有效者与无效者的全基因组45万甲基化CpG位点的甲基化水平即Beta值,去掉所检测到的甲基化CpG位点中存多态性的CpG位点,并获得剩余甲基化CpG位点的Beta值;
步骤2)、基于Fold-change(FC)的阈值筛选:根据步骤1)计算得到的剩余甲基化CpG位点的Beta值进一步计算各甲基化CpG位点的FC值,进一步筛选出FC值大于1.15的甲基化CpG位点;
步骤3)、基于统计检验筛选:根据步骤2)筛选出的甲基化CpG位点的甲基化Beta值选择不同的检验方法进行两总体的差异检验,筛选出治疗有效组与无效组两组间有显著差异的甲基化CpG位点;
步骤4)、构建疗效预测模型:对步骤3)筛选出的治疗有效组与无效组两组间有显著差异的甲基化CpG位点的Beta值,构建抗精神病药物治疗疗效预测模型,通过采用机器学习支持向量机模型和十折交叉验证所述甲基化CpG位点,计算治疗有效者与无效者样本的预测准确率;
步骤5)、获得用于预测抗精神病药物疗效的DNA甲基化标记物:所述步骤4)的抗精神病药物疗效预测模型中对应的甲基化CpG位点中的一个或多个即为可预测抗精神病药物疗效的DNA甲基化标记物。
在本发明的技术方案中,所述步骤3)中,若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布且满足方差齐性条件,采用t检验;若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布但不满足方差齐性条件,采用近似t检验;若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据不服从正态分布,采用Wilcoxon秩和检验,并且P值经FDR校正后小于0.05的CpG位点被认为存在显著差异。
在本发明的技术方案中,所述步骤4)中,所述机器学习支持向量机模型,使用R语言平台(v3.6.3)进行数据分析,所使用的工具包为e1071(v 1.7.4),并结合十折交叉验证,以上述步骤3)中得到的差异甲基化CpG位点的甲基化Beta值构建抗精神病药物疗效预测模型进行相互验证。
在本发明的技术方案中,所述步骤4)中,预测准确率的计算公式为:
其中,a为预测为治疗应答且实际也为治疗应答患者样本个数,b为预测为治疗应答患者但实际为治疗无应答个数,c为预测为治疗无应答但实际为治疗应答患者样本个数,d为预测为治疗无应答且实际也为治疗无应答样本个数。
本发明的有益效果在于:
1、本发明提供了一种用于预测抗精神病药物疗效的DNA甲基化标记物;用于预测抗精神病药物疗效的DNA甲基化标记物包括人第1号染色体上的甲基化CpG位点cg08348962、第4号染色体上的甲基化CpG位点cg27184628、第5号染色体上的甲基化CpG位点cg19679633、第6号染色体上的甲基化CpG位点cg10652641、第8号染色体上的甲基化CpG位点cg21442626、第12号染色体上的甲基化CpG位点cg09265000、第15号染色体上的甲基化CpG位点cg27079104、第16号染色体上的甲基化CpG位点cg06295223、第19号染色体上的甲基化CpG位点cg07237326中的至少一个,也可将该9个甲基化CpG位点联合起来预测抗精神病药物治疗疗效,由此,可提高抗精神病药物疗效的预测准确率,节约成本,适于推广应用,具有较好的应用前景;
2、本发明提供一种上述甲基化标记物在制备用于预测抗精神病药物疗效的诊断试剂和/或辅助诊断试剂和/或诊断试剂盒中的用途;可通过DNA甲基化标记物的甲基化水平来预测抗精神病药物疗效转归;
3、本发明提供一种上述甲基化标记物的筛选方法,通过该方法可筛选出用于预测抗精神病药物疗效的DNA甲基化标记物,其简单、科学、可靠。
附图说明
图1为可预测抗精神病药物疗效的甲基化CpG位点筛选方法流程图;
图2为十折交叉验证在测试集上的平均准确率结果图。
具体实施方式
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。
实施例1
用于预测抗精神病药物疗效的DNA甲基化标记物的筛选方法,包括如下步骤,
步骤1):基于甲基化Beta值筛选:采用Illumina 450K甲基化芯片检测精神分裂症患者治疗有效者与无效者的全基因组甲基化CpG位点的甲基化水平即Beta值,去掉所检测到的甲基化CpG位点中存多态性的CpG位点,并获得剩余甲基化CpG位点的Beta值;
本实施例通过招募首次发作且未经治疗的精神分裂症患者38例,并给予8周利培酮单一抗精神病药物治疗,治疗8周后评估患者疗效,根据Andreasen缓解标准,将患者分为缓解与未缓解组。临床症状评估、药物干预、疗效评定如下:
临床症状评估:采用阳性和阴性症状量表(Positive and Negative SyndromeScale,PANSS)评定患者的症状严重程度。PANSS共包括三个维度:阳性症状(PANSS-positive symptom,PANSS-P,由P1,P2,P3,P4,P5,P6,P7组成),阴性症状(PANSS-negativesymptom,PANSS-N,由N1,N2,N3,N4,N5,N6,N7组成),以及一般精神病理症状(PANSS-general psychopathological symptom,PANSS-G,由G1~G16组成)。
药物干预:患者接受利培酮单药治疗8周,治疗剂量从1mg/日开始,根据临床表现逐渐加量,在开始治疗的2周内达到并稳定在治疗剂量2-4mg,若患者症状未见明显改善可增加剂量,最高可至6mg/日。所有患者均未使用情绪稳定剂和抗抑郁剂。由两名有经验的医师每周评估利培酮的安全性,分别在基线及治疗8周随访时采用PANSS量表评估病人的症状严重程度。
疗效评定:利培酮治疗8周后疗效评定根据Anderson等所成立的精神分裂症缓解工作组(Remission in Schizophrenia Working Group,RSWG)的缓解标准。RSWG组将P1、P2、P3、N1、N4、N6、G5、G9等PANSS的8项评分均≤3,且维持至少6个月定义为缓解。本研究治疗时间标准定为8周,借助Anderson分类标准将患者分为治疗缓解组14例与未缓解组24例。
在入组时于固定时间(早上6:30)采集患者治疗前(基线期)的全血DNA,基于Illumina450K芯片检测所有患者全基因组45万DNA甲基化CpG位点的Beta值。去掉所检测到的甲基化CpG位点中存多态性的CpG位点,并获得剩余27万甲基化CpG位点的甲基化Beta值,在得到的27万甲基化CpG位点基础上分析抗精神病药物治疗8周缓解组与未缓解组基线期(治疗前)CpG位点Beta值的差异。
步骤2)、基于Fold-change(FC)的阈值筛选:根据步骤1)计算得到的剩余27万甲基化CpG位点的Beta值进一步计算各甲基化CpG位点的FC值,进一步筛选出FC值大于1.15的甲基化CpG位点9837个;
所述步骤2)中,对于来自缓解组、未缓解(分别是以下公式中的A、B两组)两组样本数据,FC值的定义如下:
基于Fold-change(FC)的阈值筛选,筛选出FC值大于1.15的甲基化CpG位点9837个,对于筛选出的FC值大于1.15的9837个甲基化CpG位点进行进一步的差异分析。
步骤3)、基于统计检验筛选:根据步骤2)筛选出的甲基化CpG位点的甲基化Beta值选择不同的检验方法进行两总体的差异检验,筛选出治疗有效组与无效组两组间有显著差异的甲基化CpG位点;
所述步骤3)中,若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布且满足方差齐性条件,采用t检验;若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布但不满足方差齐性条件,采用近似t检验;若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据不服从正态分布,采用Wilcoxon秩和检验,并且P值经FDR校正后小于0.05的CpG位点被认为存在显著差异。由此,筛选出治疗有效组与无效组两组间有显著差异的甲基化CpG位点9个。
步骤4)、构建疗效预测模型:对步骤3)筛选出的治疗有效组与无效组两组间有显著差异的9个甲基化CpG位点CpG位点的Beta值,构建抗精神病药物治疗疗效预测模型,通过采用机器学习支持向量机模型和十折交叉验证所述甲基化CpG位点,计算治疗有效者与无效者样本的预测准确率;
十折交叉验证(10-fold cross-validation),是常用的测试方法,用来测试算法预测的准确性。将数据集分成十分,轮流将其中9份作为训练数据,1份作为测试数据进行预测。每次试验都会得出相应的准确率。10次的结果的准确率的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证(例如10次10折交叉验证),再求其均值,作为对算法准确性的估计。
由上述方法验证所述9个甲基化CpG位点中的一个或多个预测抗精神病药物疗效模型的的准确率高达100%;
十次十折交叉验证在测试集的平均准确率为100%,每次十折交叉验证在测试集上的平均准确率如下图2所示。图中,横坐标为次数,纵坐标为准确率。
所述步骤4)中,所述机器学习支持向量机模型,使用R语言平台(v3.6.3)进行数据分析,所使用的工具包为e1071(v 1.7.4),并结合十折交叉验证,以上述步骤3)中的9个差异甲基化CpG位点的甲基化Beta值构建抗精神病药物疗效预测模型进行相互验证。
所述步骤4)中,预测准确率的计算公式为:
其中,a为预测为治疗应答且实际也为治疗应答患者样本个数,b为预测为治疗应答患者但实际为治疗无应答个数,c为预测为治疗无应答但实际为治疗应答患者样本个数,d为预测为治疗无应答且实际也为治疗无应答样本个数。
所述步骤(4)详细如下:本实施例使用支持向量机方法,使用R语言平台(v3.6.3)进行数据分析,所用工具包为e1071(v 1.7.4),并结合交叉验证,以上述步骤(3)中的9个差异CpG位点的甲基化Beta值构建预测模型进行相互验证。
本实施例使用R语言平台(v3.6.3)进行数据分析,所用工具包为e1071(v 1.7.4);通过对样本数据进行甲基化分析,获得9个显著(校正后P-value<0.05)、可能与抗精神病药物早期治疗应答相关的甲基化CpG位点(见表1),并计算出所述甲基化CpG位点的甲基化Beta值来确定DNA甲基化水平,Beta值=来自甲基化珠粒类型的强度值/(来自甲基化的强度值+来自未甲基化珠粒类型的强度值+100)。上述CpG位点即为用于预测抗精神病药物早期治疗应答的DNA甲基化标记物。用于预测抗精神病药物疗效的DNA甲基化标记物的筛选方法得到的用于预测抗精神病药物疗效的DNA甲基化标记物如表1所示。
表1预测抗精神病药物疗效的DNA甲基化标记物
本实施例通过机器学习支持向量机(support vector machine,SVM)方法,利用这9个CpGCpG位点甲基化水平即Beta值对患者疗效进行预测,十次十折交叉验证(10-foldcross-validation)平均准确率为100%。
CpG位点以上述甲基化CpG位点的甲基化Beta值构建预测模型,通过计算样本预测准确率验证该模型的可行性,样本预测准确率计算公式为:
其中,a为预测为治疗应答且实际也为治疗应答患者样本个数,b为预测为治疗应答患者但实际为治疗无应答个数,c为预测为治疗无应答但实际为治疗应答患者样本个数,d为预测为治疗无应答且实际也为治疗无应答样本个数。
使用机器学习方法(支持向量机、交叉验证)对上述预测模型进行相互验证:
在机器学习方法中,支持向量机(SVM)是一种有监督的机器学习方法,通常用于数据的二进制分类。给定分类问题中的输入数据和学习目标X={X1,...,XN},y={y1,...,yN},输入数据的每个样本都包含多个特征,从而构成一个特征空间:Xi=[X1,...,Xn]∈X。学习目标y∈{-1,1}是一个二进制变量,表示负例和正例。
若输入数据所在的特征空间存在作为决策边界的超平面将学习目标按正类和负类分开,并使任意样本的点到平面距离大于等于1:
决策边界:wTX+b=0
点到平面距离:yi(wTXi+b)≥1
则称该分类问题具有线性可分离性。参数w和b是分别是超平面的法向向量和截距。
满足此条件的决策边界实际上构造了两个平行的超平面作为区间边界,以区分样本的分类。
步骤5)、获得用于预测抗精神病药物疗效的DNA甲基化标记物:所述步骤4)的抗精神病药物疗效预测模型中对应的9个甲基化CpG位点中的一个或多个即为可预测抗精神病药物疗效的DNA甲基化标记物。
由本实施例预测抗精神病药物疗效的DNA甲基化标记物的筛选方法得到的两组间差异甲基化CpG位点9个(见表1,对应基因包括RARG、HEXA、CELF6等,分别参与神经源性分化过程,神经退行性疾病、孤独症的发病机制等)。可预测患者疗效的CpG位点有(见表1):cg19679633、cg27184628、cg06295223、cg27079104、cg21442626、cg07237326、cg09265000、cg10652641、cg08348962。
利用这9个CpG位点的甲基化Beta值中的一个或多个或联合起来预测精神分裂症早期治疗应答,适于大规模推广应用。
实施例2
本实施例提供了一种用于预测抗精神病药物疗效的诊断试剂盒,所述诊断试剂盒将上述甲基化标记物作为抗精神病药物疗效的标记物。
进一步地,本实施例提供了一种抗精神病药物疗效预测的方法,包括:
1、提取待测样本的基因组DNA;
2、以步骤1中的基因组DNA为模板,利用上述试剂盒进行PCR扩增;
3、测序;
4、得到DNA甲基化检测结果;
5、根据人第1号染色体上的甲基化CpG位点cg08348962、第4号染色体上的甲基化CpG位点cg27184628、第5号染色体上的甲基化CpG位点cg19679633、第6号染色体上的甲基化CpG位点cg10652641、第8号染色体上的甲基化CpG位点cg21442626、第12号染色体上的甲基化CpG位点cg09265000、第15号染色体上的甲基化CpG位点cg27079104、第16号染色体上的甲基化CpG位点cg06295223、第19号染色体上的甲基化CpG位点cg07237326中的至少一个CpG位点甲基化水平,实现对待测样本抗精神病药物疗效预测。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (8)
1.一种用于预测抗精神病药物疗效的DNA甲基化标记物,其特征在于,所述用于预测抗精神病药物疗效的DNA甲基化标记物选自人第1号染色体上的甲基化CpG位点cg08348962、第4号染色体上的甲基化CpG位点cg27184628、第5号染色体上的甲基化CpG位点cg19679633、第6号染色体上的甲基化CpG位点cg10652641、第8号染色体上的甲基化CpG位点cg21442626、第12号染色体上的甲基化CpG位点cg09265000、第15号染色体上的甲基化CpG位点cg27079104、第16号染色体上的甲基化CpG位点cg06295223、第19号染色体上的甲基化CpG位点cg07237326中的一个或多个。
2.根据权利要求1所述的DNA甲基化标记物,其特征在于,所述甲基化CpG位点cg08348962位于ILDR2基因上;所述甲基化CpG位点cg27184628位于MED28基因上;所述甲基化CpG位点cg19679633位于C5orf38基因上;所述甲基化CpG位点cg10652641位于C6orf27基因上;所述甲基化CpG位点cg21442626位于ATP6V1C1基因上;所述甲基化CpG位点cg09265000位于RARG基因上;所述甲基化CpG位点cg27079104位于HEXA基因上;所述甲基化CpG位点cg06295223位于PRDM7基因上。
3.一种权利要求1或2所述的甲基化标记物在制备用于预测抗精神病药物疗效的诊断试剂和/或辅助诊断试剂和/或诊断试剂盒中的用途。
4.一种试剂盒,其特征在于,其将权利要求1或2所述的甲基化标记物作为抗精神病药物疗效预测的标记物。
5.一种用于预测抗精神病药物疗效的DNA甲基化标记物的筛选方法,其特征在于,包括如下步骤:
步骤1)、基于甲基化Beta值筛选:采用Illumina 450K甲基化芯片检测精神分裂症患者治疗有效者与无效者的全基因组45万甲基化CpG位点的甲基化水平即Beta值,去掉所检测到的甲基化CpG位点中存多态性的CpG位点,并获得剩余甲基化CpG位点的Beta值;
步骤2)、基于Fold-change(FC)的阈值筛选:根据步骤1)计算得到的剩余甲基化CpG位点的Beta值进一步计算各甲基化CpG位点的FC值,进一步筛选出FC值大于1.15的甲基化CpG位点;
步骤3)、基于统计检验筛选:根据步骤2)筛选出的甲基化CpG位点的甲基化Beta值选择不同的检验方法进行两总体的差异检验,筛选出治疗有效组与无效组两组间有显著差异的甲基化CpG位点;
步骤4)、构建疗效预测模型:对步骤3)筛选出的治疗有效组与无效组两组间有显著差异的甲基化CpG位点的Beta值,构建抗精神病药物治疗疗效预测模型,通过采用机器学习支持向量机模型和十折交叉验证所述甲基化CpG位点,计算治疗有效者与无效者样本的预测准确率;
步骤5)、获得用于预测抗精神病药物疗效的DNA甲基化标记物:所述步骤4)的抗精神病药物疗效预测模型中对应的9个甲基化CpG位点中的一个或多个即为可预测抗精神病药物疗效的DNA甲基化标记物。
6.根据权利要求5所述的筛选方法,其特征在于,所述步骤3)中,若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布且满足方差齐性条件,采用t检验;若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布但不满足方差齐性条件,采用近似t检验;若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据不服从正态分布,采用Wilcoxon秩和检验,并且P值经FDR校正后小于0.05的CpG位点被认为存在显著差异。
7.根据权利要求5所述的筛选方法,其特征在于,所述步骤4)中,所述机器学习支持向量机模型,使用R语言平台(v3.6.3)进行数据分析,所使用的工具包为e1071(v 1.7.4),并结合十折交叉验证,以上述步骤3)中得到的差异甲基化CpG位点的甲基化Beta值构建抗精神病药物疗效预测模型进行相互验证。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110075081.1A CN112813155A (zh) | 2021-01-20 | 2021-01-20 | 预测抗精神病药物疗效的dna甲基化标记物及筛选方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110075081.1A CN112813155A (zh) | 2021-01-20 | 2021-01-20 | 预测抗精神病药物疗效的dna甲基化标记物及筛选方法和应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112813155A true CN112813155A (zh) | 2021-05-18 |
Family
ID=75858450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110075081.1A Pending CN112813155A (zh) | 2021-01-20 | 2021-01-20 | 预测抗精神病药物疗效的dna甲基化标记物及筛选方法和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112813155A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113355406A (zh) * | 2021-05-24 | 2021-09-07 | 北京大学第六医院 | 抗精神病药物疗效预测相关的甲基化生物标记 |
CN116200485A (zh) * | 2022-11-01 | 2023-06-02 | 广东省生殖科学研究所(广东省生殖医院) | 一种甲基化位点在子宫内膜异位症诊断和分型中的应用 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103103256A (zh) * | 2012-12-20 | 2013-05-15 | 宁波大学 | 可用于检测与精神分裂症相关的drd4基因启动子区甲基化程度的试剂盒及其应用 |
WO2015054645A1 (en) * | 2013-10-10 | 2015-04-16 | Wake Forest University Health Sciences | Compositions and methods for epigenetic regulation of long chain polyunsaturated fatty acid production |
CN104862310A (zh) * | 2015-05-04 | 2015-08-26 | 张理义 | 精神分裂症生物标记物、筛选方法及试剂盒 |
CN105228521A (zh) * | 2013-01-31 | 2016-01-06 | 布雷恩勒布斯有限公司 | 诊断抑郁症和监控治疗效果的新的诊断方法 |
CN109355381A (zh) * | 2018-09-14 | 2019-02-19 | 深圳市太空科技南方研究院 | 用于预测pd1/l1抑制剂疗效的生物标记物和方法 |
CN110023752A (zh) * | 2016-09-26 | 2019-07-16 | 精密医药控股私人有限公司 | 精神分裂症和分裂情感性精神病的诊断、预后和治疗 |
CN110317868A (zh) * | 2019-08-09 | 2019-10-11 | 新疆医科大学第二附属医院 | 一种基于多基因组合交互作用预测二代抗精神病药物治疗精神分裂症致体重增加分析方法 |
CN111020020A (zh) * | 2019-07-05 | 2020-04-17 | 深圳华大生命科学研究院 | 一种精神分裂症的生物标志物组合、其应用及metaphlan2筛选方法 |
-
2021
- 2021-01-20 CN CN202110075081.1A patent/CN112813155A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103103256A (zh) * | 2012-12-20 | 2013-05-15 | 宁波大学 | 可用于检测与精神分裂症相关的drd4基因启动子区甲基化程度的试剂盒及其应用 |
CN105228521A (zh) * | 2013-01-31 | 2016-01-06 | 布雷恩勒布斯有限公司 | 诊断抑郁症和监控治疗效果的新的诊断方法 |
WO2015054645A1 (en) * | 2013-10-10 | 2015-04-16 | Wake Forest University Health Sciences | Compositions and methods for epigenetic regulation of long chain polyunsaturated fatty acid production |
CN104862310A (zh) * | 2015-05-04 | 2015-08-26 | 张理义 | 精神分裂症生物标记物、筛选方法及试剂盒 |
CN110023752A (zh) * | 2016-09-26 | 2019-07-16 | 精密医药控股私人有限公司 | 精神分裂症和分裂情感性精神病的诊断、预后和治疗 |
CN109355381A (zh) * | 2018-09-14 | 2019-02-19 | 深圳市太空科技南方研究院 | 用于预测pd1/l1抑制剂疗效的生物标记物和方法 |
CN111020020A (zh) * | 2019-07-05 | 2020-04-17 | 深圳华大生命科学研究院 | 一种精神分裂症的生物标志物组合、其应用及metaphlan2筛选方法 |
CN110317868A (zh) * | 2019-08-09 | 2019-10-11 | 新疆医科大学第二附属医院 | 一种基于多基因组合交互作用预测二代抗精神病药物治疗精神分裂症致体重增加分析方法 |
Non-Patent Citations (2)
Title |
---|
BO CAO等: "Treatment response prediction and individualized identification of first-episode drug-naïve schizophrenia using brain functional connectivity", 《MOLECULAR PSYCHIATRY》 * |
王承敏等: "精神分裂症伴代谢综合征的研究进展", 《中国慢性病预防与控制》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113355406A (zh) * | 2021-05-24 | 2021-09-07 | 北京大学第六医院 | 抗精神病药物疗效预测相关的甲基化生物标记 |
CN116200485A (zh) * | 2022-11-01 | 2023-06-02 | 广东省生殖科学研究所(广东省生殖医院) | 一种甲基化位点在子宫内膜异位症诊断和分型中的应用 |
CN116200485B (zh) * | 2022-11-01 | 2023-12-15 | 广东省生殖科学研究所(广东省生殖医院) | 一种甲基化位点在子宫内膜异位症诊断和分型中的应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mahendran et al. | A deep learning framework with an embedded-based feature selection approach for the early detection of the Alzheimer's disease | |
Siu et al. | Functional DNA methylation signatures for autism spectrum disorder genomic risk loci: 16p11. 2 deletions and CHD8 variants | |
Oh et al. | Predicting autism spectrum disorder using blood-based gene expression signatures and machine learning | |
Le et al. | Identification and replication of RNA-Seq gene network modules associated with depression severity | |
Jonassen et al. | Serotonin transporter polymorphisms (5-HTTLPR) in emotion processing: implications from current neurobiology | |
CN112813155A (zh) | 预测抗精神病药物疗效的dna甲基化标记物及筛选方法和应用 | |
Habtewold et al. | Association of schizophrenia polygenic risk score with data-driven cognitive subtypes: a six-year longitudinal study in patients, siblings and controls | |
C. Silva et al. | Cross-tissue analysis of blood and brain epigenome-wide association studies in Alzheimer’s disease | |
Shazadi et al. | Validation of a multigenic model to predict seizure control in newly treated epilepsy | |
Lee et al. | Analysis of blood-based gene expression signature in first-episode psychosis | |
Huang et al. | Integrated analysis on transcriptome and behaviors defines HTT repeat-dependent network modules in Huntington's disease | |
Kim et al. | Examining redox modulation pathways in the post-mortem frontal cortex in patients with bipolar disorder through data mining of microRNA expression datasets | |
CN112877419A (zh) | 预测精神分裂症发生风险的dna甲基化标记物及筛选方法和应用 | |
Chen et al. | Polygenic risk scores for subtyping of schizophrenia | |
US10865446B2 (en) | DNA methylation biomarkers of post-partum depression risk | |
Beaudin et al. | Autosomal recessive ataxias | |
CN111020020A (zh) | 一种精神分裂症的生物标志物组合、其应用及metaphlan2筛选方法 | |
Shafana et al. | Exploring the molecular subclasses and stage-specific genes of oral cancer: A bioinformatics analysis | |
US20220049304A1 (en) | Dna methylation biomarkers of post-partum depression risk | |
Chen et al. | Integrated bioinformatics-based identification of diagnostic markers in Alzheimer disease | |
Tieskens et al. | Sensation-seeking-related DNA methylation and the development of delinquency: A longitudinal epigenome-wide study | |
Rastad et al. | Parallel molecular alteration between Alzheimer’s disease and major depressive disorder in the human brain dorsolateral prefrontal cortex: An insight from gene expression and methylation profile analyses | |
CN111020021A (zh) | 一种基于肠道菌群的小规模精神分裂症生物标志物组合、其应用及mOTU筛选方法 | |
Ramirez et al. | Epigenome-wide analysis identifies methylome profiles linked to obsessive-compulsive disorder, disease severity, and treatment response | |
Chen et al. | Design of ASD subtyping approach based on multi-omics data to promote personalized healthcare |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210518 |