CN112813155A

CN112813155A - 预测抗精神病药物疗效的dna甲基化标记物及筛选方法和应用

Info

Publication number: CN112813155A
Application number: CN202110075081.1A
Authority: CN
Inventors: 胡茂林; 邹秀芬; 刘忠纯; 宗小芬; 张钦然
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2021-01-20
Filing date: 2021-01-20
Publication date: 2021-05-18

Abstract

本发明提供了一种用于预测抗精神病药物疗效的DNA甲基化标记物。本发明还提供上述甲基化标记物在制备用于预测抗精神病药物疗效的诊断试剂和/或辅助诊断试剂和/或诊断试剂盒中的用途。本发明进一步提供上述甲基化标记物的筛选方法。用于预测抗精神病药物疗效的DNA甲基化标记物预测抗精神病药物治疗疗效，可以提高抗精神病药物疗效的预测准确率，节约成本，适于推广应用，具有较好的应用前景；本发明甲基化标记物的筛选方法，简单、科学、可靠。

Description

预测抗精神病药物疗效的DNA甲基化标记物及筛选方法和应用

技术领域

本发明专利涉及生物技术领域，具体是指一种用于预测抗精神病药物疗效的DNA甲基化标记物及其筛选方法和应用。

背景技术

精神分裂症是一种重型精神障碍，多发病于青少年及青年早期，表现为阳性症状、阴性症状及认知功能损害等症状群。该病发病率约为1％，致残率高，相当比例的患者存在症状迁延不愈或渐进性功能衰退的现象。抗精神病药物治疗仍是精神分裂症的主要治疗方法。早期抗精神病药物治疗应答情况是该病长期症状和功能结局的最强有力的预测因素之一。然而，迄今仍缺乏客观的生物学标记物来预测患者的早期治疗应答。目前已有初步的脑结构协变连接研究显示精神分裂症患者可能存在皮层下脑结构同步发育异常，且与患者的行为学表型相关。目前借助“在体”脑影像技术从脑结构及功能网络水平上发现了可预测抗精神病药物早期疗效的神经生物学标记物。然而，脑网络连接是从宏观角度预判抗精神病药早期疗效，微观上，脑网络连接可能受基因表达及神经可塑性变化的影响，而基因表达又在很大程度上受表观遗传的调控。已有研究证实表观遗传学变化与脑结构体积变化之间存在关联。因此我们进一步推测表观遗传或有预判精神分裂症患者早期治疗应答的潜在价值。表观遗传是指DNA序列无改变，但基因表达发生变化，进而改变基因功能并引起表型变化。在表观遗传修饰中，DNA甲基化是研究得较深入且较重要的调节基因表达的方式之一。目前，已有研究初步揭示抗精神病药物治疗可影响DNA甲基化水平，如奥氮平可引起大鼠海马、小脑中编码多巴胺受体、转运体等基因甲基化水平普遍增高；氯氮平可引起小鼠神经发育相关基因甲基化水平改变等。然而，仍未有研究探讨DNA甲基化在预判抗精神病药早期疗效中的作用。

因此，找到准确的DNA甲基化标记物是预测抗精神病药物疗效转归的至关重要的一步。

发明内容

本发明旨在至少在一定程度上解决现有技术中存在的技术问题之一，为此，提供一种用于预测抗精神病药物疗效的DNA甲基化标记物，本发明还提供上述甲基化标记物在制备用于预测抗精神病药物疗效的诊断试剂和/或辅助诊断试剂和/或诊断试剂盒中的用途。本发明进一步提供上述甲基化标记物的筛选方法。用于预测抗精神病药物疗效的DNA甲基化标记物预测抗精神病药物治疗疗效，可以提高抗精神病药物疗效的预测准确率，节约成本，适于推广应用，具有较好的应用前景；本发明甲基化标记物的筛选方法，简单、科学、可靠。通过对DNA甲基化数据分析，发现与抗精神病药物疗效预测相关的新的生物标记物。

在本发明的第一方面，本发明提供一种用于预测抗精神病药物疗效的DNA甲基化标记物，所述用于预测抗精神病药物疗效的DNA甲基化标记物选自人第1号染色体上的甲基化CpG位点cg08348962、第4号染色体上的甲基化CpG位点cg27184628、第5号染色体上的甲基化CpG位点cg19679633、第6号染色体上的甲基化CpG位点cg10652641、第8号染色体上的甲基化CpG位点cg21442626、第12号染色体上的甲基化CpG位点cg09265000、第15号染色体上的甲基化CpG位点cg27079104、第16号染色体上的甲基化CpG位点cg06295223、第19号染色体上的甲基化CpG位点cg07237326中的一个或多个。

优选地，所述标记物选自人第1号染色体上的甲基化CpG位点cg08348962、第4号染色体上的甲基化CpG位点cg27184628、第5号染色体上的甲基化CpG位点cg19679633、第6号染色体上的甲基化CpG位点cg10652641、第8号染色体上的甲基化CpG位点cg21442626、第12号染色体上的甲基化CpG位点cg09265000、第15号染色体上的甲基化CpG位点cg27079104、第16号染色体上的甲基化CpG位点cg06295223中的一个或多个。

更优选地，所述甲基化CpG位点cg08348962位于ILDR2基因上；所述甲基化CpG位点cg27184628位于MED28基因上；所述甲基化CpG位点cg19679633位于C5orf38基因上；所述甲基化CpG位点cg10652641位于C6orf27基因上；所述甲基化CpG位点cg21442626位于ATP6V1C1基因上；所述甲基化CpG位点cg09265000位于RARG基因上；所述甲基化CpG位点cg27079104位于HEXA基因上；所述甲基化CpG位点cg06295223位于PRDM7基因上。

在本发明的第二方面，本发明提供一种上述甲基化标记物在制备用于预测抗精神病药物疗效的诊断试剂和/或辅助诊断试剂和/或诊断试剂盒中的用途。

在本发明的第三方面，本发明提供一种试剂盒，其将上述甲基化标记物作为抗精神病药物疗效的标记物。

在本发明的第四方面，本发明提供一种上述用于预测抗精神病药物疗效的DNA甲基化标记物的筛选方法，包括如下步骤：

步骤1)、基于甲基化Beta值筛选：采用Illumina 450K甲基化芯片检测精神分裂症患者治疗有效者与无效者的全基因组45万甲基化CpG位点的甲基化水平即Beta值，去掉所检测到的甲基化CpG位点中存多态性的CpG位点，并获得剩余甲基化CpG位点的Beta值；

步骤2)、基于Fold-change(FC)的阈值筛选：根据步骤1)计算得到的剩余甲基化CpG位点的Beta值进一步计算各甲基化CpG位点的FC值，进一步筛选出FC值大于1.15的甲基化CpG位点；

步骤3)、基于统计检验筛选：根据步骤2)筛选出的甲基化CpG位点的甲基化Beta值选择不同的检验方法进行两总体的差异检验，筛选出治疗有效组与无效组两组间有显著差异的甲基化CpG位点；

步骤4)、构建疗效预测模型：对步骤3)筛选出的治疗有效组与无效组两组间有显著差异的甲基化CpG位点的Beta值，构建抗精神病药物治疗疗效预测模型，通过采用机器学习支持向量机模型和十折交叉验证所述甲基化CpG位点，计算治疗有效者与无效者样本的预测准确率；

步骤5)、获得用于预测抗精神病药物疗效的DNA甲基化标记物：所述步骤4)的抗精神病药物疗效预测模型中对应的甲基化CpG位点中的一个或多个即为可预测抗精神病药物疗效的DNA甲基化标记物。

在本发明的技术方案中，所述步骤3)中，若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布且满足方差齐性条件，采用t检验；若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布但不满足方差齐性条件，采用近似t检验；若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据不服从正态分布，采用Wilcoxon秩和检验，并且P值经FDR校正后小于0.05的CpG位点被认为存在显著差异。

在本发明的技术方案中，所述步骤4)中，所述机器学习支持向量机模型，使用R语言平台(v3.6.3)进行数据分析，所使用的工具包为e1071(v 1.7.4)，并结合十折交叉验证，以上述步骤3)中得到的差异甲基化CpG位点的甲基化Beta值构建抗精神病药物疗效预测模型进行相互验证。

在本发明的技术方案中，所述步骤4)中，预测准确率的计算公式为：

其中，a为预测为治疗应答且实际也为治疗应答患者样本个数，b为预测为治疗应答患者但实际为治疗无应答个数，c为预测为治疗无应答但实际为治疗应答患者样本个数，d为预测为治疗无应答且实际也为治疗无应答样本个数。

本发明的有益效果在于：

1、本发明提供了一种用于预测抗精神病药物疗效的DNA甲基化标记物；用于预测抗精神病药物疗效的DNA甲基化标记物包括人第1号染色体上的甲基化CpG位点cg08348962、第4号染色体上的甲基化CpG位点cg27184628、第5号染色体上的甲基化CpG位点cg19679633、第6号染色体上的甲基化CpG位点cg10652641、第8号染色体上的甲基化CpG位点cg21442626、第12号染色体上的甲基化CpG位点cg09265000、第15号染色体上的甲基化CpG位点cg27079104、第16号染色体上的甲基化CpG位点cg06295223、第19号染色体上的甲基化CpG位点cg07237326中的至少一个，也可将该9个甲基化CpG位点联合起来预测抗精神病药物治疗疗效，由此，可提高抗精神病药物疗效的预测准确率，节约成本，适于推广应用，具有较好的应用前景；

2、本发明提供一种上述甲基化标记物在制备用于预测抗精神病药物疗效的诊断试剂和/或辅助诊断试剂和/或诊断试剂盒中的用途；可通过DNA甲基化标记物的甲基化水平来预测抗精神病药物疗效转归；

3、本发明提供一种上述甲基化标记物的筛选方法，通过该方法可筛选出用于预测抗精神病药物疗效的DNA甲基化标记物，其简单、科学、可靠。

附图说明

图1为可预测抗精神病药物疗效的甲基化CpG位点筛选方法流程图；

图2为十折交叉验证在测试集上的平均准确率结果图。

具体实施方式

下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解，下面的实施例仅用于说明本发明，而不应视为限定本发明的范围。实施例中未注明具体技术或条件的，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。

实施例1

用于预测抗精神病药物疗效的DNA甲基化标记物的筛选方法，包括如下步骤，

步骤1)：基于甲基化Beta值筛选：采用Illumina 450K甲基化芯片检测精神分裂症患者治疗有效者与无效者的全基因组甲基化CpG位点的甲基化水平即Beta值，去掉所检测到的甲基化CpG位点中存多态性的CpG位点，并获得剩余甲基化CpG位点的Beta值；

本实施例通过招募首次发作且未经治疗的精神分裂症患者38例，并给予8周利培酮单一抗精神病药物治疗，治疗8周后评估患者疗效，根据Andreasen缓解标准，将患者分为缓解与未缓解组。临床症状评估、药物干预、疗效评定如下：

临床症状评估：采用阳性和阴性症状量表(Positive and Negative SyndromeScale,PANSS)评定患者的症状严重程度。PANSS共包括三个维度：阳性症状(PANSS-positive symptom，PANSS-P，由P1，P2，P3，P4，P5，P6，P7组成)，阴性症状(PANSS-negativesymptom，PANSS-N，由N1，N2，N3，N4，N5，N6，N7组成)，以及一般精神病理症状(PANSS-general psychopathological symptom，PANSS-G，由G1～G16组成)。

药物干预：患者接受利培酮单药治疗8周，治疗剂量从1mg/日开始，根据临床表现逐渐加量，在开始治疗的2周内达到并稳定在治疗剂量2-4mg，若患者症状未见明显改善可增加剂量，最高可至6mg/日。所有患者均未使用情绪稳定剂和抗抑郁剂。由两名有经验的医师每周评估利培酮的安全性，分别在基线及治疗8周随访时采用PANSS量表评估病人的症状严重程度。

疗效评定：利培酮治疗8周后疗效评定根据Anderson等所成立的精神分裂症缓解工作组(Remission in Schizophrenia Working Group,RSWG)的缓解标准。RSWG组将P1、P2、P3、N1、N4、N6、G5、G9等PANSS的8项评分均≤3，且维持至少6个月定义为缓解。本研究治疗时间标准定为8周，借助Anderson分类标准将患者分为治疗缓解组14例与未缓解组24例。

在入组时于固定时间(早上6:30)采集患者治疗前(基线期)的全血DNA，基于Illumina450K芯片检测所有患者全基因组45万DNA甲基化CpG位点的Beta值。去掉所检测到的甲基化CpG位点中存多态性的CpG位点，并获得剩余27万甲基化CpG位点的甲基化Beta值，在得到的27万甲基化CpG位点基础上分析抗精神病药物治疗8周缓解组与未缓解组基线期(治疗前)CpG位点Beta值的差异。

步骤2)、基于Fold-change(FC)的阈值筛选：根据步骤1)计算得到的剩余27万甲基化CpG位点的Beta值进一步计算各甲基化CpG位点的FC值，进一步筛选出FC值大于1.15的甲基化CpG位点9837个；

所述步骤2)中，对于来自缓解组、未缓解(分别是以下公式中的A、B两组)两组样本数据，FC值的定义如下：

基于Fold-change(FC)的阈值筛选，筛选出FC值大于1.15的甲基化CpG位点9837个，对于筛选出的FC值大于1.15的9837个甲基化CpG位点进行进一步的差异分析。

所述步骤3)中，若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布且满足方差齐性条件，采用t检验；若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布但不满足方差齐性条件，采用近似t检验；若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据不服从正态分布，采用Wilcoxon秩和检验，并且P值经FDR校正后小于0.05的CpG位点被认为存在显著差异。由此，筛选出治疗有效组与无效组两组间有显著差异的甲基化CpG位点9个。

步骤4)、构建疗效预测模型：对步骤3)筛选出的治疗有效组与无效组两组间有显著差异的9个甲基化CpG位点CpG位点的Beta值，构建抗精神病药物治疗疗效预测模型，通过采用机器学习支持向量机模型和十折交叉验证所述甲基化CpG位点，计算治疗有效者与无效者样本的预测准确率；

十折交叉验证(10-fold cross-validation)，是常用的测试方法，用来测试算法预测的准确性。将数据集分成十分，轮流将其中9份作为训练数据，1份作为测试数据进行预测。每次试验都会得出相应的准确率。10次的结果的准确率的平均值作为对算法精度的估计，一般还需要进行多次10折交叉验证(例如10次10折交叉验证)，再求其均值，作为对算法准确性的估计。

由上述方法验证所述9个甲基化CpG位点中的一个或多个预测抗精神病药物疗效模型的的准确率高达100％；

十次十折交叉验证在测试集的平均准确率为100％，每次十折交叉验证在测试集上的平均准确率如下图2所示。图中，横坐标为次数，纵坐标为准确率。

所述步骤4)中，所述机器学习支持向量机模型，使用R语言平台(v3.6.3)进行数据分析，所使用的工具包为e1071(v 1.7.4)，并结合十折交叉验证，以上述步骤3)中的9个差异甲基化CpG位点的甲基化Beta值构建抗精神病药物疗效预测模型进行相互验证。

所述步骤4)中，预测准确率的计算公式为：

所述步骤(4)详细如下：本实施例使用支持向量机方法，使用R语言平台(v3.6.3)进行数据分析，所用工具包为e1071(v 1.7.4)，并结合交叉验证，以上述步骤(3)中的9个差异CpG位点的甲基化Beta值构建预测模型进行相互验证。

本实施例使用R语言平台(v3.6.3)进行数据分析，所用工具包为e1071(v 1.7.4)；通过对样本数据进行甲基化分析，获得9个显著(校正后P-value<0.05)、可能与抗精神病药物早期治疗应答相关的甲基化CpG位点(见表1)，并计算出所述甲基化CpG位点的甲基化Beta值来确定DNA甲基化水平，Beta值＝来自甲基化珠粒类型的强度值/(来自甲基化的强度值+来自未甲基化珠粒类型的强度值+100)。上述CpG位点即为用于预测抗精神病药物早期治疗应答的DNA甲基化标记物。用于预测抗精神病药物疗效的DNA甲基化标记物的筛选方法得到的用于预测抗精神病药物疗效的DNA甲基化标记物如表1所示。

表1预测抗精神病药物疗效的DNA甲基化标记物

本实施例通过机器学习支持向量机(support vector machine,SVM)方法，利用这9个CpGCpG位点甲基化水平即Beta值对患者疗效进行预测，十次十折交叉验证(10-foldcross-validation)平均准确率为100％。

CpG位点以上述甲基化CpG位点的甲基化Beta值构建预测模型，通过计算样本预测准确率验证该模型的可行性，样本预测准确率计算公式为：

使用机器学习方法(支持向量机、交叉验证)对上述预测模型进行相互验证：

在机器学习方法中，支持向量机(SVM)是一种有监督的机器学习方法，通常用于数据的二进制分类。给定分类问题中的输入数据和学习目标X＝{X₁,...,X_N},y＝{y₁,...,y_N}，输入数据的每个样本都包含多个特征，从而构成一个特征空间：X_i＝[X₁,...,X_n]∈X。学习目标y∈{-1,1}是一个二进制变量，表示负例和正例。

若输入数据所在的特征空间存在作为决策边界的超平面将学习目标按正类和负类分开，并使任意样本的点到平面距离大于等于1：

决策边界：w^TX+b＝0

点到平面距离：y_i(w^TX_i+b)≥1

则称该分类问题具有线性可分离性。参数w和b是分别是超平面的法向向量和截距。

满足此条件的决策边界实际上构造了两个平行的超平面作为区间边界，以区分样本的分类。

在间隔边界以上的样本被判为正例样本，而在间隔边界以下的样本被判为负例样本。将两个间隔边界之间的距离定义为

位于间隔边界上的正例样本和负例样本作为支持向量。

步骤5)、获得用于预测抗精神病药物疗效的DNA甲基化标记物：所述步骤4)的抗精神病药物疗效预测模型中对应的9个甲基化CpG位点中的一个或多个即为可预测抗精神病药物疗效的DNA甲基化标记物。

由本实施例预测抗精神病药物疗效的DNA甲基化标记物的筛选方法得到的两组间差异甲基化CpG位点9个(见表1，对应基因包括RARG、HEXA、CELF6等，分别参与神经源性分化过程，神经退行性疾病、孤独症的发病机制等)。可预测患者疗效的CpG位点有(见表1)：cg19679633、cg27184628、cg06295223、cg27079104、cg21442626、cg07237326、cg09265000、cg10652641、cg08348962。

利用这9个CpG位点的甲基化Beta值中的一个或多个或联合起来预测精神分裂症早期治疗应答，适于大规模推广应用。

实施例2

本实施例提供了一种用于预测抗精神病药物疗效的诊断试剂盒，所述诊断试剂盒将上述甲基化标记物作为抗精神病药物疗效的标记物。

进一步地，本实施例提供了一种抗精神病药物疗效预测的方法，包括：

1、提取待测样本的基因组DNA；

2、以步骤1中的基因组DNA为模板，利用上述试剂盒进行PCR扩增；

3、测序；

4、得到DNA甲基化检测结果；

5、根据人第1号染色体上的甲基化CpG位点cg08348962、第4号染色体上的甲基化CpG位点cg27184628、第5号染色体上的甲基化CpG位点cg19679633、第6号染色体上的甲基化CpG位点cg10652641、第8号染色体上的甲基化CpG位点cg21442626、第12号染色体上的甲基化CpG位点cg09265000、第15号染色体上的甲基化CpG位点cg27079104、第16号染色体上的甲基化CpG位点cg06295223、第19号染色体上的甲基化CpG位点cg07237326中的至少一个CpG位点甲基化水平，实现对待测样本抗精神病药物疗效预测。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种用于预测抗精神病药物疗效的DNA甲基化标记物，其特征在于，所述用于预测抗精神病药物疗效的DNA甲基化标记物选自人第1号染色体上的甲基化CpG位点cg08348962、第4号染色体上的甲基化CpG位点cg27184628、第5号染色体上的甲基化CpG位点cg19679633、第6号染色体上的甲基化CpG位点cg10652641、第8号染色体上的甲基化CpG位点cg21442626、第12号染色体上的甲基化CpG位点cg09265000、第15号染色体上的甲基化CpG位点cg27079104、第16号染色体上的甲基化CpG位点cg06295223、第19号染色体上的甲基化CpG位点cg07237326中的一个或多个。

2.根据权利要求1所述的DNA甲基化标记物，其特征在于，所述甲基化CpG位点cg08348962位于ILDR2基因上；所述甲基化CpG位点cg27184628位于MED28基因上；所述甲基化CpG位点cg19679633位于C5orf38基因上；所述甲基化CpG位点cg10652641位于C6orf27基因上；所述甲基化CpG位点cg21442626位于ATP6V1C1基因上；所述甲基化CpG位点cg09265000位于RARG基因上；所述甲基化CpG位点cg27079104位于HEXA基因上；所述甲基化CpG位点cg06295223位于PRDM7基因上。

3.一种权利要求1或2所述的甲基化标记物在制备用于预测抗精神病药物疗效的诊断试剂和/或辅助诊断试剂和/或诊断试剂盒中的用途。

4.一种试剂盒，其特征在于，其将权利要求1或2所述的甲基化标记物作为抗精神病药物疗效预测的标记物。

5.一种用于预测抗精神病药物疗效的DNA甲基化标记物的筛选方法，其特征在于，包括如下步骤：

6.根据权利要求5所述的筛选方法，其特征在于，所述步骤3)中，若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布且满足方差齐性条件，采用t检验；若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据服从正态分布但不满足方差齐性条件，采用近似t检验；若步骤2)筛选出的甲基化CpG位点的甲基化Beta值数据不服从正态分布，采用Wilcoxon秩和检验，并且P值经FDR校正后小于0.05的CpG位点被认为存在显著差异。

7.根据权利要求5所述的筛选方法，其特征在于，所述步骤4)中，所述机器学习支持向量机模型，使用R语言平台(v3.6.3)进行数据分析，所使用的工具包为e1071(v 1.7.4)，并结合十折交叉验证，以上述步骤3)中得到的差异甲基化CpG位点的甲基化Beta值构建抗精神病药物疗效预测模型进行相互验证。

8.根据权利要求5所述的筛选方法，其特征在于，所述步骤4)中，预测准确率的计算公式为：