CN113362944A - 一种基于机器学习的功能性消化不良和针刺疗效的预测 - Google Patents

一种基于机器学习的功能性消化不良和针刺疗效的预测 Download PDF

Info

Publication number
CN113362944A
CN113362944A CN202110528839.2A CN202110528839A CN113362944A CN 113362944 A CN113362944 A CN 113362944A CN 202110528839 A CN202110528839 A CN 202110528839A CN 113362944 A CN113362944 A CN 113362944A
Authority
CN
China
Prior art keywords
feature
classification
feature selection
functional dyspepsia
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110528839.2A
Other languages
English (en)
Other versions
CN113362944B (zh
Inventor
史椸
张展搏
朱思敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202110528839.2A priority Critical patent/CN113362944B/zh
Publication of CN113362944A publication Critical patent/CN113362944A/zh
Application granted granted Critical
Publication of CN113362944B publication Critical patent/CN113362944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/40ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mechanical, radiation or invasive therapies, e.g. surgery, laser therapy, dialysis or acupuncture
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明公开了基于机器学习的功能性消化不良和针刺疗效的预测,进行数据预处理,采用独立样本t检验对被试样本的年龄和性别进行校验;对sMRI图像进行预处理,提取特征参数,得到形态学指标;分别使用递归特征消除法和正则化弹性网络法的特征选择算法进行特征选择,并使用支持向量机基于机器学习;讨论特征选择算法中不同参数对分类性能的影响;对构建的分类模型进行评估。发明根据大脑影像学信息,结合医学图像分割、特征提取和机器学习分类方法,构建诊断模型,帮助医生快速进行功能性消化不良的诊断,通过预测模型研究针刺干预的疗效预测,预先知道患者是否适合针刺治疗,不仅可以辅助医生进行治疗手段的选择,也可减轻患者的经济压力和时间成本。

Description

一种基于机器学习的功能性消化不良和针刺疗效的预测
技术领域
本发明涉及机器学习领域,尤其是一种基于结构性磁共振成像和支持向量机的功能性消化不良和针刺疗效的预测。
背景技术
功能性消化不良,又称非溃疡性消化不良,是临床常见症候群,症状多样,主要表现为上腹部疼痛、餐后饱胀、反酸、早饱、上腹部灼烧感、恶心等,占消化系统疾病的20%-40%。根据罗马Ⅲ标准,按照症状可将功能性消化不良分为两类:1)餐后窘迫综合征(PDS);2)上腹痛综合征(EPS)。功能性消化不良的症状迁延不愈,反复发作,严重影响了患者的生活质量和心理健康。另外,目前由于在世界范围内具有较高的发病率,功能性消化不良已经成为一个重要的社会和医疗问题。
磁共振成像是一种能够显示大脑形态变化的成像技术,现在广泛应用于认知神经科学研究领域。结构性磁共振成像(sMRI)是基于核磁共振技术产生的一种成像技术,是MRI的一种方式。sMRI主要用来观察组织器官的解剖结构有没有变化,比如增长、萎缩、变形等。
针刺作为一种在中国已经应用数千年的传统医术,到现在依然保持着它独有的魅力,也越来越受到国内外的关注和重视,具体做法是将针刺入人体一定的穴位达到治疗疾病的目的,也包括将电和针结合的电针疗法。与药物治疗相比,针刺具有经济实惠、副作用小、安全性高等显著优势,这也使得它成为了功能性消化不良的一个重要的非药物治疗方法。
现有的影像学研究多是通过刺激内脏来观察健康人和患者的大脑激活状况,重点关注局部脑区的活动异常,而采用MRI技术探索患者大脑结构异常的研究还很少。而且,在现有的研究中多是对针刺治疗功能性消化不良的疗效进行观察,很少将针刺和神经影像学相结合,来研究针刺对患者影响的个体差异性。
发明内容
为解决上述技术问题,本发明提供了一种基于结构性磁共振成像和支持向量机的功能性消化不良和针刺疗效的预测。其中,构建的诊断分类模型,结合影像学和SVM,提高了诊断准确率和效率,可以辅助疾病诊断;而构建的针刺疗效预测分类模型,减少了功能性消化不良患者的就医成本,能够在就医前就预测针刺治疗对患者是否有效,可以辅助以上进行治疗。
本发明通过以下技术方案实现:
本发明主要包括两个部分(1)采用sMRI和SVM的对功能性消化不良进行诊断(2)采用sMRI和SVM的方法对针刺治疗的效果进行预测。以上提出的两种分类模型不仅研究对象均为被测试者的脑部sMRI图像,而且其研究问题都属于二分类问题,主要包括以下步骤:
步骤1,脑部sMRI图像的采集,图像预处理:在合适的时间点采集所有被试的脑部MRI图像,使用freesufer对sMRI图像进行分割、细分、膨胀、修正,并对结果进行曲面重建、脑区标记,得到样本的特征参数;
步骤2,数据预处理:采用独立样本T检验的方法对样本的年龄、性别进行检验,排除了年龄、性别对功能性消化不良症状的影响,并且采用聚类的方法剔除离群点,独立样本T检验的统计量如下:
Figure BDA0003067339060000021
其中n1、n2分别为年龄(性别)、是否患有功能性消化不良的样本数,S1、S2分别为年龄(性别)、是否患有功能性消化不良的方差,
Figure BDA0003067339060000022
分别为年龄(性别)、是否患有功能性消化不良的均值。
步骤3,构建分类模型:对特征矩阵进行标准化,将n个样本随机分为k个大小相似的子集,把其中k-1折数据合并作为训练集,剩余1折数据作为测试集。在训练集上进行特征选择,分别使用RFE和EN的特征选择方法选出的特征子集。
其中,基于弹性网络的特征选择算法(EN)公式如下:
Figure BDA0003067339060000031
式中
Figure BDA0003067339060000032
是模型系数,β0是截距,l(·)为损失函数,λ为正则化参数,α为权衡l1、l2正则项的参数
分类算法支持向量机(SVM)公式如下:
Figure BDA0003067339060000033
式中,ξ为允许间隔的量,C为惩罚因子,用来控制被错误分类数据点的惩罚程度,ωT为系数矩阵,b为偏置矩阵,φ(xi)为非线性映射的核函数。
步骤4,讨论特征选择算法中不同参数对分类性能的影响:上述步骤构建的分类模型均为在最佳参数下构建的模型,在RFE算法中分别采用不同的特征选择数目k构建分类模型,在EN算法中分别采用不同的权衡l1惩罚和l2惩罚的参数α构建分类模型,比较不同参数取值模型的准确率和AUC值。
步骤5,模型评估:当构建的分类模型均为选择最佳参数构建的模型时,通过比较各自模型的特异性和敏感性,比较两种特征选择算法的分类性能。
与现有技术相比,本发明具有以下效益的技术结果:
本发明能够根据大脑影像学信息,结合医学图像分割、特征提取和机器学习分类方法,构建诊断模型,帮助医生快速进行功能性消化不良的诊断,且可通过预测模型研究针刺干预的疗效预测,预先知道患者是否适合针刺治疗,不仅可以辅助医生进行治疗手段的选择,也可减轻患者的经济压力和时间成本。
附图说明
图1为本发明实施例提供的一种基于结构性磁共振成像和支持向量机的功能性消化不良和针刺疗效的预测的流程图;
图2为本发明具体实施例的分类框架图;
图3为使用FreeSurfer软件进行脑图像处理的流程图;
图4为本发明具体实施例的诊断分类框架图;
图5为本发明具体实施例的针刺疗效预测分类框架图。
图6为本发明具体实施例的RFE实现步骤;
图7为本发明具体实施例的EN实现步骤;
具体实施方式
本发明提供了一种基于结构性磁共振成像和支持向量机的功能性消化不良和针刺疗效的预测。
本发明主要包括两个部分(1)采用sMRI和SVM的对功能性消化不良进行诊断预测(2)采用sMRI和SVM的方法对针刺治疗的效果进行预测。基于结构性磁共振成像和支持向量机的功能性消化不良和针刺疗效的预测的流程图如图1所示。
以上提出的两种分类模型不仅研究对象均为被测试者的脑部sMRI图像,而且其研究问题都属于二分类问题,都涉及以下步骤:图像预处理、数据预处理、构建分类模型、讨论特征选择算法中不同参数取值对分类性能的影响、模型评估。
虽然它们的数据来源不同,建模和分析细节不同,但分类框架类似,如图2分类框架图。
其中(a)表示图像处理部分,(b)表示特征选择和建模评估的过程。
图像预处理
本文所有被试的sMRI数据均采用FreeSurfe软件进行图像处理,得到大脑的形态学指标即可用于分类的特征变量。图像预处理步骤如图3所示:
(1)格式转换:将源图像转换为FreeSurfer可以读取的MGZ和DCM格式。
(2)分割:由于人脑的结构非常复杂,要想保证组织分割后不会影响后续大脑所需结构的使用。在分割前,需要先对图像进行头动校正、图像配准、不均匀场校正和标准归一化等预处理,最后对大脑进行分割,除去非脑组织,并标记大脑皮层皮下组织。
(3)细分/膨胀:分割完成后,对皮层曲面进行细分,并对细分后的图像进行平滑和膨胀操作。在膨胀过程中需要保持原始曲面的形状和角度,并确保大脑沟回仍然可见。
(4)修正:检查细分/膨胀操作后的曲面是否还存在缺陷和错误,并对存在错误的曲面进行修正。
(5)重新膨胀/修正:重新膨胀修正后的曲面,并对重新膨胀的曲面进行拓扑修正。
(6)曲面重建:根据分割结果完成对大脑三维曲面的重建,方便后续形态学数据的获取,如大脑皮层厚度等。并且为了去除锯齿和奇异边界,提高图像的质量,还需要平滑和膨胀。
(7)模板标记:将膨胀后的图像与标准球形模板对比,进行标记。
(8)脑区标记:将上一步得到的球形图像按照标准模板标记ROI(Region ofInterest)脑区,并对照被试实际解剖图像对标记脑区后的图像进行调整,以得到每个顶点和脑区的参数统计值。
(9)提取特征参数:经过上述一系列操作后,可得到大脑皮层的皮层厚度、皮层体积、皮下体积、皮层表面积、皮层曲率、皮层折叠率和皮层厚度标准差等一系列形态学指标。
数据预处理
本发明的样本共包含93个数据,其中患者47名,正常对照组的正常人46名。对所有被试进行基础评估后,采用独立样本T检验对两组数据的年龄和性别进行检验,并计算各自平均值和标准差,通过查表法发现两组样本数据在年龄(p=0.976),性别(p=0.895)上无显著性差异,排除了年龄与性别对功能性消化不良症状的影响。
独立样本T检验的统计量如下:
Figure BDA0003067339060000061
其中n1、n2分别为年龄(性别)、是否患有功能性消化不良的样本数,S1、S2分别为年龄(性别)、是否患有功能性消化不良的方差,
Figure BDA0003067339060000062
分别为年龄(性别)、是否患有功能性消化不良的均值。
由于采集被试的影像学数据过程中可能存在各种各样的干扰,最后处理得到的皮层厚度特征可能会出现干扰因素,造成模型的错误拟合。为了排除噪音的影响,采用基于聚类的方法来检测离群点,本发明采用样本到簇中心的欧式距离来度量样本属于簇的程度,剔除离群点。
模型建立
根据图2分类框架图可知,特征矩阵经过标准化之后,将n个样本随机分为k个大小相似的子集,其中,功能性消化不良的诊断分类模型中k=10,针刺疗效预测模型中k=5,并把其中k-1折数据合并作为训练集,剩余1折数据作为测试集。
在训练集上进行特征选择,分别使用基于平稳选择的递归特征消除法(RFE)获取排名靠前的前K个特征子集,和基于弹性网络(EN)的特征选择方法选出的特征子集。
诊断分类模型的框架图如图4所示:
具体实施步骤如下:
(1)将标准化后的90例样本随机分为10折,其中9折数据合并作为训练集,剩下1折作为测试集;
(2)在训练集上,对特征进行选择,分别采用两种算法,一是基于平稳选择的RFE算法,其中使用10折交叉验证并平稳选择20次,获取超过10次排序都在前K的特征构成特征子集;二是基于弹性网络的特征选择算法得到特征子集。为了说明特征选择的作用,本实验还使用全部特征构成特征子集,即不进行特征选择直接进入下一步;
(3)用特征子集在训练集上构建SVM,内部参数寻优采用10折交叉验证的方法,然后在测试集上测试,得到该数据集划分下的分类指标:精度、敏感性、特异性和AUC值;
(4)以上步骤循环10次,并对各项分类指标取平均,得到外部10折交叉验证的模型分类性能;
(5)为了消除交叉验证数据划分不同带来的影响,需要进行多次10折交叉验证,最后取平均作为该分类器的最终分类指标。
针刺疗效预测模型如图5所示。具体实施步骤如下:
(1)将45例样本随机分为5折,其中4折数据作为训练集,剩下1折作为测试集;对训练集和测试集数据均进行标准化处理;
(2)在训练集上,对特征进行选择,算法分别采用RFE和EN,其中RFE使用平稳选择的方法,即重复随机打乱数据20次,进行20次5折交叉验证,在这20次中超过半数排序均在前K的特征构成特征子集;同样为了说明特征选择的重要性,还对训练集不进行特征选择,使用全部特征构成特征子集;
(3)用上一步得到的特征子集在训练集上建立SVM模型,内部参数寻优采用5折交叉验证的方法,然后在测试集上测试,得到该数据集划分下的分类指标:精度、敏感性、特异性和AUC值;
(4)以上步骤循环5次,并对各项分类指标取平均,得到外部5折交叉验证的模型分类性能;
(5)进行多次5折交叉验证,最后取平均得到最终分类器的分类指标。
其中在两种分类模型都采用的分类算法:支持向量机(SVM)的具体公式如下:
Figure BDA0003067339060000081
式中,ξ为允许间隔的量,C为惩罚因子,用来控制被错误分类数据点的惩罚程度,ωT为系数矩阵,b为偏置矩阵,φ(xi)为非线性映射的核函数。
其中在两种分类模型都采用的特种选择算法:使用基于平稳选择的递归特征消除法(RFE)的具体实施步骤如图6所示:
具体实施步骤:
(1)对输入数据集使用k折交叉验证,其中k-1折作为训练集,剩余1折作为测试集;不同实验由于数据集的大小不同,k的取值也有所差异;
(2)对训练集进行两条并行线的操作,一是构建出SVM分类模型;二是使用二分类SVM-RFE算法对特征进行排序,获取特征重要性分数排序,得到所有特征的排序集合;
(3)使用测试集测试上一步训练的SVM模型,并评估该该模型的精度和误差;
(4)由于是k折交叉验证,上述过程循环k次,一共得到k个特征排序集合和k个测试集评估指标,选择与k个测试评估中误差最小相对应的排序集合作为此次k折交叉验证的结果,输出为最佳排序;
(5)重复上述所有步骤N次,得到N个排序集合,再使用平稳选择的方法选取合适的特征子集,即前K个特征构成的特征子集。
在两种分类模型都采用的特种选择算法:使用基于弹性网络的特征选择方法的具体实施步骤如图7所示:
使用基于弹性网络的特征选择方法的具体公式如下:
Figure BDA0003067339060000091
式中
Figure BDA0003067339060000092
是模型系数,β0是截距,l(·)为损失函数,λ为正则化参数,α为权衡l1、l2正则项的参数
具体实现步骤:
首先估计参数,为了防止过拟合,消除偶然性带来的不确定性,本发明采用五折交叉验证(5-CV)的方法来估计如图7中(a)所示,详细描述见步骤(1)和(2)。
(1)预设一个α值,所有取值从0到1,步长为0.1,共11个不同的α取值,对每一个参数都进行以下过程:
五折交叉验证训练EN模型,具体步骤如下:
a.将预设α为0输入EN模型,得到λ序列,目标函数的未知参数只有λ;
b.将输入数据随机分为5折;
c.用其中4折数据训练每一个λ对应的EN模型;
d.对于每一个λ,将剩余的1折数据输入训练好的EN模型,计算偏差;
e.重复五次,计算每一个λ对应的偏差平均值。比较此次五折交叉验证中所有λ的偏差平均值,记录最小的偏差平均值。为了消除交叉验证随机划分数据集的影响,对每个α重复40次上述五折交叉验证,计算40次偏差平均值的均值,作为该α值的分数。
(2)比较每个α值的分数,找到最小的分数对应的α,也就是说,保留最小均值对应的α即α*
然后计算正则化参数,并获取最终的特征子集,方法流程图如图5中(b)所示,详细描述见步骤(3)和(4)。
(3)α值确定之后,要确定λ和系数β,进行以下过程:
a.将α*输入EN模型,进行五折交叉验证,依然是4折用来训练EN模型,1折用来测试,得到每个对应的5-CV的偏差平均值;
b.为了消除交叉验证划分方式的不同,重复进行40次五折交叉验证,选择使偏差平均值最小的λmin
c.保留上述λmin下的五折交叉验证所分的数据,即样本的实际5折划分,具体哪4折作为训练集,余下1折作为测试集。
(4)带入α*和λmin,用上述确定的4折数据训练EN模型得到β矩阵,取系数不为0的特征构成特征子集,其中特征子集个数为K。
讨论特征选择算法中参数对模型效果的影响
RFE算法中特征选择数目K的取值会影响到分类器的分类性能,因为选择不同的K时,RFE算法得到的特征重要性排序不一样。
EN方法中的参数α是权衡l1惩罚和l2惩罚的重要参数,不同的α会导致惩罚的力度不一样,从而使得特征选择后得到的特征子集不一样,其中当α=0时,由弹性网络原理可知,惩罚项只剩l2,正则化项为ridge回归,此时相当于对特征系数进行压缩但没有压缩为0的项,所以分类特征数目为全部特征数目即68个;当时,α=1惩罚项只剩l1,正则化项为lasso回归,此时存在特征系数被缩减为0,所以特征数目少于68。
在诊断分类模型中,特征选择算法采用RFE算法时,特征选择数目K为18;特征选择算法采用EN时,权衡l1惩罚和l2惩罚的参数α取值为0.3,对应的特征选择数目K为18。
采用两种特征选择算法所选择的特征中,共同的特征有11个,即尾额中回、左侧眶额叶皮层、左扣带回后部、左颞横回、脑岛、右侧眶额叶皮层、内侧眶额叶皮层、岛盖部、距状旁回、中央后回、右颞横回。因此这些特征属于对分类高度敏感的特征,可以很好地区分开健康被试和功能性消化不良患者,与功能性消化不良有着密切的关系。
在针刺疗效预测模型中,特征选择算法采用RFE算法时,特征选择数目K为11;特征选择算法采用EN时,权衡l1惩罚和l2惩罚的参数α取值为0.5,对应的特征选择数目K为22。
采用两种特征选择算法所选择的特征中,共同的特征有8个,即左岛盖部、三角部、颞横回、脑岛、内嗅皮质、右岛盖部、前喙扣带皮质、额极。因此这些特征属于对预测高度敏感的特征,可以很好的预测针刺治疗功能性消化不良患者是否有效,与功能性消化不良有着密切的关系,在针刺治疗过程中起着重要作用。
模型评估
为了比较两种特征选择方法对分类模型效果的影响,本发明采用将RFE算法在最佳k值和EN算法在最佳α值时分别构建的分类模型进行特异性和敏感性的比较。
特异性高意味着实际病人被诊断为病人的概率高,误诊为正常人的概率低;敏感性高意味着实际正常人被诊断为正常人的概率高,误诊为病人的概率低。实际生活中,正常人的误诊可能需要承担进一步的诊断治疗所带来的经济损失,而病人的误诊则可能会导致疾病恶化,损失严重,因此我们更在意病人是否被正确诊断,即希望特异性更高,而对敏感性的要求相对较低。
准确度计算方法如下:
Figure BDA0003067339060000111
敏感度计算方法如下:
Figure BDA0003067339060000112
特异性计算方法如下:
Figure BDA0003067339060000113
其中,TP:True Positive,真阳性,被判定为正样本,事实上也是正样本的样本总数、TN:True Negative,真阴性,被判定为负样本,事实上也是负样本的样本总数、FP:FalsePositive,假阳性,被判定为正样本,但事实上是负样本的样本总数、FN:False Negative,假阴性,被判定为负样本,但事实上是正样本的样本总数。
功能性消化不良的诊断分类模型中,采用RFE算法的准确率为81.1%,敏感性为77.3%,特异性为84.8%,AUC值为0.82,采用EN算法的准确率为84.4%,敏感性为86.4%,特异性为82.6%,AUC值为0.81。采用RFE算法和EN算法的准确率较为相近,但采用RFE算法的模型特异性高于采用EN算法的模型,且AUC值更大,综合来看在功能性消化不良的诊断分类模型中RFE特征选择算法优于EN算法。
针刺疗效预测分类模型中,采用RFE算法的准确率为84.4%,敏感性为70%,特异性为96%,AUC值为0.83,采用EN算法的准确率为91.1%,敏感性为85%,特异性为96%,AUC值为0.89。采用RFE算法和EN算法时特异性都很高,但是EN算法的准确率明显高于RFE算法,且敏感性和AUC值均高于RFE算法,综合来看在针刺疗效预测分类模型中EN算法优于RFE算法。

Claims (10)

1.一种基于机器学习的功能性消化不良和针刺疗效的预测,其特征在于,包括以下步骤:
进行数据预处理,采用独立样本t检验对被试样本的年龄和性别进行校验;
对sMRI图像进行图像预处理,提取特征参数,得到形态学指标;
分别使用递归特征消除法和正则化弹性网络法的特征选择算法进行特征选择,并使用支持向量机进行分类预测;
讨论特征选择算法中不同参数对分类性能的影响;
对构建的分类模型进行评估。
2.根据权利要求1所述的一种基于机器学习的功能性消化不良和针刺疗效的预测,其特征在于:对sMRI图像进行图像预处理,提取特征参数,得到形态学指标这一步骤,具体包括:
对第一图像进行格式转换,将源图像阻焊换位MGZ和DCM格式;
对图像进行头动校正、图像配准、不均匀场校正和标准归一化处理,并对大脑进行分割,除去非脑组织,标记大脑皮层皮下组织;
对皮层曲面进行细分,对细分图像进行平滑和膨胀;
对细分错误的曲面进行修正;
重新膨胀修正后的曲面,并对重新膨胀的曲面进行拓扑修正;
根据分割结果完成三维曲面重建,并进行平滑与膨胀以提高图像质量;
将膨胀后的图像与标准球形模板对比,进行标记;
标记ROI脑区,以得到每个顶点和脑区的参数统计值;
提取特征参数,以得到如皮层体积等形态学指标。
3.根据权利要求1所述的一种基于机器学习的功能性消化不良和针刺疗效的预测,其特征在于:分别使用递归特征消除法和正则化弹性网络法的特征选择算法进行特征选择,并使用支持向量机基于机器学习,这一步骤,具体包括:
进行数据集划分;
采用两种特征选择算法进行特征选择,构建分类模型;
得到分类器最终分类指标。
4.根据权利要求3所述的一种基于机器学习的功能性消化不良和针刺疗效的预测,其特征在于:采用两种特征选择算法进行特征选择,构建分类模型这一步骤,具体包括:
在训练集上对特征进行特征选择;
用特征子集在训练集上构建SVM,内部参数寻优采取k折交叉验证。
5.根据权利要求4所述的一种基于机器学习的功能性消化不良和针刺疗效的预测,其特征在于:在训练集上对特征进行特征选择这一步骤,具体包括:
使用基于平稳选择的递归特征消除法RFE,进行20次k折交叉验证,获取排序在前的N次特征构成特征子集;
使用基于弹性网络的特征选择算法得到特征子集;
为增强对比,显示特征选择的作用,对所有特征不进行特征选择。
6.根据权利要求5所述的一种基于机器学习的功能性消化不良和针刺疗效的预测,其特征在于:使用基于平稳选择的递归特征消除法(RFE)这一步骤,具体包括:
对数据集进行k折交叉验证;
对训练集进行并行线操作,一是构建出SVM分类模型,二是使用二分类SVM-RFE算法对特征进行排序;
使用平稳选择的方法选取前K个特征构成特征子集;
分类算法支持向量机(SVM)公式如下:
Figure FDA0003067339050000021
式中,ξ为允许间隔的量,C为惩罚因子,用来控制被错误分类数据点的惩罚程度,ωT为系数矩阵,b为偏置矩阵,φ(xi)为非线性映射的核函数。
7.根据权利要求1或6所述的一种基于机器学习的功能性消化不良和针刺疗效的预测,其特征在于:使用基于弹性网络的特征选择算法得到特征子集这一步骤,具体包括:
为防止过拟合,消除偶然性,使用k折交叉验证预估权衡l1惩罚和l2惩罚的参数α,
将预估的参数α作为实际参数,然后计算正则化参数,得到特征子集
其中,基于弹性网络的特征选择算法(EN)公式如下:
Figure FDA0003067339050000022
式中
Figure FDA0003067339050000023
是模型系数,β0是截距,l(·)为损失函数,λ为正则化参数,α为权衡l1、l2正则项的参数。
8.根据根据权利要求1所述的一种基于机器学习的功能性消化不良和针刺疗效的预测,其特征在于:得到分类器最终分类指标这一步骤,具体包括:
将上述采用两种特征选择算法进行特征选择,构建分类模型这一步骤循环k次,对各项分类指标取平均;
进行多次k折交叉验证,最后取平均作为分类器的最终分类指标。
9.根据权利要求1所述的一种基于机器学习的功能性消化不良和针刺疗效的预测,其特征在于:讨论特征选择算法中不同参数对分类性能的影响这一步骤,具体包括:
特征选择算法选择基于平稳选择的递归特征消除法RFE,更改特征选择数目,比较分类性能;
特征选择算法选择基于弹性网络的特征选择算法,更改权衡l1惩罚和l2惩罚的参数α来进行特征选择,比较分类性能。
10.根据权利要求1所述的一种基于机器学习的功能性消化不良和针刺疗效的预测,其特征在于:对构建的分类模型进行评估这一步骤,具体包括:
计算RFE算法在最佳特征选择数目和EN算法在最佳α值时的准确度、敏感性、特异性,分别在功能性消化不良的诊断分类模型和针刺疗效预测分类模型中比较两种特征选择算法,分别选取最优算法。
CN202110528839.2A 2021-05-14 2021-05-14 一种基于机器学习的功能性消化不良和针刺疗效预测模型的评估方法 Active CN113362944B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110528839.2A CN113362944B (zh) 2021-05-14 2021-05-14 一种基于机器学习的功能性消化不良和针刺疗效预测模型的评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110528839.2A CN113362944B (zh) 2021-05-14 2021-05-14 一种基于机器学习的功能性消化不良和针刺疗效预测模型的评估方法

Publications (2)

Publication Number Publication Date
CN113362944A true CN113362944A (zh) 2021-09-07
CN113362944B CN113362944B (zh) 2023-06-30

Family

ID=77526488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110528839.2A Active CN113362944B (zh) 2021-05-14 2021-05-14 一种基于机器学习的功能性消化不良和针刺疗效预测模型的评估方法

Country Status (1)

Country Link
CN (1) CN113362944B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115954099A (zh) * 2022-11-18 2023-04-11 临沂中科睿鹤智慧科技有限公司 一种基于多模态步态参数的脑卒中关联量化评估方法
WO2023102166A3 (en) * 2021-12-03 2023-07-27 Digital Diagnostics Inc. Direct medical treatment predictions using artificial intelligence

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130011070A1 (en) * 2007-05-07 2013-01-10 The Penn State Research Foundation Studying aesthetics in photographic images using a computational approach
CN104504373A (zh) * 2014-12-18 2015-04-08 电子科技大学 一种用于fmri数据的特征选择方法
CN107507162A (zh) * 2017-06-29 2017-12-22 南京航空航天大学 一种基于多模态脑影像的基因型分析方法
CN110033127A (zh) * 2019-03-14 2019-07-19 中国人民解放军国防科技大学 一种基于嵌入式特征选择的冷启动项目推荐方法
CN110880008A (zh) * 2018-09-06 2020-03-13 刘艳 基于脑核磁影像数据的结构特征提取和分类方法
CN111161793A (zh) * 2020-01-09 2020-05-15 青岛科技大学 基于stacking集成的RNA中N6-甲基腺苷修饰位点预测方法
US20210000426A1 (en) * 2019-07-04 2021-01-07 Peking University Classification system of epileptic eeg signals based on non-linear dynamics features

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130011070A1 (en) * 2007-05-07 2013-01-10 The Penn State Research Foundation Studying aesthetics in photographic images using a computational approach
CN104504373A (zh) * 2014-12-18 2015-04-08 电子科技大学 一种用于fmri数据的特征选择方法
CN107507162A (zh) * 2017-06-29 2017-12-22 南京航空航天大学 一种基于多模态脑影像的基因型分析方法
CN110880008A (zh) * 2018-09-06 2020-03-13 刘艳 基于脑核磁影像数据的结构特征提取和分类方法
CN110033127A (zh) * 2019-03-14 2019-07-19 中国人民解放军国防科技大学 一种基于嵌入式特征选择的冷启动项目推荐方法
US20210000426A1 (en) * 2019-07-04 2021-01-07 Peking University Classification system of epileptic eeg signals based on non-linear dynamics features
CN111161793A (zh) * 2020-01-09 2020-05-15 青岛科技大学 基于stacking集成的RNA中N6-甲基腺苷修饰位点预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MOHAMMED QARAAD; SOUAD AMJAD; IBRAHIM I. M. MANHRAWY; HANAA FATHI; BAYOUMI ALI HASSAN; PASSENT EL KAFRAWY: "A Hybrid Feature Selection Optimization Model for High Dimension Data Classification", IEEE ACCESS *
刘茜;王瑜;付常洋;肖洪兵;邢素霞;: "基于特征选择的阿尔茨海默症辅助诊断", 中国医学物理学杂志, no. 05 *
战扬: "基于支持向量机融合多模态信息构建AD超早期分类模型研究", 中国优秀硕士学位论文全文数据库 医药卫生科技辑, vol. 2020, no. 09 *
梁丽军;刘子先;王化强;: "基于弹性网-SVM的疾病诊断关键特征识别", 计算机应用研究, no. 05 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023102166A3 (en) * 2021-12-03 2023-07-27 Digital Diagnostics Inc. Direct medical treatment predictions using artificial intelligence
CN115954099A (zh) * 2022-11-18 2023-04-11 临沂中科睿鹤智慧科技有限公司 一种基于多模态步态参数的脑卒中关联量化评估方法
CN115954099B (zh) * 2022-11-18 2023-09-15 临沂中科睿鹤智慧科技有限公司 一种基于多模态步态参数的脑卒中关联量化评估方法

Also Published As

Publication number Publication date
CN113362944B (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
Mumtaz et al. A machine learning framework involving EEG-based functional connectivity to diagnose major depressive disorder (MDD)
Zhang et al. Strength and similarity guided group-level brain functional network construction for MCI diagnosis
CN109447183B (zh) 预测模型训练方法、装置、设备以及介质
Mumtaz et al. Electroencephalogram (EEG)-based computer-aided technique to diagnose major depressive disorder (MDD)
Segovia et al. Early diagnosis of Alzheimer’s disease based on partial least squares and support vector machine
CN113362944B (zh) 一种基于机器学习的功能性消化不良和针刺疗效预测模型的评估方法
CN113284126B (zh) 人工神经网络图像分析预测脑积水分流手术疗效的方法
Mandal et al. Detection of Ventricular Arrhythmia by using Heart rate variability signal and ECG beat image
CN112348785A (zh) 一种癫痫病灶定位方法及系统
CN117153379B (zh) 一种胸廓出口综合征的预测装置
CN111329467A (zh) 一种基于人工智能的心脏疾病辅助检测方法
CN116051545B (zh) 一种双模态影像的脑龄预测方法
CN116843036A (zh) 面向阿尔兹海默症辅助诊断的个性化联邦学习方法
CN108065934B (zh) 基于lme模型的减重手术引起大脑结构变化的影像学统计分析方法
Yuan et al. Gk-bsc: Graph kernel-based brain states construction with dynamic brain networks and application to schizophrenia identification
Vasu et al. A survey on bipolar disorder classification methodologies using machine learning
CN114847922A (zh) 一种基于纤维束自动识别的脑年龄预测方法
Dai et al. Multimodal Brain Disease Classification with Functional Interaction Learning from Single fMRI Volume
Xu et al. Tinnitus classification based on resting-state functional connectivity using a convolutional neural network architecture
CN112837807A (zh) 一种t2dm脑衰老认知障碍早期智能高精度辅诊方法
CN111784755A (zh) 一种融合多尺度信息的脑部磁共振图像配准方法
Solomou et al. Utilizing Chest X-rays for age prediction and gender classification
Cao et al. A Novel Approach Analysing the Dynamic Brain Functional Connectivity for Improved MCI Detection
Fan et al. Multilevel Clustering-Evolutionary Random Support Vector Machine Cluster Algorithm-Based Functional Magnetic Resonance Imaging in Diagnosing Cerebral Ischemic Stroke
CN113947577B (zh) 基于健康人群分布实现脑影像特征归一化处理的方法、系统、装置、处理器及其存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant