CN118015381A - 基于影像基因组学的精神分裂症分类方法及系统 - Google Patents

基于影像基因组学的精神分裂症分类方法及系统 Download PDF

Info

Publication number
CN118015381A
CN118015381A CN202410280876.XA CN202410280876A CN118015381A CN 118015381 A CN118015381 A CN 118015381A CN 202410280876 A CN202410280876 A CN 202410280876A CN 118015381 A CN118015381 A CN 118015381A
Authority
CN
China
Prior art keywords
data
determining
image
feature
wavelet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410280876.XA
Other languages
English (en)
Inventor
韩勇
李文强
周之禄
生龙雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Psychiatric Hospital (the Second Affiliated Hospital Of Xinxiang Medical College)
Original Assignee
Henan Psychiatric Hospital (the Second Affiliated Hospital Of Xinxiang Medical College)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan Psychiatric Hospital (the Second Affiliated Hospital Of Xinxiang Medical College) filed Critical Henan Psychiatric Hospital (the Second Affiliated Hospital Of Xinxiang Medical College)
Priority to CN202410280876.XA priority Critical patent/CN118015381A/zh
Publication of CN118015381A publication Critical patent/CN118015381A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供一种基于影像基因组学的精神分裂症分类方法及系统,涉及数据分类技术领域,包括采集被试者的影像基因组数据,分别构建同构网络和异构网络,组合成模态融合模型,输出融合图;对融合图对应的图像数据进行切割,得到分段数据,基于小波变换,计算分段数据对应的时频特征,经过小波双谱分析,确定双谱矩阵,计算并提取能量分布特征和灰度分布特征,组合成综合特征数据;基于预先训练的特征选择模型,将综合特征数据输入特征选择模型,确定特征重要性评分,按照预设的特征数量选取核心特征,将核心特征输入预先训练的球形最近邻分类器中,确定被试者的精神分裂症类别。

Description

基于影像基因组学的精神分裂症分类方法及系统
技术领域
本发明涉及数据分类技术领域,尤其涉及一种基于影像基因组学的精神分裂症分类方法及系统。
背景技术
精神分裂症是指以基本个性改变,思维、情感、行为的分裂,精神活动与环境的不协调为主要特征的一类最常见的精神病;对于患者而言,精神分裂症会给生活和工作带来严重影响;目前,对于精神分裂症的诊断主要依赖于对明显的精神症状的定性检查和患者的自述经验;
CN202311334208.2,公开了一种基于动态证据融合神经网络的精神分裂症多视图分类方法,属于智能医学处理技术领域;其技术方案为:利用边缘到边缘、边缘到节点和节点到图卷积滤波器提取精神分裂症患者动态脑网络连接矩阵每个视图的特征图;将每个视图的特征图分别通过全连接层和激活层以获得多视图动态证据;根据动态证据导出迪利克雷分布参数,调整置信度后构建动态信任函数并计算每个视图的动态信任函数;在分类的决策层进行证据融合后获得联合信任函数;使用多视图损失函数训练神经网络;
综上所述,现有技术对于早期及时发现疾病是不可行的,结合影像基因组学相关数据的诊断可能在精神分裂症的早期能够发现细微的异常,本发明的应用至少能够解决现有技术的部分问题。
发明内容
本发明实施例提供一种基于影像基因组学的精神分裂症分类方法及系统,至少能够解决现有技术中部分问题。
本发明实施例的第一方面,
提供基于影像基因组学的精神分裂症分类方法,包括:
采集被试者的影像基因组数据,基于所述影像基因组数据,分别构建同构网络和异构网络,将所述同构网络和所述异构网络组合成模态融合模型,输出融合图;
对所述融合图对应的图像数据进行切割,得到分段数据,基于小波变换,计算所述分段数据对应的时频特征,经过小波双谱分析,确定双谱矩阵,计算并提取能量分布特征和灰度分布特征,将所述能量分布特征和所述灰度分布特征组合成综合特征数据;
基于预先训练的特征选择模型,将所述综合特征数据输入所述特征选择模型,确定特征重要性评分,按照预设的特征数量选取核心特征,将所述核心特征输入预先训练的球形最近邻分类器中,确定所述被试者的精神分裂症类别。
在一种可选的实施例中,
采集被试者的影像基因组数据,基于所述影像基因组数据,分别构建同构网络和异构网络,将所述同构网络和所述异构网络组合成模态融合模型,输出融合图包括:
采集被试者的影像基因组数据,包括:被试者静息态大脑活动血流变化的功能性磁共振成像数据、单核苷酸多态性数据、DNA甲基化数据;
所述影像基因组数据组成多模态数据,基于所述多模态数据,通过高斯径向基函数,确定模态内部的内部相似度矩阵,构建同构网络;
基于加权图扩散过程,通过相似性信息传播,确定模态之间的外部相似度矩阵,构建异构网络;
基于所述同构网络和所述异构网络,确定模态融合模型;
基于所述影像基因组数据,通过所述模态融合模型,确定综合特征图。
在一种可选的实施例中,
对所述融合图对应的图像数据进行切割,得到分段数据,基于小波变换,计算所述分段数据对应的时频特征,经过小波双谱分析,确定双谱矩阵,计算并提取能量分布特征和灰度分布特征,将所述能量分布特征和所述灰度分布特征组合成综合特征数据包括:
将所述融合图对应的图像数据分段处理,并减去所述图像数据的数据均值,确定分段数据;
基于带宽系数和中心频率,确定小波函数,结合尺度因子,对所述分段数据进行小波变换,计算时频特征,经过小波双谱分析,确定双谱矩阵;
基于所述双谱矩阵,通过计算能量熵,提取能量分布特征;
将所述双谱矩阵转换为灰度图像,通过计算所述灰度图像对应的灰度矩,提取灰度分布特征,其中,所述灰度矩包括根据所述灰度图像的均值确定的一阶矩和根据所述灰度图像的方差确定的二阶矩;
将所述能量分布特征和所述灰度分布特征组合成综合特征数据。
在一种可选的实施例中,
基于带宽系数和中心频率,确定小波函数,结合尺度因子,对所述分段数据进行小波变换,计算时频特征,经过小波双谱分析,确定双谱矩阵包括:
所述小波函数,其公式如下:
其中,ψ(t)表示小波函数,fb表示带宽系数,i表示虚数单位,fc表示中心频率,t表示时间变量;
对所述分段数据进行所述小波变换,其对应公如下:
其中,Wf(a,τ)表示小波变换结果,τ表示时移参数,a表示尺度因子,f(t)表示输入数据,表示对时间t进行a的缩放并在时间轴上时移τ,ψ*()表示小波函数的共轭函数;
经过小波双谱分析,确定双谱矩阵,其公式及如下:
其中,B(a1,a2)表示双谱矩阵,W* f(a,τ)表示小波变换的共轭函数,a1和a2表示两个不同的尺度因子。
在一种可选的实施例中,
基于所述双谱矩阵,通过计算能量熵,提取能量分布特征包括:
所述能量熵对应的能量分布,其公式及如下:
其中,Eij表示ij对应位置的能量,i表示a1的尺度索引,j表示a2的尺度索引,Δa1表示a1对应的尺度带的宽度,Δa2表示a2对应的尺度带的宽度;
所述能量熵的公式如下:
其中,En表示能量熵结果,I表示a1的尺度索引上限,J表示a2的尺度索引上限,pij表示ij点的能量占总能量的比例,E表示总能量。
在一种可选的实施例中,
基于预先训练的特征选择模型,将所述综合特征数据输入所述特征选择模型,确定特征重要性评分包括:
使用所述综合特征数据构建训练集合,对所述特征选择模型进行训练;
从所述训练集合中,有放回的随机抽取样本,确定决策树的根节点,基于所述样本的特征,划分特征子集,基于所述特征子集进行节点分裂,完成所述决策树构建;
基于每个所述决策树的每次节点分裂,确定对应特征在所述节点分裂中的信息增益平均值,在所有决策树中,累加所述信息增益平均值,确定特征重要性评分。
在一种可选的实施例中,
将所述核心特征输入预先训练的球形最近邻分类器中,确定所述被试者的精神分裂症类别包括:
基于所述核心特征,以及带精神分裂症类别标签的被试者数据,对所述球形最近邻分类器进行训练;
基于所述被试者数据,确定数据点中心,计算所述数据点中心到所述被试者数据对应点的距离最大值,以所述数据点中心为球心,以及所述距离最大值为半径,构建超球体;
选择距离所述球心的最远数据点,作为左子球树球心,选择距离所述左子球树球心的最远数据点,作为右子球树球心,其他数据点按照距离进行球心分配,分别构建左子球树和右子球树;
迭代构建再下级子球树,直到达到预设的迭代次数,确定所有子球树范围,并对应所述精神分裂症类别标签;
将待测被试者数据输入训练完成的球形最近邻分类器,计算所述待测被试者数据与所述球形最近邻分类器中数据点的近邻距离,按照预设的最近邻数量,选取所述近邻距离最小值对应的近邻数据点,根据所述近邻数据点所在的所述子球树,投票确定所述待测被试者数据对应的精神分裂症类别。
本发明实施例的第二方面,
提供基于影像基因组学的精神分裂症分类系统,包括:
第一单元,用于采集被试者的影像基因组数据,基于所述影像基因组数据,分别构建同构网络和异构网络,将所述同构网络和所述异构网络组合成模态融合模型,输出融合图;
第二单元,用于对所述融合图对应的图像数据进行切割,得到分段数据,基于小波变换,计算所述分段数据对应的时频特征,经过小波双谱分析,确定双谱矩阵,计算并提取能量分布特征和灰度分布特征,将所述能量分布特征和所述灰度分布特征组合成综合特征数据;
第三单元,用于基于预先训练的特征选择模型,将所述综合特征数据输入所述特征选择模型,确定特征重要性评分,按照预设的特征数量选取核心特征,将所述核心特征输入预先训练的球形最近邻分类器中,确定所述被试者的精神分裂症类别。
本发明实施例的第三方面,
提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
本发明实施例的第四方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本发明实施例中,通过融合同构网络和异构网络,可以挖掘多模态数据之间的潜在联系和共性,有助于发现模态之间的相关性,从而更全面地理解被试者的数据;通过小波变换和小波双谱分析,能够有效地提取图像数据的时频特征,包括频域和时域信息,通过能量分布特征,了解图像中不同时频区域的能量分布情况,有助于发现图像的局部特征;灰度分布特征提供了关于图像整体灰度分布的信息,有助于捕捉图像的亮度和对比度变化;通过构建球树,模型更关注数据的局部结构,而不是整个特征空间,有助于在高维数据中更好地捕获数据点的局部关系,增强了模型的鲁棒性;球树的结构使得在特定领域内的数据检索更加高效,通过逐级的局部检索,减少了计算的时间复杂度,提高了算法的速度。
附图说明
图1为本发明实施例基于影像基因组学的精神分裂症分类方法的流程示意图;
图2为本发明实施例基于影像基因组学的精神分裂症分类系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明实施例基于影像基因组学的精神分裂症分类方法的流程示意图,如图1所示,所述方法包括:
S101.采集被试者的影像基因组数据,基于所述影像基因组数据,分别构建同构网络和异构网络,将所述同构网络和所述异构网络组合成模态融合模型,输出融合图;
所述同构网络具体是指所有节点都属于同一模态或拥有相似的特性,基于选择的相似性度量,计算影像基因组数据中每两个样本之间的相似性,形成相似性矩阵,确定同模态的样本相关性;
所述异构网络具体是指所有节点可以属于不同的类型,代表不同的数据模态,整合不同类型的影像基因组数据,通过计算不同数据模态之间的相似性或其他关联度量,确定不同节点类型之间的连接关系,确定跨模态的样本相关性;
在本实施例中,同构网络和异构网络的构建允许综合来自不同模态的信息,同构网络处理同一模态中的数据类型,而异构网络则处理不同模态中的数据,使得模型能够从多个角度理解被试者的影像基因组数据;通过融合同构网络和异构网络,可以挖掘多模态数据之间的潜在联系和共性,有助于发现模态之间的相关性,从而更全面地理解被试者的数据;模态融合模型的输出融合图可以用于提高对精神分裂症分类的准确率。
在一种可选的实施例中,采集被试者的影像基因组数据,基于所述影像基因组数据,分别构建同构网络和异构网络,将所述同构网络和所述异构网络组合成模态融合模型,输出融合图包括:
采集被试者的影像基因组数据,包括:被试者静息态大脑活动血流变化的功能性磁共振成像数据、单核苷酸多态性数据、DNA甲基化数据;
所述影像基因组数据组成多模态数据,基于所述多模态数据,通过高斯径向基函数,确定模态内部的内部相似度矩阵,构建同构网络;
基于加权图扩散过程,通过相似性信息传播,确定模态之间的外部相似度矩阵,构建异构网络;
基于所述同构网络和所述异构网络,确定模态融合模型;
基于所述影像基因组数据,通过所述模态融合模型,确定综合特征图。
所述功能性磁共振成像数据具体是指使用功能性磁共振成像技术,通过在被试者进行任务或处于静息状态时记录脑区域的血流变化,以时间序列形式呈现;
所述单核苷酸多态性数据具体是指进行基因测序或使用基因芯片技术,检测被试者基因组中的单核苷酸多态性包含基因组中不同位置上的单核苷酸多态性信息,通常表示为基因型;
所述DNA甲基化数据具体是指使用甲基化芯片技术或基因组测序技术,检测DNA分子上的甲基基团的分布情况,包含DNA分子上的甲基化信息,通常表示为某个基因区域的甲基化程度
所述高斯径向基函数具体是指用于测量样本之间相似度的方法,它通过计算样本之间的欧氏距离并将其映射到高斯分布上;
所述加权图扩散过程具体是指通过加权图中的边传播信息的方法,用于捕捉不同模态数据之间的关联性;
对每个模态的数据计算高斯径向基函数相似度矩阵,将相似度矩阵用于构建同构网络,其中节点表示样本,边表示样本之间的相似关系;基于同构网络中的相似度矩阵,计算模态之间的外部相似度矩阵,使用相似度信息进行加权图扩散,将不同模态的节点之间传播信息,构建异构网络;将被试者的影像基因组数据输入模态融合模型;模型输出综合特征图,其中包含了来自不同模态的信息的综合特征表示。
在本实施例中,通过综合多模态数据,模态融合模型能够更全面地捕捉被试者的影像基因组特征;组合同构和异构网络能够综合利用相似性信息,使模型更具优势,提高对综合特征的理解能力;模态融合模型有助于提取丰富的特征,可以在后续任务中提高精度和性能。
S102.对所述融合图对应的图像数据进行切割,得到分段数据,基于小波变换,计算所述分段数据对应的时频特征,经过小波双谱分析,确定双谱矩阵,计算并提取能量分布特征和灰度分布特征,将所述能量分布特征和所述灰度分布特征组合成综合特征数据;
所述小波双谱分析具体是指将信号分解成不同频率的成分,分析图像数据的时频特征,基于时频领域对信号进行双谱分析,揭示信号的非线性和非高斯特性;
所述灰度分布特征具体是指图像的灰度分布统计特征,称为灰度矩,是颜色矩的一种特殊情况,对于灰度图像,每个像素的灰度值是一个单一的数值,常见的灰度矩包括均值、方差、偏度、峰度等,优选地,考虑均值和方差;
对融合图对应的图像数据进行切割,将其分为若干段,对每个分段数据进行小波变换,得到时频特征,确定图像数据在时间和频率上的变化情况,对小波变换后的数据进行双谱分析,计算不同频率成分之间的相互关系,确定双谱矩阵,基于小波双谱分析的结果,计算能量分布特征,描述信号在频域上的能量分布,同时统计图像中每个灰度级别的像素数量,提取灰度分布特征,将计算得到的能量分布特征和灰度分布特征组合成综合特征数据;
在本实施例中,通过小波变换和小波双谱分析,能够有效地提取图像数据的时频特征,包括频域和时域信息,通过能量分布特征,了解图像中不同时频区域的能量分布情况,有助于发现图像的局部特征;灰度分布特征提供了关于图像整体灰度分布的信息,有助于捕捉图像的亮度和对比度变化。
在一种可选的实施例中,对所述融合图对应的图像数据进行切割,得到分段数据,基于小波变换,计算所述分段数据对应的时频特征,经过小波双谱分析,确定双谱矩阵,计算并提取能量分布特征和灰度分布特征,将所述能量分布特征和所述灰度分布特征组合成综合特征数据包括:
将所述融合图对应的图像数据分段处理,并减去所述图像数据的数据均值,确定分段数据;
基于带宽系数和中心频率,确定小波函数,结合尺度因子,对所述分段数据进行小波变换,计算时频特征,经过小波双谱分析,确定双谱矩阵;
基于所述双谱矩阵,通过计算能量熵,提取能量分布特征;
将所述双谱矩阵转换为灰度图像,通过计算所述灰度图像对应的灰度矩,提取灰度分布特征,其中,所述灰度矩包括根据所述灰度图像的均值确定的一阶矩和根据所述灰度图像的方差确定的二阶矩;
将所述能量分布特征和所述灰度分布特征组合成综合特征数据。
所述带宽系数具体是指小波变换中用于调整小波函数在频率域内的宽度的参数,影响小波函数的频带范围,较大的带宽系数对应较宽的频带,而较小的带宽系数对应较窄的频带;
所述中心频率具体是指小波函数在频率域内的中心位置,决定小波函数的主要频率成分,通过调整中心频率,可以选择对不同频率范围的信号进行分析;
将融合图对应的图像数据分成若干段,形成分段数据,对每个分段数据,减去数据的均值,以实现数据的零均值化;
根据预先设定的带宽系数和中心频率,构建适当的小波函数,其中,带宽系数用于控制小波函数在频率域内的展宽或压缩,中心频率决定小波函数在频率域内的位置;利用确定的小波函数对每个分段数据进行小波变换,得到时频领域内的信号表示,即反映信号在时间和频率上的特征;在时频领域内进行小波双谱分析,得到双谱矩阵,揭示信号的非线性和非高斯特性,提供更全面的频谱信息;
基于双谱矩阵,计算能量熵以提取能量分布特征,所述能量熵描述了信号在时频领域内能量分布的统计量,对信号的动态特性提供了信息;
将双谱矩阵转换为灰度图像,计算灰度矩,包括一阶矩均值和二阶矩方差,确定灰度分布特征;
将能量分布特征和灰度分布特征结合,形成综合特征数据;
在本实施例中,小波双谱分析能够揭示信号的非线性和非高斯特性,提供更全面的频谱信息,有助于发现数据中的潜在复杂结构;能量熵提取了信号在时频领域内的能量分布情况,有助于识别信号的动态特性和频谱特征;灰度矩包括均值和方差等统计信息,对信号的整体亮度和灰度分布进行描述,通过将时频能量分布、灰度分布结合成综合特征数据,实现多源数据的融合和降维,有助于提取更具代表性的信息。
在一种可选的实施例中,基于带宽系数和中心频率,确定小波函数,结合尺度因子,对所述分段数据进行小波变换,计算时频特征,经过小波双谱分析,确定双谱矩阵包括:
所述小波函数,其公式如下:
其中,ψ(t)表示小波函数,fb表示带宽系数,i表示虚数单位,fc表示中心频率,t表示时间变量;
对所述分段数据进行所述小波变换,其对应公如下:
其中,Wf(a,τ)表示小波变换结果,τ表示时移参数,a表示尺度因子,f(t)表示输入数据,表示对时间t进行a的缩放并在时间轴上时移τ,ψ*()表示小波函数的共轭函数;
经过小波双谱分析,确定双谱矩阵,其公式及如下:
其中,B(a1,a2)表示双谱矩阵,W* f(a,τ)表示小波变换的共轭函数,a1和a2表示两个不同的尺度因子。
所述小波函数的公式表达了一个复数域内的小波函数,其频域特性受到带宽系数和中心频率的调节,具体地,小波函数是一个以时间t为自变量的复数函数,其形式包括指数函数和高斯分布,其中,指数函数部分反映信号的频率特性,而高斯分布部分决定信号在时间域内的时域展宽;
对于分段数据进行小波变换的公式描述在不同尺度因子和时移下,输入数据经过小波函数的变换过程,所述变换过程涉及输入数据在时间轴上的尺度变换和平移,通过与小波函数的共轭进行内积运算,得到在不同尺度下的时频表示结果;
小波双谱分析表示信号在不同尺度下的频谱特性之间的关联,双谱矩阵的计算涉及到小波变换结果在不同尺度下的共轭函数之间的内积运算,通过这种运算,揭示出信号的非线性和非高斯特性,提供了更丰富的频谱信息;
根据所述公式,通过多尺度分析,有助于更全面地理解信号的频域和时域性质;通过小波双谱分析,获取双谱矩阵,进而计算能量分布特征,用于描述信号在时频领域内的能量分布情况;小波变换还具有去噪的效果,能够减小信号中的噪声干扰,提高信号的质量。
在一种可选的实施例中,基于所述双谱矩阵,通过计算能量熵,提取能量分布特征包括:
所述能量熵对应的能量分布,其公式及如下:
其中,Eij表示ij对应位置的能量,i表示a1的尺度索引,j表示a2的尺度索引,Δa1表示a1对应的尺度带的宽度,Δa2表示a2对应的尺度带的宽度;
所述能量熵的公式如下:
其中,En表示能量熵结果,I表示a1的尺度索引上限,J表示a2的尺度索引上限,pij表示ij点的能量占总能量的比例,E表示总能量。
能量熵是通过计算双谱矩阵在不同尺度带上的能量分布得到的,具体地,通过对每个尺度带进行积分,计算在该尺度带内的能量,然后将所有尺度带上的能量合并为总能量,对于每个尺度带,计算其能量占总能量的比例,并应用信息熵的定义,将其负对数加到总能量熵中,这个过程在所有尺度带上进行,得到最终的能量熵结果;
根据所述公式,通过双谱矩阵的计算,揭示信号在不同尺度的时频分布特性,能够深入理解信号的频谱结构,包括不同频率成分的关联性;能量熵的计算基于能量分布矩阵,用于衡量信号在不同尺度下的能量分布,提供关于信号局部和全局能量分布的详细信息;能量熵通过考虑不同尺度上的能量占比,突显了尺度相关性的重要性,对于理解信号在不同时间尺度和频率尺度上的行为非常关键。
S103.基于预先训练的特征选择模型,将所述综合特征数据输入所述特征选择模型,确定特征重要性评分,按照预设的特征数量选取核心特征,将所述核心特征输入预先训练的球形最近邻分类器中,确定所述被试者的精神分裂症类别;
所述特征选择模型具体是指一种通过挑选最相关或者最具代表性的特征来提高模型性能的技术,通过基于随机森林构建的特征选择模型通过学习数据的特征重要性,从而选择对任务最有利的特征;
所述球形最近邻分类器具体是指一种基于球树结构的近邻分类器,通过构建球树加快对数据点进行近邻搜索,快速找到符合数据点的分类;
利用预先训练的特征选择模型对综合特征数据进行处理,模型输出每个特征的重要性评分,反映了它们对任务的贡献,特征选择有助于提高模型的解释性、降低过拟合风险、减少计算成本;
将核心特征输入球形最近邻分类器,快速找到最近邻的数据点,基于最近邻的类别信息进行分类,通过球树实现了高效的近邻搜索,适用于处理大规模数据集,对于快速且准确地对被试者进行分类至关重要,提高分类的准确性。
在一种可选的实施例中,基于预先训练的特征选择模型,将所述综合特征数据输入所述特征选择模型,确定特征重要性评分包括:
使用所述综合特征数据构建训练集合,对所述特征选择模型进行训练;
从所述训练集合中,有放回的随机抽取样本,确定决策树的根节点,基于所述样本的特征,划分特征子集,基于所述特征子集进行节点分裂,完成所述决策树构建;
基于每个所述决策树的每次节点分裂,确定对应特征在所述节点分裂中的信息增益平均值,在所有决策树中,累加所述信息增益平均值,确定特征重要性评分。
所述信息增益具体是一种指用于决策树构建的指标,用于衡量在选择某个特征进行节点分裂时,该特征对分类任务的贡献程度,信息增益表示在特征已知的情况下,分类的不确定性减少了多少,在决策树的构建中,我们希望选择那些在分裂节点后最大程度减少分类不确定性的特征,即信息增益最大的特征;
使用综合特征数据构建训练集,包括特征和对应的标签;
将训练集输入特征选择模型进行训练,模型学习特征之间的关系,并给出每个特征的重要性评分;
从训练集中有放回地随机抽取样本,构建决策树,在每次节点分裂时,基于样本的特征,划分特征子集,并选择能够最大化信息增益的特征进行节点分裂,重复节点分裂过程直到满足停止条件,如达到最大深度、节点样本数小于阈值等,优选地,达到预设的迭代次数;
对于每个决策树的每次节点分裂,计算对应特征的信息增益,通过比较节点分裂前后的不确定性来衡量特征的贡献程度,通常使用熵或基尼不纯度来度量不确定性;
对于每个特征,在所有决策树中累加其信息增益的平均值,较高的信息增益平均值表示该特征对于样本分类的贡献较大,因此其重要性评分较高。
在本实施例中,通过随机抽取样本并构建决策树,有效地处理大量数据,并且能够处理具有复杂关系的数据集,决策树的构建过程具有很好的解释性,可以直观地呈现数据特征和分类规则;信息增益是评估特征重要性的关键指标,帮助选择最佳的特征进行节点分裂,从而提高模型的分类准确性,通过计算信息增益,可以找到最能区分不同类别的特征,为模型提供更有效的判别能力。
在一种可选的实施例中,将所述核心特征输入预先训练的球形最近邻分类器中,确定所述被试者的精神分裂症类别包括:
基于所述核心特征,以及带精神分裂症类别标签的被试者数据,对所述球形最近邻分类器进行训练;
基于所述被试者数据,确定数据点中心,计算所述数据点中心到所述被试者数据对应点的距离最大值,以所述数据点中心为球心,以及所述距离最大值为半径,构建超球体;
选择距离所述球心的最远数据点,作为左子球树球心,选择距离所述左子球树球心的最远数据点,作为右子球树球心,其他数据点按照距离进行球心分配,分别构建左子球树和右子球树;
迭代构建再下级子球树,直到达到预设的迭代次数,确定所有子球树范围,并对应所述精神分裂症类别标签;
将待测被试者数据输入训练完成的球形最近邻分类器,计算所述待测被试者数据与所述球形最近邻分类器中数据点的近邻距离,按照预设的最近邻数量,选取所述近邻距离最小值对应的近邻数据点,根据所述近邻数据点所在的所述子球树,投票确定所述待测被试者数据对应的精神分裂症类别。
所述距离可以选择欧氏距离、曼哈顿距离或切比雪夫距离,优选地,使用切比雪夫距离计算点之间的距离;
首先确定训练集合,将带有精神分裂症类别标签的被试者数据与核心特征对应,形成训练集;使用训练集对球形最近邻分类器进行训练,对特征空间的划分,以便有效地区分不同类别;
构建球树,使分类器可以快速搜索,计算核心特征数据的中心点,计算到核心特征数据对应点的距离最大值,作为半径,构建超球体;选择距离球心最远的数据点,将其作为左子球树球心,选择距离左子球树球心最远的数据点,作为右子球树球心,计算其他数据点与左子球树球心、右子球树球心的距离,选择距离较近的,分配到左子球树或者右子球树,分别构建这两颗子球树;迭代逐级构建再下级子球树,直到达到预设的迭代次数;
每个子球树对应一个精神分裂症类别标签,将待测被试者数据输入到训练完成的球形最近邻分类器中,计算待测被试者数据与球形最近邻分类器中数据点的近邻距离,按照预设的最近邻数量,选取距离最小值对应的近邻数据点,相当于投票的形式,统计出各近邻数据点所对应的精神分裂症类别标签,数量最大值,可以确定待测被试者数据对应的精神分裂症类别;当数量相同时,选择距离更近的统计结果,作为精神分裂症类别。
在本实施例中,通过构建球树,模型更关注数据的局部结构,而不是整个特征空间,有助于在高维数据中更好地捕获数据点的局部关系,增强了模型的鲁棒性;球树的结构使得在特定领域内的数据检索更加高效,通过逐级的局部检索,减少了计算的时间复杂度,提高了算法的速度;球形最近邻分类器通过构建多层次的球树,对不同层次的子球树分别进行分类,形成一个多层次的分类器,多层次结构有助于提高模型的分类准确性。
图2为本发明实施例基于影像基因组学的精神分裂症分类系统的结构示意图,如图2所示,所述系统包括:
第一单元,用于采集被试者的影像基因组数据,基于所述影像基因组数据,分别构建同构网络和异构网络,将所述同构网络和所述异构网络组合成模态融合模型,输出融合图;
第二单元,用于对所述融合图对应的图像数据进行切割,得到分段数据,基于小波变换,计算所述分段数据对应的时频特征,经过小波双谱分析,确定双谱矩阵,计算并提取能量分布特征和灰度分布特征,将所述能量分布特征和所述灰度分布特征组合成综合特征数据;
第三单元,用于基于预先训练的特征选择模型,将所述综合特征数据输入所述特征选择模型,确定特征重要性评分,按照预设的特征数量选取核心特征,将所述核心特征输入预先训练的球形最近邻分类器中,确定所述被试者的精神分裂症类别。
本发明实施例的第三方面,
提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
本发明实施例的第四方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本发明可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本发明的各个方面的计算机可读程序指令。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.基于影像基因组学的精神分裂症分类方法,其特征在于,包括:
采集被试者的影像基因组数据,基于所述影像基因组数据,分别构建同构网络和异构网络,将所述同构网络和所述异构网络组合成模态融合模型,输出融合图;
对所述融合图对应的图像数据进行切割,得到分段数据,基于小波变换,计算所述分段数据对应的时频特征,经过小波双谱分析,确定双谱矩阵,计算并提取能量分布特征和灰度分布特征,将所述能量分布特征和所述灰度分布特征组合成综合特征数据;
基于预先训练的特征选择模型,将所述综合特征数据输入所述特征选择模型,确定特征重要性评分,按照预设的特征数量选取核心特征,将所述核心特征输入预先训练的球形最近邻分类器中,确定所述被试者的精神分裂症类别。
2.根据权利要求1所述的方法,其特征在于,采集被试者的影像基因组数据,基于所述影像基因组数据,分别构建同构网络和异构网络,将所述同构网络和所述异构网络组合成模态融合模型,输出融合图包括:
采集被试者的影像基因组数据,包括:被试者静息态大脑活动血流变化的功能性磁共振成像数据、单核苷酸多态性数据、DNA甲基化数据;
所述影像基因组数据组成多模态数据,基于所述多模态数据,通过高斯径向基函数,确定模态内部的内部相似度矩阵,构建同构网络;
基于加权图扩散过程,通过相似性信息传播,确定模态之间的外部相似度矩阵,构建异构网络;
基于所述同构网络和所述异构网络,确定模态融合模型;
基于所述影像基因组数据,通过所述模态融合模型,确定综合特征图。
3.根据权利要求1所述的方法,其特征在于,对所述融合图对应的图像数据进行切割,得到分段数据,基于小波变换,计算所述分段数据对应的时频特征,经过小波双谱分析,确定双谱矩阵,计算并提取能量分布特征和灰度分布特征,将所述能量分布特征和所述灰度分布特征组合成综合特征数据包括:
将所述融合图对应的图像数据分段处理,并减去所述图像数据的数据均值,确定分段数据;
基于带宽系数和中心频率,确定小波函数,结合尺度因子,对所述分段数据进行小波变换,计算时频特征,经过小波双谱分析,确定双谱矩阵;
基于所述双谱矩阵,通过计算能量熵,提取能量分布特征;
将所述双谱矩阵转换为灰度图像,通过计算所述灰度图像对应的灰度矩,提取灰度分布特征,其中,所述灰度矩包括根据所述灰度图像的均值确定的一阶矩和根据所述灰度图像的方差确定的二阶矩;
将所述能量分布特征和所述灰度分布特征组合成综合特征数据。
4.根据权利要求3所述的方法,其特征在于,基于带宽系数和中心频率,确定小波函数,结合尺度因子,对所述分段数据进行小波变换,计算时频特征,经过小波双谱分析,确定双谱矩阵包括:
所述小波函数,其公式如下:
其中,ψ(t)表示小波函数,fb表示带宽系数,i表示虚数单位,fc表示中心频率,t表示时间变量;
对所述分段数据进行所述小波变换,其对应公如下:
其中,Wf(a,τ)表示小波变换结果,τ表示时移参数,a表示尺度因子,f(t)表示输入数据,表示对时间t进行a的缩放并在时间轴上时移τ,ψ*()表示小波函数的共轭函数;
经过小波双谱分析,确定双谱矩阵,其公式及如下:
其中,B(a1,a2)表示双谱矩阵,W* f(a,τ)表示小波变换的共轭函数,a1和a2表示两个不同的尺度因子。
5.根据权利要求3所述的方法,其特征在于,基于所述双谱矩阵,通过计算能量熵,提取能量分布特征包括:
所述能量熵对应的能量分布,其公式及如下:
其中,Eij表示ij对应位置的能量,i表示a1的尺度索引,j表示a2的尺度索引,Δa1表示a1对应的尺度带的宽度,Δa2表示a2对应的尺度带的宽度;
所述能量熵的公式如下:
其中,En表示能量熵结果,I表示a1的尺度索引上限,J表示a2的尺度索引上限,pij表示ij点的能量占总能量的比例,E表示总能量。
6.根据权利要求1所述的方法,其特征在于,基于预先训练的特征选择模型,将所述综合特征数据输入所述特征选择模型,确定特征重要性评分包括:
使用所述综合特征数据构建训练集合,对所述特征选择模型进行训练;
从所述训练集合中,有放回的随机抽取样本,确定决策树的根节点,基于所述样本的特征,划分特征子集,基于所述特征子集进行节点分裂,完成所述决策树构建;
基于每个所述决策树的每次节点分裂,确定对应特征在所述节点分裂中的信息增益平均值,在所有决策树中,累加所述信息增益平均值,确定特征重要性评分。
7.根据权利要求1所述的方法,其特征在于,将所述核心特征输入预先训练的球形最近邻分类器中,确定所述被试者的精神分裂症类别包括:
基于所述核心特征,以及带精神分裂症类别标签的被试者数据,对所述球形最近邻分类器进行训练;
基于所述被试者数据,确定数据点中心,计算所述数据点中心到所述被试者数据对应点的距离最大值,以所述数据点中心为球心,以及所述距离最大值为半径,构建超球体;
选择距离所述球心的最远数据点,作为左子球树球心,选择距离所述左子球树球心的最远数据点,作为右子球树球心,其他数据点按照距离进行球心分配,分别构建左子球树和右子球树;
迭代构建再下级子球树,直到达到预设的迭代次数,确定所有子球树范围,并对应所述精神分裂症类别标签;
将待测被试者数据输入训练完成的球形最近邻分类器,计算所述待测被试者数据与所述球形最近邻分类器中数据点的近邻距离,按照预设的最近邻数量,选取所述近邻距离最小值对应的近邻数据点,根据所述近邻数据点所在的所述子球树,投票确定所述待测被试者数据对应的精神分裂症类别。
8.基于影像基因组学的精神分裂症分类系统,用于实现前述权利要求1-7中任一项所述的基于影像基因组学的精神分裂症分类方法,其特征在于,包括:
第一单元,用于采集被试者的影像基因组数据,基于所述影像基因组数据,分别构建同构网络和异构网络,将所述同构网络和所述异构网络组合成模态融合模型,输出融合图;
第二单元,用于对所述融合图对应的图像数据进行切割,得到分段数据,基于小波变换,计算所述分段数据对应的时频特征,经过小波双谱分析,确定双谱矩阵,计算并提取能量分布特征和灰度分布特征,将所述能量分布特征和所述灰度分布特征组合成综合特征数据;
第三单元,用于基于预先训练的特征选择模型,将所述综合特征数据输入所述特征选择模型,确定特征重要性评分,按照预设的特征数量选取核心特征,将所述核心特征输入预先训练的球形最近邻分类器中,确定所述被试者的精神分裂症类别。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至7中任意一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至7中任意一项所述的方法。
CN202410280876.XA 2024-03-12 2024-03-12 基于影像基因组学的精神分裂症分类方法及系统 Pending CN118015381A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410280876.XA CN118015381A (zh) 2024-03-12 2024-03-12 基于影像基因组学的精神分裂症分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410280876.XA CN118015381A (zh) 2024-03-12 2024-03-12 基于影像基因组学的精神分裂症分类方法及系统

Publications (1)

Publication Number Publication Date
CN118015381A true CN118015381A (zh) 2024-05-10

Family

ID=90956037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410280876.XA Pending CN118015381A (zh) 2024-03-12 2024-03-12 基于影像基因组学的精神分裂症分类方法及系统

Country Status (1)

Country Link
CN (1) CN118015381A (zh)

Similar Documents

Publication Publication Date Title
CN111985536B (zh) 一种基于弱监督学习的胃镜病理图像分类方法
Sun et al. Cervical cancer diagnosis based on random forest
CN111553127A (zh) 一种多标记的文本类数据特征选择方法及装置
CN111797326A (zh) 一种融合多尺度视觉信息的虚假新闻检测方法及系统
CN111950408B (zh) 基于规则图的手指静脉图像识别方法、装置及存储介质
CN110705722A (zh) 一种工业设备故障诊断的诊断模型及其构建方法和应用
Zhang et al. Feature-transfer network and local background suppression for microaneurysm detection
Mabrouk et al. Immune system programming for medical image segmentation
CN111564179A (zh) 一种基于三元组神经网络的物种生物学分类方法及系统
CN112580780A (zh) 模型训练的处理方法、装置、设备和存储介质
Mithra et al. FHDT: fuzzy and Hyco-entropy-based decision tree classifier for tuberculosis diagnosis from sputum images
CN112434718A (zh) 基于深度图的新冠肺炎多模态特征提取融合方法及系统
Dou et al. Comparative analysis of weka-based classification algorithms on medical diagnosis datasets
Lim et al. A scene image is nonmutually exclusive—a fuzzy qualitative scene understanding
CN116664585B (zh) 基于深度学习的头皮健康状况检测方法及相关装置
CN117315379A (zh) 面向深度学习的医学影像分类模型公平性评估方法及装置
CN110929731B (zh) 一种基于探路者智能搜索算法的医疗影像处理方法及装置
CN117195027A (zh) 基于成员选择的簇加权聚类集成方法
CN118015381A (zh) 基于影像基因组学的精神分裂症分类方法及系统
CN108846407B (zh) 基于独立成分高序不确定脑网络的磁共振影像分类方法
CN116229330A (zh) 一种视频有效帧的确定方法、系统、电子设备及存储介质
CN116010840A (zh) 一种多源域样本重加权的eeg信号跨设备解码方法
CN114168781A (zh) 病理图像检索方法及装置
CN114565617A (zh) 基于剪枝U-Net++的乳腺肿块图像分割方法及系统
CN112308844A (zh) 血管管腔提取方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication