CN115222007B - 面向胶质瘤多任务一体化网络的改进粒子群参数优化方法 - Google Patents

面向胶质瘤多任务一体化网络的改进粒子群参数优化方法 Download PDF

Info

Publication number
CN115222007B
CN115222007B CN202210611738.6A CN202210611738A CN115222007B CN 115222007 B CN115222007 B CN 115222007B CN 202210611738 A CN202210611738 A CN 202210611738A CN 115222007 B CN115222007 B CN 115222007B
Authority
CN
China
Prior art keywords
particle
fitness
population
loss
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210611738.6A
Other languages
English (en)
Other versions
CN115222007A (zh
Inventor
耿道颖
余荔恒
于泽宽
朱静逸
陈卫强
李强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Hong Kong Macao Dawan District Institute Of Precision Medicine Guangzhou
Fudan University
Original Assignee
Guangdong Hong Kong Macao Dawan District Institute Of Precision Medicine Guangzhou
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Hong Kong Macao Dawan District Institute Of Precision Medicine Guangzhou, Fudan University filed Critical Guangdong Hong Kong Macao Dawan District Institute Of Precision Medicine Guangzhou
Priority to CN202210611738.6A priority Critical patent/CN115222007B/zh
Publication of CN115222007A publication Critical patent/CN115222007A/zh
Application granted granted Critical
Publication of CN115222007B publication Critical patent/CN115222007B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10088Magnetic resonance imaging [MRI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30016Brain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,包括:步骤1:构建脑胶质瘤患者数据集:步骤2:进行数据预处理;步骤3:构建多任务学习框架;步骤4:构建多任务损失函数;步骤5:通过改进的粒子群优化算法对多任务学习框架进行优化训练,得到损失函数中两个任务的最佳权重;步骤6:在网络中载入训练集,确定网络模型的参数,得到训练好的网络模型并保存,载入训练好的网络模型,输入测试集进行预测,得到结果并根据标签计算各评价指标值。本发明使用改进的粒子群优化算法可以根据粒子适应度来调节惯性权重,实现惯性权重的自适应调整。

Description

面向胶质瘤多任务一体化网络的改进粒子群参数优化方法
技术领域
本发明涉及医学图像处理技术领域,具体地,涉及一种面向胶质瘤多任务一体化网络的改进粒子群参数优化方法。
背景技术
脑胶质瘤是中枢神经系统中最常见的原发性脑肿瘤,在组织学上表现出神经胶质细胞的特征,占主要脑肿瘤疾病的约45%。高级别脑胶质瘤(High Grade Glioma,HGG)是致死率最高的脑胶质瘤,由世界卫生组织定义的III级和IV级脑胶质瘤组成,占所有级别脑胶质瘤的75%左右,严重威胁患者的生命健康。目前,临床治疗不能很有效地治愈高级别脑胶质瘤,同时考虑到高级别脑胶质瘤致死率高和难治疗的特点,若能使用计算机辅助诊断技术帮助医生准确进行早期诊断和预后,将对制定治疗方案、延长患者寿命、提高生活质量等方面有重要临床价值和现实意义。
脑肿瘤图像精准分割可以有效地帮助临床医生进行胶质瘤的早期诊断、治疗方案的制定、和治疗效果的跟踪随访等,同时也是相关研究中不可缺少的图像处理过程。由于脑胶质瘤生长具有浸润性,其病变能侵入到血管周围或神经纤维束间的空隙中,与未病变脑组织之间没有明显得边界。不同肿瘤组织结构的灰度差异大,不同患者肿瘤的大小、形状、位置和肿瘤类型都不尽相同。同一个胶质瘤患者在不同医院、不同类型的磁共振扫描下、不同型号的影像采集序列获得的影像差异非常大,这些现实因素都对脑肿瘤精准自动分割算法造成了较大的挑战。
此外,结合肿瘤形态学和基因分子学特征对患者进行个性化治疗得到越来越多的外科医生和学者的认可。例如,异柠檬酸脱氢酶(IDH)被认为脑胶质瘤分类的基础生物标志物,其突变状态的确认关系到脑胶质瘤的确诊、治疗和治疗效果的判断,在临床方面具有重要意义。通过手术或活检获取到病变组织的样本来确认IDH突变状态可能会产生神经功能缺损的后遗症,给患者的正常生活造成更大的影响。磁共振成像MRI是最常规的分析脑胶质瘤的无创技术,但目前通过MRI鉴别相关基因状态的敏感性和特异性波动极大,即使是神经放射科医生也很难根据这些图像表型准确区分脑胶质瘤基因型。因此研究一种具有较高稳定性和临床应用价值的方法,以通过MRI预测脑胶质瘤的基因状态具有重要意义。
近年来,以深度学习为代表的机器学习在图像识别及分类领域中发挥着重要的作用。U-net网络的提出使人们开始利用计算机强大的计算能力对医学图像进行处理和分析,在医学图像分割方面取得了巨大的成功,但它缺乏对长期依赖关系进行显式建模的能力。Transformer由于具有利用自注意机制进行全局信息建模的能力,逐渐在医学图像处理中得到广泛应用。
专利文献CN108875788A(申请号:CN201810500520.7)公开了一种基于改进的粒子群算法的SVM分类器参数优化方法,包括:(1)对采集的样本数据进行10重交叉验证,选择影响分类器性能的参数作为待优化参数;(2)初始化分类器和粒子群算法的相关参数,根据所述相关参数更新粒子速度和位置;(3)将分类器的待优化参数设置为粒子当前位置的相应维度值,计算得到粒子当前位置对应的适应度值;(4)根据所述粒子当前位置对应的适应度值得到适应度值评估粒子,更新所述个体最优位置和种群最优位置。
虽然基于深度学习的方法在肿瘤分割、基因预测等方面取得了一定进展,但仍存在一些问题:在肿瘤分割时,胶质瘤区域在整个大脑中所占的比例很小,存在像素不平衡;在基因型分类预测时,存在类别不平衡;并且患者基因分子信息的稀缺,通过活检方法进行分子状态识别可能会给患者带来危险。此外,现有的基于自动的方法大多基于单任务方法,没有考虑两个任务之间的相关性。因此,需要一种高效准确的深度学习网络来联合训练两个任务,以实现胶质瘤分割和术前基因分子型准确预测。
利用多任务网络模型联合训练两个任务时,以最小化多任务损失函数为目标对网络进行训练,通过手动设置参数来平衡两个任务的差异具有不确定性,难以得到最优效果。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种面向胶质瘤多任务一体化网络的改进粒子群参数优化方法。
根据本发明提供的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,包括:
步骤1:构建脑胶质瘤患者数据集:
步骤2:进行数据预处理,首先对原始数据进行数据增强操作,对原始图像进行裁剪、翻转、旋转操作生成新的图像并添加到数据集中,其次对图像进行标准化处理以增强图像目标区域的特征;
步骤3:构建多任务学习框架,包括用于特征提取的编码器、实现分割的解码器、进行分类预测的分类器;
步骤4:构建多任务损失函数,基于Dice系数的损失函数被用作分割损失,对于基因型的预测,Poly loss被用作分类损失;
步骤5:通过改进的粒子群优化算法对多任务学习框架进行优化训练,得到损失函数中两个任务的最佳权重;
步骤6:在网络中载入训练集,确定网络模型的参数,得到训练好的网络模型并保存,载入训练好的网络模型,输入测试集进行预测,得到结果并根据标签计算各评价指标值。
优选的,所述步骤1包括:
MRI图像预处理包括颅骨去除、配准到统一空间、重采样到1mm3的分辨率,获得分辨率统一、灰度分布相同的多模态MRI数据,预处理后的所有数据大小为240×240×240。
优选的,所述步骤2包括:
将所有原始图像在-10到10度范围内进行随机旋转,以0.5的概率在轴向、冠状和矢状面上随机翻转,图像随机裁剪到128×128×128的体素大小来扩充数据集Idata,标签Lmask也进行相同的数据增强操作;
对所有图像进行标准化处理,公式如下:
Figure BDA0003672262550000031
其中,μ为图像的均值,x表示图像矩阵,σ和N分别表示图像的标准差和图像体素数量。
优选的,所述步骤3包括:
给定MRI扫描输入X∈RC×H×W×D,空间分辨率为H×W,深度维度为D,通道数为C,利用3D CNN生成捕捉空间和深度信息的特征图,然后利用Transformer编码器对全局空间中的长距离依赖性进行建模;
在实现胶质瘤分割任务的分支中,为减少编码特征和解码特征间的语义差异,用通道交叉Transformer模型CCT和通道交叉注意力模块CCA来代替普通U-net网络中的跳跃连接,编码部分的多尺度特征通过CCT模块进行交叉融合,对于编码部分的4层输出Ei,首先对特征进行token化,将特征变形为块大小的序列,使得这些块在4种尺度下映射到编码特征的相同区域,然后将token输入到多头交叉注意力模块和具有残差结构的多层感知机MLP中,以编码通道关系和依赖;
将第i级Transformer的输出Oi和第i级解码特征Di作为CCA模块的输入,并通过全局平均池化操作进行空间压缩,之后对通道依赖进行编码,嵌入全局空间信息到通道注意力图中,最终根据每个通道的重要性重新激活Oi得到
Figure BDA0003672262550000041
再将/>
Figure BDA0003672262550000042
与第i级解码器的上采样特征进行拼接融合,之后通过反卷积操作逐步恢复图像的分辨率,产生高分辨率的分割结果;
在实现基因预测任务的分支中,使用全局平均池化和全局最大池化将编码部分获取的最后两级特征变换到每个通道中的相同尺寸,并加入临床数据通过级联进行融合,然后输入到三个全连接层中,最后由Softmax函数输出基因型的预测概率,实现基因型预测。
优选的,所述用于特征提取的编码器包括:
采用一系列卷积和Transformer操作从输入中提取全局语义特征,输入先进行3×3×3的初始卷积操作,产生具有16个通道的特征图,接着通过3次下采样操作来捕获空间和深度特征表示,下采样操作通过步长为2的3×3×3的卷积来实现,每一次下采样操作后,输出的通道数量翻一倍,大小变为原来的一半,编码后的低分辨特征表示为
Figure BDA0003672262550000043
Figure BDA0003672262550000044
为确保每个体素的全面表示,使用线性投影将通道维度从128增加到512,并把空间维度和深度维度扩展成一维,得到
Figure BDA0003672262550000045
大小的特征图f;为了对位置信息进行编码,引入可学习的位置嵌入,并通过与特征图f融合,得到如下的特征嵌入:
z0=f+PE=W×F+PE
其中,W为线性投影操作,PE∈Rd×N为位置嵌入,z0∈Rd×N为特征嵌入,之后z0被送到L层堆叠的Transformer中;
每一层Transformer层由一个多头注意力MHA和一个前馈网络FFN组成,对于第l层,自注意力的输入是根据zl-1计算的三元组(Q,K,V):
Q=zl-1WQ,K=zl-1WK,V=zl-1WV
其中,WQ,WK,WV∈Rd×d是三个线性投影层的可学习参数,d是(Q,K,V)的维数;
自注意力计算如下:
Figure BDA0003672262550000046
MHA是Transformer层重要的组成部分,允许模型同时关注来自不同位置的不同子空间的表示信息,通过将Transformer层的输入分成n个独立部分,并行处理每个部分,然后使用线性投影对级联结果进行投影,MHA操作表示如下:
MHA(zl-1)=Concat(SA1(zl-1),...,SAn(zl-1))WO
其中,WO是线性投影层的可学习参数,Concat()是连接操作;
然后,MHA的输出送入FFN模块得到第l个Transformer层的输出,第l个Transformer层的输出计算为:
z′l=MHA(LN(zl-1))+zl-1
zl=FFN(LN(z′l))+z′l
LN(*)表示层归一化操作,zl表示第l层的输出,l∈[1,2,...,L];
通道交叉融合模块代替普通的跳跃连接:通道交叉融合模块由通道交叉Transformer模型CCT和通道交叉注意模块CCA组成,通道交叉Transformer用于编码部分特征转换,先将编码部分的各级特征变形为序列进行标记化,再将各层的标记Ti进行级联,得到键和值T=Concat(T1,T2,T3,T4),三个标记Ti作为查询和一个级联的Token作为键和值,分别得到:
Figure BDA0003672262550000054
K=TWK
V=TWV
其中,
Figure BDA0003672262550000053
WK、WV是不同输入的权重,i=1,2,3,4;
通过交叉注意力机制对V进行加权:
Figure BDA0003672262550000051
其中,φ(·)表示正则化操作,σ(·)表示softmax函数,Mi为相似矩阵;
得到多头交叉注意后的输出MCAi
Figure BDA0003672262550000052
其中,N为头数;
通过MLP和残差操作后,得到如下输出:
Oi=MCAi+MLP(Qi+MCAi)
第L层的四个输出O1、O2、O3和O4通过上采样和卷积操作进行重建,并与解码部分特征串联;
通道交叉注意模块融合多尺度特征和解码阶段的特征,以解决语义层不一致的问题,将第i级Transformer层输出Oi∈RC×H×W和第i级解码特征Di∈RC×H×W作为该模块的输入,并通过全局平均池化进行空间压缩,得到G(X),并通过该操作嵌入全局空间信息并产生注意力标签:
Mi=L1·G(Oi)+L2·G(Di)
其中,L1和L2是两个线性层的权重和Relu算子的权重;
使用一个单一的线性层和sigmoid激活函数来建立通道注意图,结果向量最终表示为:
Figure BDA0003672262550000061
其中,σ(Mi)表示每个通道重要性;
最终,将
Figure BDA0003672262550000062
和第i层解码器的上采样特征进行拼接融合。
优选的,所述实现分割的解码器包括:
由多个级联的上采样操作组成,通过级联的上采样操作逐渐恢复全分辨率H×W×D,每一次上采样操作由1×1×1的卷积和步长为2的反卷积组成,最后经过1×1×1的卷积和sigmoid函数作为解码器的分割层,以产生分割结果,表示为:
Figure BDA0003672262550000063
其中,φ是解码器参数,
Figure BDA0003672262550000064
为解码器输出,/>
Figure BDA0003672262550000065
是解码器的输入。
优选的,所述进行分类预测的分类器包括:
使用全局平均池化和全局最大池化将捕获的多尺度特征变换到每个通道中的相同尺寸,并加入临床数据通过级联进行融合,然后输入到三个全连接层中,最后由Softmax函数输出基因型的预测概率,概率表示为:
Hj=Concat(GAP(Fj),GMP(Fj))
Figure BDA0003672262550000066
Figure BDA0003672262550000067
其中,
Figure BDA0003672262550000068
表示编码器第j层的特征图;/>
Figure BDA0003672262550000069
和/>
Figure BDA00036722625500000610
Figure BDA00036722625500000611
是融合的特征,/>
Figure BDA00036722625500000612
是类别c中样本i的输出概率。
优选的,所述步骤4包括:
对于胶质瘤分割中前景和背景像素之间的不平衡问题,采用基于dice系数的损失函数作为分割损失,记作Loss1,表达式为:
Figure BDA0003672262550000071
其中,p(i)为分割网络经过Softmax函数的输出;g(i)为相应的真实标签值;K为类别数;∈为防止被0除的小常数;
对于基因型预测中存在的类别不平衡问题,采用Poly-1loss作为损失函数,记作Loss2,表达式为:
Figure BDA0003672262550000072
Figure BDA0003672262550000073
Figure BDA0003672262550000074
Figure BDA0003672262550000075
Loss2=LPoly-1=LCE+∈1(1-Pt)=-log(pt)+∈1(1-Pt)
Figure BDA0003672262550000076
Figure BDA0003672262550000077
其中,pt为模型对目标类的预测概率,∈1在本研究中设置为2;
综上,多任务损失函数为:
Losstotal=a·Loss1+b·Loss2
其中,a、b为Loss1和Loss2之间的任务权重。
优选的,所述步骤5包括:
对粒子群各参数进行初始化,所述参数包括粒子群的种群规模s、最大迭代次数T、搜索空间维度D、搜索范围最大值Pmax、搜索范围最小值Pmin,粒子群中每个粒子的最大速度Vmax、最小速度Vmin、位置x、自我学习因子c1、社会学习因子c2
其中,对粒子群中的每个粒子的速度和位置初始化按下式进行随机赋值,rand()为区间[0,1]之间的随机数;
v=rand()
x=200·rand()-100
将初始化后的每个粒子的位置初始值代入适应度函数,得到每个粒子的适应度;
粒子群在初始化后,每个粒子得到一个初始位置,把位置的初始值映射为多任务损失函数中的任务权重a和b,根据该多任务损失函数对模型进行训练,得到基于下式的适应度:
F=max(-Losstotal)=max(-a·Loss1-b·Loss2)
根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及粒子群的种群最优位置、种群最优适应度;
个体最优适应度为每个粒子在整个迭代过程中得到的适应度最大的值;种群最优适应度为粒子群中所有粒子在整个迭代过程中的个体最优适应度的最大值;个体最优位置为个体最优适应度的粒子所对应的位置;种群最优位置为种群最优适应度的粒子所对应的位置;
基于种群最优适应度和个体最优适应度计算惯性权重;
将种群最优适应度和个体最优适应度代入下式进行计算,得到惯性权重;
Figure BDA0003672262550000081
其中,i表示第i个粒子,t表示迭代次数,w表示惯性权重;wi(t)表示第i个粒子迭代至t次时的惯性权重值;fitness(gbest)(t)表示粒子群迭代至t次时的种群最优适应度;fitness(pbest)i(t)表示第i个粒子迭代至t次时的个体最优适应度;
基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和粒子群的种群最优位置,更新每个粒子的速度和位置;
代入下式,得到粒子更新后的速度:
vij(t+1)=wvij(t)+c1r1[pbestij(t)-xij(t)]+c2r2[gbestj(t)-xij(t)]
得到粒子更新后的位置:
xij(t+1)=xij(t)+vij(t+1)
其中,vij(t)表示第i个粒子迭代到第t次时在第j维空间的速度;vij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的速度;xij(t)表示第i个粒子迭代到第t次时在第j维空间的位置;xij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的位置;pbestij(t)表示第i个粒子迭代到第t次时在第j维空间的个体最优位置;gbestj(t)表示粒子群迭代到第t次时粒子群在第j维空间的种群最优位置;c1为社会学习因子,取值为0.25;c2为自我学习因子,取值为0.25;
计算每个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值,将所述比值与预定阈值进行比较,若所述某个粒子比值小于预定阈值,则判定该粒子搜索成功;
设定预定阈值为1,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值小于1,则判断该粒子搜索成功,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值等于1,则判断该粒子搜索失败;设置粒子搜索成功的表示值为1,粒子搜索失败的表示值为0,基于下式判断每个粒子是否搜索成功;
Figure BDA0003672262550000091
其中,SS(i,t)=1表示第i个粒子搜索成功,SS(i,t)=0表示第i个粒子搜索失败;
Figure BDA0003672262550000092
表示第i个粒子迭代至t次时的个体最优适应度;
计算搜索成功的粒子的位置到所述种群最优位置的欧氏距离,并对所有搜索成功的粒子所对应的欧氏距离取平均值,得到距离阈值;
Figure BDA0003672262550000093
其中,disti表征第i个粒子的位置到种群最优位置的欧氏距离,gbestj表征第j维的种群最优位置,xij表征第i个粒子的第j维的位置,D表征搜索空间维度;
并根据下式计算所有搜索成功的粒子到种群最优位置的欧式距离的平均值:
Figure BDA0003672262550000094
其中,distaverage表示平均值(即距离阈值);m表征搜索成功的粒子的个数;
Figure BDA0003672262550000095
其中,disti表示第i个粒子的位置到种群最优位置的欧氏距离,muti表示判断结果;若muti=1表示该粒子落入距离阈值内,muti=0表示该粒子没有落入距离阈值内;
判断每个粒子的位置到所述种群最优位置的欧氏距离是否小于所述距离阈值,若是,则对距离阈值内的部分粒子进行变异操作;
变异操作如下所示,得到所述部分粒子中每个粒子在变异后的位置:
pop(i)=(popmax-popmin)·rand()+popmin
其中,pop(i)表示第i个粒子在变异后的位置;popmax表示粒子群的搜索范围最大值;popmin表示粒子群的搜索范围最小值;rand()为区间[0,1]内的随机数;
判断当前迭代次数是否小于设定的迭代次数,若否,则执行步骤j;
输出粒子群在当前的种群最优位置,并将所述种群最优位置映射为多任务框架中的任务权重参数a和b;
根据当前得到的a和b构建多任务损失函数,并对网络模型进行训练,训练完毕后,得到每个粒子的适应度,并将适应度代入步骤c中。
优选的,所述步骤6包括:
将数据集中的80%作为训练集,剩余的20%作为测试集,所有的卷积层都采取Xavier初始化,初始学习率设置为0.0001,使用Adam优化器;
利用粒子群优化算法对多任务损失函数中的任务权重参数进行优化,先对粒子群中的各参数进行赋值,对粒子的速度和位置进行随机初始化,把粒子得到的初始值映射为所求参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算初始化后粒子的适应度;
根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及种群最优位置、种群最优适应度,基于种群最优适应度和个体最优适应度得到惯性权重;
基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和种群最优位置,对每个粒子的速度和位置进行更新,并根据设定阈值判断是否搜索成功,搜索成功后判断是否需要进行变异操作,并将当前种群最优位置映射为参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算粒子的适应度;
重复以上操作直到满足迭代次数,找到最优参数a和b确定Losstotal,通过最小化Losstotal函数使得网络模型识别性能达到最高并且保存模型参数;
最后将测试集载入训练好的网络模型进行预测得到分割结果和基因型,并根据专家标注计算各评价指标。
与现有技术相比,本发明具有如下的有益效果:
(1)本发明提出了一种面向胶质瘤分类分割多任务一体化网络的改进粒子群参数优化方法,用于同时实现脑胶质瘤分割和基因型预测,具有最新的性能;
(2)本发明使用基于dice系数的损失函数和Poly loss,并使用改进的粒子群优化算法可以根据粒子适应度来调节惯性权重,实现惯性权重的自适应调整;
(3)同时利用搜索成功的粒子计算出的阈值作为变异的条件,能更好地控制粒子变异时机,从而跳出局部最优解的能力得到提升,有利于找到平衡两个任务损失的最优权重,有助于解决胶质瘤分割时肿瘤区域像素占比小、基因型预测时基因类别数量不平衡的问题;
(4)通过粒子在搜索空间中不断更新自身位置并互相交换信息,直至搜索到全局最优值,避免了手动设置参数的不确定性。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的面向胶质瘤分类分割多任务一体化网络的改进粒子群参数优化方法的流程图;
图2为本发明中使用的多任务学习框架图;
图3为通道交叉融合模块示意图,图3a为CCT模块,图3b为CCA模块。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例:
如图1所示,本实施例的面向胶质瘤分类分割多任务一体化网络的改进粒子群参数优化方法,包括以下步骤:
1)构建脑胶质瘤患者数据集
所需的脑胶质瘤数据集包含多个病例,每个病例的数据包括多模态MRI影像数据、经活检验证的基因信息,且各病例数据所含有的数据项及数据格式需保持一致。每一例样本均提供了分割的标签,该标签是由专家手工标记出来的。分割的标签类别包括以下3类:坏死区,水肿区,增强区。对多模态MRI数据进行预处理,得到统一标准的脑胶质瘤多模态MRI数据Idata
所述的基因信息包括但不限于:IDH突变状态、1p/19q缺少状态、MGMT启动子甲基化状态等信息。
所述临床信息包括但不限于:年龄、性别、肿瘤级别、肿瘤位置。
2)数据预处理
首先对原始数据进行数据增强操作,对原始图像进行裁剪、翻转、旋转操作生成新的图像并添加到数据集中,其次对图像进行标准化处理以增强图像目标区域的特征。其中80%的数据用于模型训练,20%的数据用于参数调整。
3)多任务学习框架的构建
如图2,通过共享从编码器中提取的空间和全局特征表示,可以同时实现胶质瘤分割和基因型预测任务。该多任务学习框架由三部分组成:用于特征提取的编码器、实现分割的解码器、进行分类预测的分类器。
编码器采用一系列卷积和Transformer操作从输入中提取全局语义特征。输入先进行3×3×3的初始卷积操作,以产生具有16个通道的特征图。接着通过3次下采样操作来捕获空间和深度特征表示,下采样操作通过步长为2的3×3×3的卷积来实现,每一次下采样操作后,输出的通道数量翻一倍,大小变为原来的一半。编码后的低分辨特征表示为
Figure BDA0003672262550000121
低分辨特征经过线性投影、位置编码的操作送入四个Transformer层中。
并且,采用通道交叉融合模块代替普通U-net中的跳跃连接,通道交叉融合模块由通道交叉Transformer(CCT)和通道交叉注意模块(CCA)组成。CCT用于将编码部分的多尺度特征进行转换,CCA将多尺度特征和解码阶段的特征进行融合,以解决语义层不一致的问题,如图3a和图3b所示。
解码器由多个级联的上采样操作组成。对拼接后的特征进行上采样操作逐渐恢复全分辨率H×W×D,每一次上采样操作由1×1×1的卷积和步长为2的反卷积组成,最后,经过1×1×1的卷积和sigmoid函数作为解码器的分割层,以产生分割结果。
对编码部分的最后两级特征分别使用全局平均池化和全局最大池化,以将捕获的多尺度特征变换到每个通道中的相同尺寸,并加入临床数据通过级联进行特征融合,然后输入到三个全连接层中,最后由Softmax函数输出基因型的预测概率。
4)多任务损失函数构建
多任务损失函数由两部分构成,对于脑胶质瘤的分割,前景和背景的不平衡可能会导致分割偏差。为此,基于Dice系数的损失函数被用作分割损失,记作Loss1。对于基因型的预测,由于不同基因型的数量差异较大且样本数量有限,因此,Poly loss被用作分类损失,记作Loss2
综上,多任务损失函数为:Losstotal=a·Loss1+b·Loss2
其中,a、b为Loss1和Loss2之间的任务权重。
5)构造优化问题,通过改进的粒子群优化算法进行迭代训练,直到满足迭代终止条件,得到损失函数中两个任务的最佳权重。
a)对粒子群各参数进行初始化,所述参数包括粒子群的种群规模s、最大迭代次数T、搜索空间维度D、搜索范围最大值Pmax、搜索范围最小值Pmin,粒子群中每个粒子的最大速度Vmax、最小速度Vmin、位置x、自我学习因子c1、社会学习因子c2
其中,对粒子群中的每个粒子的速度和位置初始化按下式进行随机赋值,rand()为区间[0,1]之间的随机数。
v=rand()
x=200·rand()-100
b)粒子群在初始化后,每个粒子得到一个初始位置,把位置的初始值映射为多任务损失函数中的任务权重a和b,根据该多任务损失函数对模型进行训练,得到基于下式的适应度。
F=max(-Losstotal)=max(-a·Loss1-b·Loss2)
c)根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及粒子群的种群最优位置、种群最优适应度。
个体最优适应度为每个粒子在整个迭代过程中得到的适应度最大的值;
种群最优适应度为粒子群中所有粒子在整个迭代过程中的个体最优适应度的最大值;
个体最优位置为个体最优适应度的粒子所对应的位置;
种群最优位置为种群最优适应度的粒子所对应的位置。
d)基于种群最优适应度和个体最优适应度计算惯性权重。
将种群最优适应度和个体最优适应度代入下式进行计算,得到惯性权重;
Figure BDA0003672262550000131
其中,i表示第i个粒子,t表示迭代次数,w表示惯性权重;wi(t)表示第i个粒子迭代至t次时的惯性权重值;fitness(gbest)(t)表示粒子群迭代至t次时的种群最优适应度;fitness(pbest)i(t)表示第i个粒子迭代至t次时的个体最优适应度;
e)基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和粒子群的种群最优位置,更新每个粒子的速度和位置。
代入下式,得到粒子更新后的速度:
vij(t+1)=wvij(t)+c1r1[pbestij(t)-xij(t)]+c2r2[gbestj(t)-xij(t)]
得到粒子更新后的位置:
xij(t+1)=xij(t)+vij(t+1)
其中,vij(t)表示第i个粒子迭代到第t次时在第j维空间的速度;vij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的速度;xij(t)表示第i个粒子迭代到第t次时在第j维空间的位置;xij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的位置;pbestij(t)表示第i个粒子迭代到第t次时在第j维空间的个体最优位置;gbestj(t)表示粒子群迭代到第t次时粒子群在第j维空间的种群最优位置;c1为社会学习因子,取值为0.25;c2为自我学习因子,取值为0.25。
f)计算每个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值,将所述比值与预定阈值进行比较,若所述某个粒子比值小于预定阈值,则判定该粒子搜索成功;
设定预定阈值为1,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值小于1,则判断该粒子搜索成功,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值等于1,则判断该粒子搜索失败。进一步,可以设置粒子搜索成功的表示值为1,粒子搜索失败的表示值为0,基于下式可判断每个粒子是否搜索成功。
Figure BDA0003672262550000141
其中,SS(i,t)=1表示第i个粒子搜索成功,SS(i,t)=0表示第i个粒子搜索失败。
Figure BDA0003672262550000142
表示第i个粒子迭代至t次时的个体最优适应度。
g)计算搜索成功的粒子的位置到所述种群最优位置的欧氏距离,并对所有搜索成功的粒子所对应的欧氏距离取平均值,得到距离阈值;
Figure BDA0003672262550000143
其中,disti表示第i个粒子的位置到种群最优位置的欧氏距离,gbestj表示第j维的种群最优位置,xij表示第i个粒子的第j维的位置,D表示搜索空间维度。
并根据下式计算所有搜索成功的粒子到种群最优位置的欧式距离的平均值:
Figure BDA0003672262550000144
其中,distaverage表示平均值(即距离阈值);m表示搜索成功的粒子的个数。
Figure BDA0003672262550000151
其中,disti表示第i个粒子的位置到种群最优位置的欧氏距离,muti表示判断结果。若muti=1表示该粒子落入距离阈值内,muti=0表示该粒子没有落入距离阈值内。
h)判断每个粒子的位置到所述种群最优位置的欧氏距离是否小于所述距离阈值,若是,则对距离阈值内的部分粒子进行变异操作;
变异操作如下所示,得到所述部分粒子中每个粒子在变异后的位置:
pop(i)=(popmax-popmin)·rand()+popmin
其中,pop(i)表示第i个粒子在变异后的位置;popmax表示粒子群的搜索范围最大值;popmin表示粒子群的搜索范围最小值;rand()为区间[0,1]内的随机数。
i)判断当前迭代次数是否小于设定的迭代次数,若否,则执行步骤j;
j)输出粒子群在当前的种群最优位置,并将所述种群最优位置映射为多任务框架中的任务权重参数a和b;
k)根据当前得到的a和b构建多任务损失函数,并对网络模型进行训练,训练完毕后,得到每个粒子的适应度,并将适应度代入步骤c中。
6)训练网络模型并测试
将数据集中的80%作为训练集,剩余的20%作为测试集,所有的卷积层都采取Xavier初始化,初始学习率设置为0.0001,使用Adam优化器。利用粒子群优化算法对多任务损失函数中的任务权重参数进行优化。先对粒子群中的各参数进行赋值,对粒子的速度和位置进行随机初始化,把粒子得到的初始值映射为所求参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算初始化后粒子的适应度。根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及种群最优位置、种群最优适应度。基于种群最优适应度和个体最优适应度得到惯性权重,之后,基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和种群最优位置,对每个粒子的速度和位置进行更新,并根据设定阈值判断是否搜索成功,搜索成功后判断是否需要进行变异操作,并将当前种群最优位置映射为参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算粒子的适应度,重复以上操作直到满足迭代次数,找到最优参数a和b确定Losstotal,通过最小化Losstotal函数使得网络模型识别性能达到最高并且保存模型参数。将测试集载入训练好的网络模型进行预测得到分割结果和基因型,并根据专家标注计算各评价指标。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (8)

1.一种面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,包括:
步骤1:构建脑胶质瘤患者数据集:
步骤2:进行数据预处理,首先对原始数据进行数据增强操作,对原始图像进行裁剪、翻转、旋转操作生成新的图像并添加到数据集中,其次对图像进行标准化处理以增强图像目标区域的特征;
步骤3:构建多任务学习框架,包括用于特征提取的编码器、实现分割的解码器、进行分类预测的分类器;
步骤4:构建多任务损失函数,基于Dice系数的损失函数被用作分割损失,对于基因型的预测,Poly loss被用作分类损失;
步骤5:通过改进的粒子群优化算法对多任务学习框架进行优化训练,得到损失函数中两个任务的最佳权重;
步骤6:在网络中载入训练集,确定网络模型的参数,得到训练好的网络模型并保存,载入训练好的网络模型,输入测试集进行预测,得到结果并根据标签计算各评价指标值;
所述步骤2包括:
将所有原始图像在-10到10度范围内进行随机旋转,以0.5的概率在轴向、冠状和矢状面上随机翻转,图像随机裁剪到128×128×128的体素大小来扩充数据集Idata,标签Lmask也进行相同的数据增强操作;
对所有图像进行标准化处理,公式如下:
Figure FDA0004233232970000011
其中,μ为图像的均值,x表示图像矩阵,σ和N分别表示图像的标准差和图像体素数量;
所述步骤5包括:
对粒子群各参数进行初始化,所述参数包括粒子群的种群规模s、最大迭代次数T、搜索空间维度D、搜索范围最大值Pmax、搜索范围最小值Pmin,粒子群中每个粒子的最大速度Vmax、最小速度Vmin、位置x、自我学习因子c1、社会学习因子c2
其中,对粒子群中的每个粒子的速度和位置初始化按下式进行随机赋值,rand()为区间[0,1]之间的随机数;
v=rand()
x=200·rand()-100
将初始化后的每个粒子的位置初始值代入适应度函数,得到每个粒子的适应度;
粒子群在初始化后,每个粒子得到一个初始位置,把位置的初始值映射为多任务损失函数中的任务权重a和b,根据该多任务损失函数对模型进行训练,得到基于下式的适应度:
F=max(-Losstotal)=max(-a·Loss1-b·Loss2)
根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及粒子群的种群最优位置、种群最优适应度;
个体最优适应度为每个粒子在整个迭代过程中得到的适应度最大的值;种群最优适应度为粒子群中所有粒子在整个迭代过程中的个体最优适应度的最大值;个体最优位置为个体最优适应度的粒子所对应的位置;种群最优位置为种群最优适应度的粒子所对应的位置;
基于种群最优适应度和个体最优适应度计算惯性权重;
将种群最优适应度和个体最优适应度代入下式进行计算,得到惯性权重;
Figure FDA0004233232970000021
其中,i表示第i个粒子,t表示迭代次数,w表示惯性权重;wi(t)表示第i个粒子迭代至t次时的惯性权重值;fitness(gbest)(t)表示粒子群迭代至t次时的种群最优适应度;fitness(pbest)i(t)表示第i个粒子迭代至t次时的个体最优适应度;
基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和粒子群的种群最优位置,更新每个粒子的速度和位置;
代入下式,得到粒子更新后的速度:
vij(t+1)=wvij(t)+c1 r1[pbestij(t)-xij(t)]+c2r2[gbestj(t)-xij(t)]
得到粒子更新后的位置:
xij(t+1)=xij(t)+vij(t+1)
其中,vij(t)表示第i个粒子迭代到第t次时在第j维空间的速度;vij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的速度;xij(t)表示第i个粒子迭代到第t次时在第j维空间的位置;xij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的位置;pbestij(t)表示第i个粒子迭代到第t次时在第j维空间的个体最优位置;gbestj(t)表示粒子群迭代到第t次时粒子群在第j维空间的种群最优位置;c1为社会学习因子,取值为0.25;c2为自我学习因子,取值为0.25;
计算每个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值,将所述比值与预定阈值进行比较,若某个粒子比值小于预定阈值,则判定该粒子搜索成功;
设定预定阈值为1,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值小于1,则判断该粒子搜索成功,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值等于1,则判断该粒子搜索失败;设置粒子搜索成功的表示值为1,粒子搜索失败的表示值为0,基于下式判断每个粒子是否搜索成功;
Figure FDA0004233232970000031
其中,SS(i,t)=1表示第i个粒子搜索成功,SS(i,t)=0表示第i个粒子搜索失败;
Figure FDA0004233232970000032
表示第i个粒子迭代至t次时的个体最优适应度;
计算搜索成功的粒子的位置到所述种群最优位置的欧氏距离,并对所有搜索成功的粒子所对应的欧氏距离取平均值,得到距离阈值;
Figure FDA0004233232970000033
其中,disti表征第i个粒子的位置到种群最优位置的欧氏距离,gbestj表征第j维的种群最优位置,xij表征第i个粒子的第j维的位置,D表征搜索空间维度;
并根据下式计算所有搜索成功的粒子到种群最优位置的欧式距离的平均值:
Figure FDA0004233232970000034
其中,distaverage表示平均值(即距离阈值);m表征搜索成功的粒子的个数;
Figure FDA0004233232970000035
其中,disti表示第i个粒子的位置到种群最优位置的欧氏距离,muti表示判断结果;若muti=1表示该粒子落入距离阈值内,muti=0表示该粒子没有落入距离阈值内;
判断每个粒子的位置到所述种群最优位置的欧氏距离是否小于所述距离阈值,若是,则对距离阈值内的部分粒子进行变异操作;
变异操作如下所示,得到所述部分粒子中每个粒子在变异后的位置:
pop(i)=(popmax-popmin)·rand()+popmin
其中,pop(i)表示第i个粒子在变异后的位置;popmax表示粒子群的搜索范围最大值;popmin表示粒子群的搜索范围最小值;rand()为区间[0,1]内的随机数;
判断当前迭代次数是否小于设定的迭代次数,若否,则执行步骤j;
输出粒子群在当前的种群最优位置,并将所述种群最优位置映射为多任务框架中的任务权重参数a和b;
根据当前得到的a和b构建多任务损失函数,并对网络模型进行训练,训练完毕后,得到每个粒子的适应度,并将适应度代入每个粒子的适应度公式中。
2.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述步骤1包括:
MRI图像预处理包括颅骨去除、配准到统一空间、重采样到1mm3的分辨率,获得分辨率统一、灰度分布相同的多模态MRI数据,预处理后的所有数据大小为240×240×240。
3.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述步骤3包括:
给定MRI扫描输入X∈RC×H×W×D,空间分辨率为H×W,深度维度为D,通道数为C,利用3DCNN生成捕捉空间和深度信息的特征图,然后利用Transformer编码器对全局空间中的长距离依赖性进行建模;
在实现胶质瘤分割任务的分支中,为减少编码特征和解码特征间的语义差异,用通道交叉Transformer模型CCT和通道交叉注意力模块CCA来代替普通U-net网络中的跳跃连接,编码部分的多尺度特征通过CCT模块进行交叉融合,对于编码部分的4层输出Ei,首先对特征进行token化,将特征变形为块大小的序列,使得这些块在4种尺度下映射到编码特征的相同区域,然后将token输入到多头交叉注意力模块和具有残差结构的多层感知机MLP中,以编码通道关系和依赖;
将第i级Transformer的输出Oi和第i级解码特征Di作为CCA模块的输入,并通过全局平均池化操作进行空间压缩,之后对通道依赖进行编码,嵌入全局空间信息到通道注意力图中,最终根据每个通道的重要性重新激活Oi得到
Figure FDA0004233232970000041
再将/>
Figure FDA0004233232970000042
与第i级解码器的上采样特征进行拼接融合,之后通过反卷积操作逐步恢复图像的分辨率,产生高分辨率的分割结果;
在实现基因预测任务的分支中,使用全局平均池化和全局最大池化将编码部分获取的最后两级特征变换到每个通道中的相同尺寸,并加入临床数据通过级联进行融合,然后输入到三个全连接层中,最后由Softmax函数输出基因型的预测概率,实现基因型预测。
4.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述用于特征提取的编码器包括:
采用一系列卷积和Transformer操作从输入中提取全局语义特征,输入先进行3×3×3的初始卷积操作,产生具有16个通道的特征图,接着通过3次下采样操作来捕获空间和深度特征表示,下采样操作通过步长为2的3×3×3的卷积来实现,每一次下采样操作后,输出的通道数量翻一倍,大小变为原来的一半,编码后的低分辨特征表示为
Figure FDA0004233232970000051
Figure FDA0004233232970000052
为确保每个体素的全面表示,使用线性投影将通道维度从128增加到512,并把空间维度和深度维度扩展成一维,得到
Figure FDA0004233232970000053
大小的特征图f;为了对位置信息进行编码,引入可学习的位置嵌入,并通过与特征图f融合,得到如下的特征嵌入:
z0=f+PE=W×F+PE
其中,W为线性投影操作,PE∈Rd×N为位置嵌入,z0∈Rd×N为特征嵌入,之后z0被送到L层堆叠的Transformer中;
每一层Transformer层由一个多头注意力MHA和一个前馈网络FFN组成,对于第l层,自注意力的输入是根据zl-1计算的三元组(Q,K,V):
Q=zl-1WQ,K=zl-1WK,V=zl-1WV
其中,WQ,WK,WV∈Rd×d是三个线性投影层的可学习参数,d是(Q,K,V)的维数;
自注意力计算如下:
Figure FDA0004233232970000054
MHA是Transformer层重要的组成部分,允许模型同时关注来自不同位置的不同子空间的表示信息,通过将Transformer层的输入分成n个独立部分,并行处理每个部分,然后使用线性投影对级联结果进行投影,MHA操作表示如下:
MHA(zl-1)=Concat(SA1(zl-1),...,SAn(zl-1))WO
其中,WO是线性投影层的可学习参数,Concat()是连接操作;
然后,MHA的输出送入FFN模块得到第l个Transformer层的输出,第l个Transformer层的输出计算为:
z′l=MHA(LN(zl-1))+zl-1
zl=FFN(LN(z′l))+z′l
LN(*)表示层归一化操作,zl表示第l层的输出,l∈[1,2,...,L];
通道交叉融合模块代替普通的跳跃连接:通道交叉融合模块由通道交叉Transformer模型CCT和通道交叉注意模块CCA组成,通道交叉Transformer用于编码部分特征转换,先将编码部分的各级特征变形为序列进行标记化,再将各层的标记Ti进行级联,得到键和值T=Concat(T1,T2,T3,T4),三个标记Ti作为查询和一个级联的Token作为键和值,分别得到:
Figure FDA0004233232970000063
K=TWK
V=TWV
其中,WQi、WK、WV是不同输入的权重,i=1,2,3,4;
通过交叉注意力机制对V进行加权:
Figure FDA0004233232970000061
其中,φ(·)表示正则化操作,σ(·)表示softmax函数,Mi为相似矩阵;
得到多头交叉注意后的输出MCAi
Figure FDA0004233232970000062
其中,N为头数;
通过MLP和残差操作后,得到如下输出:
Oi=MCAi+MLP(Qi+MCAi)
第L层的四个输出O1、O2、O3和O4通过上采样和卷积操作进行重建,并与解码部分特征串联;
通道交叉注意模块融合多尺度特征和解码阶段的特征,以解决语义层不一致的问题,将第i级Transformer层输出Oi∈RC×H×W和第i级解码特征Di∈RC×H×W作为该模块的输入,并通过全局平均池化进行空间压缩,得到G(X),并通过该操作嵌入全局空间信息并产生注意力标签:
Mi=L1·G(Oi)+L2·G(Di)
其中,L1和L2是两个线性层的权重和Relu算子的权重;
使用一个单一的线性层和sigmoid激活函数来建立通道注意图,结果向量最终表示为:
Figure FDA0004233232970000071
其中,σ(Mi)表示每个通道重要性;
最终,将
Figure FDA0004233232970000072
和第i层解码器的上采样特征进行拼接融合。
5.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述实现分割的解码器包括:
由多个级联的上采样操作组成,通过级联的上采样操作逐渐恢复全分辨率H×W×D,每一次上采样操作由1×1×1的卷积和步长为2的反卷积组成,最后经过1×1×1的卷积和sigmoid函数作为解码器的分割层,以产生分割结果,表示为:
Figure FDA0004233232970000073
其中,φ是解码器参数,
Figure FDA0004233232970000074
为解码器输出,/>
Figure FDA0004233232970000075
是解码器的输入。
6.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述进行分类预测的分类器包括:
使用全局平均池化和全局最大池化将捕获的多尺度特征变换到每个通道中的相同尺寸,并加入临床数据通过级联进行融合,然后输入到三个全连接层中,最后由Softmax函数输出基因型的预测概率,概率表示为:
Hj=Concat(GAP(Fj),GMP(Fj))
Figure FDA0004233232970000076
Figure FDA0004233232970000077
其中,
Figure FDA0004233232970000078
表示编码器第j层的特征图;/>
Figure FDA0004233232970000079
和/>
Figure FDA00042332329700000710
Figure FDA00042332329700000711
是融合的特征,/>
Figure FDA00042332329700000712
是类别c中样本i的输出概率。
7.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述步骤4包括:
对于胶质瘤分割中前景和背景像素之间的不平衡问题,采用基于dice系数的损失函数作为分割损失,记作Loss1,表达式为:
Figure FDA0004233232970000081
其中,p(i)为分割网络经过Softmax函数的输出;g(i)为相应的真实标签值;K为类别数;∈为防止被0除的小常数;
对于基因型预测中存在的类别不平衡问题,采用Poly-1loss作为损失函数,记作Loss2,表达式为:
Figure FDA0004233232970000082
Figure FDA0004233232970000083
Figure FDA0004233232970000084
Figure FDA0004233232970000085
Loss2=LPoly-1=LCE+∈1(1-Pt)=-log(pt)+∈1(1-Pt)
Figure FDA0004233232970000086
Figure FDA0004233232970000087
其中,pt为模型对目标类的预测概率,∈1在本研究中设置为2;
综上,多任务损失函数为:
Losstotal=a·Loss1+b·Loss2
其中,a、b为Loss1和Loss2之间的任务权重。
8.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述步骤6包括:
将数据集中的80%作为训练集,剩余的20%作为测试集,所有的卷积层都采取Xavier初始化,初始学习率设置为0.0001,使用Adam优化器;
利用粒子群优化算法对多任务损失函数中的任务权重参数进行优化,先对粒子群中的各参数进行赋值,对粒子的速度和位置进行随机初始化,把粒子得到的初始值映射为所求参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算初始化后粒子的适应度;
根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及种群最优位置、种群最优适应度,基于种群最优适应度和个体最优适应度得到惯性权重;
基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和种群最优位置,对每个粒子的速度和位置进行更新,并根据设定阈值判断是否搜索成功,搜索成功后判断是否需要进行变异操作,并将当前种群最优位置映射为参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算粒子的适应度;
重复以上操作直到满足迭代次数,找到最优参数a和b确定Losstotal,通过最小化Losstotal函数使得网络模型识别性能达到最高并且保存模型参数;
最后将测试集载入训练好的网络模型进行预测得到分割结果和基因型,并根据专家标注计算各评价指标。
CN202210611738.6A 2022-05-31 2022-05-31 面向胶质瘤多任务一体化网络的改进粒子群参数优化方法 Active CN115222007B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210611738.6A CN115222007B (zh) 2022-05-31 2022-05-31 面向胶质瘤多任务一体化网络的改进粒子群参数优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210611738.6A CN115222007B (zh) 2022-05-31 2022-05-31 面向胶质瘤多任务一体化网络的改进粒子群参数优化方法

Publications (2)

Publication Number Publication Date
CN115222007A CN115222007A (zh) 2022-10-21
CN115222007B true CN115222007B (zh) 2023-06-20

Family

ID=83608210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210611738.6A Active CN115222007B (zh) 2022-05-31 2022-05-31 面向胶质瘤多任务一体化网络的改进粒子群参数优化方法

Country Status (1)

Country Link
CN (1) CN115222007B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115497616B (zh) * 2022-10-25 2023-05-23 杭州杏林信息科技有限公司 一种感染性疾病辅助决策的方法、系统、设备及存储介质
CN116630296B (zh) * 2023-06-11 2024-01-23 中国海洋大学 基于轻量化网络的水下船体像素级缺陷检测方法及系统
CN116864124A (zh) * 2023-07-06 2023-10-10 深圳市绿航星际太空科技研究院 一种基于大数据的营养健康预测系统
CN116965817B (zh) * 2023-07-28 2024-03-15 长江大学 一种基于一维卷积网络和Transformer的EEG情感识别方法
CN117421691B (zh) * 2023-12-18 2024-03-15 青岛奥克生物开发有限公司 基于人工智能的细胞培养监测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682682A (zh) * 2016-10-20 2017-05-17 北京工业大学 一种基于粒子群优化算法对支持向量机的优化方法
CN108038507A (zh) * 2017-12-13 2018-05-15 太原理工大学 基于粒子群优化的局部感受野极限学习机图像分类方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220237785A1 (en) * 2019-05-23 2022-07-28 H. Lee Moffitt Cancer Center And Research Institute, Inc. System and method of evaluating neural networks to segment medical images
CN110443364A (zh) * 2019-06-21 2019-11-12 深圳大学 一种深度神经网络多任务超参数优化方法及装置
CN111047589B (zh) * 2019-12-30 2022-07-26 北京航空航天大学 一种注意力增强的脑肿瘤辅助智能检测识别方法
CN111563549B (zh) * 2020-04-30 2023-07-28 广东工业大学 基于多任务进化算法的医学图像聚类方法
CN113627606A (zh) * 2020-05-06 2021-11-09 江苏科技大学 一种基于改进粒子群算法的rbf神经网络优化方法
CN112734755A (zh) * 2021-03-15 2021-04-30 四川大学 基于3d全卷积神经网络与多任务学习的肺叶分割方法
CN113391894A (zh) * 2021-06-10 2021-09-14 华南理工大学 一种基于rbp神经网络的最优超任务网优化方法
CN113706486A (zh) * 2021-08-17 2021-11-26 西安电子科技大学 基于密集连接网络迁移学习的胰腺肿瘤图像分割方法
CN114334007A (zh) * 2022-01-20 2022-04-12 腾讯科技(深圳)有限公司 基因脱靶预测模型训练方法、预测方法、装置及电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682682A (zh) * 2016-10-20 2017-05-17 北京工业大学 一种基于粒子群优化算法对支持向量机的优化方法
CN108038507A (zh) * 2017-12-13 2018-05-15 太原理工大学 基于粒子群优化的局部感受野极限学习机图像分类方法

Also Published As

Publication number Publication date
CN115222007A (zh) 2022-10-21

Similar Documents

Publication Publication Date Title
CN115222007B (zh) 面向胶质瘤多任务一体化网络的改进粒子群参数优化方法
EP3864577B1 (en) Systems and methods for image preprocessing
US20240144092A1 (en) Generative machine learning systems for drug design
Cheng et al. A fully automated multimodal MRI-based multi-task learning for glioma segmentation and IDH genotyping
CN110826638B (zh) 基于重复注意力网络的零样本图像分类模型及其方法
JP2022551683A (ja) 人工知能(ai)モデルを使用した非侵襲的遺伝子検査を行う方法及びシステム
Mondal et al. Deep learning approach for automatic classification of x-ray images using convolutional neural network
CN114998220B (zh) 一种基于改进的Tiny-YOLO v4自然环境下舌像检测定位方法
Xiang et al. Towards interpretable skin lesion classification with deep learning models
CN111340135B (zh) 基于随机投影的肾小肿块分类方法
CN112949740A (zh) 一种基于多级度量的小样本图像分类方法
CN114596467A (zh) 基于证据深度学习的多模态影像分类方法
Nasab et al. Deep learning in spatially resolved transcriptomics: A comprehensive technical view
Zhao et al. Deeply supervised active learning for finger bones segmentation
Bhardwaj et al. Computational biology in the lens of CNN
Tian et al. Radiomics and its clinical application: artificial intelligence and medical big data
Ma et al. LCAUnet: A skin lesion segmentation network with enhanced edge and body fusion
Xu et al. Correlation via synthesis: end-to-end nodule image generation and radiogenomic map learning based on generative adversarial network
CN111259176A (zh) 融合有监督信息的基于矩阵分解的跨模态哈希检索方法
CN116433679A (zh) 一种基于空间位置结构先验的内耳迷路多级标注伪标签生成与分割方法
Molder et al. Learning Medical Materials from Radiography Images
CN107798680B (zh) 一种减少图像标签融合冗余计算的方法
Chandra et al. A Novel Framework For Brain Disease Classification Using Quantum Convolutional Neural Network
Karpagam et al. Automated diagnosis system for Alzheimer disease using features selected by artificial bee colony
Dobshik et al. Weakly supervised semantic segmentation of tomographic images in the diagnosis of stroke

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant