CN115222007B - 面向胶质瘤多任务一体化网络的改进粒子群参数优化方法 - Google Patents
面向胶质瘤多任务一体化网络的改进粒子群参数优化方法 Download PDFInfo
- Publication number
- CN115222007B CN115222007B CN202210611738.6A CN202210611738A CN115222007B CN 115222007 B CN115222007 B CN 115222007B CN 202210611738 A CN202210611738 A CN 202210611738A CN 115222007 B CN115222007 B CN 115222007B
- Authority
- CN
- China
- Prior art keywords
- particle
- fitness
- population
- loss
- optimal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000002245 particle Substances 0.000 title claims abstract description 263
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000005457 optimization Methods 0.000 title claims abstract description 28
- 239000000084 colloidal system Substances 0.000 title claims abstract description 14
- 210000004767 rumen Anatomy 0.000 title claims abstract description 7
- 230000006870 function Effects 0.000 claims abstract description 59
- 206010018338 Glioma Diseases 0.000 claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 24
- 208000032612 Glial tumor Diseases 0.000 claims abstract description 21
- 230000013016 learning Effects 0.000 claims abstract description 20
- 238000012360 testing method Methods 0.000 claims abstract description 10
- 238000011156 evaluation Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 230000011218 segmentation Effects 0.000 claims description 37
- 230000035772 mutation Effects 0.000 claims description 18
- 238000011176 pooling Methods 0.000 claims description 14
- 238000002595 magnetic resonance imaging Methods 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 12
- 230000009326 social learning Effects 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- 108090000623 proteins and genes Proteins 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 7
- 238000012804 iterative process Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 4
- 239000012633 leachable Substances 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- YTAHJIFKAKIKAV-XNMGPUDCSA-N [(1R)-3-morpholin-4-yl-1-phenylpropyl] N-[(3S)-2-oxo-5-phenyl-1,3-dihydro-1,4-benzodiazepin-3-yl]carbamate Chemical compound O=C1[C@H](N=C(C2=C(N1)C=CC=C2)C1=CC=CC=C1)NC(O[C@H](CCN1CCOCC1)C1=CC=CC=C1)=O YTAHJIFKAKIKAV-XNMGPUDCSA-N 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000012952 Resampling Methods 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims description 2
- 238000007906 compression Methods 0.000 claims description 2
- 230000006835 compression Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 210000003625 skull Anatomy 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 230000010354 integration Effects 0.000 claims 1
- 206010028980 Neoplasm Diseases 0.000 description 9
- 208000003174 Brain Neoplasms Diseases 0.000 description 4
- 102000012011 Isocitrate Dehydrogenase Human genes 0.000 description 4
- 108010075869 Isocitrate Dehydrogenase Proteins 0.000 description 4
- 208000029824 high grade glioma Diseases 0.000 description 4
- 201000011614 malignant glioma Diseases 0.000 description 4
- 238000001574 biopsy Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 102100025825 Methylated-DNA-protein-cysteine methyltransferase Human genes 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 201000007983 brain glioma Diseases 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004195 computer-aided diagnosis Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 108040008770 methylated-DNA-[protein]-cysteine S-methyltransferase activity proteins Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10088—Magnetic resonance imaging [MRI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30016—Brain
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,包括:步骤1:构建脑胶质瘤患者数据集:步骤2:进行数据预处理;步骤3:构建多任务学习框架;步骤4:构建多任务损失函数;步骤5:通过改进的粒子群优化算法对多任务学习框架进行优化训练,得到损失函数中两个任务的最佳权重;步骤6:在网络中载入训练集,确定网络模型的参数,得到训练好的网络模型并保存,载入训练好的网络模型,输入测试集进行预测,得到结果并根据标签计算各评价指标值。本发明使用改进的粒子群优化算法可以根据粒子适应度来调节惯性权重,实现惯性权重的自适应调整。
Description
技术领域
本发明涉及医学图像处理技术领域,具体地,涉及一种面向胶质瘤多任务一体化网络的改进粒子群参数优化方法。
背景技术
脑胶质瘤是中枢神经系统中最常见的原发性脑肿瘤,在组织学上表现出神经胶质细胞的特征,占主要脑肿瘤疾病的约45%。高级别脑胶质瘤(High Grade Glioma,HGG)是致死率最高的脑胶质瘤,由世界卫生组织定义的III级和IV级脑胶质瘤组成,占所有级别脑胶质瘤的75%左右,严重威胁患者的生命健康。目前,临床治疗不能很有效地治愈高级别脑胶质瘤,同时考虑到高级别脑胶质瘤致死率高和难治疗的特点,若能使用计算机辅助诊断技术帮助医生准确进行早期诊断和预后,将对制定治疗方案、延长患者寿命、提高生活质量等方面有重要临床价值和现实意义。
脑肿瘤图像精准分割可以有效地帮助临床医生进行胶质瘤的早期诊断、治疗方案的制定、和治疗效果的跟踪随访等,同时也是相关研究中不可缺少的图像处理过程。由于脑胶质瘤生长具有浸润性,其病变能侵入到血管周围或神经纤维束间的空隙中,与未病变脑组织之间没有明显得边界。不同肿瘤组织结构的灰度差异大,不同患者肿瘤的大小、形状、位置和肿瘤类型都不尽相同。同一个胶质瘤患者在不同医院、不同类型的磁共振扫描下、不同型号的影像采集序列获得的影像差异非常大,这些现实因素都对脑肿瘤精准自动分割算法造成了较大的挑战。
此外,结合肿瘤形态学和基因分子学特征对患者进行个性化治疗得到越来越多的外科医生和学者的认可。例如,异柠檬酸脱氢酶(IDH)被认为脑胶质瘤分类的基础生物标志物,其突变状态的确认关系到脑胶质瘤的确诊、治疗和治疗效果的判断,在临床方面具有重要意义。通过手术或活检获取到病变组织的样本来确认IDH突变状态可能会产生神经功能缺损的后遗症,给患者的正常生活造成更大的影响。磁共振成像MRI是最常规的分析脑胶质瘤的无创技术,但目前通过MRI鉴别相关基因状态的敏感性和特异性波动极大,即使是神经放射科医生也很难根据这些图像表型准确区分脑胶质瘤基因型。因此研究一种具有较高稳定性和临床应用价值的方法,以通过MRI预测脑胶质瘤的基因状态具有重要意义。
近年来,以深度学习为代表的机器学习在图像识别及分类领域中发挥着重要的作用。U-net网络的提出使人们开始利用计算机强大的计算能力对医学图像进行处理和分析,在医学图像分割方面取得了巨大的成功,但它缺乏对长期依赖关系进行显式建模的能力。Transformer由于具有利用自注意机制进行全局信息建模的能力,逐渐在医学图像处理中得到广泛应用。
专利文献CN108875788A(申请号:CN201810500520.7)公开了一种基于改进的粒子群算法的SVM分类器参数优化方法,包括:(1)对采集的样本数据进行10重交叉验证,选择影响分类器性能的参数作为待优化参数;(2)初始化分类器和粒子群算法的相关参数,根据所述相关参数更新粒子速度和位置;(3)将分类器的待优化参数设置为粒子当前位置的相应维度值,计算得到粒子当前位置对应的适应度值;(4)根据所述粒子当前位置对应的适应度值得到适应度值评估粒子,更新所述个体最优位置和种群最优位置。
虽然基于深度学习的方法在肿瘤分割、基因预测等方面取得了一定进展,但仍存在一些问题:在肿瘤分割时,胶质瘤区域在整个大脑中所占的比例很小,存在像素不平衡;在基因型分类预测时,存在类别不平衡;并且患者基因分子信息的稀缺,通过活检方法进行分子状态识别可能会给患者带来危险。此外,现有的基于自动的方法大多基于单任务方法,没有考虑两个任务之间的相关性。因此,需要一种高效准确的深度学习网络来联合训练两个任务,以实现胶质瘤分割和术前基因分子型准确预测。
利用多任务网络模型联合训练两个任务时,以最小化多任务损失函数为目标对网络进行训练,通过手动设置参数来平衡两个任务的差异具有不确定性,难以得到最优效果。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种面向胶质瘤多任务一体化网络的改进粒子群参数优化方法。
根据本发明提供的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,包括:
步骤1:构建脑胶质瘤患者数据集:
步骤2:进行数据预处理,首先对原始数据进行数据增强操作,对原始图像进行裁剪、翻转、旋转操作生成新的图像并添加到数据集中,其次对图像进行标准化处理以增强图像目标区域的特征;
步骤3:构建多任务学习框架,包括用于特征提取的编码器、实现分割的解码器、进行分类预测的分类器;
步骤4:构建多任务损失函数,基于Dice系数的损失函数被用作分割损失,对于基因型的预测,Poly loss被用作分类损失;
步骤5:通过改进的粒子群优化算法对多任务学习框架进行优化训练,得到损失函数中两个任务的最佳权重;
步骤6:在网络中载入训练集,确定网络模型的参数,得到训练好的网络模型并保存,载入训练好的网络模型,输入测试集进行预测,得到结果并根据标签计算各评价指标值。
优选的,所述步骤1包括:
MRI图像预处理包括颅骨去除、配准到统一空间、重采样到1mm3的分辨率,获得分辨率统一、灰度分布相同的多模态MRI数据,预处理后的所有数据大小为240×240×240。
优选的,所述步骤2包括:
将所有原始图像在-10到10度范围内进行随机旋转,以0.5的概率在轴向、冠状和矢状面上随机翻转,图像随机裁剪到128×128×128的体素大小来扩充数据集Idata,标签Lmask也进行相同的数据增强操作;
对所有图像进行标准化处理,公式如下:
其中,μ为图像的均值,x表示图像矩阵,σ和N分别表示图像的标准差和图像体素数量。
优选的,所述步骤3包括:
给定MRI扫描输入X∈RC×H×W×D,空间分辨率为H×W,深度维度为D,通道数为C,利用3D CNN生成捕捉空间和深度信息的特征图,然后利用Transformer编码器对全局空间中的长距离依赖性进行建模;
在实现胶质瘤分割任务的分支中,为减少编码特征和解码特征间的语义差异,用通道交叉Transformer模型CCT和通道交叉注意力模块CCA来代替普通U-net网络中的跳跃连接,编码部分的多尺度特征通过CCT模块进行交叉融合,对于编码部分的4层输出Ei,首先对特征进行token化,将特征变形为块大小的序列,使得这些块在4种尺度下映射到编码特征的相同区域,然后将token输入到多头交叉注意力模块和具有残差结构的多层感知机MLP中,以编码通道关系和依赖;
将第i级Transformer的输出Oi和第i级解码特征Di作为CCA模块的输入,并通过全局平均池化操作进行空间压缩,之后对通道依赖进行编码,嵌入全局空间信息到通道注意力图中,最终根据每个通道的重要性重新激活Oi得到再将/>与第i级解码器的上采样特征进行拼接融合,之后通过反卷积操作逐步恢复图像的分辨率,产生高分辨率的分割结果;
在实现基因预测任务的分支中,使用全局平均池化和全局最大池化将编码部分获取的最后两级特征变换到每个通道中的相同尺寸,并加入临床数据通过级联进行融合,然后输入到三个全连接层中,最后由Softmax函数输出基因型的预测概率,实现基因型预测。
优选的,所述用于特征提取的编码器包括:
采用一系列卷积和Transformer操作从输入中提取全局语义特征,输入先进行3×3×3的初始卷积操作,产生具有16个通道的特征图,接着通过3次下采样操作来捕获空间和深度特征表示,下采样操作通过步长为2的3×3×3的卷积来实现,每一次下采样操作后,输出的通道数量翻一倍,大小变为原来的一半,编码后的低分辨特征表示为
为确保每个体素的全面表示,使用线性投影将通道维度从128增加到512,并把空间维度和深度维度扩展成一维,得到大小的特征图f;为了对位置信息进行编码,引入可学习的位置嵌入,并通过与特征图f融合,得到如下的特征嵌入:
z0=f+PE=W×F+PE
其中,W为线性投影操作,PE∈Rd×N为位置嵌入,z0∈Rd×N为特征嵌入,之后z0被送到L层堆叠的Transformer中;
每一层Transformer层由一个多头注意力MHA和一个前馈网络FFN组成,对于第l层,自注意力的输入是根据zl-1计算的三元组(Q,K,V):
Q=zl-1WQ,K=zl-1WK,V=zl-1WV
其中,WQ,WK,WV∈Rd×d是三个线性投影层的可学习参数,d是(Q,K,V)的维数;
自注意力计算如下:
MHA是Transformer层重要的组成部分,允许模型同时关注来自不同位置的不同子空间的表示信息,通过将Transformer层的输入分成n个独立部分,并行处理每个部分,然后使用线性投影对级联结果进行投影,MHA操作表示如下:
MHA(zl-1)=Concat(SA1(zl-1),...,SAn(zl-1))WO
其中,WO是线性投影层的可学习参数,Concat()是连接操作;
然后,MHA的输出送入FFN模块得到第l个Transformer层的输出,第l个Transformer层的输出计算为:
z′l=MHA(LN(zl-1))+zl-1
zl=FFN(LN(z′l))+z′l
LN(*)表示层归一化操作,zl表示第l层的输出,l∈[1,2,...,L];
通道交叉融合模块代替普通的跳跃连接:通道交叉融合模块由通道交叉Transformer模型CCT和通道交叉注意模块CCA组成,通道交叉Transformer用于编码部分特征转换,先将编码部分的各级特征变形为序列进行标记化,再将各层的标记Ti进行级联,得到键和值T∑=Concat(T1,T2,T3,T4),三个标记Ti作为查询和一个级联的Token作为键和值,分别得到:
K=T∑WK
V=T∑WV
通过交叉注意力机制对V进行加权:
得到多头交叉注意后的输出MCAi:
其中,N为头数;
通过MLP和残差操作后,得到如下输出:
Oi=MCAi+MLP(Qi+MCAi)
第L层的四个输出O1、O2、O3和O4通过上采样和卷积操作进行重建,并与解码部分特征串联;
通道交叉注意模块融合多尺度特征和解码阶段的特征,以解决语义层不一致的问题,将第i级Transformer层输出Oi∈RC×H×W和第i级解码特征Di∈RC×H×W作为该模块的输入,并通过全局平均池化进行空间压缩,得到G(X),并通过该操作嵌入全局空间信息并产生注意力标签:
Mi=L1·G(Oi)+L2·G(Di)
其中,L1和L2是两个线性层的权重和Relu算子的权重;
使用一个单一的线性层和sigmoid激活函数来建立通道注意图,结果向量最终表示为:
其中,σ(Mi)表示每个通道重要性;
优选的,所述实现分割的解码器包括:
由多个级联的上采样操作组成,通过级联的上采样操作逐渐恢复全分辨率H×W×D,每一次上采样操作由1×1×1的卷积和步长为2的反卷积组成,最后经过1×1×1的卷积和sigmoid函数作为解码器的分割层,以产生分割结果,表示为:
优选的,所述进行分类预测的分类器包括:
使用全局平均池化和全局最大池化将捕获的多尺度特征变换到每个通道中的相同尺寸,并加入临床数据通过级联进行融合,然后输入到三个全连接层中,最后由Softmax函数输出基因型的预测概率,概率表示为:
Hj=Concat(GAP(Fj),GMP(Fj))
优选的,所述步骤4包括:
对于胶质瘤分割中前景和背景像素之间的不平衡问题,采用基于dice系数的损失函数作为分割损失,记作Loss1,表达式为:
其中,p(i)为分割网络经过Softmax函数的输出;g(i)为相应的真实标签值;K为类别数;∈为防止被0除的小常数;
对于基因型预测中存在的类别不平衡问题,采用Poly-1loss作为损失函数,记作Loss2,表达式为:
Loss2=LPoly-1=LCE+∈1(1-Pt)=-log(pt)+∈1(1-Pt)
其中,pt为模型对目标类的预测概率,∈1在本研究中设置为2;
综上,多任务损失函数为:
Losstotal=a·Loss1+b·Loss2
其中,a、b为Loss1和Loss2之间的任务权重。
优选的,所述步骤5包括:
对粒子群各参数进行初始化,所述参数包括粒子群的种群规模s、最大迭代次数T、搜索空间维度D、搜索范围最大值Pmax、搜索范围最小值Pmin,粒子群中每个粒子的最大速度Vmax、最小速度Vmin、位置x、自我学习因子c1、社会学习因子c2;
其中,对粒子群中的每个粒子的速度和位置初始化按下式进行随机赋值,rand()为区间[0,1]之间的随机数;
v=rand()
x=200·rand()-100
将初始化后的每个粒子的位置初始值代入适应度函数,得到每个粒子的适应度;
粒子群在初始化后,每个粒子得到一个初始位置,把位置的初始值映射为多任务损失函数中的任务权重a和b,根据该多任务损失函数对模型进行训练,得到基于下式的适应度:
F=max(-Losstotal)=max(-a·Loss1-b·Loss2)
根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及粒子群的种群最优位置、种群最优适应度;
个体最优适应度为每个粒子在整个迭代过程中得到的适应度最大的值;种群最优适应度为粒子群中所有粒子在整个迭代过程中的个体最优适应度的最大值;个体最优位置为个体最优适应度的粒子所对应的位置;种群最优位置为种群最优适应度的粒子所对应的位置;
基于种群最优适应度和个体最优适应度计算惯性权重;
将种群最优适应度和个体最优适应度代入下式进行计算,得到惯性权重;
其中,i表示第i个粒子,t表示迭代次数,w表示惯性权重;wi(t)表示第i个粒子迭代至t次时的惯性权重值;fitness(gbest)(t)表示粒子群迭代至t次时的种群最优适应度;fitness(pbest)i(t)表示第i个粒子迭代至t次时的个体最优适应度;
基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和粒子群的种群最优位置,更新每个粒子的速度和位置;
代入下式,得到粒子更新后的速度:
vij(t+1)=wvij(t)+c1r1[pbestij(t)-xij(t)]+c2r2[gbestj(t)-xij(t)]
得到粒子更新后的位置:
xij(t+1)=xij(t)+vij(t+1)
其中,vij(t)表示第i个粒子迭代到第t次时在第j维空间的速度;vij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的速度;xij(t)表示第i个粒子迭代到第t次时在第j维空间的位置;xij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的位置;pbestij(t)表示第i个粒子迭代到第t次时在第j维空间的个体最优位置;gbestj(t)表示粒子群迭代到第t次时粒子群在第j维空间的种群最优位置;c1为社会学习因子,取值为0.25;c2为自我学习因子,取值为0.25;
计算每个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值,将所述比值与预定阈值进行比较,若所述某个粒子比值小于预定阈值,则判定该粒子搜索成功;
设定预定阈值为1,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值小于1,则判断该粒子搜索成功,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值等于1,则判断该粒子搜索失败;设置粒子搜索成功的表示值为1,粒子搜索失败的表示值为0,基于下式判断每个粒子是否搜索成功;
计算搜索成功的粒子的位置到所述种群最优位置的欧氏距离,并对所有搜索成功的粒子所对应的欧氏距离取平均值,得到距离阈值;
其中,disti表征第i个粒子的位置到种群最优位置的欧氏距离,gbestj表征第j维的种群最优位置,xij表征第i个粒子的第j维的位置,D表征搜索空间维度;
并根据下式计算所有搜索成功的粒子到种群最优位置的欧式距离的平均值:
其中,distaverage表示平均值(即距离阈值);m表征搜索成功的粒子的个数;
其中,disti表示第i个粒子的位置到种群最优位置的欧氏距离,muti表示判断结果;若muti=1表示该粒子落入距离阈值内,muti=0表示该粒子没有落入距离阈值内;
判断每个粒子的位置到所述种群最优位置的欧氏距离是否小于所述距离阈值,若是,则对距离阈值内的部分粒子进行变异操作;
变异操作如下所示,得到所述部分粒子中每个粒子在变异后的位置:
pop(i)=(popmax-popmin)·rand()+popmin
其中,pop(i)表示第i个粒子在变异后的位置;popmax表示粒子群的搜索范围最大值;popmin表示粒子群的搜索范围最小值;rand()为区间[0,1]内的随机数;
判断当前迭代次数是否小于设定的迭代次数,若否,则执行步骤j;
输出粒子群在当前的种群最优位置,并将所述种群最优位置映射为多任务框架中的任务权重参数a和b;
根据当前得到的a和b构建多任务损失函数,并对网络模型进行训练,训练完毕后,得到每个粒子的适应度,并将适应度代入步骤c中。
优选的,所述步骤6包括:
将数据集中的80%作为训练集,剩余的20%作为测试集,所有的卷积层都采取Xavier初始化,初始学习率设置为0.0001,使用Adam优化器;
利用粒子群优化算法对多任务损失函数中的任务权重参数进行优化,先对粒子群中的各参数进行赋值,对粒子的速度和位置进行随机初始化,把粒子得到的初始值映射为所求参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算初始化后粒子的适应度;
根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及种群最优位置、种群最优适应度,基于种群最优适应度和个体最优适应度得到惯性权重;
基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和种群最优位置,对每个粒子的速度和位置进行更新,并根据设定阈值判断是否搜索成功,搜索成功后判断是否需要进行变异操作,并将当前种群最优位置映射为参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算粒子的适应度;
重复以上操作直到满足迭代次数,找到最优参数a和b确定Losstotal,通过最小化Losstotal函数使得网络模型识别性能达到最高并且保存模型参数;
最后将测试集载入训练好的网络模型进行预测得到分割结果和基因型,并根据专家标注计算各评价指标。
与现有技术相比,本发明具有如下的有益效果:
(1)本发明提出了一种面向胶质瘤分类分割多任务一体化网络的改进粒子群参数优化方法,用于同时实现脑胶质瘤分割和基因型预测,具有最新的性能;
(2)本发明使用基于dice系数的损失函数和Poly loss,并使用改进的粒子群优化算法可以根据粒子适应度来调节惯性权重,实现惯性权重的自适应调整;
(3)同时利用搜索成功的粒子计算出的阈值作为变异的条件,能更好地控制粒子变异时机,从而跳出局部最优解的能力得到提升,有利于找到平衡两个任务损失的最优权重,有助于解决胶质瘤分割时肿瘤区域像素占比小、基因型预测时基因类别数量不平衡的问题;
(4)通过粒子在搜索空间中不断更新自身位置并互相交换信息,直至搜索到全局最优值,避免了手动设置参数的不确定性。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的面向胶质瘤分类分割多任务一体化网络的改进粒子群参数优化方法的流程图;
图2为本发明中使用的多任务学习框架图;
图3为通道交叉融合模块示意图,图3a为CCT模块,图3b为CCA模块。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例:
如图1所示,本实施例的面向胶质瘤分类分割多任务一体化网络的改进粒子群参数优化方法,包括以下步骤:
1)构建脑胶质瘤患者数据集
所需的脑胶质瘤数据集包含多个病例,每个病例的数据包括多模态MRI影像数据、经活检验证的基因信息,且各病例数据所含有的数据项及数据格式需保持一致。每一例样本均提供了分割的标签,该标签是由专家手工标记出来的。分割的标签类别包括以下3类:坏死区,水肿区,增强区。对多模态MRI数据进行预处理,得到统一标准的脑胶质瘤多模态MRI数据Idata;
所述的基因信息包括但不限于:IDH突变状态、1p/19q缺少状态、MGMT启动子甲基化状态等信息。
所述临床信息包括但不限于:年龄、性别、肿瘤级别、肿瘤位置。
2)数据预处理
首先对原始数据进行数据增强操作,对原始图像进行裁剪、翻转、旋转操作生成新的图像并添加到数据集中,其次对图像进行标准化处理以增强图像目标区域的特征。其中80%的数据用于模型训练,20%的数据用于参数调整。
3)多任务学习框架的构建
如图2,通过共享从编码器中提取的空间和全局特征表示,可以同时实现胶质瘤分割和基因型预测任务。该多任务学习框架由三部分组成:用于特征提取的编码器、实现分割的解码器、进行分类预测的分类器。
编码器采用一系列卷积和Transformer操作从输入中提取全局语义特征。输入先进行3×3×3的初始卷积操作,以产生具有16个通道的特征图。接着通过3次下采样操作来捕获空间和深度特征表示,下采样操作通过步长为2的3×3×3的卷积来实现,每一次下采样操作后,输出的通道数量翻一倍,大小变为原来的一半。编码后的低分辨特征表示为低分辨特征经过线性投影、位置编码的操作送入四个Transformer层中。
并且,采用通道交叉融合模块代替普通U-net中的跳跃连接,通道交叉融合模块由通道交叉Transformer(CCT)和通道交叉注意模块(CCA)组成。CCT用于将编码部分的多尺度特征进行转换,CCA将多尺度特征和解码阶段的特征进行融合,以解决语义层不一致的问题,如图3a和图3b所示。
解码器由多个级联的上采样操作组成。对拼接后的特征进行上采样操作逐渐恢复全分辨率H×W×D,每一次上采样操作由1×1×1的卷积和步长为2的反卷积组成,最后,经过1×1×1的卷积和sigmoid函数作为解码器的分割层,以产生分割结果。
对编码部分的最后两级特征分别使用全局平均池化和全局最大池化,以将捕获的多尺度特征变换到每个通道中的相同尺寸,并加入临床数据通过级联进行特征融合,然后输入到三个全连接层中,最后由Softmax函数输出基因型的预测概率。
4)多任务损失函数构建
多任务损失函数由两部分构成,对于脑胶质瘤的分割,前景和背景的不平衡可能会导致分割偏差。为此,基于Dice系数的损失函数被用作分割损失,记作Loss1。对于基因型的预测,由于不同基因型的数量差异较大且样本数量有限,因此,Poly loss被用作分类损失,记作Loss2。
综上,多任务损失函数为:Losstotal=a·Loss1+b·Loss2
其中,a、b为Loss1和Loss2之间的任务权重。
5)构造优化问题,通过改进的粒子群优化算法进行迭代训练,直到满足迭代终止条件,得到损失函数中两个任务的最佳权重。
a)对粒子群各参数进行初始化,所述参数包括粒子群的种群规模s、最大迭代次数T、搜索空间维度D、搜索范围最大值Pmax、搜索范围最小值Pmin,粒子群中每个粒子的最大速度Vmax、最小速度Vmin、位置x、自我学习因子c1、社会学习因子c2。
其中,对粒子群中的每个粒子的速度和位置初始化按下式进行随机赋值,rand()为区间[0,1]之间的随机数。
v=rand()
x=200·rand()-100
b)粒子群在初始化后,每个粒子得到一个初始位置,把位置的初始值映射为多任务损失函数中的任务权重a和b,根据该多任务损失函数对模型进行训练,得到基于下式的适应度。
F=max(-Losstotal)=max(-a·Loss1-b·Loss2)
c)根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及粒子群的种群最优位置、种群最优适应度。
个体最优适应度为每个粒子在整个迭代过程中得到的适应度最大的值;
种群最优适应度为粒子群中所有粒子在整个迭代过程中的个体最优适应度的最大值;
个体最优位置为个体最优适应度的粒子所对应的位置;
种群最优位置为种群最优适应度的粒子所对应的位置。
d)基于种群最优适应度和个体最优适应度计算惯性权重。
将种群最优适应度和个体最优适应度代入下式进行计算,得到惯性权重;
其中,i表示第i个粒子,t表示迭代次数,w表示惯性权重;wi(t)表示第i个粒子迭代至t次时的惯性权重值;fitness(gbest)(t)表示粒子群迭代至t次时的种群最优适应度;fitness(pbest)i(t)表示第i个粒子迭代至t次时的个体最优适应度;
e)基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和粒子群的种群最优位置,更新每个粒子的速度和位置。
代入下式,得到粒子更新后的速度:
vij(t+1)=wvij(t)+c1r1[pbestij(t)-xij(t)]+c2r2[gbestj(t)-xij(t)]
得到粒子更新后的位置:
xij(t+1)=xij(t)+vij(t+1)
其中,vij(t)表示第i个粒子迭代到第t次时在第j维空间的速度;vij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的速度;xij(t)表示第i个粒子迭代到第t次时在第j维空间的位置;xij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的位置;pbestij(t)表示第i个粒子迭代到第t次时在第j维空间的个体最优位置;gbestj(t)表示粒子群迭代到第t次时粒子群在第j维空间的种群最优位置;c1为社会学习因子,取值为0.25;c2为自我学习因子,取值为0.25。
f)计算每个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值,将所述比值与预定阈值进行比较,若所述某个粒子比值小于预定阈值,则判定该粒子搜索成功;
设定预定阈值为1,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值小于1,则判断该粒子搜索成功,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值等于1,则判断该粒子搜索失败。进一步,可以设置粒子搜索成功的表示值为1,粒子搜索失败的表示值为0,基于下式可判断每个粒子是否搜索成功。
其中,SS(i,t)=1表示第i个粒子搜索成功,SS(i,t)=0表示第i个粒子搜索失败。
g)计算搜索成功的粒子的位置到所述种群最优位置的欧氏距离,并对所有搜索成功的粒子所对应的欧氏距离取平均值,得到距离阈值;
其中,disti表示第i个粒子的位置到种群最优位置的欧氏距离,gbestj表示第j维的种群最优位置,xij表示第i个粒子的第j维的位置,D表示搜索空间维度。
并根据下式计算所有搜索成功的粒子到种群最优位置的欧式距离的平均值:
其中,distaverage表示平均值(即距离阈值);m表示搜索成功的粒子的个数。
其中,disti表示第i个粒子的位置到种群最优位置的欧氏距离,muti表示判断结果。若muti=1表示该粒子落入距离阈值内,muti=0表示该粒子没有落入距离阈值内。
h)判断每个粒子的位置到所述种群最优位置的欧氏距离是否小于所述距离阈值,若是,则对距离阈值内的部分粒子进行变异操作;
变异操作如下所示,得到所述部分粒子中每个粒子在变异后的位置:
pop(i)=(popmax-popmin)·rand()+popmin
其中,pop(i)表示第i个粒子在变异后的位置;popmax表示粒子群的搜索范围最大值;popmin表示粒子群的搜索范围最小值;rand()为区间[0,1]内的随机数。
i)判断当前迭代次数是否小于设定的迭代次数,若否,则执行步骤j;
j)输出粒子群在当前的种群最优位置,并将所述种群最优位置映射为多任务框架中的任务权重参数a和b;
k)根据当前得到的a和b构建多任务损失函数,并对网络模型进行训练,训练完毕后,得到每个粒子的适应度,并将适应度代入步骤c中。
6)训练网络模型并测试
将数据集中的80%作为训练集,剩余的20%作为测试集,所有的卷积层都采取Xavier初始化,初始学习率设置为0.0001,使用Adam优化器。利用粒子群优化算法对多任务损失函数中的任务权重参数进行优化。先对粒子群中的各参数进行赋值,对粒子的速度和位置进行随机初始化,把粒子得到的初始值映射为所求参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算初始化后粒子的适应度。根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及种群最优位置、种群最优适应度。基于种群最优适应度和个体最优适应度得到惯性权重,之后,基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和种群最优位置,对每个粒子的速度和位置进行更新,并根据设定阈值判断是否搜索成功,搜索成功后判断是否需要进行变异操作,并将当前种群最优位置映射为参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算粒子的适应度,重复以上操作直到满足迭代次数,找到最优参数a和b确定Losstotal,通过最小化Losstotal函数使得网络模型识别性能达到最高并且保存模型参数。将测试集载入训练好的网络模型进行预测得到分割结果和基因型,并根据专家标注计算各评价指标。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (8)
1.一种面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,包括:
步骤1:构建脑胶质瘤患者数据集:
步骤2:进行数据预处理,首先对原始数据进行数据增强操作,对原始图像进行裁剪、翻转、旋转操作生成新的图像并添加到数据集中,其次对图像进行标准化处理以增强图像目标区域的特征;
步骤3:构建多任务学习框架,包括用于特征提取的编码器、实现分割的解码器、进行分类预测的分类器;
步骤4:构建多任务损失函数,基于Dice系数的损失函数被用作分割损失,对于基因型的预测,Poly loss被用作分类损失;
步骤5:通过改进的粒子群优化算法对多任务学习框架进行优化训练,得到损失函数中两个任务的最佳权重;
步骤6:在网络中载入训练集,确定网络模型的参数,得到训练好的网络模型并保存,载入训练好的网络模型,输入测试集进行预测,得到结果并根据标签计算各评价指标值;
所述步骤2包括:
将所有原始图像在-10到10度范围内进行随机旋转,以0.5的概率在轴向、冠状和矢状面上随机翻转,图像随机裁剪到128×128×128的体素大小来扩充数据集Idata,标签Lmask也进行相同的数据增强操作;
对所有图像进行标准化处理,公式如下:
其中,μ为图像的均值,x表示图像矩阵,σ和N分别表示图像的标准差和图像体素数量;
所述步骤5包括:
对粒子群各参数进行初始化,所述参数包括粒子群的种群规模s、最大迭代次数T、搜索空间维度D、搜索范围最大值Pmax、搜索范围最小值Pmin,粒子群中每个粒子的最大速度Vmax、最小速度Vmin、位置x、自我学习因子c1、社会学习因子c2;
其中,对粒子群中的每个粒子的速度和位置初始化按下式进行随机赋值,rand()为区间[0,1]之间的随机数;
v=rand()
x=200·rand()-100
将初始化后的每个粒子的位置初始值代入适应度函数,得到每个粒子的适应度;
粒子群在初始化后,每个粒子得到一个初始位置,把位置的初始值映射为多任务损失函数中的任务权重a和b,根据该多任务损失函数对模型进行训练,得到基于下式的适应度:
F=max(-Losstotal)=max(-a·Loss1-b·Loss2)
根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及粒子群的种群最优位置、种群最优适应度;
个体最优适应度为每个粒子在整个迭代过程中得到的适应度最大的值;种群最优适应度为粒子群中所有粒子在整个迭代过程中的个体最优适应度的最大值;个体最优位置为个体最优适应度的粒子所对应的位置;种群最优位置为种群最优适应度的粒子所对应的位置;
基于种群最优适应度和个体最优适应度计算惯性权重;
将种群最优适应度和个体最优适应度代入下式进行计算,得到惯性权重;
其中,i表示第i个粒子,t表示迭代次数,w表示惯性权重;wi(t)表示第i个粒子迭代至t次时的惯性权重值;fitness(gbest)(t)表示粒子群迭代至t次时的种群最优适应度;fitness(pbest)i(t)表示第i个粒子迭代至t次时的个体最优适应度;
基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和粒子群的种群最优位置,更新每个粒子的速度和位置;
代入下式,得到粒子更新后的速度:
vij(t+1)=wvij(t)+c1 r1[pbestij(t)-xij(t)]+c2r2[gbestj(t)-xij(t)]
得到粒子更新后的位置:
xij(t+1)=xij(t)+vij(t+1)
其中,vij(t)表示第i个粒子迭代到第t次时在第j维空间的速度;vij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的速度;xij(t)表示第i个粒子迭代到第t次时在第j维空间的位置;xij(t+1)表示第i个粒子迭代到第t+1次时在第j维空间的位置;pbestij(t)表示第i个粒子迭代到第t次时在第j维空间的个体最优位置;gbestj(t)表示粒子群迭代到第t次时粒子群在第j维空间的种群最优位置;c1为社会学习因子,取值为0.25;c2为自我学习因子,取值为0.25;
计算每个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值,将所述比值与预定阈值进行比较,若某个粒子比值小于预定阈值,则判定该粒子搜索成功;
设定预定阈值为1,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值小于1,则判断该粒子搜索成功,若某个粒子在当前迭代次数时的个体最优适应度与前一次迭代次数时的个体最优适应度的比值等于1,则判断该粒子搜索失败;设置粒子搜索成功的表示值为1,粒子搜索失败的表示值为0,基于下式判断每个粒子是否搜索成功;
计算搜索成功的粒子的位置到所述种群最优位置的欧氏距离,并对所有搜索成功的粒子所对应的欧氏距离取平均值,得到距离阈值;
其中,disti表征第i个粒子的位置到种群最优位置的欧氏距离,gbestj表征第j维的种群最优位置,xij表征第i个粒子的第j维的位置,D表征搜索空间维度;
并根据下式计算所有搜索成功的粒子到种群最优位置的欧式距离的平均值:
其中,distaverage表示平均值(即距离阈值);m表征搜索成功的粒子的个数;
其中,disti表示第i个粒子的位置到种群最优位置的欧氏距离,muti表示判断结果;若muti=1表示该粒子落入距离阈值内,muti=0表示该粒子没有落入距离阈值内;
判断每个粒子的位置到所述种群最优位置的欧氏距离是否小于所述距离阈值,若是,则对距离阈值内的部分粒子进行变异操作;
变异操作如下所示,得到所述部分粒子中每个粒子在变异后的位置:
pop(i)=(popmax-popmin)·rand()+popmin
其中,pop(i)表示第i个粒子在变异后的位置;popmax表示粒子群的搜索范围最大值;popmin表示粒子群的搜索范围最小值;rand()为区间[0,1]内的随机数;
判断当前迭代次数是否小于设定的迭代次数,若否,则执行步骤j;
输出粒子群在当前的种群最优位置,并将所述种群最优位置映射为多任务框架中的任务权重参数a和b;
根据当前得到的a和b构建多任务损失函数,并对网络模型进行训练,训练完毕后,得到每个粒子的适应度,并将适应度代入每个粒子的适应度公式中。
2.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述步骤1包括:
MRI图像预处理包括颅骨去除、配准到统一空间、重采样到1mm3的分辨率,获得分辨率统一、灰度分布相同的多模态MRI数据,预处理后的所有数据大小为240×240×240。
3.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述步骤3包括:
给定MRI扫描输入X∈RC×H×W×D,空间分辨率为H×W,深度维度为D,通道数为C,利用3DCNN生成捕捉空间和深度信息的特征图,然后利用Transformer编码器对全局空间中的长距离依赖性进行建模;
在实现胶质瘤分割任务的分支中,为减少编码特征和解码特征间的语义差异,用通道交叉Transformer模型CCT和通道交叉注意力模块CCA来代替普通U-net网络中的跳跃连接,编码部分的多尺度特征通过CCT模块进行交叉融合,对于编码部分的4层输出Ei,首先对特征进行token化,将特征变形为块大小的序列,使得这些块在4种尺度下映射到编码特征的相同区域,然后将token输入到多头交叉注意力模块和具有残差结构的多层感知机MLP中,以编码通道关系和依赖;
将第i级Transformer的输出Oi和第i级解码特征Di作为CCA模块的输入,并通过全局平均池化操作进行空间压缩,之后对通道依赖进行编码,嵌入全局空间信息到通道注意力图中,最终根据每个通道的重要性重新激活Oi得到再将/>与第i级解码器的上采样特征进行拼接融合,之后通过反卷积操作逐步恢复图像的分辨率,产生高分辨率的分割结果;
在实现基因预测任务的分支中,使用全局平均池化和全局最大池化将编码部分获取的最后两级特征变换到每个通道中的相同尺寸,并加入临床数据通过级联进行融合,然后输入到三个全连接层中,最后由Softmax函数输出基因型的预测概率,实现基因型预测。
4.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述用于特征提取的编码器包括:
采用一系列卷积和Transformer操作从输入中提取全局语义特征,输入先进行3×3×3的初始卷积操作,产生具有16个通道的特征图,接着通过3次下采样操作来捕获空间和深度特征表示,下采样操作通过步长为2的3×3×3的卷积来实现,每一次下采样操作后,输出的通道数量翻一倍,大小变为原来的一半,编码后的低分辨特征表示为
为确保每个体素的全面表示,使用线性投影将通道维度从128增加到512,并把空间维度和深度维度扩展成一维,得到大小的特征图f;为了对位置信息进行编码,引入可学习的位置嵌入,并通过与特征图f融合,得到如下的特征嵌入:
z0=f+PE=W×F+PE
其中,W为线性投影操作,PE∈Rd×N为位置嵌入,z0∈Rd×N为特征嵌入,之后z0被送到L层堆叠的Transformer中;
每一层Transformer层由一个多头注意力MHA和一个前馈网络FFN组成,对于第l层,自注意力的输入是根据zl-1计算的三元组(Q,K,V):
Q=zl-1WQ,K=zl-1WK,V=zl-1WV
其中,WQ,WK,WV∈Rd×d是三个线性投影层的可学习参数,d是(Q,K,V)的维数;
自注意力计算如下:
MHA是Transformer层重要的组成部分,允许模型同时关注来自不同位置的不同子空间的表示信息,通过将Transformer层的输入分成n个独立部分,并行处理每个部分,然后使用线性投影对级联结果进行投影,MHA操作表示如下:
MHA(zl-1)=Concat(SA1(zl-1),...,SAn(zl-1))WO
其中,WO是线性投影层的可学习参数,Concat()是连接操作;
然后,MHA的输出送入FFN模块得到第l个Transformer层的输出,第l个Transformer层的输出计算为:
z′l=MHA(LN(zl-1))+zl-1
zl=FFN(LN(z′l))+z′l
LN(*)表示层归一化操作,zl表示第l层的输出,l∈[1,2,...,L];
通道交叉融合模块代替普通的跳跃连接:通道交叉融合模块由通道交叉Transformer模型CCT和通道交叉注意模块CCA组成,通道交叉Transformer用于编码部分特征转换,先将编码部分的各级特征变形为序列进行标记化,再将各层的标记Ti进行级联,得到键和值T∑=Concat(T1,T2,T3,T4),三个标记Ti作为查询和一个级联的Token作为键和值,分别得到:
K=T∑WK
V=T∑WV
其中,WQi、WK、WV是不同输入的权重,i=1,2,3,4;
通过交叉注意力机制对V进行加权:
得到多头交叉注意后的输出MCAi:
其中,N为头数;
通过MLP和残差操作后,得到如下输出:
Oi=MCAi+MLP(Qi+MCAi)
第L层的四个输出O1、O2、O3和O4通过上采样和卷积操作进行重建,并与解码部分特征串联;
通道交叉注意模块融合多尺度特征和解码阶段的特征,以解决语义层不一致的问题,将第i级Transformer层输出Oi∈RC×H×W和第i级解码特征Di∈RC×H×W作为该模块的输入,并通过全局平均池化进行空间压缩,得到G(X),并通过该操作嵌入全局空间信息并产生注意力标签:
Mi=L1·G(Oi)+L2·G(Di)
其中,L1和L2是两个线性层的权重和Relu算子的权重;
使用一个单一的线性层和sigmoid激活函数来建立通道注意图,结果向量最终表示为:
其中,σ(Mi)表示每个通道重要性;
7.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述步骤4包括:
对于胶质瘤分割中前景和背景像素之间的不平衡问题,采用基于dice系数的损失函数作为分割损失,记作Loss1,表达式为:
其中,p(i)为分割网络经过Softmax函数的输出;g(i)为相应的真实标签值;K为类别数;∈为防止被0除的小常数;
对于基因型预测中存在的类别不平衡问题,采用Poly-1loss作为损失函数,记作Loss2,表达式为:
Loss2=LPoly-1=LCE+∈1(1-Pt)=-log(pt)+∈1(1-Pt)
其中,pt为模型对目标类的预测概率,∈1在本研究中设置为2;
综上,多任务损失函数为:
Losstotal=a·Loss1+b·Loss2
其中,a、b为Loss1和Loss2之间的任务权重。
8.根据权利要求1所述的面向胶质瘤多任务一体化网络的改进粒子群参数优化方法,其特征在于,所述步骤6包括:
将数据集中的80%作为训练集,剩余的20%作为测试集,所有的卷积层都采取Xavier初始化,初始学习率设置为0.0001,使用Adam优化器;
利用粒子群优化算法对多任务损失函数中的任务权重参数进行优化,先对粒子群中的各参数进行赋值,对粒子的速度和位置进行随机初始化,把粒子得到的初始值映射为所求参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算初始化后粒子的适应度;
根据每个粒子的适应度,计算每个粒子的个体最优位置、个体最优适应度以及种群最优位置、种群最优适应度,基于种群最优适应度和个体最优适应度得到惯性权重;
基于惯性权重、自我学习因子、社会学习因子、每个粒子的个体最优位置和种群最优位置,对每个粒子的速度和位置进行更新,并根据设定阈值判断是否搜索成功,搜索成功后判断是否需要进行变异操作,并将当前种群最优位置映射为参数a和b,得到Losstotal,并对多任务学习框架进行训练同时根据适应度函数计算粒子的适应度;
重复以上操作直到满足迭代次数,找到最优参数a和b确定Losstotal,通过最小化Losstotal函数使得网络模型识别性能达到最高并且保存模型参数;
最后将测试集载入训练好的网络模型进行预测得到分割结果和基因型,并根据专家标注计算各评价指标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210611738.6A CN115222007B (zh) | 2022-05-31 | 2022-05-31 | 面向胶质瘤多任务一体化网络的改进粒子群参数优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210611738.6A CN115222007B (zh) | 2022-05-31 | 2022-05-31 | 面向胶质瘤多任务一体化网络的改进粒子群参数优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115222007A CN115222007A (zh) | 2022-10-21 |
CN115222007B true CN115222007B (zh) | 2023-06-20 |
Family
ID=83608210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210611738.6A Active CN115222007B (zh) | 2022-05-31 | 2022-05-31 | 面向胶质瘤多任务一体化网络的改进粒子群参数优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115222007B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115497616B (zh) * | 2022-10-25 | 2023-05-23 | 杭州杏林信息科技有限公司 | 一种感染性疾病辅助决策的方法、系统、设备及存储介质 |
CN116630296B (zh) * | 2023-06-11 | 2024-01-23 | 中国海洋大学 | 基于轻量化网络的水下船体像素级缺陷检测方法及系统 |
CN116864124A (zh) * | 2023-07-06 | 2023-10-10 | 深圳市绿航星际太空科技研究院 | 一种基于大数据的营养健康预测系统 |
CN116965817B (zh) * | 2023-07-28 | 2024-03-15 | 长江大学 | 一种基于一维卷积网络和Transformer的EEG情感识别方法 |
CN117421691B (zh) * | 2023-12-18 | 2024-03-15 | 青岛奥克生物开发有限公司 | 基于人工智能的细胞培养监测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682682A (zh) * | 2016-10-20 | 2017-05-17 | 北京工业大学 | 一种基于粒子群优化算法对支持向量机的优化方法 |
CN108038507A (zh) * | 2017-12-13 | 2018-05-15 | 太原理工大学 | 基于粒子群优化的局部感受野极限学习机图像分类方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220237785A1 (en) * | 2019-05-23 | 2022-07-28 | H. Lee Moffitt Cancer Center And Research Institute, Inc. | System and method of evaluating neural networks to segment medical images |
CN110443364A (zh) * | 2019-06-21 | 2019-11-12 | 深圳大学 | 一种深度神经网络多任务超参数优化方法及装置 |
CN111047589B (zh) * | 2019-12-30 | 2022-07-26 | 北京航空航天大学 | 一种注意力增强的脑肿瘤辅助智能检测识别方法 |
CN111563549B (zh) * | 2020-04-30 | 2023-07-28 | 广东工业大学 | 基于多任务进化算法的医学图像聚类方法 |
CN113627606A (zh) * | 2020-05-06 | 2021-11-09 | 江苏科技大学 | 一种基于改进粒子群算法的rbf神经网络优化方法 |
CN112734755A (zh) * | 2021-03-15 | 2021-04-30 | 四川大学 | 基于3d全卷积神经网络与多任务学习的肺叶分割方法 |
CN113391894A (zh) * | 2021-06-10 | 2021-09-14 | 华南理工大学 | 一种基于rbp神经网络的最优超任务网优化方法 |
CN113706486A (zh) * | 2021-08-17 | 2021-11-26 | 西安电子科技大学 | 基于密集连接网络迁移学习的胰腺肿瘤图像分割方法 |
CN114334007A (zh) * | 2022-01-20 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 基因脱靶预测模型训练方法、预测方法、装置及电子设备 |
-
2022
- 2022-05-31 CN CN202210611738.6A patent/CN115222007B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682682A (zh) * | 2016-10-20 | 2017-05-17 | 北京工业大学 | 一种基于粒子群优化算法对支持向量机的优化方法 |
CN108038507A (zh) * | 2017-12-13 | 2018-05-15 | 太原理工大学 | 基于粒子群优化的局部感受野极限学习机图像分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115222007A (zh) | 2022-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115222007B (zh) | 面向胶质瘤多任务一体化网络的改进粒子群参数优化方法 | |
EP3864577B1 (en) | Systems and methods for image preprocessing | |
US20240144092A1 (en) | Generative machine learning systems for drug design | |
Cheng et al. | A fully automated multimodal MRI-based multi-task learning for glioma segmentation and IDH genotyping | |
CN110826638B (zh) | 基于重复注意力网络的零样本图像分类模型及其方法 | |
JP2022551683A (ja) | 人工知能(ai)モデルを使用した非侵襲的遺伝子検査を行う方法及びシステム | |
Mondal et al. | Deep learning approach for automatic classification of x-ray images using convolutional neural network | |
CN114998220B (zh) | 一种基于改进的Tiny-YOLO v4自然环境下舌像检测定位方法 | |
Xiang et al. | Towards interpretable skin lesion classification with deep learning models | |
CN111340135B (zh) | 基于随机投影的肾小肿块分类方法 | |
CN112949740A (zh) | 一种基于多级度量的小样本图像分类方法 | |
CN114596467A (zh) | 基于证据深度学习的多模态影像分类方法 | |
Nasab et al. | Deep learning in spatially resolved transcriptomics: A comprehensive technical view | |
Zhao et al. | Deeply supervised active learning for finger bones segmentation | |
Bhardwaj et al. | Computational biology in the lens of CNN | |
Tian et al. | Radiomics and its clinical application: artificial intelligence and medical big data | |
Ma et al. | LCAUnet: A skin lesion segmentation network with enhanced edge and body fusion | |
Xu et al. | Correlation via synthesis: end-to-end nodule image generation and radiogenomic map learning based on generative adversarial network | |
CN111259176A (zh) | 融合有监督信息的基于矩阵分解的跨模态哈希检索方法 | |
CN116433679A (zh) | 一种基于空间位置结构先验的内耳迷路多级标注伪标签生成与分割方法 | |
Molder et al. | Learning Medical Materials from Radiography Images | |
CN107798680B (zh) | 一种减少图像标签融合冗余计算的方法 | |
Chandra et al. | A Novel Framework For Brain Disease Classification Using Quantum Convolutional Neural Network | |
Karpagam et al. | Automated diagnosis system for Alzheimer disease using features selected by artificial bee colony | |
Dobshik et al. | Weakly supervised semantic segmentation of tomographic images in the diagnosis of stroke |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |