WO2020224123A1

WO2020224123A1 - 一种基于深度学习的致痫灶三维自动定位系统

Info

Publication number: WO2020224123A1
Application number: PCT/CN2019/103530
Authority: WO
Inventors: 卓成; 张沁茗; 张腾; 廖懿; 王夏婉; 冯建华; 张宏; 田梅
Original assignee: 浙江大学
Priority date: 2019-06-24
Filing date: 2019-08-30
Publication date: 2020-11-12
Also published as: CN110390351B; US20220230302A1; CN110390351A; US11645748B2

Abstract

一种基于深度学习的致痫灶三维自动定位系统，该系统包括：PET图像采集和标记模块；PET图像与标准对称脑模版的配准模块；PET图像数据预处理模块，生成左右脑图像块的镜像对；孪生网络SiameseNet训练模块，包含两个共享权重参数的深度残差卷积神经网络，输出层连接多层感知机和softmax层，利用携带致痫灶的图像和正常图像的训练集对所述网络进行训练获得网络模型；分类模块和致痫灶定位模块，利用训练好的网络模型对新输入的PET图像生成概率热图，先通过分类器判断图像为正常或者携带致痫灶样本，再预测致痫灶区域的位置。该系统通过引入图像块的镜像对和孪生网络SiameseNet，来自动定位PET图像的致痫灶，能有效地提高致痫灶定位的准确度和效率，并具有较高的鲁棒性。

Description

一种基于深度学习的致痫灶三维自动定位系统

技术领域

本发明涉及医疗影像工程技术领域，特别涉及一种基于深度学习的致痫灶三维自动定位系统。

背景技术

随着医学成像技术和人工智能技术的发展，自动和半自动的计算机辅助诊断系统被广泛应用于精准诊断和治疗中，以提高诊断准确率及预后。目前，针对癫痫疾病的检测系统包括正电子发射计算机断层扫描(PET)、核磁共振成像(MRI)、单光子发射计算机断层扫描(SPECT)和脑电图(EEG)，其中PET对于癫痫疾病的检测和预后具有更高的灵敏度。对癫痫疾病类型的确定、难治性癫痫的手术治疗等中，均需要用诊断系统精确地定位致痫灶的位置。然而，传统的对三维PET图像进行视觉评估的常规临床诊断非常耗时，且受到医生临床经验的影响。因此，提出一种准确、快速的致痫灶定位系统十分重要。

现有的技术面临的挑战主要有：1.影像学技术通常基于区域或体素的标准摄取值(SUV)和/或不对称指数(AI)的统计推断判断异常。区域统计方法通常将大脑分割成较大的感兴趣区域(ROI)，然后比较区域内的SUV或AI的平均值。由于区域常远大于病灶区，导致该方法会忽略细微变化，从而导致其检测灵敏度降低。体素统计方法通常使用统计参数映射(SPM)软件来比较单个病例和控制组的数据，然而，体素统计方法对配准误差高度敏感，容易在错位区域产生假阳性。2.现有的算法大多仅适用于二维自然图像处理，而由于PET成像是一个由平行扫描图像帧组成的三维结构，二维定位算法会忽略重要的帧间信息。3.由于医学图像数据量少、缺少高质量的标注数据和训练样本、正负样本数量差异较大导致样本的不平衡等问题，训练出来的模型可能是过拟合或者模型泛化能力不高。

综上，提供一种致痫灶区域的三维自动定位系统，利用PET图像帧内和帧间的对称性信息，以提高致痫灶定位的准确度和效率，成为目前亟待解决的重要技术问题。

发明内容

本发明的目的在于针对目前医学图像病灶定位技术的不足，提供了一种基于深度学习的脑部区域致痫灶三维定位系统，用于自动定位脑部致痫灶的位置，定位结果准确率高，模型具有较高的鲁棒性。

本发明的目的是通过以下技术方案来实现的：一种基于深度学习的致痫灶三维自动定位系统，所述系统包括以下模块：

(1)PET图像采集和标记模块，包括图像采集和致痫灶区域标记：

1.1)采集图像：使用3D PET/CT扫描仪采集脑部PET图像，受试者在采集过程中保持相同体位，获取PET图像。图像采集后进行图像格式转换，即将DICOM格式的原始采集图像序列转换成易处理的NIFTI格式图像。

1.2)标记样本：将PET图像分为正常样本集和携带致痫灶的样本集，并对携带致痫灶的样本集手动标记致痫灶区域，其中，致痫灶区域标记为1，其余区域标记为0。

(2)PET图像配准模块：以互相关作为图像间的相似性度量，运用对称微分同胚(SyN)算法将所有PET图像及其标记图像形变到同一对称标准空间，以实现PET采集图像、标记图像与标准对称脑模版的配准。配准后，采用高斯平滑算法减少个体差异带来的配准误差，高斯平滑处理选择高斯函数的半峰全宽FWHM为5～15mm。对平滑后的图像进行z-score标准化。

(3)采用基于对称性的深度学习系统，包含以下模块：

3.1)数据预处理模块：

3.1.1)数据增强：对配准后的图像和标签进径向畸变和图像强度增强，得到新生成的图像和标签。径向畸变是图像像素点以畸变中心为中心点，沿着径向的位置产生偏差，径向畸变的计算过程为：

P _u＝P _d+(P _d-P _c)(k ₁r ²+k ₂r ⁴+k ₃r ⁶+…)

其中，P _u是原图像的一个像素点，P _d是畸变后图像的一个像素点，P _c是畸变中心，k _i(i＝1,2,3…)是径向畸变的畸变系数，r是P _d和P _c在矢量空间上的距离。

图像强度增强包括滤波处理、图像加噪处理和图像灰度值在空间的乘性、加性变换，图像强度增强的公式为：

P _a＝g_mult×P _u+g_add

其中P _a是图像强度增强后的图像像素点，g_mult是乘性高斯偏置场的图像像素点，g_add是加性高斯偏置场的图像像素点。

3.1.2)图像块划分：对增强后的图像数据进行图像块划分，用三维滑动窗口将PET图像的左右半脑L和R划分为图像块的镜像对，将图像块的镜像对数据按比例分为训练集、验证集和测试集。所述训练集、验证集和测试集中均包含有携带致痫灶和正常两种类型的PET图像块数据。图像数据集中，每一张PET图像数据的分辨率为X×Y×Z像素，设置滑动扫描窗口块的大小为m×m×m，滑动步长为t。则每个图像块的大小为m×m×m，对于一张PET图像的左右半脑，可划分为

对图像块。

3.2)网络构建模块：构建深度孪生网络SiameseNet。该网络包含两个相同的卷积神经网络、一个全连接层及一个输出层。每个卷积神经网络有十层结构，第1层包括依次连接的一个卷积层(conv)、一个批标准化操作单元(batch normalization)，一个Relu函数和一个池化层(pool)；第2-9层是八个ResBlock，每个ResBlock均包含依次连接的两个卷积层、两次归一化操作和一个Relu函数；第10层为一个卷积层，两个卷积神经网络的第10层输出连接一个全连接层(fc)，进行非线性变换。最后连接一个输出层。

SiameseNet的两个卷积神经网络在每层共享相同的权重参数θ，将一对图像块的镜像对输入网络，获取两个高维图像的特征L_feature和特征R_feature，计算两个高维图像特征的绝对差值d＝|L_feature-R_feature|，并将其传入到全连接层的多层感知机(MLP)中进行概率回归，全连接层向量的维度依次为2048、1024、512和2。输出层采用softmax回归函数的分类概率，即图像块携带致痫灶或正常的概率。

在模型训练中采用交叉熵函数作为网络的损失函数。交叉熵Loss(a,b)的计算方式为：

其中，n表示样本数量，a是正确的概率分布，b是网络模型预测的概率分布。采用标准随机梯度下降(SGD)更新权重参数θ，其公式为：

其中，η是学习速率，θ ^k是第k次的权重参数。

3.3)测试图像检测模块：

图像分类：利用训练好的模型计算测试集PET图像的概率热图，概率热图是一张PET图像上不同图像块对应概率拼接而成的概率图，大小为

之后采用逻辑回归算法对每一张PET图像对应的概率热图进行分类，获得分类结果，即为正常PET图像或携带致痫灶PET图像。

致痫灶定位：对识别为携带致痫灶PET图像的概率热图进行双线性插值，将概率热图改变为原始图像尺寸，将大于概率阈值的区域预测为致痫灶区域。

本发明的有益效果如下：

1)能够自动学习PET图像数据中的深度特征。传统的视觉评估需要医生一帧帧地观察和判断，极度依赖医生的经验及技术水平，且消耗大量时间。孪生网络能够自动地学习PET图像中的高维不对称特征特征，以发现PET图像和致痫灶之间的内在联系。与传统的致痫灶定位系统相比，本发明提出的系统能够学习到人眼难以识别的高阶特征，且兼顾了单侧癫痫患者代谢分布不对称这一先验知识。

2)能够实现对病灶区的精准定位。本发明提出的系统能准确检测代谢异常的患者图像，并且与现有的SPM软件相比，该系统预测出的致痫灶区域和医师视觉评估更一致，并保持较高的准确率和效率。因此，在帮助医生定位致痫区和后续手术治疗方面有较高的价值。

3)能够适用于不同脑区的致痫灶检测。本发明提出的系统对全脑不同脑区的致痫灶检测均有效，适用于致痫灶在不同脑区的癫痫患者。

4)能够实现小数据量的网络训练。本发明利用图像增强和划分图像块的镜像对，以增加样本量，在此基础上进行训练模型和测试数据，避免了网络训练的过拟合，提高了网络训练的鲁棒性。此外，为了平衡正常和病患数据样本，本发明采用样本加权作为数据增强，为少数样本设置了较大的权重，以在训练过程中使每批正常面积样本比例与致痫区样本比例均衡。

附图说明

图1是本发明一个实施例的基于深度学习的致痫灶三维定位系统的结构框图；

图2是本发明一个实施例的基于深度学习的致痫灶三维定位系统的实现流程图；

图3是本发明一个实施例的深度孪生网络SiameseNet构建示意图；

图4是本发明SiameseNet的单个残差神经网络结构示意图；

图5是本发明一个实施例的PET图像对应的概率热图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步详细说明。

如图1所示，本发明一个实施例的致痫灶三维自动定位系统包括以下模块：

1.1)采集图像：使用3D PET/CT扫描仪采集脑部PET图像，受试者在采集过程中保持相同体位，获取PET图像。图像采集后进行图像格式转换，即DICOM格式的原始采集图像序列转换成易处理的NIFTI格式图像。

(2)PET图像配准模块：以互相关作为图像间的相似性度量，运用对称微分同胚(SyN)算法将所有PET图像及其标记图像形变到同一对称标准空间，以实现PET采集图像、标记图像与标准对称脑模版的配准。对于将原始图像I形变到图像J，最小化以下目标函数：

第一项是平滑项，式中，L是平滑算符，v是速度场。第二项中的λ控制匹配的精确性。C(I,J)是相似性度量，其中C(I,J)可表示为：

配准后，采用高斯平滑算法减少个体差异带来的配准误差。高斯平滑处理选择高斯函数的半峰全宽FWHM为5～15mm，以消除个体差异带来配准误差。对平滑后的图像进行z-score标准化：

其中μ为一张配准后图像J的均值，σ为一张图像的方差。

(3)采用基于对称性的深度学习系统，包含以下模块

3.1)数据预处理模块：

3.1.1)数据增强：对配准后的图像和标签进行径向畸变和图像强度增强，得到新生成的图像和标签。径向畸变是图像像素点以畸变中心为中心点,沿着径向的位置产生偏差，径向畸变的计算过程为：

P _u＝P _d+(P _d-P _c)(k ₁r ²+k ₂r ⁴+k ₃r ⁶+…)

P _a＝g_mult×P _u+g_add

3.1.2)图像块划分：对增强后的图像数据进行图像块划分，用三维滑动窗口将PET图像的左右半脑L和R划分为图像块的镜像对，将图像块的镜像对数据按比例分为训练集、验证集和测试集；所述训练集、验证集和测试集中均包含有携带致痫灶和正常两种类型的PET图像块数据。图像数据集中，每一张PET图像数据的分辨率为X×Y×Z像素，设置滑动扫描窗口块的大小为m×m×m，滑动步长为t。则每个图像块的大小为m×m×m，对于一张PET图像的左右半脑，可划分为

对图像块。

3.2)网络构建模块：构建深度孪生网络SiameseNet。该网络包含两个相同的卷积神经网络、一个全连接层及一个输出层。每个卷积神经网络有十层结构，第1层包括依次连接的一个卷积层(conv)、一个批标准化操作单元(batch normalization)，一个Relu函数和一个池化层(pool)；第2-9层是八个ResBlock，每个ResBlock均包含依次连接的两个卷积层、两次归一化操作和一个Relu函数；第10层为一个卷积层，两个卷积神经网络的第10层输出连接一个全连接层(fc)，进行非线性变换。最后连接一个输出层。一次随机失活(dropout)其参数设置可以为0.5。

SiameseNet网络模型中，卷积层操作的计算过程为：

其中，output _conv是每一卷积层输出图像数据的三维大小(图像的长度、宽度和深度)，input _conv是输入图像的三维大小，pad表示在图像周围填充像素，kernal为卷积核的三维大小，stride为卷积核的步长。

对于每一个卷积层使用批标准化操作，加速网络的收敛速度及稳定性，批标准化操作的公式为：

其中，input _norm是输入的每个批数据，

是归一化数据，output _norm批标准化操作输出的批数据，μ和σ分别是每个批数据的均值和方差，γ和β分别是缩放和平移变量，ε是为了增加训练稳定性而加入的较小的常量数据；

与每个卷积层相连的激活函数选用Relu函数，可缩短训练周期，Relu函数的计算方式为：

output _relu＝max(input _relu,0)

其中，input _relu是Relu函数的输入数据，output _relu是Relu函数的输出数据。

SiameseNet的两个卷积神经网络在每层共享相同的权重参数θ，将一对图像块的镜像对输入网络，如图3所示，输入图像块的大小为48×48×48×1，其中48×48×48代表图像块的长、宽、高，1代表图像块的通道数量。经过第1层卷积后，得到的特征大小为24×24×24×64，经过ResBlocks分别得到的特征大小为12×12×12×64、12×12×12×64、6×6×6×128、6×6×6×128、3×3×3×256、3×3×3×256、3×3×3×512和3×3×3×512，经过第10层卷积层得到大小为1×1×1×2048的两个高维特征L_feature和R_feature，计算两个高维图像特征的绝对差值d＝|L_feature-R_feature|，并将其传入到全连接层的多层感知机(MLP)中进行概率回归，全连接层向量的维度依次为1×1×1×1024、1×1×1×512和1×1×1×2，全连接层中间采用dropout层并设置p＝0.5，减少网络参数，防止过拟合。输出层采用softmax回归函数的分类概率，即图像块携带致痫灶或正常的概率，softmax的公式为：

其中，d _j代表不同类别的输出，g代表分类数，j＝1,2,…g。

其中，n表示样本数量，a是正确的概率分布，b是网络模型预测的概率分布。采用标准随机梯度下降(SGD)更新权重权重参数θ，其公式为：

其中，η是学习速率，θ ^k是第k次的权重参数。

在本发明实例中，所述训练阶段和测试阶段流程图如图4所示，SiameseNet所采用的基本网络框架是ResNet18，两个ResNet共享相同的网络权重参数θ，利用携带致痫灶PET图像和正常图像的训练集对所述网络进行训练，通过训练过程得到网络模型。此外，在训练集的正常样本中加入少量图像背景块的镜像对，以减少图像背景对模型产生的影响。

3.3)测试图像检测模块：

图像分类：利用训练好的模型计算测试集PET图像的概率热图，如图5所示，概率热图是一张PET图像上不同图像块对应概率拼接而成的概率图，大小为

致痫灶定位：对识别为携带致痫灶PET图像的概率热图进行双线性插值，将概率热图改变为与原始图像尺寸相同的概率图heatmap，将大于概率阈值的区域预测为致痫灶区域。双线性插值的计算公式为；

f(m+u,n+v)＝(1-u)(1-v)f(m,n)+u(1-v)f(m+1,n)

+(1-u)vf(m,n+1)+uvf(m+1,n+1)

其中，f(m+u,n+v)为新计算的像素值，f(m,n)，f(m+1,n)，f(m,n+1)和f(m+1,n+1)分别是新像素值周围的四个原像素值，u和v为原像素点和新像素点之间的距离。通过设置阈值k(heatmap≥heatmap_max×k)，其中heatmap_max是heatmap的最大值，最终获得预测的致痫灶区域。

在一个应用本实施例系统的具体案例中，如图4所示，首先将采集的PET数据集分为训练集、验证集和测试集，利用孪生网络学习系统，提取左右脑图像块的两个特征向量，计算两个特征向量的绝对差值，在其后添加多层感知机进行概率回归。最后在每一整张图像上用滑动窗口块进行扫描测试，扫描完后输出概率热图，最终得到检测结果图，从而实现对PET图像中癫痫灶的分类和定位，最终整张图像分类结果的AUC为94％，并且与现有的SPM软件相比，该系统预测出的致痫灶区域和医师视觉评估更一致，保持较高的准确率和效率。

本专利不局限于上述最佳实施方式。任何人在本专利的启示下都可以得出其他各种形式的基于深度学习的致痫灶定位系统，凡依照本发明申请专利范围所做的均等变化与修饰，皆应属本专利的涵盖范围。

Claims

一种基于深度学习的致痫灶三维自动定位系统，其特征在于，该系统包括以下模块：

(1)PET图像采集和标记模块，用于图像采集和致痫灶区域标记：

1.1)采集图像：受试者在PET扫描仪上使用3D脑部图像采集，在相同体位状态下获取PET脑图像。

1.2)标记样本：将PET图像分为正常样本集和携带致痫灶的样本集，并对携带致痫灶的样本集手动标记致痫灶区域，其中，致痫灶区域标记为1，其余区域标记为0。

(2)PET图像配准模块：以互相关作为原始图像与配准图像的相似性度量，运用对称微分同胚(SyN)算法将所有PET图像及其标记图像配准到同一对称标准空间，实现PET采集图像、标记图像与标准对称脑模版的配准。

(3)采用基于对称性的深度学习系统，包含以下模块：

3.1)数据预处理模块：

3.1.1)数据增强：对配准后的图像和标签进径向畸变和图像强度增强，得到新生成的图像和标签。

3.1.2)图像块划分：对增强后的图像数据进行图像块划分，用三维滑动窗口将PET图像的左右半脑L和R划分为图像块的镜像对，将图像块的镜像对数据按比例分为训练集和测试集；所述训练集和测试集中均包含有携带致痫灶和正常两种类型的PET图像块数据。

3.2)网络构建模块：构建深度孪生网络SiameseNet，该网络包含两个相同的卷积神经网络、一个全连接层以及一个输出层。SiameseNet将一对图像块的镜像对输入每层共享权重参数θ的两个卷积神经网络，以获取两个高维图像的特征L_feature和特征R_feature，计算两个高维图像特征的绝对差值d＝|L_feature-R_feature|，并将其传入到全连接层的多层感知机中进行概率回归，输出层采用softmax回归函数的分类概率，即图像块携带致痫灶或正常的概率。

3.3)测试图像检测模块：

图像分类：利用训练好的网络计算测试集PET图像的概率热图，采用逻辑回归算法对每一张PET图像对应的概率热图进行分类，获得分类结果，即为正常PET图像或携带致痫灶PET图像。

致痫灶定位：对识别为携带致痫灶PET图像的概率热图进行双线性插值，将概率热图改变为原始图像尺寸，将大于概率阈值的区域预测为致痫灶区域。
根据权利要求1所述的一种基于深度学习的致痫灶三维自动定位系统，其特征在于，1.1)采集图像过程中，将获取的PET脑图像进行格式转换，即DICOM格式的原始采集图像转换成NIFTI格式图像。
根据权利要求1所述的一种基于深度学习的致痫灶三维自动定位系统，其特征在于，(2)PET图像配准模块中，采用高斯平滑算法减少配准误差，高斯平滑处理选择高斯函数的半峰全宽FWHM为5～15mm，并对平滑后的图像进行z-score标准化。
根据权利要求1所述的一种基于深度学习的致痫灶三维自动定位系统，其特征在于，3.1.1)数据增强过程中的径向畸变具体为：径向畸变是图像像素点以畸变中心为中心点，沿着径向的位置产生偏差，径向畸变的计算过程为：

P _u＝P _d+(P _d-P _c)(k ₁r ²+k ₂r ⁴+k ₃r ⁶+…)

其中，P _u是原图像的一个像素点，P _d是畸变后图像的一个像素点，P _c是畸变中心，k _i(i＝1,2,3…)是径向畸变的畸变系数，r是P _d和P _c在矢量空间上的距离。
根据权利要求1所述的一种基于深度学习的致痫灶三维自动定位系统，其特征在于，3.1.1)数据增强过程中的图像强度增强包括滤波处理、图像加噪处理和图像灰度值在空间的乘性、加性变换，图像强度增强的公式为：

P _a＝g_mult×P _u+g_add

其中P _a是图像强度增强后的图像像素点，g_mult是乘性高斯偏置场的图像像素点，g_add是加性高斯偏置场的图像像素点。
根据权利要求1所述的一种基于深度学习的致痫灶三维自动定位系统，其特征在于，3.1.2)图像块划分中，图像数据集中的每一张PET图像数据的分辨率为X×Y×Z像素，设置滑动扫描窗口块的大小为m×m×m，滑动步长为t，则每个图像块的大小为m×m×m，对于一张PET图像的左右半脑，可划分为
对图像块。
根据权利要求1所述的一种基于深度学习的致痫灶三维自动定位系统，其特征在于，3.2)网络构建模块中，SiameseNet的每个卷积神经网络有十层结构，第1层包括依次连接的一个卷积层、一个批标准化操作单元、一个Relu函数和一个池化层；第2-9层是八个ResBlock，每个ResBlock均包含依次连接的两个卷积层、两次归一化操作和一个Relu函数；第10层为一个卷积层，两个卷积神经网络的第10层输出连接一个全连接层进行非线性变换，全连接层向量的维度依次为2048、1024、512和2；最后连接一个输出层。
根据权利要求7所述的一种基于深度学习的致痫灶三维自动定位系统，其特征在于，3.2)网络构建模块，在模型训练中采用交叉熵函数作为网络的损失函数，交叉熵Loss(a,b)的计算公式为：

其中，n表示样本数量，a是正确的概率分布，b是网络模型预测的概率分布；

采用标准随机梯度下降更新权重参数θ，其公式为：

其中，η是学习速率，θ ^k是第k次的权重参数。
根据权利要求1所述的一种基于深度学习的致痫灶三维自动定位系统，其特征在于，3.2)网络构建模块，SiameseNet网络模型中卷积层操作的计算过程为：

其中，output _conv是每一卷积层输出图像数据的三维大小，input _conv是输入图像的三维大小，pad表示在图像周围填充像素，kernal为卷积核的三维大小，stride为卷积核的步长；

对于每一个卷积层使用批标准化操作，批标准化操作的公式为：

其中，input _norm是输入的每个批数据，
是归一化数据，output _norm批标准化操作输出的批数据，μ和σ分别是每个批数据的均值和方差，γ和β分别是缩放和平移变量，ε是为了增加训练稳定性而加入的较小的常量数据。