WO2022221991A1

WO2022221991A1 - 一种影像数据处理方法、装置、计算机及存储介质

Info

Publication number: WO2022221991A1
Application number: PCT/CN2021/088127
Authority: WO
Inventors: 袁凯伦; 周凌霄; 张崇磊; 袁小聪
Original assignee: 深圳市深光粟科技有限公司
Priority date: 2021-04-19
Filing date: 2021-04-19
Publication date: 2022-10-27

Abstract

一种影像数据处理方法、装置、计算机及存储介质，应用于图像处理技术领域。方法包括：获取待处理的影像数据，对所述影像数据进行预处理得到多通道数据，并将所述多通道数据输入至预训练编码器得到多个通道的特征图（S110）；提取每个所述特征图的深度组学参数，根据所述深度组学参数得到包含特征权重的特征图，并对每个通道中包含权重的特征图进行融合，得到第一特征图（S120）；将利用预设的批次效应去除算法调整每个通道中所述特征图的深度组学参数，得到第二特征图（S130）；将所述第一特征图和所述第二特征输入至预设的网络集成模型中进行处理，得到特征优化参数（S140）。

Description

一种影像数据处理方法、装置、计算机及存储介质

技术领域

本发明实施例涉及图像处理技术领域，尤其是一种影像数据处理方法、装置、计算机及存储介质。

背景技术

在医学影像人工智能深度学习的方法研究中，乃至在其他通用的深度学习的算法研究中，由于数据偏移、标注稀疏等原因引起的模型泛化性问题成为了研究者们讨论的热点话题之一。随着众多大规模标注的训练数据集(例如ImageNet、IMDB、LIDC-IDRI、DDSM MIAS等)的公开，深度学习在完成计算机视觉与自然语言处理领域中的许多任务上获得了巨大的成功，对于特定任务的表现甚至超过了人类自己。但是，大多数应用场景中特别是医学影像领域，标注数据的获取是一个非常昂贵、耗时、甚至无法完成的过程，加之目前不同医院之间的数据共享和互通程度较低，因此用于训练模型的数据和标注往往是来自公开数据集或者源于单一医院，如果将基于上述数据训练出的模型直接使用到其他医院中去，或者换句话讲就是将模型迁移到无标注或者是稀疏标注的目标域中去，这样的直接迁移会导致模型的准确率大幅度下降。产生这种情况的一个主要原因是数据集偏移(Dataset shift)，从统计学习的观点来看，一个机器学习任务T定义为在一个领域D上的条件概率p(x|y)的建模问题，领域D指一个样本空间及其分布。根据贝叶斯公式，p(x,y)＝p(x|y)p(y)＝p(y|x)p(x)，其中有三个我们可以考虑的概率分布项：输入空间的边缘概率分布p(x),输出空间的标签分布p(y)，以及表示该机器学习任务的条件概率分布p(x|y)。当源域和目标域的三者之一发生了变化，我们都认为发生了源域与目标域的数据集的分布发生了偏移，即数据集偏移。在我们前期的研究中发现，在复杂医疗场景下的深度学习模型构建过程中，多中心多设备所生成的影像数据偏移也成为了当前医学影像深度学习算法面临的主要挑战问题之一。

对于同样用于分析医学影像的影像组学(radiomics)分析也存在数据集偏移的问题。影像组学分析主要包含图像获取、图像分割、影像组学参数提取和模型建立与验证等步骤，通过计算机高通量定量特征提取的方法实现从医学影像图像(CT、MRI和PET-CT等)中提取海量数据，从而将医学图像中主观性强的定性数据转化为具有客观性的定量数据，并进行数据挖掘分析[2]。影像组学的迅猛发展，在疾病诊断和鉴别诊断、肿瘤分期分级、基因表型预测、治疗方案决策、疗效评估及预后预测等方面取得了较大成果，尤其在肺部肿瘤方面显示出巨大优势[3]。虽然影像组学参数在疾病的筛查、诊断、治疗和预后中展现出了超越传统医疗方式的生物标志物属性，但其在多中心多设备影像上所产生变异性(variability)大、重复性(repeatability)及再现性(reproducibility)差等问题，造成基于影像组学参数所构建的模型泛化能力欠缺，从而大大限制了模型的诊断效能，导致其难以运用到真实医疗场景的实践中。

国内外学者分别针对影像组学特征可重复性问题与深度学习中的数据偏移问题做了大量的研究工作，其中影像组学领域提出了筛选稳定参数、改善信噪比、重采样、超分辨率重建以及Combat补偿等方法；在深度学习多源领域适应领域提出了基于差异的潜伏特征空间变换方法(Discrepancy-based latent space transformation methods)、基于对抗的潜伏特征空间变换方法(Adversarial latent space transformation methods)和中间域生成方法等[11]。然而这些方法在疾病的多样化以及多中心多设备多参数变化的偏移叠加下，即使使用最成熟的肺癌分割模型，仍存在难以准确捕获目标稳定特征、模型在多源数据测试集中准确率低、模型效率低等诸多问题。因此如何有效提高深度学习模型在多中心多设备数据上的泛化性能具有重要的理论研究意义和广泛的应用前景。

发明内容

为解决上述技术问题，本发明创造的实施例提供一种影像数据处理方法，包括：

获取待处理的影像数据，对所述影像数据进行预处理得到多通道数据，并将所述多通道数据输入至预训练编码器得到多个通道的特征图；

提取每个所述特征图的深度组学参数，根据所述深度组学参数得到包含特征权重的特征图，并对每个通道中包含权重的特征图进行融合，得到第一特征图；

将利用预设的批次效应去除算法调整每个通道中所述特征图的深度组学参数，得到第二特征图；

将所述第一特征图和所述第二特征输入至预设的网络集成模型中进行处理，得到特征优化参数。

进一步地，所述对所述影像数据进行预处理得到多通道数据，包括：

对所述影像数据分别进行拉普拉斯变换、小波变换、图像强度平方、图像强度平方根、对数变换、指数变换、梯度变换和局部二值模式变换；

将所述影像数据以及经每个变换方法处理得到的影像数据作为所述多通道数据。

进一步地，所述根据所述深度组学参数得到包含特征权重的特征图，并对每个通道中包含权重的特征图进行融合，得到第一特征图，包括：

利用预设的权重计算方法计算所述特征图中特征的权重；

采用预设的正则化特征权重分配机制计算包含权重的特征图；

利用注意力机制将每个通道中包含权重的特征图进行融合，得到第一特征图。

进一步地，所述利用预设的批次效应去除算法调整每个通道中所述特征图的深度组学参数，得到第二特征图，包括：

将所述深度组学参数作为不同数据集与预设的数据集进行混合；

以所述影像数据中组内稳定参数最多的中心与设备数据集作为参考数据集；

以所述参考数据集为标准利用预设的ComBat算法对混合后得到的数据集进行调整得到所述第二特征图。

进一步地，所述将所述第一特征图和所述第二特征输入至预设的网络集成模型中进行处理，得到特征优化参数，包括：

将所述第一特征图和所述第二特征图输入至预设的MOE双网络集成模型中输出已处理的特征图；

将已处理的特征图输入至预设的解码器得到所述所述特征优化参数。

为解决上述问题，本发明实施例还提供一种影像数据处理装置，包括：

获取模块，用于获取待处理的影像数据，对所述影像数据进行预处理得到多通道数据，并将所述多通道数据输入至预训练编码器得到多个通道的特征图；

处理模块，用于提取每个所述特征图的深度组学参数，根据所述深度组学参数得到包含特征权重的特征图，并对每个通道中包含权重的特征图进行融合，得到第一特征图；

所述处理模块，还用于将利用预设的批次效应去除算法调整每个通道中所述特征图的深度组学参数，得到第二特征图；

执行模块，用于将所述第一特征图和所述第二特征输入至预设的网络集成模型中进行处理，得到特征优化参数。

进一步地，所述获取模块包括：

第一获取子模块，用于对所述影像数据分别进行拉普拉斯变换、小波变换、图像强度平方、图像强度平方根、对数变换、指数变换、梯度变换和局部二值模式变换；

第一处理子模块，用于将所述影像数据以及经每个变换方法处理得到的影像数据作为所述多通道数据。

进一步地，所述处理模块包括：

第二处理子模块，用于利用预设的权重计算方法计算所述特征图中特征的权重；

第三处理子模块，用于采用预设的正则化特征权重分配机制计算包含权重的特征图；

第一执行子模块，用于利用注意力机制将每个通道中包含权重的特征图进行融合，得到第一特征图。

进一步地，所述处理模块包括：

第四处理子模块，用于将所述深度组学参数作为不同数据集与预设的数据集进行混合；

第五处理子模块，用于以所述影像数据中组内稳定参数最多的中心与设备数据集作为参考数据集；

第六执行子模块，用于以所述参考数据集为标准利用预设的ComBat算法对混合后得到的数据集进行调整得到所述第二特征图。

进一步地，所述执行模块包括：

第六处理子模块，用于将所述第一特征图和所述第二特征图输入至预设的MOE双网络集成模型中输出已处理的特征图；

第七处理子模块，用于将已处理的特征图输入至预设的解码器得到所述特征优化参数。

为解决上述问题本发明实施例提供一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行上述影像数据处理方法的步骤。

为解决上述问题本发明实施例提供一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述影像数据处理方法的步骤。

本发明实施例的有益效果是：本发明实施例通过从方法框架、影像组学与深度学习方法融合、深度影像组学特征提取与筛选、混合专家模型等角度进行综合，提高真实复杂场景下医学图像分割模型的泛化性能。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的影像数据处理方法的流程示意图；

图2为本发明实施例提供的对影像数据进行预处理得到多通道数据方法的流程示意图；

[根据细则26改正07.06.2021]　
图3为本发明实施例提供的根据所述深度组学参数得到包含特征权重的特征图，并对每个通道中包含权重的特征图进行融合，得到第一特征图的方法的流程示意图；

图4为本发明实施例提供的利用预设的批次效应去除算法调整每个通道中所述特征图的深度组学参数，得到第二特征图方法的流程示意图；

图5为本发明实施例提供的影像数据处理装置基本结构框图；

图6为本发明实施例提供的计算机设备基本结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

在本发明的说明书和权利要求书及上述附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如101、102等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。需要说明的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二”是不同的类型。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参照图1，图1为本发明实施例提供一种影像数据处理方法，如图1所示，该方法具体包括如下步骤：

S110、获取待处理的影像数据，对所述影像数据进行预处理得到多通道数据，并将所述多通道数据输入至预训练编码器得到多个通道的特征图；

本发明实施例中，多通道数据为影响数据经多种处理方法处理后得到的多种表达形式。其中，影像数据包括医学数据，例如CT图像，超声图像等，应用于多中心多设备条件下的肺结节分割问题。

S120、提取每个所述特征图的深度组学参数，根据所述深度组学参数得到包含特征权重的特征图，并对每个通道中包含权重的特征图进行融合，得到第一特征图；

本实施例中，通过预训练模型提取图像的深度组学参数。深度学习可以分为两部分，分别为编码器和解码器。编码器主要负责提取图像的深度特征，编码器是一连串的卷积神经网络，该网络主要由卷积层、池化层和激活层组成。它主要对图像的低级局域像素值进行归类和分析，从而获得高阶语义信息。解码器是为了实现固定的任务(包括分类、分割、识别等)，它收集编码器的语义，进行理解和编译，对相同语义相近的像素进行分类，从而完成分割任务。因此，用公开的、相近的数据集训练某个任务的深度学习模型，在模型效果较好的情况下，保留训练好模型中的权重参数，把其中的解码器作为我们的预训练模型，去提取图像的深度组学参数。如此可以在不需要重新训练模型的情况下，以及在训练数据较少的情况下，能够保证以相同的规则提取不同图像的特征参数，也使得提取的参数更加的稳定。

预训练模型主要由卷积层、激活函数层和池化层组成。并参照了DenseNet的思想，在ResNet的基础上做了进一步改进，不是将前层特征只传递给下一层，而是将特征进行多层复用，传递给后面的每一层输入，如此会使得模型更加紧凑，由于网络中任何一层输出的特征图谱，都能够在后面所有的网络层访问。这使得各个网络层捕获的特征都能够被充分复用，因此网络非常紧凑，参数数量往往也更少；其次，会隐含深度监督，由于模型种含有较多的快捷连接，使得网络中各个层都能独立的接收损失函数的梯度传到，这就是“深度监督”方式；再次，随机的深度和连接。在模型内部，任意一个网络层与后面所有网络层都有直接的连接，使得两个不同的模块中的网络层隔着转换层连接在一起的情况成为可能。

S130、将利用预设的批次效应去除算法调整每个通道中所述特征图的深度组学参数，得到第二特征图；

S140、将所述第一特征图和所述第二特征输入至预设的网络集成模型中进行处理，得到特征优化参数。

本发明实施例提供的影像数据处理方法中，针对最成熟的肺癌CT影像分割模型进行多中心问题的探讨，从方法框架、影像组学与深度学习方法融合、深度影像组学特征提取与筛选、混合专家模型等角度进行系统的研究，提高真实复杂场景下肺癌分割模型的泛化性能。

如图2所示，本发明实施例提供一种对影像数据进行预处理得到多通道数据的方法，包括：

S111、对所述影像数据分别进行拉普拉斯变换、小波变换、图像强度平方、图像强度平方根、对数变换、指数变换、梯度变换和局部二值模式变换；

S112、将所述影像数据以及经每个变换方法处理得到的影像数据作为所述多通道数据。

本发明实施例中，采用Resnet-Unet结构作为基础网络，利用LUNA16的数据集训练出Resnet的预训练模型，然后对预实验中的体模影像数据进行拉普拉斯变换、小波变换、图像强度平方、图像强度平方根、对数变换、指数变换、梯度变换和局部二值模式等变换，将这样9个通道的数据分别进入预训练模型，得到9*4个不同尺度的特征图，4个特征图分别为1/4、1/8、1/16、1/32尺寸，通道数分别为64、128、256、512。

具体地，通过滤波器或数学变换，如下公式所示，将原图像转换为新的变换影像，输入由原来的单一的原图增加到若干种包含原图部分特征的变换图像，从而增加了输入的多样性。在预实验中我们也发现图像经过不同的变换，其深度组学参数在不同的变换图像中稳定性分布是具有较大差异的。换句话说，每一种变换都是独立的信息表达维度，这可以将原来的一维表达方式扩展为9种不同的表达方式或者称之为9个不同的通道。

高斯拉普拉斯变化。x,y,z分别为三个坐标轴值，σ为标准差。

小波变化。a>0，成为尺度因子，作用是对基本小波

函数做伸缩，τ反映位移。

图像强度平方。x和f(x)分别是原图和滤波后的图像强度。

f(x)＝(cx) ²,其中

图像强度平方根。x和f(x)分别是原图和滤波后的图像强度。

对数变换。x和f(x)分别是原图和滤波后的图像强度。

指数变换。x和f(x)分别是原图和滤波后的图像强度。

梯度变换。f为图像的像素矩阵。

局部二值模式。(x _c,y _c)为中心像素，亮度为i _c，i _p为相邻像素的差，s(x)就是计算相邻位置像素与中间位置像素的差值，p为该中间像素依据的邻近像素的个数。

如图3所示，本发明实施例还提供一种根据所述深度组学参数得到包含特征权重的特征图，并对每个通道中包含权重的特征图进行融合，得到第一特征图的方法，具体包括：

S121、利用预设的权重计算方法计算所述特征图中特征的权重；

S122、采用预设的正则化特征权重分配机制计算包含权重的特征图；

S123、利用注意力机制将每个通道中包含权重的特征图进行融合，得到第一特征图。

筛选稳定的深度组学参数并应用到网络的后期计算中是提升模型整体泛化性的有效途径。本发明提出将稳定的影像组学参数通过L1正则化的方式返回至模型并加以利用。

通过对前期的多中心体模数据进行深度组学参数提取，再利用ICC及CCC等统计公式去选择更加关注、更加稳定的深度特征。L1正则化是机器学习中一种常用的技术，其主要目的是控制模型复杂度，减小过拟合。最基本的正则化方法是在原目标函数中添加惩罚项，对复杂度高的模型进行“惩罚”，如以下公式所示。它在限制模型复杂度的同时，保证了模型的稀疏性，使模型倾向于更重要的特征。所谓稀疏性，就是希望模型中大部分的元素都是0。因为影响预测结果的因素由很多，但是其中一部分的特征对输出是完全没有影响的，在最小化目标函数的时候虽然加入这些特征会降低训练误差，但是实际应用这些无效的特征信息会干扰输出的正确预测，所以我们引入稀疏将这些特征的权重置为0，从而起到选择有效特征的作用。同时它对噪声的输入几乎是不变的，从而保证了模型的鲁棒性。

J(θ；X；y)＝L _emp(θ；X；y)+αΩ(θ)

Ω(θ)＝||ω|| ₁

式中X、y训练样本和相应标签，ω为权重系数向量；J()为目标函数，Ω(ω)即为惩罚项，可理解为模型“规模”的某种度量；参数α控制控制正则化强弱。不同的Ω函数对权重ω的最优解有不同的偏好，因而会产生不同的正则化效果。

多通道多维度的特征表示可以大大增加模型的性能，但是同时也会变相增加一些噪声和冗余，因此在模型设计的时候将注意力机制加入了特征融合步骤，利用注意力机制以确定下游网络与输入的多个表示的相关性。最终，我们将多通道的特征经过加权之后得到一个组合的深度特征，如公式所示。

式中w _i是各个通道的权重系数，F _i为每一个通道输出的特征，F为最终的组合特征。

本发明实施例将深度组学参数进行ICC及CCC的计算，利用计算结果及其值的占比计算出每个特征的权重，之后运用L1正则化的特征权重分配机制计算出新的带权重的9*4个特征图。将9*4个特征图融合为4个特征图，也就是将9个不同输入的通道进行特征融合，但是为了Unet特有的跳跃连接、融合，这里需要融合4次，分别处理4个阶段的特征图。此部分包括两个操作，一个是对9个特征图进行加权ADD操作，得到1*C的特征图F-sum；第二个是对9个特征图进行Concat操作，然后计算通道注意力权重、通道注意力特征图，然后将9*C的特征图降采样到1*C特征图F-Cat。最后将F-sum和F-cat两个特征图Cat起来，进行降维到1*C的特征图。

本发明实施例中，U-Net已经被证明是具有高鲁棒的深度分割模型，它广泛应用于各类医疗影像的分割任务，取得了良好的效果。这也是我们选择它作为我们的模型的原因。它主要由卷积层、四个池化层、四个上采样层以及激活函数等组成，其中最大的特色是将在上采样的过程中会丢失部分语义特征，通过拼接的方式，可以恢复部分的语义信息，从而保证分割的精度，并且过程中不会引入额外的模型参数。

同时，在原来的基础上，对U-Net做了以下几点的改进：1)使用空洞卷积。空洞卷积可以在不增加任何参数的情况下，增大卷积的感受野，同时不降低图像的分辨率，从而精确定位目标；2)采用了 ResNet思想。随着模型的加深和大参数量，使得深层网络出现退化。ResNet在不增加参数量的情况下，通过恒等变换，使得深层网络参数得以优化，保证了模型的精度。3)采用SPP(Spatial Pyramid Pooling)替代原来单一的输入大小。对所给定的输入以不同采样率的卷积并行采样，相当于以多个比例捕捉图像的上下文。同时使得任意大小的特征图都能够转换成固定大小的特征向量，提高了模型的鲁棒性和精度。

如图4所示，本发明实施例还提供一种利用预设的批次效应去除算法调整每个通道中所述特征图的深度组学参数，得到第二特征图的方法，具体方法包括：

S141、将所述深度组学参数作为不同数据集与预设的数据集进行混合；

S142、以所述影像数据中组内稳定参数最多的中心与设备数据集作为参考数据集；

S143、以所述参考数据集为标准利用预设的ComBat算法对混合后得到的数据集进行调整得到所述第二特征图。

本发明实施例采用基于深度影像组学稳定性分析加上L1正则化可能会出现重要深度特征由于不稳定而被丢弃的情况，因此为了应对这种情况构建了第二种网络模型，区别于上述第一种网络模型这里采用的是改进的批次效应去除算法(ComBat)。

ComBat其实质是一种基于经验贝叶斯方法的去除批量效应方法，对于每个深度组学参数的表示如下述公式所示：

x _ijg＝α _i+Xβ _i+γ _ig+δ _igε _ijg

式中x _ijg为单个中心单个设备数据集g、病人j、深度影像组学i的值。α _i为深度影像组学的平均值；X为中心与设备参数的设计矩阵；β _i为对应X矩阵的回归系数的向量，ε _ijg为误差项假设服从正态分布； γ _ig和δ _ig为数据集g中深度组学参数i加性和乘性批次效应。深度影像组学数据标准化公式如以下公式所示：

最终的批次效应调整数据如下述公式所示：

改进的ComBat算法主要是将原始算法中总体样本的平均值和方差转换为参考数据集中影像组学参数的平均值和方差。通过改变整体水平的参数估计值

和

为参考数据集水平的参数

及

进行调整。其改进后的数据调整公式，如以下公式：

式中g＝r为参考数据集，与改进前相比将批次效应调整公式中数据整体的均值和方差调整为参考数据集的均值和方差，调整后的数据与参考数据集分布最大程度重叠，这也解释了我们选择体模数据中组内稳定参数最多的中心与设备数据集作为参考数据集的原因。

本发明实施例还提供一种将第一特征图和第二特征输入至预设的网络集成模型中进行处理，得到特征优化参数的方法，该方法包括：

将已处理的特征图输入至预设的解码器得到所述特征优化参数。

本发明实施例中，首先输入两个模型的第一特征图和第二特征图至MoE模型。设定MoE模型超参数和参数初值包含：底层模型数量、RMSProp算法参数、小批量随机梯度下降的批量书和正则化系数等；判断当前参数为当前迭代步下的模型参数，若为迭代的第一步则为模型参数初值，否则为经过上一步RMSProp算法更新过后的模型参数；在EM算法的E步，计算Q函数，其是关于模型参数和当前迭代步模型参数的函数；在得到最终的目标优化函数值后判断其是否收敛，若已收敛，则输出当前模型参数，否则进入EM算法的M步；在EM算法的M步，将最终目标优化函数分别对所有参数求偏微分，然后用RMSProp算法更新当前参数，回到判断当前参数为当前迭代步下的模型参数这一步。MoE模型输出集成后的特征图，当实现跳跃连接和上采样的解码器部分，我们预采用的是维度分别是(倒序：从最大特征图开始向下的维度)[64,96,128,256,512]。上采样部分为了加快计算采用的是双线性插值的方法。最后利用前期研究中的真实病人数据对模型进行训练与验证。

需要说明的是，MOE双网络集成模型可以将多个模型进行结合来解决复杂问题，每个模型被称为专家，能在特定条件下解决自己擅长的问题，因而也会在这样的条件下获得更高的权重。最初的混合专家模型主要采用最大似然和梯度上升的方法进行训练，为了提升模型的收敛速度基于期望极大算法的MoE模型被提出。

本发明实施例主要采用单层的混合专家模型架构，用f _j来表示我们使用的基于深度组学参数稳定性分析的网络和基于深度参数稳定性优化的网络，对于给定的输入x，每个网络都能独立的给各自的输出：u _j＝f _j(x)。将调控各专家模型权重的网络称为门控网络，在建模时，假设门控网络是广义线性的。由此定义中间变量：

其中υ _j是一个权重向量，则门控网络的第j个输出是ξ _j的“softmax”函数如以下公式所示。

得到专家输出和门控网络后，最后模型的输出为个专家输出的加权和：u＝∑ _jg _ju _j。可以将混合专家系统看成是一个概率申城模型，即由输入生成输出y的总概率是来自每个组分密度生成y的概率的混合，其中呼和比例即门控网络中给出的值。设每个专家网络中的参数υ _j为门控网络中的参数，则总概率由下式生成：

P(y|x,θ)＝∑ _jg _j(x,v _j)P(y|x,θ _j)

其中θ包括专家模型参数θ _j以及门控网络参数v _j。

如图5所示，为了解决上述问题，本发明实施例还提供一种影像数据处理装置，包括：取模块2100、处理模块2200和执行模块2300，其中，获取模块2100，用于获取待处理的影像数据，对所述影像数据进行预处理得到多通道数据，并将所述多通道数据输入至预训练编码器得到多个通道的特征图；处理模块2200，用于提取每个所述特征图的深度组学参数，根据所述深度组学参数得到包含特征权重的特征图，并对每个通道中包含权重的特征图进行融合，得到第一特征图；处理模块2200，还用于将利用预设的批次效应去除算法调整每个通道中所述特征图的深度组学参数，得到第二特征图；执行模块2300，用于将所述第一特征图和所述第二特征输入至预设的网络集成模型中进行处理，得到特征优化参数。

本发明实施例针对最成熟的肺癌CT影像分割模型进行多中心问题的探讨，从方法框架、影像组学与深度学习方法融合、深度影像组学特征提取与筛选、混合专家模型等角度进行系统的研究，提高真实复杂场景下肺癌分割模型的泛化性能。

在一些实施例中，所述获取模块2100包括：第一获取子模块，用于对所述影像数据分别进行拉普拉斯变换、小波变换、图像强度平方、图像强度平方根、对数变换、指数变换、梯度变换和局部二值模式变换；第一处理子模块，用于将所述影像数据以及经每个变换方法处理得到的影像数据作为所述多通道数据。

在一些实施例中，所述处理模块2200包括：第二处理子模块，用于利用预设的权重计算方法计算所述特征图中特征的权重；第三处理子模块，用于采用预设的正则化特征权重分配机制计算包含权重的特征图；第一执行子模块，用于利用注意力机制将每个通道中包含权重的特征图进行融合，得到第一特征图。

在一些实施例中，所述处理模块2200包括：第四处理子模块，用于将所述深度组学参数作为不同数据集与预设的数据集进行混合；第五处理子模块，用于以所述影像数据中组内稳定参数最多的中心与设备数据集作为参考数据集；第六执行子模块，用于以所述参考数据集为标准利用预设的ComBat算法对混合后得到的数据集进行调整得到所述第二特征图。

在一些实施例中，所述执行模块2300包括：第六处理子模块，用于将所述第一特征图和所述第二特征图输入至预设的MOE双网络集成模型中输出已处理的特征图；第七处理子模块，用于将已处理的特征图输入至预设的解码器得到所述特征优化参数。

为解决上述技术问题，本发明实施例还提供计算机设备。具体请参阅图6，图6为本实施例计算机设备基本结构框图。

如图6所示，计算机设备的内部结构示意图。如图6所示，该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中，该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令，数据库中可存储有控件信息序列，该计算机可读指令被处理器执行时，可使得处理器实现一种图像处理方法。该计算机设备的处理器用于提供计算和控制能力，支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行一种图像处理方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

本实施方式中处理器用于执行图5中获取模块2100、处理模块2200和执行模块2300的具体内容，存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有图像处理方法中执行所有子模块所需的程序代码及数据，服务器能够调用服务器的程序代码及数据执行所有子模块的功能。

本发明实施例提供的计算机设备，其中的参考特征图是对参考池中的高清图像集进行特征提取得到的，由于高清图像集中图像的多样化，参考特征图中包含了所有可能用到的局部特征，可以为每一张低分辨率图像提供高频纹理信息不仅保证了特征的丰富性，还可以减轻了内存负担。此外，根据低分辨率图像来搜索参考特征图，选择的参考特征图可以自适应的屏蔽或增强多种不同的特征，使低分辨率图像的细节更加丰富。

本发明还提供一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述任一实施例所述图像处理方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述仅是本发明的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

一种影像数据处理方法，其特征在于，包括：

获取待处理的影像数据，对所述影像数据进行预处理得到多通道数据，并将所述多通道数据输入至预训练编码器得到多个通道的特征图；

提取每个所述特征图的深度组学参数，根据所述深度组学参数得到包含特征权重的特征图，并对每个通道中包含权重的特征图进行融合，得到第一特征图；

将利用预设的批次效应去除算法调整每个通道中所述特征图的深度组学参数，得到第二特征图；

将所述第一特征图和所述第二特征输入至预设的网络集成模型中进行处理，得到特征优化参数。
根据权利要求1所述的影像数据处理方法，其特征在于，所述对所述影像数据进行预处理得到多通道数据，包括：

对所述影像数据分别进行拉普拉斯变换、小波变换、图像强度平方、图像强度平方根、对数变换、指数变换、梯度变换和局部二值模式变换；

将所述影像数据以及经每个变换方法处理得到的影像数据作为所述多通道数据。
根据权利要求1所述的影像数据处理方法，其特征在于，所述根据所述深度组学参数得到包含特征权重的特征图，并对每个通道中包含权重的特征图进行融合，得到第一特征图，包括：

利用预设的权重计算方法计算所述特征图中特征的权重；

采用预设的正则化特征权重分配机制计算包含权重的特征图；

利用注意力机制将每个通道中包含权重的特征图进行融合，得到第一特征图。
根据权利要求1所述的影像数据处理方法，其特征在于，所述利用预设的批次效应去除算法调整每个通道中所述特征图的深度组学参数，得到第二特征图，包括：

将所述深度组学参数作为不同数据集与预设的数据集进行混合；

以所述影像数据中组内稳定参数最多的中心与设备数据集作为参考数据集；

以所述参考数据集为标准利用预设的ComBat算法对混合后得到的数据集进行调整得到所述第二特征图。
根据权利要求1所述的影像数据处理方法，其特征在于，所述将所述第一特征图和所述第二特征输入至预设的网络集成模型中进行处理，得到特征优化参数，包括：

将所述第一特征图和所述第二特征图输入至预设的MOE双网络集成模型中输出已处理的特征图；

将已处理的特征图输入至预设的解码器得到所述特征优化参数。
一种影像数据处理装置，其特征在于，包括：

获取模块，用于获取待处理的影像数据，对所述影像数据进行预处理得到多通道数据，并将所述多通道数据输入至预训练编码器得到多个通道的特征图；

处理模块，用于提取每个所述特征图的深度组学参数，根据所述深度组学参数得到包含特征权重的特征图，并对每个通道中包含权重的特征图进行融合，得到第一特征图；

所述处理模块，还用于将利用预设的批次效应去除算法调整每个通道中所述特征图的深度组学参数，得到第二特征图；

执行模块，用于将所述第一特征图和所述第二特征输入至预设的网络集成模型中进行处理，得到特征优化参数。
根据权利要求6所述的影像数据处理装置，其特征在于，所述获取模块包括：

第一获取子模块，用于对所述影像数据分别进行拉普拉斯变换、小波变换、图像强度平方、图像强度平方根、对数变换、指数变换、梯度变换和局部二值模式变换；

第一处理子模块，用于将所述影像数据以及经每个变换方法处理得到的影像数据作为所述多通道数据。
根据权利要求6所述的影像数据处理装置，其特征在于，所述处理模块包括：

第二处理子模块，用于利用预设的权重计算方法计算所述特征图中特征的权重；

第三处理子模块，用于采用预设的正则化特征权重分配机制计算包含权重的特征图；

第一执行子模块，用于利用注意力机制将每个通道中包含权重的特征图进行融合，得到第一特征图。
一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如权利要求1至5中任一项权利要求所述影像数据处理方法的步骤。
一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如权利要求1至5中任一项权利要求所述影像数据处理方法的步骤。