CN112634255B

CN112634255B - 脑部病灶检测模型的建立方法、装置以及计算机设备

Info

Publication number: CN112634255B
Application number: CN202011614591.3A
Authority: CN
Inventors: 徐枫; 刘傲寒; 娄昕; 郭雨晨; 吕晋浩; 雍俊海; 戴琼海
Original assignee: Tsinghua University; Chinese PLA General Hospital
Current assignee: Tsinghua University; Chinese PLA General Hospital
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2022-12-02
Anticipated expiration: 2040-12-30
Also published as: CN112634255A

Abstract

本申请提出一种脑部病灶检测模型的建立方法、装置、计算机设备和存储介质。其中，方法通过使用小规模的标注数据，采用协同训练的方式同时训练一个自然语言处理NLP模型和一个卷积模型，在每一次迭代中，利用NLP模型和卷积模型从剩余未标注数据集中选择部分数据更新到训练集，继续训练，进而将完成训练的卷积模型作为脑部病灶检测模型。由此通过利用配对的CT影像与报告中的文本信息，进行协同训练，以实现脑部CT病灶的自动检测的方法；在模块训练时，只需要少量数据标注，便可以对大规模数据进行训练，大大节省了深度学习过程中的数据标注工作量。

Description

脑部病灶检测模型的建立方法、装置以及计算机设备

技术领域

本申请属于深度学习、计算机视觉以及自然语言处理领域，尤其涉及一种脑部病灶检测模型的建立方法、装置、计算机设备和计算机可读存储介质。

背景技术

医学影像如CT(Computed Tomography，电子计算机断层扫描)、MRI(MagneticResonance Imaging，磁共振成像)等已经成为临床诊断的重要工具，但人工诊断依赖于经验丰富的医师，人力成本高。近年来，基于深度学习等人工智能方法的医学影像自动诊断方法发展迅速。卷积神经网络等计算机视觉方法可以高效且准确地对医学图像进行分类、病灶检测。在自然语言处理领域中，序列模型等方法可以高效地完成文本分类等任务，使得对病历与影像描述等医学文本的处理成为可能。然而，深度学习的训练需要大量标注数据。医学领域的数据标注工作相较于自然图像，对标注者有很高的专业要求，大量的数据标注工作成本很高。

发明内容

本申请的目的旨在至少在一定程度上解决上述的技术问题之一。

为此，本申请的第一个目的在于提出一种脑部病灶检测模型的建立方法，以实现只需要少量数据标注，便可以对大规模数据进行训练，大大节省了脑部病灶检测模型训练过程中的数据标注工作量。

本申请的第二个目的在于提出一种脑部病灶检测模型的建立装置。

本申请的第三个目的在于提出一种电子设备。

本申请的第四个目的在于提出一种非临时性计算机可读存储介质。

为达上述目的，本申请第一方面实施例提出了一种脑部病灶检测模型的建立方法，包括：

获取多个脑部CT影像样本以及与每个脑部CT影像样本对应的影像描述文本；

根据多个脑部CT影像样本生成平均脑部CT影像，并对所述平均脑部CT影像中的各区域进行分割标注；

从所述多个脑部CT影像样本中获取至少部分脑部CT影像样本，并基于所述平均脑部CT影像中各区域的分割标注，为所述至少部分脑部CT影像样本及其对应的影像描述文本标注所述至少部分脑部CT影像样本中每个区域有无病灶，得到训练集；

基于所述训练集之中的脑部CT影像样本、分割标注以及每个区域有无病灶标注，生成用于训练卷积模型的三维训练数据；

根据所述三维训练数据对所述卷积模型进行训练，并根据所述训练集之中所述至少部分脑部CT影像样本对应的影像描述文本及其标注训练自然语言处理NLP模型；

在每一次迭代中，根据所述卷积模型和所述NLP模型从剩余未标注数据集选择置信度高的数据更新至所述训练集，基于更新后的所述训练集继续对所述卷积模型和所述NLP模型进行训练；

将完成训练的卷积模型作为所述脑部病灶检测模型。

本申请实施例的方法，，解决现有技术中的技术问题。

为达上述目的，本申请第二方面实施例提出了一种脑部病灶检测模型的建立装置，包括：

第一获取模块，用于获取多个脑部CT影像样本以及与每个脑部CT影像样本对应的影像描述文本；

区域分割标注模块，用于根据多个脑部CT影像样本生成平均脑部CT影像，并对所述平均脑部CT影像中的各区域进行分割标注；

训练集获取模块，用于从所述多个脑部CT影像样本中获取至少部分脑部CT影像样本，并基于所述平均脑部CT影像中各区域的分割标注，为所述至少部分脑部CT影像样本及其对应的影像描述文本标注所述至少部分脑部CT影像样本中每个区域有无病灶，得到训练集；

生成模块，用于基于所述训练集之中的脑部CT影像样本、分割标注以及每个区域有无病灶标注，生成用于训练卷积模型的三维训练数据；

训练模块，用于根据所述三维训练数据对所述卷积模型进行训练，并根据所述训练集之中所述至少部分脑部CT影像样本对应的影像描述文本及其标注训练自然语言处理NLP模型；

所述训练模块，还用于在每一次迭代中，根据所述卷积模型和所述NLP模型从剩余未标注数据集选择置信度高的数据更新至所述训练集，基于更新后的所述训练集继续对所述卷积模型和所述NLP模型进行训练；

确定模块，用于将完成训练的卷积模型作为所述脑部病灶检测模型。

为达上述目的，本申请第三方面实施例提出了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现本申请第一方面实施例所述的脑部病灶检测模型的建立方法。

为达上述目的，本申请第四方面实施例提出了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本申请第一方面实施例所述的脑部病灶检测模型的建立方法。

根据本申请实施例的技术方案，综合利用了CT影像与文本描述两种模态的信息，只需要少量的启动数据标注，便可以利用大规模未标注数据进行协同训练，得到CT影像的异常检测模型。大大提高了对日常医学工作生成的大量无标注影像与文本数据的利用率，减少了标注的工作量。需要说明的是，本工作中的医学影像不仅局限于脑部CT影像，还可迁移至身体其他部位、其他模态的医学影像，如MRI等。

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本申请实施例所提供的一种脑部病灶检测模型的建立方法的流程示意图；

图2是根据本申请实施例的脑部病灶检测模型的具体训练过程的示意图；

图3是根据本申请实施例的平均CT图像与区域分割示意图；

图4是根据本申请一个实施例的脑部病灶检测模型的建立装置的结构框图；

图5是根据本申请另一个实施例的脑部病灶检测模型的建立装置的结构框图；

图6是根据本申请一个实施例的计算机设备的结构框图；

图7是根据本申请实施例的输入数据的示例图；

图8是根据本申请实施例的卷积模型训练数据生成方法的示例图；

图9是根据本申请实施例的卷积模型的网络结构示意图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的脑部病灶检测模型的建立方法、装置、计算机设备和存储介质。

图1为本申请实施例所提供的一种脑部病灶检测模型的建立方法的流程示意图。需要说明的是，本申请实施例的脑部病灶检测模型的建立方法可应用于本申请实施例的脑部病灶检测模型的建立装置，该建立装置可被配置于计算机设备。如图1所示，该脑部病灶检测模型的建立方法可以包括如下步骤。

在步骤101中，获取多个脑部CT影像样本以及与每个脑部CT影像样本对应的影像描述文本。

在步骤102中，根据多个脑部CT影像样本生成平均脑部CT影像，并对平均脑部CT影像中的各区域进行分割标注。

在步骤103中，从多个脑部CT影像样本中获取至少部分脑部CT影像样本，并基于平均脑部CT影像中各区域的分割标注，为至少部分脑部CT影像样本及其对应的影像描述文本标注至少部分脑部CT影像样本中每个区域有无病灶，得到训练集。

其中，在本申请实施例中，术语“至少部分”的含义是其中一部分或者所有，例如，可从多个脑部CT影像样本中获取其中一部分脑部CT影像样本，或者，可将多个脑部CT影像样本中全部样本作为训练样本。作为一种示例，本申请可从多个脑部CT影像样本中获取其中一部分脑部CT影像样本，这样，可基于平均脑部CT影像中各区域的分割标注，为所述其中一部分脑部CT影像样本及其对应的影像描述文本，标注所述其中一部分脑部CT影像样本中每个区域有无病灶，得到训练集。

在步骤104中，基于训练集之中的脑部CT影像样本、分割标注以及每个区域有无病灶标注，生成用于训练卷积模型的三维训练数据。

在一些实施例中，可基于训练集之中已有的平均脑部CT影像及其上的分割标注，由平均脑部CT影像三维配准到训练图像得到三维变换，并基于该三维变换将平均脑部CT影像上的分割标注变换到训练图像上，得到用于训练卷积模型的三维训练数据。

在步骤105中，根据三维训练数据对卷积模型进行训练，并根据训练集之中至少部分脑部CT影像样本对应的影像描述文本及其标注训练自然语言处理NLP模型。

在步骤106中，在每一次迭代中，根据卷积模型和NLP模型从剩余未标注数据集选择置信度高的数据更新至训练集，基于更新后的训练集继续对卷积模型和NLP模型进行训练。

在步骤107中，将完成训练的卷积模型作为脑部病灶检测模型。

需要说明的是，本申请实施例的目的是使用小规模的人工标注数据，结合大规模的已有脑部CT影像与对应影像描述，训练得到一个识别脑部CT图像中病灶的卷积模型，该完成训练的卷积模型即可作为所述脑部病灶检测模型。为了实现这一目的，需要使用协同训练的方式同时训练一个NLP模型与一个卷积模型。为了充分利用影像描述中的信息，本申请实施例将脑部按医学方法分成若干区域(如左额叶、右额叶等)。NLP模型的输入是对CT影像的描述(文本序列)，输出每个脑部区域有异常(病灶)的概率。卷积模型的输入是三维CT影像，输出每个脑部区域有异常的概率。两个模型首先使用小规模标注数据进行训练，然后使用协同训练方法，在每一次迭代中，从大规模未标注数据中选择置信度高的数据加入训练集，继续训练。最后得到高准确率的NLP模型与卷积模型。

还需要说明的是，本申请中的小规模标注数据只需标注每个脑部区域有无异常，而无需对异常的具体位置、分割等进行标注。为了生成可供卷积模型使用的训练数据，仅需对一例平均脑部CT影像(由大量脑部CT数据配准平均得到)进行每个区域的分割标注，然后使用图像配准与变换，由平均影像的区域分割生成每一例影像上的区域分割。卷积模型根据影像中的区域分割与有无异常的信息，使用多示例学习(Multi-Instance Learning,简称：MIL)的方法进行训练。

举例而言，本申请实施例中涉及的数据包括脑部CT图像与影像描述的文本数据，例子见图7所示，其中，如图7中的图中只显示了一层CT数据，实际为三维数据。如图2所示，本申请实施例的脑部病灶检测模型的具体训练过程可包括以下步骤：

在步骤201中，获取多个脑部CT影像样本以及与每个脑部CT影像样本对应的影像描述文本。

在步骤202中，根据多个脑部CT影像样本生成平均脑部CT影像，并对平均脑部CT影像中的各区域进行分割标注。

在一些实施例中，将脑部划分为不同的区域，包括左右额叶、左右顶叶、左右枕叶、左右颞叶、左右基底节区、左右半卵圆中心、左右小脑、左右侧脑室旁、脑干共17个区域，具体区域的定义可以进一步扩充或精细化。首先使用一例CT影像I_R作为参考，将大量CT影像配准至I_R，并做平均，得到平均脑部CT影像，并将该平均脑部CT影像作为标准CT影像I_A。然后在标准CT影像I_A上为定义的各区域进行分割标注S，如图3所示，为平均CT图像与脑部区域分割标注的示例图。

举例而言，如图8所示，可先对多个脑部CT影像样本进行CT预处理。例如，可使用一例CT影像样本I_R作为参考，将大量CT影像样本配准至该参考图像样本I_R，对配准结果做平均操作，得到平均脑部CT影像，将该平均脑部CT影像作为标准CT影像I_A，对该标准CT影像I_A上进行脑区分割标注，以便为后续生成用于训练卷积模型的训练数据提供依据。

在步骤203中，从多个脑部CT影像样本中获取至少部分脑部CT影像样本，并基于平均脑部CT影像中各区域的分割标注，为至少部分脑部CT影像样本及其对应的影像描述文本标注至少部分脑部CT影像样本中每个区域有无病灶，得到训练集。

也就是说，可为少量脑部CT影像与对应影像描述，标注每个区域有无异常(病灶)，得到训练集。

在步骤204中，从剩余未标注数据集中选择一部分更新至候选池。

可选地，随机从未标注数据中选择候选池U'。使用候选池U'的目的在于：协同训练的每一次迭代中将从较小的数据集中选择数据加入到训练集，可以迫使模型关注困难的样本，提高模型的效果。

在步骤205中，基于训练集之中的脑部CT影像样本、分割标注以及每个区域有无病灶标注，生成用于训练卷积模型的三维训练数据。

在步骤206中，基于训练集之中已有的平均脑部CT影像及其上的分割标注，由平均脑部CT影像三维配准到训练图像得到三维变换。

在步骤207中，基于三维变换将平均脑部CT影像上的分割标注变换到训练图像上，得到用于训练卷积模型(又称为CT模型)的三维训练数据。

例如，如图8所示的CT模型训练数据生成，可根据训练集之中已有的平均脑部CT影像I_A及其上的分割标注S，由平均脑部CT影像I_A三维配准到训练图像I得到三维变换T，使用三维变换T将分割标注S同样变换到训练图像I，即得到训练图像上的区域分割，将得到的数据作为用于训练卷积模型的三维训练数据。

在步骤208中，基于多示例学习方法，根据三维训练数据对卷积模型进行训练。

也就是说，可结合训练数据的区域分割和各区域有无异常的标注，可以得到训练图像上的若干区域包含异常，但某区域包含异常不代表其全为异常。因此，卷积模型使用多示例学习方法进行训练。在一些实施例中，卷积模型使用3D U-net结构，输出三维图像，同时预测每一个像素的所属区域与有无异常。每个区域的预测值为其中包含的所有像素的预测值的最大值，损失函数为每个区域的预测值与实际值交叉熵之和。

例如，如图9所示，为卷积模型(又称为CT模型)的网络结构示意图。其中，CT模型的输入图像三维大小为160*160*80，包含1通道CT图像与17个部位的分割标注。如图9所示，CT模型可以采用3D U-net结构，输出三维图像，同时预测每一个像素的所属区域与有无异常。每个区域的预测值为其中包含的所有像素的预测值的最大值，损失函数为每个区域的预测值与实际值交叉熵之和。

在步骤209中，根据训练集之中至少部分脑部CT影像样本对应的影像描述文本及其标注训练自然语言处理NLP模型。

在一些实施例中，NLP模型选用TextRNN(是一种利用RNN循环神经网络解决文本分类问题的模型)分类网络完成多分类任务，输入影像描述文本序列，输出各区域有异常的概率值。

在步骤210中，分别利用卷积模型和NLP模型对候选池中的数据进行预测，分别选择每个模型预测置信度最高的数据更新至训练集；

也就是说，可使用卷积模型与NLP模型对候选池U'中未标注数据进行预测，分别选择每个模型预测置信度最高的数据加入训练集，并返回执行步骤204，即从剩余未标注数据集U中随机选择数据补充到候选池U'，继续进行训练，直至满足训练的终止条件，已完成模型的训练。

在步骤211中，将完成训练的卷积模型作为脑部病灶检测模型。

综上所述，本申请实施例的脑部病灶检测模型的建立方法，综合利用了CT影像与文本描述两种模态的信息，只需要少量的启动数据标注，便可以利用大规模未标注数据进行协同训练，得到CT影像的异常检测模型。大大提高了对日常医学工作生成的大量无标注影像与文本数据的利用率，减少了标注的工作量。需要说明的是，本工作中的医学影像不仅局限于脑部CT影像，还可迁移至身体其他部位、其他模态的医学影像，如MRI等。

为了实现上述实施例，本申请还提出了一种脑部病灶检测模型的建立装置。

图4是根据本申请一个实施例的脑部病灶检测模型的建立装置的结构框图。如图4所示，该脑部病灶检测模型的建立装置400可以包括：第一获取模块401、区域分割标注模块402、训练集获取模块403、生成模块404、训练模块405和确定模块406。

具体地，第一获取模块401用于获取多个脑部CT影像样本以及与每个脑部CT影像样本对应的影像描述文本。

区域分割标注模块402用于根据多个脑部CT影像样本生成平均脑部CT影像，并对平均脑部CT影像中的各区域进行分割标注。

训练集获取模块403用于从多个脑部CT影像样本中获取至少部分脑部CT影像样本，并基于平均脑部CT影像中各区域的分割标注，为至少部分脑部CT影像样本及其对应的影像描述文本标注至少部分脑部CT影像样本中每个区域有无病灶，得到训练集。

生成模块404用于基于训练集之中的脑部CT影像样本、分割标注以及每个区域有无病灶标注，生成用于训练卷积模型的三维训练数据。在一些实施例中，生成模块404基于训练集之中已有的平均脑部CT影像及其上的分割标注，由平均脑部CT影像三维配准到训练图像得到三维变换；基于三维变换将平均脑部CT影像上的分割标注变换到训练图像上，得到用于训练卷积模型的三维训练数据。

训练模块405用于根据三维训练数据对卷积模型进行训练，并根据训练集之中至少部分脑部CT影像样本对应的影像描述文本及其标注训练自然语言处理NLP模型。

训练模块405还用于在每一次迭代中，根据卷积模型和NLP模型从剩余未标注数据集选择置信度高的数据更新至训练集，基于更新后的训练集继续对卷积模型和NLP模型进行训练。

确定模块406用于将完成训练的卷积模型作为脑部病灶检测模型。

在一些实施例中，如图5所示，该脑部病灶检测模型的建立装置500还可包括：选择模块507。选择模块507用于在基于训练集之中的脑部CT影像样本、分割标注以及每个区域有无病灶标注，生成用于训练卷积模型的三维训练数据之前，从剩余未标注数据集中选择一部分更新至候选池。其中，在本实施例中，训练模块具体505用于：分别利用卷积模型和NLP模型对候选池中的数据进行预测，分别选择每个模型预测置信度最高的数据更新至训练集。

其中，图5中501-506和图4中401-406具有相同功能和结构。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

为了实现上述实施例，本申请还提出一种计算机设备。

图6是根据本申请一个实施例的计算机设备的结构框图。如图6所示，该计算机设备600可以包括：存储器601、处理器602及存储在存储器601上并可在处理器602上运行的计算机程序603，处理器602执行程序603时，实现前述任一实施例所述的脑部病灶检测模型的建立方法。

为了实现上述实施例，本申请还提出了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前述任一实施例所述的脑部病灶检测模型的建立方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种脑部病灶检测模型的建立方法，其特征在于，包括：

将完成训练的卷积模型作为所述脑部病灶检测模型。

2.根据权利要求1所述的方法，其特征在于，在所述基于所述训练集之中的脑部CT影像样本、分割标注以及每个区域有无病灶标注，生成用于训练卷积模型的三维训练数据之前，所述方法还包括：

从剩余未标注数据集中选择一部分更新至候选池；

其中，所述在每一次迭代中，根据所述卷积模型和所述NLP模型从剩余未标注数据集选择置信度高的数据更新至所述训练集，基于更新后的所述训练集继续对所述卷积模型和所述NLP模型进行训练，包括：

分别利用所述卷积模型和所述NLP模型对所述候选池中的数据进行预测，分别选择每个模型预测置信度最高的数据更新至所述训练集；

返回执行所述从剩余未标注数据集中选择一部分更新至候选池的步骤。

3.根据权利要求1所述的方法，其特征在于，所述基于所述训练集之中的脑部CT影像样本、分割标注以及每个区域有无病灶标注，生成用于训练卷积模型的三维训练数据，包括：

基于所述训练集之中已有的平均脑部CT影像及其上的分割标注，由所述平均脑部CT影像三维配准到训练图像得到三维变换；

基于所述三维变换将所述平均脑部CT影像上的分割标注变换到所述训练图像上，得到所述用于训练卷积模型的三维训练数据。

4.根据权利要求1所述的方法，其特征在于，所述根据所述三维训练数据对所述卷积模型进行训练，包括：

基于多示例学习方法，根据所述三维训练数据对所述卷积模型进行训练。

5.根据权利要求1至4中任一项所述的方法，所述卷积模型由三维深度残差网络与级联U-Net网络结构构成。

6.一种脑部病灶检测模型的建立装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，还包括：

选择模块，用于在基于所述训练集之中的脑部CT影像样本、分割标注以及每个区域有无病灶标注，生成用于训练卷积模型的三维训练数据之前，从剩余未标注数据集中选择一部分更新至候选池；

其中，所述训练模块具体用于：分别利用所述卷积模型和所述NLP模型对所述候选池中的数据进行预测，分别选择每个模型预测置信度最高的数据更新至所述训练集。

8.根据权利要求6所述的装置，其特征在于，所述生成模块具体用于：

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时，实现如权利要求1至5中任一项所述的脑部病灶检测模型的建立方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至5中任一项所述的脑部病灶检测模型的建立方法。