CN115547481A

CN115547481A - 疾病辨别模型训练方法、装置及计算机可读存储介质

Info

Publication number: CN115547481A
Application number: CN202110724665.7A
Authority: CN
Inventors: 王育任
Original assignee: Fulian Precision Electronics Tianjin Co Ltd
Current assignee: Fulian Precision Electronics Tianjin Co Ltd
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2022-12-30
Also published as: US20220415504A1

Abstract

本申请提供一种疾病辨别模型训练方法、装置及计算机可读存储介质，该疾病辨别模型训练方法包括：建立疾病辨别模型，所述疾病辨别模型包括卷积神经网络和金字塔注意力机制，所述金字塔注意力机制设置在所述卷积神经网络的输出端；获取特征图样本总集，并将特征图样本总集划分为训练集和验证集；将所述训练集输入至所述疾病辨别模型，以根据所述训练集训练所述疾病辨别模型，并输出疾病信心值；根据所述验证集验证所述疾病辨别模型。能够基于不同规格的医学影像资料对疾病辨别模型进行训练，训练出的疾病辨别模型能够适应不同的医学影像并具有高识别率。

Description

疾病辨别模型训练方法、装置及计算机可读存储介质

技术领域

本申请涉及医学影像识别技术领域，尤其涉及一种疾病辨别模型训练方法、装置、设备及计算机可读存储介质。

背景技术

随着医疗技术的进步，医学影像技术已成为现代医疗诊治中不可或缺的手段。由于人工识别时容易忽略医学影像中不明显的疾病特征，因此使用人工智能进行医学影像识别正越来越普及。然而，目前通过人工智能进行医学影像识别仍存在精度低、适应性差等问题。

发明内容

有鉴于此，有必要提供一种疾病辨别模型训练方法、装置及计算机可读存储介质，能够训练出适应性高并具有高精度的疾病辨别模型。

第一方面，本申请一实施方式提供一种疾病辨别模型训练方法，包括：

建立疾病辨别模型，所述疾病辨别模型包括卷积神经网络和金字塔注意力机制，所述金字塔注意力机制设置在所述卷积神经网络的输出端；

获取特征图样本总集，并将特征图样本总集划分为训练集和验证集；

将所述训练集输入至所述疾病辨别模型，以根据所述训练集训练所述疾病辨别模型，并输出疾病信心值；

根据所述验证集验证所述疾病辨别模型。

在本申请其中一种可能实现方式中，所述获取特征图样本总集，包括：

获取预设数量的医学影像；以及

对获取到的预设数量的医学影像进行预处理，以获得所述特征图样本总集。

在本申请其中一种可能实现方式中，所述对获取到的预设数量的医学影像进行预处理，包括：

对医学影像进行重采样处理；

将重采样后的所述医学影像转换为RGB三维图像；

将所述RGB三维图像转换为所述医学影像特征图。

在本申请其中一种可能实现方式中，所述对获取到的预设数量的医学影像进行预处理，还包括：

将转换后的所述RGB三维图像做归一化处理；

将归一化处理之后的RGB三维图像进行影像增强处理，并转换为所述医学影像特征图。

在本申请其中一种可能实现方式中，所述建立疾病辨别模型包括：

选取所述卷积神经网络；

选取所述金字塔注意力机制；

判断是否需要使用所述金字塔注意力机制，若判断需要使用所述金字塔注意力机制，则由所述金字塔注意力机制输出所述疾病信心值。

在本申请其中一种可能实现方式中，若判断不需要使用所述金字塔注意力机制，则将所述卷积神经网络的输出结果输入至预设函数，以通过所述预设函数输出所述疾病信心值。

在本申请其中一种可能实现方式中，所述训练方法还包括：

判断所述疾病信心值是否高于阈值；

若高于所述阈值，则输出与所述疾病信心值对应的疾病名称。

第二方面，本申请一实施方式提供一种疾病辨别模型训练装置包括：

建立模块，用于建立疾病辨别模型，所述疾病辨别模型包括卷积神经网络和金字塔注意力机制，所述金字塔注意力机制设置在所述卷积神经网络的输出端；

获取模块，用以获取特征图样本总集，并将特征图样本总集划分为训练集和验证集；

训练模块，用于将所述训练集输入至所述疾病辨别模型，以根据所述训练集训练所述疾病辨别模型，并获取疾病信心值；

验证模块，用于根据所述验证集验证验证所述疾病辨别模型。

在本申请其中一种可能实现方式中，所述疾病辨别模型训练装置还包括图像预处理模块，所述图像预处理模块用于获取预设数量的医学影像，并对获取到的预设数量的医学影像进行预处理，以获得所述特征图样本总集；

其中，所述对获取到的预设数量的医学影像进行预处理，包括：

对医学影像进行重采样处理；

将重采样后的所述医学影像转换为RGB三维图像；

将所述RGB三维图像转换为所述医学影像特征图。

第三方面，本申请一实施方式提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现：

如第一方面所述的疾病辨别模型训练方法。

本申请实施方式提供的疾病辨别模型训练方法、装置及存储介质，能够基于不同规格的医学影像资料对疾病辨别模型进行训练，训练出的疾病辨别模型能够适应不同的医学影像并具有高识别率。

附图说明

图1为本申请一实施例提供的疾病辨别模型训练方法的流程示意图。

图2为本申请另一实施例提供的疾病辨别模型训练方法的流程示意图。

图3为本申请另一实施例提供的疾病辨别模型训练方法的流程示意图。

图4为本申请一实施例提供的疾病辨别模型训练装置的模块示意图。

图5为本申请另一实施例提供的疾病辨别模型训练装置的模块示意图。

主要元件符号说明

疾病辨别模型训练装置 10；10a

建立模块 100

获取模块 200

图像预处理模块 210

训练模块 300

验证模块 400

如下具体实施方式将结合上述附图进一步说明本申请。

具体实施方式

下面将结合本申请实施方式中的附图，对本申请实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本申请一部分实施方式，而不是全部的实施方式。

需要说明的是，本申请实施例中“至少一个”是指一个或者多个，多个是指两个或两个以上。除非另有定义，本文所使用的所有的技术和科学术语与属于本申请中的技术领域的技术人员通常理解的含义相同。本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请。

需要说明的是，本申请实施例中，“第一”、“第二”等词汇，仅用于区分描述的目的，而不能理解为指示或暗示相对重要性，也不能理解为指示或暗示顺序。限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请实施例的描述中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

基于本申请中的实施方式，本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施方式，都是属于本申请保护的范围。

下面结合附图，对申请的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

图1是本申请一实施例提供的疾病辨别模型训练方法的流程示意图，如图1所示，疾病辨别模型训练方法至少包括以下步骤：

S100：建立疾病辨别模型。

本申请实施例中，可基于卷积神经网络和金字塔注意力机制(Pyramid AttentionMechanisms)建立疾病辨别模型。其中，所述金字塔注意力机制设置在所述卷积神经网络的输出端。

可以理解的是，注意力机制(Attention Mechanisms)，是神经网络中一种通过有限的注意力资源从大量信息中快速筛选出高价值信息的手段。金字塔注意力机制是注意力机制中的一种。注意力机制的使用通常只局限于神经网络中的一层，而使用金字塔注意力机制可以运用每一层金字塔的注意力机制。

本申请实施例中，疾病辨别模型的输入为预处理后的医学影像(即特征图)，输出为疾病的信心值。其中，信心值代表图像中的图像特征与疾病中状态下的图像特征的相似程度。信心值可以设置为0-100的数字，数值越高代表相似度越高。

本申请实施例中，所述疾病辨别模型用于辨别医学影像中是否存在疾病对应的图像特征。疾病辨别模型可以同时辨别多种疾病，并输出每种疾病对应的信心值。

本申请实施例中，还可在疾病辨别模型的输出端设置阈值判断。例如，若信心值高于阈值则输出对应的疾病。所述阈值可以根据信心值进行设置。例如，当所述疾病的信心值为0-100的数字时，可以将阈值设置为60，即当所述疾病的信心值大于60时，判定为患有该种疾病。

本申请实施例中，所述阈值可以通过准确率(Accuracy)、召回率(Recall)和F1分数计算。其中，准确率为预测正确的结果占总样本的百分比。召回率为在实际为正的样本中被预测为正样本的概率。F1分数为P-R(精确率-召回率)曲线。由于精确率和召回率呈负相关，无法实现精确率和召回率均有一个较高的值。F1分数同时考虑精确率和召回率，让两者同时达到最高，取得平衡。

本申请实施例中，对应的疾病数量可以为0，代表无法从医学影像中辨别出疾病。对应的疾病数量也可以为N(N为大于0的正整数)，代表从医学影像中辨别出的疾病数量为N种。

S200：获取特征图样本总集，并将特征图样本总集划分为训练集和验证集。

可以理解，本申请实施例中，所述训练集的数据将用于训练所述疾病辨别模型，然后利用验证集对所述疾病辨别模型效果进行验证。

可以理解，所述训练集的数量可大于所述验证集的数量。例如，所述训练集与所述验证集的比例可以是3:1或者4:1。

本申请实施例中，所述特征图样本总集可通过以下方式获取：

首先获取预设数量的医学影像。

所述医学影像可包括，但不局限于，X光片(X-ray Film)、电子计算机断层扫描(Computed Tomography，CT)图像、磁共振检查〔Magnetic Resonance，MR〕图像、超声(Ultrasound)检查图像、核医学(Nuclear Medicine)图像等。显然，本申请提出的疾病辨别模型训练方法可以根据不同来源的医学影像进行疾病辨别模型训练。

接着，对获取到的预设数量的医学影像进行预处理，以获得所述特征图样本总集。

本申请实施例中，由于医学影像可能来自不同型号的扫描设备，并可以具有不同的规格、参数、对比度。因此，需要对医学影像信息进行预处理，以获取统一规格的影像特征图。

可以理解，预处理后获取的所述统一规格的影像即为特征图。因此，预处理后获取的统一规格的影像特征图可构成所述特征图样本总集。再将所述特征图样本总集内的特征图划分为所述训练集和所述验证集，以通过所述训练集的特征图数据训练所述疾病辨别模型，然后利用所述验证集的特征图数据对所述疾病辨别模型效果进行验证。

可以理解的是，由于所述医学影像信息被转换成了特征图，疾病辨别模型只需根据固定格式的特征图进行训练，无需调整输入所述疾病辨别模型的影像参数。因此，本申请实施例提出的疾病辨别模型训练方法通过预处理影像能够提高模型训练的速度和疾病辨别的准确率。

可以理解，本申请实施例中，所述医学影像的特征图可以使用浮点型(FLOAT)32位的数据格式存储。浮点数以用指数型式表示，包括：数符、尾数、指数符及指数四部分。数符为1位二进制，表示数的正负。指数符为1位二进制，表示指数的正负。尾数表示浮点数有效数字。指数位表示指数的有效数字。

请一并参阅图2，所述对获取到的预设数量的医学影像进行预处理，至少包括以下子步骤：

S210：对医学影像进行重采样处理。

本申请实施例中，重采样所述医学影像可以为，将所述医学影像进行尺寸修改，以获取统一尺寸的医学影像。所述重采样包括上采样(upsampling，即放大图像)和下采样(downsampling，即缩小图像)。

S220：将重采样后的医学影像转换为RGB三维图像。

本申请实施例中，RGB三维图像由代表RGB三维图像的高、宽、通道数的矩阵组成。例如，6*6*3的RGB三维图像代表该RGB三维图像的高为6、宽为6、通道数为3。在进行运算时，RGB的通道数与滤波器的通道数相等。

可以理解的是，在本申请实施例中可以使用Python、Java、Matlab等语言中的函数将所述医学影像转换为RGB三维图像，本申请在此不做限制。

S230：将转换后的RGB三维图像做归一化处理。

本申请实施例中，可将RGB三维图像的特征值转映射到[0,1]或者[-1,1]区间内，以完成RGB三维图像归一化处理。

可以理解，数据归一化后，可使得最优解的寻优过程变得平缓，更容易正确的收敛到最优解。

可选地，在步骤S230之后，还包括翻转RGB三维图像。可以理解，翻转RGB三维图像可以提高图像的多样性。例如，当在步骤S200中获取的特征图样本总集中的医学影像数量不够多时，翻转RGB三维图像可以增加训练时可用的图像，提高疾病辨别模型的训练效果。

S240：将归一化处理之后的RGB三维图像进行影像增强处理，并转换为所述医学影像特征图。

本申请实施例中，影像增强处理的方式可包括，但不局限于，高斯滤波、模糊化、锐利化、调整明暗度及增强对比度等。影像增强处理的方式可以根据RGB三维图像的缺陷进行设置。例如，如果RGB三维图像中存在高斯噪声，则应用高斯滤波对整幅图像进行加权平均。即，通过高斯滤波输出的RGB三维图像中，每一个像素点的值，都由其本身和邻域内的其他像素值经过加权平均后得到。可以理解的是，使用高斯滤波处理所述RGB三维图像可以降低所述RGB三维图像中的高斯噪声，提高所述RGB三维图像的清晰度。

S300：训练疾病辨别模型，并输出疾病信心值。

本申请实施例中，将训练集中的特征图输入至所述疾病辨别模型，以对疾病辨别模型进行训练。

可以理解的是，在本申请实施例中，以样本(sample)总数为1000，单次训练所选取的样本数(batch size)为10，将所有样本训练的次数(epoch)为100为例，每次输入1个batch size的样本至所述疾病辨别模型获取输出的疾病信心值，共需要100次完成所有sample的1轮epoch。

可以理解的是，在全部轮次的epoch计算完成后，所述方法还包括统计输出的疾病信心值与相应的疾病辨别模型，以供模型验证分析。

S400：验证疾病辨别模型。

本申请实施例中，通过验证集中的特征图及预设的分类器对疾病辨别模型进行验证。例如，可以通过接收者操作特征(Receiveroperating Characteristic，Roc)曲线、疾病辨别准确率或正确信息丢失率(loss)来验证所述疾病辨别模型。

在获取到经由多轮步骤S400验证的若干个疾病辨别模型后，可以根据验证结果筛选疾病辨别模型，并保留疾病辨识率高的模型。例如，保留具有最佳Roc曲线下的面积(Areaunder Curve，AUC)的模型。其中，roc曲线上反映对同一信号刺激的感受性。AUC作为数值可以直观的评价分类器的好坏，值越大越好。

在本申请的一些实施例中，还可以保留具有最高准确率的疾病辨别模型。

在本申请的一些实施例中，还可以保留具有最低正确信息丢失率的模型。

本申请实施例中，疾病辨别模型可以提取肺部疾病在X光片中的特征，进而识别X光片中可能出现的不同肺部疾病。

本申请实施例中，在所述疾病辨别模型筛选结束后，得到训练好的所述疾病辨别模型。如此，在应用训练好的疾病辨别模型进行疾病诊断时，可以直接将待诊断的医学影像输入至所述疾病辨别模型中，以利用训练好的疾病辨别模型进行诊断，进而输出疾病信心值。

可以理解的是，所述疾病辨别模型可以使用热力图可视化(Class ActivationMap)及所述信心值生成疾病类别的热力图。可以理解的是，生成疾病类别的热力图可以直观的观察各种疾病的类型。

图3是图1的疾病辨别模型训练方法中建立疾病辨别模型(即步骤S100)的具体流程示意图，如图3所示，所述建立疾病辨别模型至少包括以下步骤：

S110：选取卷积神经网络。

本申请实施例中，卷积神经网络可以为DenseNet、ResNeXt、InceptionNet及SeNet中的任意一种。本申请实施例中，卷积神经网络还可以为计算机视觉迁移模型BigTransfer(BiT)。

可以理解，在选定卷积神经网络的类型后，可以根据特征图和数据量选定卷积神经网络的层数。例如，当基于DenseNet建立疾病辨别模型时，可以选用DenseNet121、DenseNet169或DenseNet201。

S120：选取金字塔注意力机制。

本申请实施例中，金字塔注意力机制的架构包括特征金字塔注意力(FeaturePyramid Attention)、路径聚合特征金字塔注意力(Path Aggregation Feature PyramidAttention)、双向特征金字塔注意力(Bidirectional Feature Pyramid Attention)和递归特征金字塔注意力(Recursive Feature Pyramid Attention)中的一种。其中，金字塔注意力机制中的层级依靠快速归一化融合(Fast Normalized fusion)技术进行结合。

可以理解，在卷积神经网络无法正确的识别医学影像中的病灶位置时，通过在疾病辨别模型中设置金字塔注意力机制，可以提高模型的训练效率。

S130：判断是否使用金字塔注意力机制。

本申请实施例中，可以输入一组数据至疾病辨别模型，以进行所述疾病辨别模型验证。再根据步骤S400验证所述疾病辨别模型训练效果来判断是否需要在疾病辨别模型中启用金字塔注意力机制。若启用金字塔注意力机制，则执行步骤S150，若不启用金字塔注意力机制，则执行步骤S140。

S140：卷积神经网络输出疾病信心值。

本申请实施例中，在不需要使用金字塔注意力机制时，则将卷积神经网络的输出结果输入至预设函数，以通过所述预设函数输出各种疾病的所述信心值。

可以理解，所述预设函数可以为Sigmoid函数(Sigmoid function)。Sigmoid函数具有单增以及反函数单增等性质，用作神经网络的激活函数，将变量映射到[0,1]之间。因此，Sigmoid函数可以用作分类器，在疾病特征相差比较复杂或是相差不是特别大时效果比较好。

S150：金字塔注意力机制输出疾病信心值。

本申请实施例中，在需要使用金字塔注意力机制时，将卷积神经网络的输出结果输入至金字塔注意力机制，以通过金字塔注意力机制输出各种疾病的信心值。

图4为本申请一实施例提供的疾病辨别模型训练装置10的模块示意图。所述疾病辨别模型训练装置10包括：建立模块100、获取模块200、训练模块300及验证模块400。

本申请实施例中，建立模块100可用于执行图1中的步骤S100，及图3中的步骤S110-S150，以建立疾病辨别模型，其具体实现方式请一并参照图1和图3及其相关描述。

本申请实施例中，获取模块200可用于执行图1中的步骤S200，以获取特征图样本总集，并将特征图样本总集划分为验证集和训练集，其具体实现方式请一并参照图1及其相关描述。

本申请实施例中，训练模块300可用于执行图1中的步骤S300，以训练疾病辨别模型，并统计疾病信心值与疾病辨别模型，以供模型验证分析，其具体实现方式请一并参照图1，图3及其相关描述。

本申请实施例中，验证模块400可用于执行图1中的步骤S400，以通过验证集中的特征图及预设的分类器对疾病辨别模型进行验证，其具体实现方式请一并参照图1及其相关描述。

图5为本申请一实施例提供的疾病辨别模型训练装置10a的模块示意图。与图4相比，图5中所述的疾病辨别模型训练装置10a还包括图像预处理模块210。

本申请实施例中，图像预处理模块210用以获取预设数量的医学影像，并对获取到的预设数量的医学影像进行预处理，以获得所述特征图样本总集，其具体实现方式请一并参照图1，图2及其相关描述。

本申请实施例中，所述疾病辨别模型训练装置10/10a，能够基于不同规格的医学影像资料对疾病辨别模型进行训练，训练出的疾病辨别模型能够适应不同的医学影像并具有高识别率。

本申请一实施方式还提供一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现如图1中步骤S100至S400；图2中步骤S210至S300，以及图3中步骤S110至S150中的疾病辨别模型训练方法。

计算机可读存储介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是，但不限于，电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本技术领域的普通技术人员应当认识到，以上的实施方式仅是用来说明本申请，而并非用作为对本申请的限定，只要在本申请的实质精神范围之内，对以上实施例所作的适当改变和变化都落在本申请要求保护的范围之内。

Claims

1.一种疾病辨别模型训练方法，其特征在于，包括：

根据所述验证集验证所述疾病辨别模型。

2.如权利要求1所述的疾病辨别模型训练方法，其特征在于，所述获取特征图样本总集，包括：

获取预设数量的医学影像；以及

3.如权利要求2所述的疾病辨别模型训练方法，其特征在于，所述对获取到的预设数量的医学影像进行预处理，包括：

对医学影像进行重采样处理；

将重采样后的所述医学影像转换为RGB三维图像；

将所述RGB三维图像转换为所述医学影像特征图。

4.如权利要求3所述的疾病辨别模型训练方法，其特征在于，所述对获取到的预设数量的医学影像进行预处理，还包括：

将转换后的所述RGB三维图像做归一化处理；

5.如权利要求1至4中任一项所述的疾病辨别模型训练方法，其特征在于，所述建立疾病辨别模型包括：

选取所述卷积神经网络；

选取所述金字塔注意力机制；

6.如权利要求5所述的疾病辨别模型训练方法，其特征在于，若判断不需要使用所述金字塔注意力机制，则将所述卷积神经网络的输出结果输入至预设函数，以通过所述预设函数输出所述疾病信心值。

7.如权利要求6所述的疾病辨别模型训练方法，其特征在于，所述训练方法还包括：

判断所述疾病信心值是否高于阈值；

8.一种疾病辨别模型训练装置，其特征在于，包括：

验证模块，用于根据所述验证集验证所述疾病辨别模型。

9.如权利要求8所述的疾病辨别模型训练装置，其特征在于，所述疾病辨别模型训练装置还包括图像预处理模块，所述图像预处理模块用于获取预设数量的医学影像，并对获取到的预设数量的医学影像进行预处理，以获得所述特征图样本总集；

对医学影像进行重采样处理；

将重采样后的所述医学影像转换为RGB三维图像；

将所述RGB三维图像转换为所述医学影像特征图。

10.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现：

如权利要求1至7任一项所述的疾病辨别模型训练方法。