CN112420170B

CN112420170B - 一种提高计算机辅助诊断系统图片分类准确度的方法

Info

Publication number: CN112420170B
Application number: CN202011457683.5A
Authority: CN
Inventors: 刘峡壁; 杨松晓; 郑中枢
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2020-12-10
Filing date: 2020-12-10
Publication date: 2022-12-09
Anticipated expiration: 2040-12-10
Also published as: CN112420170A

Abstract

本发明涉及一种提高计算机辅助诊断系统图片分类准确度的方法，属于计算机视觉技术领域。本方法基于深度学习的融合医学图像特征和临床特征，首先对系统影像数据和临床数据进行预处理。然后，将系统的临床数据C_i经过卷积层和最大池化操作，得到高维特征向量。将影像信息经过残差块进行特征提取。将最后得到的影像特征图调整为一维向量，并与临床特征向量进行拼接，得到一个新的更大的特征向量。将该特征向量通过一层全连接层和Softmax函数，最终得到各个分类结果的概率。本发明方法，与现有的计算机辅助诊断系统图片分类方法相比，可使计算机辅助诊断系统在各种实际应用场景下获得快速、高可靠的图片分类。

Description

一种提高计算机辅助诊断系统图片分类准确度的方法

技术领域

本发明涉及一种提高计算机辅助诊断系统图片分类准确度的方法，属于计算机视觉技术领域。

背景技术

计算机辅助诊断(computer aided diagnosis，CAD)系统，是通过影像学、图像处理技术以及其他可能的生理、生化手段，结合计算机的分析计算，辅助发现病灶，提高诊断的准确率。计算机辅助诊断的过程包括病人一般资料和检查资料的搜集、医学信息的量化处理、统计学分析，直至最后得出诊断。随着人工智能技术的发展，近年来，计算机辅助诊断系统得到了广泛的应用。

图片分类处理，是计算机辅助诊断系统的重要问题。目前，现有的计算机辅助诊断系统的图片分类方法，主要分为两类：

1.基于传统机器学习方法的图片分类方法。该方法通常采用支持向量机(SVM)、决策树等机器学习方法，对经过数字图像处理后得到的特征进行分类。它对特征提取的要求很高，而且由于医学图像的复杂度较高，传统方法的分类能力不足，导致图片分类准确率较低。

2.基于卷积神经网络的图片分类方法。主要分成四类：第一类是采用2D医学影像的方法，这类方法通常取一组三维影像中的几张切片作为代表进行特征提取和分类。第二类是采用3D医学影像的方法，这类方法直接将三维影像作为输入，进行特征的提取和分类。第三类是加入临床信息和医学影像的方法，这类方法在前面两类的基础上添加了临床信息作为输入，对纯影像分类的结果进行补充。第四类则是采用多模态数据进行诊断的方法。

上述图片分类方法存在以下不足和缺陷：

基于传统机器学习的图片分类方法，虽然实现相对简单，但由于医学图像中特征在姿态、尺度等方面的多样化，传统机器学习的分类性能不足，分类的准确率往往达不到实际应用的要求。

基于卷积神经网络的图片分类方法，由于采用了复杂的神经网络结构，分类精度会优于传统方法。但是，使用2D医学影像的分类方法在选取的感兴趣区域(ROI)不合适时，会导致神经网络无法有效学习到特征提取的方法，从而大大降低分类准确率。使用3D医学影像的分类方法中，由于选用了整个三维影像，不存在感兴趣区域的选取问题，但是，三维影像带来的高复杂度和高内存占用会带来大量的计算消耗，大大降低方法的分类效率，使用如此巨大的计算消耗换取准确率提升的几个百分点，得不偿失。加入临床信息补充纯影像分类结果时，由于临床信息的数量较少，大量的影像特征会将临床信息淹没，导致神经网络无法充分使用临床信息。在使用多模态数据的方法中，由于采用了多种影像数据，例如MRI和PET，网络获得的信息会更多，分类准确率也有提升，但是网络复杂度和计算消耗极大，计算效率很低。

发明内容

本发明的目的是针对现有的计算机辅助诊断系统图片分类技术存在的不足，基于深度学习融合医学图像特征和临床特征，提出一种能够有效提高计算机辅助诊断系统的图片分类准确率的方法。

本发明采取的技术方案如下：

一种提高计算机辅助诊断系统图片分类准确率的方法，包括以下步骤：

步骤1：进行相关定义。

定义1：初始影像数据，记作I_ori；

定义2：初始临床数据，记作C_ori；

定义3：预处理后的影像数据，记为I；

定义4：预处理后的临床数据，记作C；

定义5：输入影像数据，用灰度像素矩阵表示，将数据集中第i张影像记作I_i；

定义6：输入临床数据，用一维向量表示，将数据集中第i条临床数据记作C_i；

定义7：在特征提取过程中的影像特征向量记作

定义8：在特征提取过程中的临床特征向量记作

步骤2：对系统影像数据和临床数据进行预处理。

对初始影像数据I_ori进行筛选和大小调整，得到预处理后的影像数据I。其中，筛选的标准为：影像数据对应病人的临床数据缺失情况不超过10％；大小调整的标准为：256*256。

同时，对初始临床数据C_ori进行归一化处理，得到预处理后的临床数据C。

步骤3：将临床数据C_i经过6个分别由一层卷积核大小为3×3的卷积层和1个最大池化操作后，得到高维特征向量

步骤4：将影像信息I_i经过4个两种类型的残差块进行特征提取。所述残差块包括含有临床特征注意力机制和不含有临床特征注意力机制两种类型。

其中，在含有临床特征注意力机制的残差块中，共有2个输入：

和

首先，将

经过一层卷积核大小为1×1的卷积层和一层全连接层进行特征对齐。

然后，将对齐后的

与

进行按通道的乘法，得到相似性度量矩阵M_i。将M_i每个通道进行压缩操作，即，对该通道每个元素进行加和后取平均，得到一个权值向量V_i。

最后，将权值向量V_i和

进行通道乘法，得到加权后的

将其输入到剩下两层参数层中，进行特征提取。同时，对原特征图

进行残差操作。

在不含有临床特征注意力机制的残差块中，仅对原特征图

进行残差操作以及两个参数层的特征提取，得到进一步特征提取后的特征图

步骤5：将最后得到的影像特征图

调整为一维向量，并与步骤2得到的临床特征向量进行拼接，得到一个新的更大的特征向量。

步骤6：将步骤5得到的特征向量，通过一层全连接层和Softmax函数，最终得到各个分类结果的概率。

有益效果

本发明方法与现有的计算机辅助诊断系统图片分类方法相比，可使计算机辅助诊断系统在各种实际应用场景下获得快速、高可靠的图片分类。经测试，在Alzheimer’sDisease Neuroimaging Initiative(ADNI)数据集中阿尔茨海默症的分类应用中，系统图片分类准确率能够达到97％以上。

附图说明

图1为本发明方法的原理框图。

图2为测试本发明方法的影像数据样例。

图3为本发明方法中病理特征引导注意力残差块。

图4为本发明方法中病理特征引导注意力机制的实现原理。

具体实施方式

下面结合附图与实施例对本发明方法作进一步具体说明。

实施例

步骤1：进行相关定义。

定义1：初始影像数据，记作I_ori；

定义2：初始临床数据，记作C_ori；

定义3：预处理后的影像数据，记为I；

定义4：预处理后的临床数据，记作C；

定义5：输入影像数据，用灰度像素矩阵表示，数据集中第i张影像记作I_i；

定义6：输入临床数据，用一维向量表示，数据集中第i条临床数据记作C_i；

定义7：在特征提取过程中的影像特征向量，记作

定义8：在特征提取过程中的临床特征向量，记作

步骤2：对系统的影像数据和临床数据进行预处理。

对初始影像数据I_ori进行筛选和大小调整，得到预处理后的影像数据I。同时，对初始临床数据C_ori进行归一化处理，得到预处理后的临床数据C。

具体实现如下：

步骤2.1：查看所有初始影像数据对应的临床数据中是否有超过10％的缺失，缺失数据的表示为-4。

步骤2.2：将所有初始临床数据在所有临床数据之间进行归一化处理:。归一化方法采用min-max标准化方法，公式为

得到237维的归一化临床数据。

步骤2.3：将所有初始影像数据Resize为256*256。

步骤3：将输入的临床数据C_i，经过6个分别由一层卷积核大小为3×3的卷积层和1个最大池化操作后，得到高维特征向量

具体实现如下：

输入的临床数据C_i为237*1的一维向量，经过6个卷积层和1个最大池化操作后，得到3*1024的高维特征向量

步骤4：将输入的影像信息I_i，经过4个两种类型的残差块进行特征提取。

残差块包括含有临床特征注意力机制和不含有临床特征注意力机制两种类型。具体实现如下：

步骤4.1:在含有临床特征注意力机制的残差块中，共有两个输入：

和

步骤4.2：将

经过一层卷积核大小为1×1的卷积层和一层全连接层进行特征对齐,对齐后得到与特征图通道数一致，其余两维为1的向量。

步骤4.3：将对齐后的

与

进行按通道的乘法，得到相似性度量矩阵M_i。将M_i每个通道进行压缩操作，即，对该通道每个元素进行加和后取平均，得到一个维度与特征图通道数一致的权值向量V_i。

步骤4.4:将权值向量V_i和

进行通道乘法，得到加权后的

进行残差操作。

步骤5：将最后得到的影像特征图

调整为一维向量，并与步骤2得到的临床特征向量

进行拼接，得到一个更大的特征向量。具体实现如下：

影像特征图

调整为8192*1的一维向量和步骤2得到的临床特征向量拼接得到11264*1的特征向量。

步骤6：将步骤5得到的特征向量，通过一层全连接层和Softmax函数，最终得到该图片各个分类结果的概率。