CN111178174A

CN111178174A - 基于深度卷积神经网络的尿液有形成分图像识别方法

Info

Publication number: CN111178174A
Application number: CN201911288549.4A
Authority: CN
Inventors: 汪晓萍; 秦丰; 沈继楠; 钱榴源; 丁春旭; 方红英; 吴兰; 季炜
Original assignee: Meikang Shengde Medical Technology Suzhou Co Ltd
Current assignee: Meikang Shengde Medical Technology Suzhou Co Ltd
Priority date: 2019-12-12
Filing date: 2019-12-12
Publication date: 2020-05-19
Anticipated expiration: 2039-12-12
Also published as: CN111178174B

Abstract

本发明涉及图像处理技术领域，提供一种基于深度卷积神经网络的尿液有形成分图像识别方法，包括五个步骤：将图像的大小缩放至64×64像素；将图像中所有像素点的灰度值归一化至0～1之间；计算图像中所有像素点灰度值的平均值；将图像中所有像素点的灰度值减去其平均值；将图像平均换分为16个子图像，每个子图像的大小为16×16像素，将得到的16个子图像视作16个通道，一并作为输入层，输入本发明的深度卷积神经网络模型中进行训练或识别。本发明提出的模型架构大量使用了Depthwise卷积，大大提高模型的并行性，加快了推理速度，而且模型的参数量大，识别准确率高，同时模型的计算量小，所需的内存量较小，运行成本低。

Description

基于深度卷积神经网络的尿液有形成分图像识别方法

技术领域

本发明涉及图像处理技术领域，更确切地说涉及一种基于深度卷积神经网络的尿液有形成分图像识别方法。

背景技术

尿液中的有形成分分为有机成分和无机成分两大类，有机成分具有明确的病理意义，如细胞、管形、寄生虫等具有明确的诊断价值；无机成分为生理性排出的成分，如各种生理性结晶、上皮细胞等，这些成分在某些情况下具有辅助诊断价值。随着计算机视觉技术的进步，已有一些方法可以基于尿液等体液中的有形成分图像对有形成分进行自动识别，这些方法包括两大类：一类是利用人工设计图像特征，如纹理特征、形态特征、颜色特征等，并结合机器学习算法，如神经网络、支持向量机等，实现有形成分图像的自动识别；一类是通过“端到端”的方法实现有形成分图像的识别，如深度卷积神经网络。上述两类方法有各自的优缺点，第一类方法的优点是算法实现较为简单，缺点是人工设计的图像特征可能不会十分适合于所要解决的问题，不具备自适应性，且此类方法使用的识别模型通常为“浅层”模型，模型复杂度较低，无法较好应对种类复杂的有形成分图像。第二类方法属于“端到端”的方法，其优点是模型设计简单，自适应性强，且深度卷积神经网络的拟合能力强，能够较好地应对有形成分图像的复杂性，缺点是模型的计算量通常很高，为提高模型的计算速度，通常需要高性能的硬件支持，这使得此类方法的应用成本较高。

发明内容

本发明要解决的技术问题是，提供一种基于深度卷积神经网络的尿液有形成分图像识别方法，采用“端到端”的方法实现有形成分图像的识别，能根据训练集图像自动提取图像特征，识别准确率较高，模型的计算速度高，且模型的计算量较低，所需的内存量较小，运行成本低。

本发明的技术解决方案是，提供一种基于深度卷积神经网络的尿液有形成分图像识别方法，包括以下步骤：

1)将图像的大小缩放至64×64像素；

2)将图像中所有像素点的灰度值归一化至0～1之间；

3)计算图像中所有像素点灰度值的平均值；

4)将图像中所有像素点的灰度值减去步骤3)中计算得到的均值；

5)将图像平均划分为16个子图像，每个子图像的大小为16×16像素，将得到的16个子图像视作16个通道，一并作为输入层，输入深度卷积神经网络中进行训练或识别；

所述的深度卷积神经网络包括输入层、十层卷积层、二层非卷积层、输出层，具体结构如下：

其中，p表示被卷积图像外围0值填充圈数，s表示卷积核移动步幅。

与现有技术相比，本发明的基于深度卷积神经网络的尿液有形成分图像识别方法有以下优点：本发明提出的模型架构大量使用了Depthwise卷积，大大提高模型的并行性，加快了计算速度。

优选的，步骤1)采用最近邻插值法实现图像缩放至64×64像素。

优选的，步骤2)将所有像素点的灰度值除以255，使图像中所有像素点的灰度值归一化至0～1之间。

附图说明

图1为本发明的实施例中步骤5)子图像划分方式示意图。

图2为本发明的实施例中DepthWise卷积操作示意图。

图3为本发明的实施例中Bottleneck卷积操作示意图。

图4为尿液有形成分中被归类为红细胞的显微镜图像。

图5为尿液有形成分中被归类为白细胞的显微镜图像。

图6为尿液有形成分中被归类为鳞状上皮细胞的显微镜图像。

图7为尿液有形成分中被归类为病理管型的显微镜图像。

具体实施方式

为了更好得理解本申请，将参考附图对本申请的各个方面做出更详细的说明。应理解，这些详细说明只是对本申请的示例性实施方式的描述，而非以任何方式限制本申请的范围。

还应理解的是，用语“包含”“包括”、“具有”、“包含”、“包含有”，当在本说明书中使用时表示存在所述的特征、整体、步骤、操作、元件和/或部件，但不排除存在或附加有一个或多个其他特征、整体、步骤、操作、元件、部件和/或它们的组合。

下面以具体的实施例来说明本发明的基于深度卷积神经网络的尿液有形成分图像识别方法的各个步骤，并假设图像总共分为N个类别，则网络输出层将输出一个N维向量，向量中第i个元素的值表示该图像属于第i类的概率。如果图像属于第k类的概率最大，则算法最终将该图像判定为第k类。

本发明的基于深度卷积神经网络的尿液有形成分图像识别方法具体操作如下：

步骤1)采用最近邻插值法实现图像缩放，将图像的大小缩放至64×64像素。

步骤2)将所有像素点的灰度值除以255，使图像中所有像素点的灰度值的取值范围落在[0,1]范围内。令V(x,y)表示像素点(x，y)的灰度值，Vnew(x,y)表示归一化后的像素点(x，y)的灰度值，则有：V_new(x,y)＝V(x,y)/255 (1)。

步骤3)计算图像中所有像素点的平均值。假设图像大小为m×n像素，所有像素点灰度值平均值为Vmean，则有：

步骤4)将图像中所有像素点的灰度值减去步骤3)中计算得到的均值，得到新的灰度值。像素点(x,y)经过步骤4)后得到的新灰度值为V′_new(x,y)，则有：V′_new(x,y)＝V_new(x,y)-V_mean (3)。

步骤5)将图像平均换分为16个子图像，每个子图像的大小为16×16像素，将得到的16个子图像视作16个通道，一并作为输入层，输入本发明的深度卷积神经网络中进行训练或识别。子图像划分方式如图1所示。本发明的深度卷积神经网络包括输入层、十层卷积层、二层非卷积层、输出层，具体结构如下：

在本发明的深度卷积神经网络中，大小为3×3×16的卷积核数组表示卷积核大小为3×3像素，共16个这样的卷积核。此类卷积核用于DepthWise卷积操作中，DepthWise卷积操作如图2所示。在DepthWise卷积中，每个输入图像经过一次卷积后得到一张输出图像，因此，输出图像数量与输入图像数量相同。

在本发明的深度卷积神经网络中，大小为1×1×16×16的卷积核数组表示卷积核大小为1×1像素，共16(输入图像数量)×16(输出图像数量)＝256个卷积核。此类卷积核用于Bottleneck卷积，Bottleneck卷积操作示意图如图3所示。每张输入图像都经过16次(输出图像数量为16)卷积，得到一组输出图像，该组输出图像共包含16个通道，16张输入图像共得到16组输出图像，将所有组的输出图像按照通道ID求和，即将第i个通道的所有图像按点对点的方式加和。16个通道共得到16张加和图像，即16张输出图像。

在本发明的深度卷积神经网络中，16×16×16的输入特征图数组表示特征图大小为16×16，共16张特征图，其它输入特征图数组大小的含义依次类推。BatchNormalization操作指批归一化操作。卷积层的BatchNormalization操作方式如下：

对于第i个通道特征图中位置为(x,y)处的像素点，假设其像素点灰度值为V(x,y)_i，经过BatchNormalization操作后的灰度值为V_new(x,y)_i，则有：

其中，ChannelMean_i表示第i个通道的均值，ChannelVar_i表示第i个通道的方差，表ChannelBeta_i示第i个通道的常数项系数，该系数作为待定参数，通过训练确定。eps是一个很小的正数。ChannelMean_i的计算方式如下：

其中，BatchNum表示算法训练过程中训练批次总数，

表示训练过程中，最后一次迭代第k个批次第i个通道的均值。

的计算方式如下：

其中，Batchsize表示每个批次包含的训练样本数量，m和n表示特征图的行数和列数，

表示第k个批次第Batchid个样本第i个通道特征图中位置(x,y)处的像素点灰度值。ChannelVar_i的计算方式如下：

其中，BatchNum表示算法训练过程中训练批次总数，

表示训练过程中，最后一次迭代第k个批次第i个通道的方差。

的计算方式如下：

表示第k个批次第Batchid个样本第i个通道特征图中位置(x,y)处的像素点灰度值。

在本发明的深度卷积神经网络中，FC层的BatchNormalization操作方式如下：

假设FC层第i个神经元在增加过偏置值后的结果为X(i)，经过BatchNormalization操作后得到的结果为X_new(i)，则有：

其中，Mean_i表示第i个神经元对应的均值，Var_i表示第i个神经元对应的方差，eps表示一个很小的正数，Beta_i表示常量系数，该系数作为待定参数，通过训练确定。Mean_i的计算方式如下：

其中，BatchNum表示算法训练过程中训练批次总数，

的计算方式如下：

其中，Batchsize表示每个批次包含的训练样本数量，X(i)^Batchid表示第k个批次第Batchid个样本第i个神经元在增加过偏置值后的结果。

Var_i的计算方式如下：

其中，BatchNum表示算法训练过程中训练批次总数，

表示训练过程中，最后一次迭代第k个批次第i个神经元对应的方差。

的计算方式如下：

其中，Batchsize表示每个批次包含的训练样本数量，X(i)^Batchid表示第k个批次第Batchid个样本第i个神经元在增加过偏置后的结果。

在本发明的深度卷积神经网络中，激活函数ReLU表达式为：

在本发明的深度卷积神经网络中，Global Average层分别针对Conv1_1×1层16张特征图，Conv2_1×1层16张特征图，Conv3_1×1层16张特征图，Conv4_1×1层16张特征图，Conv5_1×1层16张特征图执行Global Average操作，得到16+16+16+16+16＝80个值，这80个值即Global Average层的80个神经元的输出值。Global Average操作如下：

其中，V(x,y)表示某一张特征图中位置(x,y)处的值，m和n表示特征图的行数和列数。Average表示Global Average操作的结果。

在本发明的深度卷积神经网络中，经过Global Average操作得到的80个神经元输出值被输入FC全连接层，经过BatchNormalization操作和ReLU激活函数，将得到500个神经元的输出，将该500个神经元的激活值输入到输出层，并经过Softmax激活函数将得到N维的输出向量。该N维的输出向量的每一维依次表示输入图像属于对应类别的概率。

本发明的基于深度卷积神经网络的尿液有形成分图像识别方法的模型训练采用Adam优化方法，学习速率设置为0.001，训练时，利用相同的训练数据集训练了5个具有上述架构的深度卷积网络模型。为提高模型的识别准确性，采用bagging策略提高模型的准确率，在识别时，将图像分别输入上述的5个模型中，得到5个N维的概率预测向量，记作V1,V2,V3,V4,V5。计算这5个向量的平均向量Vmean＝(V1+V2+V3+V4+V5)/5，并将Vmean作为最终的概率预测向量，图像最终被分类到概率值最高的类别中。图4至图7所示为运用本发明的基于深度卷积神经网络的尿液有形成分图像识别方法的结果分析示例，图4至图7中的图像分别被归类为红细胞、白细胞、鳞状上皮细胞、病理管型，识别结果完全准确。

在计算模型的参数量和计算量时，考虑到本发明的基于深度卷积神经网络的尿液有形成分图像识别方法的模型采用了bagging策略整合了5个并行运行的模型结果，因此，在计算模型的参数量和计算量时均需要乘5；另外，考虑到输出层类别数量会影响模型的参数量和计算量，而不同的分类问题其输出层类别数也不同，因此，在计算时采取保守策略，在计算本发明中的模型的参数量和计算量时暂时先不考虑和输出层有关的计算。本发明中的模型与Alexnet模型关于参数量和计算量的比较结果如下：

模型	参数量/个	浮点数计算量
			Alexnet模型	约5600万	约720MFLOPS
本发明中的模型	约42000×5＝21万	约0.3×5＝1.5MFLOPS

由上述比较结果可以明显看出，一方面，本发明中的模型的参数量足有21万，且采用bagging策略整合了5个模型的结果，所以本发明中的模型拟合能力强，能够较好地应对有尿液有形成分图像的复杂性，本发明的基于深度卷积神经网络的尿液有形成分图像识别方法识别准确率高；另一方面，本发明中的模型的参数量和计算量远远小于Alexnet模型的计算量，应用本发明中的模型所需的内存量较小，对硬件的要求低，运行成本较低。

Claims

1.一种基于深度卷积神经网络的尿液有形成分图像识别方法，其特征在于，包括以下步骤：

1)将图像的大小缩放至64×64像素；

2)将图像中所有像素点的灰度值归一化至0～1之间；

3)计算图像中所有像素点灰度值的平均值；

5)将图像平均换分为16个子图像，每个子图像的大小为16×16像素，将得到的16个子图像视作16个通道，一并作为输入层，输入深度卷积神经网络中进行训练或识别；

2.根据权利要求1所述的基于深度卷积神经网络的尿液有形成分图像识别方法，其特征在于，步骤1)采用最近邻插值法实现图像缩放至64×64像素。

3.根据权利要求1所述的基于深度卷积神经网络的尿液有形成分图像识别方法，其特征在于，步骤2)将所有像素点的灰度值除以255，使图像中所有像素点的灰度值归一化至0～1之间。