CN113420636A

CN113420636A - 一种基于深度学习与阈值分割的线虫识别方法

Info

Publication number: CN113420636A
Application number: CN202110678930.2A
Authority: CN
Inventors: 金治宇; 杜昕泽; 朱作斌; 施朋; 王萧; 孙晨译
Original assignee: Xuzhou Medical University
Current assignee: Xuzhou Medical University
Priority date: 2021-06-18
Filing date: 2021-06-18
Publication date: 2021-09-21

Abstract

本发明是一种基于深度学习与阈值分割的线虫识别方法，包括生成待选区域；对待选区域进行判断，根据神经网络输出的概率值判断出其中确定包含虫子的目标区域；之后，利用非极大值抑制算法消除掉发生重叠的目标区域。然后，确定每个目标区域的最佳分割阈值，对每个目标区域进行二值化分割，并利用连通域算法判断线虫密度，实现精准定位医学研究对象。本发明根据线虫图像的自身特点，运用相配的算法对线虫进行识别，算法简单，运算速度快，且准确率高。

Description

一种基于深度学习与阈值分割的线虫识别方法

技术领域

本发明涉及一种线虫识别算法，具体是一种基于深度学习与阈值分割的线虫识别方法，属于图像处理和目标识别技术领域。

背景技术

目标识别与检测技术就是赋予计算机理解图像的能力，如同人类通过视觉观察和认知事物。在目标识别领域内，根据识别的深入程度，如图1所示，又可以细分为三类：目标分类，目标检测和目标分割。

目标分类(Classification)是指，对于给定的一张图像或者区域，输出一个判定类别，如图1中的CAT、DOG、DUCK等，目标分类默认处理的图像或区域中只包含单个目标。

目标检测(Detection)是指，对于一张包含多个目标图片，先将每个目标定位(Localization)，从而将整张图划分为只包含单个目标的区域，然后再对每个区域进行分类，目标检测中划分区域一般使用矩形框完成。

目标分割(Segmentation)是指，不仅判断每个目标的类别和大致所在区域(矩形框)，还要具体到图片中的每个像素点，找到每个目标占据的所有像素点。

因此，目标识别的三个类别实质上是由浅入深，分别是图像级识别、区域级识别和像素级识别。

一般来讲，目标识别与检测算法分为最重要的两大类，分别是基于传统方法和基于深度学习方法，如图2所示:

传统方法一般基于经典数字图像处理算法，如对图像滤波、梯度计算、借助像素的连通域关系等，传统方法的特点是实现简单、直观、不需要数据集训练，但是准确率一般，鲁棒性不好。因为传统方法都是基于简单数学运算，一旦处理的图像数量增多，就很难适应不同的复杂情况，往往需要人工手动调节参数。

基于深度学习的方法是在2012年的深度学习框架被提出后兴起，一般做法是使用大量采集、标注好的图像数据集训练网络，从而能够对给定目标做出准确判断。比起传统方法，深度学习方法的准确率大大提高，面对实际中的不同复杂情况适应性好，但是必须事先采集大量数据集进行标注，以提供给网络训练，需要受过训练的人员投入较多时间成本。

就目前的实际而言，应用以基于深度学习的方法为主流，最具有代表性的是YOLO系列与RCNN系列算法。

基于深度学习的算法又可以分成两类：单阶段和双阶段，单阶段算法是指直接对像素点的概率值进行回归，实现目标分割，YOLO系列算法属于单阶段的。双阶段算法是指，首先生成“待选框”，即先找到一批有可能是目标的框，里面包含了所有的目标和其它干扰背景，然后再利用网络对每个待选框进行预测，判定它们是否确实是目标。

目前，目标识别与检测已经成为现代信息技术最重要的基石之一，在许多领域发挥了重要作用，如图3所示。

在国外，Afshari等提出一种基于YOLO的深度网络结构，用于检测PET图像中的脑、心脏等器官，平均准确率在75％以上，Almasni等使用YOLO网络检测乳腺肿块，定位准确率达到99％。国内同样有大量的应用，合肥工业大学的卞景帅，卢家品等人基于RCNN网络自动检测结核杆菌，平均准确率达到80％，每张图片检测时间在1s以内，以及还有许多对病毒、血细胞、脏器、肿瘤等不同医学目标进行识别和检测的应用。

但是这些研究只是借助已经成熟的架构(YOLO和RCNN)所做的应用，具体说，凡是以“基于RCNN/YOLO/(等框架)”开头的研究，研究者所做的工作只是采集他们研究目标的图片，然后标注好，送进去训练即可，即便有对算法做的改进，也是在这个架构之上做的改进，所以具有一定的局限性。

虽然YOLO、RCNN等框架是众多成熟开发者研究出来的先进算法，但是它也并不适用于所有的实际问题。事实上，考虑到主流应用方式，以及为了宣传视频的视觉效果，YOLO、RCNN等框架大部分主流算法架构都是针对人类或者动物检测的，尤其是人类，与医学图像并不适用，虽然强行去运用也能收获较好的效果，这是因为这个算法架构是无数顶尖研究人员不断完善的成果，但是在付出相同代价的情况下，肯定是用更匹配的架构会更好。

举个典型的例子，RCNN算法中的第一步是利用Selective Search算法搜集待选区域，该算法的原理是不断合并相似像素点，生成不同大小的区域，显然，这个算法是针对比较大的目标的，而且图像的饱和度要高，包含不同大小的像素值，效果才好，但是线虫图像的特点是背景灰暗、目标小，且非常密集，以及线虫的大小是基本确定的，所以没必要搜索大小差异很大的区域，这个信息相当于被浪费了，如果强行应用这个算法，会造成大量的运算时延，而且效果较差。

发明内容

针对上述现有技术存在的问题，本发明提供一种基于深度学习与阈值分割的线虫识别方法，能够根据线虫图像的自身特点，运用相配的算法对线虫进行识别，算法简单，运算速度快，且准确率高。

本发明一种基于深度学习与阈值分割的线虫识别方法，包括以下步骤：

S1生成待选区域：从用户接口接收待处理医学图像及其参数，利用Harris算法从待处理医学图像中提取线虫特征点，并在特征点周围以固定边长生成待选区域；

S2用训练好的神经网络，对步骤S1中待选区域进行预测，根据神经网络输出的概率值判断出其中确定包含虫子的区域；

S3像素分割：利用阈值分割法对每个确定包含线虫的区域进行二值化分割，并利用连通域算法计算连通域数量和面积，从而对线虫的密度进行判断。

与现有技术相比，由于线虫图像背景灰暗、目标小且非常密集，与现有成熟的目标识别框架并不匹配，因此本发明根据线虫自身的特点，基于Harris算子提取特征区域，并利用改进后的Lenet-5卷积神经网络进行预测，采用基于灰度直方图梯度的方法确定分割阈值，将图像分为纯白(线虫)和纯黑(背景)两类，再对线虫密度情况进行判断。本发明运算速度快，准确率高。

附图说明

图1是传统目标识别任务示意图；

图2是传统目标检索算法分类；

图3是传统目标检测与识别算法实际应用示意图；

图4是本发明流程图；

图5是本发明输入的一张待检测的线虫医学图像；

图6是本发明生成待选区域分布示意图；

图7是本发明经神经网络预测后的目标区域分布情况；

图8是本发明一只线虫图像利用灰度重映射增强图像对比度示意图；

图9是本发明训练网络使用的部分数据集示例示意图；

图10是本发明NMS算法处理后的目标区域分布情况示意图；

图11是本发明理想目标区域的灰度直方图；

图12是本发明实际目标区域的灰度直方图；

图13是本发明最佳阈值示意图；

图14是本发明一张典型的包含两只线虫的目标区域示意图；

图15是图14的灰度直方图；

图16是图15最佳阈值分割结果示意图。

具体实施方式

下面结合附图对本发明作进一步说明。

如图4所示，本发明一种基于深度学习与阈值分割的线虫识别方法，包括以下步骤：

S1生成待选区域：从用户接口接收待处理医学图像及其参数，利用Harris算法从待处理医学图像中提取线虫特征点，并在特征点周围以固定边长生成待选区域，具体方法如下：

S1.1使用者输入一张包含有大量线虫的医学图像，并选择输入可调节的参数，如图5所示；

S1.2将输入的医学图像转化为灰度图，然后计算其Harris响应值R，通过以下方法得出Harris响应值R：

S1.2.1计算医学图像中每个像素在水平和垂直方向上的偏导数I_X，I_y；

S1.2.2对医学图像进行高斯滤波，离散二维零均值高斯函数为：

其中，x,y为像素坐标值，x,y取非负整数；σ为标准差，是决定高斯分布的参数；

S1.2.3计算医学图像中每个像素的Harris响应值R：

R＝{I_x ²×I_y ²-(I_xI_y)²}-k{I_x ²+I_y ²}²

其中，I_x，I_y分别为该像素在X和Y轴方向上的偏导数：k是常数，0.04≤k≤0.06；

令医学图像函数为P(x,y)：(x,y)为像素坐标，P(x,y)为像素值；

则对于任一像素值P₀(x₀，y₀)，该像素的I_x，I_y为：

I_x＝P₀(x₀+1，y₀)-P₀(x₀，y₀)

I_y＝P₀(x₀，y₀+1)-P₀(x₀，y₀)

S1.2.4将各像素的Harris响应值R与预先设定的阈值D相比，将R＞D的像素，作为响应特征点，将该阈值D设置为响应值R中最大值R_max的0.001-0.01倍，即0.001R_max≤D≤0.01R_max；本实施例中将该阈值D设置为响应值R最大值的0.005倍。

S1.2.5根据响应特征点，以设置的边长width作为固定边长，生成待选区域即待选框，其中，边长参数width由用户手动观察、调节、输入，具体如下：

令医学图像的像像素矩阵为M，某响应特征点坐标为(x,y),固定边长为width，则生成的待选区域Region为：

其中，Region取矩阵M的

到

行，

到

列的元素，若width为奇数，则将其加一或者减一取得偶数。

待选区域的大小在图中刚好包含一只线虫时最合适，如对于640*480的图片，待选区域边长可设置为14，对于1080*960的图片，则待选区域边长可设置为20。

如图6所示，利用Harris算法从原始医学图像(即从用户接口接收的待处理医学图像)中获取了约三百个待选区域，这些待选区域基本上已经覆盖了所有可能包含有线虫的区域。

进行上述处理的原因在于：医学图像的背景相对单调，而线虫是一个局部的像素值剧烈变化的点，因此利用Harris算子计算梯度，很好地捕捉到了这种变化，且这样的运算量也非常小，以一个固定大小生成待选区域的原因是线虫的尺寸是固定的。在本发明应用的医学图像中，一般按照医学图像的尺寸边长设置为14或20，这样设计大大简化了运算量。

S2用训练好的神经网络，对步骤S1中待选区域(约三百个待选区域)进行预测，根据神经网络输出的概率值，判断出其中确定包含虫子的区域，该区域为目标区域。

步骤S2的神经网络为改进后的Lenet-5卷积神经网络，使用以下方法对的Lenet-5卷积神经网络进行改进、训练和预测：

S2.1将Lenet-5神经网络输出层神经元改进为两个，即两个输出值，其中一个输出值用来判断判断图像是否为是线虫，另一个输出值用来预测为干扰背景的概率值(1减去该概率值即可得到了线虫的概率值)；

S2.2采集4800张线虫医学图像，并依次对该图像进行灰度重映射、图像增强、归一化、格式转化处理，如图9所示；

灰度重映射是指，将原本的图像灰度重新映射到(0，255)内，从而增强图像的对比度。图像的灰度级有0到255共256个，但是由于线虫的图片一般背景灰暗，颜色单一，可能取值只占其中很小一部分。利用灰度重映射，使灰度值增大，使背景和线虫的差值更大，提高了识别准确率和像素分割的精度。如图8所示，对于一条线虫的灰度重映射，效果非常明显。

图像增强是指，针对同一张图像，在加载训练数据时，利用旋转、翻转、缩放、变形等操作，加载出多个数据，这实际上使原本数据集大大扩充了。在本发明中，虽然只有四千多张线虫医学图像，但是对于每张医学图像，在训练神经网络时加载了其旋转、反转的其它数据，因此可用的数据实际上达到了两万组左右。

归一化是指，将所有像素值统一到[0,1]的范围内，大大加快了神经网络的训练速度。神经网络的训练是每步一个学习率，慢慢更新的，如果神经网络中输入的值太大，函数值也会太大，那么训练的速度就会很慢，而把它们统一到[0,1]的范围内，就大大加快了训练速度，但是相应的，在预测时，也应该把数据归一化到[0,1]的范围内。

格式转化是指，我们将图片的格式统一转化为与python更兼容的bmp格式，并且在加载数据时，统一转化为[28,28,1]大小的矩阵，为了方便输入进神经网络，我们使用圣经网络的输入神经元个数是28*28个。

S2.3将步骤S2.2处理后的医学图像输入到步骤S2.1的神经网络中，利用梯度下降方法对步骤S2.1中改进后的Lenet-5卷积神经网络进行训练；

S2.4利用经步骤S2.3训练后的神经网络，对步骤S1.2.4中生成的所有Region进行预测，将预测包含线虫的概率大于50％的区域，确定为包含线虫的区域，该区域为目标区域。如图7所示，预测后得到100个确定包含线虫的区域。实际应用中，实际上预测可以达到非常准确，对于确定是线虫的区域，网络的输出值一般为99％以上；

其中，梯度下降法的方法包括以下步骤：

1)通过计算出的当前损失函数得出各个权值参数w的梯度值：

其中，L为交叉熵损失函数：

L(y_label,p)＝-[y_labellog(p)+(1-y_label)log(1-p)]

其中，y_label是数据的标签值，p是网络预测的概率值；

S2.3.2然后更新权值参数w的值：

其中，α＝0.2是一个训练者定义的参数，称为学习率，w_i是指第i个权值参数；

S2.3.3重复步骤S2.3.1-S2.3.2进行20轮迭训练。

梯度的方向就是L值减少的方向，整个训练过程的原理就像一个人不断向低处走，直到走到谷底，每步走的步长就是学习率的值。在本申请中，将学习率定义为0.2，并进行了20轮迭代(即反复训练了20次)，最终的预测准确率达到95％以上。

为了解决同一只线虫出现多个待选区域的问题，通过非极大值抑制(NMS)算法对步骤S2中得到的目标区域进行筛选，筛选出包含线虫概率最大的待选区域确定为包含线虫的区域，筛选掉发生重叠的目标区域；非极大值抑制(NMS)算法原理是：对于那些距离太近的待选区域，认为是包含了同一条线虫，因此，只保留预测包含线虫概率最大的目标区域，而删除其他重叠的目标区域，所述非极大值抑制算法具体方法如下：

针对一个包含目标区域的列表，如图10所示，

L:[region₁,region₂,……region_k]

region_i为已经判定是线虫的目标区域，设一共有k个，

1)锁定其中一个region，然后向后遍历其它所有的region。

2)计算该region与其它region的距离distance，

若distance<预先设定的阈值D₁，则认为该目标区域发生重叠，distance是两个目

标区域的中心点(x₁,y₁),(x₂,y₂)的坐标距离：

distance＝|x₁-x₂|+|y₁-y₂|

所述阈值D1与所述生成待选框的边长width相同；

3)针对所有重叠的目标区域，统计其预测包含线虫的概率值，保留概率值最大的目标区域，该目标区域为确定包含线虫的区域，同时删除其他重叠的目标区域。

4)处理完当前region后，就锁定列表中的下一个region；

5)重复步骤1)-步骤4)，直至处理完所有的region，筛选掉所有发生重叠的目标区域。

使用NMS算法处理后的医学图像如图8所示，实现了对线虫区域的分割，每只线虫都被一个区域所包含。

S3像素分割：利用阈值分割法对每个确定包含线虫的区域进行二值化分割，并利用连通域算法计算连通域数量和面积，从而对线虫的密度情况进行判断。

阈值分割法是指根据阈值像素的取值，将整张医学图像的像素分割为两类：纯白和纯黑，实现了图像的前景(线虫)和背景(图像背景)的分割，从而确定了每个线虫的具体像素，进而判断出线虫密度等有价值的数据。

灰度直方图横轴为灰度级0-255，纵轴为在图像中每个像素值出现的次数，灰度直方图反应了各个像素值出现的频率情况。

在理想的情况下，假如背景都是纯白的，线虫都是纯黑的，那么图像中只有两个像素值(即背景和虫子的像素值)，其它像素值出现的次数都为0，那么直方图会是两个尖峰，最佳分割阈值t取双峰中间的任一像素值即可。如图11所示，若对于一张具有四百个像素的图片(20*20)，在理想情况下，线虫与背景完全分开。若线虫占据100个像素，像素值P1，背景占据300个像素值，像素值为P2。

然而，在实际情况中，由于线虫或背景的像素值是在一定范围内分布的，以及其它的干扰因素，灰度直方图的尖峰会向两边塌陷，如图12所示，若对于一张具有四百个像素的图片(20*20)，在实际情况下，尖峰会向两侧“塌陷”。线虫所在区域共同占据100个像素，像素值范围为P1-T/2，P1+T/2，背景区域同理，T是线虫图像占据的像素频域宽度，即占据的像素值的个数。此时的最佳分割阈值t应该取两个尖峰中间的最低谷，在一些情况下，甚至两端会发生混叠，图中，第一个峰会比第二个峰小很多，这是因为线虫的面积在整张图中只占很小一部分，此时取双峰中间的最低谷作为最佳分割阈值t，该阈值t刚好将前景和背景所在的像素分割开。如图13所示，观察该阈值t，其特征是“处于两峰之间”，最佳分割阈值t通过以下公式得出：

令h(t)为灰度直方图函数，则t取0-255的像素值，h(t)为该像素值在图像中出现的次数；

令：

使得g(i)取得最大值时的自变量i值即为最佳分割阈值t，即：

t＝i→maxg(i)

其中，l为步长，l＝10。

在实际处理中，l为卷积步长，即山峰“塌陷”的长度，l＝10，即认为前后景像素值塌陷的区域在20个像素值以内。

线虫图像中大于最佳分割阈值t的像素为纯白，小于最佳分割阈值t像素为纯黑，从而识别出线虫并判断线虫的密度情况，并将识别结果发送至可视化用户界面，用户便可清晰的了解到线虫的分布情况。

如图14所示，为一个实际应用的例子，是一张包含有两只线虫的典型区域。

该区域的灰度直方图显示为图15所示，通过公式(1)得出最佳分割阈值t，并对图像进行像素分割(大于最佳分割阈值t的像素为纯白，小于最佳分割阈值t的像素为纯黑)，分割结果如图16所示。

经过多次测试证明，本发明最佳阈值分割方法对于目标区域的像素分割效果远远优于传统的OTSU或自适应方法，此方法同样适用于其它的简单前后景分割场景，尤其是物体形态比较简单，且只占图像一小部分时。

Claims

1.一种基于深度学习与阈值分割的线虫识别方法，其特征在于，包括以下步骤：

S1生成待选区域：从用户接口接收待处理医学图像及参数，利用Harris算法从待处理医学图像中提取线虫特征点，并在特征点周围以固定边长生成待选区域；

S2用训练好的神经网络，对步骤S1中待选区域进行预测，根据神经网络输出的概率值，判断出其中确定包含虫子的区域，输出的线虫概率值大于50％，则认为该待选区域是确定包含了线虫的区域，该区域为目标区域；

2.根据权利要求1所述的一种基于深度学习与阈值分割的线虫识别方法，其特征在于，步骤S1具体方法如下：

S1.1使用者输入一张包含有大量线虫的医学图像，并选择输入可调节的参数；

其中，x，y为像素坐标值，x，y取非负整数；σ为标准差，是决定高斯分布的参数；

S1.2.3计算医学图像中每个像素的Harris响应值R：

R＝{I_x ²×I_y ²-(I_xI_y)²}-k{I_x ²+I_y ²}²

其中，I_x，I_y分别为该像素在×和Y轴方向上的偏导数：k是常数，0.04≤k≤0.06；

令医学图像函数为P(x，y)：(x，y)为像素坐标，P(x，y)为像素值；

则对于任一像素值P₀(x₀，y₀)，该像素的I_x，I_y为：

I_x＝P₀(x₀+1，y₀)-P₀(x₀，y₀)

I_y＝P₀(x₀，y₀+1)-P₀(x₀，y₀)

S1.2.4将各像素的Harris响应值R与预先设定的阈值D相比，将R＞D的像素，作为响应特征点，将该阈值D设置为响应值R中最大值R_max的0.001-0.01倍，即0.001R_max≤D≤0.01R_max；

S1.2.5根据响应特征点，以设置的边长width作为固定边长，生成待选区域，具体如下：

令医学图像的像素矩阵为M，某响应特征点坐标为(x，y)，固定边长为width，则生成的待选区域Region为：

其中，Region取矩阵M的

到

行，

到

列的元素，若width为奇数，则将其加一或者减一取得偶数。

3.根据权利要求2所述的一种基于深度学习与阈值分割的线虫识别方法，其特征在于，步骤S2的神经网络为改进后的Lenet-5卷积神经网络，使用以下方法对的Lenet-5卷积神经网络进行改进、训练和预测：

S2.1将Lenet-5神经网络输出层神经元改进为两个，即两个输出值，其中一个输出值用来判断判断图像是否为是线虫，另一个输出值用于预测为干扰背景的概率值；

S2.2采集线虫医学图像，并依次对该图像进行灰度重映射、图像增强、归一化、格式转化处理；

S2.4利用经步骤S2.3训练后的神经网络，对步骤S1.2.4中生成的所有Region进行预测，将预测包含线虫的概率大于50％的区域，确定为包含线虫的区域，该区域为目标区域。

4.根据权利要求3所述的一种基于深度学习与阈值分割的线虫识别方法，其特征在于，梯度下降方法包括以下步骤：

S2.3.1通过计算出当前的损失函数得出各个权值参数w的梯度值：

其中，L为交叉熵损失函数：

L(y_label，p)＝-[y_labellog(p)+(1-y_label)log(1-p)]

其中，y_label是数据的标签值，p是网络预测的概率值；

S2.3.2更新权值参数w的值：

其中，α＝0.2为学习率，w_i是指第i个权值参数；

S2.3.3重复步骤S2.3.1-S2.3.2进行20轮迭训练。

5.根据权利要求1所述的一种基于深度学习与阈值分割的线虫识别方法，其特征在于，通过非极大值抑制算法对步骤S2中得到的目标区域进行筛选，筛选出包含线虫概率最大的待选区域确定为包含线虫的区域，筛选掉发生重叠的目标区域，所述非极大值抑制算法具体方法如下：

针对包含所有目标区域的列表

L：[region₁，region₂，……region_k]

region_i为目标区域，设一共有k个，

1)锁定其中一个region，然后向后遍历其它所有的region；

2)计算该region与其它region的距离distance：

若distance<预先设定的阈值D₁，则认为该目标区域发生重叠，distance是两个目标区域的中心点(x₁，y₁)，(x₂，y₂)的坐标距离：

distance＝|x₁-x₂|+|y₁-y₂|

所述阈值D₁与所述生成待选框的边长width相同；

3)针对所有重叠的目标区域，统计其预测包含线虫的概率值，保留概率值最大的目标区域，该目标区域为确定包含线虫的区域，同时删除其他重叠的目标区域；

4)处理完当前region后，就锁定列表中的下一个region；

6.根据权利要求1所述的一种基于深度学习与阈值分割的线虫识别方法，其特征在于，步骤S3的阈值分割法为基于灰度直方图梯度的方法，具体步骤如下：

灰度直方图横轴为灰度级0-255，纵轴为在医学图像中每个像素值出现的次数，利用灰度直方图确定最佳分割阈值t，将整张医学图像的像素分割为两类：纯白和纯黑；

大于最佳分割阈值t的像素为纯白，小于最佳分割阈值t的像素为纯黑，最佳分割阈值t通过以下公式得出：

令：

使得g(i)取得最大值时的自变量i值即为最佳分割阈值t

即：

t＝i→maxg(i)

其中，l为步长，l＝10。

7.根据权利要求1所述的一种基于深度学习与阈值分割的线虫识别方法，其特征在于，通过以下方法对线虫的密度情况进行判断：

S3.1计算一条线虫面积的标准值S，该标准值S通过用户输入，或者由阈值分割法得到的所有连通域面积的均值的得到：

其中，假设阈值分割共得到z个连通域，S(r_i)为第r个连通区域的面积；

S3.2对于一张图像中所有连通区域[r₁，r₂，……，r_z]，若S(r_i)<0.5*S或S(r_i)>5*S，则认为该连通区域无效，将其删除；

S3计算S(r_i)mod S，则医学图像中的线虫条数为：

其中，mod为除法取整运算，若一个连通区域内的线虫条数大于1，则认为是高密度区域。