CN114782319A

CN114782319A - 一种用于超声图像的标尺的识别方法

Info

Publication number: CN114782319A
Application number: CN202210293137.5A
Authority: CN
Inventors: 何敏亮
Original assignee: Shiwei Xinzhi Medical Technology Shanghai Co ltd
Current assignee: Shiwei Xinzhi Medical Technology Shanghai Co ltd
Priority date: 2022-03-24
Filing date: 2022-03-24
Publication date: 2022-07-22

Abstract

本发明涉及一种用于超声图像的标尺的识别方法，包括：获取超声图像；通过第一检测网络检测所述超声图像中的标尺；所述第一检测网络包括依次连接的卷积神经网络XDNetV2‑D‑Ruler、特征金字塔网络以及两个并行的分类网络和回归网络；所述卷积神经网络XDNetV2‑D‑Ruler用于提取超声图像的特征，所述特征金字塔网络用于对提取出的特征进行强化与融合，所述分类网络用于根据强化与融合后的特征识别出超声图像的标尺，所述回归网络用于对超声图像的标尺区域进行标识；本发明能够有效检测超声图像的标尺。

Description

一种用于超声图像的标尺的识别方法

技术领域

本发明涉及医学图像处理技术领域，特别是涉及一种用于超声图像的标尺的识别方法。

背景技术

在超声临床医生的阅片过程中，身体组织(比如脏器、腺体等)的尺寸，异常区域(比如结节、肿块等)的尺寸，以及一些病灶(比如钙化)的尺寸，等等，都是医生做出临床诊断的依据；然而，医生对这些尺寸的判断，都是通过参考超声图像侧边的比例标尺，用肉眼(或手指在屏幕上比划)进行估计。这种方法既费时又费力，而且误差较大。

发明内容

本发明所要解决的技术问题是提供一种用于超声图像的标尺的识别方法，能够有效检测超声图像的标尺。

本发明解决其技术问题所采用的技术方案是：提供一种用于超声图像的标尺的识别方法，包括：

获取带有标尺的超声图像；

通过第一检测网络检测所述超声图像中的标尺；所述第一检测网络包括依次连接的卷积神经网络XDNetV2-D-Ruler、特征金字塔网络以及两个并行的分类网络和回归网络；所述卷积神经网络XDNetV2-D-Ruler用于提取超声图像的特征，所述特征金字塔网络用于对提取出的特征进行强化与融合，所述分类网络用于根据强化与融合后的特征识别出超声图像的标尺，所述回归网络用于对超声图像的标尺区域进行标识。

所述卷积神经网络XDNetV2-D-Ruler包括依次连接的第一特征单元、第二特征单元、第三特征单元、第四特征单元、2个第五特征单元和第六特征单元，其中，所述第一特征单元包括依次连接的第七特征单元、2个第九特征单元、第八特征单元、第九特征单元和第八特征单元；所述第二特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元、第九特征单元和第八特征单元；所述第三特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元和第九特征单元；所述第四特征单元包括依次连接的第五特征单元、第九特征单元和第八特征单元。

所述第七特征单元包括依次连接的深度可分离卷积层、批归一化层、激活层、卷积层和激活层；

所述第八特征单元包括依次连接的层归一化层、注意力模块和相加层，并且第八特征单元中层归一化层的输入和相加层连接；

所述第九特征单元包括依次连接的激活层、批归一化层、深度可分离卷积层、激活层、批归一化层、深度可分离卷积层和相加层，并且第九特征单元中激活层的输入和相加层连接。

所述第五特征单元包括依次连接的卷积层、激活层、层归一化层、注意力模块和相加层，并且第五特征单元中层归一化层的输入和相加层连接；

所述第六特征单元包括依次连接的卷积层、批归一化层和激活层。

所述注意力模块包括相对位置编码层和3个深度可分离卷积层，其中，第2个深度可分离层与第3个深度可分离层进行点乘得到第一点乘结果，第3个深度可分离层和相对位置编码层进行点乘得到第二点乘结果，所述第一点乘结果和第二点乘结果相加后与注意力激活层连接，激活层的输出和第1个深度可分离层进行点乘后与重塑层连接。

还包括：通过第二检测网络检测所述标尺上的单位刻度；所述第二检测网络包括依次连接的卷积神经网络XDNetV2-D-Marker、特征金字塔网络以及两个并行的分类网络和回归网络；所述卷积神经网络XDNetV2-D-Marker用于提取超声图像的特征，所述特征金字塔网络用于对提取出的特征进行强化与融合，所述分类网络用于根据强化与融合后的特征识别出标尺上的单位刻度，所述回归网络用于对单位刻度进行标识。

所述卷积神经网络XDNetV2-D-Marker包括依次连接的第十特征单元、第三特征单元、第二特征单元、第三特征单元和3个第五特征单元。

还包括：计算所述单位刻度间的像素数，得到单位刻度与像素数的对应关系，根据所述单位刻度与像素数的对应关系来判断超声图像中各组织的尺寸。

有益效果

由于采用了上述的技术方案，本发明与现有技术相比，具有以下的优点和积极效果：本发明构建的卷积神经网络XDNetV2-D-Ruler网络和XDNetV2-D-Marker网络的开发属于小样本训练，轻量化的网络能够有效避免小样本训练的过拟合问题，提升泛化能力；通常标尺的尺寸相对于整张超声图像极小，且是属于细长结构，有着十分极端的长宽比，XDNetV2-D-Ruler网络优化了低维特征的提取，加强了对小目标的检测，同时，标尺的特征是由一连串的刻度组成，注意力模块中的相对位置编码能够把握住这种明显的连续位置关系，帮助识别标尺；刻度的尺寸相对于标尺是中等偏小，但毫米级的刻度是最大的干扰，因此XDNetV2-D-Marker网络优化了中等偏低维度的特征的提取，加强了对中小目标的检测；本发明通过目标检测网络能够自动检测标尺并识别刻度，无需额外人工操作，省时省力，使用快速且便捷，且保证结果精确；本发明能够满足实时超声扫查的需求，并且不受超声机品牌、型号的限制，泛用性更强。

附图说明

图1是本发明实施方式的方法流程图；

图2是本发明实施方式的卷积神经网络XDNetV2-D-Ruler结构示意图；

图3是本发明实施方式的卷积神经网络XDNetV2-D-Marker结构示意图；

图4是本发明实施方式的注意力模块结构示意；

图5是本发明实施方式的目标检测网络处理流程图；

图6是本发明实施方式的实际检测结果示意图。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

本发明的实施方式涉及一种用于超声图像的标尺的识别方法，包括：

获取超声图像；

通过第一检测网络检测所述超声图像中的标尺；所述第一检测网络包括依次连接的卷积神经网络XDNetV2-D-Ruler、特征金字塔网络以及两个并行的分类网络和回归网络，详见图5；所述卷积神经网络XDNetV2-D-Ruler用于提取超声图像的特征，所述特征金字塔网络用于对提取出的特征进行强化与融合，所述分类网络用于根据强化与融合后的特征识别出超声图像的标尺，所述回归网络用于对超声图像的标尺区域进行标识；

通过第二检测网络检测所述标尺上的单位刻度；所述第二检测网络包括依次连接的卷积神经网络XDNetV2-D-Marker、特征金字塔网络以及两个并行的分类网络和回归网络，详见图5；所述卷积神经网络XDNetV2-D-Marker用于提取超声图像的特征，所述特征金字塔网络用于对提取出的特征进行强化与融合，所述分类网络用于根据强化与融合后的特征识别出标尺上的单位刻度，所述回归网络用于对单位刻度进行标识。

计算所述单位刻度间的像素数，得到单位刻度与像素数的对应关系，根据所述单位刻度与像素数的对应关系来判断超声图像中各组织的尺寸。

以下对本实施方式进行详细介绍：

本实施方式主要由两个目标检测网络串联而成。

1、训练数据构成

1.1、第一检测网络训练数据

上万张超声图像，前期由人工标注图中的标尺区域，包括外接矩形顶点坐标和对应分类，本实施方式中有且只有一种分类，即“标尺”。

第一检测网络的训练数据由超声图像数据和标尺的标注数据，两部分组成。

1.2、第二检测网络训练数据

根据1.1中的标尺区域坐标，提取标尺图像，并由人工标注图中的厘米级刻度，包括外接矩形顶点坐标和对应分类，本实施方式中有且只有一种分类，即“刻度”。

第二检测级网络的训练数据由标尺图像数据和刻度的标注数据，两部分组成。

2、数据预处理(Data Preprocessing)

所有图像在输入时都会被调整大小到(512，512，3)，此处的3表示通道数，即数据为彩色图像；随后进行归一化。

3、训练数据增强(DataAugmentation)

对数据进行增强处理，提升算法鲁棒性。

使用的数据增强包括：随机横向平移(random width shift)、随机纵向平移(random height shift)、随机亮度偏移(random brightness shift)、随机通道平移(random channel shift)、随机横向翻转(random width flip)、随机纵向翻转(randomheight flip)。

4、主干网络结构(NetworkArchitecture)

本实施方式中的目标检测模型的主干网络是卷积神经网络XDNetV2-D-Ruler和XDNetV2-D-Marker，分别针对检测标尺和识别刻度，这两个网络均是一种半自注意力卷积神经网络(semi-self-attention CNN)，详见图2和图3。

进一步地，卷积神经网络XDNetV2-D-Ruler和XDNetV2-D-Marker使用的局部结构包括：

A)卷积层(convolution layer)；

B)深度可分离卷积层(depth-wise separable convolution layer)；

C)批归一化层(batch normalization layer)：是一批训练数据之间对单个神经元的归一化；

D)层归一化层(layer normalization layer)：是单个训练数据对某一层所有神经元之间的归一化；

E)激活层(activation layer，swish和softmax)；

swish函数公式：

softmax函数公式：

其中，e为自然常数；x_i表示输入的第i个元素。

F)相对位置编码(Relative Position Embedding)：普通的卷积层提取的是像素强度(即颜色)和边缘轮廓的图像特征；注意力模块中使用相对位置编码，得到像素与像素间的相对位置关系，从而提取形状结构等特征；

G)相加(add)；

H)点乘(dotproduct)；

I)重塑层(reshape layer)。

进一步地，对上述各局部结构进行拼接，可以得到卷积神经网络XDNetV2-D-Ruler，具体包括依次连接的第一特征单元、第二特征单元、第三特征单元、第四特征单元、2个第五特征单元和第六特征单元，其中，所述第一特征单元包括依次连接的第七特征单元、2个第九特征单元、第八特征单元、第九特征单元和第八特征单元；所述第二特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元、第九特征单元和第八特征单元；所述第三特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元和第九特征单元；所述第四特征单元包括依次连接的第五特征单元、第九特征单元和第八特征单元。第一、第二、第三、第四、第五、第六特征单元中的“卷积层(步长为2)”是下采样的标志，每列只有一个，每下采样一次即代表数据维度大幅提升一次，所以从XDNetV2-D-Ruler网络结构可看出：越往左越往上，即越靠近输入端，数据维度越低；越往右越往下，即越靠近输出端，数据维度越高。因此，第一、第二、第三、第四、第五、第六特征单元对应的列越长，注意力模块和卷积运算就越多，提取特征的能力就越强，对该维度提取的特征就越多。

所述第七特征单元包括依次连接的深度可分离卷积层、批归一化层、激活层(swish)、卷积层和激活层(swish)；

所述第九特征单元包括依次连接的激活层(swish)、批归一化层、深度可分离卷积层、激活层(swish)、批归一化层、深度可分离卷积层和相加层，并且第九特征单元中激活层(swish)的输入和相加层连接。

所述第五特征单元包括依次连接的卷积层、激活层(swish)、层归一化层、注意力模块和相加层，并且第五特征单元中层归一化层的输入和相加层连接；

所述第六特征单元包括依次连接的卷积层、批归一化层和激活层(swish)。

所述注意力模块包括相对位置编码层和3个深度可分离卷积层，其中，第2个深度可分离层与第3个深度可分离层进行点乘得到第一点乘结果，第3个深度可分离层和相对位置编码层进行点乘得到第二点乘结果，所述第一点乘结果和第二点乘结果相加后与注意力激活层(softmax)连接，激活层的输出和第1个深度可分离层进行点乘后与重塑层连接。

进一步地，所述卷积神经网络XDNetV2-D-Marker包括依次连接的第十特征单元、第三特征单元、第二特征单元、第三特征单元和3个第五特征单元。

本实施方式通过变换器(transformer)中的自注意力(self-attention)机制，构建适合应用于超声图像的注意力模块，见图4；结合ResNet中的完全预激活跳接(full pre-activation skip connection)，实现特征强化(feature enhancement)和赋予网络随机深度；并应用深度可分离卷积，大幅减少参数量，降低计算复杂度。

5、目标检测模型结构

本发明的目标检测模型为一段式(one stage)类型，见图5：输入经过主干网络的处理，再输入特征金字塔网络(Feature PyramidNetwork，以下简称FPN)，FPN的作用是特征强化与融合(feature enhancement and fusion)，再分别经过分类分析(classificationanalysis)和回归分析(regression analysis)，得到分类输出和对应的边框输出。

6、损失函数(Loss Function)

对应回归分析和分类分析，损失函数分别为Smooth-L1和Focal Loss。

Smooth-L1公式：

其中，L1_Smooth表示预测损失，r表示实际值，

表示预测值。

Focal Loss公式：

FL(p_t)＝-(1-p_t)^γlog(p_t)

其中：

其中，FL是预测损失，p_t表示模型预测为类的概率，y_t表示实际值(即实际是否为t类，1表示“是”，0表示“否”)，

表示预测值，γ为一个常数，此处取值为2。

7、开发与应用流程

标注好的数据(含框选坐标和分类)，经过预处理和增强后，输入并训练神经网络模型，学习图像特征；应用时，软件会将用户导入的图像预处理后，通过神经网络模型运算，得到预测的边框和对应的分类结果，经过非极大值抑制(Non Maximum Suppression，简称NMS)，得到最终结果。

若将结果可视化，则如图6所示，图6中右侧的长条即为“标尺”，在“标尺”中的小矩形区域之间的距离为单位刻度，计算结果(即一厘米对应超声图像上多少个像素)将被用以帮助临床医生快速且精确地测量超声图像中物体尺寸。

不难发现，本发明的网络(XDNetV2-D-Ruler和XDNetV2-D-Marker)以使用注意力模块和跳接为主，用于自适应的网络深度，并大量使用深度可分离卷积，减少计算参数量，属于十分轻量化的网络结构。轻量化的网络在本发明中有两大优势：1：因为计算量小，所以网络运行速度快；2：颈部淋巴结的超声图像属于医疗数据，不仅采集困难，加之伦理和隐私等问题。因此，XDNetV2-D-Ruler和XDNetV2-D-Marker网络的开发属于小样本训练，轻量化的网络能够有效避免小样本训练的过拟合问题，提升泛化能力。通常标尺的尺寸相对于整张超声图像极小，且是属于细长结构，有着十分极端的长宽比，XDNetV2-D-Ruler网络优化了低维特征的提取，加强了对小目标的检测，同时，标尺的特征是由一连串的刻度组成，注意力模块中的相对位置编码能够把握住这种明显的连续位置关系，帮助识别标尺；刻度的尺寸相对于标尺是中等偏小，但毫米级的刻度是最大的干扰，因此XDNetV2-D-Marker网络优化了中等偏低维度的特征的提取，加强了对中小目标的检测。因此相比其他网络结构，具有速度快、准确率高的优势。

前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式，并且很显然，根据上述教导，可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用，从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。

Claims

1.一种用于超声图像的标尺的识别方法，其特征在于，包括：

获取超声图像；

2.根据权利要求1所述的用于超声图像的标尺的识别方法，其特征在于，所述卷积神经网络XDNetV2-D-Ruler包括依次连接的第一特征单元、第二特征单元、第三特征单元、第四特征单元、2个第五特征单元和第六特征单元，其中，所述第一特征单元包括依次连接的第七特征单元、2个第九特征单元、第八特征单元、第九特征单元和第八特征单元；所述第二特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元、第九特征单元和第八特征单元；所述第三特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元和第九特征单元；所述第四特征单元包括依次连接的第五特征单元、第九特征单元和第八特征单元。

3.根据权利要求2所述的用于超声图像的标尺的识别方法，其特征在于，所述第七特征单元包括依次连接的深度可分离卷积层、批归一化层、激活层、卷积层和激活层；

4.根据权利要求2所述的用于超声图像的标尺的识别方法，其特征在于，所述第五特征单元包括依次连接的卷积层、激活层、层归一化层、注意力模块和相加层，并且第五特征单元中层归一化层的输入和相加层连接；

5.根据权利要求3-4所述的用于超声图像的标尺的识别方法，其特征在于，所述注意力模块包括相对位置编码层和3个深度可分离卷积层，其中，第2个深度可分离层与第3个深度可分离层进行点乘得到第一点乘结果，第3个深度可分离层和相对位置编码层进行点乘得到第二点乘结果，所述第一点乘结果和第二点乘结果相加后与注意力激活层连接，激活层的输出和第1个深度可分离层进行点乘后与重塑层连接。

6.根据权利要求2所述的用于超声图像的标尺的识别方法，其特征在于，还包括：通过第二检测网络检测所述标尺上的单位刻度；所述第二检测网络包括依次连接的卷积神经网络XDNetV2-D-Marker、特征金字塔网络以及两个并行的分类网络和回归网络；所述卷积神经网络XDNetV2-D-Marker用于提取超声图像的特征，所述特征金字塔网络用于对提取出的特征进行强化与融合，所述分类网络用于根据强化与融合后的特征识别出标尺上的单位刻度，所述回归网络用于对单位刻度进行标识。

7.根据权利要求6所述的用于超声图像的标尺的识别方法，其特征在于，所述卷积神经网络XDNetV2-D-Marker包括依次连接的第十特征单元、第三特征单元、第二特征单元、第三特征单元和3个第五特征单元。

8.根据权利要求6所述的用于超声图像的标尺的识别方法，其特征在于，还包括：计算所述单位刻度间的像素数，得到单位刻度与像素数的对应关系，根据所述单位刻度与像素数的对应关系来判断超声图像中各组织的尺寸。