CN114782319A - 一种用于超声图像的标尺的识别方法 - Google Patents
一种用于超声图像的标尺的识别方法 Download PDFInfo
- Publication number
- CN114782319A CN114782319A CN202210293137.5A CN202210293137A CN114782319A CN 114782319 A CN114782319 A CN 114782319A CN 202210293137 A CN202210293137 A CN 202210293137A CN 114782319 A CN114782319 A CN 114782319A
- Authority
- CN
- China
- Prior art keywords
- layer
- network
- unit
- scale
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000001514 detection method Methods 0.000 claims abstract description 29
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 27
- 238000005728 strengthening Methods 0.000 claims abstract description 7
- 238000010606 normalization Methods 0.000 claims description 28
- 230000004913 activation Effects 0.000 claims description 17
- 239000003550 marker Substances 0.000 claims description 17
- 238000002604 ultrasonography Methods 0.000 claims description 9
- 239000000654 additive Substances 0.000 claims description 4
- 230000000996 additive effect Effects 0.000 claims description 4
- 238000007634 remodeling Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000010224 classification analysis Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000000611 regression analysis Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 230000004927 fusion Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002308 calcification Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10132—Ultrasound image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种用于超声图像的标尺的识别方法,包括:获取超声图像;通过第一检测网络检测所述超声图像中的标尺;所述第一检测网络包括依次连接的卷积神经网络XDNetV2‑D‑Ruler、特征金字塔网络以及两个并行的分类网络和回归网络;所述卷积神经网络XDNetV2‑D‑Ruler用于提取超声图像的特征,所述特征金字塔网络用于对提取出的特征进行强化与融合,所述分类网络用于根据强化与融合后的特征识别出超声图像的标尺,所述回归网络用于对超声图像的标尺区域进行标识;本发明能够有效检测超声图像的标尺。
Description
技术领域
本发明涉及医学图像处理技术领域,特别是涉及一种用于超声图像的标尺的识别方法。
背景技术
在超声临床医生的阅片过程中,身体组织(比如脏器、腺体等)的尺寸,异常区域(比如结节、肿块等)的尺寸,以及一些病灶(比如钙化)的尺寸,等等,都是医生做出临床诊断的依据;然而,医生对这些尺寸的判断,都是通过参考超声图像侧边的比例标尺,用肉眼(或手指在屏幕上比划)进行估计。这种方法既费时又费力,而且误差较大。
发明内容
本发明所要解决的技术问题是提供一种用于超声图像的标尺的识别方法,能够有效检测超声图像的标尺。
本发明解决其技术问题所采用的技术方案是:提供一种用于超声图像的标尺的识别方法,包括:
获取带有标尺的超声图像;
通过第一检测网络检测所述超声图像中的标尺;所述第一检测网络包括依次连接的卷积神经网络XDNetV2-D-Ruler、特征金字塔网络以及两个并行的分类网络和回归网络;所述卷积神经网络XDNetV2-D-Ruler用于提取超声图像的特征,所述特征金字塔网络用于对提取出的特征进行强化与融合,所述分类网络用于根据强化与融合后的特征识别出超声图像的标尺,所述回归网络用于对超声图像的标尺区域进行标识。
所述卷积神经网络XDNetV2-D-Ruler包括依次连接的第一特征单元、第二特征单元、第三特征单元、第四特征单元、2个第五特征单元和第六特征单元,其中,所述第一特征单元包括依次连接的第七特征单元、2个第九特征单元、第八特征单元、第九特征单元和第八特征单元;所述第二特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元、第九特征单元和第八特征单元;所述第三特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元和第九特征单元;所述第四特征单元包括依次连接的第五特征单元、第九特征单元和第八特征单元。
所述第七特征单元包括依次连接的深度可分离卷积层、批归一化层、激活层、卷积层和激活层;
所述第八特征单元包括依次连接的层归一化层、注意力模块和相加层,并且第八特征单元中层归一化层的输入和相加层连接;
所述第九特征单元包括依次连接的激活层、批归一化层、深度可分离卷积层、激活层、批归一化层、深度可分离卷积层和相加层,并且第九特征单元中激活层的输入和相加层连接。
所述第五特征单元包括依次连接的卷积层、激活层、层归一化层、注意力模块和相加层,并且第五特征单元中层归一化层的输入和相加层连接;
所述第六特征单元包括依次连接的卷积层、批归一化层和激活层。
所述注意力模块包括相对位置编码层和3个深度可分离卷积层,其中,第2个深度可分离层与第3个深度可分离层进行点乘得到第一点乘结果,第3个深度可分离层和相对位置编码层进行点乘得到第二点乘结果,所述第一点乘结果和第二点乘结果相加后与注意力激活层连接,激活层的输出和第1个深度可分离层进行点乘后与重塑层连接。
还包括:通过第二检测网络检测所述标尺上的单位刻度;所述第二检测网络包括依次连接的卷积神经网络XDNetV2-D-Marker、特征金字塔网络以及两个并行的分类网络和回归网络;所述卷积神经网络XDNetV2-D-Marker用于提取超声图像的特征,所述特征金字塔网络用于对提取出的特征进行强化与融合,所述分类网络用于根据强化与融合后的特征识别出标尺上的单位刻度,所述回归网络用于对单位刻度进行标识。
所述卷积神经网络XDNetV2-D-Marker包括依次连接的第十特征单元、第三特征单元、第二特征单元、第三特征单元和3个第五特征单元。
还包括:计算所述单位刻度间的像素数,得到单位刻度与像素数的对应关系,根据所述单位刻度与像素数的对应关系来判断超声图像中各组织的尺寸。
有益效果
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明构建的卷积神经网络XDNetV2-D-Ruler网络和XDNetV2-D-Marker网络的开发属于小样本训练,轻量化的网络能够有效避免小样本训练的过拟合问题,提升泛化能力;通常标尺的尺寸相对于整张超声图像极小,且是属于细长结构,有着十分极端的长宽比,XDNetV2-D-Ruler网络优化了低维特征的提取,加强了对小目标的检测,同时,标尺的特征是由一连串的刻度组成,注意力模块中的相对位置编码能够把握住这种明显的连续位置关系,帮助识别标尺;刻度的尺寸相对于标尺是中等偏小,但毫米级的刻度是最大的干扰,因此XDNetV2-D-Marker网络优化了中等偏低维度的特征的提取,加强了对中小目标的检测;本发明通过目标检测网络能够自动检测标尺并识别刻度,无需额外人工操作,省时省力,使用快速且便捷,且保证结果精确;本发明能够满足实时超声扫查的需求,并且不受超声机品牌、型号的限制,泛用性更强。
附图说明
图1是本发明实施方式的方法流程图;
图2是本发明实施方式的卷积神经网络XDNetV2-D-Ruler结构示意图;
图3是本发明实施方式的卷积神经网络XDNetV2-D-Marker结构示意图;
图4是本发明实施方式的注意力模块结构示意;
图5是本发明实施方式的目标检测网络处理流程图;
图6是本发明实施方式的实际检测结果示意图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的实施方式涉及一种用于超声图像的标尺的识别方法,包括:
获取超声图像;
通过第一检测网络检测所述超声图像中的标尺;所述第一检测网络包括依次连接的卷积神经网络XDNetV2-D-Ruler、特征金字塔网络以及两个并行的分类网络和回归网络,详见图5;所述卷积神经网络XDNetV2-D-Ruler用于提取超声图像的特征,所述特征金字塔网络用于对提取出的特征进行强化与融合,所述分类网络用于根据强化与融合后的特征识别出超声图像的标尺,所述回归网络用于对超声图像的标尺区域进行标识;
通过第二检测网络检测所述标尺上的单位刻度;所述第二检测网络包括依次连接的卷积神经网络XDNetV2-D-Marker、特征金字塔网络以及两个并行的分类网络和回归网络,详见图5;所述卷积神经网络XDNetV2-D-Marker用于提取超声图像的特征,所述特征金字塔网络用于对提取出的特征进行强化与融合,所述分类网络用于根据强化与融合后的特征识别出标尺上的单位刻度,所述回归网络用于对单位刻度进行标识。
计算所述单位刻度间的像素数,得到单位刻度与像素数的对应关系,根据所述单位刻度与像素数的对应关系来判断超声图像中各组织的尺寸。
以下对本实施方式进行详细介绍:
本实施方式主要由两个目标检测网络串联而成。
1、训练数据构成
1.1、第一检测网络训练数据
上万张超声图像,前期由人工标注图中的标尺区域,包括外接矩形顶点坐标和对应分类,本实施方式中有且只有一种分类,即“标尺”。
第一检测网络的训练数据由超声图像数据和标尺的标注数据,两部分组成。
1.2、第二检测网络训练数据
根据1.1中的标尺区域坐标,提取标尺图像,并由人工标注图中的厘米级刻度,包括外接矩形顶点坐标和对应分类,本实施方式中有且只有一种分类,即“刻度”。
第二检测级网络的训练数据由标尺图像数据和刻度的标注数据,两部分组成。
2、数据预处理(Data Preprocessing)
所有图像在输入时都会被调整大小到(512,512,3),此处的3表示通道数,即数据为彩色图像;随后进行归一化。
3、训练数据增强(DataAugmentation)
对数据进行增强处理,提升算法鲁棒性。
使用的数据增强包括:随机横向平移(random width shift)、随机纵向平移(random height shift)、随机亮度偏移(random brightness shift)、随机通道平移(random channel shift)、随机横向翻转(random width flip)、随机纵向翻转(randomheight flip)。
4、主干网络结构(NetworkArchitecture)
本实施方式中的目标检测模型的主干网络是卷积神经网络XDNetV2-D-Ruler和XDNetV2-D-Marker,分别针对检测标尺和识别刻度,这两个网络均是一种半自注意力卷积神经网络(semi-self-attention CNN),详见图2和图3。
进一步地,卷积神经网络XDNetV2-D-Ruler和XDNetV2-D-Marker使用的局部结构包括:
A)卷积层(convolution layer);
B)深度可分离卷积层(depth-wise separable convolution layer);
C)批归一化层(batch normalization layer):是一批训练数据之间对单个神经元的归一化;
D)层归一化层(layer normalization layer):是单个训练数据对某一层所有神经元之间的归一化;
E)激活层(activation layer,swish和softmax);
swish函数公式:
softmax函数公式:
其中,e为自然常数;xi表示输入的第i个元素。
F)相对位置编码(Relative Position Embedding):普通的卷积层提取的是像素强度(即颜色)和边缘轮廓的图像特征;注意力模块中使用相对位置编码,得到像素与像素间的相对位置关系,从而提取形状结构等特征;
G)相加(add);
H)点乘(dotproduct);
I)重塑层(reshape layer)。
进一步地,对上述各局部结构进行拼接,可以得到卷积神经网络XDNetV2-D-Ruler,具体包括依次连接的第一特征单元、第二特征单元、第三特征单元、第四特征单元、2个第五特征单元和第六特征单元,其中,所述第一特征单元包括依次连接的第七特征单元、2个第九特征单元、第八特征单元、第九特征单元和第八特征单元;所述第二特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元、第九特征单元和第八特征单元;所述第三特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元和第九特征单元;所述第四特征单元包括依次连接的第五特征单元、第九特征单元和第八特征单元。第一、第二、第三、第四、第五、第六特征单元中的“卷积层(步长为2)”是下采样的标志,每列只有一个,每下采样一次即代表数据维度大幅提升一次,所以从XDNetV2-D-Ruler网络结构可看出:越往左越往上,即越靠近输入端,数据维度越低;越往右越往下,即越靠近输出端,数据维度越高。因此,第一、第二、第三、第四、第五、第六特征单元对应的列越长,注意力模块和卷积运算就越多,提取特征的能力就越强,对该维度提取的特征就越多。
所述第七特征单元包括依次连接的深度可分离卷积层、批归一化层、激活层(swish)、卷积层和激活层(swish);
所述第八特征单元包括依次连接的层归一化层、注意力模块和相加层,并且第八特征单元中层归一化层的输入和相加层连接;
所述第九特征单元包括依次连接的激活层(swish)、批归一化层、深度可分离卷积层、激活层(swish)、批归一化层、深度可分离卷积层和相加层,并且第九特征单元中激活层(swish)的输入和相加层连接。
所述第五特征单元包括依次连接的卷积层、激活层(swish)、层归一化层、注意力模块和相加层,并且第五特征单元中层归一化层的输入和相加层连接;
所述第六特征单元包括依次连接的卷积层、批归一化层和激活层(swish)。
所述注意力模块包括相对位置编码层和3个深度可分离卷积层,其中,第2个深度可分离层与第3个深度可分离层进行点乘得到第一点乘结果,第3个深度可分离层和相对位置编码层进行点乘得到第二点乘结果,所述第一点乘结果和第二点乘结果相加后与注意力激活层(softmax)连接,激活层的输出和第1个深度可分离层进行点乘后与重塑层连接。
进一步地,所述卷积神经网络XDNetV2-D-Marker包括依次连接的第十特征单元、第三特征单元、第二特征单元、第三特征单元和3个第五特征单元。
本实施方式通过变换器(transformer)中的自注意力(self-attention)机制,构建适合应用于超声图像的注意力模块,见图4;结合ResNet中的完全预激活跳接(full pre-activation skip connection),实现特征强化(feature enhancement)和赋予网络随机深度;并应用深度可分离卷积,大幅减少参数量,降低计算复杂度。
5、目标检测模型结构
本发明的目标检测模型为一段式(one stage)类型,见图5:输入经过主干网络的处理,再输入特征金字塔网络(Feature PyramidNetwork,以下简称FPN),FPN的作用是特征强化与融合(feature enhancement and fusion),再分别经过分类分析(classificationanalysis)和回归分析(regression analysis),得到分类输出和对应的边框输出。
6、损失函数(Loss Function)
对应回归分析和分类分析,损失函数分别为Smooth-L1和Focal Loss。
Smooth-L1公式:
Focal Loss公式:
FL(pt)=-(1-pt)γlog(pt)
其中:
7、开发与应用流程
标注好的数据(含框选坐标和分类),经过预处理和增强后,输入并训练神经网络模型,学习图像特征;应用时,软件会将用户导入的图像预处理后,通过神经网络模型运算,得到预测的边框和对应的分类结果,经过非极大值抑制(Non Maximum Suppression,简称NMS),得到最终结果。
若将结果可视化,则如图6所示,图6中右侧的长条即为“标尺”,在“标尺”中的小矩形区域之间的距离为单位刻度,计算结果(即一厘米对应超声图像上多少个像素)将被用以帮助临床医生快速且精确地测量超声图像中物体尺寸。
不难发现,本发明的网络(XDNetV2-D-Ruler和XDNetV2-D-Marker)以使用注意力模块和跳接为主,用于自适应的网络深度,并大量使用深度可分离卷积,减少计算参数量,属于十分轻量化的网络结构。轻量化的网络在本发明中有两大优势:1:因为计算量小,所以网络运行速度快;2:颈部淋巴结的超声图像属于医疗数据,不仅采集困难,加之伦理和隐私等问题。因此,XDNetV2-D-Ruler和XDNetV2-D-Marker网络的开发属于小样本训练,轻量化的网络能够有效避免小样本训练的过拟合问题,提升泛化能力。通常标尺的尺寸相对于整张超声图像极小,且是属于细长结构,有着十分极端的长宽比,XDNetV2-D-Ruler网络优化了低维特征的提取,加强了对小目标的检测,同时,标尺的特征是由一连串的刻度组成,注意力模块中的相对位置编码能够把握住这种明显的连续位置关系,帮助识别标尺;刻度的尺寸相对于标尺是中等偏小,但毫米级的刻度是最大的干扰,因此XDNetV2-D-Marker网络优化了中等偏低维度的特征的提取,加强了对中小目标的检测。因此相比其他网络结构,具有速度快、准确率高的优势。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。
Claims (8)
1.一种用于超声图像的标尺的识别方法,其特征在于,包括:
获取超声图像;
通过第一检测网络检测所述超声图像中的标尺;所述第一检测网络包括依次连接的卷积神经网络XDNetV2-D-Ruler、特征金字塔网络以及两个并行的分类网络和回归网络;所述卷积神经网络XDNetV2-D-Ruler用于提取超声图像的特征,所述特征金字塔网络用于对提取出的特征进行强化与融合,所述分类网络用于根据强化与融合后的特征识别出超声图像的标尺,所述回归网络用于对超声图像的标尺区域进行标识。
2.根据权利要求1所述的用于超声图像的标尺的识别方法,其特征在于,所述卷积神经网络XDNetV2-D-Ruler包括依次连接的第一特征单元、第二特征单元、第三特征单元、第四特征单元、2个第五特征单元和第六特征单元,其中,所述第一特征单元包括依次连接的第七特征单元、2个第九特征单元、第八特征单元、第九特征单元和第八特征单元;所述第二特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元、第九特征单元和第八特征单元;所述第三特征单元包括依次连接的第五特征单元、第九特征单元、第八特征单元和第九特征单元;所述第四特征单元包括依次连接的第五特征单元、第九特征单元和第八特征单元。
3.根据权利要求2所述的用于超声图像的标尺的识别方法,其特征在于,所述第七特征单元包括依次连接的深度可分离卷积层、批归一化层、激活层、卷积层和激活层;
所述第八特征单元包括依次连接的层归一化层、注意力模块和相加层,并且第八特征单元中层归一化层的输入和相加层连接;
所述第九特征单元包括依次连接的激活层、批归一化层、深度可分离卷积层、激活层、批归一化层、深度可分离卷积层和相加层,并且第九特征单元中激活层的输入和相加层连接。
4.根据权利要求2所述的用于超声图像的标尺的识别方法,其特征在于,所述第五特征单元包括依次连接的卷积层、激活层、层归一化层、注意力模块和相加层,并且第五特征单元中层归一化层的输入和相加层连接;
所述第六特征单元包括依次连接的卷积层、批归一化层和激活层。
5.根据权利要求3-4所述的用于超声图像的标尺的识别方法,其特征在于,所述注意力模块包括相对位置编码层和3个深度可分离卷积层,其中,第2个深度可分离层与第3个深度可分离层进行点乘得到第一点乘结果,第3个深度可分离层和相对位置编码层进行点乘得到第二点乘结果,所述第一点乘结果和第二点乘结果相加后与注意力激活层连接,激活层的输出和第1个深度可分离层进行点乘后与重塑层连接。
6.根据权利要求2所述的用于超声图像的标尺的识别方法,其特征在于,还包括:通过第二检测网络检测所述标尺上的单位刻度;所述第二检测网络包括依次连接的卷积神经网络XDNetV2-D-Marker、特征金字塔网络以及两个并行的分类网络和回归网络;所述卷积神经网络XDNetV2-D-Marker用于提取超声图像的特征,所述特征金字塔网络用于对提取出的特征进行强化与融合,所述分类网络用于根据强化与融合后的特征识别出标尺上的单位刻度,所述回归网络用于对单位刻度进行标识。
7.根据权利要求6所述的用于超声图像的标尺的识别方法,其特征在于,所述卷积神经网络XDNetV2-D-Marker包括依次连接的第十特征单元、第三特征单元、第二特征单元、第三特征单元和3个第五特征单元。
8.根据权利要求6所述的用于超声图像的标尺的识别方法,其特征在于,还包括:计算所述单位刻度间的像素数,得到单位刻度与像素数的对应关系,根据所述单位刻度与像素数的对应关系来判断超声图像中各组织的尺寸。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210293137.5A CN114782319A (zh) | 2022-03-24 | 2022-03-24 | 一种用于超声图像的标尺的识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210293137.5A CN114782319A (zh) | 2022-03-24 | 2022-03-24 | 一种用于超声图像的标尺的识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114782319A true CN114782319A (zh) | 2022-07-22 |
Family
ID=82426203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210293137.5A Pending CN114782319A (zh) | 2022-03-24 | 2022-03-24 | 一种用于超声图像的标尺的识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114782319A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522889A (zh) * | 2018-09-03 | 2019-03-26 | 中国人民解放军国防科技大学 | 一种基于图像分析的水文尺水位识别估算方法 |
FR3103938A1 (fr) * | 2019-12-03 | 2021-06-04 | Idemia Identity & Security France | Procédé de détection d’au moins un élément d’intérêt visible dans une image d’entrée au moyen d’un réseau de neurones à convolution |
CN113033522A (zh) * | 2021-05-25 | 2021-06-25 | 风脉能源(武汉)股份有限公司 | 基于视觉检测塔筒晃动的标记物识别方法 |
WO2021139069A1 (zh) * | 2020-01-09 | 2021-07-15 | 南京信息工程大学 | 自适应注意力指导机制的一般性目标检测方法 |
CN113554125A (zh) * | 2021-09-18 | 2021-10-26 | 四川翼飞视科技有限公司 | 结合全局与局部特征的目标检测装置、方法和存储介质 |
CN114092820A (zh) * | 2022-01-20 | 2022-02-25 | 城云科技(中国)有限公司 | 目标检测方法及应用其的移动目标跟踪方法 |
ES2908944A2 (es) * | 2018-07-24 | 2022-05-04 | Fund Centro Tecnoloxico De Telecomunicacions De Galicia | Un metodo y sistema implementados por ordenador para detectar objetos pequenos en una imagen usando redes neuronales convolucionales |
-
2022
- 2022-03-24 CN CN202210293137.5A patent/CN114782319A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2908944A2 (es) * | 2018-07-24 | 2022-05-04 | Fund Centro Tecnoloxico De Telecomunicacions De Galicia | Un metodo y sistema implementados por ordenador para detectar objetos pequenos en una imagen usando redes neuronales convolucionales |
CN109522889A (zh) * | 2018-09-03 | 2019-03-26 | 中国人民解放军国防科技大学 | 一种基于图像分析的水文尺水位识别估算方法 |
FR3103938A1 (fr) * | 2019-12-03 | 2021-06-04 | Idemia Identity & Security France | Procédé de détection d’au moins un élément d’intérêt visible dans une image d’entrée au moyen d’un réseau de neurones à convolution |
WO2021139069A1 (zh) * | 2020-01-09 | 2021-07-15 | 南京信息工程大学 | 自适应注意力指导机制的一般性目标检测方法 |
CN113033522A (zh) * | 2021-05-25 | 2021-06-25 | 风脉能源(武汉)股份有限公司 | 基于视觉检测塔筒晃动的标记物识别方法 |
CN113554125A (zh) * | 2021-09-18 | 2021-10-26 | 四川翼飞视科技有限公司 | 结合全局与局部特征的目标检测装置、方法和存储介质 |
CN114092820A (zh) * | 2022-01-20 | 2022-02-25 | 城云科技(中国)有限公司 | 目标检测方法及应用其的移动目标跟踪方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210374466A1 (en) | Water level monitoring method based on cluster partition and scale recognition | |
WO2023015743A1 (zh) | 病灶检测模型的训练方法及识别图像中的病灶的方法 | |
CN111862044B (zh) | 超声图像处理方法、装置、计算机设备和存储介质 | |
CN114897816B (zh) | 基于改进掩膜的Mask R-CNN矿物颗粒识别以及粒度检测方法 | |
CN111325750B (zh) | 一种基于多尺度融合u型链神经网络的医学图像分割方法 | |
CN109886928A (zh) | 一种目标细胞标记方法、装置、存储介质及终端设备 | |
CN104732520A (zh) | 一种胸部数字影像的心胸比测量算法及系统 | |
CN113033315A (zh) | 一种稀土开采高分影像识别与定位方法 | |
JP4978227B2 (ja) | 画像検出装置 | |
CN116740758A (zh) | 一种防止误判的鸟类图像识别方法及系统 | |
CN115205520A (zh) | 胃镜图像智能目标检测方法、系统、电子设备及存储介质 | |
CN113569726B (zh) | 一种联合自动数据增广和损失函数搜索的行人检测方法 | |
CN117392157B (zh) | 一种边缘感知的保护性耕作秸秆覆盖率检测方法 | |
CN113538363A (zh) | 一种基于改进U-Net的肺部医学影像分割方法及装置 | |
CN114782319A (zh) | 一种用于超声图像的标尺的识别方法 | |
CN116385717A (zh) | 叶面病害识别方法、装置、电子设备、存储介质及产品 | |
CN113160261B (zh) | 一种用于oct图像角膜层分割的边界增强卷积神经网络 | |
CN114596433A (zh) | 一种绝缘子识别方法 | |
CN114565626A (zh) | 基于PSPNet改进的肺部CT图像分割算法 | |
CN114494240A (zh) | 基于多尺度协作深度学习的无砟轨道板裂缝测量方法 | |
CN114140428A (zh) | 基于YOLOv5的落叶松毛虫虫害检测识别方法及系统 | |
CN116524315A (zh) | 一种基于Mask R-CNN的肺癌病理组织切片识别及分割方法 | |
CN114782318A (zh) | 一种基于目标检测的超声图像类型识别方法 | |
WO2024092968A1 (zh) | 一种路面裂缝检测方法、介质及系统 | |
CN114782317A (zh) | 一种基于目标检测的超声图像工作区域检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |