CN112085760A - 一种腹腔镜手术视频的前景分割方法 - Google Patents
一种腹腔镜手术视频的前景分割方法 Download PDFInfo
- Publication number
- CN112085760A CN112085760A CN202010924388.XA CN202010924388A CN112085760A CN 112085760 A CN112085760 A CN 112085760A CN 202010924388 A CN202010924388 A CN 202010924388A CN 112085760 A CN112085760 A CN 112085760A
- Authority
- CN
- China
- Prior art keywords
- laparoscopic surgery
- module
- image
- video
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000002357 laparoscopic surgery Methods 0.000 title claims abstract description 65
- 230000011218 segmentation Effects 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000003287 optical effect Effects 0.000 claims abstract description 37
- 238000003709 image segmentation Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 14
- 238000002372 labelling Methods 0.000 claims abstract description 8
- 238000012360 testing method Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000004927 fusion Effects 0.000 claims description 26
- 238000005070 sampling Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 12
- 230000003213 activating effect Effects 0.000 claims description 7
- 210000000683 abdominal cavity Anatomy 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 230000010339 dilation Effects 0.000 claims description 3
- 230000000877 morphologic effect Effects 0.000 claims description 3
- 238000001356 surgical procedure Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30204—Marker
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种腹腔镜手术视频的前景分割方法,其包括以下步骤:S1、获取腹腔镜手术视频,划分训练集及测试集;S2、对训练集内腹腔镜手术视频进行裁剪及手术器械像素的标注的预处理;S3、构建前景分割系统,将S2中腹腔镜手术视频输入前景分割系统,通过光流预测模块结合图像分割模块进行前景分割,得到分割结果;本发明在复杂的手术场景中精确分割腹腔镜手术器械,对腹腔镜手术器械进行细分,避免干扰,提高了腹腔镜手术的精确度。
Description
技术领域
本发明涉及腹腔镜手术技术领域,尤其涉及一种腹腔镜手术视频的前景分割方法。
背景技术
腹腔镜手术就是利用腹腔镜及其相关器械进行的手术:使用冷光源提供照明,将腹腔镜镜头插入腹腔内,运用数字摄像技术使腹腔镜镜头拍摄到的图像通过光导纤维传导至后级信号处理系统,并且实时显示在专用监视器上。然后医生通过监视器屏幕上所显示患者器官不同角度的图像,对病人的病情进行分析判断,并且运用特殊的腹腔镜手术器械进行手术。
与普通外科手术相比,腹腔镜手术避免了开发的手术环境,并且缩短了患者的康复时间,配合手术辅助系统减少医生在手术过程中的疲劳度,提高手术的准确性,腹腔镜手术器械分割是手术辅助系统的关键要素之一,但是由于手术场景较为复杂,在复杂的手术场景中,腹腔镜手术视频容易出现器械运动伪影、器械被周围组织、血液或烟雾遮挡导致手术辅助系统分析异常,难以对手术器械进行细分。
发明内容
本发明的目的在于提供一种腹腔镜手术视频的前景分割方法,在复杂的手术场景中精确分割腹腔镜手术器械,对腹腔镜手术器械进行细分,避免干扰,提高了腹腔镜手术的精确度。
为实现上述目的,本发明采用以下技术方案:
一种腹腔镜手术视频的前景分割方法,包括以下步骤:
S1、获取腹腔镜手术视频,划分训练集及测试集;
S2、对训练集内腹腔镜手术视频进行裁剪及手术器械像素的标注的预处理;
S3、构建前景分割系统,将S2中腹腔镜手术视频输入前景分割系统,通过光流预测模块结合图像分割模块进行前景分割,得到分割结果。
进一步地,所述步骤S2中的腹腔镜手术视频采样频率为1Hz,腹腔镜手术视频的原始图像的尺寸为1920×1080,通过缩放得到尺寸为640×512的图像,对尺寸为640×512的图像裁剪得到320×256的区域图像作为前景分割系统的输入图像;手术器械像素的标注为单通道的二值语义标注。
进一步地,所述步骤S3中前景分割系统还包括采样路径的编码器、上采用路径的解码器、瓶颈模块及注意力模块,编码器与解码器进行跳跃连接,瓶颈模块分别与编码器及解码器相连接;图像分割模块分别与编码器、解码器、光流预测模块及注意力模块相连接;注意力模块分别与编码器、解码器及光流预测模块相连接;步骤S3的具体步骤为:
S31、腹腔手术视频输入编码器进行下采样提取特征并输入瓶颈模块;
S32、瓶颈模块调整特征的通道数后输入解码器;
S33、解码器与编码器将具有相同尺度的特征沿着通道方向进行拼接得到拼接特征;
S36、将融合特征输入解码器进行上采样放大得到尺寸为1920×1080的第一融合特征;
S37、通过Sigmoid函数激活尺寸为1920×1080的第一融合特征并将激活后的尺寸为1920×1080的第一融合特征输入编码器,重复4次S31-S37的操作,得到尺寸为1920×1080的第二融合特征;
S38、通过Sigmoid函数激活尺寸为1920×1080的第二融合特征得到分割结果。
进一步地,所述图像分割模块设有5个子模块,5个子模块依次相连接,5个子模块的卷积层数分别为1、1、2、2及2,5个子模块的卷积层通道数分别为64、128、256、512及1024,后3个子模块均设有并行卷积层。
进一步地,所述步骤S32中的瓶颈模块调整特征的通道数为256;步骤S35中的注意力信息为步骤S37中注意力模块输出的尺寸为1920×1080的第一融合特征或光流预测模块对腹腔镜手术视频的预测信息;注意力信息与特征进行点乘提取时空信息,时空信息与特征的每个通道相加得到第一融合特征。
进一步地,所述并行卷积层为带有ReLU激活函数的1×1卷积层。
进一步地,所述光流预测模块对腹腔镜手术视频的上一帧图像及下一帧图像相邻的两帧图像提取光流,光流设有2个通道U及通道V,上一帧图像上具有手术器械像素的标注,坐标为x及y,光流预测模块通过光流对标注进行形变,得到新坐标xnew及ynew,具体公式如下:
xnew=clip(x+U,0,w-1)
ynew=clip(y+V,0,h-1)
其中,x为上一帧图像的手术器械像素在通道U方向上的坐标,y为上一帧图像的手术器械像素在通道V方向上的坐标,w为上一帧图像的宽,h为上一帧图像的长;
对新坐标xnew及ynew进行形态学膨胀处理得到光流预测模块对腹腔镜手术视频的预测信息。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
1、本发明通过构建前景分割系统,将预处理后的腹腔镜手术视频及腹腔镜手术器械像素的标注输入前景分割系统,利用光流预测模块获取腹腔镜手术视频的信息配合图像分割模块对腹腔镜手术视频内的手术器械进行分割,得到分割结果,对腹腔镜手术器械进行细分,避免干扰,提高了腹腔镜手术的精确度。
2、本发明通过通过图像分割模块的5个子模块对腹腔镜手术视频进行采样操作提取特征,特征输入瓶颈模块调整特征通道数后输送给解码器,利用跳跃连接补充解码器下采样过程丢失的信息,编码器提取得到低维特征及解码器提取得到高维特征分别输送给注意力模块进行拼接得到特征注意力模块接收光流预测模块或上一个注意力模块输出得到的第一融合特征与特征进行融合得到尺寸为1920×1080的第二融合特征,经过Sigmoid函数激活尺寸为1920×1080的第二融合特征得到分割结果;注意力模块融合腹腔镜手术视频中图像之间的时序信息和拼接后的特征,利用时序信息指导前景分割系统直接关注到手术器械所在的空间区域,提高了手术器械的细分精确度。
附图说明
图1为本发明整体流程图;
图2为本发明整体结构示意图;
图3为本发明图像分割整体结构示意图;
图4为本发明注意力模块整体结构示意图;
图5为本发明光流预测模块的光流示意图;
图6为本发明分割结果对比示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
配合图1至图5所示,本发明公开了一种腹腔镜手术视频的前景分割方法,包括以下步骤:
S1、获取腹腔镜手术视频,划分训练集及测试集。
S2、对训练集内腹腔镜手术视频进行裁剪及手术器械像素的标注的预处理。
S3、构建前景分割系统,将S2中腹腔镜手术视频输入前景分割系统,通过光流预测模块结合图像分割模块进行前景分割,得到分割结果。
步骤S2中的腹腔镜手术视频采样频率为1Hz,腹腔镜手术视频的原始图像尺寸为1920×1080,裁剪掉原始图像的黑边,通过缩放得到尺寸为640×512的图像,对尺寸为640×512的图像裁剪得到320×256的区域图像作为前景分割系统的输入图像;手术器械像素的标注为单通道的二值语义标注;若像素的标注中的像素对应的值大于0,则在单通道的二值语义标注上将对应位置赋值为1;手术器械共有8种,分别为单孔弯头双极钳、双孔长抓钳、有创单孔组织抓钳、大号持针器、血管封口器、牵开器、超声探头及单极弯剪刀。
配合图2至图4所示,步骤S3中前景分割系统还包括采样路径的编码器、上采用路径的解码器、瓶颈模块及注意力模块,编码器与解码器进行跳跃连接(copy andconcatente),瓶颈模块分别与编码器及解码器相连接;图像分割模块分别与编码器、解码器、光流预测模块及注意力模块相连接;注意力模块分别与编码器、解码器及光流预测模块相连接;步骤S3的具体步骤为:
S31、腹腔手术视频输入编码器进行下采样提取特征并输入瓶颈模块。
S32、瓶颈模块调整特征的通道数后输入解码器。
S33、解码器与编码器将具有相同尺度的特征沿着通道方向进行拼接得到拼接特征。
S36、将融合特征输入解码器进行上采样放大得到尺寸为1920×1080的第一融合特征。
S37、通过Sigmoid函数激活尺寸为1920×1080的第一融合特征并将激活后的尺寸为1920×1080的第一融合特征输入编码器,重复4次S31-S37的操作,得到尺寸为1920×1080的第二融合特征。
S38、通过Sigmoid函数激活尺寸为1920×1080的第二融合特征得到分割结果。
光流预测模块优选光流估算网络FlowNet2.0,以监督学习的方式预测图像之间的光流,即在2帧图像之间像素标注的位移信息;图像分割模块优选以U-Net为结构基础,TernausNetV1为基准在编码器的下采样过程将VGG-11的特征提取网络与并行卷积分支结合。
图像分割模块设有5个子模块分别为模块1、模块2、模块3、模块4及模块5,5个子模块依次相连接,5个子模块的卷积层数分别为1、1、2、2及2,5个子模块的卷积层通道数分别为64、128、256、512及1024,后3个子模块均设有并行卷积层;VGG-11的前7个卷积(Conv)操作中,每个卷积核(Conv2d)的大小都为3×3,输出都经过ReLU激活;5个最大池化层(MaxPooling)的下采样倍数都为2,且不含全连接层FC,第1个卷积层产生64个通道,之后的每个卷积层所产生的通道数都成倍增加。
瓶颈模块由2个带ReLU激活函数的1×1卷积层(Conv2d)组成;步骤S32中的瓶颈模块调整特征的通道数为256;步骤S35中的注意力信息为步骤S37中注意力模块输出的尺寸为1920×1080的第一融合特征或光流预测模块对腹腔镜手术视频的预测信息;注意力信息与特征进行点乘提取时空信息,时空信息与特征的每个通道相加得到第一融合特征,第一融合特征带有时序信息;,并行卷积层为带有ReLU激活函数的1×1卷积层,这一设置的目的是在不同的通道上对每个像素点进行线性叠加,实现通道间的信息交互,且保留特征的原有平面结构;图像分割模块中两路卷积的输出最终在平面上进行叠加。
参考图5所示,光流预测模块对腹腔镜手术视频的上一帧图像及下一帧图像相邻的两帧图像提取光流,不同颜色代表像素的不同运动方向,而颜色的深浅则表示像素运动时相对速度的快慢,光流设有2个通道U及通道V,上一帧图像上具有手术器械像素的标注,坐标为x及y,光流预测模块通过光流对标注进行形变,得到新坐标xnew及ynew,具体公式如下:
xnew=clip(x+U,0,w-1)
ynew=clip(y+V,0,h-1)
其中,x为上一帧图像的手术器械像素在通道U方向上的坐标,y为上一帧图像的手术器械像素在通道V方向上的坐标,w为上一帧图像的宽,h为上一帧图像的长;对新坐标xnew及ynew进行形态学膨胀处理得到光流预测模块对腹腔镜手术视频的预测信息。
实验评价
训练集中的腹腔镜手术视频都具有双目摄像机的左右视野,每个视野各包含300帧RGB图像;训练集包含8段序列长度为225帧的视频,测试集包含训练集中所有视频的最后75帧图像以及另外两段长度为300帧的视频。
对训练集进行数据增强操作,数据增强操作包括对图像进行随机裁剪和中心裁剪,分别以0.5的概率对图像沿着水平或垂直方向进行随机翻转和旋转,训练集的腹腔镜手术视频在进行数据增强后,经归一化操作后输入前景分割系统。
编码器的下采样操作使用的是降采样因子为2的最大池化层,而解码器的上采样操作使用的是双线性插值,其上采样因子也为2,相比于直接进行转置卷积操作,双线性插值方法无可学习参数,利用中心点四周的像素值就可以计算中心值,操作简单,速度较快,此外,还使用学习率衰减和提前终止(early stopping)训练策略,其中学习率衰减率为0.9,提前终止的容忍值为20个epoch。
通过损失函数Loss监督前景分割系统,损失函数Loss的公式为:
Loss=0.4·BCE+0.6·(1-IoU)
其中,二分类交叉熵(BCE)的公式为:
其中,N为腹腔镜手术视频中目标图像的像素个数,ti为目标图像的像素个数中一个像素的类别,取0或1,yi为该像素被前景分割模型分类为正例的概率,IoU为真实值与预测值之间的交并比,取值越大说明真实标注与预测结果之间的重叠面积越大,其公式为:
其中,gt为真实值,pred为测试值,tp为被前景分割系统判断为前景像素-真阳性的数量,fp为被前景分割系统判断为背景像素-假阳性的数量,fn为被前景分割系统判断为前景像素-假阴性的数量。
通过Dice评价系数得出真实值与测试值的相似度,其公式为:
取值越大代表手术器械大小和前景分割系统的分割结果越接近。
验证前景分割系统的性能,结果如表1所示:
表1前景分割系统的性能对比表
通过前景分割系统的TernausNetV1+并行卷积层结构与单独的U-Net、TernausNetV1结构在四折交叉验证时的平均性能对比结果可知,前景分割系统的TernausNetV1+并行卷积层结构引入注意力信息后分割结果得到更小的方差,鲁棒性更好。
验证前景分割系统与其他分割系统的有效性对比,结果如表2所示:
表2验证前景分割系统与其他分割系统的有效性对比表
通过表2可知前景分割系统的TernausNetV1+并行卷积层结构引入注意力信息的性能更佳。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (8)
1.一种腹腔镜手术视频的前景分割方法,其特征在于,包括以下步骤:
S1、获取腹腔镜手术视频,划分训练集及测试集;
S2、对训练集内腹腔镜手术视频进行裁剪及手术器械像素的标注的预处理;
S3、构建前景分割系统,将S2中腹腔镜手术视频输入前景分割系统,通过光流预测模块结合图像分割模块进行前景分割,得到分割结果。
2.如权利要求1所述的一种腹腔镜手术视频的前景分割方法,其特征在于:所述步骤S2中的腹腔镜手术视频采样频率为1Hz,腹腔镜手术视频的原始图像的尺寸为1920×1080,通过缩放得到尺寸为640×512的图像,对尺寸为640×512的图像裁剪得到320×256的区域图像作为前景分割系统的输入图像;手术器械像素的标注为单通道的二值语义标注。
3.如权利要求1所述的一种腹腔镜手术视频的前景分割方法,其特征在于:所述步骤S3中前景分割系统还包括采样路径的编码器、上采用路径的解码器、瓶颈模块及注意力模块,编码器与解码器进行跳跃连接,瓶颈模块分别与编码器及解码器相连接;图像分割模块分别与编码器、解码器、光流预测模块及注意力模块相连接;注意力模块分别与编码器、解码器及光流预测模块相连接;步骤S3的具体步骤为:
S31、腹腔手术视频输入编码器进行下采样提取特征并输入瓶颈模块;
S32、瓶颈模块调整特征的通道数后输入解码器;
S33、解码器与编码器将具有相同尺度的特征沿着通道方向进行拼接得到拼接特征;
S36、将融合特征输入解码器进行上采样放大得到尺寸为1920×1080的第一融合特征;
S37、通过Sigmoid函数激活尺寸为1920×1080的第一融合特征并将激活后的尺寸为1920×1080的第一融合特征输入编码器,重复4次S31-S37的操作,得到尺寸为1920×1080的第二融合特征;
S38、通过Sigmoid函数激活尺寸为1920×1080的第二融合特征得到分割结果。
5.如权利要求3所述的一种腹腔镜手术视频的前景分割方法,其特征在于:所述图像分割模块设有5个子模块,5个子模块依次相连接,5个子模块的卷积层数分别为1、1、2、2及2,5个子模块的卷积层通道数分别为64、128、256、512及1024,后3个子模块均设有并行卷积层。
7.如权利要求5所述的一种腹腔镜手术视频的前景分割方法,其特征在于:所述并行卷积层为带有ReLU激活函数的1×1卷积层。
8.如权利要求6所述的一种腹腔镜手术视频的前景分割方法,其特征在于:所述光流预测模块对腹腔镜手术视频的上一帧图像及下一帧图像相邻的两帧图像提取光流,光流设有2个通道U及通道V,上一帧图像上具有手术器械像素的标注,坐标为x及y,光流预测模块通过光流对标注进行形变,得到新坐标xnew及ynew,具体公式如下:
xnew=clip(x+U,0,w-1)
ynew=clip(y+V,0,h-1)
其中,x为上一帧图像的手术器械像素在通道U方向上的坐标,y为上一帧图像的手术器械像素在通道V方向上的坐标,w为上一帧图像的宽,h为上一帧图像的长;
对新坐标xnew及ynew进行形态学膨胀处理得到光流预测模块对腹腔镜手术视频的预测信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010924388.XA CN112085760B (zh) | 2020-09-04 | 2020-09-04 | 一种腹腔镜手术视频的前景分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010924388.XA CN112085760B (zh) | 2020-09-04 | 2020-09-04 | 一种腹腔镜手术视频的前景分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112085760A true CN112085760A (zh) | 2020-12-15 |
CN112085760B CN112085760B (zh) | 2024-04-26 |
Family
ID=73731462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010924388.XA Active CN112085760B (zh) | 2020-09-04 | 2020-09-04 | 一种腹腔镜手术视频的前景分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112085760B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113066026A (zh) * | 2021-03-26 | 2021-07-02 | 重庆邮电大学 | 基于深度神经网络的内窥镜图像烟雾净化方法 |
CN113744306A (zh) * | 2021-06-08 | 2021-12-03 | 电子科技大学 | 基于时序内容感知注意力机制的视频目标分割方法 |
CN113813053A (zh) * | 2021-09-18 | 2021-12-21 | 长春理工大学 | 一种基于腹腔镜内窥影像的手术进程分析方法 |
CN114898177A (zh) * | 2022-05-09 | 2022-08-12 | 梅卡曼德(北京)机器人科技有限公司 | 缺陷图像生成方法、模型训练方法、设备、介质及产品 |
CN116030397A (zh) * | 2023-03-27 | 2023-04-28 | 湖南大学 | 一种基于时序信息交互的腔镜手术视频分割方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107644429A (zh) * | 2017-09-30 | 2018-01-30 | 华中科技大学 | 一种基于强目标约束视频显著性的视频分割方法 |
CN107808389A (zh) * | 2017-10-24 | 2018-03-16 | 上海交通大学 | 基于深度学习的无监督视频分割方法 |
WO2019103912A2 (en) * | 2017-11-22 | 2019-05-31 | Arterys Inc. | Content based image retrieval for lesion analysis |
CN110458127A (zh) * | 2019-03-01 | 2019-11-15 | 腾讯医疗健康(深圳)有限公司 | 图像处理方法、装置、设备以及系统 |
AU2020100200A4 (en) * | 2020-02-08 | 2020-06-11 | Huang, Shuying DR | Content-guide Residual Network for Image Super-Resolution |
CN111325751A (zh) * | 2020-03-18 | 2020-06-23 | 重庆理工大学 | 基于注意力卷积神经网络的ct图像分割系统 |
US20200226748A1 (en) * | 2017-06-26 | 2020-07-16 | The Research Foundation For The State University Of New York | System, method, and computer-accessible medium for virtual pancreatography |
-
2020
- 2020-09-04 CN CN202010924388.XA patent/CN112085760B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200226748A1 (en) * | 2017-06-26 | 2020-07-16 | The Research Foundation For The State University Of New York | System, method, and computer-accessible medium for virtual pancreatography |
CN107644429A (zh) * | 2017-09-30 | 2018-01-30 | 华中科技大学 | 一种基于强目标约束视频显著性的视频分割方法 |
CN107808389A (zh) * | 2017-10-24 | 2018-03-16 | 上海交通大学 | 基于深度学习的无监督视频分割方法 |
WO2019103912A2 (en) * | 2017-11-22 | 2019-05-31 | Arterys Inc. | Content based image retrieval for lesion analysis |
CN110458127A (zh) * | 2019-03-01 | 2019-11-15 | 腾讯医疗健康(深圳)有限公司 | 图像处理方法、装置、设备以及系统 |
AU2020100200A4 (en) * | 2020-02-08 | 2020-06-11 | Huang, Shuying DR | Content-guide Residual Network for Image Super-Resolution |
CN111325751A (zh) * | 2020-03-18 | 2020-06-23 | 重庆理工大学 | 基于注意力卷积神经网络的ct图像分割系统 |
Non-Patent Citations (1)
Title |
---|
李栋等: "模糊连接图像分割CUDA 并行算法的改进", 计算机辅助设计与图形学学报, vol. 28, no. 2, 29 February 2016 (2016-02-29), pages 295 - 300 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113066026A (zh) * | 2021-03-26 | 2021-07-02 | 重庆邮电大学 | 基于深度神经网络的内窥镜图像烟雾净化方法 |
CN113066026B (zh) * | 2021-03-26 | 2022-05-20 | 重庆邮电大学 | 基于深度神经网络的内窥镜图像烟雾净化方法 |
CN113744306A (zh) * | 2021-06-08 | 2021-12-03 | 电子科技大学 | 基于时序内容感知注意力机制的视频目标分割方法 |
CN113744306B (zh) * | 2021-06-08 | 2023-07-21 | 电子科技大学 | 基于时序内容感知注意力机制的视频目标分割方法 |
CN113813053A (zh) * | 2021-09-18 | 2021-12-21 | 长春理工大学 | 一种基于腹腔镜内窥影像的手术进程分析方法 |
CN114898177A (zh) * | 2022-05-09 | 2022-08-12 | 梅卡曼德(北京)机器人科技有限公司 | 缺陷图像生成方法、模型训练方法、设备、介质及产品 |
CN114898177B (zh) * | 2022-05-09 | 2023-08-04 | 梅卡曼德(北京)机器人科技有限公司 | 缺陷图像生成方法、模型训练方法、设备、介质及产品 |
CN116030397A (zh) * | 2023-03-27 | 2023-04-28 | 湖南大学 | 一种基于时序信息交互的腔镜手术视频分割方法 |
CN116030397B (zh) * | 2023-03-27 | 2023-08-01 | 湖南大学 | 一种基于时序信息交互的腔镜手术视频分割方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112085760B (zh) | 2024-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112085760A (zh) | 一种腹腔镜手术视频的前景分割方法 | |
CN111383214B (zh) | 实时内窥镜肠镜息肉检测系统 | |
Hasan et al. | U-NetPlus: A modified encoder-decoder U-Net architecture for semantic and instance segmentation of surgical instruments from laparoscopic images | |
JP7127785B2 (ja) | 情報処理システム、内視鏡システム、学習済みモデル、情報記憶媒体及び情報処理方法 | |
CN111445478B (zh) | 一种用于cta图像的颅内动脉瘤区域自动检测系统和检测方法 | |
JPH05108819A (ja) | 画像処理装置 | |
US20240156547A1 (en) | Generating augmented visualizations of surgical sites using semantic surgical representations | |
Bawa et al. | The saras endoscopic surgeon action detection (esad) dataset: Challenges and methods | |
JP2022039921A (ja) | 目標検出方法及び装置、コンピュータシステム並びに可読記憶媒体 | |
WO2021159778A1 (zh) | 图像处理方法、装置、智能显微镜、可读存储介质和设备 | |
CN115937089A (zh) | 一种基于改进yolov5病灶检测模型的训练检测方法 | |
CN116993699A (zh) | 一种眼动辅助训练下的医学图像分割方法及系统 | |
Kanakatte et al. | Surgical tool segmentation and localization using spatio-temporal deep network | |
Rueckert et al. | Methods and datasets for segmentation of minimally invasive surgical instruments in endoscopic images and videos: A review of the state of the art | |
WO2024088621A1 (en) | Method, processor unit and system for processing of images | |
US20240303984A1 (en) | Adaptive visualization of contextual targets in surgical video | |
CN116091524B (zh) | 一种针对复杂背景中目标的检测与分割方法 | |
US20240324852A1 (en) | Systems and interfaces for computer-based internal body structure assessment | |
US20240161497A1 (en) | Detection of surgical states and instruments | |
CN116188486A (zh) | 一种面向腹腔镜肝脏手术的视频分割方法及系统 | |
Wang et al. | Smoke veil prior regularized surgical field desmoking without paired in-vivo data | |
Lafouti et al. | Surgical instrument tracking for capsulorhexis eye surgery based on siamese networks | |
Song et al. | Real-Time Instance Segmentation and Tip Detection for Neuroendoscopic Surgical Instruments | |
EP4373079A1 (en) | System, method, and computer program for an optical imaging system and corresponding optical imaging system | |
Hussain et al. | 3D landmark detection for augmented reality based otologic procedures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |