CN110765835A

CN110765835A - 一种基于边缘信息的手术视频流程识别方法

Info

Publication number: CN110765835A
Application number: CN201910800602.8A
Authority: CN
Inventors: 秦小林; 祁宝莲; 杨涌; 崔小莉
Original assignee: Chengdu Information Technology Co Ltd of CAS
Current assignee: Chengdu Information Technology Co Ltd of CAS
Priority date: 2019-08-19
Filing date: 2019-08-19
Publication date: 2020-02-07

Abstract

本发明为一种基于边缘信息的手术视频流程识别方法，属于人工智能和医疗应用领域。该方法包含以下步骤：S1：对手术视频进行采样，提取原始图像，并对原始图像进行边缘化信息提取；S2：采用两个并联卷积神经网络分别对原始图像和边缘信息进行处理；S3：将两个卷积神经网络的输出进行拼接；S4：采用分类器对拼接信息进行分类识别，判断当前原始图像对应的手术视频流程阶段；S5：对卷积神经网络和分类器采用已分类的训练集手术视频进行训练，评估手术视频流程阶段识别效果，确定相关参数。本发明提出了一种基于边缘信息的手术视频流程识别方法，能够自动、准确、快速的对手术视频图像进行提取和分类，实现自动识别手术流程。

Description

一种基于边缘信息的手术视频流程识别方法

技术领域

本发明涉及一种基于边缘信息的手术视频流程识别方法，属于人工智能和医疗应用领域，尤其适用于基于边缘信息的手术视频流程识别等。

背景技术

实时手术流程自动检测作为一种计算机辅助手术系统，由于能提高手术过程的安全性，已成为一种新兴的趋势。近年来，深度学习技术在医学治疗和诊断方面展现了很大的潜能，为人们带来了方便和快捷。目前，深度学习在手术视频的识别方面实现了视频标注、任务检索、概念检测、视频摘要和工作流分析。其中，从手术视频中自动识别手术流程仍是当前AI医疗的一个研究热点。手术流程自动识别分为在线识别和离线识别，其中，离线识别手术流程可以方便外科医生以及实习生从手术视频中搜索特定的操作任务和工具；而在线识别手术流程可以提醒外科医生注意并发症的发生，减少外科医生在手术中的操作失误，从而提高手术期间的安全性。此外，它还可以为手术室外的临床工作人员提供相关手术进展的信息，为手术后续相关工作的安排也起到一个参考的作用。然而，由于手术流程本身的不确定性，如意外出血、其他不良事件、人为错误和个人技能等各种因素可以影响自动手术流程的判断，通过视觉信息识别手术流程仍然是一项复杂的任务。

发明内容

有鉴于此，本发明提供一种基于边缘信息的手术视频流程识别方法，自动、准确、快速的对手术视频图像进行提取和分类，实现自动识别手术流程。

为达到上述目的，本发明提供如下技术方案：

一种基于边缘信息的手术视频流程识别方法，包括如下步骤：

S1：对手术视频进行采样，提取原始图像，并对原始图像进行边缘化信息提取；

S2：采用两个并联卷积神经网络(CNN)分别对原始图像和边缘信息进行处理；

S3：将两个卷积神经网络的输出进行拼接；

S4：采用分类器对拼接信息进行分类识别，判断当前原始图像对应的手术视频流程阶段；

S5：对卷积神经网络和分类器采用已分类的训练集手术视频进行训练，评估手术视频流程阶段识别效果，确定相关参数。

进一步，所述的步骤S1具体为：通过安装在手术室或者手术台等地方的摄像头获取手术视频，每隔固定时长提取一帧原始图像，利用边缘化处理方法提取原始图像的边缘信息，将原始图片以及边缘化处理后的边缘信息分别存储为独立的两个数据集。

更进一步，所述的边缘化处理方法为Sobel算子、Laplacian算子、Canny算子三种边缘化处理方法之一，根据手术不同的场景，择优选取识别效果最好的边缘化处理方法。

进一步，步骤S2所述的两个并联卷积神经网络其网络参数相互独立，可以为ResNet网络。

进一步，步骤S3所述的将拼接为在两个并联卷积神经网络的最后一层的全连接层后采用concat方法进行拼接，其中两个并联卷积神经网络共享同一权重。

本发明的有益效果在于：本发明提供了一种基于边缘信息的手术视频流程识别方法，将图片的边缘信息作为原始图像的补充信息以提升手术流程识别准确率，实现自动识别手术流程，能够方便外科医生和实习生从手术视频中发现特定的手术任务或工具，提醒外科医生注意并发症的发生，来减少手术失误，提高手术过程中的安全性。此外，还可以为手术室外的临床工作人员提供手术进度信息，为术后相关工作的安排提供参考。

附图说明

为了使本发明的目的、技术方案，本发明提供如下附图进行说明：

图1为一种基于边缘信息的手术视频流程识别方法网络构架图。

具体实施方式

为使本发明的目的和技术方案更加清晰明白，下面结合附图及实施例对本发明进行详细的描述。

实施例：

针对白内障手术，结合现有101个白内障手术视频数据集，其分辨率为1920×1080，手术过程有10个流程阶段，如表1所示，现拟对白内障手术实现手术流程的视频识别，以指导手术的进行。本实施例提供“一种基于边缘信息的手术流程识别方法”，结合图1，该方法包含以下步骤：

步骤一：

首先，将101个白内障手术视频数据集随机分为两部分：训练子集(包含73个视频)和测试子集(28个视频)，每隔固定时长提取一帧原始图像，得到1046219张原始图片用于训练集原始图像，216998张图片测试集原始图像。

其次，将所有原始图片的分辨率从原来的1920×1080调整为250×250，来减小计算量，提高识别效率。

然后，分别利用Sobel算子、Laplacian算子、Canny算子对降低分辨率后的所有原始图片分别进行边缘化处理提取原始图像的边缘信息，将原始图片以及边缘化处理后的边缘信息分别存储为独立的两个数据集。

步骤二：

采用两个并联卷积神经网络分别对原始图像数据集和边缘信息数据集进行处理；其中，两个并联卷积神经网络为ResNet网络，其网络参数相互独立，在网络中的图像数据通过224×224的裁剪、镜像和旋转来增强数据。

步骤三：

在两个ResNet网络最后一层的全连接层后增加一层，该层采用concat方法对全连接层的输出进行拼接，其中两个并联卷积神经网络共享同一权重。

步骤四：

采用支持向量机(SVM)对拼接信息进行分类识别，判断当前原始图像对应的手术视频流程阶段。

步骤五：

首先，采用训练集原始图像对ResNet网络和支持向量机(SVM)采用已分类的训练集手术视频进行训练，设定ResNet网络都为50层，其中ResNet网络的训练参数如下：学习率λ被设为0.01，学习速率规则设为multistep，原始图像和边缘信息的ResNet网络分别对应的stepvalues设为60000和120000，动量设为0.9，权重下降设为0.001。

然后，确定ResNet网络和支持向量机(SVM)的相关参数，选择训练效果最好的Sobel算子为边缘化处理方法。

最后，使用Sobel算子和设定好的ResNet网络和支持向量机(SVM)对测试集原始图像进行处理，评估手术视频流程阶段识别效果。

测试表明：本发明具有很好的手术视频流程阶段识别效果，准确率为90.1％。

表1 本发明实施例所述白内障手术10个流程阶段的注释标记

阶段号	阶段名称
		1	切口
2	粘性剂注入
		3	破裂
4	水解剖
		5	超声乳化白内障吸除术
6	浇注和抽吸
		7	囊抛光术
8	晶状体植入
		9	去除粘性剂
10	滋补和抗生素

最后说明的是，以上优选实施例仅用以说明本发明的技术方案而非限制，尽管通过上述优选实施例已经对本发明进行了详细的描述，但本领域技术人员应当理解，可以在形式上和细节上对其做出各种各样的改变，而不偏离本发明权利要求书所限定的范围。

Claims

1.一种基于边缘信息的手术视频流程识别方法，其特征在于，该方法包含以下步骤：

S2：采用两个并联卷积神经网络分别对原始图像和边缘信息进行处理；

S3：将两个卷积神经网络的输出进行拼接；

2.根据权利要求1所述的一种基于边缘信息的手术视频流程识别方法，其特征在于，所述的步骤S1具体为：通过安装在手术室或者手术台等地方的摄像头获取手术视频，每隔固定时长提取一帧原始图像，利用边缘化处理方法提取原始图像的边缘信息，将原始图片以及边缘化处理后的边缘信息分别存储为独立的两个数据集。

3.根据权利要求2所述的边缘化处理方法，其特征在于，所述的边缘化处理方法为Sobel算子、Laplacian算子、Canny算子三种边缘化处理方法之一，根据手术不同的场景，择优选取识别效果最好的边缘化处理方法。

4.根据权利要求1所述的一种基于边缘信息的手术视频流程识别方法，其特征在于，步骤S2所述的两个并联卷积神经网络其网络参数相互独立，可以为Resnet网络。

5.根据权利要求1所述的一种基于边缘信息的手术视频流程识别方法，其特征在于，步骤S3所述的将拼接为在两个并联卷积神经网络的最后一层的全连接层后采用concat方法进行拼接，其中两个并联卷积神经网络共享同一权重。