CN115082739B - 基于卷积神经网络的内窥镜评估方法及评估系统 - Google Patents
基于卷积神经网络的内窥镜评估方法及评估系统 Download PDFInfo
- Publication number
- CN115082739B CN115082739B CN202210776537.1A CN202210776537A CN115082739B CN 115082739 B CN115082739 B CN 115082739B CN 202210776537 A CN202210776537 A CN 202210776537A CN 115082739 B CN115082739 B CN 115082739B
- Authority
- CN
- China
- Prior art keywords
- endoscope
- evaluation
- target
- characteristic
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/771—Feature selection, e.g. selecting representative features from a multi-dimensional feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Endoscopes (AREA)
Abstract
本发明公开了一种基于卷积神经网络的内窥镜评估方法及评估系统。所述内窥镜评估方法包括:获取内窥镜的评估图像;获取所述评估图像中的特征目标及其位置信息;计算所述评估图像中不同种类的特征目标之间的距离,以及同一种类特征目标出现的比例,对所述特征目标进行特征过滤;对通过所述特征过滤的特征目标进行连续计时,获取评估结果,用于指示所述内窥镜是否正常。本发明所提供的内窥镜评估方法及评估系统能够准确的判断内窥镜术前准备是否完成喷气喷水检查准备工作,并准确给出是否通过术前准备工作的指示,避免术中因术前准备不足的原因而导致手术或检查中断的问题,极大地提高了医生进行术前准备的效率,节省了医生的精力。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种基于卷积神经网络的内窥镜评估方法及评估系统。
背景技术
在内窥镜领域,基于深度学习的计算机辅助诊断系统因为其很高的应用价值得到了研究人员越来越对的关注。基于卷积神经网的人工智能算法的主要应用领域包括:息肉的自动检出,盲区监测,早癌识别,质量控制。大量的临床研究数据表明,较为成熟的人工智能算法主要集中在书中对于病变的检测和识别,如息肉,早癌识别,而作为实验重要一环的术前设备状况的智能检测,如内窥镜能否正常喷气、喷水的检查还没有与之相关的自动化算法。
人工智能在内窥镜操作质量评估上的应用还较为少见,且仅有的一些多为手术途中对医生操作的评估,并没有术前对手术设备能否正常工作的评估。而术前准备中比较重要的一个应用场景,便是评估内窥镜的前端能否顺畅喷气、喷水,以确保手术中的操作能够正常进行。目前内镜内窥镜前端能否喷气、喷水的检测均为医生人工判断,医生通过观察内镜内窥镜前端能否在水中喷出气泡来判断其能否正常喷气,通过观察内窥镜前端喷出的水滴是否顺畅来判断其能否喷水。由于对于肠胃镜检测的需求增加迅速,内窥镜操作医生人数相对缺乏,面对大量的病人,医生有时会误判,漏判术前准备结果,进而增加影响手术正常进程,延误病人病情的概率。
发明内容
针对现有技术的不足,本发明的目的在于提供一种基于卷积神经网络的内窥镜评估方法及评估系统。
为实现前述发明目的,本发明采用的技术方案包括:
第一方面,本发明提供一种基于卷积神经网络的内窥镜评估方法,所述内窥镜至少具有喷气和喷水两种功能,所述的内窥镜评估方法包括:
1)通过摄像模块获取内窥镜的评估图像;
2)通过目标检测获取所述评估图像中的特征目标及其位置信息,所述特征目标至少包括含有液体以及气泡的透明容器、连续液滴以及所述内窥镜的前端;
3)基于所述特征目标及其位置信息计算所述评估图像中不同种类的特征目标之间的距离,以及计算连续多个所述评估图像中同一种类的特征目标出现的比例,基于所述距离和比例对所述特征目标进行特征过滤;
4)对通过所述特征过滤的特征目标进行连续计时,并基于计时结果获取所述内窥镜的评估结果,所述评估结果用于指示所述内窥镜的喷气和喷水功能是否正常。
第二方面,本发明还提供一种内窥镜评估系统,其包括:
摄像模块,用于获取内窥镜的评估图像;
目标检测器,用于通过目标检测获取所述评估图像中的特征目标及其位置信息,所述特征目标至少包括含有液体以及气泡的透明容器、连续液滴以及所述内窥镜的前端;
特征过滤器,用于基于所述特征目标及其位置信息计算所述评估图像中不同种类的特征目标之间的距离,以及计算连续多个所述评估图像中同一种类的特征目标出现的比例,基于所述距离和比例对所述特征目标进行特征过滤;
信号计时器,用于对通过所述特征过滤的特征目标进行连续计时,并基于计时结果获取所述内窥镜的评估结果,所述评估结果用于指示所述内窥镜的喷气和喷水功能是否正常。
基于上述技术方案,与现有技术相比,本发明的有益效果至少包括:
本发明提供的基于卷积神经网络的内窥镜评估方法及评估系统能够高效准确的寻找出内窥镜的前端喷气时含有液体及气泡的透明容器,喷水时放入连续液滴以及内窥镜前端,然后对检测目标结果进行处理过滤,仅输出正确结果,最后正确的特征目标信号触发计时器,并基于计时器的计时结果指示内窥镜是否评估通过;该方法及系统能够准确的判断内窥镜术前准备是否完成喷气喷水检查准备工作,并准确给出是否通过术前准备工作的指示,避免术中因术前准备不足的原因而导致手术或检查中断的问题,极大地提高了医生进行术前准备的效率,节省了医生的精力。
上述说明仅是本发明技术方案的概述,为了能够使本领域技术人员能够更清楚地了解本申请的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合详细附图说明如后。
附图说明
图1是本发明一具体实施方案提供的基于卷积神经网络的内窥镜评估方法的使用场景示图;
图2是本发明一具体实施方案提供的特征目标的图像示例图;
图3是本发明一具体实施方案提供的基于卷积神经网络的内窥镜评估方法的总体流程示意图;
图4是本发明一具体实施方案提供的目标检测器结构示意图;
图5是本发明一具体实施方案提供的特征过滤器中处理神经网络识别结果的信号处理的详细过程示意图;
图6是本发明一具体实施方案提供的信号计时器的结构示意图。
具体实施方式
需要首先声明,虽然内窥镜属于医疗器械的一种,但仍然需强调的是,本发明所基于的技术构思以及采取的技术方案,均是服务于内窥镜的前期检测,属于一种对器械或设备的自动化视觉检测方法,该方法仅仅给出了上述内窥镜的功能是否正常的相关信息,而丝毫未涉及到直接用于判断生物体是否健康的诊断信息,更与任何疾病的治疗和诊断方法无直接关联,具体而言,医生仅根据本发明实施例所提供的方法完全无法直接单独判断生物体的健康状况和疾病状态,本发明实施例所提供的评估方法仅仅告诉医生,其使用的内窥镜是否功能正常。
因此,本发明所保护的技术方案未涉及疾病的诊断与治疗方法,完全属于专利保护客体。
在本发明技术方案属于专利保护客体的基础上,鉴于现有技术中的不足,本案发明人经长期研究和大量实践,得以提出本发明的技术方案。如下将对该技术方案、其实施过程及原理等作进一步的解释说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
而且,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个与另一个具有相同名称的部件或方法步骤区分开来,而不一定要求或者暗示这些部件或方法步骤之间存在任何这种实际的关系或者顺序。
在传统目标检测算法中,通常使用人工设计的形状特征当作模版对图像全局进行索引来找到符合特征的目标。该类型算法通用性较差,需要大量人工设计对应特征,并且大多只能对特定目标进行检测。传统算法应使用中央处理器(CPU)运行算法,其效率也远远低于现在使用显卡运行的深度学习算法。随着深度学习的发展,基于CNN的目标检测算法在准确度和速度方面均有了飞跃的发展。基于CNN的目标检测算法通过骨干CNN提取的特征更加通用,通过训练可以抽取各种目标的特征,搭配区域候选网络等CNN网络,深度学习算法还能更快更准确找到目标。近年来,随着显卡硬件性能的提升以及深度学习算法的快速迭代优化,人工智能(AI)在众多领域都出现了革命性的发展和进步。随着整个社会快速向数字化方向发展,全世界每天都会有大量的数据产生。在这些数据的支撑下,现有深度学习算法的AI系统在许多领域的实际使用性能发生了质的改变,其表现已经可以接近甚至超越人类专家的判断。在医疗领域,基于深度学习的算法也同样展示出了很大的潜力,例如在应对皮肤病变和糖尿病视网膜病变图像的诊断方面,基于深度学习的AI系统在闭包测试过程中已经具备与医学专家相同甚至更佳的识别能力。
为了解决基于AI的内窥镜,例如消化内镜CAD系统中操作质量评估的问题,本发明提出了基于卷积神经网络的内窥镜术前喷气喷水自动检测评估算法及系统。本发明中所述评估方法主要包含三个部分:(1)用于检测内窥镜前端,内窥镜前端在水杯中正常喷气,以及内窥镜前端喷出水滴的检测器。(2)目标检测信号处理算法,通过计算不同特征目标之间的相对位置以及滑窗算法过滤目标检测器的报告。(3)检测信号计时器,对正确输出信号计时,输出最终检测结果。
本发明中,所述的喷水功能为内窥镜喷出液体功能的简称,并非一定限定为喷出的液体为水,也可能是一些水溶液或一些医疗用溶剂或染色剂等等其他液体。
具体的,参见图1-图3,本发明实施例提供一种基于卷积神经网络的内窥镜评估方法,所述内窥镜至少具有喷气和喷水两种功能,该内窥镜评估方法包括如下的步骤:
1)通过摄像模块获取内窥镜的评估图像;
2)通过目标检测获取所述评估图像中的特征目标及其位置信息,所述特征目标至少包括含有液体以及气泡的透明容器、连续液滴以及所述内窥镜的前端;
3)基于所述特征目标及其位置信息计算所述评估图像中不同种类的特征目标之间的距离,以及计算连续多个所述评估图像中同一种类的特征目标出现的比例,基于所述距离和比例对所述特征目标进行特征过滤;
4)对通过所述特征过滤的特征目标进行连续计时,并基于计时结果获取所述内窥镜的评估结果,所述评估结果用于指示所述内窥镜的喷气和喷水功能是否正常。
作为一些典型的应用实例,上述技术方案中所包含的实施方式例如可以包括如图3所示的步骤,具体为:
步骤一:通过摆放在术前准备台上的摄像模块获取连续的单帧图像
步骤二:将获取的图像用CNN目标检测器进行目标检测
步骤三:对目标检测器的结果进行过滤
步骤四:计数器对成功检测的目标进行计时,计数器达到阈值,报告术前准备成功。
在一些实施方式中,步骤1)中,所述摄像模块固设于术前准备台上,且拍摄方向朝向所述术前准备台的操作平台;
在一些实施方式中,所述摄像模块距离所述操作平台的中心15-24cm。
作为一些具体的功能应用场景示例,如图1-图2所示的使用场景图片所示,图1从左到右分别为喷水操作场景,喷气操作场景,摄像模块的视角图片。图中红框为摄像模块摆放位置。图2从左到右依次为盛放液体但无气泡的透明容器(一水杯)、有气泡的透明容器、连续液滴以及内窥镜的前端图像。
在一些实施方式中,步骤2)中,利用目标检测器执行所述目标检测;
在一些实施方式中,所述目标检测器包括依次串联的骨干神经网络、区域候选网络以及分类器;
所述骨干神经网络用于基于所述评估图像转化生成特征图像;
所述区域候选网络用于基于所述特征图像获取检测目标及其位置信息;
所述分类器用于将所述检测目标分类为不同种类的所述特征目标。
在一些实施方式中,所述骨干神经网络包括ResNet、SqueezeNet、ShuffleNNet、VGGNnet以及DenseNet中的任意一种;
在一些实施方式中,所述分类器包括softmax分类器。
作为一些具体的应用实例,所述的目标检测器是基于单帧评估图像的内窥镜喷气喷水检测器。例如,该检测器可以将对准消化内镜术前准备操作台的摄像模块的单帧评估图像作为输入,采用当前通用的基于卷积神经网络,输出内窥镜前端是否能够顺畅喷气喷水的目标位置和类别。
更具体的,本实施案例所述的目标检测器所要检测的特征目标有以下三种:
1.有气泡的水杯:医生在做术前准备的时候会首先将内窥镜前端插进装有水的水杯进行喷气,若喷气顺利,水杯会出现大量气泡,与无气泡水杯区别很大。因此,若目标检测器可检测到有含有大量气泡的水杯,则可基于此进一步地判断喷气正常。
2.内窥镜前端喷出的水滴:在检测内窥镜前端喷水时,医生会将内窥镜前端拔出水杯,进行喷水操作并观察末端喷出的水滴,若水滴连续顺畅,则可确定该设备能够顺畅喷水。若检测器可检测到连续顺畅的水滴,便可确认该设备喷水正常。
3.内窥镜前端:在医生进行术前准备操作时,空气以及水均从内窥镜内窥镜前端喷出。通过对内窥镜前端进行检测,并计算其与水杯或水滴的相对位置,可以进一步确认水杯与水滴检测的准确性。
在一些实施方式中,所述目标检测器通过标记训练得到。
在一些实施方式中,所述标记训练包括对所述骨干神经网络的预训练。
在一些实施方式中,所述预训练在ImageNet进行。
在一些实施方式中,所述标记训练具体包括:
提供目标初始检测器、训练图像及其对应的标签。
利用所述目标初始检测器对所述训练图像进行目标检测,获得训练检测结果。
基于所述训练检测结果和标签,对所述目标初始检测器进行参数更新,获得所述目标检测器。
作为另一些具体的应用实例,可以采用基于监督的机器学习方法,首先采样如图2所示的场景视频图像作为数据来源,对含有气泡的水杯,和含有连续水滴,内窥镜前端的图片进行标注,经过专业医生进行质量审核之后,形成训练数据集,数据集构建完成后再对CNN模型进行训练,经过闭包测试之后,最终获得准确率较高所述目标检测器。
图4显示上述步骤二中目标检测系统的流程图,其中骨干神经网络可采用当前通用的卷积神经网络,例如ResNet、SqueezeNet、ShuffleNNet、VGGNnet、DenseNet等。单帧图片通过该网络的处理后生成特征图像将作为区域候选网络的输入。区域候选网络为用于区分检测物体和背景的神经网络,该网络会对特征图进行处理,并选出前景目标并输出检测目标的位置信息,算法随后通过该信息可从特征图中截取相应的特征作为最后分类器的输入。本发明中的三分类分类器为softmax分类器。骨干神经网络会预先在ImageNet进行与训练,随后整个网络会在人工收集并标注的水杯,水滴,内窥镜前端图片上进行训练。
在一些实施方式中,步骤3)具体包括:
使所述特征目标及其位置信息进入距离过滤器。
计算所述透明容器与内窥镜的前端之间的第一目标距离。
计算所述连续液滴与内窥镜的前端之间的第二目标距离。
当所述第一目标距离大于第一预设阈值或所述第二目标距离大于第二预设阈值时,使对应的所述特征目标通过所述距离过滤器。
在一些实施方式中,步骤3)具体还包括:
使通过距离过滤器的特征目标进入滑窗过滤器,所述滑窗过滤器包括具有预设队列大小的滑窗队列。
统计连续多个所述特征目标中同类特征目标的总数。
当所述同类特征目标的总数与所述预设队列大小的比值大于预设比例时,使所述特征目标通过所述滑窗过滤器。
为了减小图像检测器误报对算法最后结果的不良影响,本发明通过两步对目标检测器的结果信号进行过滤。第一步,通过水杯,水滴,内窥镜前端的相对位置进行误报过滤,当内窥镜前端与水杯,水滴在评估图像中位置较近,小于或等于一定阈值,则可确定含有气泡的水杯或连续水滴检测正确,反之,若二者之间位置较远,大于一定阈值,则可判断检测到的含有气泡的水杯或连续水滴为误报。第二步,增加了滑窗过滤算法,顺利通过第一步过滤的检测器结果会被送入滑窗队列,当滑窗中同一类别目标超过预设滑窗阈值,再输出最后的目标位置及类别信息。
图5为本发明实施例中目标检测结果信号处理系统(特征过滤器)的结构示例,为本发明实施例中的第二个模块。具体的一些示例中,首先可以通过计算冒泡水杯(即上述含有液体以及气泡的透明容器的简称,下同)与如内窥镜前端相对距离,连续水滴与内窥镜前端的相对距离对目标检测器结果进行第一次误报过滤。该系统第一检测目标为内窥镜软管前端,其中心坐标记为c1,第二检测目标为冒泡水杯,其中心坐标记为c2,第三检测目标连续水滴中心坐标为c3,检测结果可分为以下几种情况:
如图像中检测到冒泡水杯或连续水滴,而未检测到内窥镜软管前端,则判断检测到的水杯,水滴有可能为背景中的噪音,不是真正的目标,判断为错误检测,随后被系统过滤。
若图像中检测到冒泡水杯或连续水滴,以及内窥镜软管前端,则设c1与c2之间的直线距离为d1,若d1在较小范围之内,即,d1∈[0,7cm],则判断冒泡水杯检测为正确,否则如果d1>7cm,水杯距离软管前端距离过远,为背景噪音误报,判断为错误检测,随后被系统过滤.同理设c1与c3之间的直线距离为d2,若d2在较小范围之内,即d2∈[0,7cm],则判断连续水滴检测为正确,否则如果d1>7cm,水滴距离软管前端距离过远,为背景噪音误报,判断为错误检测,随后被系统过滤。
为进一步过滤检测结果,通过距离过滤器的目标会被分别送入喷气和喷水的滑窗过滤器的滑窗队列,Q1,Q2.每个队列的大小均为N,每当有评估图像通过检测器输出目标并通过距离过滤器的冒泡水杯,则向Q1插入1,若评估图像无结果输出,则插入0.当则输出检测到喷气信号,其中t=N/2为预先设定的阈值,Q1i为队列Q1的第i个元素.同理,每当有评估图像检测到连续水滴并通过距离过滤器,则向Q2插入1,若评估图像无结果输出,则插入0.当/>则输出检测到喷气信号,其中t=N/2为预先设定的阈值,Q2i为队列Q2的第i个元素。
在一些实施方式中,步骤4)具体包括:
当所述特征目标通过所述特征过滤时,与所述特征目标的种类对应的计时器开始计时,当后续评估图像对应的特征目标继续通过所述特征过滤时,使所述计时器的计时结果正向增长。
当所述计时结果大于预设时间阈值时,生成所述内窥镜的评估结果为评估通过。
在一些实施方式中,所述评估结果包括喷气评估结果和/或喷水评估结果。
在一些实施方式中,所述计时器包括对应所述喷气评估结果的喷气计时器,所述喷气计时器对应的特征目标包括所述透明容器和内窥镜的前端。
在一些实施方式中,所述计时器还包括对应所述喷水评估结果的喷水计时器,所述喷水计时器对应的特征目标包括所述连续液滴和内窥镜的前端。
上述部分中,通过两次过滤的目标信息会激活相对应的计时器,当喷气质检计时器到达预设数值后,系统输出喷气质检通过,同理,当喷水质检计时器到达预设数值后,系统输出喷水质检通过。
如图6所示,顺利通过过滤的检测结果(特征目标)会触发与之对应的计时器,每次正确检测目标信号会使计时器增加,当计时器累计数值c大于医生预设时间t,评估通过,即所述的内窥镜功能正常
可以理解的,上述的方法以及下述的评估系统,还可以包括输出器,或输出模块,用于将上述内窥镜的功能是否正常的信息输出以使医生能够获知,其输出方式可以是语音,也可以是图像或文本,相应的输出方法及相关设置属于常见的技术手段,在此不再赘述。
继续参见图3-图6,本发明实施例还提供一种内窥镜评估系统,其包括:
摄像模块,用于获取内窥镜的评估图像。
目标检测器,用于通过目标检测获取所述评估图像中的特征目标及其位置信息,所述特征目标至少包括含有液体以及气泡的透明容器、连续液滴以及所述内窥镜的前端。
特征过滤器,用于基于所述特征目标及其位置信息计算所述评估图像中不同种类的特征目标之间的距离,以及计算连续多个所述评估图像中同一种类的特征目标出现的比例,基于所述距离和比例对所述特征目标进行特征过滤。
信号计时器,用于对通过所述特征过滤的特征目标进行连续计时,并基于计时结果获取所述内窥镜的评估结果,所述评估结果用于指示所述内窥镜的喷气和喷水功能是否正常。
上述目标检测器、特征过滤器以及信号计时器构成了本发明实施例提供的基于卷积神经网络的术前准备评估算法,具体的,三个模块分别可以是:1.基于卷积神经网络CNN目标检测器,2.目标检测信号处理算法,3.目标成功检测信号计时器,若连续检测到目标时间超过预定阈值则报告术前准备成功。
作为一具体的应用场景,采用上述内窥镜评估系统及其对应的评估方法进行评估时,其评估准确性可以达95%,医生肉眼评估相当,但是,采用本发明实施例所提供的系统和方法,无需医生消耗额外的精力进行评判,甚至于基于该方法和系统,可以交待给其他医护人员例如护士来替代医生进行专业化的评估,尤其在面临数量较大的待检查或手术的患者时,可以大大节约医生的精力,提高检查或手术的质量以及效率。
综上所述,本发明实施例提供的方法以及系统能够准确的判断内窥镜术前准备是否完成喷气喷水检查准备工作,并准确给出是否通过术前准备工作的指示,避免术中因术前准备不足的原因而导致手术或检查中断的问题,极大地提高了医生进行术前准备的效率,节省了医生的精力。对于内窥镜方法的发展和应用具有巨大意义。
应当理解,上述实施例仅为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。
Claims (6)
1.一种基于卷积神经网络的内窥镜评估方法,所述内窥镜至少具有喷气和喷水两种功能,其特征在于,所述内窥镜评估方法包括:
1)通过摄像模块获取内窥镜的评估图像;
2)利用目标检测器通过目标检测获取所述评估图像中的特征目标及其位置信息,所述特征目标至少包括含有液体以及气泡的透明容器、连续液滴以及所述内窥镜的前端,所述目标检测器包括依次串联的骨干神经网络、区域候选网络以及分类器,所述骨干神经网络用于基于所述评估图像转化生成特征图像,所述区域候选网络用于基于所述特征图像获取检测目标及其位置信息,所述分类器用于将所述检测目标分类为不同种类的所述特征目标;
3)基于所述特征目标及其位置信息计算所述评估图像中不同种类的特征目标之间的距离,以及计算连续多个所述评估图像中同一种类的特征目标出现的比例,基于所述距离和比例对所述特征目标进行特征过滤,其中第一检测目标为内窥镜的前端,其中心坐标记为c1,第二检测目标为含有液体以及气泡的透明容器,其中心坐标记为c2,第三检测目标为连续液滴,其中心坐标记为c3,所述特征过滤的结果包括:
当所述评估图像中检测到含有液体以及气泡的透明容器和/或连续液滴,而未检测到内窥镜的前端时,判断检测到的含有液体以及气泡的透明容器和/或连续液滴为噪音,并判断为错误检测,随后被过滤去除;
当所述评估图像中检测到含有液体以及气泡的透明容器、连续液滴以及所述内窥镜的前端时,则记c1与c2之间的直线距离为d1,当d1[0,7cm]时,判断含有液体以及气泡的透明容器的检测为正确,当d1>7cm时,判定为背景噪音误报,将检测结果判断为错误检测,随后相应的特征目标被过滤去除;
记c1与c3之间的直线距离为d2,当d2[0,7cm]时,判断连续液滴的检测为正确的,当d1>7cm时,判定背景噪音误报,将检测结果判断为错误检测,随后相应的特征目标被过滤去除;
通过距离过滤器的目标会被分别送入喷气和喷水的滑窗过滤器的滑窗队列,Q1,Q2.每个队列的大小均为N,每当有所述评估图像检测到冒泡并通过距离过滤器的特征过滤时,向Q1插入1,当评估图像无结果输出时,则插入0,当> t时,则输出检测到喷气信号,用于指示喷气功能正常,其中t = N/2 为预先设定的阈值,Q1i为队列Q1的第i个元素;
每当有评估图像检测到连续水滴并通过距离过滤器的特征过滤时,则向Q2插入1,若评估图像无结果输出,则插入0,当 > t时,则输出检测到喷水信号,用于指示喷水功能正常,其中t = N/2为预先设定的阈值,Q2i为队列Q2的第i个元素;
4)当所述特征目标通过所述特征过滤时,与所述特征目标的种类对应的计时器开始计时,当后续评估图像对应的特征目标继续通过所述特征过滤时,使所述计时器的计时结果正向增长;
当所述计时结果大于预设时间阈值时,生成所述内窥镜的评估结果为评估通过;
所述评估结果包括喷气评估结果和/或喷水评估结果;
所述计时器包括对应所述喷气评估结果的喷气计时器,所述喷气计时器对应的特征目标包括所述透明容器和内窥镜的前端,表现形式为所述滑窗队列Q1;所述计时器还包括对应所述喷水评估结果的喷水计时器,所述喷水计时器对应的特征目标包括所述连续液滴和内窥镜的前端,表现形式为所述滑窗队列Q2。
2.根据权利要求1所述的内窥镜评估方法,其特征在于,步骤1)中,所述摄像模块固设于术前准备台上,且拍摄方向朝向所述术前准备台的操作平台;
所述摄像模块距离所述操作平台中心为,其中/>。
3.根据权利要求1所述的内窥镜评估方法,其特征在于,所述骨干神经网络包括ResNet、SqueezeNet、ShuffleNet、VGGNet以及DenseNet中的任意一种;
和/或,所述分类器包括softmax分类器。
4.根据权利要求1所述的内窥镜评估方法,其特征在于,所述目标检测器通过标记训练得到;
所述标记训练包括对所述骨干神经网络的预训练;
所述预训练在ImageNet进行。
5.根据权利要求4所述的内窥镜评估方法,其特征在于,所述标记训练具体包括:
提供目标初始检测器、训练图像及其对应的标签;
利用所述目标初始检测器对所述训练图像进行目标检测,获得训练检测结果;
基于所述训练检测结果和标签,对所述目标初始检测器进行参数更新,获得所述目标检测器。
6.一种用于实现权利要求1-5中任意一项所述的内窥镜评估方法的内窥镜评估系统,其特征在于,包括:
摄像模块,用于获取内窥镜的评估图像;
目标检测器,用于通过目标检测获取所述评估图像中的特征目标及其位置信息,所述特征目标至少包括含有液体以及气泡的透明容器、连续液滴以及所述内窥镜的前端;
特征过滤器,用于基于所述特征目标及其位置信息计算所述评估图像中不同种类的特征目标之间的距离,以及计算连续多个所述评估图像中同一种类的特征目标出现的比例,基于所述距离和比例对所述特征目标进行特征过滤;
信号计时器,用于对通过所述特征过滤的特征目标进行连续计时,并基于计时结果获取所述内窥镜的评估结果,所述评估结果用于指示所述内窥镜的喷气和喷水功能是否正常。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210776537.1A CN115082739B (zh) | 2022-07-01 | 2022-07-01 | 基于卷积神经网络的内窥镜评估方法及评估系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210776537.1A CN115082739B (zh) | 2022-07-01 | 2022-07-01 | 基于卷积神经网络的内窥镜评估方法及评估系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115082739A CN115082739A (zh) | 2022-09-20 |
CN115082739B true CN115082739B (zh) | 2023-09-01 |
Family
ID=83258703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210776537.1A Active CN115082739B (zh) | 2022-07-01 | 2022-07-01 | 基于卷积神经网络的内窥镜评估方法及评估系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115082739B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116309605B (zh) * | 2023-05-24 | 2023-08-22 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 基于深度学习和状态转移的内窥镜检查质控方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012070937A (ja) * | 2010-09-28 | 2012-04-12 | Fujifilm Corp | 内視鏡システム |
CN104797186A (zh) * | 2013-03-06 | 2015-07-22 | 奥林巴斯株式会社 | 内窥镜系统 |
KR101875004B1 (ko) * | 2017-01-04 | 2018-07-05 | 금오공과대학교 산학협력단 | 캡슐 내시경 영상을 이용한 자동 출혈 감지 방법 및 컴퓨터 프로그램 |
CN110837760A (zh) * | 2018-08-17 | 2020-02-25 | 北京四维图新科技股份有限公司 | 目标检测方法、用于目标检测的训练方法和装置 |
CN110930429A (zh) * | 2018-09-19 | 2020-03-27 | 杭州海康威视数字技术股份有限公司 | 一种目标跟踪处理方法、装置及设备、可读介质 |
CN111666998A (zh) * | 2020-06-03 | 2020-09-15 | 电子科技大学 | 一种基于目标点检测的内窥镜智能插管决策方法 |
CN113768452A (zh) * | 2021-09-16 | 2021-12-10 | 重庆金山医疗技术研究院有限公司 | 一种电子内窥镜智能计时方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110363049B (zh) * | 2018-04-10 | 2024-01-12 | 阿里巴巴集团控股有限公司 | 图形元素检测识别和类别确定的方法及装置 |
CN110378381B (zh) * | 2019-06-17 | 2024-01-19 | 华为技术有限公司 | 物体检测方法、装置和计算机存储介质 |
WO2021131809A1 (en) * | 2019-12-23 | 2021-07-01 | Sony Group Corporation | Computer assisted surgery system, surgical control apparatus and surgical control method |
WO2022147453A1 (en) * | 2020-12-30 | 2022-07-07 | Stryker Corporation | Systems and methods for classifying and annotating images taken during a medical procedure |
-
2022
- 2022-07-01 CN CN202210776537.1A patent/CN115082739B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012070937A (ja) * | 2010-09-28 | 2012-04-12 | Fujifilm Corp | 内視鏡システム |
CN104797186A (zh) * | 2013-03-06 | 2015-07-22 | 奥林巴斯株式会社 | 内窥镜系统 |
KR101875004B1 (ko) * | 2017-01-04 | 2018-07-05 | 금오공과대학교 산학협력단 | 캡슐 내시경 영상을 이용한 자동 출혈 감지 방법 및 컴퓨터 프로그램 |
CN110837760A (zh) * | 2018-08-17 | 2020-02-25 | 北京四维图新科技股份有限公司 | 目标检测方法、用于目标检测的训练方法和装置 |
CN110930429A (zh) * | 2018-09-19 | 2020-03-27 | 杭州海康威视数字技术股份有限公司 | 一种目标跟踪处理方法、装置及设备、可读介质 |
CN111666998A (zh) * | 2020-06-03 | 2020-09-15 | 电子科技大学 | 一种基于目标点检测的内窥镜智能插管决策方法 |
CN113768452A (zh) * | 2021-09-16 | 2021-12-10 | 重庆金山医疗技术研究院有限公司 | 一种电子内窥镜智能计时方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN115082739A (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2685881B1 (en) | Medical instrument for examining the cervix | |
US20220172828A1 (en) | Endoscopic image display method, apparatus, computer device, and storage medium | |
Zheng et al. | Localisation of colorectal polyps by convolutional neural network features learnt from white light and narrow band endoscopic images of multiple databases | |
CN107256552A (zh) | 息肉图像识别系统及方法 | |
JP7182019B2 (ja) | 画像認識に基づく結腸鏡検査品質評価ワークステーション | |
CN115082739B (zh) | 基于卷积神经网络的内窥镜评估方法及评估系统 | |
JP6716853B2 (ja) | 情報処理装置、制御方法、及びプログラム | |
CN111091559A (zh) | 基于深度学习的小肠镜下淋巴瘤辅助诊断系统 | |
WO2023143014A1 (zh) | 一种基于人工智能的内窥镜辅助检查方法及装置 | |
CN113129287A (zh) | 一种针对上消化道内镜影像的病灶自动留图方法 | |
CN113888518A (zh) | 一种基于深度学习分割、分类多任务的喉咽内镜肿瘤检测及良恶性分类方法 | |
US20230377147A1 (en) | Method and system for detecting fundus image based on dynamic weighted attention mechanism | |
CN111798408B (zh) | 一种内窥镜干扰图像检测与分级系统及方法 | |
CN113017702A (zh) | 超声内镜小探头伸出长度的识别方法、系统及存储介质 | |
Wang et al. | LARNet-STC: Spatio-temporal orthogonal region selection network for laryngeal closure detection in endoscopy videos | |
Ghosh et al. | Block based histogram feature extraction method for bleeding detection in wireless capsule endoscopy | |
Zabulis et al. | Lumen detection for capsule endoscopy | |
CN112419246A (zh) | 量化食管粘膜IPCLs血管形态分布的深度检测网络 | |
CN114332025B (zh) | 消化内镜口咽通过时间自动检测系统及方法 | |
CN112862754B (zh) | 一种基于智能识别的留图漏检提示系统和方法 | |
Li et al. | Computer aided detection of bleeding in capsule endoscopy images | |
CN114693912A (zh) | 具有眼球追功能的内镜检查系统、存储介质及设备 | |
CN111446003A (zh) | 基于视觉识别的传染疾病检测机器人及其检测方法 | |
CN113012198B (zh) | 颅内外血管吻合术中的血流自动定量分析方法 | |
Urooj et al. | Computer-Aided System for Pneumothorax Detection through Chest X-ray Images using Convolutional Neural Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |