CN112861849B - 一种脊柱畸形矫正手术术中组织识别方法 - Google Patents

一种脊柱畸形矫正手术术中组织识别方法 Download PDF

Info

Publication number
CN112861849B
CN112861849B CN202011591568.7A CN202011591568A CN112861849B CN 112861849 B CN112861849 B CN 112861849B CN 202011591568 A CN202011591568 A CN 202011591568A CN 112861849 B CN112861849 B CN 112861849B
Authority
CN
China
Prior art keywords
network
target
rpn
spinal deformity
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011591568.7A
Other languages
English (en)
Other versions
CN112861849A (zh
Inventor
杨明轩
毕佳鹏
管迎春
海涌
张希诺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202011591568.7A priority Critical patent/CN112861849B/zh
Publication of CN112861849A publication Critical patent/CN112861849A/zh
Application granted granted Critical
Publication of CN112861849B publication Critical patent/CN112861849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30008Bone
    • G06T2207/30012Spine; Backbone

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种脊柱畸形矫正手术术中组织识别方法,基于Faster R‑CNN算法模型,通过采集术野中图像并标记术野中主要区域构建脊柱畸形术中组织识别深度学习图像库。通过将标记后的图像输入构建的算法框架中提取其主要特征,训练算法模型中的各个参数,将待检测的图片输入训练完成的算法模型中,根据待测图片各区域图像特征对区域中物体位置与类别做出判断。本发明可有效识别脊柱畸形矫正手术术野中的主要区域,为脊柱畸形矫正手术提供导航。

Description

一种脊柱畸形矫正手术术中组织识别方法
技术领域
本发明涉及图像处理技术领域,具体涉及一种脊柱畸形矫正手术术中组织识别方法。
背景技术
脊柱畸形是发生于任何年龄的一类疾病,由于脊柱畸形常常涉及到多种解剖结构的变异,使脊柱畸形矫正手术成为脊柱外科领域难度高、风险大的治疗方式。目前脊柱畸形矫正手术对术中组织的识别主要依靠人工识别,这种识别方式高度依赖医生的经验,这无疑增加了手术的难度与不确定性。通过对手术术野进行实时监测与目标识别可为医生的手术方案提供参考,有效增加手术的安全性,并有利于医疗机器人于该手术中的应用。
传统的图像识别技术常根据物体的颜色、形状、纹理等特征对物体进行识别,难以对较为复杂的物体进行有效的识别。
因此,如何提供一种脊柱畸形矫正手术中对目标区域精确识别的术中组织识别方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种脊柱畸形矫正手术术中组织识别方法,运用FasterR-CNN算法模型,通过构建脊柱畸形术中组织识别深度学习图像库与合理设置模型框架,通过多轮参数训练最终实现脊柱畸形矫正手术中相关组织的识别。
为了实现上述目的,本发明采用如下技术方案:
一种脊柱畸形矫正手术术中组织识别方法,包括如下步骤:
S1、采集多张脊柱畸形矫正手术术中场景图像,并对场景图像中的组织目标进行标注,构建得到深度学习图像库;
S2、以去除全连接层的卷积神经网络RESNET50作为特征提取网络,在特征提取网络的最后一个卷积层后方插入RPN网络用于生成候选框,网络后方添加ROI池化层与全连接层用于输出检测结果,得到目标检测模型;
S3、通过深度学习图像库中标注好的场景图像训练S2中目标检测构建的模型。
S4、将深度学习图像输入至修改后的卷积神经网络RESNET进行组织目标的图像特征提取,得到图像特征图;
S5、将所述图像特征图输入至RPN网络,生成包含组织目标的候选框,将候选框投影到特征图上获得相应的特征矩阵;
S6、将S5所得特征矩阵通过ROI池化层进行缩放,将缩放的特征图展平输入到全连接层中即可得到预测结果。
优选的,所述组织目标包括:脊突、椎板、矫正器械和手术工具。
优选的,所述目标检测模型使用Resnet50残差网络作为特征提取网络,对输入场景图像进行组织目标的特征提取。
优选的,所述S5具体包括:
通过RPN网络生成针对组织区域的初始检测框:在特征图中参照anchor box每一点设置多个不同尺寸、不同长宽比的初始检测框;
对生成的初始检测框通过RPN判断初始检测框中是否存在目标并对初始检测框位置与大小进行调整,最终生成包含目标的候选框。
优选的,所述S6中通过RPN网络收集候选框,将候选框与特征图对应位置相结合生成特征矩阵。
经由上述的技术方案可知,与现有技术相比,本发明的有益效果包括:
(1)将深度学习算法模型应用到脊柱畸形矫正手术中,通过合理设置算法模型结构与优化算法参数实现目标区域的精确识别。
(2)通过正确设置算法工作流程,在经过三百张手术图像的100轮训练之后,使整个检测过程达到识别平均准确率50%,部分目标识别准确率达90%以上的效果,而对每张图像的识别时间仅为2-3s。
(3)基于一定标准的对术中图像进行识别,在一定程度上避免了个人主观因素对识别结果的干扰,提高手术的成功率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图;
图1为本发明实施例提供的脊柱畸形手术术中组织识别的算法流程示意图;
图2为本发明实施例提供的特征提取网络Resnet50示意图;
图3为本发明实施例提供的脊柱畸形手术术中组织识别的具体训练检测过程示意图
图4为本发明实施例提供的脊柱畸形手术术中组织识别结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例公开的一种脊柱畸形矫正手术术中组织识别方法,目的是基于深度学习技术,参考Faster R-CNN算法框架,通过合理配置Resnet50卷积神经网络及RPN目标区域生成网络,有效的提取脊柱畸形矫正手术术中图像各区域主要特征。通过大量手术图像的多轮训练,训练算法模型中的各个参数,从而实现对手术中复杂场景下各目标区域的mAP50%以上的准确率,该发明将主要用于脊柱畸形矫正手术术中组织区域的识别中。
深度学习是机器学习领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能。深度学习依赖于大量的数据训练模型,而医疗影像庞大的数据量以及本身客观、可量化的特点,非常符合深度学习的应用场景。目前深度学习已广泛应用于医学影像处理,对医学领域中常见的分类、检测、分割等任务皆取得了较好的效果。目前常见的用于目标检测的深度学习算法包括Faster R-CNN、YOLO、SSD等,其中Faster R-CNN凭借其较高的识别精确度而得到广泛的应用。
本实施例中在Faster R-CNN框架的基础上引入RPN生成可能的目标区域,RPN的本质是“基于滑窗的无类别目标检测器”,算法模型工作时通过对RPN生成的候选区域进行分类与回归得到最终目标区域。目前世界上众多研究机构包括谷歌、微软等都在从事深度学习的算法研究,本实施例将深度学习应用在外科手术医学上。
参见图1,本实施例设计了脊柱畸形矫正手术中相关组织实时识别方法,其主要思想是参照深度学习原理利用脊柱畸形矫正手术术中存在的主要物体对模型参数进行训练进而实现自动识别场景中类似目标的能力。算法模型的训练首先构建脊柱畸形术中组织识别深度学习图像库,标注足够数量的手术图像中的脊突、椎板、手术器械、骨钉、连接杆等区域。在训练时将这些包含各目标区域信息的图像输入到搭建好的算法模型中,通过反向传播算法训练模型中的各个参数。在完成模型参数之后,将待检测的手术过程图像输入到训练完成的模型中,通过对各目标区域的特征提取最终得到图片中的目标区域的类别与位置信息。
具体实现步骤如下:
S1、在构建算法模型之前首先采集一定数量的脊柱畸形矫正手术术中场景图像,通过人工对场景中的主要区域,包括脊突、椎板、手术器械、骨钉、骨钉之间的连接杆等区域进行标注,并生成可输入算法模型的相关文件,从而构建用于训练算法模型参数的深度学习图像库。
S2、构建整个脊柱畸形矫正手术术中组织识别网络,具体的,以去除全连接层的卷积神经网络RESNET50作为特征提取网络,在主干网络的最后一个卷积层后方插入RPN网络用于生成候选框,网络后方添加ROI池化层与全连接层用于输出检测结果,得到目标检测模型。
本发明构建的目标检测网络参照Faster R-CNN。通过大量的图像资源的多轮训练不断优化模型参数,最终实现快速精准识别场景中主要目标的效果。
S3、通过深度学习图像库中标注完成的场景图像训练S2中构建的目标检测模型。
本发明中,以标注完成的手术图像对模型进行训练,训练过程可分为四步:首先利用网络中下载的ImageNet预训练分类模型初始化去除全连接层的Resnet50网络中的卷积层参数,并开始单独训练RPN网络参数;固定RPN网络参数,利用RPN生成的建议框训练其余网络;固定Resnet50网络参数,微调RPN网络参数;固定Resnet50网络参数,微调后方全连接层参数。
S4、将深度学习图像输入至去除全连接层的卷积神经网络RESNET50进行组织目标的图像特征提取,得到图像特征图。
本实施例中,用于提取图像特征的主干网络Resnet50如图2所示。本发明训练图像与测试图像皆为RGB三通道彩色图像,且图像质量较高,目前各种目标模型无法直接对原始图像进行处理,需通过卷积运算提取图像的特征,本发明所使用的卷积神经网络为Resnet50。Resnet50是目前常用的一种残差网络,包含50层卷积层,Resnet50与众多残差网络类似,通过将网络某几层的数据进行层级的跳跃作为网络后方的某些层的输入以提升算法的准确率。Resnet50主要由Conv Block与Identity Block两模块构成,二者的主要区别是Conv Block对数据处理前后存在尺寸的改变而Identity Block处理后数据尺寸不发生改变。在模块内部对数据的处理方式皆为卷积运算、数据归一化、Relu激活函数处理。通过多层卷积运算的叠加,Resnet50可实现对输入图像特征的提取。
S5、将所述图像特征图输入至RPN网络,生成包含组织目标的候选框,将候选框投影到特征图上获得相应的特征矩阵。
整个检测过程如图3所示,候选区域的生成方式为RPN搭配anchor box,RPN位于最后一个卷积层的后方,通过在神经网络生成的特征图中滑动,生成物体的大体位置信息,通过Resnet50对图像的处理可生成包含图像特征的特征图,特征图中每一点包含原始图像相关区域的图像信息。本发明通过RPN网络生成可能包含目标区域的建议框。在特征图中参照anchor box每一点设置多个不同尺寸、不同长宽比的初始检测框,之后对生成的初始检测框通过卷积运算判断检测框中是否存在目标并对检测框位置与大小进行调整,最终生成包含各类物体的建议框。anchor box主要应对目标形状的变化问题,通过生成长宽比各不相同的数个候选框适应不同的目标形状。
S6、将S5得到的特征矩阵通过ROI池化层进行缩放,将缩放的特征图展平输入到全连接层中即可得到预测结果。
ROI池化将不同尺寸的特征矩阵缩放为固定尺寸的输出,方便后方全连接层对数据的处理。在后续网络中分别设置用于对特征矩阵进行分类与位置回归的全连接层,从而最终实现对术中目标的识别,其最终识别结果如图4所示。
以上对本发明所提供的脊柱畸形矫正手术术中组织识别方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (5)

1.一种脊柱畸形矫正手术术中组织识别方法,其特征在于,包括如下步骤:
S1、采集多张脊柱畸形矫正手术术中场景图像,并对场景图像中的组织目标进行标注,构建得到深度学习图像库;
S2、以去除全连接层的卷积神经网络RESNET50作为特征提取网络,在特征提取网络的最后一个卷积层后方插入RPN网络用于生成候选框,网络后方添加ROI池化层与全连接层用于输出检测结果,得到目标检测模型;
S3、通过深度学习图像库中标注好的场景图像训练S2中构建的目标检测模型,训练过程分为四步:
首先利用网络中下载的ImageNet预训练分类模型初始化去除全连接层的Resnet50网络中的卷积层参数,并开始单独训练RPN网络参数;
固定RPN网络参数,利用RPN生成的建议框训练其余网络;
固定Resnet50网络参数,微调RPN网络参数;
固定Resnet50网络参数,微调后方全连接层参数;
S4、将深度学习图像输入至修改后的卷积神经网络RESNET50进行组织目标的图像特征提取,得到图像特征图;
S5、将所述图像特征图输入至RPN网络,生成包含组织目标的候选框,将候选框投影到特征图上获得相应的特征矩阵;
S6、将S5得到的特征矩阵通过ROI池化层进行缩放,将缩放的特征图展平输入到全连接层中即可得到预测结果。
2.根据权利要求1所述的脊柱畸形矫正手术术中组织识别方法,其特征在于,所述组织目标包括:脊突、椎板、矫正器械和手术工具。
3.根据权利要求1所述的脊柱畸形矫正手术术中组织识别方法,其特征在于,所述目标检测模型使用Resnet50残差网络作为主干网络,对输入场景图像进行组织目标的特征提取。
4.根据权利要求1所述的脊柱畸形矫正手术术中组织识别方法,其特征在于,所述S5具体包括:
通过RPN网络生成针对组织区域的初始检测框:在特征图中参照anchor box每一点设置多个不同尺寸、不同长宽比的初始检测框;
对生成的初始检测框通过RPN网络判断初始检测框中是否存在目标并对初始检测框位置与大小进行调整,最终生成包含目标的候选框。
5.根据权利要求1所述的脊柱畸形矫正手术术中组织识别方法,其特征在于,所述S6中通过RPN网络收集候选框,将候选框与特征图对应位置相结合生成特征矩阵。
CN202011591568.7A 2020-12-29 2020-12-29 一种脊柱畸形矫正手术术中组织识别方法 Active CN112861849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011591568.7A CN112861849B (zh) 2020-12-29 2020-12-29 一种脊柱畸形矫正手术术中组织识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011591568.7A CN112861849B (zh) 2020-12-29 2020-12-29 一种脊柱畸形矫正手术术中组织识别方法

Publications (2)

Publication Number Publication Date
CN112861849A CN112861849A (zh) 2021-05-28
CN112861849B true CN112861849B (zh) 2023-01-10

Family

ID=75998083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011591568.7A Active CN112861849B (zh) 2020-12-29 2020-12-29 一种脊柱畸形矫正手术术中组织识别方法

Country Status (1)

Country Link
CN (1) CN112861849B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110826476A (zh) * 2019-11-02 2020-02-21 国网浙江省电力有限公司杭州供电公司 识别目标物体的图像检测方法、装置、电子设备和存储介质
CN111047572A (zh) * 2019-12-10 2020-04-21 南京安科医疗科技有限公司 一种基于Mask RCNN的医学图像中脊柱自动定位方法
WO2020181685A1 (zh) * 2019-03-12 2020-09-17 南京邮电大学 一种基于深度学习的车载视频目标检测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509839A (zh) * 2018-02-02 2018-09-07 东华大学 一种基于区域卷积神经网络高效的手势检测识别方法
CN108961229A (zh) * 2018-06-27 2018-12-07 东北大学 基于深度学习的心血管oct影像易损失斑块检测方法及系统
CN110210463B (zh) * 2019-07-03 2023-07-11 中国人民解放军海军航空大学 基于Precise ROI-Faster R-CNN的雷达目标图像检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020181685A1 (zh) * 2019-03-12 2020-09-17 南京邮电大学 一种基于深度学习的车载视频目标检测方法
CN110826476A (zh) * 2019-11-02 2020-02-21 国网浙江省电力有限公司杭州供电公司 识别目标物体的图像检测方法、装置、电子设备和存储介质
CN111047572A (zh) * 2019-12-10 2020-04-21 南京安科医疗科技有限公司 一种基于Mask RCNN的医学图像中脊柱自动定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于改进Mask RCNN和Kinect的服务机器人物品识别系统;石杰 等;《仪器仪表学报》;20190430;第40卷(第4期);第2页右栏第2段至第7页左栏第1段 *

Also Published As

Publication number Publication date
CN112861849A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
US10706333B2 (en) Medical image analysis method, medical image analysis system and storage medium
US20210042564A1 (en) Medical image recognition method, model training method, and computer device
CN107895367B (zh) 一种骨龄识别方法、系统及电子设备
WO2021017297A1 (zh) 基于人工智能的脊柱影像处理方法及相关设备
US9480439B2 (en) Segmentation and fracture detection in CT images
CN107480677B (zh) 一种识别三维ct图像中感兴趣区域的方法及装置
CN110084318B (zh) 一种结合卷积神经网络和梯度提升树的图像识别方法
JP2021530061A (ja) 画像処理方法及びその装置、電子機器並びにコンピュータ可読記憶媒体
US20200327721A1 (en) Autonomous level identification of anatomical bony structures on 3d medical imagery
CN112102237A (zh) 基于半监督学习的脑部肿瘤识别模型的训练方法及装置
CN108765392B (zh) 一种基于滑动窗口的消化道内镜病变检测和识别方法
CN111243730B (zh) 一种基于乳腺超声影像的乳腺病灶智能分析方法及系统
CN108062749B (zh) 肛提肌裂孔的识别方法、装置和电子设备
CN112037200A (zh) 一种医学影像中解剖特征自动识别与模型重建方法
CN112215858A (zh) 用于图像分割和识别的方法和系统
CN110969619B (zh) 一种自动识别鼻咽癌原发肿瘤的方法及装置
US20230177698A1 (en) Method for image segmentation, and electronic device
CN110880177A (zh) 一种图像识别方法及装置
CN108898601B (zh) 基于随机森林的股骨头图像分割装置及分割方法
CN112861849B (zh) 一种脊柱畸形矫正手术术中组织识别方法
CN109816665B (zh) 一种光学相干断层扫描图像的快速分割方法及装置
CN115393351B (zh) 一种基于朗格汉斯细胞判断角膜免疫状态的方法及装置
CN111667469A (zh) 肺部疾病分类方法、装置及设备
CN112651400B (zh) 一种立体内窥镜辅助检测方法、系统、装置及存储介质
CN113962957A (zh) 医学图像处理方法、骨骼图像处理方法、装置、设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant