CN113744319A - 一种胶囊胃镜轨迹跟踪方法及装置 - Google Patents

一种胶囊胃镜轨迹跟踪方法及装置 Download PDF

Info

Publication number
CN113744319A
CN113744319A CN202111303021.7A CN202111303021A CN113744319A CN 113744319 A CN113744319 A CN 113744319A CN 202111303021 A CN202111303021 A CN 202111303021A CN 113744319 A CN113744319 A CN 113744319A
Authority
CN
China
Prior art keywords
picture
capsule gastroscope
sample
feature
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111303021.7A
Other languages
English (en)
Other versions
CN113744319B (zh
Inventor
吴家豪
招展鹏
李青原
方堉欣
王羽嗣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Side Medical Technology Co ltd
Original Assignee
Guangzhou Side Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Side Medical Technology Co ltd filed Critical Guangzhou Side Medical Technology Co ltd
Priority to CN202111303021.7A priority Critical patent/CN113744319B/zh
Publication of CN113744319A publication Critical patent/CN113744319A/zh
Application granted granted Critical
Publication of CN113744319B publication Critical patent/CN113744319B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10068Endoscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30092Stomach; Gastric

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种胶囊胃镜轨迹跟踪方法及装置,该方法包括:获取胶囊胃镜拍摄到的视频图片序列;将所述视频图片序列中每一帧图片依次输入到训练好的图片特征提取模型中,得到每一帧图片的图片特征点和对应的特征描述符;根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪。本发明通过将深度学习网络和ORB SLAM3算法结合,实现在使用卷积神经网络提取特征向量的基础上,通过ORB SLAM3算法对图片特征进行匹配跟踪,提高所提取特征的鲁棒性,从而对胶囊胃镜的轨迹跟踪实现精密定位。

Description

一种胶囊胃镜轨迹跟踪方法及装置
技术领域
本发明涉及图像处理技术领域,尤其涉及一种胶囊胃镜轨迹跟踪方法及装置。
背景技术
现有对于胶囊胃镜轨迹跟踪方法主要分为两种,一种是使用内带磁标记物的胶囊,另一种是需要另外对胃部进行染色。
对于第一种方法的实现,需要提供多个磁场传感器,磁场传感器分布固定在体表设定位置,并与体外定位控制装置的电源管理器和多路开关相连,用于捕获胶囊在体内的三维运动轨迹。对于使用内带磁标记物的胶囊进行胶囊轨迹跟踪,检测者需要佩戴多个磁场传感器在身上,这也会给检测者在检测过程中造成不便;其次,每个磁场传感器必须固定在体表设定位置,对于不同体型的检测者或者佩戴过程中出现传感器移动,都会对后续检测准确性造成影响。因此该方法存在使用不便及固定不易等问题,导致跟踪容易失败。
而对于第二种方法,需要先对检测者胃部进行染色,增强胃部图像特征,从而能够从胶囊拍摄图片中更好提取图片特征,实现胶囊轨迹跟踪计算。对于额外使用染色剂的方法,由于需要检测者在检测时额外使用染色剂,在医生检测识别病灶时,受到染色剂的影响,医生辨别病灶的难度会大大提高,这种方法就起到一种适得其反的效果,即使能跟踪到胶囊的运动轨迹,到最终反而影响到图片的准确性,不适合实际应用。
基于上述现有技术在对胶囊胃镜的轨迹跟踪时,存在的跟踪准确率较低的问题,现在亟需一种胶囊胃镜轨迹跟踪方法及装置来解决上述问题。
发明内容
针对现有技术存在的问题,本发明提供一种胶囊胃镜轨迹跟踪方法及装置。
本发明提供一种胶囊胃镜轨迹跟踪方法,包括:
获取胶囊胃镜拍摄到的视频图片序列;
将所述视频图片序列中每一帧图片依次输入到训练好的图片特征提取模型中,得到每一帧图片的图片特征点和对应的特征描述符,其中,所述训练好的图片特征提取模型是由样本视频图片,对卷积神经网络进行训练得到的,所述样本视频图片上标记有样本图片特征点和所述样本图片特征点对应的样本特征描述符;
根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪。
根据本发明提供的一种胶囊胃镜轨迹跟踪方法,所述训练好的图片特征提取模型通过以下步骤得到:
通过SIFT算法,对每张样本视频图片的样本图片特征点进行特征提取标定,并获取所述样本图片特征点对应的特征描述符,构建得到训练样本集;
将所述训练样本集输入到学习不变特征变换网络进行训练,得到训练好的图片特征提取模型。
根据本发明提供的一种胶囊胃镜轨迹跟踪方法,所述根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪,包括:
根据所述图片特征点和所述特征描述符,通过g2o算法,对胶囊胃镜位姿进行估计,得到第一3D位置坐标,所述第一3D位置坐标为胶囊胃镜的3D位置坐标;
根据所述图片特征点的位置坐标和所述第一3D位置坐标,通过g2o算法,对所述图片特征点的3D位置坐标进行估计,得到第二3D位置坐标;
根据所述第一3D位置坐标和所述第二3D位置坐标,对胶囊胃镜进行轨迹跟踪。
根据本发明提供的一种胶囊胃镜轨迹跟踪方法,在所述根据所述图片特征点和所述特征描述符,通过g2o算法,对胶囊胃镜位姿进行估计,得到第一3D位置坐标之前,所述方法还包括:
通过GMS算法,对所述图片特征点和所述特征描述符进行匹配,并将匹配后的图片特征点和特征描述符,用于胶囊胃镜的轨迹跟踪。
根据本发明提供的一种胶囊胃镜轨迹跟踪方法,在所述根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪之后,所述方法还包括:
根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法对视频图片序列中每一帧图片进行重识别及回环检测,得到胶囊胃镜的轨迹跟踪结果。
本发明还提供一种胶囊胃镜轨迹跟踪装置,包括:
图像获取模块,用于获取胶囊胃镜拍摄到的视频图片序列;
特征提取模块,用于将所述视频图片序列中每一帧图片依次输入到训练好的图片特征提取模型中,得到每一帧图片的图片特征点和对应的特征描述符,其中,所述训练好的图片特征提取模型是由样本视频图片,对卷积神经网络进行训练得到的,所述样本视频图片上标记有样本图片特征点和所述样本图片特征点对应的样本特征描述符;
跟踪模块,用于根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪。
根据本发明提供的一种胶囊胃镜轨迹跟踪装置,所述装置还包括:
样本构建模块,用于通过SIFT算法,对每张样本视频图片的样本图片特征点进行特征提取标定,并获取所述样本图片特征点对应的特征描述符,构建得到训练样本集;
训练模块,用于将所述训练样本集输入到学习不变特征变换网络进行训练,得到训练好的图片特征提取模型。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述胶囊胃镜轨迹跟踪方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述胶囊胃镜轨迹跟踪方法的步骤。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述胶囊胃镜轨迹跟踪方法的步骤。
本发明提供的一种胶囊胃镜轨迹跟踪方法及装置,通过将深度学习网络和ORBSLAM3算法结合,实现在使用卷积神经网络提取特征向量的基础上,通过ORB SLAM3算法对图片特征进行匹配跟踪,提高所提取特征的鲁棒性,从而对胶囊胃镜的轨迹跟踪实现精密定位。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的胶囊胃镜轨迹跟踪方法的流程示意图;
图2为本发明提供的胶囊胃镜轨迹跟踪装置的结构示意图;
图3为本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明采集到的用于胶囊胃镜轨迹跟踪的视频图像以及用于模型训练的样本视频图像,是通过胶囊胃镜拍摄得到的,胶囊胃镜的工作过程及特点主要包括:1、胶囊胃镜从口腔进入消化道后再自然排出体外;2、胶囊胃镜的电池续航力有限,其有效工作区间为口腔、食道、胃、十二指肠、小肠和大肠一部分;3、胶囊胃镜的每次活动都会产生域内检查图片和域外检查图片,其中,域内检查图片是通过对消化道某一段进行拍摄得到的,域外检查图片是指除了域内检查图片以外,胶囊胃镜顺便拍到的图片;4、每粒胶囊胃镜每次可以拍摄的原始图片的数量可以为2000~3000张,即胶囊胃镜获取到的图片集中的图片数量。
针对现有胶囊胃镜轨迹跟踪的方法存在使用不便、跟踪准确率较低较低的问题,本发明提供了一种纯视觉单目的胶囊胃镜轨迹跟踪方法,适用于被动式胶囊的轨迹跟踪,能够更准确的跟踪胶囊轨迹。同时,由于不需要使用磁场传感器和对肠胃使用染色剂,保证能稳定跟踪胶囊胃镜轨迹。
图1为本发明提供的胶囊胃镜轨迹跟踪方法的流程示意图,如图1所示,本发明提供了一种胶囊胃镜轨迹跟踪方法,包括:
步骤101,获取胶囊胃镜拍摄到的视频图片序列。
在本发明中,通过胶囊胃镜的拍摄过程,获取未经任何处理的胶原始视频图片序列(JPG格式),然后对该原始视频图片序列进行图像预处理,得到用于后续胶囊胃镜轨迹跟踪的视频图片序列。需要说明的是,在本发明中,胶囊胃镜拍摄得到的原始视频图片序列为实时拍摄得到的。
步骤102,将所述视频图片序列中每一帧图片依次输入到训练好的图片特征提取模型中,得到每一帧图片的图片特征点和对应的特征描述符,其中,所述训练好的图片特征提取模型是由样本视频图片,对卷积神经网络进行训练得到的,所述样本视频图片上标记有样本图片特征点和所述样本图片特征点对应的样本特征描述符。
在本发明中,训练好的图片特征提取模型是由学习不变特征变换网络(LearnedInvariant Feature Transform,简称LIFT)构建并通过训练得到的,LIFT网络实现了图像特征点检测、方向估计以及描述符提取,并采用了空间转换层来修正特征点和方向估计。进一步地,将上述实施例得到的视频图片,按帧顺序输入训练好的图片特征提取模型,提取得到每一帧图片的特征点和特征点对应的特征描述符提。
步骤103,根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪。
在本发明中,通过ORB SLAM3算法,根据每一帧图片的图片特征点和特征描述符,估计胶囊胃镜在拍摄当前帧图片时的三维空间位置坐标,并根据估计得到三维空间位置坐标对胶囊胃镜进行实时跟踪。
本发明提供的胶囊胃镜轨迹跟踪方法,通过将深度学习网络和ORB SLAM3算法结合,实现在使用卷积神经网络提取特征向量的基础上,通过ORB SLAM3算法对图片特征进行匹配跟踪,提高所提取特征的鲁棒性,从而对胶囊胃镜的轨迹跟踪实现精密定位。
在上述实施例的基础上,所述训练好的图片特征提取模型通过以下步骤得到:
通过SIFT算法,对每张样本视频图片的样本图片特征点进行特征提取标定,并获取所述样本图片特征点对应的特征描述符,构建得到训练样本集。
尺度不变特征转换算法(Scale-Invariant Feature Transform,简称SIFT)是一种计算机视觉的算法,该算法可用于侦测与描述影像中的局部影像特征(即图片特征点),在空间尺度中寻找极值点,并提取出其位置、尺度和旋转不变量。进一步地,局部影像特征的描述与侦测可以帮助辨识物体,该特征是基于物体上的一些局部外观的兴趣点,而与影像的大小和旋转无关。SIFT算法的实质是在不同的尺度空间上查找关键点(特征点),并计算出关键点的方向。通过SIFT算法所查找到的关键点,是一些十分突出,不会因光照,仿射变换和噪音等因素而变化的点,如角点、边缘点、暗区的亮点及亮区的暗点等。由于每一个关键点拥有三个信息:位置、尺度以及方向,SIFT算法接下来就是为每个关键点建立一个描述符,使其不随各种变化而改变,比如光照变化、视角变化等等,并且描述符具有较高的独特性,从而提高特征点正确匹配的概率。
将所述训练样本集输入到学习不变特征变换网络进行训练,得到训练好的图片特征提取模型。
在本发明中,采用SIFT算法对样本视频图片进行特征提取标定,以此作为训练集合。然后,随机选取batch size张样本图片输入LIFT Net进行模型训练。在本发明中,将SIFT算法所获得每帧样本图片对应的图片特征点和特征描述符数据作为ground true,并根据LIFT Net在训练过程中预测得到每帧样本图片的图片特征点和特征描述符数据,通过回归损失函数计算网络损失值;根据每一轮训练计算得到的网络损失值对LIFT网络进行反向求导,并进行参数优化;在进行多轮训练之后,当loss值降低到指定预定值则停止训练,得到训练好的图片特征提取模型。
本发明使用深度学习算法来对图片实现特征描述符提取,代替传统视觉算法,保持算法实时性,也保证在胃壁这种特征少,图像模糊的情况下,也能很好提取图像特征,实现特征匹配。
在上述实施例的基础上,所述根据所述图片特征点和所述特征描述符,通过ORBSLAM3算法,对胶囊胃镜进行轨迹跟踪,包括:
根据所述图片特征点和所述特征描述符,通过g2o算法,对胶囊胃镜位姿进行估计,得到第一3D位置坐标,所述第一3D位置坐标为胶囊胃镜的3D位置坐标。
在本发明中,将上述实施例通过图片特征提取模型提取得到的图片特征点和特征描述符输入到ORB SLAM3算法中,使用g2o(General Graph Optimization)算法实时对胶囊胃镜的相机位姿进行估计,得到相机3D位置,即第一3D位置坐标。
根据所述图片特征点的位置坐标和所述第一3D位置坐标,通过g2o算法,对所述图片特征点的3D位置坐标进行估计,得到第二3D位置坐标。
在本发明中,根据图片特征点位置坐标及胶囊胃镜的相机估计3D位置,使用g2o算法对该图片特征点的3D坐标进行估计,从而得到第二3D位置坐标。
根据所述第一3D位置坐标和所述第二3D位置坐标,对胶囊胃镜进行轨迹跟踪。
在本发明中,ORB SLAM3算法基于g2o算法估计得到的相机3D位置和图片特征点3D坐标,对胶囊胃镜的运动轨迹进行实时跟踪。
优选地,在上述实施例的基础上,在所述根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪之后,包括:
根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法对视频图片序列中每一帧图片进行重识别及回环检测,得到胶囊胃镜的轨迹跟踪结果。
在本发明中,在对胶囊胃镜进行轨迹跟踪时,当得到胶囊胃镜的轨迹跟踪结果后,此时可对该轨迹跟踪结果进行优化,通过ORB SLAM3算法对全局进行重识别及回环检测,从而对全局跟踪进行一个整体的优化。这是为了避免胶囊胃镜拍照频率低或快速移动旋转时,造成视频中断而导致跟踪失败的情况,凭借ORB SLAM3算法的重定位和回环检测,可以很好地解决因视频中断而造成的跟踪失败。
在上述实施例的基础上,在所述根据所述图片特征点和所述特征描述符,通过g2o算法,对胶囊胃镜位姿进行估计,得到第一3D位置坐标之前,所述方法还包括:
通过GMS算法,对所述图片特征点和所述特征描述符进行匹配,并将匹配后的图片特征点和特征描述符,用于胶囊胃镜的轨迹跟踪。
在本发明中,使用GMS(Grid-based Motion Statistics)算法,对图片特征提取模型提取得到的图片特征点和特征描述符进行特征点匹配,当图片特征点和特征描述符完成匹配后,再通过匹配后的图片特征点进行胶囊胃镜的轨迹跟踪。相比于现有直接使用BFMatch算法进行暴力特征匹配,GMS匹配算法能关注局部大量正确匹配区域,匹配准确率更高,在胶囊胃镜图片中,减少漂浮物及黑色边框对特征匹配影响。
在一实施例中,运用本发明提供的胶囊胃镜跟踪方法,当胶囊胃镜在拍摄视频时,采集胶囊胃镜拍摄图片的设备会把这些图片实时反馈到移动终端(例如,手机、平板电脑),移动终端通过无线网络把图片传输到服务器,最后,服务器实时对胶囊胃镜拍摄的图片进行跟踪计算,估计出胶囊胃镜在胃部具体位置以及移动轨迹,并实时反馈位置结果到移动终端。
图2为本发明提供的胶囊胃镜轨迹跟踪装置的结构示意图,如图2所示,本发明提供了一种胶囊胃镜轨迹跟踪装置,包括图像获取模块201、特征提取模块202和跟踪模块203,其中,图像获取模块201用于获取胶囊胃镜拍摄到的视频图片序列;特征提取模块202用于将所述视频图片序列中每一帧图片依次输入到训练好的图片特征提取模型中,得到每一帧图片的图片特征点和对应的特征描述符,其中,所述训练好的图片特征提取模型是由样本视频图片,对卷积神经网络进行训练得到的,所述样本视频图片上标记有样本图片特征点和所述样本图片特征点对应的样本特征描述符;跟踪模块203用于根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪。
本发明提供的胶囊胃镜轨迹跟踪装置,通过将深度学习网络和ORB SLAM3算法结合,实现在使用卷积神经网络提取特征向量的基础上,通过ORB SLAM3算法对图片特征进行匹配跟踪,提高所提取特征的鲁棒性,从而对胶囊胃镜的轨迹跟踪实现精密定位。
在上述实施例的基础上,所述装置还包括样本构建模块和训练模块,其中,样本构建模块用于通过SIFT算法,对每张样本视频图片的样本图片特征点进行特征提取标定,并获取所述样本图片特征点对应的特征描述符,构建得到训练样本集;训练模块用于将所述训练样本集输入到学习不变特征变换网络进行训练,得到训练好的图片特征提取模型。
在上述实施例的基础上,所述跟踪模块包括相机3D坐标计算单元、特征点3D坐标计算单元和第一处理单元,其中,相机3D坐标计算单元用于根据所述图片特征点和所述特征描述符,通过g2o算法,对胶囊胃镜位姿进行估计,得到第一3D位置坐标,所述第一3D位置坐标为胶囊胃镜的3D位置坐标;特征点3D坐标计算单元用于根据所述图片特征点的位置坐标和所述第一3D位置坐标,通过g2o算法,对所述图片特征点的3D位置坐标进行估计,得到第二3D位置坐标;第一处理单元用于根据所述第一3D位置坐标和所述第二3D位置坐标,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪。
在上述实施例的基础上,所述装置还包括:匹配模块,用于通过GMS算法,对所述图片特征点和所述特征描述符进行匹配,并将匹配后的图片特征点和特征描述符,用于胶囊胃镜的轨迹跟踪。
在上述实施例的基础上,所述装置还包括:图像优化模块,用于根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法对视频图片序列中每一帧图片进行重识别及回环检测,得到胶囊胃镜的轨迹跟踪结果。
本发明提供的装置是用于执行上述各方法实施例的,具体流程和详细内容请参照上述实施例,此处不再赘述。
图3为本发明提供的电子设备的结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、通信接口(CommunicationsInterface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令,以执行胶囊胃镜轨迹跟踪方法,该方法包括:获取胶囊胃镜拍摄到的视频图片序列;将所述视频图片序列中每一帧图片依次输入到训练好的图片特征提取模型中,得到每一帧图片的图片特征点和对应的特征描述符,其中,所述训练好的图片特征提取模型是由样本视频图片,对卷积神经网络进行训练得到的,所述样本视频图片上标记有样本图片特征点和所述样本图片特征点对应的样本特征描述符;根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪。
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的胶囊胃镜轨迹跟踪方法,该方法包括:获取胶囊胃镜拍摄到的视频图片序列;将所述视频图片序列中每一帧图片依次输入到训练好的图片特征提取模型中,得到每一帧图片的图片特征点和对应的特征描述符,其中,所述训练好的图片特征提取模型是由样本视频图片,对卷积神经网络进行训练得到的,所述样本视频图片上标记有样本图片特征点和所述样本图片特征点对应的样本特征描述符;根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的胶囊胃镜轨迹跟踪方法,该方法包括:获取胶囊胃镜拍摄到的视频图片序列;将所述视频图片序列中每一帧图片依次输入到训练好的图片特征提取模型中,得到每一帧图片的图片特征点和对应的特征描述符,其中,所述训练好的图片特征提取模型是由样本视频图片,对卷积神经网络进行训练得到的,所述样本视频图片上标记有样本图片特征点和所述样本图片特征点对应的样本特征描述符;根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种胶囊胃镜轨迹跟踪方法,其特征在于,包括:
获取胶囊胃镜拍摄到的视频图片序列;
将所述视频图片序列中每一帧图片依次输入到训练好的图片特征提取模型中,得到每一帧图片的图片特征点和对应的特征描述符,其中,所述训练好的图片特征提取模型是由样本视频图片,对卷积神经网络进行训练得到的,所述样本视频图片上标记有样本图片特征点和所述样本图片特征点对应的样本特征描述符;
根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪。
2.根据权利要求1所述的胶囊胃镜轨迹跟踪方法,其特征在于,所述训练好的图片特征提取模型通过以下步骤得到:
通过SIFT算法,对每张样本视频图片的样本图片特征点进行特征提取标定,并获取所述样本图片特征点对应的特征描述符,构建得到训练样本集;
将所述训练样本集输入到学习不变特征变换网络进行训练,得到训练好的图片特征提取模型。
3.根据权利要求1所述的胶囊胃镜轨迹跟踪方法,其特征在于,所述根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪,包括:
根据所述图片特征点和所述特征描述符,通过g2o算法,对胶囊胃镜位姿进行估计,得到第一3D位置坐标,所述第一3D位置坐标为胶囊胃镜的3D位置坐标;
根据所述图片特征点的位置坐标和所述第一3D位置坐标,通过g2o算法,对所述图片特征点的3D位置坐标进行估计,得到第二3D位置坐标;
根据所述第一3D位置坐标和所述第二3D位置坐标,对胶囊胃镜进行轨迹跟踪。
4.根据权利要求3所述的胶囊胃镜轨迹跟踪方法,其特征在于,在所述根据所述图片特征点和所述特征描述符,通过g2o算法,对胶囊胃镜位姿进行估计,得到第一3D位置坐标之前,所述方法还包括:
通过GMS算法,对所述图片特征点和所述特征描述符进行匹配,并将匹配后的图片特征点和特征描述符,用于胶囊胃镜的轨迹跟踪。
5.根据权利要求1所述的胶囊胃镜轨迹跟踪方法,其特征在于,在所述根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪之后,所述方法还包括:
根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法对视频图片序列中每一帧图片进行重识别及回环检测,得到胶囊胃镜的轨迹跟踪结果。
6.一种胶囊胃镜轨迹跟踪装置,其特征在于,包括:
图像获取模块,用于获取胶囊胃镜拍摄到的视频图片序列;
特征提取模块,用于将所述视频图片序列中每一帧图片依次输入到训练好的图片特征提取模型中,得到每一帧图片的图片特征点和对应的特征描述符,其中,所述训练好的图片特征提取模型是由样本视频图片,对卷积神经网络进行训练得到的,所述样本视频图片上标记有样本图片特征点和所述样本图片特征点对应的样本特征描述符;
跟踪模块,用于根据所述图片特征点和所述特征描述符,通过ORB SLAM3算法,对胶囊胃镜进行轨迹跟踪。
7.根据权利要求6所述的胶囊胃镜轨迹跟踪装置,其特征在于,所述装置还包括:
样本构建模块,用于通过SIFT算法,对每张样本视频图片的样本图片特征点进行特征提取标定,并获取所述样本图片特征点对应的特征描述符,构建得到训练样本集;
训练模块,用于将所述训练样本集输入到学习不变特征变换网络进行训练,得到训练好的图片特征提取模型。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述胶囊胃镜轨迹跟踪方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述胶囊胃镜轨迹跟踪方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述胶囊胃镜轨迹跟踪方法的步骤。
CN202111303021.7A 2021-11-05 2021-11-05 一种胶囊胃镜轨迹跟踪方法及装置 Active CN113744319B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111303021.7A CN113744319B (zh) 2021-11-05 2021-11-05 一种胶囊胃镜轨迹跟踪方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111303021.7A CN113744319B (zh) 2021-11-05 2021-11-05 一种胶囊胃镜轨迹跟踪方法及装置

Publications (2)

Publication Number Publication Date
CN113744319A true CN113744319A (zh) 2021-12-03
CN113744319B CN113744319B (zh) 2022-04-05

Family

ID=78727417

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111303021.7A Active CN113744319B (zh) 2021-11-05 2021-11-05 一种胶囊胃镜轨迹跟踪方法及装置

Country Status (1)

Country Link
CN (1) CN113744319B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657640A (zh) * 2017-09-30 2018-02-02 南京大典科技有限公司 基于orb slam的智能巡防巡检管理方法
CN113222957A (zh) * 2021-05-25 2021-08-06 长春大学 一种基于胶囊镜图像的多类别病灶高速检测方法及系统
CN113469985A (zh) * 2021-07-13 2021-10-01 中国科学院深圳先进技术研究院 内镜图像特征点提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657640A (zh) * 2017-09-30 2018-02-02 南京大典科技有限公司 基于orb slam的智能巡防巡检管理方法
CN113222957A (zh) * 2021-05-25 2021-08-06 长春大学 一种基于胶囊镜图像的多类别病灶高速检测方法及系统
CN113469985A (zh) * 2021-07-13 2021-10-01 中国科学院深圳先进技术研究院 内镜图像特征点提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张建勋等: "面向低分辨率单目内窥镜图像的三维多孔结构重建", 《光学精密工程》 *

Also Published As

Publication number Publication date
CN113744319B (zh) 2022-04-05

Similar Documents

Publication Publication Date Title
US10860930B2 (en) Learning method, image recognition device, and computer-readable storage medium
JP6942488B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
Wetzler et al. Rule of thumb: Deep derotation for improved fingertip detection
CN106372629B (zh) 一种活体检测方法和装置
CN110232369B (zh) 一种人脸识别方法和电子设备
Kazemi et al. Multi-view body part recognition with random forests
US9002099B2 (en) Learning-based estimation of hand and finger pose
US20220157047A1 (en) Feature Point Detection
Xue et al. Panoramic Gaussian Mixture Model and large-scale range background substraction method for PTZ camera-based surveillance systems
CN108875507B (zh) 行人跟踪方法、设备、系统和计算机可读存储介质
EP2704056A2 (en) Image processing apparatus, image processing method
CN113658211B (zh) 一种用户姿态的评估方法、装置以及处理设备
US10991124B2 (en) Determination apparatus and method for gaze angle
CN112184757A (zh) 运动轨迹的确定方法及装置、存储介质、电子装置
CN109325413A (zh) 一种人脸识别方法、装置及终端
Bedagkar-Gala et al. Gait-assisted person re-identification in wide area surveillance
Spyrou et al. Homography-based orientation estimation for capsule endoscope tracking
CN115035546B (zh) 三维人体姿态检测方法、装置及电子设备
Wei et al. RegiNet: Gradient guided multispectral image registration using convolutional neural networks
CN113744319B (zh) 一种胶囊胃镜轨迹跟踪方法及装置
CN114616591A (zh) 物体跟踪装置以及物体跟踪方法
CN106406507B (zh) 图像处理方法以及电子设备
KR102294739B1 (ko) 캡슐 내시경의 위치정보를 기반으로 캡슐 내시경의 위치를 파악하는 시스템 및 방법
CN114359965A (zh) 训练方法及训练装置
CN112380966A (zh) 基于特征点重投影的单眼虹膜匹配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant