CN111145238A - 单目内窥镜图像的三维重建方法、装置及终端设备 - Google Patents
单目内窥镜图像的三维重建方法、装置及终端设备 Download PDFInfo
- Publication number
- CN111145238A CN111145238A CN201911275140.9A CN201911275140A CN111145238A CN 111145238 A CN111145238 A CN 111145238A CN 201911275140 A CN201911275140 A CN 201911275140A CN 111145238 A CN111145238 A CN 111145238A
- Authority
- CN
- China
- Prior art keywords
- image
- key frame
- pixel
- coordinate system
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012937 correction Methods 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000004590 computer program Methods 0.000 claims description 18
- 238000013507 mapping Methods 0.000 claims description 13
- 230000004927 fusion Effects 0.000 claims description 7
- 238000003384 imaging method Methods 0.000 abstract description 15
- 230000000694 effects Effects 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 101000664407 Neisseria meningitidis serogroup B (strain MC58) Surface lipoprotein assembly modifier 2 Proteins 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 241000226585 Antennaria plantaginifolia Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/55—Depth or shape recovery from multiple images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/80—Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10068—Endoscopic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30204—Marker
- G06T2207/30208—Marker matrix
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Endoscopes (AREA)
- Image Processing (AREA)
Abstract
本申请适用于图像处理技术领域,提供了单目内窥镜图像的三维重建方法,包括:获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,对所述多张棋盘标定板的畸变图像进行畸变校正得到图像序列,从所述图像序列中确定关键帧,获取所述关键帧的位姿参数,估算所述关键帧的深度图,基于所述关键帧的位姿参数以及所述关键帧的深度图进行图像重建,得到三维点云。本申请还提供了单目内窥镜图像的三维重建装置及终端设备,降低了单目内窥镜成像畸变带来的误差,也提高了图像的显示效果。
Description
技术领域
本申请属于图像处理技术领域,尤其涉及一种单目内窥镜图像的三维重建方法、装置及终端设备。
背景技术
三维重建是计算机视觉中的研究热点之一,其主要目的是从二维图像恢复物体三维结构,在增强现实,虚拟导航和医疗领域都有广泛运用。图像的三维信息主要依赖与视觉即时定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术得出。
目前,单目内窥镜成像畸变会造成位姿误差的增大,而且内窥镜通常伴随着冷光源一起使用,其成像也会受光线的干扰,可能会影响SLAM过程中的特征匹配结果。通常很难用单目内窥镜提供准确的样本进行训练,结合SLAM方案和深度预测方案,才能够对二维图像序列进行稠密三维重建,但由于上述的位姿和深度图的误差等因素会造成三维重建的精度和效果变差。
发明内容
本申请实施例提供了单目内窥镜的三维重建方法及装置,可以解决减小单目内窥镜固有参数造成成像畸变带来的误差、将二维图像序列进行三维重建出现精度不高和效果差的问题。
第一方面,本申请实施例提供了一种单目内窥镜图像的三维重建方法,包括:
获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,对所述多张棋盘标定板的畸变图像进行畸变校正得到图像序列;
从所述图像序列中确定关键帧;
获取所述关键帧的位姿参数,估算所述关键帧的深度图;
基于所述关键帧的位姿参数以及所述关键帧的深度图进行图像重建,得到三维点云。
可选地,所述基于所述关键帧的位姿参数以及所述关键帧的深度图进行图像重建,得到三维点云,包括:
获取所述关键帧的像素坐标;
根据所述深度图、所述关键帧的位姿参数和所述关键帧的像素坐标计算得到目标空间坐标;
获取所述关键帧中的每个像素点的颜色信息,根据所述关键帧中的每个像素点的颜色信息和所述目标空间坐标对所述关键帧进行点云融合,得到所述三维点云。
可选地,所述获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,对所述多张棋盘标定板的畸变图像进行校正得到图像序列,包括:
获取所述多张棋盘标定板的畸变图像中的棋盘的角点,基于所述棋盘的角点对所述单目内窥镜进行标定,得到所述单目内窥镜的相机参数和畸变参数;
根据所述相机参数和所述畸变参数从所述畸变图像中确定待校正图像;
基于相机坐标系对所述待校正图像进行畸变校正得到所述图像序列。
可选地,所述基于相机坐标系对所述待校正图像进行畸变校正得到所述图像序列,包括:
获取所述待校正图像的每个像素点在所述相机坐标中的预设坐标;
将所述相机坐标系投影至所述待校正图像的每个像素点所在的平面上,得到所述预设坐标在像素坐标系中的像素坐标;
将所述预设坐标在像素坐标系中的像素坐标映射至所述相机坐标系得到所述图像序列。
可选地,所述获取所述关键帧的像素坐标,包括:
将所述相机坐标系投影至所述待校正图像的每个像素点所在的平面上,得到所述预设坐标在像素坐标系中的像素坐标;
将所述预设坐标在像素坐标系中的像素坐标映射至所述相机坐标系得到所述图像序列,以及所述图像序列对应的像素坐标;
基于所述图像序列对应的像素坐标得到所述关键帧的像素坐标。
可选地,所述从所述图像序列中确定关键帧,包括:
获取所述图像序列中的各图像的局部特征,并基于所述各图像的局部特征对所述图像序列中的各图像进行特征点匹配,得到匹配结果;
当所述匹配结果为第一图像和第二图像匹配的特征点数量大于或等于预设阈值时,将所述第一图像作为关键帧,其中,所述第一图像和所述第二图像为所述图像序列中相邻的任意两帧图像。
可选地,所述获取所述关键帧的位姿参数,包括:
将所述第一图像进行位姿初始化;
估算所述图像序列中的关键帧的位姿参数。
可选地,所述估算所述关键帧的深度图,包括:
从所述关键帧中确定参考帧图像,其中,所述参考帧图像为所述关键帧中的任一帧图像或多帧图像;
基于所述位姿参数对所述参考帧图像的每个像素点进行深度估计处理,得到所述关键帧的深度图。
第二方面,本申请实施例提供了一种单目内窥镜图像的三维重建装置,包括:
获取模块,用于获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,对所述多张棋盘标定板的畸变图像进行畸变校正得到图像序列;
确定模块,用于从所述图像序列中确定关键帧;
计算模块,用于获取所述关键帧的位姿参数,估算所述关键帧的深度图;
生成模块,用于基于所述关键帧的位姿参数以及所述关键帧的深度图进行图像重建,得到三维点云。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的三维重建方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的三维重建方法。
本申请实施例与现有技术相比存在的有益效果是:通过获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,对多张棋盘标定板的畸变图像进行畸变校正得到图像序列,从图像序列中确定关键帧,获取关键帧的位姿参数,估算关键帧的深度图,基于关键帧的位姿参数和关键帧的深度图进行图像重建得到三维点云。上述方法采用棋盘标定板图像可以实现对单目内窥镜进行标定和畸变校正得到图像序列,有效降低了单目内窥镜自身造成的成像畸变误差,从图像序列中确定符合要求的多张图像作为关键帧,并确定关键帧的位姿参数,可以避免光线变化等外界因素的干扰,可以精确地估计位姿参数和深度图,根据关键帧的位置参数和深度图进行图像重建,可以得到更精细的三维点云,也提高了图像的显示效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的单目内窥镜图像的三维重建方法的流程示意图;
图2是本申请实施例提供的图像畸变校正的流程示意图;
图3是本申请实施例提供的单目内窥镜图像的三维重建装置的结构示意图;
图4是本申请实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
图1示出了本申请一提供的单目内窥镜图像的三维重建方法的流程示意图,如图1,本申请提供的单目内窥镜图像的三维重建方法,所述三维重建方法包括S101至S104,具体如下:
S101:获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,对所述多张棋盘标定板的畸变图像进行畸变校正得到图像序列;
在本实施例中,棋盘标定板的畸变图像可以用于单目内窥镜畸变校正的棋盘标定板是双排黑白条纹间隔的二值化图片,单目内窥镜可以从不同角度观测该标定板得到多张单目内窥镜畸变图像。摄像机的成像过程主要涉及到图像像素坐标系、图像物理坐标系、摄像机坐标系和世界坐标系之间进行变换,由于透镜成像原理出现摄像机成像畸变,畸变校正是找到畸变前后的点位置的对应关系。
需要说明的是,单目内窥镜的成像模型不同于小孔成像模型,而是更贴近于鱼眼摄像头模型。棋盘标定板是按照间隔排列的黑白格,也称棋盘格标定板,标定板(Calibration Target)在机器视觉、图像测量、摄影测量、三维重建等应用中,为校正镜头畸变,确定物理尺寸和像素间的换算关系,以及确定空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系,需要建立相机成像的几何模型。通过相机拍摄带有固定间距图案阵列平板、经过标定算法的计算,可以得出相机的几何模型,从而得到高精度的测量和重建结果。而带有固定间距图案阵列的平板就是标定板。
应理解,通过获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,可以实现对单目内窥镜进行相机标定,并根据标定单目内窥镜可以对畸变图像进行畸变校正得到图像序列,即真实图像,可以降低图像畸变给图像识别带来的误差。
图2示出了本申请提供的畸变校正的实现流程图,如图2,所述获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,对所述多张棋盘标定板的畸变图像进行校正得到图像序列,包括S1011至S1013:
S1011:获取所述多张棋盘标定板的畸变图像中的棋盘的角点,基于所述棋盘的角点对所述单目内窥镜进行标定,得到所述单目内窥镜的相机参数和畸变参数;
在本实施例中,获取20张左右不同角度下用单目内窥镜拍摄的带有棋盘标定板的图像,提取图像中的棋盘的角点,选择满足拟合条件的畸变图像。可以采用Canny角点算子检测所有单目内窥镜观测棋盘标定板得到的畸变图像,统计所有畸变图像中的角点数目,满足拟合条件的畸变图像优选为该图像中检测得到的角点数目不小于6个。其中,角点的数目可以根据实际情况选择,此处不作具体限定。
具体的,根据选择的畸变图像和检测到的角点拟合得到椭圆方程的参数,椭圆方程可以为包括6个参数的标准方程,根据检测得到的畸变图像中的角点,采用最小二乘法得到曲面投影参数得到该椭圆方程参数,多张畸变图像的椭圆方程的参数拟合结果采用均值滤波得到平均值。构建曲面投影模型,建立椭圆方程的参数,即便图像像素点坐标和真实图像像素点坐标之间的对应关系,之后构建曲面投影模型,根据曲面投影原则建立曲面模型参数,得到畸变图像点坐标与真实图像点坐标之间的对应关系,以此对单目内窥镜进行标定,通过对单目内窥镜进行标定可以得到单目内窥镜的相机参数和畸变参数。通过标定可得到单目内窥镜的内参矩阵K与畸变参数矩阵(k1 k2 k3 k4)其中K可表示为:
需要说明的是,棋盘是一块由黑白方块间隔组成的标定板作为相机标定的标定物(从真实世界映射到数字图像内的对象)。二维物体相对于三维物体会缺少一部分信息,采用棋盘作为标定物是因为平面棋盘模式更容易处理,经过多次改变棋盘的方位来捕捉图像,以此获得更丰富的坐标信息。
S1012:根据所述相机参数和所述畸变参数从所述畸变图像中确定待校正图像;
在本实施例中,对单目内窥镜进行标定可以确定相机的位姿,以获得单目内窥镜的相机参数和畸变参数,以一副图像为例,通过相机参数和畸变参数计算出该图像是否没有发生畸变得到待校正畸变图像,即可以对拍摄的多张图像进行判断是否发生畸变,或者设定预设阈值,将计算结果与预设阈值比较得到比较结果,其中,将比较结果中相差较大的作为有畸变和比较结果中相差不大的作为无畸变,反之亦然。
需要说明的是,在图像的获取或显示过程中往往会产生各种失真(畸变),常见的有几何形状失真、灰度失真、颜色失真,引起图像失真的原因有成像系统的象差、畸变、带宽有限、拍摄状态、扫描非线性、相对运动等,非均匀光照条件或点光源照明等。根据相机参数和畸变参数对拍摄的多张图像中确定待校正图像,便于排除畸变对图像识别和处理的误差,一定程度上提高了图像处理的精度。
S1013:基于所述相机坐标系对所述待校正图像进行畸变校正得到所述图像序列。
在本实施例中,畸变空间中的直线在像空间中一般不再是直线,而只有通过对称中心的直线是例外,在进行畸变校正时可以找出对称中心,再进行通用的几何畸变校正过程。畸变校正的一般步骤为先找出畸变图对称中心,将畸变图代表的地址空间关系转换为以对称中心为原点的空间坐标系,接着空间变换,对输入图像即畸变图上像素重新排列以恢复原空间关系,即利用地址映射关系为校正图空间上的每一个点找到它们在畸变图空间上的对应点,最后灰度差值即对空间变换后的像素赋予相应的灰度值以恢复原位置的灰度值。几何畸变的校正需要使用坐标转换,包括平行移动、旋转、扩大缩小等简单的变换。
需要说明的是,畸变校正的过程可以理解成将有畸变的图像处理成无畸变的图像即真实图像,不同的摄像头模型在拍照时图像的显示是不同的,可能发生畸变或不发生畸变,相应的采用畸变校正过程可以相同,也可以不同。图像的畸变主要有径向畸变和切向畸变,径向畸变指的是正中心位置的畸变最小,随着半径的增大畸变增大,径向畸变可以分为枕形畸变和桶形畸变。切向畸变指的是在透镜与成像平面不平行时产生,类似于透视变换。通过对待校正图像进行畸变校正得到校正后的图像序列,一定程度上确保了图像处理的可靠性。
可选地,所述基于所述相机坐标系对所述待校正图像进行畸变校正得到所述图像序列,包括步骤A1~A3:
步骤A1:获取所述待校正图像的每个像素点在所述相机坐标中的预设坐标;
在本实施例中,在对单目内窥镜进行标定可以得到相机坐标系,根据相机成像模型和相机坐标系可以实现世界坐标系与相机坐标系、相机坐标系与图像坐标系、以及图像坐标系到像素坐标系的转换。世界坐标系与相机坐标系之间转换是从一个三维坐标到另一个三维坐标系,可以通过旋转矩阵和平移向量得到相机的位姿参数,即相机坐标系。相机坐标系到图像坐标系是将一个三维坐标投影在一个二维平面上,根据两个坐标系距离即相机焦距进行估算。换言之,将相机坐标系中的预设坐标进行校正得到无畸变的相机坐标系下的坐标,将无畸变的相机坐标系下的坐标映射至像素坐标系中,得到无畸变的图像序列。
步骤A2:将所述相机坐标系投影至所述待校正图像的每个像素点所在的平面上,得到所述预设坐标在像素坐标系中的像素坐标;
在本实施例中,假设单目内窥镜拍摄的图像的像素点(u′,v′)在相机坐标系中的坐标为(x,y,z),将像素点在相机坐标系中的坐标投影到图像所在的平面即图像坐标系,根据图像坐标系原点在相对于像素坐标系原点的位置关系,可以看成将像素点在相机坐标系中的坐标投影至像素坐标系,可以表示如下:
x′=x/z,y′=y/z,r2=x′2+y′2
θ=arctan(r)
θ′=θ(1+k1θ2+k2θ4+k3θ6+k4θ8)
x′=(θ′/r)x,y′=(θ′/r)y
u=fxx′+cx
v=fyy′+cy
其中,(x′,y′)是投影在平面上的坐标,r则表示投影平面上该点与中心的距离(投影半径),θ表示入射角。通过上述公式可以确定相机坐标系和图像坐标系之间的对应关系,这样便于后续确定像素坐标系及像素坐标。
步骤A3:将所述预设坐标在像素坐标系中的像素坐标映射至所述相机坐标系得到所述图像序列。
在本实施例中,对于N张无畸变的图像来说,共有4个内参+6N个外参来标定,每张棋盘图上有4个有效的角点,可以提供8个约束,则需要8N>=4+6N,则至少需要2张无畸变的图像可以求出相机的内参和外参,实际上一般可以取10张或者20张,从而利用最小二乘法得到更精确的解,在求出了内参和外参后,即可根据剩余的点坐标求出畸变相关参数。
需要说明的是,在对待校正图像进行畸变校正可能出现至少两张图像呈线性关系,可以采用重映射的过程,将有畸变内窥镜图像像素坐标转化为有畸变的相机坐标系坐标,再将有畸变的相机坐标系坐标转化为无畸变的相机坐标系坐标,最后将无畸变的相机坐标系坐标转化为无畸变图像的像素坐标,以此得到校正后的图像序列,也可以得到相应的图像的像素坐标,便于后续确定关键帧及关键帧的位姿参数。
S102:从所述图像序列中确定关键帧;
在本实施例中,将畸变校正后的图像作为图像序列,从中确定关键帧。ORB_SLAM2是一种嵌入式位置识别模型,具有重定位,防止跟踪失败(如遮挡)、已建图场景重新初始化、回环检测等特点,使用相同的ORB特征进行跟踪、建图和位置识别任务,这些特征在旋转和尺度上有良好的鲁棒性,对摄像机的自动增益和自动曝光以及光照变化具有良好的不变性,它还能够迅速提取特征和匹配特征,满足实时操作的需求。本申请采用ORB_SLAM2对单目内窥镜图像进行关键帧的判定和位姿估计,可以采用ORB对图像序列进行特征提取、通过前一图像帧估计相机的初始位姿、通过全局重定位来初始化位姿、跟踪局部地图和新关键帧的判断标准这四个过程,以更精确地确定关键帧和关键帧的位姿参数。
需要说明的是,关键帧可以作为图像序列的标记,具有引导作用,将图像序列中经过畸变校正的图像按照预设顺序进行排列,可以按照拍摄时间顺序依次排列,这样便于对各图像进行特征提取处理,提高单目内窥镜图像处理的效率。
可选地,所述从所述图像序列中确定关键帧,包括步骤B1~B2,具体如下:
步骤B1:获取所述图像序列中的各图像的局部特征,并基于所述各图像的局部特征对所述图像序列中的各图像进行特征点匹配,得到匹配结果;
在本实施例中,提取图像序列中的各图像的局部特征,并对各图像的局部特征对图像序列中的各图像进行特征点匹配,以提取各图像的坐标对应的区域进行特征匹配,或者提取图像丰富区域的所有像素点,按照预设顺序将前后两帧图像进行特征点匹配,即两帧图像中相同的ORB特征匹配成功的特征点数量作为匹配结果,设定匹配成功的特征点数量的阈值在50~100之间。
需要说明的是,单目内窥镜成像的图像四周边缘区域为黑色无信息的区域,不能提取有用的特征信息,因此选取图像中信息丰富的区域,将该区域可以定义为感兴趣区域,以提取该区域的ORB特征,ORB(Oriented FAST and Rotated BRIEF)是一种快速特征点提取和描述的算法,ORB算法包括特征点提取和特征点描述,ORB算法具有计算速度快的特点,使用FAST检测特征点,再次是使用BRIEF算法计算描述子,该描述子特有的二进制串的表现形式不仅节约了存储空间,而且大大缩短了匹配的时间。
应理解,通过从渐变校正后的图像序列中确定关键帧,可以关键帧作为标记对该图像序列进行快速处理,可以提高单目内窥镜图像处理的效率。
步骤B2:当所述匹配结果为第一图像和第二图像匹配的特征点数量大于或等于预设阈值时,将所述第一图像作为关键帧,其中,所述第一图像和所述第二图像为所述图像序列中相邻的任意两帧图像。
在本实施例中,设定匹配成功的特征点数量的阈值在50~100之间,当第一图像和第二图像匹配的特征点数量超过该阈值,则确定首次有前后两帧图像匹配成功。
需要说明的是,如果上一帧图像跟踪成功,可以用运动速率恒定模型来预测当前相机的位置(即认为摄像头处于匀速运动),然后搜索上一帧图像中的特征点在地图中的对应云点与当前帧图像的匹配点,最后利用搜索到的匹配点对当前相机的位姿进一步优化,从而获得符合要求的图像序列中的图像,以提高判定关键帧的准确性。
S103:获取所述关键帧的位姿参数,估算所述关键帧的深度图;
在本实施例中,基于特征点法的ORB_SLAM2可以得到位姿参数,对于有相对位姿参数的图像序列,即两张图像之间存在线性关系,位姿参数描述的是两张图像对应相机的相对移动关系。深度图是指存储每个像素使用的位数,用于量度图像的色彩分辨率,
可选地,获取所述关键帧的位姿参数包括:
将所述第一图像进行位姿初始化;估算所述图像序列中的关键帧的位姿参数。
在本实施例中,当第一图像和第二图像匹配的特征点数量超过设定的阈值时,将第一图像即前一帧图像的位姿初始化为(R0,t0),该关键帧包含多张特征点匹配成功的图像,根据第一图像的位姿初始化对关键帧中的每一帧图像提取ORB特征与前一帧进行特征匹配并估算其位姿参数(旋转矩阵Ri,平移向量ti),将位姿估计成功的图像作为关键帧,得到关键帧对应的位姿参数,将关键帧和关键帧对应的位姿参数一起存储,以便后续对所有关键帧进行深度估计。
应理解,根据第一图像的位姿初始化对关键帧中的其他图像也采用上述特征点匹配的过程进行判断,并估算当前图像的位姿参数,将特征点匹配成功的图像作为关键帧,并根据初始化的位姿参数得到图像序列中的各图像的位姿参数即关键帧的位姿参数,这样提高了位姿参数估计的精确度。
可选地,所述估算所述关键帧的深度图,包括:
从所述关键帧中确定参考帧图像,其中,所述参考帧图像为所述关键帧中的任一帧图像或多帧图像;
在本实施例中,根据单目视频中关键图像帧的第一深度图将光度误差进行最小化,确定单目内窥镜图像中的参考帧图像与关键帧之间的当前相机位姿.根据当前相机位姿对参考帧图像和关键帧中的高梯度像索点进行三角测量,确定关键帧的第二深度图,将第一深度图和第二深度图进行高斯融合,更新关键帧的第一深度图,若参考帧图像的后一图像帧与关键帧之间的后一相机位姿超过预设相机位姿,则将更新后的第一深度图确定为关键帧的稠密深度图。
需要说明的是,进行深度图估算可以选取一帧图像或者多帧图像进行估算,当选取关键帧中的一帧图像作为参考帧时,对关键帧中的各图像的每个像素点进行三角测量和贝叶斯概率估计策略得到稠密深度图。当选取关键帧中的多帧图像进行迭代计算得到每个像素点对应的深度值,之后对深度图进行平滑滤波处理,以消除一些深度图中的噪声,可以提高深度估计的效率和精确度。
基于所述位姿参数对所述参考帧图像的每个像素点进行深度估计处理,得到所述关键帧的深度图。
在本实施例中,关键帧的第一深度图可以是通过初始化关键帧中高梯度点的深度值得到的服从于高斯分布的稠密深度图,也可以是将该关键帧的前一关键帧的深度值根据相机位姿进行投影后的稠密深度图。例如,若待深度估计的关键帧为图像序列中的第一关键帧,则该关键帧的第一深度图为通过初始化得到的稠密深度图;若带深度估计的关键帧为图像序列中除第一关键帧之外的其他关键帧,则该关键帧的第一深度图为将前一关键帧的深度值进行投影后的稠密深度图。光度误差是指投影图像中的高梯度点与参考帧图像中对应的高梯度点之间的量度差,投影图像是按照图像序列中的参考帧与关键帧之间的初始相机位姿,将关键帧中的像素点对应的高梯度点投影至参考帧图像后得到的图像,当前相机位姿包括参考帧与关键帧之间的旋转和平移,关键帧的第二深度图是指根据图像序列中的参考帧图像与关键帧之间的当前相机位姿进行三角测量得到的新的稠密深度图;参考帧图像的后一帧图像是指在图像序列中预参考帧图像相邻的后一帧图像,后一相机位姿包括后一相机位姿的最大阈值,可以根据实际情况和需求预先设定,此处不作具体限定。
需要说明的是,稠密深度图是指包括大量特征点对应的深度值的图像,或者包括高梯度点也包括低梯度点对应的深度值的图像,通过对参考帧图像中的每个像素点进行深度估计得到深度图和深度值,便于后续恢复该像素点的空间坐标。
S104:基于所述关键帧的位姿参数以及所述关键帧的深度图进行图像重建,得到三维点云。
在本实施例中,三维重建是指从输入数据中建立3D模型,深度相机扫描得到的每一帧数据不仅包含场景中的点的彩色RGB图像,还包含每个点到深度相机所在的垂直平面的距离值,这个距离值称为深度值,这些深度值共同组成了这一帧的深度图。深度图可以看成一副灰度图,图像中的每一个点的灰度值代表了这个点在现实中的位置到相机所在垂直平面的真实距离,RGB图像中的每个点都会对应一个在相机的局部坐标系中的三维点。
需要说明的是,三维重建的过程可以是图像获取、摄像机标定、特征提取、立体匹配和三维重建等,其中,立体匹配是指根据所提取的特征来建立图像对之间的一种对应关系,也就是将同一物理空间点在两幅不同图像中的成像点进行一一对应起来。在进行匹配时要注意场景中一些因素的干扰,比如光照条件、噪声干扰、景物几何形状畸变、表面物理特性以及摄像机机特性等诸多变化因素,以得到高精度的三维点云,也增强了视觉效果。
可选地,S104可以包括步骤C1~C3,具体如下:
步骤C1:获取所述关键帧的像素坐标;
在本实施例中,根据上述对单目内窥镜进行相机标定,可以确定像素坐标系和关键帧中的各图像的像素坐标,该像素坐标表示像素在图像中的位置,可以确定关键帧中的各图像的像素位置,便于后续对图像进行三维重建。
步骤C2:根据所述深度图、所述关键帧的位姿参数和所述关键帧的像素坐标计算得到目标空间坐标;
在本实施例中,获取关键中的各图像的深度图对应的深度值,将深度值和关键帧的位姿参数和关键帧的各图像的像素坐标进行计算,得到各图像的空间坐标,即由二维坐标到三维坐标的转化,根据精确地深度估计得到的深度值,计算所得的目标空间坐标的精度也提高。
步骤C3:获取所述关键帧中的每个像素点的颜色信息,根据所述关键帧中的每个像素点的颜色信息和所述目标空间坐标对所述关键帧进行点云融合,得到所述三维点云。
在本实施例中,二维图像中的像素点坐标[u,v],对应的点云包含了颜色信息和空间位置信息,颜色信息由该像素点的RGB值表示,根据所述深度图、所述关键帧的位姿参数和所述关键帧的像素坐标计算得到目标空间坐标为[x,y,z],从像素坐标[u,v]及其深度值d恢复空间坐标,由如下公式表示:
z′=d
x′=z(u-cx)/fx
y′=z(v-cy)/fy
(x,y,z)T=(Ri,ti)(x′,y′,z′)T
其中,d表示该像素点的深度,由REMODE方案的深度估计得出,(x’,y’,z’)是像相机坐标系下的坐标值,(Ri,ti)是该帧对应的位姿参数。
需要说明的是,点云是一组离散的点表示的图,点云中存储了该帧像素点对应的空间坐标和颜色信息,在进行多帧的点云融合时,将多帧的点云存储在一个容器中,然后通过滤波器将重复的点云去除,可以得出多帧图像融合在一起的三维点云。上述三维重建方法可以是在融合时绘制了多帧图像的点云,以得到更精细的三维信息。
可选地,当S101包括S1011至S1013时,步骤C1所述获取所述关键帧的像素坐标,包括步骤C11~C13:
步骤C11:将所述相机坐标系投影至所述待校正图像的每个像素点所在的平面上,得到所述预设坐标在像素坐标系中的像素坐标;
在本实施方式中,定义像素点在相机坐标系中的坐标,利用投影计算相机坐标系和图像坐标系之间的对应关系,之后通过图像坐标系与像素坐标系的对应关系得到像素坐标系,此处的像素坐标与上述的畸变校正中得到的像素坐标的过程相同,此处不再赘述。
步骤C12:将所述预设坐标在像素坐标系中的像素坐标映射至所述相机坐标系得到所述图像序列,以及所述图像序列对应的像素坐标;
在本实施例中,通过畸变校正的坐标系转化方式可以得到校正后的图像序列和图像序列对应的像素坐标,此处的具体处理过程与上述畸变校正过程相同,此处不再赘述。
步骤C13:基于所述图像序列对应的像素坐标得到所述关键帧的像素坐标。
在本实施方式中,从图像序列中确定了关键帧,就可以得到关键帧的像素坐标,根据关键帧的各图像的像素坐标就可以确定各图像相对于相机的移动位置关系,以提高了单目内窥镜图像的处理效率。
图3示出了本申请实施例提供的单目内窥镜图像的三维重建装置300,如图3,本申请提供的单目内窥镜图像的三维重建装置300,包括:
获取模块310,用于获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,对所述多张棋盘标定板的畸变图像进行畸变校正得到图像序列;
确定模块320,用于从所述图像序列中确定关键帧;
计算模块330,用于获取所述关键帧的位姿参数,估算所述关键帧的深度图;
生成模块340,用于基于所述关键帧的位姿参数以及所述关键帧的深度图进行图像重建,得到三维点云。
在本实施例中,单目内窥镜图像的三维重建装置可以是终端设备,也可以是服务器,也可以是能进行人机交互的设备。
可选地,所述获取模块310具体包括:
第一获取单元,用于获取所述多张棋盘标定板的畸变图像中的棋盘的角点,基于所述棋盘的角点对所述单目内窥镜进行标定,得到所述单目内窥镜的相机参数和畸变参数;
第一确定单元,用于根据所述相机参数和所述畸变参数从所述畸变图像中确定待校正图像;
第一处理单元,用于基于所述相机坐标系对所述待校正图像进行畸变校正得到所述图像序列。
可选地,所述获取模块310还包括:
第二获取单元,用于获取所述待校正图像的每个像素点在所述相机坐标中的预设坐标;
第二处理单元,用于将所述相机坐标系投影至所述待校正图像的每个像素点所在的平面上,得到所述预设坐标在像素坐标系中的像素坐标;
第三处理单元,用于将所述预设坐标在像素坐标系中的像素坐标映射至所述相机坐标系得到所述图像序列。
可选地,所述确定模块320具体包括:
第三获取单元,用于获取所述图像序列中的各图像的局部特征,并基于所述各图像的局部特征对所述图像序列中的各图像进行特征点匹配,得到匹配结果;
第二确定单元,用于当所述匹配结果为第一图像和第二图像匹配的特征点数量大于或等于预设阈值时,将所述第一图像作为关键帧,其中,所述第一图像和所述第二图像为所述图像序列中相邻的任意两帧图像。
可选地,所述确定模块320还包括:
第三确定单元,用于当第一图像和第二图像匹配的特征点数量大于或等于预设阈值时,将所述第一图像作为关键帧;
第四处理单元,用于将所述第一图像进行位姿初始化;
第一估算单元,用于估算所述图像序列中的关键帧的位姿参数。
可选地,所述确定模块320还包括:
第四确定单元,用于从所述关键帧中确定参考帧图像,其中,所述参考帧图像为所述关键帧中的任一帧图像或多帧图像;
第二估算单元,用于基于所述位姿参数对所述参考帧图像的每个像素点进行深度估计处理,得到所述关键帧的深度图。
可选地,所述生成模块340包括:
第四获取单元,用于获取所述关键帧的像素坐标;
第三估算单元,用于根据所述深度图、所述关键帧的位姿参数和所述关键帧的像素坐标计算得到目标空间坐标;
第一生成单元,用于获取所述关键帧中的每个像素点的颜色信息,根据所述关键帧中的每个像素点的颜色信息和所述目标空间坐标对所述关键帧进行点云融合,得到所述三维点云。
可选地,所述生成模块340还包括:
第一投影单元,将所述相机坐标系投影至所述待校正图像的每个像素点所在的平面上,得到所述预设坐标在像素坐标系中的像素坐标;
第二投影单元,用于将所述预设坐标在像素坐标系中的像素坐标映射至所述相机坐标系得到所述图像序列,以及所述图像序列对应的像素坐标;
第二生成单元,用于基于所述图像序列对应的像素坐标得到所述关键帧的像素坐标。
请参阅图4,图4是本申请实施例还提供的终端设备400的结构示意图,终端设备400包括存储器410、至少一个处理器420以及存储在所述存储器410中并可在所述处理器420上运行的计算机程序430,所述处理器420执行所述计算机程序430时实现上述的三维重建方法。
终端设备400可以是桌上型计算机、手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。
该终端设备400可包括但不仅限于处理器420、存储器410。本领域技术人员可以理解,图4仅仅是终端设备400的举例,并不构成对终端设备400的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备等。
所称处理器420可以是中央处理单元(Central Processing Unit,CPU),该处理器420还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器410在一些实施例中可以是终端设备400的内部存储单元,例如终端设备400的硬盘或内存。所述存储器410在另一些实施例中也可以是所述终端设备400的外部存储设备,例如终端设备400上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器410还可以既包括终端设备400的内部存储单元也包括外部存储设备。所述存储器410用于存储操作系统、应用程序、引导装载程序(Boot Loader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器410还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述生成装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述辅助拍摄装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种单目内窥镜图像的三维重建方法,其特征在于,所述三维重建方法包括:
获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,对所述多张棋盘标定板的畸变图像进行畸变校正得到图像序列;
从所述图像序列中确定关键帧;
获取所述关键帧的位姿参数,估算所述关键帧的深度图;
基于所述关键帧的位姿参数以及所述关键帧的深度图进行图像重建,得到三维点云。
2.根据权利要求1所述的三维重建方法,其特征在于,所述基于所述关键帧的位姿参数以及所述关键帧的深度图进行图像重建,得到三维点云,包括:
获取所述关键帧的像素坐标;
根据所述深度图、所述关键帧的位姿参数和所述关键帧的像素坐标计算得到目标空间坐标;
获取所述关键帧中的每个像素点的颜色信息,根据所述关键帧中的每个像素点的颜色信息和所述目标空间坐标对所述关键帧进行点云融合,得到所述三维点云。
3.根据权利要求1或2所述的三维重建方法,其特征在于,所述获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,对所述多张棋盘标定板的畸变图像进行校正得到图像序列,包括:
获取所述多张棋盘标定板的畸变图像中的棋盘的角点,基于所述棋盘的角点对所述单目内窥镜进行标定,得到所述单目内窥镜的相机参数和畸变参数;
根据所述相机参数和所述畸变参数从所述畸变图像中确定待校正图像;
基于相机坐标系对所述待校正图像进行畸变校正得到所述图像序列。
4.根据权利要求3所述的三维重建方法,其特征在于,所述基于相机坐标系对所述待校正图像进行畸变校正得到所述图像序列,包括:
获取所述待校正图像的每个像素点在所述相机坐标中的预设坐标;
将所述相机坐标系投影至所述待校正图像的每个像素点所在的平面上,得到所述预设坐标在像素坐标系中的像素坐标;
将所述预设坐标在像素坐标系中的像素坐标映射至所述相机坐标系得到所述图像序列。
5.根据权利要求3所述的三维重建方法,其特征在于,所述获取所述关键帧的像素坐标,包括:
将所述相机坐标系投影至所述待校正图像的每个像素点所在的平面上,得到所述预设坐标在像素坐标系中的像素坐标;
将所述预设坐标在像素坐标系中的像素坐标映射至所述相机坐标系得到所述图像序列,以及所述图像序列对应的像素坐标;
基于所述图像序列对应的像素坐标得到所述关键帧的像素坐标。
6.根据权利要求1-2、4-5任一项所述的三维重建方法,其特征在于,所述从所述图像序列中确定关键帧,包括:
获取所述图像序列中的各图像的局部特征,并基于所述各图像的局部特征对所述图像序列中的各图像进行特征点匹配,得到匹配结果;
当所述匹配结果为第一图像和第二图像匹配的特征点数量大于或等于预设阈值时,将所述第一图像作为关键帧,其中,所述第一图像和所述第二图像为所述图像序列中相邻的任意两帧图像。
7.根据权利要求6所述的三维重建方法,其特征在于,所述获取所述关键帧的位姿参数,包括:
将所述第一图像进行位姿初始化;
估算所述图像序列中的关键帧的位姿参数。
8.根据权利要求1或7所述的三维重建方法,其特征在于,所述估算所述关键帧的深度图,包括:
从所述关键帧中确定参考帧图像,其中,所述参考帧图像为所述关键帧中的任一帧图像或多帧图像;
基于所述位姿参数对所述参考帧图像的每个像素点进行深度估计处理,得到所述关键帧的深度图。
9.一种单目内窥镜图像的三维重建装置,其特征在于,包括:
获取模块,用于获取单目内窥镜拍摄的多张棋盘标定板的畸变图像,对所述多张棋盘标定板的畸变图像进行畸变校正得到图像序列;
确定模块,用于从所述图像序列中确定关键帧;
计算模块,用于获取所述关键帧的位姿参数,估算所述关键帧的深度图;
生成模块,用于基于所述关键帧的位姿参数以及所述关键帧的深度图进行图像重建,得到三维点云。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的三维重建方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911275140.9A CN111145238B (zh) | 2019-12-12 | 2019-12-12 | 单目内窥镜图像的三维重建方法、装置及终端设备 |
PCT/CN2020/129546 WO2021115071A1 (zh) | 2019-12-12 | 2020-11-17 | 单目内窥镜图像的三维重建方法、装置及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911275140.9A CN111145238B (zh) | 2019-12-12 | 2019-12-12 | 单目内窥镜图像的三维重建方法、装置及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111145238A true CN111145238A (zh) | 2020-05-12 |
CN111145238B CN111145238B (zh) | 2023-09-22 |
Family
ID=70518247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911275140.9A Active CN111145238B (zh) | 2019-12-12 | 2019-12-12 | 单目内窥镜图像的三维重建方法、装置及终端设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111145238B (zh) |
WO (1) | WO2021115071A1 (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111784754A (zh) * | 2020-07-06 | 2020-10-16 | 浙江得图网络有限公司 | 基于计算机视觉的牙齿正畸方法、装置、设备及存储介质 |
CN111798387A (zh) * | 2020-06-24 | 2020-10-20 | 海南大学 | 一种用于共聚焦内窥镜的图像处理方法及系统 |
CN111862120A (zh) * | 2020-07-22 | 2020-10-30 | 苏州大学 | 一种单目slam尺度恢复的方法 |
CN111882657A (zh) * | 2020-06-29 | 2020-11-03 | 杭州易现先进科技有限公司 | 三维重建的尺度恢复方法、装置、系统和计算机设备 |
CN111899345A (zh) * | 2020-08-03 | 2020-11-06 | 成都圭目机器人有限公司 | 一种基于2d视觉图像的三维重建方法 |
CN112261399A (zh) * | 2020-12-18 | 2021-01-22 | 安翰科技(武汉)股份有限公司 | 胶囊内窥镜图像三维重建方法、电子设备及可读存储介质 |
CN112330729A (zh) * | 2020-11-27 | 2021-02-05 | 中国科学院深圳先进技术研究院 | 图像深度预测方法、装置、终端设备及可读存储介质 |
CN112767489A (zh) * | 2021-01-29 | 2021-05-07 | 北京达佳互联信息技术有限公司 | 一种三维位姿确定方法、装置、电子设备及存储介质 |
CN112802123A (zh) * | 2021-01-21 | 2021-05-14 | 北京科技大学设计研究院有限公司 | 一种基于条纹虚拟靶标的双目线阵相机静态标定方法 |
CN112907620A (zh) * | 2021-01-25 | 2021-06-04 | 北京地平线机器人技术研发有限公司 | 相机位姿的估计方法、装置、可读存储介质及电子设备 |
CN112927340A (zh) * | 2021-04-06 | 2021-06-08 | 中国科学院自动化研究所 | 一种不依赖于机械摆放的三维重建加速方法、系统及设备 |
WO2021115071A1 (zh) * | 2019-12-12 | 2021-06-17 | 中国科学院深圳先进技术研究院 | 单目内窥镜图像的三维重建方法、装置及终端设备 |
CN113569843A (zh) * | 2021-06-21 | 2021-10-29 | 影石创新科技股份有限公司 | 角点检测方法、装置、计算机设备和存储介质 |
CN113724194A (zh) * | 2021-06-22 | 2021-11-30 | 山东交通学院 | 一种发动机内窥式火焰测量系统及图像处理方法 |
CN114677572A (zh) * | 2022-04-08 | 2022-06-28 | 北京百度网讯科技有限公司 | 对象描述参数的生成方法、深度学习模型的训练方法 |
CN114782470A (zh) * | 2022-06-22 | 2022-07-22 | 浙江鸿禾医疗科技有限责任公司 | 消化道的三维全景识别定位方法、存储介质和设备 |
CN115471556A (zh) * | 2022-09-22 | 2022-12-13 | 南京博视医疗科技有限公司 | 一种单目相机图像目标点三维定位方法及装置 |
WO2023007641A1 (ja) * | 2021-07-29 | 2023-02-02 | 株式会社エビデント | 3次元再構成装置、3次元再構成方法、およびプログラム |
WO2023093739A1 (zh) * | 2021-11-25 | 2023-06-01 | 华为技术有限公司 | 一种多视图三维重建的方法 |
WO2023124877A1 (zh) * | 2021-12-30 | 2023-07-06 | 小荷医疗器械(海南)有限公司 | 内窥镜图像的处理方法、装置、可读介质和电子设备 |
CN116704152A (zh) * | 2022-12-09 | 2023-09-05 | 荣耀终端有限公司 | 图像处理方法和电子设备 |
CN116958147A (zh) * | 2023-09-21 | 2023-10-27 | 青岛美迪康数字工程有限公司 | 基于深度图像特征的目标区域确定方法、装置和设备 |
CN117115358A (zh) * | 2023-10-11 | 2023-11-24 | 世优(北京)科技有限公司 | 数字人自动建模方法及装置 |
JP7498371B2 (ja) | 2021-07-29 | 2024-06-11 | 株式会社エビデント | 3次元再構成装置、3次元再構成方法、およびプログラム |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113596432B (zh) * | 2021-07-30 | 2024-04-30 | 成都市谛视科技有限公司 | 可变视角的3d视频制作方法、装置、设备及存储介质 |
CN113838138A (zh) * | 2021-08-06 | 2021-12-24 | 杭州灵西机器人智能科技有限公司 | 一种优化特征提取的系统标定方法、系统、装置和介质 |
CN113793413A (zh) * | 2021-08-13 | 2021-12-14 | 北京迈格威科技有限公司 | 三维重建方法、装置、电子设备及存储介质 |
CN113884025B (zh) * | 2021-09-16 | 2024-05-03 | 河南垂天智能制造有限公司 | 增材制造结构光回环检测方法、装置、电子设备和存储介质 |
CN113902846B (zh) * | 2021-10-11 | 2024-04-12 | 岱悟智能科技(上海)有限公司 | 一种基于单目深度相机和里程传感器的室内三维建模方法 |
CN114155349B (zh) * | 2021-12-14 | 2024-03-22 | 杭州联吉技术有限公司 | 一种三维建图方法、三维建图装置及机器人 |
CN114494464A (zh) * | 2021-12-15 | 2022-05-13 | 深圳市华汉伟业科技有限公司 | 一种线扫相机的标定方法 |
CN113925441B (zh) * | 2021-12-17 | 2022-05-03 | 极限人工智能有限公司 | 一种基于内窥镜的成像方法及成像系统 |
CN114820787B (zh) * | 2022-04-22 | 2024-05-28 | 聊城大学 | 一种面向大视场平面视觉测量的图像校正方法及系统 |
CN114972531A (zh) * | 2022-05-17 | 2022-08-30 | 上海人工智能创新中心 | 一种标定板、角点检测方法、设备及可读存储介质 |
CN114926515B (zh) * | 2022-06-08 | 2024-05-14 | 北京化工大学 | 基于时空域深度信息补全的红外与可见光图像配准方法 |
CN117522765A (zh) * | 2022-07-28 | 2024-02-06 | 杭州堃博生物科技有限公司 | 一种内窥镜位姿估计方法、装置及存储介质 |
CN117237553A (zh) * | 2023-09-14 | 2023-12-15 | 广东省核工业地质局测绘院 | 一种基于点云图像融合的三维地图测绘系统 |
CN117218089B (zh) * | 2023-09-18 | 2024-04-19 | 中南大学 | 一种沥青路面构造深度检测方法 |
CN117173342A (zh) * | 2023-11-02 | 2023-12-05 | 中国海洋大学 | 基于水下单双目相机的自然光下移动三维重建装置及方法 |
CN117392329B (zh) * | 2023-12-08 | 2024-02-06 | 中国海洋大学 | 一种基于移动式多光谱光度立体设备的使用方法 |
CN117557660B (zh) * | 2024-01-09 | 2024-04-12 | 北京集度科技有限公司 | 数据处理方法、装置、电子设备以及车辆 |
CN117893693B (zh) * | 2024-03-15 | 2024-05-28 | 南昌航空大学 | 一种密集slam三维场景重建方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103247075A (zh) * | 2013-05-13 | 2013-08-14 | 北京工业大学 | 基于变分机制的室内环境三维重建方法 |
CN108416840A (zh) * | 2018-03-14 | 2018-08-17 | 大连理工大学 | 一种基于单目相机的三维场景稠密重建方法 |
CN109087349A (zh) * | 2018-07-18 | 2018-12-25 | 亮风台(上海)信息科技有限公司 | 一种单目深度估计方法、装置、终端和存储介质 |
CN109448041A (zh) * | 2018-10-29 | 2019-03-08 | 重庆金山医疗器械有限公司 | 一种胶囊内镜图像三维重建方法及系统 |
WO2019169540A1 (zh) * | 2018-03-06 | 2019-09-12 | 斯坦德机器人(深圳)有限公司 | 紧耦合视觉slam的方法、终端及计算机可读存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9384585B2 (en) * | 2012-10-23 | 2016-07-05 | Electronics And Telecommunications Research Institute | 3-dimensional shape reconstruction device using depth image and color image and the method |
CN108898630B (zh) * | 2018-06-27 | 2020-12-15 | 清华-伯克利深圳学院筹备办公室 | 一种三维重建方法、装置、设备和存储介质 |
CN109544677B (zh) * | 2018-10-30 | 2020-12-25 | 山东大学 | 基于深度图像关键帧的室内场景主结构重建方法及系统 |
CN111145238B (zh) * | 2019-12-12 | 2023-09-22 | 中国科学院深圳先进技术研究院 | 单目内窥镜图像的三维重建方法、装置及终端设备 |
-
2019
- 2019-12-12 CN CN201911275140.9A patent/CN111145238B/zh active Active
-
2020
- 2020-11-17 WO PCT/CN2020/129546 patent/WO2021115071A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103247075A (zh) * | 2013-05-13 | 2013-08-14 | 北京工业大学 | 基于变分机制的室内环境三维重建方法 |
WO2019169540A1 (zh) * | 2018-03-06 | 2019-09-12 | 斯坦德机器人(深圳)有限公司 | 紧耦合视觉slam的方法、终端及计算机可读存储介质 |
CN108416840A (zh) * | 2018-03-14 | 2018-08-17 | 大连理工大学 | 一种基于单目相机的三维场景稠密重建方法 |
CN109087349A (zh) * | 2018-07-18 | 2018-12-25 | 亮风台(上海)信息科技有限公司 | 一种单目深度估计方法、装置、终端和存储介质 |
CN109448041A (zh) * | 2018-10-29 | 2019-03-08 | 重庆金山医疗器械有限公司 | 一种胶囊内镜图像三维重建方法及系统 |
Non-Patent Citations (2)
Title |
---|
NADER MAHMOUD ET AL: "\"ORBSLAM-Based Endscope Tracking and 3D Reconstruction\"", pages 72 - 83 * |
YONGLI DUAN ET AL: ""Dense Mapping from feature-Based Monocular SLAM Based on Depth Prediction"", pages 1 - 5 * |
Cited By (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021115071A1 (zh) * | 2019-12-12 | 2021-06-17 | 中国科学院深圳先进技术研究院 | 单目内窥镜图像的三维重建方法、装置及终端设备 |
CN111798387A (zh) * | 2020-06-24 | 2020-10-20 | 海南大学 | 一种用于共聚焦内窥镜的图像处理方法及系统 |
CN111882657A (zh) * | 2020-06-29 | 2020-11-03 | 杭州易现先进科技有限公司 | 三维重建的尺度恢复方法、装置、系统和计算机设备 |
CN111882657B (zh) * | 2020-06-29 | 2024-01-26 | 杭州易现先进科技有限公司 | 三维重建的尺度恢复方法、装置、系统和计算机设备 |
CN111784754A (zh) * | 2020-07-06 | 2020-10-16 | 浙江得图网络有限公司 | 基于计算机视觉的牙齿正畸方法、装置、设备及存储介质 |
CN111784754B (zh) * | 2020-07-06 | 2024-01-12 | 浙江得图网络有限公司 | 基于计算机视觉的牙齿正畸方法、装置、设备及存储介质 |
CN111862120A (zh) * | 2020-07-22 | 2020-10-30 | 苏州大学 | 一种单目slam尺度恢复的方法 |
CN111862120B (zh) * | 2020-07-22 | 2023-07-11 | 苏州大学 | 一种单目slam尺度恢复的方法 |
CN111899345A (zh) * | 2020-08-03 | 2020-11-06 | 成都圭目机器人有限公司 | 一种基于2d视觉图像的三维重建方法 |
CN111899345B (zh) * | 2020-08-03 | 2023-09-01 | 成都圭目机器人有限公司 | 一种基于2d视觉图像的三维重建方法 |
CN112330729B (zh) * | 2020-11-27 | 2024-01-12 | 中国科学院深圳先进技术研究院 | 图像深度预测方法、装置、终端设备及可读存储介质 |
CN112330729A (zh) * | 2020-11-27 | 2021-02-05 | 中国科学院深圳先进技术研究院 | 图像深度预测方法、装置、终端设备及可读存储介质 |
CN112261399A (zh) * | 2020-12-18 | 2021-01-22 | 安翰科技(武汉)股份有限公司 | 胶囊内窥镜图像三维重建方法、电子设备及可读存储介质 |
CN112802123A (zh) * | 2021-01-21 | 2021-05-14 | 北京科技大学设计研究院有限公司 | 一种基于条纹虚拟靶标的双目线阵相机静态标定方法 |
CN112802123B (zh) * | 2021-01-21 | 2023-10-27 | 北京科技大学设计研究院有限公司 | 一种基于条纹虚拟靶标的双目线阵相机静态标定方法 |
CN112907620A (zh) * | 2021-01-25 | 2021-06-04 | 北京地平线机器人技术研发有限公司 | 相机位姿的估计方法、装置、可读存储介质及电子设备 |
CN112767489A (zh) * | 2021-01-29 | 2021-05-07 | 北京达佳互联信息技术有限公司 | 一种三维位姿确定方法、装置、电子设备及存储介质 |
CN112767489B (zh) * | 2021-01-29 | 2024-05-14 | 北京达佳互联信息技术有限公司 | 一种三维位姿确定方法、装置、电子设备及存储介质 |
CN112927340A (zh) * | 2021-04-06 | 2021-06-08 | 中国科学院自动化研究所 | 一种不依赖于机械摆放的三维重建加速方法、系统及设备 |
CN112927340B (zh) * | 2021-04-06 | 2023-12-01 | 中国科学院自动化研究所 | 一种不依赖于机械摆放的三维重建加速方法、系统及设备 |
CN113569843A (zh) * | 2021-06-21 | 2021-10-29 | 影石创新科技股份有限公司 | 角点检测方法、装置、计算机设备和存储介质 |
CN113724194B (zh) * | 2021-06-22 | 2024-01-30 | 山东交通学院 | 一种发动机内窥式火焰测量系统及图像处理方法 |
CN113724194A (zh) * | 2021-06-22 | 2021-11-30 | 山东交通学院 | 一种发动机内窥式火焰测量系统及图像处理方法 |
WO2023007641A1 (ja) * | 2021-07-29 | 2023-02-02 | 株式会社エビデント | 3次元再構成装置、3次元再構成方法、およびプログラム |
JP7498371B2 (ja) | 2021-07-29 | 2024-06-11 | 株式会社エビデント | 3次元再構成装置、3次元再構成方法、およびプログラム |
WO2023093739A1 (zh) * | 2021-11-25 | 2023-06-01 | 华为技术有限公司 | 一种多视图三维重建的方法 |
WO2023124877A1 (zh) * | 2021-12-30 | 2023-07-06 | 小荷医疗器械(海南)有限公司 | 内窥镜图像的处理方法、装置、可读介质和电子设备 |
CN114677572B (zh) * | 2022-04-08 | 2023-04-18 | 北京百度网讯科技有限公司 | 对象描述参数的生成方法、深度学习模型的训练方法 |
CN114677572A (zh) * | 2022-04-08 | 2022-06-28 | 北京百度网讯科技有限公司 | 对象描述参数的生成方法、深度学习模型的训练方法 |
CN114782470A (zh) * | 2022-06-22 | 2022-07-22 | 浙江鸿禾医疗科技有限责任公司 | 消化道的三维全景识别定位方法、存储介质和设备 |
CN114782470B (zh) * | 2022-06-22 | 2022-09-13 | 浙江鸿禾医疗科技有限责任公司 | 消化道的三维全景识别定位方法、存储介质和设备 |
WO2023246441A1 (zh) * | 2022-06-22 | 2023-12-28 | 江苏势通生物科技有限公司 | 消化道的三维全景识别定位方法、存储介质和计算机设备 |
CN115471556A (zh) * | 2022-09-22 | 2022-12-13 | 南京博视医疗科技有限公司 | 一种单目相机图像目标点三维定位方法及装置 |
CN115471556B (zh) * | 2022-09-22 | 2023-11-14 | 南京博视医疗科技有限公司 | 一种单目相机图像目标点三维定位方法及装置 |
CN116704152A (zh) * | 2022-12-09 | 2023-09-05 | 荣耀终端有限公司 | 图像处理方法和电子设备 |
CN116704152B (zh) * | 2022-12-09 | 2024-04-19 | 荣耀终端有限公司 | 图像处理方法和电子设备 |
CN116958147B (zh) * | 2023-09-21 | 2023-12-22 | 青岛美迪康数字工程有限公司 | 基于深度图像特征的目标区域确定方法、装置和设备 |
CN116958147A (zh) * | 2023-09-21 | 2023-10-27 | 青岛美迪康数字工程有限公司 | 基于深度图像特征的目标区域确定方法、装置和设备 |
CN117115358A (zh) * | 2023-10-11 | 2023-11-24 | 世优(北京)科技有限公司 | 数字人自动建模方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2021115071A1 (zh) | 2021-06-17 |
CN111145238B (zh) | 2023-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111145238B (zh) | 单目内窥镜图像的三维重建方法、装置及终端设备 | |
Jeon et al. | Accurate depth map estimation from a lenslet light field camera | |
US7554575B2 (en) | Fast imaging system calibration | |
CN110070598B (zh) | 用于3d扫描重建的移动终端及其进行3d扫描重建方法 | |
CN105488775A (zh) | 一种基于六摄像机环视的柱面全景生成装置及方法 | |
US9183634B2 (en) | Image processing apparatus and image processing method | |
CN112348863B (zh) | 图像对齐方法、图像对齐装置及终端设备 | |
CN111598993A (zh) | 基于多视角成像技术的三维数据重建方法、装置 | |
WO2010044939A1 (en) | Structure and motion with stereo using lines | |
WO2021136386A1 (zh) | 数据处理方法、终端和服务器 | |
US11620730B2 (en) | Method for merging multiple images and post-processing of panorama | |
CN111080776B (zh) | 人体动作三维数据采集和复现的处理方法及系统 | |
CN112927306B (zh) | 拍摄装置的标定方法、装置及终端设备 | |
Bastanlar et al. | Multi-view structure-from-motion for hybrid camera scenarios | |
CN111461998A (zh) | 一种环境重建方法及装置 | |
CN111325828B (zh) | 一种基于三目相机的三维人脸采集方法及装置 | |
CN113379815A (zh) | 基于rgb相机与激光传感器的三维重建方法、装置及服务器 | |
CN113807451A (zh) | 全景图像特征点匹配模型的训练方法、装置以及服务器 | |
CN113516719B (zh) | 一种基于多单应性矩阵的相机标定方法、系统及存储介质 | |
CN111383264A (zh) | 一种定位方法、装置、终端及计算机存储介质 | |
CN112907657A (zh) | 一种机器人重定位方法、装置、设备及存储介质 | |
US9135715B1 (en) | Local feature cameras for structure from motion (SFM) problems with generalized cameras | |
CN112102378A (zh) | 图像配准方法、装置、终端设备及计算机可读存储介质 | |
JP7489253B2 (ja) | デプスマップ生成装置及びそのプログラム、並びに、デプスマップ生成システム | |
CN113034345B (zh) | 一种基于sfm重建的人脸识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |