CN111161408B

CN111161408B - 一种实现增强现实的方法及其应用、计算设备

Info

Publication number: CN111161408B
Application number: CN201911377582.4A
Authority: CN
Inventors: 李彬; 张志敏; 田联房; 丁焕文
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2019-12-27
Filing date: 2019-12-27
Publication date: 2021-12-21
Anticipated expiration: 2039-12-27
Also published as: CN111161408A

Abstract

本发明公开了一种实现增强现实的方法及其应用、计算设备，方法包括先获取被测目标的多帧视频图像和数字三维模型；选取模型在世界空间坐标系下的四个坐标点，在首帧视频图像或者首帧带有被测目标的视频图像中选取出四个对应的像素点，并提取出视频图像的特征点，生成改进特征点描述符向量，然后在该帧视频图像中渲染数字三维模型；再对剩余的多帧视频图像依次提取特征点，对当前视频图像和前一帧视频图像的特征点进行匹配跟踪；求解数字三维模型的位姿估计，并在剩余的多帧视频图像中依次渲染对应的位姿状态，最终得到实现增强现实的多帧视频图像。本发明可以实现高精确度、高稳定度和高效率的图像匹配，得到实现增强现实的图像。

Description

一种实现增强现实的方法及其应用、计算设备

技术领域

本发明涉及计算机图形图像学技术领域，特别涉及一种实现增强现实的方法及其应用、计算设备。

背景技术

在计算机辅助骨科手术中应用增强现实技术(Augmented Reality，AR)具有非常高的临床应用价值。在计算机辅助骨科手术系统中结合AR技术，可以提高医生对患者病灶区域定位的准确性，而且具有实时性。实现AR需要对视频图像的目标进行匹配跟踪，然而，由于视频图像中光线变化和视角变化产生的噪点对特征点的干扰，视频图像中场景复杂和变化太大，以及视频帧图像的丢失而对目标跟踪造成重大的影响，视频图像的目标匹配问题一直是个具有挑战性的问题。

现有的针对视频图像目标匹配问题的解决方法主要是改进特征点提取步骤、改进特征点描述符算子以及改进特征点的匹配算法。目前在图像匹配中的特征点算子主要有Morave算法、SUSAN算子、Harris角点、SIFT算子以及SURF算子。前三种算子都只能检测出关键点而没有描述符算子，不能很好地描述出局部位置信息。SIFT算子和SURF算子都是高维特征，具有尺度不变的特点，匹配精确度较高，但SIFT在检测和构造描述符的运算量比较大，导致匹配速度慢。SURF速度比SIFT快3倍，但其描述符维度比SIFT小一半，描述的局部信息减少了，对于相对复杂的视频场景来说还是达不到准确性和快速性的要求。常用的匹配方法有暴力法(Brute Force，BF)、快速最近邻匹配算法(Fast Library for ApproximateNearest Neighbors，FLANN)以及随机抽样一致算法(Random Sample Consensus,RANSAC)。BF和RANSANC的配对具有准确性但是其匹配时间较长，达不到视频图像匹配的要求；而FLANN算法在一定程度上缩短了匹配时间，但也还不满足AR场景中的实时性。鉴于现有算法在实现AR上仍存在的不足之处，因此有必要研究出新的实现方法。

发明内容

本发明的第一目的在于克服现有技术的缺点与不足，提供一种实现增强现实的方法，该方法可以实现高精确度、高稳定度和高效率的图像匹配，得到实现增强现实的图像。

本发明的第二目的在于提供一种实现增强现实的方法的应用。

本发明的第三目的在于提供一种计算设备。

本发明的第一目的通过下述技术方案实现：一种实现增强现实的方法，步骤如下：

S1、获取被测目标的多帧视频图像和被测目标的数字三维模型；

S2、选取数字三维模型在世界空间坐标系下的四个坐标点，在首帧视频图像或者首帧带有被测目标的视频图像中选取出与四个坐标点对应的像素点，并对该帧视频图像进行特征点提取，生成改进特征点描述符向量，然后在该帧视频图像中渲染数字三维模型；

S3、针对于剩余的多帧视频图像，依次进行特征点提取，并对当前视频图像和前一帧视频图像的特征点进行匹配跟踪；

S4、求解数字三维模型的位姿估计，并在剩余的多帧视频图像中依次渲染对应的数字三维模型位姿状态，最终得到实现增强现实的多帧视频图像。

优选的，提取的特征点为SURF特征点、SUSAN算子、FAST特征点、SIFT特征点或者ORB特征点。

优选的，当特征点为SURF特征点时，对视频图像进行特征点提取的过程具体为：

求解视频图像的Hessian行列式矩阵，根据Hessian行列式矩阵构建特征点的尺度空间，并基于该尺度空间，利用非极值抑制来提取出视频图像的特征点；

生成改进特征点描述符向量的过程具体如下：

在特征点6s领域内，统计所有点的水平haar小波特征和垂直haar小波特征总和，将小波特征总和最多的60度扇形方向作为主方向，并基于该主方向，利用haar小波响应生成特征点主描述符f₀，s为特征点主描述符f₀所在的尺度；

在视频图像中，对于分布在特征点主描述符f₀的上、下、左和右四个方向上且距离10s的四个像素点，基于主方向和利用haar小波响应生成对应的特征点次描述符f₁、f₂、f₃和f₄；

由特征点主描述符和四个特征点次描述符构成改进特征点描述符，并将该特征点描述符作为特征点的特征向量v＝{f₀,f₁,f₂,f₃,f₄}。

更进一步的，利用opencv库中的cv::SurfFeatureDetector类中的detect函数提取出特征点，利用opencv库中的cv::SurfDescriptorExtractor类构建改进特征点描述符。

优选的，在步骤S3中，采用改进FLANN算法对当前视频图像和前一帧视频图像的特征点进行匹配跟踪，过程如下：

S31、在对第二帧视频图像进行特征点配对时，此时没有匹配先验信息，用原始的FLANN算法匹配第一帧和第二帧视频图像的特征点；

S32、在前一帧视频图像f_i-1的特征点已成功配对的情况下，对当前视频图像f_i进行特征点配对时，此时含有前两帧视频图像f_i-1和f_i-2的匹配先验信息，根据匹配先验信息，利用RANSAC算法求出先验的配对点之间的位置映射关系，然后从映射区域搜索当前帧视频图像f_i与前一帧视频图像f_i-1特征点的配对点；

S33、若步骤S32找不到配对的特征点，再参照步骤31采用原始的FLANN算法对当前帧视频图像f_i进行全局特征点匹配。

更进一步的，在步骤S31中，用原始的FLANN算法匹配第一帧和第二帧视频图像的特征点，过程如下：

判断第一帧和第二帧视频图像中特征点的迹的符号是否相同，若否，则判定两帧视频图像的特征点不匹配；

若是，则分别计算两帧视频图像的特征点之间的最小欧氏距离与次小欧氏距离，以此计算出最小欧氏距离与次小欧氏距离的比值；

判断比值是否小于或等于设定阈值T，以此确定两帧视频图像的特征点p和q是否为配对点，表达式如下：

其中，D_pq是特征点p的最小欧式距离，D_pk是特征点p的次小欧氏距离。

更进一步的，在步骤S32中，利用RANSAC算法求出先验的配对点之间的位置映射关系，然后从映射区域搜索当前帧视频图像f_i与前一帧视频图像f_i-1特征点的配对点，过程如下：

S321、根据前两帧视频图像中存在的特征点映射关系表达式，利用前两帧视频图像的四组已配对好的坐标点和像素点计算出坐标变换矩阵H，特征点映射关系表达式具体如下：

其中，(x,y)和(x',y')分别是第f_i-2帧视频图像与f_i-1帧视频图像中相配对的坐标点和像素点的坐标；h₁₁、h₁₂、h₁₃、h₂₁、h₂₂、h₂₃、h₃₁、h₃₂和h₃₃是坐标变换矩阵H的各个参数；

S322、根据上述求得的特征点映射关系，计算出前一帧视频图像f_i-1的特征点在当前帧视频图像f_i的特征点映射位置，然后根据特征点匹配原则，在该特征点映射位置的s领域内搜索当前帧视频图像f_i与前一帧视频图像f_i-1匹配的特征点，s为改进特征点描述符中的特征点主描述符f₀所在的尺度；

特征点匹配原则是：当两个特征点之间的欧氏距离小于设定值，两个特征点为匹配点对。

优选的，在步骤S4中，数字三维模型的位姿状态求解过程如下：

根据数字三维模型在世界空间坐标系下的四个坐标点与对应的视频图像中的像素点组成的四组特征点，求解出旋转矩阵和平移矩阵；

利用opencv里的cv::solvePnP()函数求解旋转矩阵和平移矩阵，得到旋转向量和平移向量，也即是得到数字三维模型的位姿状态；

为了使数字三维模型更好地贴合被测目标，使用cv::Rodrigues()函数将求得的三维旋转向量转化为三维旋转空间矩阵，再对数字三维模型进行相应的变换。

本发明的第二目的通过下述技术方案实现：一种实现增强现实的方法的应用，将本发明第一目的所述的实现增强现实的方法应用在计算机辅助骨科手术中；

其中，步骤S1中的被测目标指的是正在进行骨科手术的患者或者需做骨科手术的患者的骨骼实物模型，数字三维模型指的是患者对应的骨骼数字三维模型；执行步骤S1至步骤S4后得到可辅助骨科手术的实现增强现实的视频图像。

本发明的第三目的通过下述技术方案实现：一种计算设备，包括处理器以及用于存储处理器可执行程序的存储器，所述处理器执行存储器存储的程序时，实现本发明第一目的所述的实现增强现实的方法。

本发明相对于现有技术具有如下的优点及效果：

(1)本发明实现增强现实的方法，包括先获取被测目标的多帧视频图像和数字三维模型；选取模型在世界空间坐标系下的四个坐标点，在首帧视频图像或者首帧带有被测目标的视频图像中选取出四个对应的像素点，并提取出视频图像的特征点，生成改进特征点描述符向量，然后在该帧视频图像中渲染数字三维模型；再对剩余的多帧视频图像依次提取特征点，对当前视频图像和前一帧视频图像的特征点进行匹配跟踪；求解数字三维模型的位姿估计，并在剩余的多帧视频图像中依次渲染对应的位姿状态，最终得到实现增强现实的多帧视频图像。本发明方法能够将视频图像和数字三维模型进行高精确度、高稳定度和高效率匹配，从而得到实现增强现实的图像，能够满足AR场景中的实时性和准确性的要求。

(2)本发明方法对SURF特征点的描述符做了改进，在保留特征点的旋转、平移、尺度不变的特性的同时增大了特征点对局部信息的描述，使得特征点描述符在复杂的视频场景下依然可以提供准确的局部信息，得到的匹配结果更加准确。

(3)本发明方法采用改进FLANN算法进行特征点匹配，利用了连续图像的前一帧匹配先验信息，预测当前帧特征点匹配的坐标区域，在预测区域搜索配对点，极大地提高特征点的匹配效率。并且，在局部区域搜索不到配对点的情况下还有再进行全局特征点配对，可以保证配对的稳定性。

(4)本发明方法适用于多种特征点，包括SUSAN算子、FAST特征点、SIFT特征点、ORB特征点，因此本发明方法应用范围广。

(5)本发明方法适用于图像拼接处理、医学图像匹配、遥感图像处理和目标跟踪等领域，其中，当本发明方法应用在计算机辅助骨科手术时，计算机辅助骨科手术系统结合AR技术可以提高医生对患者病灶区域定位的准确性，辅助骨科手术，具有非常高的临床应用价值。

附图说明

图1是本发明实现增强现实的方法的流程图。

图2(a)是骨骼实物模型的视频图像。

图2(b)是图2(a)的实现增强现实的图像。

图2(c)是骨骼实物模型的另一帧视频图像。

图2(d)是图2(c)的实现增强现实的图像。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例1

本实施例公开了一种实现增强现实的方法，如图1所示，步骤如下：

S1、获取被测目标的多帧视频图像和被测目标的数字三维模型。本实施例的视频图像是通过对被测目标的视频做帧处理而得到的连续图像，数字三维模型是通过MarchingCubes面绘制算法构建而成。

S2、选取数字三维模型在世界空间坐标系下的四个坐标点，在首帧视频图像或者首帧带有被测目标的视频图像中选取出与四个坐标点对应的像素点，并对该帧视频图像进行特征点提取，生成改进特征点描述符向量，然后在该帧视频图像中渲染数字三维模型。

考虑到选取的便捷性，四个坐标点通常是在模型轮廓边缘进行选取。提取的特征点可以是SURF特征点、SUSAN算子、FAST特征点、SIFT特征点或者ORB特征点，提取方法也类似。

本实施例提取的是SURF特征点。当特征点为SURF特征点时，对视频图像进行特征点提取的过程具体为：

求解视频图像的Hessian行列式矩阵，根据Hessian行列式矩阵构建特征点的尺度空间，并基于该尺度空间，利用非极值抑制来提取出视频图像的特征点。

生成改进特征点描述符向量的过程具体如下：

由特征点主描述符和四个特征点次描述符构成改进特征点描述符，并将该特征点描述符作为特征点的特征向量v＝{f₀,f₁,f₂,f₃,f₄}。可见，改进特征点描述符在保留特征点的旋转、平移、尺度不变的特性的同时增大了特征点对局部信息的描述。

在本实施例中，可以利用opencv库中的cv::SurfFeatureDetector类中的detect函数提取出SURF特征点，利用opencv库中的cv::SurfDescriptorExtractor类构建改进特征点描述符。

S3、针对于剩余的多帧视频图像，依次进行特征点提取，并对当前视频图像和前一帧视频图像的特征点进行匹配跟踪。

本实施例具体是采用改进FLANN算法进行匹配跟踪，过程如下：

S31、在对第二帧视频图像进行特征点配对时，此时没有匹配先验信息，用原始的FLANN算法匹配第一帧和第二帧视频图像的特征点，过程如下：

其中，D_pq是特征点p的最小欧式距离，D_pk是特征点p的次小欧氏距离，设定阈值T根据实际情况而定，一般是0.6～0.8。

S32、在前一帧视频图像f_i-1的特征点已成功配对的情况下，对当前视频图像f_i进行特征点配对时，此时含有前两帧视频图像f_i-1和f_i-2的匹配先验信息，根据匹配先验信息，利用RANSAC算法求出先验的配对点之间的位置映射关系，然后从映射区域搜索当前帧视频图像f_i与前一帧视频图像f_i-1特征点的配对点，过程如下：

S322、根据上述求得的特征点映射关系，计算出前一帧视频图像f_i-1的特征点在当前帧视频图像f_i的特征点映射位置，然后根据特征点匹配原则，在该特征点映射位置的s领域内搜索当前帧视频图像f_i与前一帧视频图像f_i-1匹配的特征点。

特征点匹配原则是：当两个特征点之间的欧氏距离小于设定值，两个特征点为匹配点对。本实施例的设定值为100。

由上述过程可知，改进FLANN算法需要用到前一帧图像的匹配先验信息来预测下一帧图像特征点匹配的位置，这种算法能有效提高特征点匹配的效率。

求解数字三维模型的位姿估计即是求解位姿变换矩阵的过程，位姿变换的结果即是位姿状态，求解过程具体如下：

根据数字三维模型在世界空间坐标系下的四个坐标点与对应的视频图像中的像素点组成的四组特征点，求解出旋转矩阵和平移矩阵，旋转矩阵和平移矩阵描述了数字三维模型的位姿变换；

利用opencv里的cv::solvePnP()函数求解旋转矩阵和平移矩阵，得到旋转向量和平移向量，也即是得到数字三维模型的位姿状态。

将opencv重新编译，开启支持OpenGL状态即可在二维的视频图像渲染数字三维模型的位姿状态，实现被测目标和数字三维模型的匹配；

使用cv::Rodrigues()函数将求得的三维旋转向量转化为三维旋转空间矩阵，再对数字三维模型进行相应的变换，使数字三维模型更好地贴合被测目标。

本实施例还公开了一种实现增强现实的方法的应用，如图2(a)至图2(d)所示，具体是将上述实现增强现实的方法应用在计算机辅助骨科手术中。

其中，步骤S1中的被测目标指的是正在进行骨科手术的患者或者需做骨科手术的患者的骨骼实物模型，骨骼实物模型可参见图2(a)和图2(c)，数字三维模型指的是患者对应的骨骼数字三维模型；执行步骤S1至步骤S4后即可得到可辅助骨科手术的实现增强现实的视频图像，可参见图2(b)和图2(d)。

实施例2

本实施例公开了一种计算设备，包括处理器以及用于存储处理器可执行程序的存储器，所述处理器执行存储器存储的程序时，实现实施例1中所述的实现增强现实的方法，具体如下：

本实施例中所述的计算设备可以是台式电脑、笔记本电脑、智能手机、PDA手持终端、平板电脑或其他具有处理器功能的终端设备。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种实现增强现实的方法，其特征在于，步骤如下：

S4、求解数字三维模型的位姿估计，并在剩余的多帧视频图像中依次渲染对应的数字三维模型位姿状态，最终得到实现增强现实的多帧视频图像；

在步骤S3中，采用改进FLANN算法对当前视频图像和前一帧视频图像的特征点进行匹配跟踪，过程如下：

2.根据权利要求1所述的实现增强现实的方法，其特征在于，提取的特征点为SURF特征点、SUSAN算子、FAST特征点、SIFT特征点或者ORB特征点。

3.根据权利要求1所述的实现增强现实的方法，其特征在于，当特征点为SURF特征点时，对视频图像进行特征点提取的过程具体为：

生成改进特征点描述符向量的过程具体如下：

4.根据权利要求3所述的实现增强现实的方法，其特征在于，利用opencv库中的cv::SurfFeatureDetector类中的detect函数提取出特征点，利用opencv库中的cv::SurfDescriptorExtractor类构建改进特征点描述符。

5.根据权利要求1所述的实现增强现实的方法，其特征在于，在步骤S31中，用原始的FLANN算法匹配第一帧和第二帧视频图像的特征点，过程如下：

判断比值是否小于设定阈值T，以此确定两帧视频图像的特征点p和q是否为配对点，表达式如下：

6.根据权利要求1所述的实现增强现实的方法，其特征在于，在步骤S32中，利用RANSAC算法求出先验的配对点之间的位置映射关系，然后从映射区域搜索当前帧视频图像f_i与前一帧视频图像f_i-1特征点的配对点，过程如下：

S322、当前帧视频图像f_i根据上述求得的特征点映射关系，计算出前一帧视频图像f_i-1的特征点在当前帧视频图像f_i的特征点映射位置，然后根据特征点匹配原则，在该特征点映射位置的s领域内搜索当前帧视频图像f_i与前一帧视频图像f_i-1匹配的特征点，s为改进特征点描述符中的特征点主描述符f₀所在的尺度；

7.根据权利要求1所述的实现增强现实的方法，其特征在于，在步骤S4中，数字三维模型的位姿状态求解过程如下：

8.一种实现增强现实的方法的应用，其特征在于，将权利要求1至7中任一项所述的实现增强现实的方法应用在计算机辅助骨科手术中；

9.一种计算设备，包括处理器以及用于存储处理器可执行程序的存储器，其特征在于，所述处理器执行存储器存储的程序时，实现权利要求1至7中任一项所述的实现增强现实的方法。