WO2018019272A1

WO2018019272A1 - 基于平面检测实现增强现实的方法及装置

Info

Publication number: WO2018019272A1
Application number: PCT/CN2017/094736
Authority: WO
Inventors: 柳寅秋; 郑黎力
Original assignee: 成都理想境界科技有限公司
Priority date: 2016-07-29
Filing date: 2017-07-27
Publication date: 2018-02-01

Abstract

本发明提供一种基于平面检测实现增强现实的方法，包括以下步骤：通过摄像机实时获取环境场景的视频图像；确定所述环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面；根据所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象。本发明同时提供一种基于平面检测实现增强现实的装置。本发明基于平面检测实现增强现实的方法及装置，通过检测环境场景的视频图像的用户感兴趣区域中的平面，使叠加渲染的虚拟对象的姿态与其叠加位置的平面保持一致，显著提升了虚拟对象与真实环境场景的贴合度，实现虚拟对象与真实环境的无缝融合。

Description

基于平面检测实现增强现实的方法及装置

本申请要求享有2016年7月29日提交的名称为“基于平面检测实现增强现实的方法及装置”的中国专利申请CN201610617570.4、以及2016年7月29日提交的名称为“基于平面检测实现增强现实的方法及装置”的中国专利申请CN201610616770.8的优先权，其全部内容通过引用并入本文中。

技术领域

本发明涉及计算机视觉与人工智能技术领域，尤其涉及一种基于平面检测实现增强现实的方法及装置。

背景技术

SLAM(Simultaneous Localization and Mapping，同时定位与地图创建)，是一项应用于在未知环境中自主地图创建与自身定位相结合的技术，是当前自主导航领域的研究热点。该技术的目标是解决在进入未知环境后，如何感知周围环境并构建增量式地图，同时进行自身定位的问题，目前主要应用于无人驾驶、机器人及场景三维重建等技术方向。

增强现实技术(Augmented Reality，AR)借助计算机图形技术和可视化技术生成现实环境中不存在的虚拟对象，并通过图像识别定位技术将虚拟对象准确地融合到真实环境中，借助显示设备将虚拟对象与真实环境融为一体，并呈现给使用者真实的感观体验。增强现实技术要解决的首要技术难题是如何将虚拟对象准确地融合到真实世界中，也就是要使虚拟对象以正确的角度姿态出现在真实场景的正确位置上，从而产生强烈的视觉真实感。

现有技术中基于SLAM技术的增强现实技术方案，完成环境识别与摄像机位姿计算之后，未进行平面检测便直接进行虚拟信息叠加显示，这导致虚拟信息与环境场景的贴合度较低，容易使用户产生视觉错位，影响增强现实技术的呈现效果。因此，如何在不同的真实环境场景中准确检测虚拟信息叠加的平面，使虚拟信息与其叠加位置的平面保持一致，是增强现实技术发展中亟待解决的技术问题之一。

发明内容

本发明的目的是提供一种基于平面检测实现增强现实的方法及装置，通过实时采集环境场景的视频图像，检测环境场景的视频图像中感兴趣区域中的平面，无需场景的初始信息或者特定的标记点，即可快速、准确地实现在环境场景的视频图像的感兴趣区域中对虚拟对象进行叠加显示。

有鉴于此，本发明一方面提供一种基于平面检测实现增强现实的方法，包括以下步骤：通过摄像机实时获取环境场景的视频图像；确定所述环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面；根据所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象。

优选地，所述通过摄像机实时获取环境场景的视频图像的步骤，还包括：根据所述环境场景的视频图像，确定所述环境场景的视频图像的当前帧对应的摄像机位姿；以及，根据所述环境场景的视频图像，构建所述环境场景的三维地图。

优选地，所述确定所述环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面的步骤，具体为：根据用户操控指令，确定所述环境场景的视频图像的当前帧中的感兴趣区域；或者，根据所述摄像机位姿，确定所述环境场景的视频图像的当前帧中的感兴趣区域；提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，得到图像特征点集合；在所述图像特征点集合中，选取预设数量的图像特征点，并检测所述感兴趣区域中的平面。

优选地，所述在所述图像特征点集合中，选取预设数量的图像特征点，并检测所述感兴趣区域中的平面的步骤，具体为：在所述图像特征点集合中，通过随机抽样一致性算法选取预设数量的图像特征点；根据所述环境场景的三维地图，确定各个选取的图像特征点在所述环境场景的视频图像的参考帧中的对应图像点，所述参考帧为所述环境场景的视频图像的当前帧的前一关键帧或者前一相邻帧；根据所有选取的图像特征点及其在所述参考帧中的对应图像点，迭代计算单应性矩阵，并根据所述单应性矩阵确定旋转矩阵R₀和位移矩阵t₀；根据当前帧图像与参考帧图像的旋转矩阵R和位移矩阵t，判断包括所述旋转矩阵R₀和位移矩阵t₀的矩阵与包括所述旋转矩阵R和位移矩阵t的矩阵之间的误差是否小于预设阈值ε，若是，则确定所有选取的图像特征点在同一平面上，并确定该平面为所述感兴趣区域中的平面。

优选地，所述确定所述环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面的步骤，还包括：根据所述图像特征点集合中到所述感兴趣区域中的平面的距离小于预设距离阈值的图像特征点，确定所述感兴趣区域中的平面的法线。

优选地，所述确定所述环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面的步骤，具体为：根据用户操控指令，确定所述环境场景的视频图像的当前帧中的感兴趣区域；提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，根据所述环境场景的三维地图，确定所述图像特征点对应的地图点，得到地图点集合；根据所述地图点集合，检测所述感兴趣区域中的平面。

优选地，所述根据所述地图点集合，检测所述感兴趣区域中的平面的步骤，具体为：根据所述地图点集合中地图点的平均坐标值，获取以所述环境场景的三维地图的坐标原点为中心的地图点集合MP；将所述地图点集合MP转换为数据矩阵并进行奇异值分解，确定以最小奇异值对应的奇异向量为法线的平面P；递归计算所述地图点集合MP中所有地图点到所述平面P的距离，判断距离小于预设阈值ε的地图点数量是否大于预设数量阈值l，若是，则确定所述平面P为所述感兴趣区域中的平面。

优选地，所述根据所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象的步骤，具体为：调整所述虚拟对象的位置和/或角度，使所述虚拟对象的法线方向与所述感兴趣区域中的平面的法线方向一致，确定所述虚拟对象的旋转矩阵和位移矩阵；在所述环境场景的视频图像的当前帧中的感兴趣区域内，根据所述虚拟对象的旋转矩阵和位移矩阵渲染所述虚拟对象。

本发明另一方面提供一种基于平面检测实现增强现实的装置，其包括：图像采集模块：用于通过摄像机实时获取环境场景的视频图像；平面检测模块：用于确定所述环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面；对象渲染模块：用于根据所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象。

优选地，所述图像采集模块，还包括：图像跟踪单元：用于根据所述环境场景的视频图像，确定所述环境场景的视频图像的当前帧对应的摄像机位姿；地图构建单元：用于根据所述环境场景的视频图像，构建所述环境场景的三维地图。

优选地，所述平面检测模块，还包括：区域确定单元：用于根据用户操控指令或所述摄像机位姿，确定所述环境场景的视频图像的当前帧中的感兴趣区域；特征点提取单元：用于提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，得到图像特征点集合；平面检测单元：用于在所述图像特征点集合中，选取预设数量的图像特征点，并检测所述感兴趣区域中的平面。

优选地，所述平面检测单元，具体用于：在所述图像特征点集合中，通过随机抽样一致性算法选取预设数量的图像特征点；根据所述环境场景的三维地图，确定各个选取的图像特征点在所述环境场景的视频图像的参考帧中的对应图像点，所述参考帧为所述环境场景的视频图像的当前帧的前一关键帧或者前一相邻帧；根据所有选取图像特征点及其在所述参考帧中的对应图像点，迭代计算单应性矩阵，并根据所述单应性矩阵确定旋转矩阵R₀和位移矩阵t₀；根据当前帧图像与参考帧图像的旋转矩阵R和位移矩阵t，判断包括所述旋转矩阵R₀和位移矩阵t₀的矩阵与包括所述旋转矩阵R和位移矩阵t的矩阵之间的误差是否小于预设阈值ε，若是，则确定所有选取的图像特征点在同一平面上，并确定该平面为所述感兴趣区域中的平面。

优选地，所述平面检测模块，还包括：法线确定单元：用于根据所述图像特征点集合中到所述感兴趣区域中的平面的距离小于预设距离阈值的图像特征点，确定所述感兴趣区域中的平面的法线。

优选地，所述平面检测模块，包括：区域确定单元：用于根据用户操控指令或所述摄像机位姿，确定所述环境场景的视频图像的当前帧中的感兴趣区域；特征点提取单元：用于提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，根据所述环境场景的三维地图，确定所述图像特征点对应的地图点，得到地图点集合；平面检测单元：用于根据所述地图点集合，检测所述感兴趣区域中的平面。

优选地，所述平面检测单元，具体用于：根据所述地图点集合中地图点的平均坐标值，获取以所述环境场景的三维地图的坐标原点为中心的地图点集合MP；将所述地图点集合MP转换为数据矩阵并进行奇异值分解，确定以最小奇异值对应的奇异向量为法线的平面P；递归计算所述地图点集合MP中所有地图点到所述平面P的距离，判断距离小于预设阈值ε的地图点数量是否大于预设数量阈值l，若是，则确定所述平面P为所述感兴趣区域中的平面。

优选地，所述对象渲染模块，包括：对象调整单元：用于调整所述虚拟对象的位置和/或角度，使所述虚拟对象的法线方向与所述感兴趣区域中的平面的法线方向一致，确定所述虚拟对象的旋转矩阵和位移矩阵；对象渲染单元：用于在所述环境场景的视频图像的当前帧中的感兴趣区域，根据所述虚拟对象的旋转矩阵和位移矩阵渲染所述虚拟对象。

本发明基于平面检测实现增强现实的方法及装置，通过摄像机实时采集环境场景的视频图像，进行摄像机位姿跟踪并建立环境场景的三维地图，确定环境场景的视频图像中的用户感兴趣区域，通过检测用户感兴趣区域中的平面，进行虚拟对象的姿态调整，完成虚拟对象在环境场景的视频图像中的叠加渲染。本发明基于平面检测实现增强现实的方法及装置，通过检测环境场景中用户感兴趣区域中的平面，使叠加渲染的虚拟对象的姿态与其叠加位置的平面保持一致，显著提升了虚拟对象与真实环境场景的贴合度，实现虚拟对象与真实环境无缝融合的效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图：

图1示出了本发明第一实施例的基于平面检测实现增强现实的方法的流程示意图；

图2示出了本发明第二实施例的基于平面检测实现增强现实的方法的流程示意图；

图3示出了本发明第三实施例的基于平面检测实现增强现实的装置的结构示意图；

图4示出了本发明第三实施例的基于平面检测实现增强现实的装置的图像采集模块的结构示意图；

图5示出了本发明第三实施例的基于平面检测实现增强现实的装置的平面检测模块的结构示意图；

图6示出了本发明第三实施例的基于平面检测实现增强现实的装置的对象渲染模块的结构示意图；

图7示出了本发明第四实施例的基于平面检测实现增强现实的方法的流程示意图。

具体实施方式

为了能够更清楚地理解本发明的目的、特征和优点，下面结合附图和具体实施方式对本发明做进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互结合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，这仅仅是本发明的一些实施例，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

实施例一

图1示出了本发明第一实施例的基于平面检测实现增强现实的方法的流程示意图。

本发明实施例的基于平面检测实现增强现实的方法，如图1所示，包括步骤S101至步骤S103。其中，在步骤S101中，通过摄像机实时获取环境场景的视频图像。在步骤S102中，确定所述环境场景的视频图像的当前帧中的感兴趣区域，并检测所述感兴趣区域中的平面。在步骤S103中，根据所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象。

本发明实施例基于平面检测实现增强现实的方法，通过摄像机实时获取环境场景的视频图像，基于同时定位与地图创建技术，确定环境场景的视频图像对应的摄像机位姿并构建环境场景的三维地图，以及，通过确定环境场景的视频图像中的用户感兴趣区域并检测感兴趣区域中的平面，实现虚拟对象在环境场景的视频图像的当前帧中的叠加渲染。

实施例二

图2示出了本发明第二实施例的基于平面检测实现增强现实的方法的流程示意图。

本发明实施例的基于平面检测实现增强现实的方法，如图2所示，包括以下步骤S201至步骤S205。其中，在步骤S201中，通过摄像机实时获取环境场景的视频图像。在步骤S202中，根据用户操控指令，确定所述环境场景的视频图像的当前帧中的感兴趣区域；或者，根据所述摄像机位姿，确定所述环境场景的视频图像的当前帧中的感兴趣区域。在步骤S203中，提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，得到图像特征点集合。在步骤S204中，在所述图像特征点集合中，选取预设数量的图像特征点，并检测所述感兴趣区域中的平面。在步骤S205中，根据所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象。

在上述技术方案中，所述步骤S201，还包括：根据所述环境场景的视频图像，确定所述环境场景的视频图像的当前帧对应的摄像机位姿；以及，根据所述环境场景的视频图像，构建所述环境场景的三维地图。具体地，实时采集环境场景的视频图像，通过逐帧提取环境场景的视频图像中的图像特征点进行视频图像跟踪，对环境场景的视频图像的相邻帧进行图像特征匹配，根据最小化重投影误差的方法计算当前帧对应的摄像机位于环境场景中的位置和方向信息，以及，根据环境场景的视频图像在三维空间中构建描述环境场景的空间三维地图，所述三维地图中包括地图点的位置和摄像机的位姿。

在上述技术方案，所述步骤S202，具体为：在环境场景的视频图像实时采集过程中，在屏幕中显示视频图像，根据用户在屏幕上进行触控操作的位置，确定以所述触控操作位置为中心的预设范围区域为所述环境场景的视频图像的当前帧中的感兴趣区域，其中，触控操作可以是点击、划动、圈选等，此处不作限定；或者，判断预设时间范围内摄像机位姿的变化幅度是否小于预设阈值，若是，则确定所述预设时间范围内摄像机采集的环境场景的视频图像的中心预设范围区域为所述环境场景的视频图像的当前帧中的感兴趣区域。

在上述技术方案中，所述步骤S203，具体为：提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，得到图像特征点集合FP。

在上述技术方案中，所述步骤S204，具体为：首先，在所述图像特征点集合FP中，通过随机抽样一致性算法选取预设数量的图像特征点。其中，图像特征点的选取数量可以是4个或4个以上。其次，根据环境场景的三维地图，确定所选取的图像特征点在环境场景的视频图像的参考帧中的对应图像点。具体地，根据所选取的图像特征点在环境场景的三维地图中对应的地图点，确定相同地图点在环境场景的视频图像参考帧中的映射点，即为所选取的图像特征点在环境场景的视频图像的参考帧中的对应图像点。其中，参考帧为所述环境场景的视频图像的当前帧的前一关键帧或者前一相邻帧。再次，根据图像特征点以及所述图像特征点在所述参考帧中的对应图像点，迭代计算单应性矩阵，并据此确定旋转矩阵R₀和位移矩阵t₀。然后，根据环境场景的视频图像跟踪过程中确定的当前帧与参考帧之间的旋转矩阵R和位移矩阵t，判断包括所述旋转矩阵R₀和位移矩阵t₀的矩阵与包括所述旋转矩阵R和位移矩阵t的矩阵之间的误差是否小于预设阈值ε。若是，则确定所有选取的图像特征点在同一平面P₀上，并确定该平面P₀为所述感兴趣区域中的平面。否则，则确定所述当前帧图像中不存在符合虚拟对象叠加渲染条件的平面。

在上述技术方案中，所述步骤S204，还包括：根据所述图像特征点集合FP中到感兴趣区域中的平面P₀的距离小于预设距离阈值的图像特征点，确定感兴趣区域中的平面P₀的法线。

在上述技术方案中，所述步骤S205，具体为：调整所述虚拟对象的位置和/或角度，使所述虚拟对象的法线方向与所述感兴趣区域中的平面的法线方向一致，确定所述虚拟对象的旋转矩阵和位移矩阵；在所述环境场景的视频图像的当前帧中的感兴趣区域，根据所述虚拟对象的旋转矩阵和位移矩阵渲染所述虚拟对象。具体地，以所述环境场景的视频图像中的感兴趣区域的中心为虚拟对象的渲染位置，调整所述虚拟对象的位置和/或角度，使所述虚拟对象的法线方向与所述感兴趣区域中的平面的法线方向一致，确定所述虚拟对象的旋转矩阵和位移矩阵，并据此渲染所述虚拟对象。

本发明实施例的基于平面检测实现增强现实的方法，通过摄像机实时采集环境场景的视频图像，进行摄像机位姿跟踪并建立环境场景的三维地图，确定环境场景的视频图像中的用户感兴趣区域，通过检测用户感兴趣区域中的平面，进行虚拟对象的姿态调整，完成虚拟对象在环境场景的视频图像中的叠加渲染。本发明实施例基于稀疏点云检测环境场景中用户感兴趣区域中的平面，运算效率高，适用于移动增强现实实现，同时能够使叠加渲染的虚拟对象的姿态与其叠加位置的平面保持一致，显著提升了虚拟对象与真实环境场景的贴合度，实现虚拟对象与真实环境无缝融合的效果。

实施例三

图3示出了本发明第三实施例的基于平面检测实现增强现实的装置的结构示意图。

本发明实施例的基于平面检测实现增强现实的装置300，如图3所示，主要包括：图像采集模块301：用于通过摄像机实时获取环境场景的视频图像；平面检测模块302：用于确定所述图像采集模块301获取的环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面；对象渲染模块303：用于根据所述平面检测模块302检测到的所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象。

在该技术方案中，图像采集模块301通过摄像机实时获取环境场景的视频图像，基于同时定位与地图创建技术，确定环境场景的视频图像对应的摄像机位姿并构建环境场景的三维地图。平面检测模块302确定环境场景的视频图像中的用户感兴趣区域并检测感兴趣区域中的平面。对象渲染模块303根据感兴趣区域中的平面实现虚拟对象在环境场景的视频图像的当前帧中的叠加渲染。

在上述技术方案中，优选地，所述图像采集模块301，如图4所示，还包括：图像跟踪单元3011：用于根据所述环境场景的视频图像，确定所述环境场景的视频图像的当前帧对应的摄像机位姿；地图构建单元3012：用于根据所述环境场景的视频图像，构建所述环境场景的三维地图。

在该技术方案中，图像跟踪单元3011通过逐帧提取环境场景的视频图像中的图像特征点进行视频图像跟踪，对环境场景的视频图像的相邻帧进行图像特征匹配，通过最小化重投影误差的方法计算当前帧对应的摄像机位于环境场景中的位置和方向信息。地图构建单元3012根据环境场景的视频图像在三维空间中构建描述环境场景的空间三维地图，所述三维地图中包括地图点的位置和摄像机的位姿。

在上述技术方案中，优选地，平面检测模块302，如图5所示，包括：区域确定单元3021：用于根据用户操控指令或所述摄像机位姿，确定所述环境场景的视频图像的当前帧中的感兴趣区域；特征点提取单元3022：用于提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，得到图像特征点集合；平面检测单元3023：用于在所述图像特征点集合中，选取预设数量的图像特征点，并检测所述感兴趣区域中的平面。

在该技术方案中，具体地，图像采集模块301进行环境场景的视频图像实时采集过程中，在屏幕中显示视频图像。所述区域确定单元3021根据用户在屏幕上进行触控操作的位置，确定以所述触控操作位置为中心的预设范围区域为所述环境场景的视频图像的当前帧中的感兴趣区域，其中，触控操作可以是点击、划动、圈选等，此处不作限定。或者，所述区域确定单元3021判断预设时间范围内摄像机位姿的变化幅度是否小于预设阈值，若是，则确定所述预设时间范围内摄像机采集的环境场景的视频图像的中心预设范围区域为所述环境场景的视频图像的当前帧中的感兴趣区域。

在上述技术方案中，具体地，特征点提取单元3022，提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，得到图像特征点集合FP。

在上述技术方案中，具体地，平面检测单元3023，在所述图像特征点集合FP中，通过随机抽样一致性算法选取预设数量的图像特征点，其中，图像特征点的选取数量可以是4个或4个以上；根据环境场景的三维地图，确定所选取的图像特征点在环境场景的视频图像的参考帧中的对应图像点，具体地，根据所选取的图像特征点在环境场景的三维地图中对应的地图点，确定相同地图点在环境场景的视频图像参考帧中的映射点，即为所选取的图像特征点在环境场景的视频图像的参考帧中的对应图像点，其中，参考帧为所述环境场景的视频图像的当前帧的前一关键帧或者前一相邻帧；根据图像特征点以及所述图像特征点在所述参考帧中的对应图像点，迭代计算单应性矩阵，并据此确定旋转矩阵R₀和位移矩阵t₀；根据环境场景的视频图像跟踪过程中确定的所述当前帧与参考帧之间的旋转矩阵R和位移矩阵t，判断包括所述旋转矩阵R₀和位移矩阵t₀的矩阵与包括所述旋转矩阵R和位移矩阵t的矩阵之间的误差是否小于预设阈值ε，若是，则确定所有选取的图像特征点在同一平面P₀上，并确定所述平面P₀为所述感兴趣区域中的平面。否则，则确定所述当前帧图像中不存在符合虚拟对象叠加渲染条件的平面。

在上述技术方案中，平面检测模块302，还包括：法线确定单元(附图中未示出)，用于根据所述图像特征点集合FP中到感兴趣区域中的平面P₀的距离小于预设阈值的图像特征点，确定感兴趣区域中的平面P₀的法线。

在上述技术方案中，优选地，所述对象渲染模块303，如图6所示，包括：对象调整单元3031：用于调整所述虚拟对象的位置和/或角度，使所述虚拟对象的法线方向与所述感兴趣区域中的平面的法线方向一致，确定所述虚拟对象的旋转矩阵和位移矩阵；对象渲染单元3032：用于在所述环境场景的视频图像的当前帧中的感兴趣区域，根据所述虚拟对象的旋转矩阵和位移矩阵渲染所述虚拟对象。具体地，对象调整单元3031以所述环境场景的视频图像中的感兴趣区域的中心为虚拟对象的渲染位置，调整所述虚拟对象的位置和/或角度，使所述虚拟对象的法线方向与所述感兴趣区域中的平面的法线方向一致，确定所述虚拟对象的旋转矩阵和位移矩阵；对象渲染单元3032，根据所述虚拟对象的旋转矩阵和位移矩阵，在环境场景的视频图像的当前帧中的感兴趣区域内渲染所述虚拟对象。

本发明实施例的基于平面检测实现增强现实的装置，通过摄像机实时采集环境场景的视频图像，进行摄像机位姿跟踪并建立环境场景的三维地图，确定环境场景的视频图像中的用户感兴趣区域，通过检测用户感兴趣区域中的平面，进行虚拟对象的姿态调整，完成虚拟对象在环境场景的视频图像中的叠加渲染。本发明实施例基于稀疏点云检测环境场景中用户感兴趣区域中的平面，计算量小，运算效率高，适用于移动增强现实实现，同时能够使叠加渲染的虚拟对象的姿态与其叠加位置的平面保持一致，显著提升了虚拟对象与真实环境场景的贴合度，实现虚拟对象与真实环境无缝融合的效果。

实施例四

本发明实施例的基于平面检测实现增强现实的方法，如图7所示，包括以下步骤：步骤S401，通过摄像机实时获取环境场景的视频图像；步骤S402，根据用户操控指令，确定所述环境场景的视频图像的当前帧中的感兴趣区域；步骤S403，提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，根据所述环境场景的三维地图，确定所述图像特征点对应的地图点，得到地图点集合；步骤S404，根据所述地图点集合，检测所述感兴趣区域中的平面；步骤S405，根据所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象。

在上述技术方案中，所述步骤S401，还包括：根据所述环境场景的视频图像，确定所述环境场景的视频图像的当前帧对应的摄像机位姿；以及，根据所述环境场景的视频图像，构建所述环境场景的三维地图。具体地，实时采集环境场景的视频图像，通过逐帧提取环境场景的视频图像中的图像特征点，对环境场景的视频图像的相邻帧进行图像特征匹配，根据最小化重投影误差的方法计算当前帧对应的摄像机位于环境场景中的位置和方向信息，以及，根据环境场景的视频图像在三维空间中构建描述环境场景的空间三维地图，所述三维地图中包括地图点的位置和摄像机的位姿。

在上述技术方案，所述步骤S402，具体为：环境场景的视频图像实时采集过程中，在屏幕中显示视频图像，根据用户在屏幕上进行触控操作的位置，确定以所述触控操作位置为中心的预设范围区域为所述环境场景的视频图像的当前帧中的感兴趣区域，其中，触控操作可以是点击、划动、圈选等，此处不作限定；或者，根据用户操控指令，摄像机对焦于环境场景中用户希望渲染虚拟对象的场景区域，所述场景区域包括平面或近似平面，例如桌面、墙面或地面等，确定所述场景区域为所述环境场景的视频图像的当前帧中的感兴趣区域。

在上述技术方案中，所述步骤S403，具体为：提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，根据所述环境场景的三维地图，确定所述图像特征点对应的地图点，得到地图点集合FP。

在上述技术方案中，所述步骤S404，具体为：根据所述地图点集合FP中地图点的平均坐标值，将所述地图点集合FP中每一个地图点的坐标值减去所述平均坐标值，获取以所述环境场景的三维地图的坐标原点为中心的地图点集合MP；将所述地图点集合MP转换为数据矩阵并进行奇异值分解，确定以最小奇异值向量为法线的平面P；递归计算所述地图点集合MP中所有地图点到所述平面P的距离，判断距离小于预设阈值ε的地图点数量是否大于预设数量阈值l，若是，则确定所述平面P为所述感兴趣区域中的平面。

在上述技术方案中，所述步骤S405，具体为：调整所述虚拟对象的位置和/或角度，使所述虚拟对象的法线方向与所述感兴趣区域中的平面的法线方向一致，确定所述虚拟对象的旋转矩阵和位移矩阵；在所述环境场景的视频图像的当前帧中的感兴趣区域内，根据所述虚拟对象的旋转矩阵和位移矩阵渲染所述虚拟对象。具体地，以所述环境场景的视频图像中的感兴趣区域的中心为虚拟对象的渲染位置，调整所述虚拟对象的位置和/或角度，使所述虚拟对象的法线方向与所述感兴趣区域中的平面的法线方向一致，确定所述虚拟对象的旋转矩阵和位移矩阵，并据此渲染所述虚拟对象。

实施例五

本实施例涉及基于平面检测实现增强现实的装置的结构示意图。由于本实施例的装置的结构示意图与图3至图6中所描述的装置相近，故在此处不再单独进行附图。

参照图3所示，主要包括：图像采集模块301：用于通过摄像机实时获取环境场景的视频图像；平面检测模块302：用于确定所述图像采集模块301获取的环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面；对象渲染模块303：用于根据所述平面检测模块302检测到的所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象。

在该技术方案中，图像采集模块301通过摄像机实时获取环境场景的视频图像，基于同时定位与地图创建技术，确定环境场景的视频图像对应的摄像机位姿并构建环境场景的三维地图。平面检测模块302确定环境场景的视频图像中的用户感兴趣区域并检测感兴趣区域中的平面，对象渲染模块303根据感兴趣区域中的平面实现虚拟对象在环境场景的视频图像的当前帧中的叠加渲染。

在该技术方案中，图像跟踪单元3011通过逐帧提取环境场景的视频图像中的图像特征点，对环境场景的视频图像的相邻帧进行图像特征匹配，通过最小化重投影误差的方法计算当前帧对应的摄像机位于环境场景中的位置和方向信息；地图构建单元3012根据环境场景的视频图像在三维空间中构建描述环境场景的空间三维地图，所述三维地图中包括地图点的位置和摄像机的位姿。

在上述技术方案中，优选地，平面检测模块302，如图5所示，包括：区域确定单元3021：用于根据用户操控指令，确定所述环境场景的视频图像的当前帧中的感兴趣区域；特征点提取单元3022：用于提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，根据所述环境场景的三维地图，确定所述图像特征点对应的地图点，得到地图点集合；平面检测单元3023：用于根据所述地图点集合，检测所述感兴趣区域中的平面。

在该技术方案中，具体地，图像采集模块301进行环境场景的视频图像实时采集过程中，在屏幕中显示视频图像，所述区域确定单元3021根据用户在屏幕上进行触控操作的位置，确定以所述触控操作位置为中心的预设范围区域为所述环境场景的视频图像的当前帧中的感兴趣区域，其中，触控操作可以是点击、划动、圈选等，此处不作限定；或者，根据用户操控指令，区域确定单元3021将摄像机对焦于环境场景中用户希望渲染虚拟对象的场景区域，所述场景区域包括平面或近似平面，例如桌面、墙面或地面等，确定所述场景区域为所述环境场景的视频图像的当前帧中的感兴趣区域。

在上述技术方案中，具体地，特征点提取单元3022，提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，根据所述环境场景的三维地图，确定所述图像特征点对应的地图点，得到地图点集合FP。

在上述技术方案中，具体地，平面检测单元3023，根据所述地图点集合FP中地图点的平均坐标值，将所述地图点集合中每一个地图点的坐标值减去所述平均坐标值，获取以所述环境场景的三维地图的坐标原点为中心的地图点集合MP；将所述地图点集合MP转换为数据矩阵并进行奇异值分解，确定以最小奇异值向量为法线的平面P；递归计算所述地图点集合MP中所有地图点到所述平面P的距离，判断距离小于预设阈值ε的地图点数量是否大于预设数量阈值l，若是，则确定所述平面P为所述感兴趣区域中的平面。

再次声明，本说明书中公开的所有特征，或公开的所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以以任何方式组合。

本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的的替代特征加以替换。即，除非特别叙述，每个特征只是一系列等效或类似特征中的一个例子而已。

本发明并不局限于前述的具体实施方式。本发明可以扩展到任何在本说明书中披露的新特征或任何新的组合，以及披露的任一新的方法或过程的步骤或任何新的组合。

Claims

一种基于平面检测实现增强现实的方法，其特征在于，包括以下步骤：

通过摄像机实时获取环境场景的视频图像；

确定所述环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面；

根据所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象。
根据权利要求1所述的基于平面检测实现增强现实的方法，其特征在于，所述通过摄像机实时获取环境场景的视频图像的步骤，还包括：

确定所述环境场景的视频图像的当前帧对应的摄像机位姿；以及，

根据所述环境场景的视频图像，构建所述环境场景的三维地图。
根据权利要求2所述的基于平面检测实现增强现实的方法，其特征在于，所述确定所述环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面的步骤，具体为：

根据用户操控指令，确定所述环境场景的视频图像的当前帧中的感兴趣区域；或者，根据所述摄像机位姿，确定所述环境场景的视频图像的当前帧中的感兴趣区域；

提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，得到图像特征点集合；

在所述图像特征点集合中，选取预设数量的图像特征点，并检测所述感兴趣区域中的平面。
根据权利要求3所述的基于平面检测实现增强现实的方法，其特征在于，所述在所述图像特征点集合中，选取预设数量的图像特征点，并检测所述感兴趣区域中的平面的步骤，具体为：

在所述图像特征点集合中，通过随机抽样一致性算法选取预设数量的图像特征点；

根据所述环境场景的三维地图，确定各个选取的图像特征点在所述环境场景的视频图像的参考帧中的对应图像点，所述参考帧为所述环境场景的视频图像的当前帧的前一关键帧或者前一相邻帧；

根据所有选取的图像特征点及其在所述参考帧中的对应图像点，迭代计算单应性矩阵，并根据所述单应性矩阵确定旋转矩阵R₀和位移矩阵t₀；

根据当前帧图像与参考帧图像的旋转矩阵R和位移矩阵t，判断包括所述旋转矩阵R₀和位移矩阵t₀的矩阵与包括所述旋转矩阵R和位移矩阵t的矩阵之间的误差是否小于预设阈值ε，若是，则确定所有选取的图像特征点在同一平面上，并确定该平面为所述感兴趣区域中的平面。
根据权利要求4所述的基于平面检测实现增强现实的方法，其特征在于，所述确定所述环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面的步骤，还包括：

根据所述图像特征点集合中到所述感兴趣区域中的平面的距离小于预设距离阈值的图像特征点，确定所述感兴趣区域中的平面的法线。
根据权利要求2所述的基于平面检测实现增强现实的方法，其特征在于，所述确定所述环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面的步骤，具体为：

根据用户操控指令，确定所述环境场景的视频图像的当前帧中的感兴趣区域；

提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，根据所述环境场景的三维地图，确定所述图像特征点对应的地图点，得到地图点集合；

根据所述地图点集合，检测所述感兴趣区域中的平面。
根据权利要求6所述的基于平面检测实现增强现实的方法，其特征在于，所述根据所述地图点集合，检测所述感兴趣区域中的平面的步骤，具体为：

根据所述地图点集合中地图点的平均坐标值，获取以所述环境场景的三维地图的坐标原点为中心的地图点集合MP；

将所述地图点集合MP转换为数据矩阵并进行奇异值分解，确定以最小奇异值对应的奇异向量为法线的平面P；

递归计算所述地图点集合MP中所有地图点到所述平面P的距离，判断距离小于预设阈值ε的地图点数量是否大于预设数量阈值l，若是，则确定所述平面P为所述感兴趣区域中的平面。
根据权利要求5或7所述的基于平面检测实现增强现实的方法，其特征在于，所述根据所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象的步骤，具体为：

调整所述虚拟对象的位置和/或角度，使所述虚拟对象的法线方向与所述感兴趣区域中的平面的法线方向一致，确定所述虚拟对象的旋转矩阵和位移矩阵；

在所述环境场景的视频图像的当前帧中的感兴趣区域内，根据所述虚拟对象的旋转矩阵和位移矩阵渲染所述虚拟对象。
一种基于平面检测实现增强现实的装置，其特征在于，包括：

图像采集模块：用于通过摄像机实时获取环境场景的视频图像；

平面检测模块：用于确定所述环境场景的视频图像的当前帧中的感兴趣区域，检测所述感兴趣区域中的平面；

对象渲染模块：用于根据所述感兴趣区域中的平面，在所述环境场景的视频图像的当前帧中渲染虚拟对象。
根据权利要求9所述的基于平面检测实现增强现实的装置，其特征在于，所述图像采集模块，还包括：

图像跟踪单元：用于确定所述环境场景的视频图像的当前帧对应的摄像机位姿；

地图构建单元：用于根据所述环境场景的视频图像，构建所述环境场景的三维地图。
根据权利要求10所述的基于平面检测实现增强现实的装置，其特征在于，所述平面检测模块，包括：

区域确定单元：用于根据用户操控指令或所述摄像机位姿，确定所述环境场景的视频图像的当前帧中的感兴趣区域；

特征点提取单元：用于提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，得到图像特征点集合；

平面检测单元：用于在所述图像特征点集合中，选取预设数量的图像特征点，并检测所述感兴趣区域中的平面。
根据权利要求11所述的基于平面检测实现增强现实的装置，其特征在于，所述平面检测单元，具体用于：

在所述图像特征点集合中，通过随机抽样一致性算法选取预设数量的图像特征点；

根据所述环境场景的三维地图，确定各个选取的图像特征点在所述环境场景的视频图像的参考帧中的对应图像点，所述参考帧为所述环境场景的视频图像的当前帧的前一关键帧或者前一相邻帧；

根据所有选取的图像特征点及其在所述参考帧中的对应图像点，迭代计算单应性矩阵，并根据所述单应性矩阵确定旋转矩阵R₀和位移矩阵t₀；

根据当前帧图像与参考帧图像的旋转矩阵R和位移矩阵t，判断包括所述旋转矩阵R₀和位移矩阵t₀的矩阵与包括所述旋转矩阵R和位移矩阵t的矩阵之间的误差是否小于预设阈值ε，若是，则确定所有选取的图像特征点在同一平面上，并确定该平面为所述感兴趣区域中的平面。
根据权利要求12所述的基于平面检测实现增强现实的装置，其特征在于，所述平面检测模块，还包括：

法线确定单元：用于根据所述图像特征点集合中到所述感兴趣区域中的平面的距离小于预设距离阈值的图像特征点，确定所述感兴趣区域中的平面的法线。
根据权利要求10所述的基于平面检测实现增强现实的装置，其特征在于，所述平面检测模块，包括：

区域确定单元：用于根据用户操控指令，确定所述环境场景的视频图像的当前帧中的感兴趣区域；

特征点提取单元：用于提取所述环境场景的视频图像的当前帧中的感兴趣区域中的图像特征点，根据所述环境场景的三维地图，确定所述图像特征点对应的地图点，得到地图点集合；

平面检测单元：用于根据所述地图点集合，检测所述感兴趣区域中的平面。
根据权利要求14所述的基于平面检测实现增强现实的装置，其特征在于，所述平面检测单元，具体用于：

根据所述地图点集合中地图点的平均坐标值，获取以所述环境场景的三维地图的坐标原点为中心的地图点集合MP；

将所述地图点集合MP转换为数据矩阵并进行奇异值分解，确定以最小奇异值对应的奇异向量为法线的平面P；

递归计算所述地图点集合MP中所有地图点到所述平面P的距离，判断距离小于预设阈值ε的地图点数量是否大于预设数量阈值l，若是，则确定所述平面P为所述感兴趣区域中的平面。
根据权利要求13或15所述的基于平面检测实现增强现实的装置，其特征在于，所述对象渲染模块，包括：

对象调整单元：用于调整所述虚拟对象的位置和/或角度，使所述虚拟对象的法线方向与所述感兴趣区域中的平面的法线方向一致，确定所述虚拟对象的旋转矩阵和位移矩阵；

对象渲染单元：用于在所述环境场景的视频图像的当前帧中的感兴趣区域内，根据所述虚拟对象的旋转矩阵和位移矩阵渲染所述虚拟对象。