CN109671119A

CN109671119A - 一种基于slam的室内定位方法及装置

Info

Publication number: CN109671119A
Application number: CN201811318082.9A
Authority: CN
Inventors: 刘振耀; 陈威屹
Original assignee: Academy of Opto Electronics of CAS
Current assignee: Academy of Opto Electronics of CAS
Priority date: 2018-11-07
Filing date: 2018-11-07
Publication date: 2019-04-23

Abstract

本发明实施例提供一种基于SLAM的室内定位方法及装置，获取用户终端上传的待定位图像，通过SFM算法快速构建带有位姿信息的图片数据库，通过卷积神经网络提取待定位图像的特征向量以及数据库图像的特征向量集合，计算待定位图像与数据库图像的特征向量之间的相似度，完成回环检测，得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息，从而得到用户终端准确的位置和姿态信息。与传统的视觉SLAM算法采用词袋模型，识别能力较弱相比，本发明采用神经网络学习图像的深层次特征，可以实现更高的识别准确率，提高回环检测的准确率。

Description

一种基于SLAM的室内定位方法及装置

技术领域

本发明实施例涉及场景识别技术领域，尤其涉及一种基于SLAM的室内定位方法及装置。

背景技术

导航定位是基于位置服务研究的热点，当前室外GNSS定位已经足以提供成熟的定位服务，但室内定位技术仍处于起步阶段，尚没有一种技术占据绝对的优势。根据应用需求的不同，室内定位技术分为消费级和工业级两种，消费级的定位精度要求在1～3m，要求与移动智能终端兼容，用于消费者信息指引/营销推送等；工业级的定位精度要求在cm～dm级，一般不考虑与现有的智能终端兼容，用于货物搬运、急救寻人、资产管理等。室内定位的技术中种类众多，包括基于无线信号的定位、惯性导航和基于计算机视觉的定位。

基于无线信号的定位主要分为几何关系定位和特征匹配定位两种，几何关系定位利用接收机和基站之间的几何关系，通过解算方程组来得到定位结果，代表UWB定位、RFID定位、ZigBee定位、伪卫星定位等。特征匹配定位通过建立与位置相关的可测量参数数据库，将测量值与数据库进行匹配，从而获取位置信息，代表技术包括Wi-Fi指纹、地磁定位、蓝牙信标等。基于无线信号的定位方式，容易受到复杂室内环境的干扰和非视距误差的影响等，稳定性能差。基于几何关系定位的方案基本上都需要提前构建基站并提前确定基站的准确坐标，基于特征匹配定位的方案同样需要构建指纹数据库，工作量大。除Wi-Fi、蓝牙外，其他的无线信号大都不能与移动终端很好的结合，需要专门的设备。

惯性导航作为航迹推算定位最具有代表性的技术，通过传感器获取相邻点的航向和距离信息，在不借助外界物标的情况下，求取位置信息，可以实现自主导航，与其他传感器联合应用可抑制误差积累，可以作为有力的辅助手段引入到视觉和无线信号的定位研究中。惯性导航通过内置传感器可以实现自主导航，但限制了移动终端的行动且低成本的MEMS用于独立的导航漂移误差太大，一般不能用于单独的移动终端的定位导航，而是作为辅助手段加入到其他定位方案中。

基于视觉的定位方法具有定位精度高，能够提供丰富的场景信息，避免了无线信号受非视距误差的影响且能够与移动智能终端更好的兼容，成为众多室内定位方式中消费级应用中较为新颖的一种模式。现有的基于视觉的室内定位主要分为两个方向，一是借助视觉标志物进行室内定位，如二维码、机器视觉识别路标等；另一种主要基于图像检索的室内定位，通过精确检索后，将问询图像最佳匹配的图像所指向的场景确定为用户所在场景。基于视觉标志物的定位需要提前布设标志物和获取标志物的地理位置信息，必须在室内各个场景张贴路标，其实是一种标识识别，并没有利用丰富的图像信息；基于图像检索的室内定位通过将图片信息与场景位置数据库关联，并对图像和位置进行标注，位置信息数据库同样需要人工采集，工作方式费时费力，且无法得到准确的位置和姿态信息。

发明内容

针对传统基于图像检索的室内定位方法位置信息数据库需要人工采集，工作方式费时费力，且无法得到准确的位置和姿态信息的缺陷。本发明实施例提供一种基于SLAM的室内定位方法。

第一方面，本发明实施例提供一种基于SLAM的室内定位方法，包括：

101，获取用户终端上传的待定位图像；

102，将待定位图像和图片数据库内的数据库图像分别输入卷积神经网络，提取待定位图像的特征向量以及数据库图像的特征向量集合；其中，图片数据库是对目标场景的图像集合使用SFM算法得到的；

103，计算待定位图像对应的特征向量与数据库图像对应的特征向量集合之间的相似度，得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息。

第二方面，本发明实施例提供一种基于SLAM的室内定位装置，包括：

图像获取模块，用于获取用户终端上传的待定位图像；

特征提取模块，用于将待定位图像和图片数据库内的数据库图像分别输入卷积神经网络，提取待定位图像的特征向量以及数据库图像的特征向量集合；其中，图片数据库是对目标场景的图像集合使用SFM算法得到的；

相似度匹配模块，用于计算待定位图像对应的特征向量与数据库图像对应的特征向量集合之间的相似度，得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息。

第三方面，本发明实施例提供了一种电子设备，包括：

至少一个处理器、至少一个存储器、通信接口和总线；其中，

所述处理器、存储器、通信接口通过所述总线完成相互间的通信；

所述存储器存储有可被所述处理器执行的程序指令，处理器调用所述程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的基于SLAM的室内定位方法。

第四方面，本发明实施例提供了一种非暂态计算机可读存储介质，非暂态计算机可读存储介质存储计算机指令，计算机指令使计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的基于SLAM的室内定位方法。

本发明实施例提供的基于SLAM的室内定位方法及装置，通过SFM算法快速构建带有位姿信息的图片数据库，获取用户终端上传的待定位图像，通过卷积神经网络提取待定位图像的特征向量以及数据库图像的特征向量集合，计算待定位图像与数据库图像的特征向量之间的相似度，完成回环检测，得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息，从而得到用户准确的位置和姿态信息。与传统基于图像检索的室内定位方法，位置信息数据库需要人工采集，且无法得到准确的位置和姿态信息相比，本发明实施例实现位置和姿态信息的精确获取。与传统的视觉SLAM算法采用词袋模型，识别能力较弱相比，本发明实施例采用神经网络学习图像的深层次特征，可以实现更高的识别准确率，提高回环检测的准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为根据本发明实施例提供的基于SLAM的室内定位方法流程示意图；

图2为根据本发明实施例提供的基于SLAM的室内定位装置的结构框图；

图3为根据本发明实施例提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

图1为根据本发明实施例提供的基于SLAM的室内定位方法流程示意图。参照图1，基于SLAM的室内定位方法包括：

步骤101，获取用户终端上传的待定位图像。用户终端拍摄待定位图像，上传至与用户终端建立无线通讯连接的数据处理云端。

步骤102，将待定位图像和图片数据库内的数据库图像分别输入卷积神经网络，提取待定位图像的特征向量以及数据库图像的特征向量集合；其中，图片数据库是对目标场景的图像集合使用SFM算法得到的；

即时定位与地图构建(Simultaneous Localization and Mapping，SLAM)通过自身携带的传感器，可以在没有环境先验信息的情况下，于运动过程中建立环境模型，同时估计自己的运动。SLAM技术是移动机器人导航领域的核心技术，如果搭载的传感器主要是相机，则被称为“视觉SLAM”。经典视觉SLAM框架分为前端(视觉里程计)、后端(非线性优化)、回环检测和建图四部分。前端的任务是估算相邻图像间的相机运动，以及构建局部地图；后端接受不同时刻前端测量的相机位姿，以及回环检测的信息，并进行优化，得到全局一致的轨迹和地图。回环检测用于判断机器人是否回到先前的位置，并将信息提供给后端进行处理。建图用于根据估计的轨迹，建立与任务要求对应的地图。

本实施例中，将视觉SLAM框架和技术应用于室内移动终端的定位导航领域。提供针对消费级的用户终端的室内定位方法。视觉SLAM过程不需要额外的手段即可获取带有位姿信息的图像数据库，可以有效的减少室内定位的图像数据库建立的工作量。

首先，通过单目相机、双目相机、深度相机或手机摄像头采集目标室内场景的图像信息，以视频或图片的形式上传到数据处理云端，使用SFM算法，输出带有位姿信息的图片数据库。然后，将待定位图像和图片数据库内的数据库图像分别输入卷积神经网络，提取待定位图像的特征向量以及数据库图像的特征向量集合。

步骤103，计算待定位图像对应的特征向量与数据库图像对应的特征向量集合之间的相似度，得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息。

在视觉SLAM问题中，位姿的估计往往是一个递推的过程，即由上一帧位姿解算当前帧位姿，因此其中的误差便这样一帧一帧的传递下去，也就是我们所说的累计误差。无论在单目、双目还是RGBD中，追踪得到的位姿都是有误差的。随着路径的不断延伸，前面帧的误差会一直传递到后面去，导致最后一帧的位姿在世界坐标系里的误差有可能非常大。除了利用优化方法在局部和全局调整位姿，也可以利用回环检测(loop closure)来优化位姿。其中，位置和姿态统称为位姿。

本实施例中，通过计算待定位图像对应的特征向量与数据库图像对应的特征向量集合之间的相似度来判定两帧图像是否是同一个地点，以完成回环检测。得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息，将第一位姿信息作为待定位图像的位置和姿态信息。对于SLAM算法来说，可以通过比对当前帧与过去的关键帧，相似度超过某一阈值时就可以认为检测到回环。

需要说明的是，传统SLAM算法提取稀疏的图像特征，通过SIFT特征点之间的匹配实现帧间估计和闭环检测。识别能力较弱。而本实施例提供的基于SLAM的室内定位方法，采用卷积神经网络提取待定位图像的特征向量以及数据库图像的特征向量集合，能够学习图像的深层次特征，实现更高的识别准确率，提高回环检测的准确率。

本发明实施例提供的基于SLAM的室内定位方法，通过SFM算法快速构建带有位姿信息的图片数据库，获取用户终端上传的待定位图像，通过卷积神经网络提取待定位图像的特征向量以及数据库图像的特征向量集合，计算待定位图像与数据库图像的特征向量之间的相似度，完成回环检测，得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息，从而得到用户准确的位置和姿态信息。与传统基于图像检索的室内定位方法，位置信息数据库需要人工采集，且无法得到准确的位置和姿态信息相比，本发明实施例实现位置和姿态信息的精确获取。与传统的视觉SLAM算法采用词袋模型，识别能力较弱相比，本发明实施例采用神经网络学习图像的深层次特征，可以实现更高的识别准确率，提高回环检测的准确率。

在上述实施例的基础上，步骤102中，图片数据库的具体构建过程包括：

对相机上传的目标场景的图像集合进行预处理；

对预处理后的图像集合使用SFM算法，输出携带位姿信息的图片数据库。

其中，本实施例中的相机可以是单目相机、双目相机或深度相机，也可以是手机自带的相机。通过单目相机、双目相机、深度相机或手机摄像头采集目标场景的图像集合，以视频或图片的形式上传到数据处理云端并进行预处理，预处理过程主要包括畸变校正、灰度化、滤波去躁和对比度增强四部分。在使用相机采集视频或图像之前，需要经过相机标定过程获取相机的内外参数和畸变参数。优选的，本实施例采用基于棋盘格的半自动标定法获取相机的内外参数和畸变参数。

本实施例中，采用高次多项式函数纠正法、平均值法、高斯滤波法和非线性增强法对目标场景的图像集合进行预处理。具体地，采用高次多项式函数纠正法进行畸变校正。其中，多项式纠正的原理是利用地面控制点的图像坐标和其同名点的地面坐标，通过平差原理计算多项式里的系数，之后用该多项式对图像进行纠正。通过平均值法实现图像的灰度化，具体是将图像中的三分量亮度求平均得到一个灰度值。采用高斯滤波法对图像集合进行滤波去躁。通过非线性增强法对图像集合进行对比度增强处理。

进一步地，使用SFM算法，输出带有位姿信息的图片数据库，具体包括：

首先，提取图像集合中每一张图片的SIFT特征点。其中，SIFT是用于图像处理领域的一种描述。这种描述具有尺度不变性，可在图像中检测出关键点，是一种局部特征描述子。SIFT特征是图像的局部特征，其对旋转、尺度缩放、亮度变化保持不变性，对视角变化、仿射变换、噪声也保持一定程度的稳定性。

然后，计算每两张图片SIFT特征点之间的欧式距离进行SIFT特征点的匹配，获得若干SIFT特征点相匹配的图像对。具体地，用kd-tree模型去计算每两张图片SIFT特征点之间的欧式距离进行SIFT特征点的匹配，从而找到SIFT特征点匹配个数达到要求的图像对。

接下来，计算每一对图像对的对极几何，估计F矩阵，并通过RANSAC算法优化所述图像对。确定初始化图像对，对初始化图像对进行第一次光束法平差。具体地，通过两图像变换之间的单应性模型来寻找初始化图像对。采用RANSC算法四点法计算单应矩阵，满足单应矩阵的匹配点称为内点，不满足单应矩阵的称为外点，找寻一个内点占比最小的图像对作为初始化图像对。

最后，循环添加新的图片进行新的光束法平差，生成SIFT特征点的点云地图，获得带有位姿信息的图片数据库。

在上述各实施例的基础上，在步骤103之后，本发明实施例提供的基于SLAM的室内定位方法还包括：

基于SFM算法生成的SIFT特征点云地图，采用EPnP算法获取待定位图像的第二位姿信息。具体的，基于SFM算法生成的SIFT特征点的点云地图，EPnP算法通常是选取世界坐标下的四个控制点坐标；通过若干3D点在相机平面的投影关系，以及与这四个控制点的权重关系，构建一个12*12方阵，求得其零空间特征向量，可以得到虚拟控制点的相机平面坐标，然后使用POSIT算法即可求出相机位姿，获得待定位图像准确的位姿信息，即第二位姿信息。

若判断获知所述第二位姿信息和第一位姿信息的相似度大于第一预设阈值，则将所述待定位图像加入图片数据库。

具体地，将第二位姿信息与步骤103获得的与待定位图像相似度最高的图像对应的第一位姿信息比较，对回环检测的正确性进行检验，若第二位姿信息和第一位姿信息的相似度大于第一预设阈值，则检验正确，将检验正确的待定位图像加入图片数据库，为SFM算法中光束法平差提供更多的有效数据，优化图像数据库。

在上述各实施例的基础上，步骤102中的卷积神经网络为Vgg-16神经网络模型。

步骤102中，将待定位图像和图片数据库内的数据库图像分别输入卷积神经网络，提取待定位图像的特征向量以及数据库图像的特征向量集合具体包括：

提取待定位图像的SIFT特征点，然后以待定位图像SIFT特征点的像素为中心，提取待定位图像的图像块。本实施例中，以SIFT特征点的像素为中心，提取50*50的图像块，按照特征响应的强弱进行排序，取前500个SIFT特征点。

将待定位图像的图像块和数据库图像对应的图像块分别输入卷积神经网络，以所述Vgg-16网络pool5层得到的特征向量作为图像的特征表示，提取待定位图像的特征向量以及数据库图像的特征向量集合。

本实施例采用神经网络学习图像的深层次特征，可以实现更高的识别准确率，提高回环检测的准确率。

在上述各实施例的基础上，步骤103中，所述计算待定位图像对应的特征向量与数据库图像对应的特征向量集合之间的相似度具体包括：

计算待定位图像的某一SIFT特征点对应的特征向量与数据库图像所有SIFT特征点对应特征向量的余弦相似度，得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息；

其中，两个特征向量m，n之间的余弦相似度为：

式中，分子为向量m和向量n的点乘，分母为两者的模长的乘积，余弦相似度的取值范围为[-1,1]。

本实施例通过计算待定位图像的某一SIFT特征点对应的特征向量与数据库图像所有SIFT特征点对应特征向量的余弦相似度，得到图片数据库中与待定位图像相似度最高的图像。并基于SFM算法标注的位姿信息，获得图片数据库中与待定位图像相似度最高的图像对应的第一位姿信息。

图2为根据本发明实施例提供的基于SLAM的室内定位装置的结构框图，本发明实施例提供一种基于SLAM的室内定位装置，包括图像获取模块201、特征提取模块202和相似度匹配模块203，其中：

图像获取模块201用于获取用户终端上传的待定位图像。特征提取模块202用于将待定位图像和图片数据库内的数据库图像分别输入卷积神经网络，提取待定位图像的特征向量以及数据库图像的特征向量集合；其中，图片数据库是对目标场景的图像集合使用SFM算法得到的。相似度匹配模块203用于计算待定位图像与数据库图像的特征向量之间的相似度，得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息。

具体地，图像获取模块201获取用户终端上传的待定位图像。待定位图像可以是视频或图片。

进一步地，通过单目相机、双目相机、深度相机或手机摄像头采集目标室内场景的图像信息，以视频或图片的形式上传到数据处理云端，使用SFM算法，输出带有位姿信息的图片数据库。特征提取模块202将待定位图像和图片数据库内的数据库图像分别输入卷积神经网络，提取待定位图像的特征向量以及数据库图像的特征向量集合。

相似度匹配模块203通过计算待定位图像对应的特征向量与数据库图像对应的特征向量集合之间的相似度来判定两帧图像是否是同一个地点，以完成回环检测。得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息，将第一位姿信息作为待定位图像的位置和姿态信息。对于SLAM算法来说，可以通过比对当前帧与过去的关键帧，相似度超过某一阈值时就可以认为检测到回环。

本发明实施例提供的基于SLAM的室内定位装置，通过SFM算法快速构建带有位姿信息的图片数据库，获取用户终端上传的待定位图像，通过卷积神经网络提取待定位图像的特征向量以及数据库图像的特征向量集合，计算待定位图像与数据库图像的特征向量之间的相似度，完成回环检测，得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息，从而得到用户准确的位置和姿态信息。与传统基于图像检索的室内定位方法，位置信息数据库需要人工采集，且无法得到准确的位置和姿态信息相比，本发明实施例实现位置和姿态信息的精确获取。与传统的视觉SLAM算法采用词袋模型，识别能力较弱相比，本发明实施例采用神经网络学习图像的深层次特征，可以实现更高的识别准确率，提高回环检测的准确率。

在上述实施例的基础上，本发明实施例提供的基于SLAM的室内定位装置还包括：

数据库更新模块204，用于基于SFM算法生成的SIFT特征点云地图，采用EPnP算法获取待定位图像的第二位姿信息；若判断获知所述第二位姿信息和第一位姿信息的相似度大于第一预设阈值，则将所述待定位图像加入图片数据库。

具体地，将第二位姿信息与相似度匹配模块203获得的与待定位图像相似度最高的图像对应的第一位姿信息比较，对回环检测的正确性进行检验，若第二位姿信息和第一位姿信息的相似度大于第一预设阈值，则检验正确，将检验正确的待定位图像加入图片数据库，为SFM算法中光束法平差提供更多的有效数据，优化图像数据库。

本发明实施例提供了一种电子设备，图3为根据本发明实施例提供的电子设备的结构示意图，如图3所示，该电子设备包括：

至少一个处理器(processor)301、通信接口(Communications Interface)304、至少一个存储器(memory)302和通信总线303，其中，至少一个处理器301，通信接口304，至少一个存储器302通过通信总线303完成相互间的通信。至少一个处理器301可以调用至少一个存储器302中的逻辑指令，以执行如下基于SLAM的室内定位方法，例如包括：获取用户终端上传的待定位图像。将待定位图像和图片数据库内的数据库图像分别输入卷积神经网络，提取待定位图像的特征向量以及数据库图像的特征向量集合；其中，图片数据库是对目标场景的图像集合使用SFM算法得到的。计算待定位图像对应的特征向量与数据库图像对应的特征向量集合之间的相似度，得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息。

本发明实施例还提供了一种非暂态计算机可读存储介质，非暂态计算机可读存储介质存储计算机指令，该计算机指令使计算机执行对应实施例所提供的基于SLAM的室内定位方法，例如包括：获取用户终端上传的待定位图像。将待定位图像和图片数据库内的数据库图像分别输入卷积神经网络，提取待定位图像的特征向量以及数据库图像的特征向量集合；其中，图片数据库是对目标场景的图像集合使用SFM算法得到的。计算待定位图像对应的特征向量与数据库图像对应的特征向量集合之间的相似度，得到图片数据库中与待定位图像相似度最高的图像及其对应的第一位姿信息。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于SLAM的室内定位方法，其特征在于，包括:

101，获取用户终端上传的待定位图像；

2.根据权利要求1所述的基于SLAM的室内定位方法，其特征在于，步骤102中，所述图片数据库的具体构建过程包括：

对相机上传的目标场景的图像集合进行预处理；

3.根据权利要求2所述的基于SLAM的室内定位方法，其特征在于，所述对预处理后的图像集合使用SFM算法，输出携带位姿信息的图片数据库具体包括：

提取图像集合中每一张图片的SIFT特征点；

计算每两张图片SIFT特征点之间的欧式距离进行SIFT特征点的匹配，获得若干SIFT特征点相匹配的图像对；

计算每一对图像对的对极几何，估计F矩阵，并通过RANSAC算法优化所述图像对；

确定初始化图像对，对初始化图像对进行第一次光束法平差；

循环添加新的图片进行新的光束法平差，生成SIFT特征点云地图，获得带有位姿信息的图片数据库。

4.根据权利要求3所述的基于SLAM的室内定位方法，其特征在于，在步骤103之后，所述基于SLAM的室内定位方法还包括：

基于SFM算法生成的SIFT特征点云地图，采用EPnP算法获取待定位图像的第二位姿信息；

5.根据权利要求1所述的基于SLAM的室内定位方法，其特征在于，步骤102中，所述卷积神经网络为Vgg-16神经网络模型；

相应的，所述将待定位图像和图片数据库内的数据库图像分别输入卷积神经网络，提取待定位图像的特征向量以及数据库图像的特征向量集合具体包括：

提取待定位图像的SIFT特征点，然后以待定位图像SIFT特征点的像素为中心，提取待定位图像的图像块；

6.根据权利要求5所述的基于SLAM的室内定位方法，其特征在于，步骤103中，所述计算待定位图像对应的特征向量与数据库图像对应的特征向量集合之间的相似度具体包括：

其中，两个特征向量m，n之间的余弦相似度为：

7.一种基于SLAM的室内定位装置，其特征在于，包括：

图像获取模块，用于获取用户终端上传的待定位图像；

8.根据权利要求7所述的基于SLAM的室内定位装置，其特征在于，所述装置还包括：

数据库更新模块，用于基于SFM算法生成的SIFT特征点云地图，采用EPnP算法获取待定位图像的第二位姿信息；若判断获知所述第二位姿信息和第一位姿信息的相似度大于第一预设阈值，则将所述待定位图像加入图片数据库。

9.一种电子设备，其特征在于，包括：

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令，以执行如权利要求1至6任一项所述的基于SLAM的室内定位方法。

10.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如权利要求1至6中任一项所述的基于SLAM的室内定位方法。