CN112182279B - 一种基于离散网格与影像匹配的室内自定位方法及设备 - Google Patents

一种基于离散网格与影像匹配的室内自定位方法及设备 Download PDF

Info

Publication number
CN112182279B
CN112182279B CN202011392141.4A CN202011392141A CN112182279B CN 112182279 B CN112182279 B CN 112182279B CN 202011392141 A CN202011392141 A CN 202011392141A CN 112182279 B CN112182279 B CN 112182279B
Authority
CN
China
Prior art keywords
image
cell
field
cells
discrete grid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011392141.4A
Other languages
English (en)
Other versions
CN112182279A (zh
Inventor
朱伟奇
曹斌
魏延峰
解云飞
苏俊
俞鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Geospace Information Technology Co Ltd
Original Assignee
Wuda Geoinformatics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuda Geoinformatics Co ltd filed Critical Wuda Geoinformatics Co ltd
Priority to CN202011392141.4A priority Critical patent/CN112182279B/zh
Publication of CN112182279A publication Critical patent/CN112182279A/zh
Application granted granted Critical
Publication of CN112182279B publication Critical patent/CN112182279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/005Tree description, e.g. octree, quadtree
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Graphics (AREA)
  • Remote Sensing (AREA)
  • Library & Information Science (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供一种基于离散网格与影像匹配的室内自定位方法及设备,方法包括:采用改进的全球离散网格结合ResNet神经网络的方法,充分考虑了室内建筑存在多层、不同高度的情况,通过全球离散网格划分人类活动空间得到多个不同高度的单元格,再通过神经网络训练得到的每一个单元格特有的预测模型,然后对输入图片进行匹配预测,获取与图片匹配度最高的单元格,从而实现图片的室内定位;所述设备用于实现该方法;本发明提供的有益效果是:实现了高精度的室内环境图片自适应三维位置定位。

Description

一种基于离散网格与影像匹配的室内自定位方法及设备
技术领域
本发明涉及图像定位领域,尤其涉及一种基于离散网格与影像匹配的室内自定位方法及设备。
背景技术
互联网时代,每天都会产生大量的信息数据,而且这些数据通常都与地理位置相关,如果不经过高效地组织存储,这些数据就不能得到有效地检索使用。全球离散网格就是为此而生,它将整个地球空间划分为多个体素或者面单元,并将信息数据放进对应的基元中,在使用时通过检索网格就能得到对应空间位置的数据。全球离散网格根据空间维度的不同可分为:球面剖分系统和球体剖分系统。球面剖分系统是对地球表面空间进行划分,忽略了第三维的高度信息。球体剖分系统是对整个地球三维空间进行划分,能够对与高度相关的信息进行组织存储。
如果将全球离散网格与图像识别技术融合起来,就能通过匹配输入图像的特征来检索该图像所处的空间位置,进行图像的自适应定位。Google提出的PlaNet影像定位系统就是基于这个原理。但是PlaNet系统是基于球面离散网格设计的,图片定位得到的位置信息是二维的,并且用于训练的影像集是某个地理区域,是室外的场景,以致于PlaNet系统无法用于室内环境三维位置的定位。不幸的是,面向室内环境的图片自适应三维位置定位的研究十分匮乏,所以面向室内环境的图片自适应三维位置定位的研究急待补充完善。
发明内容
有鉴于此,为了解决现有技术中的不足,本发明提出一种基于离散网格与影像匹配的室内自定位方法及设备。本发明实际要解决的技术问题是:弥补面向室内环境的图片自适应三维位置定位的缺乏。
本方法充分考虑了室内建筑存在多层、不同高度的情况,通过全球离散网格划分人类活动空间得到多个不同高度的单元格,再通过神经网络训练得到的每一个单元格特有的预测模型,对输入图片进行匹配预测,获取与图片匹配度最高的单元格,从而实现图片的室内定位。
本发明提供的一种基于离散网格与影像匹配的室内自定位方法及设备,具体包括以下步骤:
S101:建立改进的全球球体离散网格并对每一个单元格进行编码,得到单元格的编码信息;
S102:根据所述编码信息建立空数据库;所述空数据库中的一条信息即为一个单元格,每个单元格均包括四个属性,分别为影像数据集字段TP i 、影像预测模型字段TF i 、地址编码字段TC i 和语义描述信息字段TT i ;其中i为单元格的编号;
S103:对单元格的属性进行填充,得到完整的数据库;
S104:运用所述完整的数据库对待处理影像进行预测匹配:每一个待处理影像与数据库中单元格的匹配度为S*,将匹配度最高的MaxS*)对应的单元格语义描述信息字段TT i 提取,得到待处理影像所处的空间位置。
进一步地,步骤S101具体为:
S201:根据GeoSOT-3D的构建原理,先将全球球体离散网格的经纬度空间由-90°到90°与-180°到180°均拉伸到-256°到256°,得到拉伸后的全球球体离散网格;
S202:对拉伸后的全球球体离散网格进行八叉树分割,直至分割层级达到预设的K层时分割停止,得到分割后的单元格;
S203:将分割后的单元格与建筑矢量地图叠加求交,得到交集部分的单元格;
S204:对每一个交集部分的单元格进行编码,编码顺序为Z序编码。
进一步地,步骤S103具体为:
S301:为单元格C i 采集独立的影像图片资料P i ,并将影像图片资料P i 加入到单元格C i 对应的影像数据集TP i 中;
S302:使用影像图片资料P i 对ResNet神经网络进行训练得到影像预测模型F i ,将得到的影像预测模型F i 加入到单元格C i 对应的影像预测模型字段TF i 中;
S303:将单元格C i 的地址编码Code i 加入到单元格C i 对应的地址编码字段TC i 中;
S304:将单元格C i 的语义描述文字Text i 加入到单元格C i 对应的语义描述信息字段TT i 中。
一种存储设备,所述存储设备存储所述一种基于离散网格与影像匹配的室内自定位方法的所有指令及数据。
一种基于离散网格与影像匹配的室内自定位设备,包括:处理器及存储设备;所述处理器加载并执行存储设备中的指令及数据,用于实现一种基于离散网格与影像匹配的室内自定位方法的所有步骤。
本发明提供的有益效果是:实现了高精度的室内环境图片自适应三维位置定位,为室内导航、室内定位以及室内GIS的发展提供了一种新的思路,与传统的坐标定位与语义定位不同,该方法能够根据用户输入的图像信息,反馈给用户高精度的室内三维位置,解决了用户在车站、商场以及地下商业街等大型室内综合体中定位、导航的需求,使得定位、导航技术变得更加全面,能够应对各个应用场景的需求。
附图说明
图1是本发明一种基于离散网格与影像匹配的室内自定位方法流程图;
图2是本发明具体的数据库关系;
图3是本发明方法的整体详细流程图;
图4是本发明实施例中硬件设备工作的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。
请参考图1,一种基于离散网格与影像匹配的室内自定位方法及设备,包括以下:
S101:建立改进的全球球体离散网格并对每一个单元格进行编码,得到单元格的编码信息;
根据GeoSOT-3D的构建原理,先将全球球体离散网格的经纬度空间由-90°到90°与-180°到180°均拉伸到-256°到256°,得到拉伸后的全球球体离散网格;对拉伸后的全球球体离散网格进行八叉树分割,直至分割层级达到24层时分割停止,得到分割后的单元格;将分割后的单元格与建筑矢量地图叠加求交,得到交集部分的单元格;对每一个交集部分的单元格进行编码,编码顺序为Z序编码。
下面针对步骤S101,提供具体的实施过程说明:
根据GeoSOT-3D的构建原理,逐层对整个地球空间进行剖分,第一次剖分得到8个基元;
具体的剖分方法是沿着0°经线、0°纬线、径向256°进行切分,得到4个四分之一圆和4个四分之一球壳,每个基元的大小为256°*256°*256°,对应的尺度是32768km;
上述尺度无法满足实际的使用需求,故在本实施例中,这八个基元分别进行再剖分,每个基元又被剖分为八个小基元,大小为128°*128°*128°。
优选地,为了保证检索效率以及网格建立的高效,本发明中阻止一些不包含人类活动范围基元的再剖分,并剔除部分空基元,人类活动范围被定义为经纬度-256°到256°、径向48°到48°5′之间的范围。
随后不断剖分直至剖分层级达到第24层,此时每个基元的尺度为4m,基本满足现代建筑每层楼的高度,能达到对高度划分的效果。但因为此时单元格的尺度过小,即使研究范围只有1km×1km,单元格的数量仍然可能达到十万数量级,所以还需进一步减少单元格的数量。
此时将研究区域的建筑矢量图与三维球体离散网格做叠加求交操作,并保留交集部分的单元格,这部分格网几乎包含了所有室内建筑信息,然后剔除其余单元格,这样单元格的数量将得到大幅度减少。至此一个只包含人类室内活动范围的三维球体离散网格建立完成。
网格建立完成之后,对每个单元格进行编码,采用Z序96位二进制数值编码,如在东北半球,编码按照经度从小到大,纬度从低到高,高度从低到高的方式进行。
本部分的一个具体实施例为武汉大学:
首先明确需进行执行室内定位的区域为武汉大学,则确定空间范围为南至114.3621°N,北至114.3571°N,西至30.5393°E,东至30.5346°E,高度在径向48°到48°0.5″之间。
在建立网格时,剔除掉不在这个范围内的格网信息,最终剩下了6.3×10^5个单元格。将这些单元格与武汉大学的建筑矢量图叠加求交,得到武汉大学室内三维球体离散网格。
随后按照Z序96位二进制数值规则对格网进行编码,以武汉大学信息学部2号教学楼315室为例,他的坐标为(30°32′N,114°22′E,9m),那么他对应的二进制编码为G001132230-032323-301123.030。
S102:根据所述编码信息建立空数据库;所述空数据库中的一条信息即为一个单元格,每个单元格均包括四个属性,分别为影像数据集字段TP i 、影像预测模型字段TF i 、地址编码字段TC i 和语义描述信息字段TT i ;其中i为单元格的编号;
由于数据库在整个系统中占据着重要的地位,其负责对整个系统的训练集以及结果集进行组织存储。可以根据使用群体的不同选用不同的数据库,例如Oracle、Sqlite3等。
请参考图2,图2是本发明具体的数据库关系。
一个研究区域对应一个数据库,然后根据研究区域的功能分区或行政区划分为多个表格,每个表格都含有五个字段,分别为:ID号,影像数据集、影像预测模型、地址编码以及语义描述信息,每个区域含有多少个单元格就对应了每张表中有多少条记录。
ID号字段的类型为INT,影像数据集字段存储的是该单元格影像表格的ID,类型为TEXT。
由于一个单元格可能需要多张图片来对其进行描述,所以为每一个单元格开辟一个独立的影像表格用以存储图片,影像表格的命名需要结合主表的次序以及该单元格的ID号,中间用“_”下划线连接。
影像表格的字段包括ID号字段以及图片字段,ID号字段的类型为INT,图片字段的类型为BLOB类型。
影像预测模型字段存储的是通过深度学习算法训练得到的该单元格的影像预测模型的参数,用于后续与输入图像进行特征匹配与预测,字段类型为BLOB。地址编码字段存储的是该单元格的网格编码,类型为TEXT。语义描述信息字段存储的是该单元格位置信息的语义描述。举例说明如下:
例如:武汉大学信息学部2号教学楼3楼315室等,类型为TEXT。对于其他字段,这里不再举例说明。
对于步骤S102,同样针对武汉大学的一个实施例,本发明实施方案如下:
为整个武汉大学的空间离散网格建立数据库,以Sqlite3为例进行讲解说明。在实验计算机中安装配置Sqlite3数据库;
在命令提示符中启动sqlite3数据库,通过.open命令创建一个本研究区域专属的数据库,命名为whu.db,并指定该数据库的存储位置,如果存储在C盘,则完整的命令为:.open C:\whu.db。
根据武汉大学的教学分区,总共需要创建:文理学部、信息学部以及医学部三个主表,通过create命令创建表格,完整的命令为:create table Information_district(IDINT ,picture_set TEXT ,feature BLOB ,code TEXT ,description TEXT)。
影像表格的创建命令为:create table 2_1(ID INT ,picture BLOB),这里的“2_1”意为第二个主表的第一条记录。在创建数据库的过程中需要注意遵守数据库的唯一性约束。
S103:对单元格的属性进行填充,得到完整的数据库;
为单元格C i 采集独立的影像图片资料P i ,并将影像图片资料P i 加入到单元格C i 对应的影像数据集TP i 中;
使用影像图片资料P i 对ResNet神经网络进行训练得到影像预测模型F i ,将得到的影像预测模型F i 加入到单元格C i 对应的影像预测模型字段TF i 中;
将单元格C i 的地址编码Code i 加入到单元格C i 对应的地址编码字段TCi中;
将单元格C i 的语义描述文字Text i 加入到单元格C i 对应的语义描述信息字段TT i 中。
步骤S103的具体的实施方法如下:
在这一步中,图像采集的任务是通过人工现场采集为主、网络图片收集为辅来完成。在步骤S101和步骤S102的基础上,形成一幅研究区域基元为4m*4m*4m的网格图;派遣人工到对应的单元格位置采集室内影像,在采集影像时注意,关注该房间内别具特征的物体、程设或布置方式;
在房间的四个角落朝向房间的中心点进行拍照,这样既能获取到该房间的全局特征也能获取到该房间的局部特有特征,照片数量通常保持在4到10张之间。然后将采集到的影像图片资料P i 加入到步骤S102建立的表格的对应记录字段中,作为初次影像资料,如果后期单元格内部发生变化,可重新拍照获取最新的影像资料,对数据库中的信息进行更新。
在得到整个研究区域的影像资料之后,将使用ResNet神经网络进行训练,获取每个单元格的预测模型。
ResNet是一种卷积神经网络,其将残差的概念与Short-Cut的思想进行结合,在能实现更深网络结构的同时,还能避免梯度爆炸和梯度消失的问题,实现更优的训练效果。在训练前需要统一每一张影像的格式,确保输入模型的一致性。本发明实施例中,选择ResNet-50残差网络,整个网络主要由4个残差结构构成。每个残差结构都是由conv层、Normalize层、Scale层以及ReLU层构成。整个网络会经历3个阶段,第一个阶段由conv层、Normalize层、Scale层、ReLU层以及MaxPool层组成,其中conv为卷积层,Normalize为归一化层,Scale层与ReLU层为激活层,MaxPool为最大池化层。第二阶段都是由4个残差结构组成的局部网络,第三阶段由一个AveragePool层、一个Flatten层以及一个FC层构成,其中AveragePool为平均池化层,Flatten为归一层,FC为全连接层。
定义交叉熵用以计算损失函数和代价函数,最后不断迭代直至达到设定的迭代次数时停止,并将训练好的预测模型输出到数据库中相应的字段中。
将步骤S101中得到的单元格地址编码存入到数据库中对应的字段中,以方便后续的空间位置索引。最终将人工对于该单元格的位置认知整理成文字形式存储进对应的字段位置中。
优选的,本发明仍然以武汉大学为例,提供上述过程的实际应用场景,具体如下:
根据步骤S101与步骤S102得到的武汉大学离散网格,派遣多名工作人员至实地进行图片的采集,因为研究区域为学校区域,所以建筑物多为教学楼、寝室楼、食堂以及图书馆等地区。
针对于教学楼,同一栋教学楼中不同教室的内部陈设几乎没有太大的差别,可将教室门牌号、前门的位置、讲台的位置以及投影仪的位置等作为差异特征记录进影像中。
针对于寝室楼此类私人空间,将房间门口的过道特征记录进影像中。
针对于食堂、图书馆此类差异较为明显的区域,多记录其特征区域,但是图书馆中存在部分保密文件存储室,这类区域则不应进行采集记录。随后将采集的影像存入到数据库对应的记录字段中。
运用Tensorflow构建ResNet-50模型。首先对残差结构进行构建,根据结构图,残差结构的Blank部分是由多个conv、Normalize、Scale与ReLU构成的局部网络组成,重点在于对这四个结构基元进行表示。
根据Tensorflow,conv可表示为tf.nn.conv2d,Normalize可表示为tf.layers.batch_normalization,Scale与ReLU均起激活作用可表示为tf.nn.relu,在残差结构开始备份一份传入数据,以保证模型的Short-Cut功能。
针对Indentity部分,这部分采用与Blank同样的方法进行构建,但在Short-Cut中,连接了一个由conv、Normalize构成的局部网络。
结合残差结构以及模型主流程对ResNet-50模型进行构建。第一阶段需依次通过tf.nn.conv2d、tf.layers.batch_normalization、tf.nn.relu以及tf.nn.max_pool处理。
第二阶段需依次通过4个残差结构,第一个由1个Indentity块以及2个Blank块组成,第二个由1个Indentity块以及3个Blank块组成,第三个由1个Indentity块以及5个Blank块组成,第四个由1个Indentity块以及2个Blank块组成。第三阶段需通过一个由tf.nn.avg_pool平均池化处理层,tf.layers.flatten归一化层以及FC全连接层依次组成的局部网络,这样就完成了预测模型的构建。
采用tf.losses.softmax_cross_entropy构建交叉熵计算损失以及代价,使用影像数据集对预测模型进行训练,控制迭代的次数,防止模型过度拟合。
训练完成之后,运用tf.train.Saver()将训练好的预测模型存入数据库对应的记录字段中。
将每个单元格的地址编码存入数据表对应的记录字段中,最后根据工作人员对于相应单元格空间位置的认知,将对该单元格空间位置的语义描述信息存入到对应的记录字段中,例如:武汉大学信息学部学生14舍206室。
S104:运用所述完整的数据库对待处理影像进行预测匹配:每一个待处理影像与数据库中单元格的匹配度为S*,将匹配度最高的MaxS*)对应的单元格语义描述信息字段TT i 提取,得到待处理影像所处的空间位置。
具体实施方法如下:
对于一张任意给定的武汉大学室内建筑的照片,逐一取出数据库中的预测模型,对该单元格与给定图像的匹配程度进行预测,得到该模型预测的精确度,即该待处理影像与该单元格的匹配度为S*。待全部匹配完成之后,将匹配度最高的单元格的语义描述文字Text i 取出,如果遇到有多个高匹配度的情况,将这些单元格一并输出。最终语义描述文字Text i 作为结果输出给用户,告知用户该图片所处的空间位置。
优选的,以武汉大学为例,该部分具体实施方法如下:
给定一张武汉大学信息学部学生三食堂的照片,首先使用Tensorflow的tf.reset_default_graph()命令对图片进行初始化,然后采用tf.train.Saver().restore函数逐个读取预测模型的参数数据形成预测模型,对图片进行预测匹配。经过多次预测后,筛选匹配度最高的记录,获取对单元格空间位置的语义描述,并返回给用户,得知图片的空间位置为“武汉大学信息学部学生三食堂”。
最后,作为前述部分的总结,请参考图3,图3是本发明方法的整体详细流程图。
首先,建立GeoSOT-3D离散网格,并对网格进行八叉树剖分,得到剖分后的单元格;
判断剖分后的单元格是否包含研究范围(或人类活动范围),若是,则加入待处理队列,否则进行剔除单元格,剔除的方法即为前述的定义人类活动范围,处于活动范围内的,进行保留,处于人类活动外的,进行剔除;
剔除之后判断剩下的单元格剖分次数是否大于24,若是,表示已不能再剖分;
此时进一步对单元格进行筛选,将单元格与建筑矢量图叠加求交,得到交集部分的单元格,其余没有交集部分的进行剔除,最终得到筛选完毕的单元格;
对筛选完毕的单元格进行网络编码,得到编码信息;其中编码规则前文已详细交代;
根据编码信息建立单元格的数据库;其中数据库的建立,前文已详细交代。
调用预测模型,预测待处理图像与数据库中单元格进行预测匹配,得到匹配度P*(即相当于前文所述的S*);
判断是否存在未使用预测模型的单元格(即是否将待处理图像与每个单元格都进行匹配计算),若待处理图像与每个单元格均匹配完毕,则获取最大匹配度Max(P*)的单元格,输出该单元格所在的空间位置,否则直到待处理图像与每个单元格匹配完为止,再进行后续操作。
请参见图4,图4是本发明实施例的硬件设备工作示意图,所述硬件设备具体包括:一种基于离散网格与影像匹配的室内自定位设备401、处理器402及存储设备403。
一种基于离散网格与影像匹配的室内自定位设备401:所述一种基于离散网格与影像匹配的室内自定位设备401用于实现所述一种基于离散网格与影像匹配的室内自定位方法。
存储设备403:所述存储设备403用于存储所述一种基于离散网格与影像匹配的室内自定位方法的所有指令及数据;
处理器402:所述处理器402加载并执行所述存储设备403中的指令及数据,并完成所述一种基于离散网格与影像匹配的室内自定位方法的所有步骤。
本发明提供的有益效果是:实现了高精度的室内环境图片自适应三维位置定位,为室内导航、室内定位以及室内GIS的发展提供了一种新的思路,与传统的坐标定位与语义定位不同,该方法能够根据用户输入的图像信息,反馈给用户高精度的室内三维位置,解决了用户在车站、商场以及地下商业街等大型室内综合体中定位、导航的需求,使得定位、导航技术变得更加全面,能够应对各个应用场景的需求。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于离散网格与影像匹配的室内自定位方法,其特征在于:具体包括以下步骤:
S101:建立改进的全球球体离散网格并对每一个单元格进行编码,得到单元格的编码信息;
S102:根据所述编码信息建立空数据库;所述空数据库中的一条信息即为一个单元格,每个单元格均包括四个属性,分别为影像数据集字段TP i 、影像预测模型字段TF i 、地址编码字段TC i 和语义描述信息字段TT i ;其中i为单元格的编号;
影像数据集字段TP i 存储单元格影像表格的ID,类型为TEXT;
影像表格的字段包括ID号字段以及图片字段,ID号字段的类型为INT,图片字段的类型为BLOB类型;
影像预测模型字段TF i 存储影像预测模型的参数,类型为BLOB;
地址编码字段TC i 存储单元格的网格编码,类型为TEXT;
语义描述信息字段TT i 存储单元格位置信息的语义描述,类型为TEXT;
S103:对单元格的属性进行填充,得到完整的数据库;
S104:运用所述完整的数据库对待处理影像进行预测匹配:每一个待处理影像与数据库中单元格的匹配度为S*,将匹配度最高的MaxS*)对应的单元格语义描述信息字段TT i 提取,得到待处理影像所处的空间位置;
步骤S101具体为:
S201:根据GeoSOT-3D的构建原理,先将全球球体离散网格的经纬度空间由-90°到90°与-180°到180°均拉伸到-256°到256°,得到拉伸后的全球球体离散网格;
S202:对拉伸后的全球球体离散网格进行八叉树分割,直至分割层级达到预设的K层时分割停止,得到分割后的单元格;
S203:将分割后的单元格与建筑矢量地图叠加求交,得到交集部分的单元格;
S204:对每一个交集部分的单元格进行编码,编码顺序为Z序编码。
2.如权利要求1所述的基于离散网格与影像匹配的室内自定位方法,其特征在于:步骤S103具体为:
S301:为单元格C i 采集独立的影像图片资料P i ,并将影像图片资料P i 加入到单元格C i 对应的影像数据集TP i 中;
S302:使用影像图片资料P i 对ResNet神经网络进行训练得到影像预测模型F i ,将得到的影像预测模型F i 加入到单元格C i
Figure DEST_PATH_IMAGE001
对应的影像预测模型字段TF i 中;
S303:将单元格C i 的地址编码Code i 加入到单元格C i 对应的地址编码字段TC i 中;
S304:将单元格C i 的语义描述文字Text i 加入到单元格C i 对应的语义描述信息字段TT i 中。
3.一种存储设备,其特征在于:所述存储设备存储指令及数据用于实现如权利要求1~2任意一项所述的基于离散网格与影像匹配的室内自定位方法。
4.一种基于离散网格与影像匹配的室内自定位设备,其特征在于:包括:处理器及存储设备;所述处理器加载并执行存储设备中的指令及数据用于实现如权利要求1~2任意一项所述的基于离散网格与影像匹配的室内自定位方法。
CN202011392141.4A 2020-12-03 2020-12-03 一种基于离散网格与影像匹配的室内自定位方法及设备 Active CN112182279B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011392141.4A CN112182279B (zh) 2020-12-03 2020-12-03 一种基于离散网格与影像匹配的室内自定位方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011392141.4A CN112182279B (zh) 2020-12-03 2020-12-03 一种基于离散网格与影像匹配的室内自定位方法及设备

Publications (2)

Publication Number Publication Date
CN112182279A CN112182279A (zh) 2021-01-05
CN112182279B true CN112182279B (zh) 2021-03-19

Family

ID=73918326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011392141.4A Active CN112182279B (zh) 2020-12-03 2020-12-03 一种基于离散网格与影像匹配的室内自定位方法及设备

Country Status (1)

Country Link
CN (1) CN112182279B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239952B (zh) * 2021-03-30 2023-03-24 西北工业大学 一种基于空间尺度注意力机制和矢量地图的航空图像地理定位方法
CN113850845B (zh) * 2021-12-01 2022-03-01 南京瀚海星宇信息技术有限公司 一种动目标对象的活动轨迹跟踪方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104866873A (zh) * 2015-04-10 2015-08-26 长安大学 一种基于手机图像匹配的室内定位方法
CN106568435A (zh) * 2016-11-09 2017-04-19 深圳奥比中光科技有限公司 一种室内定位方法及系统
CN109670547A (zh) * 2018-12-19 2019-04-23 中国人民解放军国防科技大学 一种多尺度序列图像匹配的位置识别定位方法
CN111340882A (zh) * 2020-02-20 2020-06-26 盈嘉互联(北京)科技有限公司 基于图像的室内定位方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355334A (zh) * 2016-08-30 2017-01-25 中国农业大学 农田建设区域判定方法
US10504002B2 (en) * 2017-07-30 2019-12-10 Fuji Xerox Co., Ltd. Systems and methods for clustering of near-duplicate images in very large image collections
CN108984729B (zh) * 2018-07-12 2021-01-22 武大吉奥信息技术有限公司 一种在WebGIS环境下动态图例的高效显示方法及装置
CN111127500A (zh) * 2019-12-20 2020-05-08 深圳市银星智能科技股份有限公司 一种空间分区方法、装置及移动机器人

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104866873A (zh) * 2015-04-10 2015-08-26 长安大学 一种基于手机图像匹配的室内定位方法
CN106568435A (zh) * 2016-11-09 2017-04-19 深圳奥比中光科技有限公司 一种室内定位方法及系统
CN109670547A (zh) * 2018-12-19 2019-04-23 中国人民解放军国防科技大学 一种多尺度序列图像匹配的位置识别定位方法
CN111340882A (zh) * 2020-02-20 2020-06-26 盈嘉互联(北京)科技有限公司 基于图像的室内定位方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于GeoSOT-3D的三维数据表达研究;胡晓光等;《北京大学学报(自然科学版)》;20151111;第51卷(第6期);正文第1-2节 *

Also Published As

Publication number Publication date
CN112182279A (zh) 2021-01-05

Similar Documents

Publication Publication Date Title
CN112182279B (zh) 一种基于离散网格与影像匹配的室内自定位方法及设备
CN111597170B (zh) 一种无损地由bim模型构建空间语义数据库的方法
CN109544683B (zh) 基于倾斜摄影数据的城市建筑群地震反应动态可视化方法
Simpson Virtual reality and urban simulation in planning: A literature review and topical bibliography
CN112784002B (zh) 一种虚拟场景生成方法、装置、设备和存储介质
CN108717729A (zh) 一种面向虚拟地球的地形多尺度tin在线可视化方法
Peterson Discrete global grid systems
Abou Diakité et al. Topological reconstruction of complex 3d buildings and automatic extraction of levels of detail
CN111027004A (zh) 一种离线式地震灾害损失评估系统的构建方法及应用方法
Diakité et al. Extraction of the 3D free space from building models for indoor navigation
Ribeiro et al. Exploring CityEngine as a visualisation tool for 3D cadastre
CN106897425A (zh) 一种地球重力场数据的三维可视化方法
CN115408382B (zh) 面向大规模卫星数据的矢量空间信息网格化存储管理方法
Glander et al. Cell-based generalization of 3D building groups with outlier management
CN110706340A (zh) 基于真实地理数据的管线三维可视化平台
CN105608094A (zh) 城市地下管线的二三维联动数据同步方法及装置
CN112948518B (zh) 对象处理方法、装置、电子设备和计算机存储介质
Gotlib et al. Integration of models of building interiors with cadastral data
Feld et al. Approximated environment features with application to trajectory annotation
Yudono et al. The Three Dimension (3D) Spatial Urban Heritage Informatics of Malang City, Indonesia
Chen et al. Data-driven Reconstruction for Massive Buildings within Urban Scenarios: A Case Study
Jackson et al. Digital City: an urban perspective on digital earth
Ridzuan et al. Voxelization Techniques: Data Segmentation and Data Modelling for 3d Building Models
Karim et al. Unified topological framework for retrieving 2D and 3D multi-scale spatial information
Lee et al. A conceptual Data Model for a 3D Cadastre in Korea

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 430000 Wuda science and Technology Park, Jiangxia Avenue, Miaoshan District, Donghu Development Zone, Wuhan City, Hubei Province

Patentee after: Geospace Information Technology Co., Ltd.

Address before: 430000 Wuda science and Technology Park, Jiangxia Avenue, Miaoshan District, Donghu Development Zone, Wuhan City, Hubei Province

Patentee before: WUDA GEOINFORMATICS Co.,Ltd.