CN108763481B - 一种基于大规模街景数据的图片地理定位方法和系统 - Google Patents
一种基于大规模街景数据的图片地理定位方法和系统 Download PDFInfo
- Publication number
- CN108763481B CN108763481B CN201810533914.2A CN201810533914A CN108763481B CN 108763481 B CN108763481 B CN 108763481B CN 201810533914 A CN201810533914 A CN 201810533914A CN 108763481 B CN108763481 B CN 108763481B
- Authority
- CN
- China
- Prior art keywords
- picture
- nearest neighbor
- feature
- query
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明公开了一种基于大规模街景数据的图片地理定位方法及实现该方法的系统。所述方法包括实时匹配部分:从查询图片中提取局部特征点作为查询特征点,生成查询特征集;在索引结构中对每个查询特征点检索K个最近邻特征点,生成最近邻特征分布表;通过所述最近邻特征分布表得到候选图片的最近邻特征集;选择最近邻特征集中的最优特征集对应的候选图片作为最佳匹配图片,该匹配图片对应的地理位置即视为查询图片的地理位置;其中K为整数。本方法优选还可以包括预处理部分,将比较耗时的“建立索引结构部分”分开提前进行处理。本方法和系统具有定位精度高、匹配速度快、可以求出全局最优解等特点。
Description
技术领域
本发明涉及图像定位技术领域,尤其涉及一种基于大规模街景数据的图片地理定位的方法和系统。
背景技术
图片地理定位是根据图片视觉信息确定或估计图片的地理位置。这个问题有许多的运用场景,例如汽车自动驾驶,移动终端导航,视频地理轨迹生成等。最近几年,街景图片正在不断地更新完善,在某些城市可以做到街道视野的全覆盖。图片中有许多可识别的视觉信息,例如建筑物、广告牌等,我们可以采用基于特征匹配的方法,把这些信息给识别出来,以达到图片地理定位的目的。
在学术研究领域,Zamir等作者提出了每个查询特征点检索距离其最近的一个特征点,然后用比值过滤误匹配的外点,最后选择特征点最多对应的参考图片作为最佳匹配。在接下来的工作中,该作者把第1个最近邻特征点扩展到K个最近邻特征点,根据第一最近邻特征点、第K个最近邻特征点到查询特征点的比值关系,过滤外点。在特征点匹配算法部分,作者把局部特征和全局特征结合作为优化条件,并提出了用广义最小团GMCP算法选择最佳匹配最近邻点。理想情况下,每个查询特征点都有一个对应的最近邻特征点,然而,大多数情况下,部分查询特征点匹配的特征点不在最近邻范围内,这些点即为匹配外点,消耗匹配时间并且GMCP为NP-hard问题,具有较高的时间复杂度。同时,GMCP求出的为局部最优解,并非全局最佳解。
在实际运用领域,Google公司研发了一个定位一张图片位置的Google Photos技术。用户把图片上传到服务器中,当服务器接收到需要定位的图片时,它首先会将图片分解成像素级别,然后将这些信息和数据库中的信息进行比对,通过一定的算法判断出照片所在大概区域,如某个国家的某个景区等。接着再根据数据库中保存的GPS地理信息进一步判断,如照片特征符合某个经纬度信息就为其匹配对应的地理位置,这样通过实际经纬度信息就可以对照片进行定位。然而此定位方法是在全球范围内,定位准确率低,无法满足实际要求。
发明内容
为了解决街景图片匹配速度慢、只能求出局部最优解和定位精度低的问题,本发明公开了一种基于大规模街景数据的图片地理定位方法,可以仅根据图片视觉信息进行地理定位,具有匹配速度快、可以求出全局最优解和定位精度高的特点。
本发明解决其技术问题所采用的技术方案是:
一种基于大规模街景数据的图片地理定位方法,从查询图片中提取局部特征点作为查询特征点,生成查询特征集;在索引结构中对每个查询特征点检索K个最近邻特征点,生成最近邻特征分布表;通过所述最近邻特征分布表得到候选图片的最近邻特征集;选择最近邻特征集中的最优特征集对应的候选图片作为最佳匹配图片,该匹配图片对应的地理位置即视为查询图片的地理位置;其中K为整数。
优选地,具体步骤可包括:B1:从查询图片中提取局部特征点作为查询特征点qi,生成查询特征集Q={qi|i=1,2,…,n};B2:对所述查询特征集Q中每个查询特征点qi,在所述索引结构中返回K个到查询特征点距离递增的最近邻特征点,生成最近邻分布表VT;B3:对所述最近邻分布表VT中每个最近邻点vij,按照最近邻点与街景图片的映射表,返回最近邻分布表VT对应的街景图片,去除重复的街景图片,得到候选匹配图片集Ic={I1,I2,I3…,Is};B4:对所述候选匹配图片集Ic中每个候选匹配图片Is,遍历Q中的每个查询特征点,判断该查询特征点在最近邻分布表VT中对应的最近邻行中是否有最近邻特征点属于Is;若特征点个数大于1或等于1,则选择一个距离查询特征点最近的特征点;若无,则跳过该特征点的选择;所有选择的特征点组成候选图片特征集NNFS;B5:将所述候选匹配图片集Ic中的每个候选匹配图片Is去除所述候选图片最近邻特征集NNFSIs中重复的特征点;B6:对所述候选匹配图片集Ic中每个候选匹配图片Is,计算所述候选图片最近邻特征集NNFSIs的相似度;B7:对所述候选匹配图片集Ic中每个候选匹配图片,选择所述候选图片最近邻特征集NNFSIs特征点个数最多的候选图片作为匹配图片;将匹配图片的地理位置作为查询图片的地理位置。
更进一步地,步骤B6中所述候选图片最近邻特征集NNFSIs的相似度为:
更进一步地,步骤B6中,所述查询特征点qi与所述最近邻特征点vij间的相似度为:式中,ξ(qi)表示返回qi的特征向量;ξ(vij)表示返回vij的特征性向量;||ξ(qi)-ξ(vij)||表示计算两个所述特征向量的范数。
更进一步地,步骤B7中,若存在两个或两个以上候选图片特征集NNFS特征点个数相同且数值最大时,则在其中选择相似度最大值对应的候选图片作为匹配图片。
更进一步地,还包括预处理过程,用于提取街景图片的局部特征点作为参考特征集,建立局部特征点与其所提取街景图片的映射表,将所述参考特征集建立成索引结构;预处理过程具体步骤包括:A1:将街景图片进行压缩;A2:对街景图片提取局部特征点,将其作为参考特征集,同时建立每个局部特征点和所提取街景图片的映射表;A3:将所述参考特征集建立成索引结构。
更进一步地,步骤A2中,所述特征点是SIFT或SURF特征点。
更进一步地,步骤A3中,所述索引结构是用相似性搜索工具FAISS或快速最近邻搜索库FLANN将其建立成索引结构。
更进一步地,其中K值取5。
本发明还提出一种基于大规模街景数据的图片地理定位系统,包括计算机程序,所述程序可被执行用于实现上述任一项所述方法。
本发明的有益效果是:本发明的图片地理定位方法可以仅根据图片视觉信息进行地理定位,实时匹配部分的时间复杂度可以仅与查询特征点个数相关,并且是线性匹配时间复杂度,从而具有较低的时间复杂度,因此匹配时间短,可以仅为秒级,匹配速度快。
进一步地,该方法求出的候选图片参考特征集为全局最优解,而现有技术中的GMCP算法求出的只是局部最优解。在Zamir公开的测试数据集上,本发明实施例比基于GMCP的方法匹配准确度提高了2%,定位精度更高。
附图说明
图1是本发明实施例基于大规模街景数据的图片定理定位方法流程示意图;
图2是本发明实施例一张查询图片定位的示意图;
图3是本发明实施例最近邻特征表示意图;
图4是本发明实施例公开测试数据集的匹配正确率。
具体实施方式
下面结合附图和具体实施例对本发明做进一步说明。
如图1所示,基于大规模街景数据的图片地理定位方法,它包括可离线处理(可在终端处理,也可在服务器处理)的预处理部分,以及要在线处理的实时匹配(实时处理)部分。
对街景数据集,这里采用了Zamir公开的超过102K带有GPS标签的Google街景图片,测试数据集采用了从Flickr、Panoramio和Picasa地区用户随机上传的644张带有GPS标签的图片。本具体实施例在服务器上Ubuntu环境下用Python2.7脚本语言下执行,其中服务器内存至少需要100G;在变通实施例中,如果数据量大,电脑、移动电子设备或服务器可能需要更大内存。如图2所示为一张查询图片定位过程中所需要的主要步骤的形象化示意。
其中预处理部分是提取街景图片的局部特征点作为参考特征集,建立局部特征点与其所提取街景图片的映射表,将所述参考特征集建立成索引结构;具体步骤如下:
A1:将街景图片进行压缩;
A2:对街景图片提取125077125个SIFT特征点,将其作为参考特征集,同时建立每个局部特征点和所提取街景图片的映射表,在变通实施列中可以使用SURF特征点;
A3:将参考特征集用相似性搜索工具FAISS将其建立成索引结构,在变通实施列中可以使用快速最近邻搜索库FLANN。
其中实时匹配是从查询图片中提取局部特征点作为查询特征点,生成查询特征集;在所述索引结构中对每个查询特征点检索K个最近邻特征点,最近邻特征点K可以是5个,生成最近邻特征分布表;通过所述最近邻特征分布表得到候选图片的最近邻特征集;选择最近邻特征集中的最优特征集对应的候选图片作为最佳匹配图片,该匹配图片对应的地理位置即视为查询图片的地理位置。具体步骤如下:
B1:从查询图片中提取局部特征点作为查询特征点qi,生成查询特征集Q={qi|i=1,2,…,n},n=5227;
B2:对所述查询特征集Q中每个查询特征点qi,在所述索引结构中返回K个到查询特征点距离递增的最近邻特征点,生成最近邻分布表VT,返回K个到查询特征点距离递增的最近邻特征点中的K可以是5个;
B3:对所述最近邻分布表VT中每个最近邻点vij,按照最近邻点与街景图片的映射表,返回最近邻分布表VT对应的街景图片,去除重复的街景图片,得到候选匹配图片集Ic={I1,I2,I3…,Is};
B4:对所述候选匹配图片集Ic中每个候选匹配图片Is,遍历Q中的每个查询特征点,判断该查询特征点在最近邻分布表VT中对应的最近邻行中是否有最近邻特征点属于Is;若特征点个数大于1或等于1,则选择一个距离查询特征点最近的特征点;若无,则跳过该特征点的选择;所有选择的特征点组成候选图片特征集NNFS;
B5:将所述候选匹配图片集Ic中的每个候选匹配图片Is去除所述候选图片最近邻特征集NNFSIs中重复的特征点;
B6:对所述候选匹配图片集Ic中每个候选匹配图片Is,计算所述候选图片最近邻特征集NNFSIs的相似度;所述查询特征点qi与所述最近邻特征点vij间的相似度为:式中,ξ(qi)表示返回qi的特征向量;ξ(vij)表示返回vij的特征性向量;||ξ(qi)-ξ(vij)||表示计算两个所述特征向量的范数;候选图片最近邻特征集NNFSIs的相似度为:
B3~B6步骤,在本具体实施例子中,执行时间为172ms。
B7:对所述候选匹配图片集Ic中每个候选匹配图片,选择所述候选图片最近邻特征集NNFSIs特征点个数最多的候选图片作为匹配图片;本具体实施例中,只有一张候选图片的最近邻特征集NNFSIs,特征点个数最大为69,故将该候选图片作为查询图片的匹配图片;在变通实施例中,若存在两个或两个以上候选图片特征集NNFS特征点个数相同且数值最大时,则在其中选择相似度最大值对应的候选图片作为匹配图片;将匹配图片的地理位置作为查询图片的地理位置。
为实现上述方法,本发明实施例提供一种基于大规模街景数据的图片地理定位系统,包括计算机程序,所述程序可被执行用于实现上述方法,得到匹配后的图片,定位查询图片的地理位置。
本发明的图片定位方法可以运用到大规模街景数据的图片地理定位中,具体工作过程为:预处理部分把街景数据建立的索引数据传到实时处理部分;用户可通过电脑或者移动电子设备上传查询图片,也可以通过电脑或者移动电子设备处理预见处理部分,或者直接在服务器上处理预处理部分;在服务器上处理时,可离线处理也可在线处理;服务器端对查询图片按照本发明的服务器处理部分进行处理,得到匹配后的图片,定位查询图片的地理位置,其中电脑、移动电子设备或服务器的相关配置取决于街景数据的数量。
如图3所示,步骤B2生成的最近邻分布表VT。
候选图片特征集的求解算法如表1所示。
表1:候选图片特征集的求解算法
如图4所示,实验结果表明,在300m的误差范围内,本发明比基于GMCP的方法匹配准确度提高了2%,定位精度高;同时匹配时间为秒级,匹配速度快;该方法求出的候选图片参考特征集为全局最优解,而并非GMCP算法求出的局部最优解。
以上结合附图对本发明进行了详细说明,但本发明不仅仅局限于上述具体实施方式,本领域的普通技术人员根据所具备的知识,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (9)
1.一种基于大规模街景数据的图片地理定位方法,其特征在于:从查询图片中提取局部特征点作为查询特征点,生成查询特征集;在索引结构中对每个查询特征点检索K个最近邻特征点,生成最近邻特征分布表;通过所述最近邻特征分布表得到候选图片的最近邻特征集;选择最近邻特征集中的最优特征集对应的候选图片作为最佳匹配图片,该匹配图片对应的地理位置即视为查询图片的地理位置;其中K为整数;
具体步骤包括:
B1:从查询图片中提取局部特征点作为查询特征点qi,生成查询特征集Q={qi|i=1,2,···,n};
B2:对所述查询特征集Q中每个查询特征点qi,在所述索引结构中返回K个到查询特征点距离递增的最近邻特征点,生成最近邻分布表VT;
B3:对所述最近邻分布表VT中每个最近邻点vij,按照最近邻点与街景图片的映射表,返回最近邻分布表VT对应的街景图片,去除重复的街景图片,得到候选匹配图片集Ic={I1,I2,I3···,Is};
B4:对所述候选匹配图片集Ic中每个候选匹配图片Is,遍历Q中的每个查询特征点,判断该查询特征点在最近邻分布表VT中对应的最近邻行中是否有最近邻特征点属于Is;若特征点个数大于1或等于1,则选择一个距离查询特征点最近的特征点;若无,则跳过该特征点的选择;所有选择的特征点组成候选图片特征集NNFS;
B6:对所述候选匹配图片集Ic中每个候选匹配图片Is,计算所述候选图片最近邻特征集NNFSIs的相似度;
B7:对所述候选匹配图片集Ic中每个候选匹配图片,选择所述候选图片最近邻特征集NNFSIs特征点个数最多的候选图片作为匹配图片;将匹配图片的地理位置作为查询图片的地理位置。
4.根据权利要求1所述的基于大规模街景数据的图片地理定位方法,其特征在于:步骤B7中,若存在两个或两个以上候选图片特征集NNFS特征点个数相同且数值最大时,则在其中选择相似度最大值对应的候选图片作为匹配图片。
5.根据权利要求1所述的基于大规模街景数据的图片地理定位方法,其特征在于:还包括预处理过程,用于提取街景图片的局部特征点作为参考特征集,建立局部特征点与其所提取街景图片的映射表,将所述参考特征集建立成索引结构;预处理过程具体步骤包括:
A1:将街景图片进行压缩;
A2:对街景图片提取局部特征点,将其作为参考特征集,同时建立每个局部特征点和所提取街景图片的映射表;
A3:将所述参考特征集建立成索引结构。
6.根据权利要求5所述的基于大规模街景数据的图片地理定位方法,其特征在于:步骤A2中,所述特征点是SIFT或SURF特征点。
7.根据权利要求5所述的基于大规模街景数据的图片地理定位方法,其特征在于:步骤A3中,所述索引结构是用相似性搜索工具FAISS或快速最近邻搜索库FLANN将其建立成索引结构。
8.根据权利要求1所述的基于大规模街景数据的图片地理定位方法,其特征在于:其中K值取5。
9.一种基于大规模街景数据的图片地理定位系统,其特征在于包括计算机程序,所述程序可被执行用于实现如权利要求1-7中所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810533914.2A CN108763481B (zh) | 2018-05-29 | 2018-05-29 | 一种基于大规模街景数据的图片地理定位方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810533914.2A CN108763481B (zh) | 2018-05-29 | 2018-05-29 | 一种基于大规模街景数据的图片地理定位方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108763481A CN108763481A (zh) | 2018-11-06 |
CN108763481B true CN108763481B (zh) | 2020-09-01 |
Family
ID=64003553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810533914.2A Active CN108763481B (zh) | 2018-05-29 | 2018-05-29 | 一种基于大规模街景数据的图片地理定位方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108763481B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109634952B (zh) * | 2018-11-02 | 2021-08-17 | 宁波大学 | 一种面向大规模数据的自适应最近邻查询方法 |
CN109446293B (zh) * | 2018-11-13 | 2021-12-10 | 嘉兴学院 | 一种并行的高维近邻查询方法 |
CN111680709A (zh) * | 2019-03-11 | 2020-09-18 | 武汉小狮科技有限公司 | 一种基于环境图片特征匹配的定位方法 |
CN110069666B (zh) * | 2019-04-03 | 2021-04-06 | 清华大学 | 基于近邻结构保持的哈希学习方法和装置 |
CN110210533B (zh) * | 2019-05-20 | 2021-01-19 | 清华大学深圳研究生院 | 基于最大覆盖位置问题的图片组地理定位方法 |
CN113706592A (zh) * | 2021-08-24 | 2021-11-26 | 北京百度网讯科技有限公司 | 一种定位信息的修正方法、装置、电子设备和存储介质 |
CN115641499B (zh) * | 2022-10-19 | 2023-07-18 | 感知天下(北京)信息科技有限公司 | 基于街景图特征库的拍照实时定位方法、设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103970769B (zh) * | 2013-01-29 | 2018-06-26 | 华为技术有限公司 | 图像检索方法及装置 |
EP2989607B1 (en) * | 2013-04-25 | 2019-01-09 | Thomson Licensing | Method and device for performing super-resolution on an input image |
US9311690B2 (en) * | 2014-03-11 | 2016-04-12 | Adobe Systems Incorporated | Video denoising using optical flow |
CN106780579B (zh) * | 2017-01-17 | 2019-08-13 | 华中科技大学 | 一种超大规模图像特征点匹配方法及系统 |
CN107085607B (zh) * | 2017-04-19 | 2020-06-30 | 电子科技大学 | 一种图像特征点匹配方法 |
CN107133325B (zh) * | 2017-05-05 | 2020-01-07 | 南京大学 | 一种基于街景地图的互联网照片地理空间定位方法 |
-
2018
- 2018-05-29 CN CN201810533914.2A patent/CN108763481B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108763481A (zh) | 2018-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108763481B (zh) | 一种基于大规模街景数据的图片地理定位方法和系统 | |
US9165217B2 (en) | Techniques for ground-level photo geolocation using digital elevation | |
CN109658445A (zh) | 网络训练方法、增量建图方法、定位方法、装置及设备 | |
CN109255042B (zh) | 基于大规模街景数据的实时图片匹配地理定位方法和系统 | |
CN104794219A (zh) | 一种基于地理位置信息的场景检索方法 | |
US10089762B2 (en) | Methods for navigating through a set of images | |
Cheng et al. | A data-driven point cloud simplification framework for city-scale image-based localization | |
CN111383205A (zh) | 一种基于特征点和三维模型的图像融合定位方法 | |
CN109711443A (zh) | 基于神经网络的户型图识别方法、装置、设备及存储介质 | |
CN109284409B (zh) | 基于大规模街景数据的图片组地理定位方法 | |
CN115267724A (zh) | 一种基于激光雷达可估位姿的移动机器人位置重识别方法 | |
Salarian et al. | Improved image-based localization using SFM and modified coordinate system transfer | |
CN110636248A (zh) | 目标跟踪方法与装置 | |
Kong et al. | Robust convnet landmark-based visual place recognition by optimizing landmark matching | |
Li et al. | Global-scale location prediction for social images using geo-visual ranking | |
CN110134816B (zh) | 一种基于投票平滑的单张图片地理定位方法和系统 | |
CN108399413B (zh) | 一种图片拍摄区域识别及地理定位方法及装置 | |
CN114943766A (zh) | 重定位方法、装置、电子设备及计算机可读存储介质 | |
Zhang et al. | Hierarchical Image Retrieval Method Based on Bag-of-Visual-Word and Eight-point Algorithm with Feature Clouds for Visual Indoor Positioning | |
JP2018194366A (ja) | 位置推定装置、方法、及びプログラム | |
Hoashi et al. | Constructing a landmark identification system for geo-tagged photographs based on web data analysis | |
JP5349004B2 (ja) | コンテンツ検索システムおよびコンテンツ検索プログラム | |
KR102464358B1 (ko) | 머신러닝에 기반하여 이미지에 대응되는 공간 정보를 추정하기 위한 방법 및 이를 이용한 공간 추정 장치 | |
Wang et al. | A visual-GPS fusion based outdoor augmented reality method | |
Musa et al. | Feasibility of Video-based Sub-meter Localization on Resource-constrained Platforms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |