CN105389375B - 一种基于可视域的图像索引设置方法、系统及检索方法 - Google Patents

一种基于可视域的图像索引设置方法、系统及检索方法 Download PDF

Info

Publication number
CN105389375B
CN105389375B CN201510793976.3A CN201510793976A CN105389375B CN 105389375 B CN105389375 B CN 105389375B CN 201510793976 A CN201510793976 A CN 201510793976A CN 105389375 B CN105389375 B CN 105389375B
Authority
CN
China
Prior art keywords
image
index
visual
planar
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510793976.3A
Other languages
English (en)
Other versions
CN105389375A (zh
Inventor
吴勇
童为民
黄碧辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Normal University
Original Assignee
Fujian Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Normal University filed Critical Fujian Normal University
Priority to CN201510793976.3A priority Critical patent/CN105389375B/zh
Publication of CN105389375A publication Critical patent/CN105389375A/zh
Application granted granted Critical
Publication of CN105389375B publication Critical patent/CN105389375B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Studio Devices (AREA)

Abstract

本发明公开了一种基于可视域的图像索引设置方法、系统及检索方法,其中设置方法包括:解析可定位图像EXIF头文件中的参数标记,提取出参数信息;并构建镜头视角范围模型,计算出图像可视域面状范围;并存储到图像数据库空间字段中;确定索引边界、分割索引区域空间,并确定索引坐标。通过上述方式,本发明充分利用参数信息建立图像可视域模型,用面状图形代替传统的点图形,更真实反应图像在真实场景中的所覆盖的区域。同时基于可视域的图像检索方法,除了可检索到检索区域内拍摄的图像外,还可以检索到拍摄位置在检索范围外,但其图像实际场景在检索范围内的图像,使得图像检索结果更精确,同时其检索方式更符合人们的实际需求。

Description

一种基于可视域的图像索引设置方法、系统及检索方法
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种基于可视域的图像索引设置方法、系统及检索方法。
背景技术
图像是视觉所及环境的自然再现,具有内容丰富、表达直观的特性,其已成为社会生产生活中一种重要的可视信息载体,应用日益广泛。面向快速增长的海量图像数据,如何快速高效检索出用户需要的图像资源已成为图像处理技术领域重要的研究课题。
目前主流的图像检索方法主要分为基于文本的图像检索和基于内容的图像检索,基于文本的图像检索主要利用人工对图像主题、内容描述进行标注,再采用关键字匹配技术进行图像检索;基于内容图像检索则通过抽取图像的颜色、纹理、形状等特征构建参数描述算子,然后根据特征匹配实现图像检索。然而,以上图像检索技术主要专注于图像主题、图像内容特征方面的检索,而忽略了图像隐含的位置特征,即目前的图像检索方法主要用于解决了“查询某某主题图像”、“查询某某特征图像”等需求,而无法解决“查询位于某区域内的图像”、“查询拍摄方向为东南向的图像”等需求。
近年来,随着硬件设备的飞速发展,索尼、尼康、佳能、松下、卡西欧、富士等各大相机厂商都推出了GPS相机,例如索尼推出的GPS-CS1适配器同步记录包括定位、时间、拍摄设置等在内的各类数据,将GPS位置信息与图像融为一体;同时众多学者也在图像与GPS定位信息、方位信息集成方面做了大量的工作,这些研究都为基于二维可视域的图像检索提供了数据基础。目前基于位置的图像检索还是仅仅利用了图像中的GPS定位信息,其解决思路为将图像可视范围抽象为点特征数据,然后采用空间索引对点数据进行索引,最后在GIS技术支持下实现图像检索,具体步骤为:1)针对图像集,循环提取每一张图像中的GPS定位信息,并在数据库中生成一条点记录信息,图像作为点的属性存储在该条记录中;2)采用空间索引对数据库中点记录集进行组织;3)用户在电子地图上框选图像查询范围,4)在空间索引支持下,基于查询范围筛选出初步图像集,再遍历初选图像集记录判断GPS定位信息点是否包含在检索区域内;5)返回点位于检索区域内的图像数据集。
目前基于位置的图像检索方法缺点在于:
(1)未充分利用图像中记录的信息,例如镜头焦距、镜头可视角度、镜头放大倍率、方位信息等参数信息,仅利用了GPS定位信息。
(2)在数据组织方面,仅简单根据图像拍摄位置GPS定位信息将图像抽象为点模型,实质上图像反映的是面状场景信息,采用以点代面的建模方式就会造成只能检索到拍摄位置在检索范围内的图像,而一些虽然拍摄位置在检索区域外,但是实际上拍摄场景在检索范围内的图像出现漏检的现象,使得检索精度不足,同时检索结果与人们检索的实际需求不符。
发明内容
本发明所要解决的技术问题是:解决图像参数信息未充分利用、以点代面的图像建模方式造成检索精度不足的缺陷,充分利用镜头焦距、镜头可视角度、镜头放大倍率、GPS定位信息、方位信息参数建立图像可视域模型,用面状图形代替传统的点图形,更真实表达图像在现实场景中的所覆盖的区域,并采用多级网格对图像可视域生成的面状图形进行空间索引,进而在GIS技术支持下实现基于位置的图像检索,使得图像检索结果更加精确,更符合人们的检索需求。
为了解决上述技术问题,本发明采用的技术方案为:提供一种基于可视域的图像索引设置方法,包括:
解析可定位图像EXIF头文件中的参数标记,提取出参数信息;
根据所述参数信息构建镜头视角范围模型,并计算出图像可视域面状范围;
存储图像可视域面状图形到图像数据库空间字段中;
根据图像可视域面状图形的分布确定索引边界、分割索引区域空间,并确定索引坐标。
为解决上述问题,本发明还提供一种基于可视域的图像检索方法,包括以下步骤:
在地图上选取图像检索区域;
获取检索区域与索引区域相交的索引区域块;
根据图像可视域与索引区域块的索引关系,筛选出相交区域块内的图像集合,以作为初级过滤结果集;
遍历初级过滤结果集中的图像,获取目标结果图像。
为解决上述问题,本发明提供一种基于可视域的图像索引设置系统,包括:
解析提取模块,用于解析可定位图像EXIF头文件中的参数标记,提取出参数信息;
构建计算模块,用于根据所述参数信息构建镜头视角范围模型,并计算出图像可视域面状范围;
存储模块,用于存储图像可视域面状图形到图像数据库空间字段中;
图像索引模块,用于根据图像可视域面状图形的分布确定索引边界、分割索引区域空间,并确定索引坐标系统。
本发明的有益效果在于:区别于现有技术,本发明通过解析可定位图像EXIF头文件中的参数标记,提取出参数信息;通过提取出的参数构建镜头视角范围模型,计算出图像可视域面状范围;根据图像可视域面状图形的分布确定索引边界、分割索引区域空间,并确定索引坐标,以此建立图像索引,进而在GIS技术支持下实现基于可视域的图像高效、精确检索。通过上述方式,本发明充分利用参数信息建立图像可视域模型,用面状图形代替传统的点图形,更真实反应图像在真实场景中的所覆盖的区域。同时基于可视域的图像检索方法,除了可检索到检索区域内拍摄的图像外,还可以检索到拍摄位置在检索范围外,但其图像实际场景在检索范围内的图像,使得图像检索结果更精确,同时其检索方式更符合人们的实际需求。
附图说明
图1为本发明基于可视域的图像索引与检索实现技术路线图;
图2为本发明具体实施例中视角范围模型;
图3为本发明具体实施例中镜头缩放示意图;
图4为本发明具体实施例中焦距、视角、感光元件宽度三者关系示意图;
图5为本发明具体实施例中物体宽度与成像宽度的关系示意图;
图6为本发明具体实施例中可定位图像参数值示意图;
图7为本发明具体实施例中图像可视范围示意图;
图8为本发明具体实施例中图像可视域示意图;
图9为本发明具体实施例中多级网格空间索引流程图;
图10为本发明具体实施例中4×4多级网格划分示意图;
图11为本发明具体实施例中索引坐标B树组织结构关系图;
图12为本发明具体实施例中基于可视域图像检索流程图;
图13为本发明具体实施例中基于可视域图像检索结果示意图。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
本发明最关键的构思在于:基于可定位图像数据,根据图像EXIF头文件标记字段中的参数信息构建图像可视范围模型,并在二维矢量/三维场景模型的辅助下计算图像的可视域,在此基础上建立图像可视域面状图形的空间索引,进而在GIS技术支持下实现基于可视域的图像高效、精确检索。
术语解释:
1.EXIF(Exchangeable Image File)是“可交换图像文件”的缩写,当中包含了专门为数码相机的照片而定制的元数据,可以记录数码照片的拍摄参数、缩略图及其他属性信息。是由日本电子工业发展协会(Japan Electronic Industry DevelopmentAssociation,JEIDA)制订的图像的一种格式,它的数据存储与JPEG格式是完全相同的。实际上Exif格式就是在JPEG格式头部插入了数码照片的信息,包括拍摄时的光圈、快门、白平衡、ISO、焦距、日期时间等各种和拍摄条件以及相机品牌、型号、色彩编码、拍摄时录制的声音以及GPS全球定位系统数据、缩略图等。
2.可定位图像:是一种基于EXIF图像结构将图像信息、图像元数据信息、图像属性信息以及图像空间信息集于一体的图像,图像信息指被拍摄对象实体的实景信息;图像元数据包括图像分辨率、焦距、采集时间、曝光度等照片元数据;图像属性信息包括文本信息、音频信息等;图像空间信息主要包括GPS位置信息与方位信息。
3.镜头视点与朝向:可简单地理解为相机的拍摄位置以及拍摄角度。
4.镜头可视距离:是在某一条件下镜头最佳的成像距离。
5.镜头焦距:是指镜头光学后主点到焦点的距离,是镜头的重要性能指标。镜头焦距的长短决定着拍摄的成像大小,视场角大小,景深大小和画面的透视强弱。
6.镜头视角:是指通过镜头可以看到的视觉范围。
7.放大倍率:光学透镜性能参数,是指物体通过透镜在焦平面上的成像大小与物体实际大小的比值。
8.针孔成像模型:计算机视觉研究中,三维空间中的物体到像平面的投影关系即为成像模型,理想的投影成像模型是光学中的中心投影,也称为针孔成像模型。
9.图像可视范围:根据镜头视点、镜头朝向、镜头焦距以及可视角度等相机拍摄参数确定镜头的可视范围。
10.可视域:对于给定的一个观察点,基于一定的相对高度,查找给定的范围内观察点所能通视覆盖的区域,也就是给定点的通视区域范围,此通视区域范围即可视域。
11.空间索引:空间索引是指依据空间对象的位置和形状或空间对象之间的某种空间关系按一定顺序排列的一种数据结构,它介于空间操作算法和空间对象之间,通过筛选作用将大量与特定空间操作无关的空间对象排除,从而提高空间操作的速度和效率。
12.WKT:是由开放地理空间联盟(OGC)制定的用于表述空间对象的标准格式,它是一种文本标记语言(Well-Known Text),主要表示矢量几何对象(点、线、面、多边形、多面体等)、空间参照系统(空间物体的测地基准、大地水准面、坐标系统及地图投影)及空间参照系统之间的转换。
本发明实施例一提供一种基于可视域的图像索引设置方法,包括:
S11:解析可定位图像EXIF头文件中的参数标记,提取出参数信息;
S12:根据所述参数信息构建镜头视角范围模型,并计算出图像可视域面状范围;
S13:存储图像可视域面状图形到图像数据库空间字段中;
S14:根据图像可视域面状图形的分布确定索引边界、分割索引区域空间,并确定索引坐标。
其中,本发明所述参数信息包括镜头焦距、镜头水平可视角度、GPS定位信息、方位信息等;采用步骤S11中提取的参数构建镜头视角范围模型(FOV,Field of Vision),并计算出图像可视范围。视角范围模型如图2所示,所述图像可视域面状图形范围由包括视点位置、视角朝向、可视角度、可视距离在内的参数决定。
其中,本发明以GPS定位信息(如GPS经纬度值)作为图像视点位置;以方位信息值作为图像视角朝向;
其中图像可视角度值的计算可分为以下两种情况:1、针对定焦方式拍摄的图像,图像可视角度等价于步骤S11中获取的镜头初始水平可视角度值;2、针对变焦方式拍摄的图像,其镜头放大倍率直接决定了镜头可视角度。如图3镜头缩放示意图所示,当镜头变焦拍摄物体时,实际上镜头焦距是不变的,只是通过缩小物体在感光元件上的成像范围,然后再将成像范围内的像素进行放大来达到变焦的效果,其放大倍率与感光元件成像范围对角线长度呈反比,同时可视角度也随着放大倍率的增大而减小。
因此,本发明采用镜头焦距、感光元件宽度与可视角度之间的三角比例约束关系进行变焦图像可视角度计算,焦距、视角、感光元件宽度三者关系示意图如图4所示。
其计算过程为:首先将步骤S11中获取的初始水平可视角度、焦距值代入公式1计算感光元件宽度,其次将步骤S11中获取的放大倍率、感光元件宽度值代入公式2计算变焦后的感光元件成像宽度,最后将计算出的感光元件成像宽度、镜头焦距代入公式1求取变焦图像的水平可视角度,其中ViewAngle为水平可视角度,FocalLen为镜头焦距,SensorWidth为感光元件宽度,SensorWidthZom为变焦后感光元件成像宽度,ScaleFactor为缩放倍数。
式1;
式2;
通过单位尺寸的物体宽度所占图幅宽度的比例,利用感光元件成像宽度、镜头焦距,计算图像可视距离。
具体地,图像的可视距离理论上是无限远的,然而图像中物体的成像清晰度随着可视距离增加而逐渐降低,距离较远的物体在图像上几乎无法分辨,因此可视距离取无限远是无意义的。本方法以物体在图像上清晰成像为前提,通过设置某单位尺寸的物体宽度所占图幅宽度的比例,利用感光元件成像宽度、镜头焦距与可视距离之间的比例关系(如图6所示),基于公式3计算图像的极限可视距离作为该图像的可视距离。公式3中的Distance为图像可视距离,SensorWidth为感光元件宽度,FocalLen为镜头焦距,Ratio为单位尺寸物体宽度所占图幅的比例,ObjectWidth为物体的实际宽度。
式3
获取图像可视域面状图形后,需要存储到图像数据库空间字段中,具体为:
若图像可视域面状图形范围区域具有二维矢量或三维场景数据,则将步骤S12构建的镜头视角范围模型与二维矢量或三维场景数据进行求交计算,获得图像可视域面状图形,并存储图像可视域面状图形到图像数据库空间字段中;
若图像可视域面状图形范围区域不具有二维矢量和三维场景数据,则直接存储图像可视域面状图形到图像数据库空间字段中。
其中,本发明中图像可视域面状图形除了可存储在SQL Server数据库空间字段中外,还可以存储于Oracle、DB2、PostgreSQL等数据库空间字段中。
通过以上步骤遍历处理所有图像,将所有计算得到的图像可视域面状图形都存储于图像数据库空间字段中,然后根据图像可视域面状图形的分布确定索引边界、分割索引区域空间,并基于分割区域与图像可视域面状图形的空间关系确定索引坐标,从而实现图像可视域面状图形的空间索引。
区别于现有技术,本发明实施例一通过解析可定位图像EXIF头文件中的参数标记,提取出参数信息;充分利用镜头焦距、水平可视角度、放大倍率、GPS定位信息、方位信息参数构建镜头视角范围模型,计算出图像可视域面状范围;根据图像可视域面状图形的分布确定索引边界、分割索引区域空间,并确定索引坐标,以此建立图像索引。通过上述方式,本发明充分利用参数信息建立图像可视域模型,用面状图形代替传统的点图形,更真实反应图像在真实场景中的所覆盖的区域。
在上述索引设置方法的基础上,本发明实施例二还提供一种基于可视域的图像检索方法,包括以下步骤:
S21:在地图上选取图像检索区域;
S22:获取检索区域与索引区域相交的索引区域块;
S23:根据图像可视域与索引区域块的索引关系,筛选出相交区域块内的图像集合,以作为初级过滤结果集;
S24:遍历初级过滤结果集中的图像,获取目标结果图像。
具体地,在检索时,本发明可通过在电子地图上框选图像检索区域,通过检索区域与步骤S14中建立的空间索引区域块进行相交判断,获取与检索区域相交的索引区域块。根据图像可视域与索引区域块之间的索引关系,快速筛选出相交区域块内的图像集合作为初级过滤结果集。
针对初级过滤结果集中的图像,逐一判断图像的可视域是否与检索范围相交。如果不相交,则将图像剔除;如果相交,则确定该图像为目标结果图像,并加入到图像检索结果集中,直到相交网格内索引的全部图像都判断完毕后,最终将检索到图像集返回给用户。
区别于现有技术,本发明实施例二通过对可视域面状图形的空间索引,进而在GIS技术支持下实现图像高效、精确检索。通过上述方式,本发明基于可视域的图像检索方法,除了可检索到检索区域内拍摄的图像外,还可以检索到拍摄位置在检索范围外,但其图像实际场景在检索范围内的图像,使得图像检索结果更精确,同时其检索方式更符合人们的实际需求。
承上,本发明实施例三提供一种基于可视域的图像索引设置系统,包括:
解析提取模块,用于解析可定位图像EXIF头文件中的参数标记,提取出参数信息;
构建计算模块,用于根据所述参数信息构建镜头视角范围模型,并计算出图像可视域面状范围;
存储模块,用于存储图像可视域面状图形到图像数据库空间字段中;
图像索引模块,用于根据图像可视域面状图形的分布确定索引边界、分割索引区域空间,并确定索引坐标系统。
以下结合具体实施例对本发明所述的设置方法、系统及检索方法的原理进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
请一并参阅图1~图13,本发明的具体实施例所述的是一种基于二维可视域的图像索引与检索方法,其图像可采用Android手机拍摄的一组可定位图像,图像采集方式为现有技术公知的手段获取;图像可视域采用SkyLine TerraExplorer Developer API开发包所提供的方法进行构建;图像可视域采用SQL Server 2008数据库软件提供的多级网格进行空间索引,其具体步骤如下:
1、从可定位图像集中提取一幅图像,其图像参数如图6所示,通过解析其EXIF头文件参数信息可得:例如图像拍摄位置的GPS经纬度值为(E119.206,N 26.028)、拍摄方位为91°,初始水平可视视角为57.6°、数码变焦倍数为1.5倍、焦距为3.9mm;
2、通过步骤1中提取的参数构建镜头的二维视角范围模型,其视点、镜头朝向、可视角度、拍摄距离参数值计算过程如下:
1)视点:将步骤1中获取的图像拍摄位置的GPS经纬度值(E 119.206,N 26.028)作为视点;
2)镜头朝向:将步骤1获取的图像拍摄方位91°作为视角中心的朝向;
3)可视角度:由于图像放大倍率值为1.5,说明该图像是采用变焦方式拍摄的。因此,首先根据步骤1获取的镜头初始水平可视角度、焦距值代入公式1可得镜头感光元件宽度值为4.29mm,然后将计算得到感光元件宽度值与变焦倍数值代入公式2可得该变焦图像感光元件成像实际宽度值为2.86mm,最后将计算得到的变焦图像感光元件成像实际宽度、焦距值代入公式1得到变焦图像的水平可视角度为40.27°。
根据公式1计算感光元件宽度可得:
根据公式2计算该变焦图像感光元件成像实际宽度值可得:
根据公式1计算该变焦图像水平可视角度可得:
4)可视距离:本例中以1米宽度的物体在图像中清晰成像至少其成像宽度占整幅图像宽度的2%为限,在此条件下计算图像的可视距离。将物体实际宽度、占图幅的比例、镜头焦距以及步骤3)中计算出感光元件宽度值代入公式4计算该图像的可视距离为45.5m。
根据公式3计算图像可视距离可得:
3、基于步骤2计算得到的视点、镜头朝向、镜头焦距、可视距离值构建图像可视范围,并将得到的图像可视范围与图像所在区域的三维地形模型进行求交得到图像可视域,最终将计算得到的图像可视域存储在SQL Server 2008数据库中。具体步骤如下:
1)图像可视范围构建:利用Skyline TerraExplorer Developer API提供的CreatePosition方法构建图像可视范围,CreatePosition函数原型为CreatePosition(X,Y,Altitude,AltitudeTypeCode,Yaw,Pitch,Roll,Distance),其中X代表经度,Y代表纬度(Y),Altitude代表高程,AltitudeTypeCode代表海拔类型,Yaw代表方位角,Pitch代表俯仰角,Roll代表翻滚角,Distance代表可视距离,在本例中X设置为119.206,Y设置为26.028,设置Altitude为0,AltitudeTypeCode采用相对高度类型,设置为0,Yaw设置为91,Pitch设置0,Roll设置为0,Distance设置为45.5,构建的图像二维可视范围如图7所示。
2)图像可视域构建:在本例采用三维场景模型与图像可视范围进行求交计算获取图像可视域,图像可视域计算采用Skyline TerraExplorer Developer API提供的CreateViewshed方法进行获取,CreateViewshed函数原型为CreateViewshed(ViewerPosition,FieldOfView,SampleInterval,RaySpacing,TargetHeightAboveGround,TimeStart,TimeEnd,GroupID,Description),其中ViewerPosition代表计算视点位置,FieldOfView代表可视角度,SampleInterva代表采样间隔,RaySpacing代表采样角度间隔,TargetHeightAboveGround代表目标高度,TimeStart代表分析开始时间,TimeEnd代表代表分析结束时间,GroupID代表模型组ID,Description代表可视域描述,在本例中ViewerPosition设置为步骤1)中获取的图像可视范围对象,FieldOfView设置为40.27,SampleInterva设置为2,RaySpacing设置为1,TargetHeightAboveGround设置为0,TimeStart设置为null,TimeEnd设置为null,GroupID设置为空,Description设置为空,计算得到的图像可视域如图8所示。
3)图像可视域存储:在SQL Server 2008数据库创建图像数据表,其数据结构如表1所示,其中将步骤2)计算得到的图像可视域以OGC(Open Geospatial Consortium,开放地理空间联盟)定义的WKT(Well-Known Text)文本形式存储在空间字段中,如本例中的图像可视域采用polygon(经度1纬度1,经度2纬度2,……,经度n纬度n,经度1纬度1)方式存储,其中经度、纬度值为构成面域的点坐标。
表1 图像数据表结构
4、重复以上步骤1,2,3将图像集中所有图像按上述方式计算图像可视域,并将结果存储于空间字段中。所有图像处理完毕后,采用多级网格对该空间字段中存储的所有面状图形建立空间索引,其空间索引流程如图9所示,具体步骤如下:
1)索引范围的确定:遍历图像数据库表空间字段,计算出所有图像可视域面状数据的空间坐标范围作为网格划分的边界,同时将索引空间范围坐标值记录在空间系统表(即多级网格空间索引表)中,多级网格空间索引表结构如表2所示,其中经度最小值存在Bounding_box_xmin字段中,经度最大值存储在Bounding_box_xmax字段中,纬度最小值存储在Bounding_box_ymin字段中,纬度最大值存储在Bounding_box_ymax字段中。
2)空间网格划分:根据步骤1)中计算得到的空间索引范围区域,本例中采用四层嵌套网格结构进行索引管理,每级单元又以4×4网格方式进行空间区域划分,空间网格划分示意图如图10所示,同时将网格相应参数值存储在空间系统表中,其中各个级别的网格密度存储在的Level_1_grid、Level_2_grid、Level_3_grid、Level_4_grid字段中,本例中其数值为16;各个级别网格描述信息存储在Level_1_grid_desc,Level_2_grid_desc,Level_3_grid_desc,Level_4_grid_desc字段中;网格划分方式存储在Tessellation_scheme字段中,即4×4网格划分方式;空间对象最大分割单元数存储在Cell_per_object字段中,本例中其数值为16。
应当理解的是,图像可视域的空间索引除了采用多级网格索引外,还可采用四叉树、R树等空间索引。
表2 多级网格空间索引表
3)对象分割与定位:从图像数据库空间字段中读取出一个图像可视域面状对象,然后以“广度优先”方式从第一级网格开始逐一判断网格与对象是否接触,如果对象覆盖了整个接触格网,则该对象不必进行分割,结束索引并返回该对象在网格中的坐标位置存储于空间索引表中,如图10中可视域对象1所示;如果该对象包含在接触网格中,则继续分割对象直到达到限制或不再有要计数单元的单元为止,如图9中可视域对象2所示,该对象一直被分割到第四级网格,由于达到了网格最低级别则结束对象分割,返回该对象的索引坐标11.11.11.1、11.11.11.2、11.11.11.3、11.11.11.4并存储在空间索引表中,空间索引表结构如表3所示。重复此步骤,直到图像数据库中所有可视域面状数据索引完毕。
表3 空间索引表
4)空间坐标索引:采用B树索引对空间索引表中的图像可视域的索引坐标信息进行组织,具体索引组织结构如图11所示,实现图像可视域面状数据的空间索引的创建。
6、在电子地图上框选图像检索区域,通过判断该图像检索区域与图像可视域面状数据的空间位置关系,实现该区域内图像集的快速检索,其检索具体流程如图12所示,具体步骤如下:
1)获取用户在电子地图上框选的检索范围,检索范围如图13中方框区域,其左上角坐标为(119.205,26.031),右下角坐标为(119.209,26.028);
2)采用SQL内置STIntersects()方法对多级网格空间索引表中记录进行遍历,获取与空间检索范围相接触的网格,并根据索引坐标检索出网格内的所有图像可视域面状对象作为初步检索结果集合;
3)遍历步骤2)得到的初步检索结果集合,逐一判断图像可视域面状对象是否与检索范围是否有接触,如果未接触,说明该面状对象未在检索范围中,则将该面状对象对应的图像从结果集中剔除,如果存在接触,则在初步图像结果集中保留。当所有对象处理完毕后,返回最终的图像集合给用户。如图13所示,图中方框为用户指定的检索区域,在该区域中总共检索到6幅图像。从检索到的图像位置来看,其中图像1、图像3、图像5、图像6虽然拍摄位置在检索区域外,但是其图像中的实际场景仍在检索区域内,符合用户检索的需求,但是按传统直接以视点查询的方式无法检索到图像1、图像3、图像5、图像6,因此基于可视域的图像检索方法能更精确的检索到用户所需的图像。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种基于可视域的图像索引设置方法,其特征在于,包括:
解析可定位图像EXIF头文件中的参数标记,提取出参数信息;
根据所述参数信息构建镜头视角范围模型,并计算出图像可视域面状图形范围;
存储图像可视域面状图形到图像数据库空间字段中;
根据图像可视域面状图形的分布确定索引边界、分割索引区域空间,并确定索引坐标;其中,所述参数信息包括镜头焦距、镜头水平可视角度、GPS定位信息、方位信息;所述图像可视域面状图形范围由包括视点位置、视角朝向、可视角度、可视距离在内的参数决定。
2.根据权利要求1所述的基于可视域的图像索引设置方法,其特征在于,
以GPS定位信息作为图像视点位置;
以方位信息作为图像视角朝向;
根据对焦方式,确定图像可视角度;
通过单位尺寸的物体宽度所占图幅宽度的比例,利用感光元件成像宽度、镜头焦距,计算图像可视距离。
3.根据权利要求2所述的基于可视域的图像索引设置方法,其特征在于,根据对焦方式,确定图像可视角度的步骤具体为:
若图像是通过定焦方式拍摄,则以镜头水平可视角度作为图像可视角度;
若图像不是通过定焦方式拍摄,则通过镜头焦距、感光元件宽度、放大倍率计算图像可视角度。
4.根据权利要求1所述的基于可视域的图像索引设置方法,其特征在于,存储图像可视域面状图形到图像数据库空间字段中的步骤具体为:
若图像可视域面状图形范围区域具有二维矢量或三维场景数据,则将镜头视角范围模型与二维矢量或三维场景数据进行求交计算,获得图像可视域面状图形;并存储图像可视域面状图形到图像数据库空间字段中;
若图像可视域面状图形范围区域不具有二维矢量和三维场景数据,则存储图像可视域面状图形到图像数据库空间字段中。
5.根据权利要求1所述的基于可视域的图像索引设置方法,其特征在于,根据图像可视域面状图形的分布确定索引边界、分割索引区域空间,并确定索引坐标具体为:
根据所有图像的可视域面状图形的分布确定索引边界、分割索引区域空间,并基于分割区域与图像可视域面状图形的空间关系确定索引坐标。
6.一种基于可视域的图像检索方法,适用于根据权利要求1-5所述的图像索引设置方法形成的检索系统,其特征在于,包括以下步骤:
在地图上选取图像检索区域;
获取检索区域与索引区域相交的索引区域块;
根据图像可视域与索引区域块的索引关系,筛选出相交区域块内的图像集合,以作为初级过滤结果集;
遍历初级过滤结果集中的图像,获取目标结果图像。
7.根据权利要求6所述的基于可视域的图像检索方法,其特征在于,遍历初级过滤结果集中的图像,获取目标结果图像具体为:
逐一判断初级过滤结果集中的图像可视域是否与索引区域相交;
若是,则确定所述初级过滤结果集中的图像为目标结果图像;
反之,则剔除所述初级过滤结果集中的图像。
8.根据权利要求7所述基于可视域的图像检索的方法,其特征在于,确定所述初级过滤结果集中的图像为目标结果图像之后,还包括:
将所述目标结果图像加入到图像检索结果集中,并返回数据。
9.一种基于可视域的图像索引设置系统,其特征在于,包括:
解析提取模块,用于解析可定位图像EXIF头文件中的参数标记,提取出参数信息;所述参数信息包括镜头焦距、镜头水平可视角度、GPS定位信息、方位信息;
构建计算模块,用于根据所述参数信息构建镜头视角范围模型,并计算出图像可视域面状图形范围;所述图像可视域面状图形范围由包括视点位置、视角朝向、可视角度、可视距离在内的参数决定;
存储模块,用于存储图像可视域面状图形到图像数据库空间字段中;
图像索引模块,用于根据图像可视域面状图形的分布确定索引边界、分割索引区域空间,并确定索引坐标系统。
CN201510793976.3A 2015-11-18 2015-11-18 一种基于可视域的图像索引设置方法、系统及检索方法 Active CN105389375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510793976.3A CN105389375B (zh) 2015-11-18 2015-11-18 一种基于可视域的图像索引设置方法、系统及检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510793976.3A CN105389375B (zh) 2015-11-18 2015-11-18 一种基于可视域的图像索引设置方法、系统及检索方法

Publications (2)

Publication Number Publication Date
CN105389375A CN105389375A (zh) 2016-03-09
CN105389375B true CN105389375B (zh) 2018-10-02

Family

ID=55421665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510793976.3A Active CN105389375B (zh) 2015-11-18 2015-11-18 一种基于可视域的图像索引设置方法、系统及检索方法

Country Status (1)

Country Link
CN (1) CN105389375B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10311330B2 (en) * 2016-08-17 2019-06-04 International Business Machines Corporation Proactive input selection for improved image analysis and/or processing workflows
US10579741B2 (en) 2016-08-17 2020-03-03 International Business Machines Corporation Proactive input selection for improved machine translation
CN106446153A (zh) * 2016-09-21 2017-02-22 广州特道信息科技有限公司 一种分布式newSQL数据库系统及方法
CN108090092B (zh) * 2016-11-23 2021-11-19 中国移动通信有限公司研究院 一种数据处理方法及其系统
CN107205124A (zh) * 2017-06-28 2017-09-26 高感(北京)科技有限公司 一种多镜头倾斜摄影设备及方法
CN107577790A (zh) * 2017-09-18 2018-01-12 北京金山安全软件有限公司 一种图像搜索方法及装置
CN108287924A (zh) * 2018-02-28 2018-07-17 福建师范大学 一种可定位视频数据采集与组织检索方法
CN110059101B (zh) * 2019-04-16 2021-08-13 北京科基中意软件开发有限公司 一种基于图像识别的车辆数据查找系统和查找方法
CN111026708B (zh) * 2019-11-25 2023-04-14 烟台艾睿光电科技有限公司 一种热像仪图像文件的存储方法、装置、设备及存储介质
CN113362392B (zh) * 2020-03-05 2024-04-23 杭州海康威视数字技术股份有限公司 可视域生成方法、装置、计算设备及存储介质
CN112966164A (zh) * 2021-05-19 2021-06-15 航天宏图信息技术股份有限公司 一种用于海量遥感影像目标提取的快速定位方法及装置
CN113920144B (zh) * 2021-09-30 2022-09-13 广东省国土资源测绘院 一种实景照片地面视域分析方法及系统
CN117576333B (zh) * 2024-01-15 2024-05-07 苍穹数码技术股份有限公司 可视域的确定方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542523A (zh) * 2011-12-28 2012-07-04 天津大学 一种基于街景的城市图片信息认证方法
CN104717462A (zh) * 2014-01-03 2015-06-17 杭州海康威视系统技术有限公司 监控录像视频的提取方法及其装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542523A (zh) * 2011-12-28 2012-07-04 天津大学 一种基于街景的城市图片信息认证方法
CN104717462A (zh) * 2014-01-03 2015-06-17 杭州海康威视系统技术有限公司 监控录像视频的提取方法及其装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Exchangeable image file format for digital still cameras:Exif version 2.2;Jeita CP-3451;《Japan Electronics and Information Technology Industries Association》;20021231;第1-72页 *
可定位图像移动采集系统设计;吴勇等;《测绘通报》;20141231(第4期);第74-78页 *
可定位图像采集与检索方法研究;吴勇等;《计算机工程》;20140731;第40卷(第7期);第207-211页 *

Also Published As

Publication number Publication date
CN105389375A (zh) 2016-03-09

Similar Documents

Publication Publication Date Title
CN105389375B (zh) 一种基于可视域的图像索引设置方法、系统及检索方法
CN111144388B (zh) 一种基于单目影像的道路标志标线的更新方法
CN104966270B (zh) 一种多图像拼接方法
CN108919944A (zh) 一种基于数字城市模型实现在显示端进行数据无损交互的虚拟漫游方法
CN108287924A (zh) 一种可定位视频数据采集与组织检索方法
CN107170033A (zh) 基于激光雷达技术的智慧城市3d实景地图系统
CN103530881A (zh) 适用于移动终端的户外增强现实无标志点跟踪注册方法
CN108765538B (zh) 基于cad平台的osgb数据分级渲染的方法
CN105005580B (zh) 一种用于显示水库地形的方法及其装置
CN110660125B (zh) 用于电力配网系统的三维建模装置
Epshtein et al. Hierarchical photo organization using geo-relevance
CN108537887A (zh) 基于3d打印的草图与模型库三维视图匹配方法
Tarini et al. Marching Intersections: An Efficient Approach to Shape-from-Silhouette.
Zhang et al. Research on 3D architectural scenes construction technology based on augmented reality
KR20020068151A (ko) 수치사진측량 시스템
CN110659369A (zh) 在轨高精度轻量化全球影像控制点数据库构建方法及系统
CN112527916A (zh) 一种基于遥感影像的网格可视化定义与智能特征分析方法
CN117315146B (zh) 基于跨尺度多源数据的三维模型的重建方法及存储方法
CN114202610A (zh) 一种倾斜摄影建筑物单体化模型纹理映射方法
CN110348351A (zh) 一种图像语义分割的方法、终端和可读存储介质
CN110378995A (zh) 一种利用投射特征进行三维空间建模的方法
Adorjan Opensfm: A collaborative structure-from-motion system
CN116051980B (zh) 基于倾斜摄影的建筑识别方法、系统、电子设备及介质
Firdaus et al. Comparisons of the three-dimensional model reconstructed using MicMac, PIX4D mapper and Photoscan Pro
CN113362458B (zh) 模拟多视角成像的三维模型解译方法、终端及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant