CN118154858A - 基于数字实景模型的兴趣点提取方法、装置、介质及系统 - Google Patents
基于数字实景模型的兴趣点提取方法、装置、介质及系统 Download PDFInfo
- Publication number
- CN118154858A CN118154858A CN202410584735.7A CN202410584735A CN118154858A CN 118154858 A CN118154858 A CN 118154858A CN 202410584735 A CN202410584735 A CN 202410584735A CN 118154858 A CN118154858 A CN 118154858A
- Authority
- CN
- China
- Prior art keywords
- interest
- live
- picture
- digital
- positioning information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000004140 cleaning Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 2
- 230000008030 elimination Effects 0.000 claims description 2
- 238000003379 elimination reaction Methods 0.000 claims description 2
- 238000003709 image segmentation Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 235000012054 meals Nutrition 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- ORWQBKPSGDRPPA-UHFFFAOYSA-N 3-[2-[ethyl(methyl)amino]ethyl]-1h-indol-4-ol Chemical compound C1=CC(O)=C2C(CCN(C)CC)=CNC2=C1 ORWQBKPSGDRPPA-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101150061388 LON1 gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052792 caesium Inorganic materials 0.000 description 1
- TVFDJXOCXUVLDH-UHFFFAOYSA-N caesium atom Chemical compound [Cs] TVFDJXOCXUVLDH-UHFFFAOYSA-N 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 238000003707 image sharpening Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 101150004293 lon2 gene Proteins 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明属于图像兴趣点提取领域,为解决兴趣点提取技术存在效率低,数据完整性欠缺且数据质量差的问题,提供了一种基于数字实景模型的兴趣点提取方法、装置、介质及系统。其中,基于数字实景模型的兴趣点提取方法包括对各张带定位信息的图片进行分割处理,得到包含独立的兴趣目标图片;再将独立的兴趣目标图片进行坐标校准,得到独立的兴趣目标图片序列;依次对独立的兴趣目标图片序列中的每张图片进行文字识别,得到对应兴趣目标名称,再将兴趣目标名称与其对应定位信息组合成记录对,生成兴趣点初始提取信息集合,清洗后得到最终的兴趣点提取信息集合,以结合定位信息与实景地图进行关联,其能够提取出完整且干净的兴趣点文本信息。
Description
技术领域
本发明属于图像兴趣点提取领域,尤其涉及一种基于数字实景模型的兴趣点提取方法、装置、介质及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
兴趣点提取POI(Point-of-Interest)对于图像中的对象识别、导航、推荐等领域有着极高的应用价值。例如,以经纬度、商户名称为主的商业POI(Point-of-Interest)旨在从三维世界场景中提取出对人类最有用的结构化文本地理信息。受限于现实世界的空间规模之大和人工收集真实场景数据极高的复杂程度,完整、干净的兴趣点提取数据很难从现实的世界中高效地提取出来。
现有的兴趣点提取技术包含web网页爬虫、人工收集及社交媒体共享这三类。其中web网页爬虫方案以尽可能多地爬取网页相关数据为目的,数据来源可靠性差并且完整性不足;人工收集方案存在于大型地图服务商,以汽车等交通工具为载体用“扫街”的方式采集兴趣点提取原始数据,人力和时间成本极高;社交媒体共享方案是在社交媒体发展迅速的环境下,借助每一个利用定位功能的人之手,对其上传的图片或文字加以分析和处理,得到与位置绑定的兴趣点提取信息的方案,不仅具有完整性欠缺的问题,还存在着数据质量不可保证的难点。
发明内容
为了解决上述兴趣点提取技术存在效率低,数据完整性欠缺且数据质量差的问题,本发明提供一种基于数字实景模型的兴趣点提取方法、装置、介质及系统,其能够提取出完整且干净的兴趣点文本信息。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供了一种基于数字实景模型的兴趣点提取方法。
在一个或多个实施例中,提供了一种基于数字实景模型的兴趣点提取方法,包括:
获取设定区域实景对应的数字实景模型,基于预设路径对数字实景模型进行虚拟导航,并从中捕获设定区域实景内所有兴趣目标的带定位信息的图片;其中,每张带定位信息的图片中至少包含一个兴趣目标;
对各张带定位信息的图片进行分割处理,得到包含独立的兴趣目标图片;再将独立的兴趣目标图片进行坐标校准,得到独立的兴趣目标图片序列;
依次对独立的兴趣目标图片序列中的每张图片进行文字识别,得到对应兴趣目标名称,再将兴趣目标名称与其对应定位信息组合成记录对,生成兴趣点初始提取信息集合;
对兴趣点初始提取信息集合内的记录对进行清洗,得到最终的兴趣点提取信息集合,以结合定位信息与实景地图进行关联。
本发明的第二个方面提供了一种基于数字实景模型的兴趣点提取装置。
一种基于数字实景模型的兴趣点提取装置,包括:
图片捕获模块,其用于获取设定区域实景对应的数字实景模型,基于预设路径对数字实景模型进行虚拟导航,并从中捕获设定区域实景内所有兴趣目标的带定位信息的图片;其中,每张带定位信息的图片中至少包含一个兴趣目标;
图片分割模块,其用于对各张带定位信息的图片进行分割处理,得到包含独立的兴趣目标图片;再将独立的兴趣目标图片进行坐标校准,得到独立的兴趣目标图片序列;
文字识别模块,其用于依次对独立的兴趣目标图片序列中的每张图片进行文字识别,得到对应兴趣目标名称,再将兴趣目标名称与其对应定位信息组合成记录对,生成兴趣点初始提取信息集合;
信息清洗模块,其用于对兴趣点初始提取信息集合内的记录对进行清洗,得到最终的兴趣点提取信息集合,以结合定位信息与实景地图进行关联。
本发明的第三个方面提供了一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于数字实景模型的兴趣点提取方法中的步骤。
本发明的第四个方面提供了一种导航系统。
一种导航系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于数字实景模型的兴趣点提取方法中的步骤。
与现有技术相比,本发明的有益效果是:
本发明基于预设路径对实景设定范围内对应的数字实景模型进行虚拟导航,从数字实景模型中捕获对应实景设定范围内所有兴趣目标的带定位信息的图片,使得数据来源可靠;本发明对各张带定位信息的图片进行分割处理、坐标校准和文字识别,从而得到对应兴趣目标名称并与其对应定位信息组合,生成兴趣点初始提取信息集合,再进行清洗,实现了兴趣点的自动提取,而且提取的兴趣点文本信息完整且干净;而且本发明得到的最终兴趣点提取信息集合,还根据定位信息与实景地图进行关联,可应用于对导航或推荐等领域。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例的一种导航系统的示意图;
图2是本发明实施例的基于数字实景模型的兴趣点提取方法的流程示意图;
图3是本发明实施例的基于数字实景模型的兴趣点提取过程示例图;
图4是本发明实施例的提示词模板;
图5是本发明的最终兴趣点提取信息与公共兴趣点提取信息的F1指标对比;
图6是本发明实施例的基于数字实景模型的兴趣点提取装置结构示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
参照图1,给出一种导航系统的示意图。需要说明的是,图1示出的导航系统100仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图1所示,导航系统100包括中央处理单元(CPU)101,其可以根据存储在只读存储器(ROM)102中的程序或者从存储部分108加载到随机访问存储器(RAM)103中的程序而执行各种适当的动作和处理。在RAM 103中,还存储有系统操作所需的各种程序和数据。中央处理单元 101、ROM 102以及RAM 103通过总线104彼此相连。输入/输出(I/O)接口105也连接至总线104。
以下部件连接至I/O接口105:包括键盘、鼠标等的输入部分106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分107;包括硬盘等的存储部分108;以及包括诸如局域网(LAN)卡、调制解调器等的网络接口卡的通信部分109。通信部分109经由诸如因特网的网络执行通信处理。驱动器110也根据需要连接至I/O接口105。可拆卸介质111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器110上,以便于从其上读出的计算机程序根据需要被安装入存储部分108。
本实施例的导航系统中的中央处理单元 101执行所述程序时实现如图2所示的基于数字实景模型的兴趣点提取方法中的步骤。
本发明的兴趣目标可为实景中的任意人为设定的目标,比如店铺、信号灯、电线杆等。
下面以兴趣目标为店铺为例来结合附图详细描述基于数字实景模型的兴趣点提取方法的具体实施过程。
图2是本发明实施例中一种基于数字实景模型的兴趣点提取方法的流程示意图,如图2所示的本实施例中的基于数字实景模型的兴趣点提取方法可以包括:
S201,从数字实景模型中捕获对应实景设定范围内所有兴趣目标(如,店铺)的带定位信息的图片;其中,每张带定位信息的图片中至少包含一个兴趣目标(如,店铺)。
此处的定位信息可采用WGS84坐标系的经纬度和高度来表征。
在步骤S201中,基于预设路径对数字实景模型进行虚拟导航,并从中捕获设定区域实景内所有兴趣目标的带定位信息的图片的过程为:
S2011,将数字实景模型加载到虚幻引擎中,为数字实景模型中每条道路铺设线条。
S2012,在虚幻引擎中设置分别朝向道路两旁且保持设定高度的虚拟相机,使其以设定倾斜角度沿铺设线条自动导航,以捕获道路两旁的兴趣目标。
当兴趣目标为店铺时,基于预设路径对数字实景模型进行虚拟导航,并从中捕获设定区域实景内所有兴趣目标的带定位信息的图片的过程为:
将输入的3dtiles数字城市模型加载到虚幻引擎中,使用虚幻引擎中的“Spline工具”为每条道路铺设线条,使得任何虚拟相机可以沿此路线自动导航。
在虚幻引擎中,虚拟相机保持设定高度,其目标是让操作者可以看到所有街道的俯视图,并以一个设定倾斜角度看到其侧面的商店。
在虚幻引擎中,虚拟相机的数量为两个且夹角为180度,分别朝向道路两旁。这样,当沿着路径导航时,虚拟相机可以同时捕捉到两侧的场景图像。针对路两旁出现树木遮挡的情况,可以根据虚幻引擎中的Cesium for Unreal插件的特性,在线条道路铺设时穿过树木,使得在虚拟相机沿轨迹移动时可以透过树木看到正常的画面,而忽略树木的边界。
在具体实施过程中,首先在虚幻引擎中的路线铺设模块中设置一组样条线实例splines、两个摄像机实例left C和right C、当前地理参考geo和预渲染等待时间t wait。为了获得最佳的捕捉效果,左右两虚拟相机均使用“Render Target”子组件l和r来完成捕捉和渲染任务。预渲染等待时间t wait设置为10s,以等待引擎加载当前样条路线s周围的倾斜切片模型。接下来,设置一个频率为 1.5 秒的计时器来执行“DelegateCapture”委托,负责自动收集街景图片的原子操作实施。
具体来说,委托首先通过当前的左或右虚拟相机的渲染组件捕捉并渲染一张图片,然后将其存储到变量img中。然后,它会确定当前相机是l还是r,并借助当前坐标系变量geo获取当前坐标,并添加一个表示方向的字符。最后,使用一个特殊的文件名Cord来存储这个图像img。在主进程中,我们只需要遍历每个路线s,并且在导航开始之前暂停委托t wait的时间,以等待场景加载。最后,执行委托“DelegateCapture”,让虚拟相机将沿路线s导航。
执行结束后,将会生成一个街景图片数据集,每一张的文件名Cord都以拍摄时虚拟相机的经纬度、虚拟相机代号(l或r)、世界角度、高度几个信息的整合命名,并且每张图片都包含了一个或多个有效的店招信息。
结合图3,步骤S201为捕获阶段,其接收3dtiles格式的数字实景模型(即倾斜模型)输入,在数字场景中得到指定范围内所有兴趣点(比如店铺)的带定位的街景图片,例如,以“117.www, 36.www_90r179.jpg”命名,包含了经纬度、虚拟相机角度、虚拟相机代号和高度信息。
S202,对各张带定位信息的图片进行分割处理,得到包含独立的兴趣目标图片;再将独立的兴趣目标图片进行坐标校准,得到独立的兴趣目标图片序列。
步骤S202为分割阶段,当兴趣目标为店铺时,由于每个店招(即店铺的招牌)的大小不同,很难保证每张图片只有一个独立的店招信息。此外,由于一般的文字识别方法只能识别从上到下、从左到右的字符,而缺乏实体层面的感知,无法准确地将每条识别结果独立出来。因此,需要将每幅图像分割成几个部分,其中每个部分只包含一个店招。
在本实施例中,利用标注工具,在若干张(比如2000张)图像数据集上做标注,将每张图片中的招牌使用矩形框圈出来。将带有标注的数据集放入先进的图像识别AI模型中训练,得到一个只检测独立店招的AI模型(比如:CNN、YOLOv系列等神经网络模型)。最后,将每一个独立店招从原始图片中分割出来。
将分割得到的每一个独立店招图片的经纬度进行校准,使得坐标更贴近与真实店招的地理位置,否则,每张原始图片分割得到的独立店招切片都有相同的地理位置,且为拍摄时虚拟相机的位置。
在具体实施过程中,对各张带定位信息的图片进行分割处理时,同步对每个兴趣点中心位置进行深度估计,并对其进行校正,得到校正后的兴趣点中心位置的深度值。
采用单目深度估计技术,借助AI深度估计模型,在分割时同步进行每一个店招中心位置的深度估计。利用每个兴趣点中心位置的深度估计值与实际深度值之间的拟合曲线,对每个兴趣点中心位置的深度估计值进行校正。
例如,兴趣点中心位置的深度估计值与实际深度值之间的拟合曲线如下:
Depth_real = 1.08depth-0.3;
其中,depth是深度估计模型得到的深度值,Depth_real是校正后的深度值。
在其他实施例中,兴趣点中心位置的深度估计值与实际深度值之间的拟合曲线中的参数可根据实际拟合情况来具体拟合得到。
在一个或多个实施例中,利用校正后的兴趣点中心位置的深度值来对独立的兴趣目标图片进行坐标校准。
在一些具体实施例中,利用校正后的兴趣点中心位置的深度值、单位转换的偏差因子与图片捕获装置的位置信息三者的乘积来补偿校正独立的兴趣目标图片的原始坐标。
例如,每个店招中心的地理位置通过以下公式校准:
式中,lon1、lon2、lai1、lai2为经纬度校准的中间结果变量;和为校准后最终得到的新经度和维度;f为方向变量,若当前图片使用左虚拟相机拍摄,则f为1;若使用右虚拟相机拍摄,则f为-1;r为拍摄角度对应的弧度;Depth_real是校正后的深度值;s为“经纬度”和“米”转换的偏差因子,例如分别设置为5*10-5和4*10-5;coord.lon和coord.lai分别为原始图片的经度和纬度;off为店招中心店在整个图片中的相对距离,width为原始图片的宽度;x为当前店招的中心横坐标。
S203,依次对独立的兴趣目标图片序列中的每张图片进行文字识别,得到对应兴趣目标名称,再将兴趣目标名称与其对应定位信息组合成记录对,生成兴趣点初始提取信息集合。
该步骤为识别阶段。由于虚幻引擎中采集到的图片与真实世界的图片有一定的差异,直接使用现有AI文字识别模型对独立的兴趣目标图片序列进行识别的效果不佳,需要对其进行初步处理,并对AI文字识别模型做此场景下数据集的微调。
利用一个预设锐化系数的图像锐化滤波器中,对独立的兴趣目标图片序列进行预处理,使其尽可能地突出店招切片中的文字部分;
AI文字识别模型可为中英文文字识别AI模型,在单独标记出的若干张(如5000张)文字识别数据集上进行微调,使其能够适应虚幻引擎场景图片的识别;利用AI文字识别模型对锐化处理后的图片做识别,在本实例中输出“COLOUR”、“金磨坊超级牛躺饭 电话876543奥体路店”、“鲁”三个结果,同样以定位信息中的经纬度、高度命名。
最终生成一个json格式文件,其中每个元素是“经纬度_高度”与“店名”组合成的记录对,也就是未经清洗的兴趣点初始提取信息集合。
S204,对兴趣点初始提取信息集合内的记录对进行清洗,得到最终的兴趣点提取信息集合,以结合定位信息与实景地图进行关联。
步骤S204为清洗阶段,在步骤S204中,对兴趣点初始提取信息集合内的记录对进行清洗的过程为:
S2041,从兴趣点初始提取信息集合中进行实体抽取,得到仅包含兴趣点名称(比如,店名)的数据集。
其中,S2041的目的是兴趣点名称(比如,店名)属性中最关键的实体抽取出来,去掉冗余信息。
在一些具体实施例中,可采用AI文本生成语言模型作为实体抽取的模型,在若干个公共数据集上对AI文本生成语言模型进行参数微调;
具体地,对S203识别阶段的输出文本进行加权抽取,“金磨坊超级牛躺饭 电话876543奥体路店”中后半不需要的部分即可被去除,得到“金磨坊超级牛躺饭”,再利用本发明技术方案中的思维链提示词,让AI文本生成语言模型(比如GPT4、GPT3.5、Baichuan2-13B)进行实体清洗,去除冗余、无意义的部分,并对可能识别错误的字符作修正,“金磨坊超级牛躺饭”中的错误识别字“躺”便可以修正为“腩”,而无意义的“鲁”会被直接忽略。最终通过微调后的AI文本生成语言模型生成一个仅包含店招核心名称的数据集。
S2042,将仅包含兴趣点名称的数据集中的各个名称与现实世界中的实体名称进行比对,根据两者的相似性进行名称修正或剔除,得到清洗后的仅包含兴趣点名称的数据集。
在本实施例中,利用AI大语言模型(LLM)进行实体清洗。
在应用AI大语言模型(LLM)进行实体清洗的过程中,采用如下两条基本规则:
(1)如果一条记录与现实世界中的实体标志名称相似,但有一些“错别字”,则将其改为最相似的;
(2)如果一条记录与现实世界中的实体标志名称完全不相似,则用空格替换。
其中,在AI大语言模型(LLM)内部,可根据两个名称对应向量的距离来判断表征相似性,例如,若两个名称的向量距离大于第一预设阈值,则判断两个名称完全不相似;若两个名称的向量距离小于第二预设阈值,则判断两个名称相似。其中,第一预设阈值大于第二预设阈值。第一预设阈值和第二预设阈值均可根据实际情况来人为设置。
S2043,将清洗后的仅包含兴趣点名称的数据集中的各个名称与其对应定位信息再组合成记录对,得到最终的兴趣点提取信息集合。
最终,将清理结果整理为记录对集合,每一对记录都是实体名称和地理位置的绑定。具体提示词模板如图4所示。提示词的设计包含Context上下文部分,Task任务描述部分,Output Format输出格式部分,Examples示例部分,Request需要实际处理数据的描述部分。在Examples示例部分中,采用当前提示词工程领域流行的“few-shot”的策略:即提供大于一个的少量样例供AI模型学习。并且为了方便对结果后处理,使其更可能地满足大规模工业化用途,“Output Format”即输出格式方面进行了自然语言和正则表达式的双重描述,同时在最后又对格式要求强调一次,尽可能地减少因输出格式带来的效率问题。
本发明以高精度三维数字实景的形式存储与表现真实世界的场景,达到半自动高效地采集街景数据的效果,后续的分割、识别和清洗阶段使用对应的低成本的AI模型,对采集到的数据进行自动分割店招,自动识别文字,自动清洗文字的功能,最终得到高质量的带有精准地理位置的商业POI信息,无需大量的人力成本和时间开支。
在对某市一个10km2的商圈范围进行实验时,通过手动在虚拟场景中对照标注,得到一个全面的“黄金标准”数据集,将高德公共商业兴趣点提取数据集与本发明最终得到的商业兴趣点提取数据作对比,如图5所示,最终本发明在GPT-4、GPT-3.5、Baichuan2-13B的结果在F1指标上均超过高德(Gaode)公共数据集,达到了使商业POI完整度尽可能高的目的;其中F1指标为综合了准确率与召回率/>的指标,通过以下公式获得:
。
其中:
在图5中,GPT(Generative Pre-Trained Transformer)-4:由OpenAI组织开发的万亿级别大语言模型;
GPT-3.5:由OpenAI组织开发的千亿级别大语言模型;
Baichuan2-13B:是百川智能公司推出的百亿级别大语言模型;
Gaode:高德地图中提取的公共商业POI数据。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行图2所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分109从网络上被下载和安装,和/或从可拆卸介质111被安装。在该计算机程序被中央处理单元101执行时,执行本申请的装置中限定的各种功能。
其中,图2所示的方法所对应的计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
图6是本发明实施例中一种基于数字实景模型的兴趣点提取装置结构示意图,本实施例与图2的基于数字实景模型的兴趣点提取方法相对应,如图6所示,本实施例中的基于数字实景模型的兴趣点提取装置可以包括:
图片捕获模块301,其用于获取设定区域实景对应的数字实景模型,基于预设路径对数字实景模型进行虚拟导航,并从中捕获设定区域实景内所有兴趣目标的带定位信息的图片;其中,每张带定位信息的图片中至少包含一个兴趣目标;
图片分割模块302,其用于对各张带定位信息的图片进行分割处理,得到包含独立的兴趣目标图片;再将独立的兴趣目标图片进行坐标校准,得到独立的兴趣目标图片序列;
文字识别模块303,其用于依次对独立的兴趣目标图片序列中的每张图片进行文字识别,得到对应兴趣目标名称,再将兴趣目标名称与其对应定位信息组合成记录对,生成兴趣点初始提取信息集合;
信息清洗模块304,其用于对兴趣点初始提取信息集合内的记录对进行清洗,得到最终的兴趣点提取信息集合,以结合定位信息与实景地图进行关联。
图6所示的基于数字实景模型的兴趣点提取装置中的模块301~304的具体实施过程与图2中的步骤S201~204的具体实施过程相同,此处不再详述。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于数字实景模型的兴趣点提取方法,其特征在于,包括:
获取设定区域实景对应的数字实景模型,基于预设路径对数字实景模型进行虚拟导航,并从中捕获设定区域实景内所有兴趣目标的带定位信息的图片;其中,每张带定位信息的图片中至少包含一个兴趣目标;
对各张带定位信息的图片进行分割处理,得到包含独立的兴趣目标图片;再将独立的兴趣目标图片进行坐标校准,得到独立的兴趣目标图片序列;
依次对独立的兴趣目标图片序列中的每张图片进行文字识别,得到对应兴趣目标名称,再将兴趣目标名称与其对应定位信息组合成记录对,生成兴趣点初始提取信息集合;
对兴趣点初始提取信息集合内的记录对进行清洗,得到最终的兴趣点提取信息集合,以结合定位信息与实景地图进行关联。
2.如权利要求1所述的基于数字实景模型的兴趣点提取方法,其特征在于,基于预设路径对数字实景模型进行虚拟导航,并从中捕获设定区域实景内所有兴趣目标的带定位信息的图片的过程为:
将数字实景模型加载到虚幻引擎中,为数字实景模型中每条道路铺设线条;
在虚幻引擎中设置分别朝向道路两旁且保持设定高度的虚拟相机,使其以设定倾斜角度沿铺设线条自动导航,以捕获道路两旁的兴趣目标。
3.如权利要求1所述的基于数字实景模型的兴趣点提取方法,其特征在于,对各张带定位信息的图片进行分割处理时,同步对每个兴趣点中心位置进行深度估计,并对其进行校正,得到校正后的兴趣点中心位置的深度值。
4.如权利要求3所述的基于数字实景模型的兴趣点提取方法,其特征在于,利用每个兴趣点中心位置的深度估计值与实际深度值之间的拟合曲线,对每个兴趣点中心位置的深度估计值进行校正。
5.如权利要求3所述的基于数字实景模型的兴趣点提取方法,其特征在于,利用校正后的兴趣点中心位置的深度值来对独立的兴趣目标图片进行坐标校准。
6.如权利要求3所述的基于数字实景模型的兴趣点提取方法,其特征在于,利用校正后的兴趣点中心位置的深度值、单位转换的偏差因子与图片捕获装置的位置信息三者的乘积来补偿校正独立的兴趣目标图片的原始坐标。
7.如权利要求1所述的基于数字实景模型的兴趣点提取方法,其特征在于,对兴趣点初始提取信息集合内的记录对进行清洗的过程为:
从兴趣点初始提取信息集合中进行实体抽取,得到仅包含兴趣点名称的数据集;
将仅包含兴趣点名称的数据集中的各个名称与现实世界中的实体名称进行比对,根据两者的相似性进行名称修正或剔除,得到清洗后的仅包含兴趣点名称的数据集;
将清洗后的仅包含兴趣点名称的数据集中的各个名称与其对应定位信息再组合成记录对,得到最终的兴趣点提取信息集合。
8.一种基于数字实景模型的兴趣点提取装置,其特征在于,包括:
图片捕获模块,其用于获取设定区域实景对应的数字实景模型,基于预设路径对数字实景模型进行虚拟导航,并从中捕获设定区域实景内所有兴趣目标的带定位信息的图片;其中,每张带定位信息的图片中至少包含一个兴趣目标;
图片分割模块,其用于对各张带定位信息的图片进行分割处理,得到包含独立的兴趣目标图片;再将独立的兴趣目标图片进行坐标校准,得到独立的兴趣目标图片序列;
文字识别模块,其用于依次对独立的兴趣目标图片序列中的每张图片进行文字识别,得到对应兴趣目标名称,再将兴趣目标名称与其对应定位信息组合成记录对,生成兴趣点初始提取信息集合;
信息清洗模块,其用于对兴趣点初始提取信息集合内的记录对进行清洗,得到最终的兴趣点提取信息集合,以结合定位信息与实景地图进行关联。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基于数字实景模型的兴趣点提取方法中的步骤。
10.一种导航系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于数字实景模型的兴趣点提取方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410584735.7A CN118154858B (zh) | 2024-05-13 | 基于数字实景模型的兴趣点提取方法、装置、介质及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410584735.7A CN118154858B (zh) | 2024-05-13 | 基于数字实景模型的兴趣点提取方法、装置、介质及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118154858A true CN118154858A (zh) | 2024-06-07 |
CN118154858B CN118154858B (zh) | 2024-07-26 |
Family
ID=
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899243A (zh) * | 2015-03-31 | 2015-09-09 | 北京奇虎科技有限公司 | 检测兴趣点poi数据准确性的方法及装置 |
US20170109602A1 (en) * | 2014-07-01 | 2017-04-20 | Naver Corporation | Ocr-based system and method for recognizing map image, recording medium and file distribution system |
CN110647607A (zh) * | 2018-12-29 | 2020-01-03 | 北京奇虎科技有限公司 | 一种基于图片识别的poi数据的验证方法和装置 |
CN111316333A (zh) * | 2018-09-30 | 2020-06-19 | 华为技术有限公司 | 一种信息提示方法及电子设备 |
CN111695488A (zh) * | 2020-06-09 | 2020-09-22 | 北京百度网讯科技有限公司 | 兴趣面识别方法、装置、设备以及存储介质 |
CN112146672A (zh) * | 2020-09-09 | 2020-12-29 | 上海擎感智能科技有限公司 | 一种导航方法、装置及计算机存储介质 |
CN112507799A (zh) * | 2020-11-13 | 2021-03-16 | 幻蝎科技(武汉)有限公司 | 基于眼动注视点引导的图像识别方法、mr眼镜及介质 |
CN112905901A (zh) * | 2020-09-11 | 2021-06-04 | 卞美玲 | 面向大数据定位的服务兴趣提取方法、系统及平台 |
CN113483771A (zh) * | 2021-06-30 | 2021-10-08 | 北京百度网讯科技有限公司 | 实景地图的生成方法、装置及系统 |
WO2023065798A1 (zh) * | 2021-10-22 | 2023-04-27 | 北京百度网讯科技有限公司 | 道路动态事件的处理方法、装置、设备和介质 |
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170109602A1 (en) * | 2014-07-01 | 2017-04-20 | Naver Corporation | Ocr-based system and method for recognizing map image, recording medium and file distribution system |
CN104899243A (zh) * | 2015-03-31 | 2015-09-09 | 北京奇虎科技有限公司 | 检测兴趣点poi数据准确性的方法及装置 |
CN111316333A (zh) * | 2018-09-30 | 2020-06-19 | 华为技术有限公司 | 一种信息提示方法及电子设备 |
CN110647607A (zh) * | 2018-12-29 | 2020-01-03 | 北京奇虎科技有限公司 | 一种基于图片识别的poi数据的验证方法和装置 |
CN111695488A (zh) * | 2020-06-09 | 2020-09-22 | 北京百度网讯科技有限公司 | 兴趣面识别方法、装置、设备以及存储介质 |
CN112146672A (zh) * | 2020-09-09 | 2020-12-29 | 上海擎感智能科技有限公司 | 一种导航方法、装置及计算机存储介质 |
CN112905901A (zh) * | 2020-09-11 | 2021-06-04 | 卞美玲 | 面向大数据定位的服务兴趣提取方法、系统及平台 |
CN112507799A (zh) * | 2020-11-13 | 2021-03-16 | 幻蝎科技(武汉)有限公司 | 基于眼动注视点引导的图像识别方法、mr眼镜及介质 |
CN113483771A (zh) * | 2021-06-30 | 2021-10-08 | 北京百度网讯科技有限公司 | 实景地图的生成方法、装置及系统 |
WO2023065798A1 (zh) * | 2021-10-22 | 2023-04-27 | 北京百度网讯科技有限公司 | 道路动态事件的处理方法、装置、设备和介质 |
Non-Patent Citations (2)
Title |
---|
QI LI: "Integration of Points of Interest and Regions of Interest", 《IEEE ACCESS》, 4 September 2014 (2014-09-04) * |
邹强: "一种时空约束的兴趣点可达性模型研究", 《中国优秀硕士学位论文全文数据库(基础科学辑)》, 31 January 2020 (2020-01-31) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110160502A (zh) | 地图要素提取方法、装置及服务器 | |
CN109520500B (zh) | 一种基于终端拍摄图像匹配的精确定位及街景库采集方法 | |
US10643368B2 (en) | Generative image synthesis for training deep learning machines | |
CN111551167B (zh) | 一种基于无人机拍摄和语义分割的全局导航辅助方法 | |
DE102012218390A1 (de) | Optimierung der Erkennung von Objekten in Bildern | |
CN104794171B (zh) | 标记图片地理位置信息的方法及装置 | |
US11403766B2 (en) | Method and device for labeling point of interest | |
CN111160360B (zh) | 图像识别方法、装置及系统 | |
CN110135323A (zh) | 图像标注方法、装置、系统及存储介质 | |
CN112419512A (zh) | 一种基于语义信息的空中三维模型修复系统及方法 | |
CN105976395A (zh) | 一种基于稀疏表示的视频目标跟踪方法 | |
CN111178282A (zh) | 一种道路交通限速标志定位识别方法及装置 | |
CN111383286B (zh) | 定位方法、装置、电子设备及可读存储介质 | |
CN107356255B (zh) | 一种无人机导航方法及装置 | |
CN111914596B (zh) | 车道线检测方法、装置、系统及存储介质 | |
CN118154858B (zh) | 基于数字实景模型的兴趣点提取方法、装置、介质及系统 | |
CN111758118B (zh) | 一种视觉定位方法、装置、设备及可读存储介质 | |
CN117437519A (zh) | 一种无水尺水位识别方法及装置 | |
CN202350794U (zh) | 一种导航数据采集装置 | |
CN118154858A (zh) | 基于数字实景模型的兴趣点提取方法、装置、介质及系统 | |
CN115760886A (zh) | 基于无人机鸟瞰图的地块划分方法、装置及相关设备 | |
CN115115705A (zh) | 点云的标注方法及装置、车辆 | |
Tamas et al. | Vine diseases detection trials in the carpathian region with proximity aerial images | |
CN110427911B (zh) | 一种道路检测方法、装置、设备及存储介质 | |
CN114119973A (zh) | 一种基于图像语义分割网络的空间距离预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |