CN110390279A - 坐标识别方法、装置、设备、及计算机可读存储介质 - Google Patents
坐标识别方法、装置、设备、及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110390279A CN110390279A CN201910610305.7A CN201910610305A CN110390279A CN 110390279 A CN110390279 A CN 110390279A CN 201910610305 A CN201910610305 A CN 201910610305A CN 110390279 A CN110390279 A CN 110390279A
- Authority
- CN
- China
- Prior art keywords
- coordinate
- image
- identified
- associated picture
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种坐标识别方法、装置、设备及计算机可读存储介质,本申请实施例通过获取待识别坐标图像;提取所述待识别坐标图像中包含的地址文本;获取与所述地址文本对应的相关图像;通过预设的相似度计算模型获取所述待识别坐标图像与所述相关图像之间的相似度;筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像;提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群;根据所述定位坐标点群获取所述待识别坐标图像对应的坐标。提高了坐标识别的准确性。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种坐标识别方法、装置、设备及计算机可读存储介质。
背景技术
执法拍照取证对现场证据的准确性、可靠性、时效性具有较严格的要求,具有能反映执法照片所拍摄目标的真实位置、对应的真实场景覆盖区域的照片信息势必加强执法证据的力度。早期执法照片只能反映纯粹的影像信息,随着GPS(Global PositioningSystem,全球定位系统)的普及,可获取具有地理标记的执法照片。
当前在地理标记采集过程中,常常存在以下不足,首先,通过GPS进行现场采集地理标记的方式,由于信号等因素的影响,会导致GPS发生漂移的问题,使得GPS定位不够准确,从而难以获取到拍照时真实的坐标位置,采集坐标可靠性难以评估。
发明内容
本申请实施例提供一种坐标识别方法、装置、设备及计算机可读存储介质,可以实现提高采集地理坐标的准确性。
第一方面,本申请实施例提供了一种坐标识别方法,包括:
获取待识别坐标图像;
提取所述待识别坐标图像中包含的地址文本;
获取与所述地址文本对应的相关图像;
通过预设的相似度计算模型获取所述待识别坐标图像与所述相关图像之间的相似度;
筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像;
提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群;
根据所述定位坐标点群获取所述待识别坐标图像对应的坐标。
在一些实施方式中,所述提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群之后,还包括:
获取异常点检测模型;
通过所述异常点检测模型识别所述定位坐标点群中的异常坐标点;
对所述定位坐标点群中的所述异常坐标点进行去除,得到去除后的定位坐标点群;
所述根据所述定位坐标点群获取所述待识别坐标图像对应的坐标包括:
所述根据所述去除后的定位坐标点群,获取所述待识别坐标图像对应的坐标。
在一些实施方式中,所述获取与所述地址文本对应的相关图像,包括:
将图像获取指令发送至第三方服务平台,所述图像获取指令携带有所述地址文本;
接收所述第三方服务平台基于所述图像获取指令返回的相关图像,所述相关图像为所述第三方服务平台基于所述地址文本查找到。
在一些实施方式中,所述获取与所述地址文本对应的相关图像,包括:
将图像获取指令发送至第三方地图服务平台,所述图像获取指令携带有所述地址文本;
接收所述第三方地图服务平台基于所述图像获取指令返回的兴趣点列表;
根据所述兴趣点列表获取与所述地址文本对应的相关图像。
在一些实施方式中,所述根据所述定位坐标点群获取所述待识别坐标图像的坐标,包括:
获取所述定位坐标点群中的每两个坐标点之间的标准差;
根据所述每两个坐标点之间的标准差计算各个坐标点的标准差总和;
根据标准差总和最小的坐标点确定中心点;
根据所述中心点获取所述待识别坐标图像的坐标。
在一些实施方式中,所述根据所述中心点获取所述待识别坐标图像的坐标之后,包括:
获取所述异常坐标点的个数;
根据所述异常坐标点的个数确定所述中心点的数据可信度;
将所述待识别坐标图像的坐标与数据可信度进行关联,获得关联后的坐标与可信度;
当接收到显示指令时,将所述关联后的坐标与可信度进行显示,其中,所述显示指令携带有所述待识别坐标图像。
在一些实施方式中,所述提取所述待识别坐标图像中包含的地址文本,包括:
获取预先构建的图像文本识别模型;
通过所述预先构建的图像文本识别模型对所述待识别坐标图像进行文本检测和文本识别,得到目标识别结果,所述图像文本识别模型包括图像文本检测子模型和图像文本识别子模型,所述图像文本检测子模型与所述图像文本识别子模型分别采用深度学习算法训练得到的;
根据所述目标识别结果确定所述待识别坐标图像中包含的地址文本。
第二方面,本申请实施例还提供了一种坐标识别装置,包括:
第一获取单元,用于获取待识别坐标图像;
第一提取单元,用于提取所述待识别坐标图像中包含的地址文本;
第二获取单元,用于获取与所述地址文本对应的相关图像;通过预设的相似度计算模型获取所述待识别坐标图像与所述相关图像之间的相似度;
筛选单元,用于筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像;
第二提取单元,用于提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群;
第三获取单元,用于根据所述定位坐标点群获取所述待识别坐标图像对应的坐标。
在一些实施方式中,所述坐标识别装置还包括:
第四获取单元,用于获取异常点检测模型;
识别单元,用于通过所述异常点检测模型识别所述定位坐标点群中的异常坐标点;
去除单元,用于对所述定位坐标点群中的所述异常坐标点进行去除,得到去除后的定位坐标点群;
所述第三获取单元包括:
第一获取子单元,用于所述根据所述去除后的定位坐标点群,获取所述待识别坐标图像对应的坐标。
在一些实施方式中,所述第二获取单元,包括:
第一发送子单元,用于将图像获取指令发送至第三方服务平台,所述图像获取指令携带有所述地址文本;
第一接收子单元,用于接收所述第三方服务平台基于所述图像获取指令返回的相关图像,所述相关图像为所述第三方服务平台基于所述地址文本查找到。
在一些实施方式中,所述第二获取单元,包括:
第二发送子单元,用于将图像获取指令发送至第三方地图服务平台,所述图像获取指令携带有所述地址文本;
第二接收子单元,用于接收所述第三方地图服务平台基于所述图像获取指令返回的兴趣点列表;
第二获取子单元,用于根据所述兴趣点列表获取与所述地址文本对应的相关图像。
在一些实施方式中,所述第三获取子单元,包括:
第三获取子单元,用于获取所述定位坐标点群中的每两个坐标点之间的标准差;
计算子单元,用于根据所述每两个坐标点之间的标准差计算各个坐标点的标准差总和;
确定子单元,用于根据标准差总和最小的坐标点确定中心点;
第四获取子单元,用于根据所述中心点获取所述待识别坐标图像的坐标。
在一些实施方式中,所述坐标识别装置,还包括:
第五获取单元,用于获取所述异常坐标点的个数;
确定单元,用于根据所述异常坐标点的个数确定所述中心点的数据可信度;
关联单元,用于将所述待识别坐标图像的坐标与数据可信度进行关联,获得关联后的坐标与可信度;
显示单元,用于当接收到显示指令时,将所述关联后的坐标与可信度进行显示,其中,所述显示指令携带有所述待识别坐标图像。
在一些实施方式中,所述第一提取单元,包括:
第五获取子单元,用于获取预先构建的图像文本识别模型;
识别子单元,用于通过所述预先构建的图像文本识别模型对所述待识别坐标图像进行文本检测和文本识别,得到目标识别结果,所述图像文本识别模型包括图像文本检测子模型和图像文本识别子模型,所述图像文本检测子模型与所述图像文本识别子模型分别采用深度学习算法训练得到的;
第二确定子单元,用于根据所述目标识别结果确定所述待识别坐标图像中包含的地址文本。
第三方面,本申请实施例还提供了一种设备,包括处理器和存储器,所述存储器中存储有程序代码,所述处理器调用所述存储器中的程序代码时执行如上所述的坐标识别方法。
第四方面,本申请实施例还提供了一种存储介质,所述存储介质存储有计算机程序,该程序被处理器加载以执行如上所述的坐标识别方法。
本申请实施例通过获取待识别坐标图像;提取待识别坐标图像中包含的地址文本;获取所述地址文本的相关图像;通过预设的相似度计算模型获取所述相关图像之间的相似度,并筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像,提取筛选后的相关图像中包含的坐标点,得到定位坐标点群;提取筛选后的相关图像包含的定位坐标点群;最后可以根据所述定位坐标点群获取所述待识别坐标图像的坐标。本方案通过获取待识别坐标图像,以及与待识别坐标图像相关的相关图像,并通过预设的相似度计算模型获取待识别图像与相关图像之间的相似度,筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像,提取筛选后的相关图像包含的定位坐标点群,从而去除无法判定坐标精度的采集数据,有效评估采集坐标的精度,即可根据定位坐标点群获取待识别坐标图像的坐标,使得获得的坐标更精准,从而提高了确定坐标的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的坐标识别方法的流程示意图;
图2是本申请实施例提供的坐标识别方法的另一流程示意图;
图3是本申请实施例提供的坐标识别装置的结构示意图;
图4是本申请实施例提供的设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,图1是本申请第一实施例提供的坐标识别方法的流程示意图。该坐标识别方法的执行主体可以是本申请实施例提供的坐标识别装置,或者集成了该坐标识别装置的设备,比如终端或服务器等,该设备可以是智能手机、平板电脑、掌上电脑、或者笔记本电脑、固定电脑、以及服务器等等。该坐标识别方法可以包括:
S101,获取待识别坐标图像。
具体地,在本实施例中,待识别坐标图像可以由用户通过拍摄终端拍摄得到,比如通过相机,手机等进行拍摄得到,相机可以为现有相机生产商批量生产、销售的相机,例如单反相机,微单相机,不局限与专业相机,可减少识别成本;还可以直接接收其他终端发送的图像,从而得到待识别坐标图像,在此不做限制。
S102,提取所述待识别坐标图像中包含的地址文本。
在获得待识别坐标图像之后,可提取待识别坐标图像中包含的地址文本,具体可通过预设的识别模型进行地址文本识别。
即步骤S102具体可包括:
获取预先构建的图像文本识别模型,并通过坐标识别装置中预先构建的图像文本识别模型对待识别坐标图像进行文本检测和文本识别,得到目标识别结果,所述图像文本识别模型包括图像文本检测子模型和图像文本识别子模型,所述图像文本检测子模型与所述图像文本识别子模型分别采用深度学习算法训练得到的;
根据所述目标识别结果确定所述待识别坐标图像中包含的地址文本。
本申请实施例,在获取待识别图像后,进一步获取坐标识别装置中预先构建的图像文本识别模型,并通过预先构建的图像文本识别模型对待识别坐标图像进行文本检测和文本识别,然后得到目标识别结果。,其中图像文本识别模型具体集成在坐标识别装置中。
本申请实施例具体通过采用深度学习算法训练得到的图像文本识别模型来实现地址文本识别。其中,深度学习算法例如可以是针对现有文本检测算法进行改进、或者卷积神经网络(Convolutional Neural Network,CNN)、深度残差网络(Deep ResidualNetwork,DResNet)以及长短期记忆网络(Long Short-Term Memory,LSTM)等的组合结果。其中,文本检测算法,例如可以是改进的SSD算法(Single Shot Detection)。改进的SSD算法基于获取图片自身的特点,通过调整特征提取层的选择和目标框比例的设置来实现,其能够进一步地提升检测结果的精确度。
本申请实施例,图像文本识别模型至少包括图像文本检测子模型和图像文本识别子模型。其中,图像文本检测子模型例如可以采用改进的SSD算法训练而成。图像文本识别子模型例如可以采用神经网络组合训练而成。神经网络组合例如可以是卷积神经网络与长短期记忆网络的组合,或者深度残差网络与长短期记忆网络的组合等。
通过图像文本识别模型识别待识别图像的地址文本信息,即可从图像中识别出对应的地址文本信息,然后进一步确定识别的结果是否为正确的地址,具体可将识别得到的地址文本发送至第三方地图服务平台,以便第三方地图服务平台进行对比,若接收到第三方地图服务平台返回的,对比到与从图像中识别出对应的地址文本信息一致的地址文本的反馈信息,则确定图像文本识别模型识别得到的地址文本信息是正确的,若接收到第三方地图服务平台返回的,没有匹配到与从图像中识别出对应的地址文本信息一致的地址文本的反馈信息,则确定图像文本识别模型为不正确的,需要返回图像文本识别模型进行重新识别。其中,第三方地图服务平台为提供图像以及图像对应的坐标、电子地图浏览、地点搜索、公交自驾路线查询、手机地图、手机导航、高清卫星图、城市仿真三维图等多项服务的通用地图,比如高德地图、搜狗地图等。
S103,获取与所述地址文本对应的相关图像。
获得待识别图像的地址文本信息之后,即可根据地址文本信息获取相关图像。相关图像可以为众源地理数据对应的地址图像,众源地理数据是由大量非专业人员志愿获取并通过互联网向大众提供的一种开放地理空间数据。人们通过有意或者无意的行为活动,直接或间接地提供了大量的互联网数据。众源影像数据作为众源地理数据的一部分,具有基数大、来源广、携带信息丰富等特点,其中,众源影像数据对应的地址图像一般包含坐标点,在获取图像时,同时获取图像对应的坐标点。
具体可通过将地址文本发送至第三方服务平台,或者第三方地图服务平台中,通过第三方服务平台,或者第三方地图服务平台进行查找,并通过第三方服务平台,或者第三方地图服务平台返回查找到的相关图像,从而获取到地址文本对应的相关图像。
具体地,当通过第三方服务平台获取相关图像时,步骤S103包括:
将图像获取指令发送至第三方服务平台,所述图像获取指令携带有所述地址文本;
接收所述第三方服务平台基于所述图像获取指令返回的相关图像,所述相关图像为所述第三方服务平台基于所述地址文本查找到。
当通过第三方服务平台获取相关图像时,将图像获取指令发送至第三方服务平台,图像获取指令中携带有地址文本,其中,第三方服务平台为开放平台,比如社交服务平台等,具体可包括微博、微信等提供获取图像以及图像对比的坐标点服务的社交平台,在发送图像获取指令之前,需要获得第三方服务平台的授权,具体可通过将授权请求发送至第三方服务平台,其中授权请求携带有终端标识,授权范围等,在接收到第三方服务平台返回的确定授权之后,再将图像获取指令发送至第三方服务平台,以便第三方服务平台根据地址文本进行图像搜索,然后将搜索得到的图像返回至终端,从而使得终端获得地址文本的相关图像。
当通过第三方地图服务平台获取相关图像时,步骤S103包括:
将图像获取指令发送至第三方地图服务平台,所述图像获取指令携带有所述地址文本;
接收所述第三方地图服务平台基于所述图像获取指令返回的兴趣点列表;
根据所述兴趣点列表获取与所述地址文本对应的相关图像。
当通过第三方地图服务平台获取相关图像时,将图像获取指令发送至第三方地图服务平台,图像获取指令携带有地址文本;其中,第三方地图服务平台为开放的通用地图,同理,在发送图像获取指令之前,需要获得第三方地图服务平台的授权,获得第三方地图服务平台授权的方式与获得第三方服务平台的授权方式类似,在此不再赘述。在获得第三方地图服务平台的授权之后,再将图像获取指令发送至第三方地图服务平台,以便第三方地图服务平台根据地址文本进行搜索,得到与地址文本相关的兴趣点列表,其中,兴趣点POI(Point of Interest),在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等,并将得到的兴趣点列表返回至终端,用户可通过点击选取对应的兴趣点,第三方地图服务平台在接收到用户选取的兴趣点时,即获取对应的相关图像,可以理解的是,用户也可不进行点击选取操作,当用户不进行点击选取操作时,则默认获取所有与地址文本相关的兴趣点列表所对应的相关图像,并将获取到的图像返回至终端。
S103,通过预设的相似度计算模型获取所述待识别坐标图像与所述相关图像之间的相似度。
获得待识别图像的相关图像之后,即可可通过坐标识别装置中的相似度计算模型,进行待识别图像与相关图像之间的相似度识别。其中,该相似度计算模型由多个标注了相似度的样本图像训练而成。具体可以获取样本图像,通过预设模型对样本图像进行检测,得到预测的相似度,将该预测的相似度进行收敛,使得预测的相似度无限接近于标注的相似度,以此类推进行多次训练,最终便可得到相似度计算模型,其中相似度计算模型集成在坐标识别装置中,具体的预设模型训练过程可以在坐标识别装置中进行训练,也可以在其他装置进行训练,坐标识别装置直接获取训练好的相似度计算模型。
S104,筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像。
在获得相关图像与待识别坐标图像之间的相似度之后,即可根据相似度对相关图像进行筛选,具体地,将各个相似度与预设阈值进行对比,若相似度大于预设阈值,则将对应的相关图像进行保存;若相识度小于或等于预设阈值,则去除对应的相关图像,从而获得筛选后的相关图像。具体的阈值可根据实际场景进行设置,在此不做限制。
S105,提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群。
获得筛选后的相关图像之后,即可对相关图像中包含的地址坐标点进行提取。由于众源影像数据对应的地址图像一般包含坐标点,在获取图像时,同时获取了图像对应的坐标点,因此直接通过相关图像提取对应的坐标点即可,然后通过提取得到的各个坐标点构建定位坐标点群。
进一步地,在获得定位坐标点群之后,可以通过异常点检测模型对定位坐标点群中的各个坐标点进行检测,从而剔除异常坐标点。具体地,提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群之后,还包括:
获取异常点检测模型;
通过所述异常点检测模型识别所述定位坐标点群中的异常坐标点;
对所述定位坐标点群中的所述异常坐标点进行去除,得到去除后的定位坐标点群。
具体地,由于坐标识别装置中集成了模型,在具体实施过程中,可以具体根据需要实现的功能,先获取相关的模型,比如识别异常坐标点时,先获取异常点检测模型,通过异常点检测模型识别定位坐标点群中的异常坐标点,其中,该异常点检测模型由多个标注了与参考坐标点的坐标距离的样本坐标点训练而成。具体可以获取样本坐标点,通过预设模型对样本坐标点进行检测,得到预测的坐标距离,将该预测的坐标距离进行收敛,使得预测的坐标距离无限接近于标注的坐标距离,以此类推进行多次训练,最终便可得到异常点检测模型。然后将定位坐标点群输入至异常点检测模型,通过异常点检测模型获得异常坐标点,并对定位坐标点群中的异常坐标点进行去除,得到去除后的定位坐标点群。
根据定位坐标点群获取所述待识别坐标图像对应的坐标包括:
根据所述去除后的定位坐标点群,获取所述待识别坐标图像对应的坐标。
在后续获取待识别坐标图像对应的坐标过程中,根据去除后的定位坐标点群进行获取。
S106,根据所述定位坐标点群获取所述待识别坐标图像对应的坐标。
在获得定位坐标点群之后,即可根据定位坐标点群获取待识别坐标图像对应的坐标。具体地,获取定位坐标点群中的每两个坐标点之间的标准差,根据每两个坐标点之间的标准差计算各个坐标点的标准差总和,即计算各个坐标点与定位坐标点群中的其他坐标点的标准差总和;然后根据标准差总和最小的坐标点确定中心点,具体可将标准差总和确定为中心点;然后根据中心点获取待识别坐标图像的坐标即可。
具体地,步骤S106包括:
获取所述定位坐标点群中的每两个坐标点之间的标准差;
根据所述每两个坐标点之间的标准差计算各个坐标点的标准差总和;
根据标准差总和最小的坐标点确定中心点;
根据所述中心点获取所述待识别坐标图像的坐标。
首先计算定位坐标点群中的每两个坐标点之间的标准差,根据每两个坐标点之间的标准差计算各个坐标点的标准差总和,即计算各个坐标点与定位坐标点群中的其他坐标点的标准差总和,并将标准差总和进行排序,具体可为升序排序或者降序排序,在此不做限定。通过标准差总和排序,即可获得标准差总和最小的坐标点,然后将标准差总和最小的坐标点设置点,并将标准差总和最小的坐标点的具体坐标值作为待识别坐标图像的坐标,即可获得待识别坐标图像的坐标。
在获得待识别坐标图像的坐标之后,可进一步获取获得的坐标的可信度,以便用户进行查看。具体地,根据所述定位坐标点群获取所述待识别坐标图像对应的坐标之后,还包括:
获取所述异常坐标点的个数;
根据所述异常坐标点的个数确定所述中心点的数据可信度;
将所述待识别坐标图像的坐标与数据可信度进行关联,获得关联后的坐标与可信度;
当接收到显示指令时,将所述关联后的坐标与可信度进行显示,其中,所述显示指令携带有所述待识别坐标图像。
获取异常点检测模型输出的异常坐标点的个数,根据异常坐标点的个数确定所述中心点的数据可信度,具体可将异常坐标点的个数设置为中心点的数据可信度,比如假设异常坐标点的个数为10,则中心点的数据可信度为10。然后将待识别坐标图像的坐标与数据可信度进行关联,获得关联后的坐标与可信度;当接收到显示指令时,将关联后的坐标与可信度进行显示,其中,显示指令携带有待识别坐标图像,以便用户在获知坐标的同时,进一步了解对应的可信度。
本实施例通过获取待识别坐标图像;提取待识别坐标图像中包含的地址文本;获取所述地址文本的相关图像;通过预设的相似度计算模型获取所述相关图像之间的相似度,并筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像,提取筛选后的相关图像中包含的坐标点,得到定位坐标点群;提取筛选后的相关图像包含的定位坐标点群;最后可以根据所述定位坐标点群获取所述待识别坐标图像的坐标。本方案通过获取待识别坐标图像,以及与待识别坐标图像相关的相关图像,并通过预设的相似度计算模型获取待识别图像与相关图像之间的相似度,筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像,提取筛选后的相关图像包含的定位坐标点群,从而去除无法判定坐标精度的采集数据,有效评估采集坐标的精度,即可根据定位坐标点群获取待识别坐标图像的坐标,使得获得的坐标更精准,从而提高了确定坐标的准确性。
根据上述实施例所描述的坐标识别方法,以下将坐标识别方法应用于手机作进一步详细说明。
请参照图2,图2为本申请实施例提供的坐标识别方法的另一流程示意图。该坐标识别方法可以应用于手机,如图2所示,该坐标识别方法的流程可以如下:
S201,通过手机获取待识别坐标图像。
具体地,在本实施例中,待识别坐标图像可以由用户通过手机拍摄终端拍摄得到,比如用户在外出时,看到感兴趣的地点,通过手机进行拍摄得到的图像,具体可以为景物、建筑等。比如用户在黄鹤楼进行游玩时,出于对黄鹤楼的兴趣,对黄鹤楼进行拍摄得到的图像。
S202,获取预先构建的图像文本识别模型,通过预先构建的图像文本识别模型对所述待识别坐标图像进行文本检测和文本识别,得到目标识别结果。
S203,根据目标识别结果确定待识别坐标图像中包含的地址文本。
在获得待识别坐标图像之后,可提取待识别坐标图像中包含的地址文本,具体可通过预设的识别模型进行地址文本识别。
通过预先构建的图像文本识别模型对待识别坐标图像进行文本检测和文本识别,得到目标识别结果,所述图像文本识别模型包括图像文本检测子模型和图像文本识别子模型,图像文本识别模型具体为集成在手机中的模型,图像文本检测子模型与所述图像文本识别子模型分别采用深度学习算法训练得到的。
本申请实施例具体通过采用深度学习算法训练得到的图像文本识别模型来实现地址文本识别。其中,深度学习算法例如可以是针对现有文本检测算法进行改进、或者CNN、DResNet、LSTM等的组合结果。其中,文本检测算法,例如可以是改进的SSD算法。改进的SSD算法基于获取图片自身的特点,通过调整特征提取层的选择和目标框比例的设置来实现,其能够进一步地提升检测结果的精确度。
本申请实施例,图像文本识别模型至少包括图像文本检测子模型和图像文本识别子模型。其中,图像文本检测子模型例如可以采用改进的SSD算法训练而成。图像文本识别子模型例如可以采用神经网络组合训练而成。神经网络组合例如可以是卷积神经网络与长短期记忆网络的组合,或者深度残差网络与长短期记忆网络的组合等。
具体通过图像文本识别模型从图像中识别出对应的地址文本信息,比如将用户拍摄黄鹤楼的图像作为待识别图像时,识别出来的地址文本信息为黄鹤楼,然后进一步确定识别的结果是否为正确的地址,具体可将识别得到的地址文本发送至第三方地图服务平台,以便第三方地图服务平台进行对比,比如将识别得到地址文本信息“黄鹤楼”发送至第三方地图服务平台,若接收到第三方地图服务平台反馈的,对比到与从图像中识别出对应的地址文本信息一致的地址文本的反馈信息,则确定图像文本识别模型识别得到的地址文本信息是正确的,若接收到第三方地图服务平台反馈的,没有匹配到与从图像中识别出对应的地址文本信息一致的地址文本的反馈信息,则确定图像文本识别模型为不正确的,需要返回图像文本识别模型进行重新识别。
S204,将图像获取指令发送至第三方服务平台。
S205,接收第三方服务平台基于图像获取指令返回的相关图像。
获得待识别图像的地址文本信息之后,即可根据地址文本信息获取相关图像。相关图像可以为众源地理数据对应的地址图像,众源地理数据是由大量非专业人员志愿获取并通过互联网向大众提供的一种开放地理空间数据。人们通过有意或者无意的行为活动,直接或间接地提供了大量的互联网数据。众源影像数据作为众源地理数据的一部分,具有基数大、来源广、携带信息丰富等特点,其中,众源影像数据对应的地址图像一般包含坐标点,在获取图像时,同时获取图像对应的坐标点。
具体可通过将地址文本发送至第三方服务平台,或者第三方地图服务平台中,通过第三方服务平台,或者第三方地图服务平台进行查找,并通过第三方服务平台,或者第三方地图服务平台返回查找到的相关图像,从而获取到地址文本对应的相关图像,比如将用户拍摄黄鹤楼的图像作为待识别图像时,通过第三方服务平台,或者第三方地图服务平台查找与黄鹤楼相关的图像,与黄鹤楼相关的图像可以为其他用户拍摄的黄鹤楼图像。
当通过第三方服务平台获取相关图像时,将图像获取指令发送至第三方服务平台,图像获取指令中携带有地址文本,以便第三方服务平台根据地址文本进行图像搜索,然后将搜索得到的图像返回至终端,从而使得终端获得地址文本的相关图像。
S206,通过预设的相似度计算模型获取待识别坐标图像与所述相关图像之间的相似度。
获得待识别图像的相关图像之后,即可将待识别图像与相关图像输入预设的相似度计算模型中,进行相似度识别。其中,该相似度计算模型由多个标注了相似度的样本图像训练而成。具体可以通过预设模型对样本图像进行检测,得到预测的相似度,将该预测的相似度进行收敛,使得预测的相似度无限接近于标注的相似度,以此类推进行多次训练,最终便可得到相似度计算模型。
S207,筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像。
在获得相关图像与待识别坐标图像之间的相似度之后,即可根据相似度对相关图像进行筛选,具体地,将各个相似度与预设阈值进行对比,若相似度大于预设阈值,则将对应的相关图像进行保存;若相识度小于或等于预设阈值,则去除对应的相关图像,从而获得筛选后的相关图像。具体的阈值可根据实际场景进行设置,在此不做限制。
S208,提取筛选后的相关图像中包含的坐标点,得到定位坐标点群。
获得筛选后的相关图像之后,即可对相关图像中包含的地址坐标点进行提取。由于众源影像数据对应的地址图像一般包含坐标点,在获取图像时,同时获取了图像对应的坐标点,因此直接通过相关图像提取对应的坐标点即可,然后通过提取得到的各个坐标点构建定位坐标点群。
S209,获取异常点检测模型。
S210,通过所述异常点检测模型识别所述定位坐标点群中的异常坐标点。
S211,对所述定位坐标点群中的所述异常坐标点进行去除,得到去除后的定位坐标点群。
具体地,获取异常点检测模型,通过异常点检测模型获得异常坐标点,并将异常坐标点从定位坐标点群中删除,得到删除后的定位坐标点群。
S212,获取所述删除后的定位坐标点群中的每两个坐标点之间的标准差;
S213,根据所述每两个坐标点之间的标准差计算各个坐标点的标准差总和;
S214,根据标准差总和最小的坐标点确定中心点;
S215,根据所述中心点获取所述待识别坐标图像的坐标。
在获得删除后的定位坐标点群之后,即可根据删除后的定位坐标点群获取待识别坐标图像对应的坐标。具体地,获取定位坐标点群中的每两个坐标点之间的标准差,根据每两个坐标点之间的标准差计算各个坐标点的标准差总和,即计算各个坐标点与定位坐标点群中的其他坐标点的标准差总和;然后根据标准差总和最小的坐标点确定中心点,具体可将标准差总和确定为中心点;然后根据中心点获取待识别坐标图像的坐标即可。
首先计算定位坐标点群中的每两个坐标点之间的标准差,根据每两个坐标点之间的标准差计算各个坐标点的标准差总和,即计算各个坐标点与定位坐标点群中的其他坐标点的标准差总和,并将标准差总和进行排序,具体可为升序排序或者降序排序,在此不做限定。通过标准差总和排序,即可获得标准差总和最小的坐标点,然后将标准差总和最小的坐标点设置点,并将标准差总和最小的坐标点的具体坐标值作为待识别坐标图像的坐标,即可获得待识别坐标图像的坐标。
S216,获取异常坐标点的个数。
S217,根据所述异常坐标点的个数确定所述中心点的数据可信度。
S218,将所述待识别坐标图像的坐标与数据可信度进行关联,获得关联后的坐标与可信度。
S219,当接收到显示指令时,将所述关联后的坐标与可信度进行显示,其中,所述显示指令携带有所述待识别坐标图像。
获取异常点检测模型输出的异常坐标点的个数,根据异常坐标点的个数确定所述中心点的数据可信度,具体可将异常坐标点的个数设置为中心点的数据可信度,比如假设异常坐标点的个数为10,则中心点的数据可信度为10。然后将待识别坐标图像的坐标与数据可信度进行关联,获得关联后的坐标与可信度;当接收到显示指令时,将关联后的坐标与可信度进行显示,其中,显示指令携带有待识别坐标图像,以便用户在获知坐标的同时,进一步了解对应的可信度。
本方案通过获取待识别坐标图像,以及与待识别坐标图像相关的相关图像,并通过预设的相似度计算模型获取待识别图像与相关图像之间的相似度,筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像,提取筛选后的相关图像包含的定位坐标点群,从而去除无法判定坐标精度的采集数据,有效评估采集坐标的精度,即可根据定位坐标点群获取待识别坐标图像的坐标,使得获得的坐标更精准,从而提高了确定坐标的准确性。
为便于更好的实施本申请实施例提供的坐标识别方法,本申请实施例还提供一种基于上述坐标识别装置。其中名词的含义与上述坐标识别方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图3,图3为本申请实施例提供的坐标识别装置的结构示意图,其中该坐标识别装置可以包括第一获取单元301、第一提取单元302、第二获取单元303、筛选单元304、第二提取单元305以及第三获取单元306等。
具体地,坐标识别装置包括:
第一获取单元,用于获取待识别坐标图像;
第一提取单元,用于提取所述待识别坐标图像中包含的地址文本;
第二获取单元,用于获取与所述地址文本对应的相关图像;通过预设的相似度计算模型获取所述待识别坐标图像与所述相关图像之间的相似度;
筛选单元,用于筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像;
第二提取单元,用于提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群;
第三获取单元,用于根据所述定位坐标点群获取所述待识别坐标图像对应的坐标。
在一些实施方式中,所述坐标识别装置还包括:
第四获取单元,用于获取异常点检测模型;
识别单元,用于通过所述异常点检测模型识别所述定位坐标点群中的异常坐标点;
去除单元,用于对所述定位坐标点群中的所述异常坐标点进行去除,得到去除后的定位坐标点群;
所述第三获取单元包括:
第一获取子单元,用于所述根据所述去除后的定位坐标点群,获取所述待识别坐标图像对应的坐标。
在一些实施方式中,所述第二获取单元,包括:
第一发送子单元,用于将图像获取指令发送至第三方服务平台,所述图像获取指令携带有所述地址文本;
第一接收子单元,用于接收所述第三方服务平台基于所述图像获取指令返回的相关图像。
在一些实施方式中,所述第二获取单元,包括:
第二发送子单元,用于将图像获取指令发送至第三方地图服务平台,所述图像获取指令携带有所述地址文本;
第二接收子单元,用于接收所述第三方地图服务平台返回的兴趣点列表;
第二获取子单元,用于根据所述兴趣点列表获取对应的相关图像。
在一些实施方式中,所述第三获取子单元,包括:
第三获取子单元,用于获取所述定位坐标点群中的每两个坐标点之间的标准差;
计算子单元,用于根据所述每两个坐标点之间的标准差计算各个坐标点的标准差总和;
确定子单元,用于根据标准差总和最小的坐标点确定中心点;
第四获取子单元,用于根据所述中心点获取所述待识别坐标图像的坐标。
在一些实施方式中,所述坐标识别装置,还包括:
第五获取单元,用于获取所述异常坐标点的个数;
确定单元,用于根据所述异常坐标点的个数确定所述中心点的数据可信度;
关联单元,用于将所述待识别坐标图像的坐标与数据可信度进行关联,获得关联后的坐标与可信度;
显示单元,用于当接收到显示指令时,将所述关联后的坐标与可信度进行显示,其中,所述显示指令携带有所述待识别坐标图像。
在一些实施方式中,所述第一提取单元,包括:
第五获取子单元,用于获取预先构建的图像文本识别模型;
识别子单元,用于通过所述预先构建的图像文本识别模型对所述待识别坐标图像进行文本检测和文本识别,得到目标识别结果,所述图像文本识别模型包括图像文本检测子模型和图像文本识别子模型,所述图像文本检测子模型与所述图像文本识别子模型分别采用深度学习算法训练得到的;
第二确定子单元,用于根据所述目标识别结果确定所述待识别坐标图像中包含的地址文本。
其中,以上各个操作的具体实施可参见前面的第一方法实施例,在此不再赘述。
图4示出了本发明实施例提供的设备的具体结构框图,该设备即为坐标识别设备,该设备可以用于实施上述实施例中提供的坐标识别方法。该设备400可以为智能手机或平板电脑等。
如图4所示,设备400可以包括RF(Radio Frequency,射频)电路110、包括有一个或一个以上(图中仅示出一个)计算机可读存储介质的存储器120、输入单元130、显示单元140、传输模块170、包括有一个或者一个以上(图中仅示出一个)处理核心的处理器180以及电源190等部件。本领域技术人员可以理解,图4中示出的设备400结构并不构成对设备400的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。RF电路110可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。RF电路110可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信系统(Global System for Mobile Communication,GSM)、增强型移动通信技术(Enhanced DataGSM Environment,EDGE),宽带码分多址技术(Wideband Code Division MultipleAccess,WCDMA),码分多址技术(Code Division Access,CDMA)、时分多址技术(TimeDivision Multiple Access,TDMA),无线保真技术(Wireless Fidelity,Wi-Fi)(如美国电气和电子工程师协会标准IEEE 802.11a,IEEE 802.11b,IEEE802.11g和/或IEEE802.11n)、网络电话(Voice over Internet Protocol,VoIP)、全球微波互联接入(Worldwide Interoperability for Microwave Access,Wi-Max)、其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。
存储器120可用于存储软件程序以及模块,如上述实施例中坐标识别方法的程序指令/模块,处理器180通过运行存储在存储器120内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现坐标识别的功能。存储器120可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器120可进一步包括相对于处理器180远程设置的存储器,这些远程存储器可以通过网络连接至设备400。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。具体地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及设备400的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图4中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输出功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
设备400通过传输模块170(例如Wi-Fi模块)可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图4示出了传输模块170,但是可以理解的是,其并不属于设备400的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器180是设备400的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行设备400的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;在一些实施例中,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。
设备400还包括给各个部件供电的电源190(比如电池),在一些实施例中,电源可以通过电源管理系统与处理器180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
具体在本实施例中,设备400的显示单元140是触摸屏显示器,设备400还包括有存储器120,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器120中,且经配置以由一个或者一个以上处理器180执行一个或者一个以上程序包含用于进行以下操作的指令:
获取待识别坐标图像;
提取所述待识别坐标图像中包含的地址文本;
获取与所述地址文本对应的相关图像;
通过预设的相似度计算模型获取所述待识别坐标图像与所述相关图像之间的相似度;
筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像;
提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群;
根据所述定位坐标点群获取所述待识别坐标图像对应的坐标。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对坐标识别方法的详细描述,此处不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,所述存储介质存储有计算机程序,该程序被处理器加载以执行如上项所述的坐标识别方法,例如,该指令可以执行如下步骤:
获取待识别坐标图像;
提取所述待识别坐标图像中包含的地址文本;
获取与所述地址文本对应的相关图像;
通过预设的相似度计算模型获取所述待识别坐标图像与所述相关图像之间的相似度;
筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像;
提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群;
根据所述定位坐标点群获取所述待识别坐标图像对应的坐标。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种坐标识别方法中的步骤,因此,可以实现本申请实施例所提供的任一种坐标识别方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种坐标识别方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种坐标识别方法,其特征在于,包括:
获取待识别坐标图像;
提取所述待识别坐标图像中包含的地址文本;
获取与所述地址文本对应的相关图像;
通过预设的相似度计算模型获取所述待识别坐标图像与所述相关图像之间的相似度;
筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像;
提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群;
根据所述定位坐标点群获取所述待识别坐标图像对应的坐标。
2.根据权利要求1所述的坐标识别方法,其特征在于,所述提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群之后,还包括:
获取异常点检测模型;
通过所述异常点检测模型识别所述定位坐标点群中的异常坐标点;
对所述定位坐标点群中的所述异常坐标点进行去除,得到去除后的定位坐标点群;
所述根据所述定位坐标点群获取所述待识别坐标图像对应的坐标包括:
所述根据所述去除后的定位坐标点群,获取所述待识别坐标图像对应的坐标。
3.根据权利要求1所述的坐标识别方法,其特征在于,所述获取与所述地址文本对应的相关图像,包括:
将图像获取指令发送至第三方服务平台,所述图像获取指令携带有所述地址文本;
接收所述第三方服务平台基于所述图像获取指令返回的相关图像,所述相关图像为所述第三方服务平台基于所述地址文本查找到。
4.根据权利要求1所述的坐标识别方法,其特征在于,所述获取与所述地址文本对应的相关图像,包括:
将图像获取指令发送至第三方地图服务平台,所述图像获取指令携带有所述地址文本;
接收所述第三方地图服务平台基于所述图像获取指令返回的兴趣点列表;
根据所述兴趣点列表获取与所述地址文本对应的相关图像。
5.根据权利要求1所述的坐标识别方法,其特征在于,所述根据所述定位坐标点群获取所述待识别坐标图像的坐标,包括:
获取所述定位坐标点群中的每两个坐标点之间的标准差;
根据所述每两个坐标点之间的标准差计算各个坐标点的标准差总和;
根据标准差总和最小的坐标点确定中心点;
根据所述中心点获取所述待识别坐标图像的坐标。
6.根据权利要求5所述的坐标识别方法,其特征在于,所述根据所述中心点获取所述待识别坐标图像的坐标之后,包括:
获取所述异常坐标点的个数;
根据所述异常坐标点的个数确定所述中心点的数据可信度;
将所述待识别坐标图像的坐标与数据可信度进行关联,获得关联后的坐标与可信度;
当接收到显示指令时,将所述关联后的坐标与可信度进行显示,其中,所述显示指令携带有所述待识别坐标图像。
7.根据权利要求1所述的坐标识别方法,其特征在于,所述提取所述待识别坐标图像中包含的地址文本,包括:
获取预先构建的图像文本识别模型;
通过所述预先构建的图像文本识别模型对所述待识别坐标图像进行文本检测和文本识别,得到目标识别结果,所述图像文本识别模型包括图像文本检测子模型和图像文本识别子模型,所述图像文本检测子模型与所述图像文本识别子模型分别采用深度学习算法训练得到的;
根据所述目标识别结果确定所述待识别坐标图像中包含的地址文本。
8.一种坐标识别装置,其特征在于,包括:
第一获取单元,用于获取待识别坐标图像;
第一提取单元,用于提取所述待识别坐标图像中包含的地址文本;
第二获取单元,用于获取与所述地址文本对应的相关图像;通过预设的相似度计算模型获取所述待识别坐标图像与所述相关图像之间的相似度;
筛选单元,用于筛选相似度大于预设阈值的相关图像,得到筛选后的相关图像;
第二提取单元,用于提取所述筛选后的相关图像中包含的坐标点,得到定位坐标点群;
第三获取单元,用于根据所述定位坐标点群获取所述待识别坐标图像对应的坐标。
9.一种坐标识别设备,其特征在于,包括处理器和存储器,所述存储器中存储有程序代码,所述处理器调用所述存储器中的程序代码时执行如权利要求1至7任一项所述的坐标识别方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,该程序被处理器加载以执行如权利要求1至7任一项所述的坐标识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910610305.7A CN110390279A (zh) | 2019-07-08 | 2019-07-08 | 坐标识别方法、装置、设备、及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910610305.7A CN110390279A (zh) | 2019-07-08 | 2019-07-08 | 坐标识别方法、装置、设备、及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110390279A true CN110390279A (zh) | 2019-10-29 |
Family
ID=68286327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910610305.7A Pending CN110390279A (zh) | 2019-07-08 | 2019-07-08 | 坐标识别方法、装置、设备、及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110390279A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116069885A (zh) * | 2023-01-05 | 2023-05-05 | 阿里巴巴(中国)有限公司 | 一种信息真实性的确定方法、装置和电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104112129A (zh) * | 2014-06-25 | 2014-10-22 | 小米科技有限责任公司 | 图像识别方法及装置 |
CN105571583A (zh) * | 2014-10-16 | 2016-05-11 | 华为技术有限公司 | 一种用户位置定位方法以及服务器 |
CN105717483A (zh) * | 2016-02-06 | 2016-06-29 | 北京邮电大学 | 一种基于多源定位方式的位置确定方法及装置 |
US9396541B2 (en) * | 2013-11-26 | 2016-07-19 | Institute For Information Industry | Positioning control method |
CN106920253A (zh) * | 2017-02-10 | 2017-07-04 | 华中科技大学 | 一种基于遮挡分层的多目标跟踪方法 |
CN107436906A (zh) * | 2016-05-27 | 2017-12-05 | 高德信息技术有限公司 | 一种信息检测方法及装置 |
CN108304423A (zh) * | 2017-03-29 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种信息识别方法及装置 |
CN108764226A (zh) * | 2018-04-13 | 2018-11-06 | 顺丰科技有限公司 | 图像文本识别方法、装置、设备及其存储介质 |
CN109325415A (zh) * | 2018-08-22 | 2019-02-12 | 吴昌议 | 一种基于图像列对齐特征预测所有目标区域的方法 |
CN109636771A (zh) * | 2018-10-23 | 2019-04-16 | 中国船舶重工集团公司第七0九研究所 | 基于图像处理的飞行目标检测方法及系统 |
-
2019
- 2019-07-08 CN CN201910610305.7A patent/CN110390279A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9396541B2 (en) * | 2013-11-26 | 2016-07-19 | Institute For Information Industry | Positioning control method |
CN104112129A (zh) * | 2014-06-25 | 2014-10-22 | 小米科技有限责任公司 | 图像识别方法及装置 |
CN105571583A (zh) * | 2014-10-16 | 2016-05-11 | 华为技术有限公司 | 一种用户位置定位方法以及服务器 |
CN105717483A (zh) * | 2016-02-06 | 2016-06-29 | 北京邮电大学 | 一种基于多源定位方式的位置确定方法及装置 |
CN107436906A (zh) * | 2016-05-27 | 2017-12-05 | 高德信息技术有限公司 | 一种信息检测方法及装置 |
CN106920253A (zh) * | 2017-02-10 | 2017-07-04 | 华中科技大学 | 一种基于遮挡分层的多目标跟踪方法 |
CN108304423A (zh) * | 2017-03-29 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种信息识别方法及装置 |
CN108764226A (zh) * | 2018-04-13 | 2018-11-06 | 顺丰科技有限公司 | 图像文本识别方法、装置、设备及其存储介质 |
CN109325415A (zh) * | 2018-08-22 | 2019-02-12 | 吴昌议 | 一种基于图像列对齐特征预测所有目标区域的方法 |
CN109636771A (zh) * | 2018-10-23 | 2019-04-16 | 中国船舶重工集团公司第七0九研究所 | 基于图像处理的飞行目标检测方法及系统 |
Non-Patent Citations (2)
Title |
---|
倪志伟 等: "《现代物流技术》", 30 September 2007, 中国物资出版社 * |
张云菲: "多源道路网与兴趣点的一致性整合方法", 《中国博士学位论文全文数据库 基础科学辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116069885A (zh) * | 2023-01-05 | 2023-05-05 | 阿里巴巴(中国)有限公司 | 一种信息真实性的确定方法、装置和电子设备 |
CN116069885B (zh) * | 2023-01-05 | 2024-01-09 | 阿里巴巴(中国)有限公司 | 一种信息真实性的确定方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9665596B2 (en) | Data access based on content of image recorded by a mobile device | |
US9805065B2 (en) | Computer-vision-assisted location accuracy augmentation | |
KR20210053122A (ko) | 신경망의 훈련 방법, 장치 및 저장 매체 | |
US8891832B2 (en) | Computer-vision-assisted location check-in | |
WO2018177071A1 (zh) | 车牌号码匹配方法及装置、字符信息匹配方法及装置 | |
WO2018107996A1 (zh) | 路线规划方法及装置、计算机存储介质及终端 | |
CN104199906B (zh) | 一种拍摄区域的推荐方法及装置 | |
CN111931844B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
US9122910B2 (en) | Method, apparatus, and system for friend recommendations | |
WO2014166133A1 (en) | Method, apparatus, and system for friend recommendations | |
CN105530607A (zh) | 用户推荐方法、装置和系统 | |
JP6886516B2 (ja) | データ記憶及び呼出の方法及び装置 | |
CN106255966A (zh) | 使用店面辨识来识别待考察实体 | |
WO2011033315A1 (en) | Event reconciliation system and method | |
CN109074171A (zh) | 输入方法及电子设备 | |
CN110378276A (zh) | 车辆状态获取方法、装置、设备、及存储介质 | |
WO2018210214A1 (zh) | 设备定位方法及装置 | |
CN115063656A (zh) | 图像检测方法、装置、计算机可读存储介质及电子设备 | |
CN109521888A (zh) | 一种输入方法、装置和介质 | |
Shahid et al. | Indoor positioning:“an image-based crowdsource machine learning approach” | |
CN110390279A (zh) | 坐标识别方法、装置、设备、及计算机可读存储介质 | |
CN106960026A (zh) | 搜索方法、搜索引擎和电子设备 | |
CN110457604A (zh) | 基于人工智能的推荐方法及相关设备 | |
CN108021669A (zh) | 图像分类方法和装置、电子设备、计算机可读存储介质 | |
Vo et al. | WhereAmI: Energy efficient positioning using partial textual signatures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191029 |