CN116309494B - 一种电子地图中兴趣点信息确定方法、装置、设备及介质 - Google Patents
一种电子地图中兴趣点信息确定方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116309494B CN116309494B CN202310298496.4A CN202310298496A CN116309494B CN 116309494 B CN116309494 B CN 116309494B CN 202310298496 A CN202310298496 A CN 202310298496A CN 116309494 B CN116309494 B CN 116309494B
- Authority
- CN
- China
- Prior art keywords
- image
- intersection point
- identified
- target
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000004364 calculation method Methods 0.000 claims abstract description 35
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 22
- 230000009466 transformation Effects 0.000 claims abstract description 21
- 238000006243 chemical reaction Methods 0.000 claims abstract description 15
- 238000001514 detection method Methods 0.000 claims abstract description 14
- 238000009499 grossing Methods 0.000 claims abstract description 12
- 230000002146 bilateral effect Effects 0.000 claims abstract description 9
- 238000010606 normalization Methods 0.000 claims abstract description 9
- 238000000605 extraction Methods 0.000 claims description 75
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 13
- 238000012015 optical character recognition Methods 0.000 claims description 10
- 238000003709 image segmentation Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 239000000654 additive Substances 0.000 claims description 5
- 230000000996 additive effect Effects 0.000 claims description 5
- 230000007246 mechanism Effects 0.000 claims description 5
- 230000003287 optical effect Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G06T5/70—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Abstract
本申请提供了一种电子地图中兴趣点信息确定方法、装置、设备及介质,其中,对待识别图像进行图像均值和高斯平滑计算后进行颜色空间转换,将转换得到的图像进行差值计算和归一化处理得到初始显著区域图像;将初始显著区域图像输入残差网络进行检测得到目标显著区域图像;将每个目标显著区域图像使用编码解码器和双分辨率双边网络进行分割得到待提取图像;对待提取图像进行灰度变换和自适应阈值二值化算法处理得到候选提取图像;利用多边形逼近法和反投影重建算法对候选提取图像进行处理并利用识别网络进行识别得到兴趣点文字信息;将文字信息与图像属性进行关联得到兴趣点信息。采用上述方法,以提高从电子地图中获取到的兴趣点信息的准确度。
Description
技术领域
本发明涉及图像处理领域,具体而言,涉及一种电子地图中兴趣点信息确定方法、装置、设备及介质。
背景技术
随着计算机的不断进步和发展,电子地图已经被越来越多的应用到人们的日常生活中,人们可以通过在电子地图获得所需的地理位置信息。目前,为了更好的为用户提供导航服务,会采集大量的兴趣点信息,并将采集到的兴趣点信息添加到在电子地图中,兴趣点信息不仅能够用于关键位置的定位,还能产生很多的增值服务;每个兴趣点信息包含名称、地址、电话,坐标等,后续,用户想要去哪个兴趣点,可通过在电子地图输入关键词来检索该兴趣点信息。
现有技术中,在获取兴趣点信息时,通常是由相关人员根据经验对电子地图中包含兴趣点信息的图片中的文字进行人眼识别和解读,然后将识别得到的兴趣点文字信息存储在数据库中,从而得到兴趣点信息。但是发明人在研究中发现,受限于相关人员的经验不足或者是人眼识别的误差情况,很可能会导致使用上述方法得到的兴趣点信息与实际情况不符,出现获取到的兴趣点信息是错误的情况,从而降低了从电子地图中获取到的兴趣点信息的准确度。
发明内容
有鉴于此,本发明的目的在于提供一种电子地图中兴趣点信息确定方法、装置、设备及介质,以提高从电子地图中获取到的兴趣点信息的准确度。
第一方面,本申请实施例提供了一种电子地图中兴趣点信息确定方法,所述方法包括:
获取待识别图像,其中,所述待识别图像中包含至少一个兴趣点,所述待识别图像为RGB图像;
对所述待识别图像进行图像均值计算得到第一初始图像,并对所述待识别图像进行高斯平滑计算得到第二初始图像;
将所述第一初始图像进行颜色空间转换得到第一候选图像,并将所述第二初始图像进行颜色空间转换得到第二候选图像,其中,所述第一候选图像和所述第二候选图像均为LAB图像;
将所述第一候选图像和所述第二候选图像进行差值计算,并将进行差值计算后得到的图像结果进行归一化处理,得到所述待识别图像中所包含的至少一个初始显著区域图像;
将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像;
对于所述至少一个目标显著区域图像中的每个所述目标显著区域图像,使用编码解码器和双分辨率双边网络对该目标显著区域图像进行图像分割得到待提取图像;
对所述待提取图像进行灰度变换,然后利用自适应阈值二值化算法对进行灰度变换后的待提取图像进行轮廓提取得到候选提取图像;
利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像,其中,所述目标提取图像中为该目标显著区域图像中包含兴趣点的最小图像;
利用反投影重建算法对所述目标提取图像进行反投影处理,得到待识别图像;
利用训练好的光学字符识别网络对所述待识别图像中所包含的文字进行识别提取,得到该目标显著区域图像中的兴趣点所包含的文字信息;
将所述文字信息与所述待识别图像的图像属性进行关联得到所述待识别图像的兴趣点信息。
可选地,所述多边形逼近法中的多边形为四边形,所述利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像,包括:
根据所述四边形中每两条相邻的边所在的直线方程确定出所述四边形中所包含的交点,其中,所述四边形中所包含的交点包括第一交点A(x1,y1),第二交点B(x2,y2),第三交点C(x3,y3)和第四交点D(x4,y4),x1为第一交点A的横坐标,y1为第一交点A的纵坐标,x2为第二交点B的横坐标,y2为第二交点B的纵坐标,x3为第三交点C的横坐标,y3为第三交点C的纵坐标,x4为第四交点D的横坐标,y4为第四交点D的纵坐标;
根据所述四边形中所有的每两条相邻的边的交点生成投影矩阵P:
P={(x1,y1),(x2,y2),(x3,y3),(x4,y4)};
将所述候选提取图像中被所述投影矩阵P所包含的图像进行提取得到所述目标提取图像。
可选地,所述图像属性包括采集所述待识别图像时的地理位置,所述地理位置包括地理位置的三维直角坐标和欧拉角坐标。
可选地,在将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像前,所述方法还包括:
将每个所述初始显著区域图像均按照预设比例进行图像缩放。
可选地,所述光学字符识别网络包括编码模块、语言模块和解码模块,所述编码模块包括残差网络,所述语言模块包括双向长短期记忆网络,所述解码模块包括基于加性注意力机制的解码器。
第二方面,本申请实施例提供了一种电子地图中兴趣点信息确定装置,所述装置包括:
待识别图像获取模块,用于获取待识别图像,其中,所述待识别图像中包含至少一个兴趣点,所述待识别图像为RGB图像;
初始图像确定模块,用于对所述待识别图像进行图像均值计算得到第一初始图像,并对所述待识别图像进行高斯平滑计算得到第二初始图像;
候选图像确定模块,用于将所述第一初始图像进行颜色空间转换得到第一候选图像,并将所述第二初始图像进行颜色空间转换得到第二候选图像,其中,所述第一候选图像和所述第二候选图像均为LAB图像;
初始显著区域图像确定模块,用于将所述第一候选图像和所述第二候选图像进行差值计算,并将进行差值计算后得到的图像结果进行归一化处理,得到所述待识别图像中所包含的至少一个初始显著区域图像;
目标显著区域图像确定模块,用于将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像;
待提取图像确定模块,用于对于所述至少一个目标显著区域图像中的每个所述目标显著区域图像,使用编码解码器和双分辨率双边网络对该目标显著区域图像进行图像分割得到待提取图像;
候选提取图像确定模块,用于对所述待提取图像进行灰度变换,然后利用自适应阈值二值化算法对进行灰度变换后的待提取图像进行轮廓提取得到候选提取图像;
目标提取图像确定模块,用于利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像,其中,所述目标提取图像中为该目标显著区域图像中包含兴趣点的最小图像;
待识别图像确定模块,用于利用反投影重建算法对所述目标提取图像进行反投影处理,得到待识别图像;
文字信息识别模块,用于利用训练好的光学字符识别网络对所述待识别图像中所包含的文字进行识别提取,得到该目标显著区域图像中的兴趣点所包含的文字信息;
兴趣点信息生成模块,用于将所述文字信息与所述待识别图像的图像属性进行关联得到所述待识别图像的兴趣点信息。
可选地,所述多边形逼近法中的多边形为四边形,目标提取图像确定模块在用于利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像时,具体用于:
根据所述四边形中每两条相邻的边所在的直线方程确定出所述四边形中所包含的交点,其中,所述四边形中所包含的交点包括第一交点A(x1,y1),第二交点B(x2,y2),第三交点C(x3,y3)和第四交点D(x4,y4),x1为第一交点A的横坐标,y1为第一交点A的纵坐标,x2为第二交点B的横坐标,y2为第二交点B的纵坐标,x3为第三交点C的横坐标,y3为第三交点C的纵坐标,x4为第四交点D的横坐标,y4为第四交点D的纵坐标;
根据所述四边形中所有的每两条相邻的边的交点生成投影矩阵P:
P={(x1,y1),(x2,y2),(x3,y3),(x4,y4)};
将所述候选提取图像中被所述投影矩阵P所包含的图像进行提取得到所述目标提取图像。
可选地,所述图像属性包括采集所述待识别图像时的地理位置,所述地理位置包括地理位置的三维直角坐标和欧拉角坐标。
可选地,所述装置还包括:
图像缩放模块,用于在所述目标显著区域图像确定模块将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像前,将每个所述初始显著区域图像均按照预设比例进行图像缩放。
可选地,所述光学字符识别网络包括编码模块、语言模块和解码模块,所述编码模块包括残差网络,所述语言模块包括双向长短期记忆网络,所述解码模块包括基于加性注意力机制的解码器。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面中任一种可选地实施方式中所述的电子地图中兴趣点信息确定方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面中任一种可选地实施方式中所述的电子地图中兴趣点信息确定方法的步骤。
本申请提供的技术方案包括但不限于以下有益效果:
获取待识别图像,其中,所述待识别图像中包含至少一个兴趣点,所述待识别图像为RGB图像;对所述待识别图像进行图像均值计算得到第一初始图像,并对所述待识别图像进行高斯平滑计算得到第二初始图像;将所述第一初始图像进行颜色空间转换得到第一候选图像,并将所述第二初始图像进行颜色空间转换得到第二候选图像,其中,所述第一候选图像和所述第二候选图像均为LAB图像;将所述第一候选图像和所述第二候选图像进行差值计算,并将进行差值计算后得到的图像结果进行归一化处理,得到所述待识别图像中所包含的至少一个初始显著区域图像;将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像;通过上述步骤,能够从待识别图像中确定出视觉显著度高的,能够吸引用户注意力的初始显著区域图像,以为后续进行兴趣点信息的提取提供信息来源和基础。
对于所述至少一个目标显著区域图像中的每个所述目标显著区域图像,使用编码解码器和双分辨率双边网络对该目标显著区域图像进行图像分割得到待提取图像;对所述待提取图像进行灰度变换,然后利用自适应阈值二值化算法对进行灰度变换后的待提取图像进行轮廓提取得到候选提取图像;利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像,其中,所述目标提取图像中为该目标显著区域图像中包含兴趣点的最小图像;利用反投影重建算法对所述目标提取图像进行反投影处理,得到待识别图像;通过上述步骤,能够逐步减小进行兴趣点信息提取时的图像尺寸和范围,减少无关图像和区域的干扰,避免干扰信息的误差。
利用训练好的光学字符识别网络对所述待识别图像中所包含的文字进行识别提取,得到该目标显著区域图像中的兴趣点所包含的文字信息;将所述文字信息与所述待识别图像的图像属性进行关联得到所述待识别图像的兴趣点信息;通过上述步骤,能够实现对图像中所包含的兴趣点文字信息的识别和提取,并将识别得到的文字信息和图像属性进行关联得到兴趣点信息。
采用上述方法,通过从待识别图像中确定出满足预设视觉显著度要求的图像区域,然后逐渐缩小这些图像中进行文字识别的区域大小,最终对区域中的兴趣点的文字信息进行识别和关联,得到兴趣点信息,避免了人为通过经验和人眼进行图像中的文字识别,减少了人为干扰可能带来的识别误差和干扰,以提高从电子地图中获取到的兴趣点信息的准确度。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例一所提供的一种电子地图中兴趣点信息确定方法的流程图;
图2示出了本发明实施例一所提供的一种目标提取图像确定方法的流程图;
图3示出了本发明实施例二所提供的一种电子地图中兴趣点信息确定装置的结构示意图;
图4示出了本发明实施例二所提供的第二种电子地图中兴趣点信息确定装置的结构示意图;
图5示出了本发明实施例三所提供的一种计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
为便于对本申请进行理解,下面结合图1示出的本发明实施例一所提供的一种电子地图中兴趣点信息确定方法的流程图描述的内容对本申请实施例一进行详细说明。
参见图1所示,图1示出了本发明实施例一所提供的一种电子地图中兴趣点信息确定方法的流程图,其中,所述方法包括步骤S101~S106:
S101:获取待识别图像,其中,所述待识别图像中包含至少一个兴趣点,所述待识别图像为RGB图像。
具体的,通过图像采集设备例如相机、监控等设备获取包含至少一个兴趣点的待识别图像,待识别图像通常为RGB(red-green-blue,红-绿-蓝)色彩模式下的图像(称为RGB图像)。
S102:对所述待识别图像进行图像均值计算得到第一初始图像,并对所述待识别图像进行高斯平滑计算得到第二初始图像。
具体的,通过调用Matlab(Matrix Laboratory,矩阵实验室)或者OpenCV(一个跨平台计算机视觉和机器学习软件库)中的用于计算图像均值的函数对待识别图像进行图像均值计算得到第一初始图像;同时,对待识别图像进行高斯平滑计算得到第二初始图像,高斯平滑也可称作高斯模糊,是在图像处理软件中广泛使用的处理效果,通常用它来减少图像噪声以及降低细节层次;在进行高斯平滑处理时,具体是将待识别图像与正态分布做卷积,用正态分布计算图像中每个像素的变换,从而得到高斯平滑计算后的第二初始图像。
S103:将所述第一初始图像进行颜色空间转换得到第一候选图像,并将所述第二初始图像进行颜色空间转换得到第二候选图像,其中,所述第一候选图像和所述第二候选图像均为LAB图像。
具体的,第一初始图像和第二初始图像均为RGB图像,这里需要将RGB图像转换为LAB(一种颜色模型,其组成要素包括亮度L,以及a和b两个颜色通道)图像,注意,RGB图像无法直接转换成LAB图像,需要先转换成XYZ(XYZ中X、Y、Z是对RGB的一种线性变换,XYZ也分别代表了RGB三基色刺激值的概念)再转换成LAB图像,即:RGB-XYZ-LAB。
S104:将所述第一候选图像和所述第二候选图像进行差值计算,并将进行差值计算后得到的图像结果进行归一化处理,得到所述待识别图像中所包含的至少一个初始显著区域图像。
具体的,图像差值是将两个不同时期、同一波段图像的对应像元值相减,生成差值图像,将第一候选图像和第二候选图像进行差值计算得到差值图像(图像结果),然后对该图像结果进行归一化处理得到待识别图像中所包含的至少一个初始显著区域图像;显著区域图像是指视觉显著性高的图像或者是图像中的区域(子图像),视觉显著性越高就越代表这个区域更能吸引观察者注意。
S105:将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像。
具体的,训练好的残差网络用于对初始显著区域图像进行检测和分类,将属于真正的显著区域的图像筛选出来,得到至少一个目标显著区域图像,属于真正的显著区域的判断方法是满足预设显著度标准的初始显著区域图像为目标显著区域图像。
S106:对于所述至少一个目标显著区域图像中的每个所述目标显著区域图像,使用编码解码器和双分辨率双边网络对该目标显著区域图像进行图像分割得到待提取图像。
具体的,编码解码器由编码器和解码器组成,编码器可以视为特征提取网络,通常使用池化层来逐渐缩减目标显著区域图像的尺寸大小,解码器通过上采样或反卷积等网络层来逐步恢复目标的细节和相应的空间维度;通过编码解码器和双分辨率双边网络(DDRNets)分别对每个目标显著区域图像进行图像分割得到待提取图像。
S107:对所述待提取图像进行灰度变换,然后利用自适应阈值二值化算法对进行灰度变换后的待提取图像进行轮廓提取得到候选提取图像。
具体的,灰度变换是指根据某种目标条件按一定变换关系逐点改变源图像中每一个像素灰度值的方法,对待提取图像进行灰度变换,只保留一个通道;然后使用自适应阈值二值化算法对进行灰度变换后的待提取图像进行轮廓提取得到候选提取图像。
S108:利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像,其中,所述目标提取图像中为该目标显著区域图像中包含兴趣点的最小图像。
具体的,多边形逼近法也称作道格拉斯-普克算法(Douglas–Peuckeralgorithm),用于对图像中包含目标内容的最小区域(区域的形状可指定)进行提取。
S109:利用反投影重建算法对所述目标提取图像进行反投影处理,得到待识别图像。
具体的,反投影重建算法包括直接反投影重建算法和滤波反投影重建算法,利用反投影重建算法对目标提取图像进行反投影处理,得到待识别图像。
S110:利用训练好的光学字符识别网络对所述待识别图像中所包含的文字进行识别提取,得到该目标显著区域图像中的兴趣点所包含的文字信息。
具体的,训练好的光学字符识别网络用于对图片中的文字进行识别和提取,将待识别图像输入至训练好的光学字符识别网络中,得到待识别图像所归属于的该目标显著区域图像中的兴趣点所包含的文字信息。
S111:将所述文字信息与所述待识别图像的图像属性进行关联得到所述待识别图像的兴趣点信息。
具体的,在采集待识别图像时,会同时记录待识别图像的图像属性,则将文字信息与其所归属于的待识别图像的图像属性进行关联,能够得到待识别图像的兴趣点信息。
在一个可行的实施方案中,参见图2所述,图2示出了本发明实施例一所提供的一种目标提取图像确定方法的流程图,其中,所述多边形逼近法中的多边形为四边形,所述利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像,包括步骤S201~S203:
S201:根据所述四边形中每两条相邻的边所在的直线方程确定出所述四边形中所包含的交点,其中,所述四边形中所包含的交点包括第一交点A(x1,y1),第二交点B(x2,y2),第三交点C(x3,y3)和第四交点D(x4,y4),x1为第一交点A的横坐标,y1为第一交点A的纵坐标,x2为第二交点B的横坐标,y2为第二交点B的纵坐标,x3为第三交点C的横坐标,y3为第三交点C的纵坐标,x4为第四交点D的横坐标,y4为第四交点D的纵坐标。
具体的,将多边形逼近法中的约束设置为四条边,即使用四边形进行图像拟合,已知四边形中的每条边所在的直线的直线方程,则可以根据四边形中每两条相邻的边所在的直线方程确定出四边形中所包含的交点。
S202:根据所述四边形中所有的每两条相邻的边的交点生成投影矩阵P:
P={(x1,y1),(x2,y2),(x3,y3),(x4,y4)};
S203:将所述候选提取图像中被所述投影矩阵P所包含的图像进行提取得到所述目标提取图像。
在一个可行的实施方案中,所述图像属性包括采集所述待识别图像时的地理位置,所述地理位置包括地理位置的三维直角坐标和欧拉角坐标。
具体的,所述图像属性还包括采集所述待识别图像时的时间。
在一个可行的实施方案中,在将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像前,所述方法还包括:
将每个所述初始显著区域图像均按照预设比例进行图像缩放。
具体的,在将所述第一候选图像和所述第二候选图像进行差值计算,并将进行差值计算后得到的图像结果进行归一化处理,得到所述待识别图像中所包含的至少一个初始显著区域图像后,将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像前,将每个所述初始显著区域图像均按照预设比例进行图像缩放。
在一个可行的实施方案中,所述光学字符识别网络包括编码模块、语言模块和解码模块,所述编码模块包括残差网络,所述语言模块包括双向长短期记忆网络,所述解码模块包括基于加性注意力机制的解码器。
实施例二
参见图3所示,图3示出了本发明实施例二所提供的一种电子地图中兴趣点信息确定装置的结构示意图,其中,如图3所示,本发明实施例二所提供的一种电子地图中兴趣点信息确定装置包括:
待识别图像获取模块301,用于获取待识别图像,其中,所述待识别图像中包含至少一个兴趣点,所述待识别图像为RGB图像;
初始图像确定模块302,用于对所述待识别图像进行图像均值计算得到第一初始图像,并对所述待识别图像进行高斯平滑计算得到第二初始图像;
候选图像确定模块303,用于将所述第一初始图像进行颜色空间转换得到第一候选图像,并将所述第二初始图像进行颜色空间转换得到第二候选图像,其中,所述第一候选图像和所述第二候选图像均为LAB图像;
初始显著区域图像确定模块304,用于将所述第一候选图像和所述第二候选图像进行差值计算,并将进行差值计算后得到的图像结果进行归一化处理,得到所述待识别图像中所包含的至少一个初始显著区域图像;
目标显著区域图像确定模块305,用于将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像;
待提取图像确定模块306,用于对于所述至少一个目标显著区域图像中的每个所述目标显著区域图像,使用编码解码器和双分辨率双边网络对该目标显著区域图像进行图像分割得到待提取图像;
候选提取图像确定模块307,用于对所述待提取图像进行灰度变换,然后利用自适应阈值二值化算法对进行灰度变换后的待提取图像进行轮廓提取得到候选提取图像;
目标提取图像确定模块308,用于利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像,其中,所述目标提取图像中为该目标显著区域图像中包含兴趣点的最小图像;
待识别图像确定模块309,用于利用反投影重建算法对所述目标提取图像进行反投影处理,得到待识别图像;
文字信息识别模块310,用于利用训练好的光学字符识别网络对所述待识别图像中所包含的文字进行识别提取,得到该目标显著区域图像中的兴趣点所包含的文字信息;
兴趣点信息生成模块311,用于将所述文字信息与所述待识别图像的图像属性进行关联得到所述待识别图像的兴趣点信息。
在一个可行的实施方案中,所述多边形逼近法中的多边形为四边形,目标提取图像确定模块在用于利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像时,具体用于:
根据所述四边形中每两条相邻的边所在的直线方程确定出所述四边形中所包含的交点,其中,所述四边形中所包含的交点包括第一交点A(x1,y1),第二交点B(x2,y2),第三交点C(x3,y3)和第四交点D(x4,y4),x1为第一交点A的横坐标,y1为第一交点A的纵坐标,x2为第二交点B的横坐标,y2为第二交点B的纵坐标,x3为第三交点C的横坐标,y3为第三交点C的纵坐标,x4为第四交点D的横坐标,y4为第四交点D的纵坐标;
根据所述四边形中所有的每两条相邻的边的交点生成投影矩阵P:
P={(x1,y1),(x2,y2),(x3,y3),(x4,y4)};
将所述候选提取图像中被所述投影矩阵P所包含的图像进行提取得到所述目标提取图像。
在一个可行的实施方案中,所述图像属性包括采集所述待识别图像时的地理位置,所述地理位置包括地理位置的三维直角坐标和欧拉角坐标。
在一个可行的实施方案中,参见图4所示,图4示出了本发明实施例二所提供的第二种电子地图中兴趣点信息确定装置的结构示意图,其中,所述装置还包括:
图像缩放模块401,用于在所述目标显著区域图像确定模块将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像前,将每个所述初始显著区域图像均按照预设比例进行图像缩放。
在一个可行的实施方案中,所述光学字符识别网络包括编码模块、语言模块和解码模块,所述编码模块包括残差网络,所述语言模块包括双向长短期记忆网络,所述解码模块包括基于加性注意力机制的解码器。
实施例三
基于同一申请构思,参见图5所示,图5示出了本发明实施例三所提供的一种计算机设备的结构示意图,其中,如图5所示,本申请实施例三所提供的一种计算机设备500包括:
处理器501、存储器502和总线503,所述存储器502存储有所述处理器501可执行的机器可读指令,当计算机设备500运行时,所述处理器501与所述存储器502之间通过所述总线503进行通信,所述机器可读指令被所述处理器501运行时执行上述实施例一所示的电子地图中兴趣点信息确定方法的步骤。
实施例四
基于同一申请构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例中任一项所述的电子地图中兴趣点信息确定方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例所提供的进行电子地图中兴趣点信息确定的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
本发明实施例所提供的电子地图中兴趣点信息确定装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种电子地图中兴趣点信息确定方法,其特征在于,所述方法包括:
获取待识别图像,其中,所述待识别图像中包含至少一个兴趣点,所述待识别图像为RGB图像;
对所述待识别图像进行图像均值计算得到第一初始图像,并对所述待识别图像进行高斯平滑计算得到第二初始图像;
将所述第一初始图像进行颜色空间转换得到第一候选图像,并将所述第二初始图像进行颜色空间转换得到第二候选图像,其中,所述第一候选图像和所述第二候选图像均为LAB图像;
将所述第一候选图像和所述第二候选图像进行差值计算,并将进行差值计算后得到的图像结果进行归一化处理,得到所述待识别图像中所包含的至少一个初始显著区域图像;
将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像;
对于所述至少一个目标显著区域图像中的每个所述目标显著区域图像,使用编码解码器和双分辨率双边网络对该目标显著区域图像进行图像分割得到待提取图像;
对所述待提取图像进行灰度变换,然后利用自适应阈值二值化算法对进行灰度变换后的待提取图像进行轮廓提取得到候选提取图像;
利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像,其中,所述目标提取图像中为该目标显著区域图像中包含兴趣点的最小图像;
利用反投影重建算法对所述目标提取图像进行反投影处理,得到待识别图像;
利用训练好的光学字符识别网络对所述待识别图像中所包含的文字进行识别提取,得到该目标显著区域图像中的兴趣点所包含的文字信息;
将所述文字信息与所述待识别图像的图像属性进行关联得到所述待识别图像的兴趣点信息。
2.根据权利要求1所述的方法,其特征在于,所述多边形逼近法中的多边形为四边形,所述利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像,包括:
根据所述四边形中每两条相邻的边所在的直线方程确定出所述四边形中所包含的交点,其中,所述四边形中所包含的交点包括第一交点A(x1,y1),第二交点B(x2,y2),第三交点C(x3,y3)和第四交点D(x4,y4),x1为第一交点A的横坐标,y1为第一交点A的纵坐标,x2为第二交点B的横坐标,y2为第二交点B的纵坐标,x3为第三交点C的横坐标,y3为第三交点C的纵坐标,x4为第四交点D的横坐标,y4为第四交点D的纵坐标;
根据所述四边形中所有的每两条相邻的边的交点生成投影矩阵P:
P={(x1,y1),(x2,y2),(x3,y3),(x4,y4)};
将所述候选提取图像中被所述投影矩阵P所包含的图像进行提取得到所述目标提取图像。
3.根据权利要求2所述的方法,其特征在于,所述图像属性包括采集所述待识别图像时的地理位置,所述地理位置包括地理位置的三维直角坐标和欧拉角坐标。
4.根据权利要求1所述的方法,其特征在于,在将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像前,所述方法还包括:
将每个所述初始显著区域图像均按照预设比例进行图像缩放。
5.根据权利要求1所述的方法,其特征在于,所述光学字符识别网络包括编码模块、语言模块和解码模块,所述编码模块包括残差网络,所述语言模块包括双向长短期记忆网络,所述解码模块包括基于加性注意力机制的解码器。
6.一种电子地图中兴趣点信息确定装置,其特征在于,所述装置包括:
待识别图像获取模块,用于获取待识别图像,其中,所述待识别图像中包含至少一个兴趣点,所述待识别图像为RGB图像;
初始图像确定模块,用于对所述待识别图像进行图像均值计算得到第一初始图像,并对所述待识别图像进行高斯平滑计算得到第二初始图像;
候选图像确定模块,用于将所述第一初始图像进行颜色空间转换得到第一候选图像,并将所述第二初始图像进行颜色空间转换得到第二候选图像,其中,所述第一候选图像和所述第二候选图像均为LAB图像;
初始显著区域图像确定模块,用于将所述第一候选图像和所述第二候选图像进行差值计算,并将进行差值计算后得到的图像结果进行归一化处理,得到所述待识别图像中所包含的至少一个初始显著区域图像;
目标显著区域图像确定模块,用于将所述至少一个初始显著区域图像输入至训练好的残差网络中进行图像检测得到满足预设显著度标准的至少一个目标显著区域图像;
待提取图像确定模块,用于对于所述至少一个目标显著区域图像中的每个所述目标显著区域图像,使用编码解码器和双分辨率双边网络对该目标显著区域图像进行图像分割得到待提取图像;
候选提取图像确定模块,用于对所述待提取图像进行灰度变换,然后利用自适应阈值二值化算法对进行灰度变换后的待提取图像进行轮廓提取得到候选提取图像;
目标提取图像确定模块,用于利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像,其中,所述目标提取图像中为该目标显著区域图像中包含兴趣点的最小图像;
待识别图像确定模块,用于利用反投影重建算法对所述目标提取图像进行反投影处理,得到待识别图像;
文字信息识别模块,用于利用训练好的光学字符识别网络对所述待识别图像中所包含的文字进行识别提取,得到该目标显著区域图像中的兴趣点所包含的文字信息;
兴趣点信息生成模块,用于将所述文字信息与所述待识别图像的图像属性进行关联得到所述待识别图像的兴趣点信息。
7.根据权利要求6所述的装置,其特征在于,所述多边形逼近法中的多边形为四边形,目标提取图像确定模块在用于利用多边形逼近法对所述候选提取图像进行图像拟合得到目标提取图像时,具体用于:
根据所述四边形中每两条相邻的边所在的直线方程确定出所述四边形中所包含的交点,其中,所述四边形中所包含的交点包括第一交点A(x1,y1),第二交点B(x2,y2),第三交点C(x3,y3)和第四交点D(x4,y4),x1为第一交点A的横坐标,y1为第一交点A的纵坐标,x2为第二交点B的横坐标,y2为第二交点B的纵坐标,x3为第三交点C的横坐标,y3为第三交点C的纵坐标,x4为第四交点D的横坐标,y4为第四交点D的纵坐标;
根据所述四边形中所有的每两条相邻的边的交点生成投影矩阵P:
P={(x1,y1),(x2,y2),(x3,y3),(x4,y4)};
将所述候选提取图像中被所述投影矩阵P所包含的图像进行提取得到所述目标提取图像。
8.根据权利要求6所述的装置,其特征在于,所述图像属性包括采集所述待识别图像时的地理位置,所述地理位置包括地理位置的三维直角坐标和欧拉角坐标。
9.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至5中任一所述的电子地图中兴趣点信息确定方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至5中任意一项所述的电子地图中兴趣点信息确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310298496.4A CN116309494B (zh) | 2023-03-23 | 2023-03-23 | 一种电子地图中兴趣点信息确定方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310298496.4A CN116309494B (zh) | 2023-03-23 | 2023-03-23 | 一种电子地图中兴趣点信息确定方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116309494A CN116309494A (zh) | 2023-06-23 |
CN116309494B true CN116309494B (zh) | 2024-01-23 |
Family
ID=86819930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310298496.4A Active CN116309494B (zh) | 2023-03-23 | 2023-03-23 | 一种电子地图中兴趣点信息确定方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116309494B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117197211B (zh) * | 2023-09-04 | 2024-04-26 | 北京斯年智驾科技有限公司 | 一种深度图像生成方法、系统、装置及介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100619715B1 (ko) * | 2005-05-03 | 2006-09-06 | 엘지전자 주식회사 | 이동 통신 단말기를 이용한 문서 영상 촬영 방법 및 그문서 영상에서의 단어 추출방법 |
US8009928B1 (en) * | 2008-01-23 | 2011-08-30 | A9.Com, Inc. | Method and system for detecting and recognizing text in images |
CN102216941A (zh) * | 2008-08-19 | 2011-10-12 | 数字标记公司 | 用于内容处理的方法和系统 |
CN107239203A (zh) * | 2016-03-29 | 2017-10-10 | 北京三星通信技术研究有限公司 | 一种图像管理方法和装置 |
WO2017219021A1 (en) * | 2016-06-17 | 2017-12-21 | Schroeder James E | Apparatus and method for imaging and modeling the surface of a three-dimensional (3-d) object |
CN108009548A (zh) * | 2018-01-09 | 2018-05-08 | 贵州大学 | 一种智能路牌识别方法及系统 |
CN111291742A (zh) * | 2020-02-10 | 2020-06-16 | 北京百度网讯科技有限公司 | 对象识别方法和装置、电子设备、存储介质 |
CN112101165A (zh) * | 2020-09-07 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 兴趣点识别方法、装置、计算机设备和存储介质 |
CN114925295A (zh) * | 2022-06-08 | 2022-08-19 | 北京百度网讯科技有限公司 | 确定兴趣点的引导点的方法、相关装置及计算机程序产品 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7831358B2 (en) * | 1992-05-05 | 2010-11-09 | Automotive Technologies International, Inc. | Arrangement and method for obtaining information using phase difference of modulated illumination |
US20080040678A1 (en) * | 2006-08-14 | 2008-02-14 | Richard Crump | Interactive Area Guide Method, System and Apparatus |
KR101042910B1 (ko) * | 2008-11-13 | 2011-06-21 | 엔에이치엔(주) | 전자 지도를 이용하여 서비스를 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
US20120127297A1 (en) * | 2010-11-24 | 2012-05-24 | Baxi Vipul A | Digital microscopy with focus grading in zones distinguished for comparable image structures |
US9165206B2 (en) * | 2011-12-12 | 2015-10-20 | Google Inc. | Updating point of interest data based on an image |
US10031925B2 (en) * | 2014-10-15 | 2018-07-24 | Thinkcx Technologies, Inc. | Method and system of using image recognition and geolocation signal analysis in the construction of a social media user identity graph |
-
2023
- 2023-03-23 CN CN202310298496.4A patent/CN116309494B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100619715B1 (ko) * | 2005-05-03 | 2006-09-06 | 엘지전자 주식회사 | 이동 통신 단말기를 이용한 문서 영상 촬영 방법 및 그문서 영상에서의 단어 추출방법 |
US8009928B1 (en) * | 2008-01-23 | 2011-08-30 | A9.Com, Inc. | Method and system for detecting and recognizing text in images |
CN102216941A (zh) * | 2008-08-19 | 2011-10-12 | 数字标记公司 | 用于内容处理的方法和系统 |
CN107239203A (zh) * | 2016-03-29 | 2017-10-10 | 北京三星通信技术研究有限公司 | 一种图像管理方法和装置 |
WO2017219021A1 (en) * | 2016-06-17 | 2017-12-21 | Schroeder James E | Apparatus and method for imaging and modeling the surface of a three-dimensional (3-d) object |
CN108009548A (zh) * | 2018-01-09 | 2018-05-08 | 贵州大学 | 一种智能路牌识别方法及系统 |
CN111291742A (zh) * | 2020-02-10 | 2020-06-16 | 北京百度网讯科技有限公司 | 对象识别方法和装置、电子设备、存储介质 |
CN112101165A (zh) * | 2020-09-07 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 兴趣点识别方法、装置、计算机设备和存储介质 |
CN114925295A (zh) * | 2022-06-08 | 2022-08-19 | 北京百度网讯科技有限公司 | 确定兴趣点的引导点的方法、相关装置及计算机程序产品 |
Non-Patent Citations (5)
Title |
---|
Point Cloud Saliency Detection by Local and Global Feature Fusion;Xiaoying Ding;《IEEE Transactions on Image Processing》;全文 * |
基于视觉的文字识别系统的设计与实现;乔海晔, 肖南峰;交通与计算机(第05期);全文 * |
未知环境中基于视觉显著区域的拓扑定位;王璐;李玉玲;蔡自兴;;计算机应用(第09期);全文 * |
蒋梦迪 ; 程江华 ; 陈明辉 ; 库锡树 ; .视频和图像文本提取方法综述.计算机科学.2017,(第S2期),第9-10页. * |
视频和图像文本提取方法综述;蒋梦迪;程江华;陈明辉;库锡树;;计算机科学(第S2期);第9-10页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116309494A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8509499B2 (en) | Automatic face detection and identity masking in images, and applications thereof | |
EP1612733B1 (en) | Color segmentation-based stereo 3D reconstruction system and process | |
US9042648B2 (en) | Salient object segmentation | |
CN108491848B (zh) | 基于深度信息的图像显著性检测方法和装置 | |
EP1555634A1 (en) | Method and apparatus for automatically determining image foreground color | |
CN112418216B (zh) | 一种复杂自然场景图像中的文字检测方法 | |
CN110874594A (zh) | 基于语义分割网络的人体外表损伤检测方法及相关设备 | |
CN107172354B (zh) | 视频处理方法、装置、电子设备及存储介质 | |
CN111369581A (zh) | 图像处理方法、装置、设备及存储介质 | |
Vitoria et al. | Semantic image inpainting through improved wasserstein generative adversarial networks | |
CN110992366B (zh) | 一种图像语义分割方法、装置及存储介质 | |
CN116309494B (zh) | 一种电子地图中兴趣点信息确定方法、装置、设备及介质 | |
CN112651953B (zh) | 图片相似度计算方法、装置、计算机设备及存储介质 | |
CN111104813A (zh) | 二维码图像关键点检测方法、装置、电子设备及存储介质 | |
CN116168351B (zh) | 电力设备巡检方法及装置 | |
CN112380940A (zh) | 一种高空抛物监控图像的处理方法、装置、电子设备和存储介质 | |
CN116798041A (zh) | 图像识别方法、装置和电子设备 | |
CN116958033A (zh) | 异常检测方法、模型训练方法、装置、设备和介质 | |
CN114937023A (zh) | 一种承压设备的缺陷识别方法及装置 | |
Zhu et al. | A random-valued impulse noise removal algorithm via just noticeable difference threshold detector and weighted variation method | |
CN114913287A (zh) | 一种三维人体模型重建方法及系统 | |
CN113516609A (zh) | 分屏视频检测方法、装置、计算机设备和存储介质 | |
Zhang et al. | Quality Assessment for DIBR-synthesized Views based on Wavelet Transform and Gradient Magnitude Similarity | |
Sekhar et al. | An object-based splicing forgery detection using multiple noise features | |
CN112734901B (zh) | 一种3d说明书生成方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |