CN112560586A - 一种杆塔标识牌结构化数据获得方法、装置及电子设备 - Google Patents
一种杆塔标识牌结构化数据获得方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112560586A CN112560586A CN202011360719.8A CN202011360719A CN112560586A CN 112560586 A CN112560586 A CN 112560586A CN 202011360719 A CN202011360719 A CN 202011360719A CN 112560586 A CN112560586 A CN 112560586A
- Authority
- CN
- China
- Prior art keywords
- signboard
- tower
- tower signboard
- image
- obtaining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000009466 transformation Effects 0.000 claims abstract description 32
- 238000001514 detection method Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims description 36
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000003708 edge detection Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 229910052704 radon Inorganic materials 0.000 description 2
- SYUHGPGVQRZVTB-UHFFFAOYSA-N radon atom Chemical compound [Rn] SYUHGPGVQRZVTB-UHFFFAOYSA-N 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本说明书一个或多个实施例提供一种杆塔标识牌结构化数据获得方法、装置及电子设备,所述获得方法包括获取原始图像;将所述原始图像输入预训练好的目标检测模型中,获得杆塔标识牌图像、所述杆塔标识牌图像中的标识信息以及所述杆塔标识牌图像中的内容边线;根据所述标识信息之间的位置关系,获得所述杆塔标识牌图像的类别;根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度;输出所述杆塔标识牌的所述标识信息、类别以及几何变换精度。本发明实施例通过预先训练好的目标检测方法,能够对标识牌同时进行定位与识别,简化了识别步骤,有效的提高了标识牌结构化数据的识别效率。
Description
技术领域
本说明书一个或多个实施例涉及杆塔标识牌结构化数据识别技术领域,尤其涉及一种杆塔标识牌结构化数据获得方法、装置及电子设备。
背景技术
目前,使用无人机航拍对输电线路进行巡检的技术日益成熟,无人机巡检过程中,通过拍摄杆塔上的标识牌,并配合算法进行自动识别,能够对输电线路进行准确的定位。
现有技术中,对杆塔标识牌进行自动识别算法的主要步骤为:针对任意图片,先定位图片中的全部四边形框,针对该图片中的每个四边形框,识别该四边形框内是否具有标识信息,若有,则该四边形框为标识牌,识别该标识牌的结构化数据,若没有,则放弃该四边形框,继续识别下一个四边形框。
发明人发现,现有技术中,自动识别算法中采用不同的算法进行定位与识别,需要进行多种算法与模型的运用与训练,增大计算成本,识别效率低下。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种杆塔标识牌结构化数据获得方法、装置及电子设备,以解决现有技术中标识牌结构化数据识别效率低下的问题。
基于上述目的,本说明书一个或多个实施例提供了一种杆塔标识牌结构化数据获得方法,包括:
获取原始图像;
将所述原始图像输入预训练好的目标检测模型中,获得杆塔标识牌图像、所述杆塔标识牌图像中的标识信息以及所述杆塔标识牌图像中的内容边线;
根据所述标识信息之间的位置关系,获得所述杆塔标识牌图像的类别;
根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度;
输出所述杆塔标识牌的所述标识信息、类别以及几何变换精度。
作为一种可选的实施方式,所述目标检测模型为YOLO v3或者YOLO v4模型;
所述第一目标检测模型的训练方法为:
获取训练集,所述训练集包括标记好杆塔标识牌区域坐标、杆塔标识牌上的标识信息以及杆塔标识牌图像中的内容边线的训练图像;
将所述训练集内的训练图像输入YOLO v3或者YOLO v4模型进行迭代运算,直至达到预设的迭代次数;
获得训练好的YOLO v3或者YOLO v4模型。
作为一种可选的实施方式,所述杆塔标识牌图像中的内容边线的标记方法为:
绘制一个矩形框,使所述矩形框的其中一条对角线与所述内容边线重合。
作为一种可选的实施方式,所述根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度,包括
对所述杆塔标识牌图像进行边缘检测,获得杆塔标识牌边缘图像;
根据所述内容边线,获得所述杆塔标识牌边缘图像中的标识牌边线;
计算所述标识牌边线的偏转角度;
根据所述标识牌边线的偏转角度,获得所述杆塔标识牌图像的几何变换精度。
作为一种可选的实施方式,所述杆塔标识牌图像中的标识信息包括标识牌拥有者Owner、线路Title、电话Dh以及杆序号Gh。
与所述获得方法相对应的,本发明实施例还提供了一种杆塔标识牌结构化数据获得装置,包括:
第一获取模块,用于获取原始图像;
第一计算模块,用于将所述原始图像输入预训练好的目标检测模型中,获得杆塔标识牌图像、所述杆塔标识牌图像中的标识信息以及所述杆塔标识牌图像中的内容边线;
第二计算模块,用于根据所述标识信息之间的位置关系,获得所述杆塔标识牌图像的类别;
第三计算模块,用于根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度;
输出模块,用于输出所述杆塔标识牌的所述标识信息、类别以及几何变换精度。
作为一种可选的实施方式,所述目标检测模型为YOLO v3或者YOLO v4模型;
所述获得装置还包括:
第二获取模块,用于获取训练集,所述训练集包括标记好杆塔标识牌区域坐标、杆塔标识牌上的标识信息以及杆塔标识牌图像中的内容边线的训练图像;
训练模块,用于将所述训练集内的训练图像输入YOLO v3或者YOLO v4模型进行迭代运算,直至达到预设的迭代次数;
获得模块,用于获得训练好的YOLO v3或者YOLO v4模型。
作为一种可选的实施方式,所述第一计算模块包括绘制单元,所述绘制单元用于绘制一个矩形框,使所述矩形框的其中一条对角线与所述内容边线重合。
作为一种可选的实施方式,所述第三计算模块包括
边缘检测单元,用于对所述杆塔标识牌图像进行边缘检测,获得杆塔标识牌边缘图像;
获得单元,用于根据所述内容边线,获得所述杆塔标识牌边缘图像中的标识牌边线;
第一计算单元,用于计算所述标识牌边线的偏转角度;
第二计算单元,用于根据所述标识牌边线的偏转角度,获得所述杆塔标识牌图像的几何变换精度。
与上述获得方法相对应的,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的方法。
从上面所述可以看出,本说明书一个或多个实施例提供的一种杆塔标识牌结构化数据获得方法、装置及电子设备,不同于其他目标检测与目标识别分离进行的方法,通过预先训练好的目标检测方法,能够对标识牌同时进行定位与识别,简化了识别步骤,有效的提高了标识牌结构化数据的识别效率。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例的获得方法的示意图;
图2为本说明书一个或多个实施例的获得装置的示意图;
图3为本说明书一个或多个实施例的电子设备的示意图;
图4为本说明书一个或多个实施例的对杆塔标识牌图像进行边缘检测的示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本公开进一步详细说明。
为了实现上述发明目的,本发明实施例提供了一种杆塔标识牌结构化数据获得方法,包括:
获取原始图像;
将所述原始图像输入预训练好的目标检测模型中,获得杆塔标识牌图像、所述杆塔标识牌图像中的标识信息以及所述杆塔标识牌图像中的内容边线;
根据所述标识信息之间的位置关系,获得所述杆塔标识牌图像的类别;
根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度;
输出所述杆塔标识牌的所述标识信息、类别以及几何变换精度。
本发明实施例中,针对原始图像,能够同时定位出原始图像中的杆塔标识牌图像、识别出杆塔标识牌图像中的标识信息且识别出杆塔标识牌图像中的内容边线,再通过标识信息之间的位置关系,获得所述杆塔标识牌图像的类别、通过内容边线计算所述杆塔标识牌图像的几何变换精度,从而输出杆塔标识牌的所述标识信息、类别以及几何变换精度。本发明实施例中,不同于其他目标检测与目标识别分离进行的方法,通过预先训练好的目标检测方法,能够对标识牌同时进行定位与识别,简化了识别步骤,有效的提高了标识牌结构化数据的识别效率。
请参考图1,本发明实施例提供了一种杆塔标识牌结构化数据获得方法,包括:
S100、获取原始图像。
可选的,所述原始图像通过无人机巡检时,无人机上携带的拍摄设备拍摄获得。
S200、将所述原始图像输入预训练好的目标检测模型中,获得杆塔标识牌图像、所述杆塔标识牌图像中的标识信息以及所述杆塔标识牌图像中的内容边线。
作为一种可选的实施方式,所述目标检测模型为YOLO v3或者YOLO v4模型;
所述第一目标检测模型的训练方法为:
获取训练集,所述训练集包括标记好杆塔标识牌区域坐标、杆塔标识牌上的标识信息以及杆塔标识牌图像中的内容边线的训练图像;
将所述训练集内的训练图像输入YOLO v3或者YOLO v4模型进行迭代运算,直至达到预设的迭代次数;
获得训练好的YOLO v3或者YOLO v4模型。
以YOLO v4为例,其主要包括如下几个部分:
输入一张图片,经过主干特征提取网络的CSPDarknet53会提取到3个初始特征层用于目标检测,三个初始特征层位于CSPDarknet53的不同位置,它们的shape分别为(608,608,32)、(304,304,64)、(152,152,128),这三个特征层分别用来检测小、中等大小以及较大的目标;
由CSPDarknet53提取得到3个初始特征层之后经过一定的处理,会得到3个有效的特征层,shape分别为(76,76,256)、(38,38,512)、(19,19,1024);YOLOv4将SPP结构参杂在对CSPdarknet53的最后一个特征层的卷积中,在对CSPdarknet53的最后一个特征层进行三次DarknetConv2D_BN_Leaky卷积后,分别利用四个不同尺度的最大池化进行处理,最大池化的池化核大小分别为13x13、9x9、5x5、1x1(1x1为无处理),这样可以极大地增加感受野以分离出最显著的上下文特征;同时,YOLOv4模型通过对三个有效特征层使用PANet结构,实现对特征层从上到下特征的反复提取;
YOLOv4模型经过对目标对象的特征提取后,利用YOLOv3 Head对获取的特征进行预测,得到三个有效特征层的预测结果,相应的shape数据也随之得出,并可明确3个预测框的位置;但这个预测结果并不对应着最终的预测框在原图片上的位置,还需要对每个特征层进行解码。解码后可获取预测框在原图片上的位置,这些预测框再经过相关算法筛选方可绘制在原图片上;
以上过程可完成YOLOv4目标检测的最终呈现效果。
可选的,所述杆塔标识牌图像中的标识信息包括标识牌拥有者Owner、线路Title、电话Dh以及杆序号Gh。
可选的,所述杆塔标识牌图像中的内容边线的标记方法为:
绘制一个矩形框,使所述矩形框的其中一条对角线与所述内容边线重合,用来提高标注的精度,减少背景信息在识别信息中的占比,使图像标定精准性更强,其中,zb与yb分别表示其中一条对角线与左侧内容边线与右侧内容边线重合的矩形框。
S300、根据所述标识信息之间的位置关系,获得所述杆塔标识牌图像的类别。
可选的,可以使用SVM、决策树、随机森林等采用机器学习方法,依据标识牌的Owner、线路Title、电话Dh以及杆序号Gh之间的位置关系,对杆塔标识牌图像的类型进行分类,目前将杆塔标识牌图像分为2类:A类(上下结构)、B类(左右结构)。
S400、根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度。
作为一种可选的实施方式,所述根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度,包括
对所述杆塔标识牌图像进行边缘检测,获得杆塔标识牌边缘图像;
根据所述内容边线,获得所述杆塔标识牌边缘图像中的标识牌边线;
计算所述标识牌边线的偏转角度;
根据所述标识牌边线的偏转角度,获得所述杆塔标识牌图像的几何变换精度。
可选的,使用CANNY算子、拉普拉斯算子、Sobel算子等结合OPENCV的边缘检测方法对所述杆塔标识牌图像进行边缘检测,如图4所示,获得杆塔标识牌边缘图像。
通过离散化梯度逼近函数根据二维灰度矩阵梯度向量来寻找图像灰度矩阵的灰度跃变位置,然后在图像中将这些位置的点连起来构成的图像边缘,具体过程为:
1)平滑滤波:因为梯度计算容易受噪声影响,所以先使用滤波平滑图像去除噪声,例如高斯滤波、均值滤波等;
2)锐化滤波:为了检测边界,需要确定邻域中灰度变化,锐化突出了灰度变化的区域,例如拉普拉斯锐化、索贝尔锐化等;
3)边缘判定:通过阈值或灰度变换,剔除某些处理点,查找边缘点;
4)边缘连接:将间断的边缘连接成有意义的完整边缘,同时去除假边缘,从而获得杆塔标识牌边缘图像。
可选的,计算所述标识牌边线的偏转角度,包括
获得杆塔标识牌边缘图像后,通过Hough变换或Randon变换能够计算出图像的倾斜角度,例如
1)Hough变换
一条直线在直角坐标系下可以用y=kx+b表示,hough变换的主要思想是利用该方程的参数空间和变量空间的对应关系。在变量空间里(x,y)作为已知量,在参数空间(k,b)作为变量坐标,或者相反。直线y=k1×x+b1在参数空间映射的点为(k1,b1),参数空间直线y1=k×x1+b在变量空间映射的点为(x1,y1),过变量(x,y)有无数条直线与参数空间点对应。由此可以做如下推论:在变量空间N个点分布在同一直线上,各个点在参数空间中按照倾斜角度均匀提取M条直线,则M×N条直线会在参数空间中有一个重叠数目达到M的点,该点对应的变量空间的直线的倾斜角度便是文字图像的倾斜角度。由于斜率K在直线垂直X周的情况下为无穷大,所以直接用直角坐标系下的参数映射法存在不合适实际情况的地方。
选用极坐标,ρ=cos(θ)×x+sin(θ)×y,ρ表示直线到原点的距离,θ为线上点与原点连线与X轴角度,同时也是图像的偏转角度。
ρ=cos(θ)×x+sin(θ)×y=Asin(α+θ)
2)Randon变换
在图像投影中,一条直线沿着它的发现方向投影最长,沿着水平方向投影最短,此称之为Radon变换。定义:二元函数f(x,y)的投影是在某一方向上的线积分,例如f(x,y)在垂直方向上的线积分是f(x,y)在x方向上的投影,在水平方向上的线积分是在y方向上的投影,沿y'方向的线积分是沿x'方向上的投影。
投影可沿任意角度进行,通常f(x,y)的Radon变换是f(x,y)平行于y’轴的线积分,格式如下:
S500、输出所述杆塔标识牌的所述标识信息、类别以及几何变换精度。
需要说明的是,本说明书一个或多个实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
基于上面所述杆塔标识牌结构化数据获得方法的任意一个实施例,本发明还提供了一种杆塔标识牌结构化数据获得装置,如图2所示,包括:
第一获取模块10,用于获取原始图像;
第一计算模块20,用于将所述原始图像输入预训练好的目标检测模型中,获得杆塔标识牌图像、所述杆塔标识牌图像中的标识信息以及所述杆塔标识牌图像中的内容边线;
第二计算模块30,用于根据所述标识信息之间的位置关系,获得所述杆塔标识牌图像的类别;
第三计算模块40,用于根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度;
输出模块50,用于输出所述杆塔标识牌的所述标识信息、类别以及几何变换精度。
本发明实施例中,针对原始图像,能够同时定位出原始图像中的杆塔标识牌图像、识别出杆塔标识牌图像中的标识信息且识别出杆塔标识牌图像中的内容边线,再通过标识信息之间的位置关系,获得所述杆塔标识牌图像的类别、通过内容边线计算所述杆塔标识牌图像的几何变换精度,从而输出杆塔标识牌的所述标识信息、类别以及几何变换精度。本发明实施例中,不同于其他目标检测与目标识别分离进行的方法,通过预先训练好的目标检测方法,能够对标识牌同时进行定位与识别,简化了识别步骤,有效的提高了标识牌结构化数据的识别效率。
作为一种可选的实施方式,所述目标检测模型为YOLO v3或者YOLO v4模型;
所述获得装置还包括:
第二获取模块,用于获取训练集,所述训练集包括标记好杆塔标识牌区域坐标、杆塔标识牌上的标识信息以及杆塔标识牌图像中的内容边线的训练图像;
训练模块,用于将所述训练集内的训练图像输入YOLO v3或者YOLO v4模型进行迭代运算,直至达到预设的迭代次数;
获得模块,用于获得训练好的YOLO v3或者YOLO v4模型。
作为一种可选的实施方式,所述第一计算模块包括绘制单元,所述绘制单元用于绘制一个矩形框,使所述矩形框的其中一条对角线与所述内容边线重合。
作为一种可选的实施方式,所述第三计算模块包括
边缘检测单元,用于对所述杆塔标识牌图像进行边缘检测,获得杆塔标识牌边缘图像;
获得单元,用于根据所述内容边线,获得所述杆塔标识牌边缘图像中的标识牌边线;
第一计算单元,用于计算所述标识牌边线的偏转角度;
第二计算单元,用于根据所述标识牌边线的偏转角度,获得所述杆塔标识牌图像的几何变换精度。
需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本说明书一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
基于上面所述杆塔标识牌结构化数据获得方法的任意一个实施例,本发明还提供了一种更为具体的电子设备硬件结构示意图,如图3所示,该电子设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种杆塔标识牌结构化数据获得方法,其特征在于,包括:
获取原始图像;
将所述原始图像输入预训练好的目标检测模型中,获得杆塔标识牌图像、所述杆塔标识牌图像中的标识信息以及所述杆塔标识牌图像中的内容边线;
根据所述标识信息之间的位置关系,获得所述杆塔标识牌图像的类别;
根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度;
输出所述杆塔标识牌的所述标识信息、类别以及几何变换精度。
2.根据权利要求1所述的杆塔标识牌结构化数据获得方法,其特征在于,所述目标检测模型为YOLO v3或者YOLO v4模型;
所述第一目标检测模型的训练方法为:
获取训练集,所述训练集包括标记好杆塔标识牌区域坐标、杆塔标识牌上的标识信息以及杆塔标识牌图像中的内容边线的训练图像;
将所述训练集内的训练图像输入YOLO v3或者YOLO v4模型进行迭代运算,直至达到预设的迭代次数;
获得训练好的YOLO v3或者YOLO v4模型。
3.根据权利要求2所述的杆塔标识牌结构化数据获得方法,其特征在于,所述杆塔标识牌图像中的内容边线的标记方法为:
绘制一个矩形框,使所述矩形框的其中一条对角线与所述内容边线重合。
4.根据权利要求1所述的杆塔标识牌结构化数据获得方法,其特征在于,所述根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度,包括
对所述杆塔标识牌图像进行边缘检测,获得杆塔标识牌边缘图像;
根据所述内容边线,获得所述杆塔标识牌边缘图像中的标识牌边线;
计算所述标识牌边线的偏转角度;
根据所述标识牌边线的偏转角度,获得所述杆塔标识牌图像的几何变换精度。
5.根据权利要求1所述的杆塔标识牌结构化数据获得方法,其特征在于,所述杆塔标识牌图像中的标识信息包括标识牌拥有者Owner、线路Title、电话Dh以及杆序号Gh。
6.一种杆塔标识牌结构化数据获得装置,其特征在于,包括:
第一获取模块,用于获取原始图像;
第一计算模块,用于将所述原始图像输入预训练好的目标检测模型中,获得杆塔标识牌图像、所述杆塔标识牌图像中的标识信息以及所述杆塔标识牌图像中的内容边线;
第二计算模块,用于根据所述标识信息之间的位置关系,获得所述杆塔标识牌图像的类别;
第三计算模块,用于根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度;
输出模块,用于输出所述杆塔标识牌的所述标识信息、类别以及几何变换精度。
7.根据权利要求6所述的杆塔标识牌结构化数据获得装置,其特征在于,所述目标检测模型为YOLO v3或者YOLO v4模型;
所述获得装置还包括:
第二获取模块,用于获取训练集,所述训练集包括标记好杆塔标识牌区域坐标、杆塔标识牌上的标识信息以及杆塔标识牌图像中的内容边线的训练图像;
训练模块,用于将所述训练集内的训练图像输入YOLO v3或者YOLO v4模型进行迭代运算,直至达到预设的迭代次数;
获得模块,用于获得训练好的YOLO v3或者YOLO v4模型。
8.根据权利要求6所述的杆塔标识牌结构化数据获得装置,其特征在于,所述第一计算模块包括绘制单元,所述绘制单元用于绘制一个矩形框,使所述矩形框的其中一条对角线与所述内容边线重合。
9.根据权利要求6所述的杆塔标识牌结构化数据获得装置,其特征在于,所述第三计算模块包括
边缘检测单元,用于对所述杆塔标识牌图像进行边缘检测,获得杆塔标识牌边缘图像;
获得单元,用于根据所述内容边线,获得所述杆塔标识牌边缘图像中的标识牌边线;
第一计算单元,用于计算所述标识牌边线的偏转角度;
第二计算单元,用于根据所述标识牌边线的偏转角度,获得所述杆塔标识牌图像的几何变换精度。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011360719.8A CN112560586B (zh) | 2020-11-27 | 2020-11-27 | 一种杆塔标识牌结构化数据获得方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011360719.8A CN112560586B (zh) | 2020-11-27 | 2020-11-27 | 一种杆塔标识牌结构化数据获得方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112560586A true CN112560586A (zh) | 2021-03-26 |
CN112560586B CN112560586B (zh) | 2024-05-10 |
Family
ID=75046457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011360719.8A Active CN112560586B (zh) | 2020-11-27 | 2020-11-27 | 一种杆塔标识牌结构化数据获得方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112560586B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114035606A (zh) * | 2021-11-05 | 2022-02-11 | 中国南方电网有限责任公司超高压输电公司广州局 | 杆塔巡检系统、杆塔巡检方法、控制装置和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017156920A (ja) * | 2016-03-01 | 2017-09-07 | 株式会社日立情報通信エンジニアリング | 画像処理装置及び画像処理プログラム |
CN107679531A (zh) * | 2017-06-23 | 2018-02-09 | 平安科技(深圳)有限公司 | 基于深度学习的车牌识别方法、装置、设备及存储介质 |
CN109376768A (zh) * | 2018-09-21 | 2019-02-22 | 福州大学 | 一种基于深度学习的航拍图像杆塔标识牌故障诊断方法 |
WO2019232830A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 机场异物检测方法、装置、计算机设备及存储介质 |
CN110766098A (zh) * | 2019-11-07 | 2020-02-07 | 中国石油大学(华东) | 基于改进YOLOv3的交通场景小目标检测方法 |
CN110956169A (zh) * | 2018-09-27 | 2020-04-03 | 杭州海康威视数字技术股份有限公司 | 一种车牌识别方法、装置及电子设备 |
CN110969166A (zh) * | 2019-12-04 | 2020-04-07 | 国网智能科技股份有限公司 | 一种巡检场景下小目标识别方法和系统 |
WO2020164282A1 (zh) * | 2019-02-14 | 2020-08-20 | 平安科技(深圳)有限公司 | 基于yolo的图像目标识别方法、装置、电子设备和存储介质 |
CN111639642A (zh) * | 2020-05-07 | 2020-09-08 | 浙江大华技术股份有限公司 | 一种图像处理方法、设备及装置 |
-
2020
- 2020-11-27 CN CN202011360719.8A patent/CN112560586B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017156920A (ja) * | 2016-03-01 | 2017-09-07 | 株式会社日立情報通信エンジニアリング | 画像処理装置及び画像処理プログラム |
CN107679531A (zh) * | 2017-06-23 | 2018-02-09 | 平安科技(深圳)有限公司 | 基于深度学习的车牌识别方法、装置、设备及存储介质 |
WO2019232830A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 机场异物检测方法、装置、计算机设备及存储介质 |
CN109376768A (zh) * | 2018-09-21 | 2019-02-22 | 福州大学 | 一种基于深度学习的航拍图像杆塔标识牌故障诊断方法 |
CN110956169A (zh) * | 2018-09-27 | 2020-04-03 | 杭州海康威视数字技术股份有限公司 | 一种车牌识别方法、装置及电子设备 |
WO2020164282A1 (zh) * | 2019-02-14 | 2020-08-20 | 平安科技(深圳)有限公司 | 基于yolo的图像目标识别方法、装置、电子设备和存储介质 |
CN110766098A (zh) * | 2019-11-07 | 2020-02-07 | 中国石油大学(华东) | 基于改进YOLOv3的交通场景小目标检测方法 |
CN110969166A (zh) * | 2019-12-04 | 2020-04-07 | 国网智能科技股份有限公司 | 一种巡检场景下小目标识别方法和系统 |
CN111639642A (zh) * | 2020-05-07 | 2020-09-08 | 浙江大华技术股份有限公司 | 一种图像处理方法、设备及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114035606A (zh) * | 2021-11-05 | 2022-02-11 | 中国南方电网有限责任公司超高压输电公司广州局 | 杆塔巡检系统、杆塔巡检方法、控制装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112560586B (zh) | 2024-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109961009B (zh) | 基于深度学习的行人检测方法、系统、装置及存储介质 | |
CN108121931B (zh) | 二维码数据处理方法、装置及移动终端 | |
US9767604B2 (en) | Image analysis method by analyzing point cloud using hierarchical search tree | |
CN109815770B (zh) | 二维码检测方法、装置及系统 | |
CN108875537B (zh) | 对象检测方法、装置和系统及存储介质 | |
CN108876804B (zh) | 抠像模型训练和图像抠像方法、装置和系统及存储介质 | |
WO2010093680A1 (en) | System and method for capturing and detecting barcodes using vision on chip processor | |
CN110852311A (zh) | 一种三维人手关键点定位方法及装置 | |
CN111797821A (zh) | 文本检测方法、装置、电子设备及计算机存储介质 | |
CN112528318A (zh) | 一种图像脱敏的方法、装置及电子设备 | |
CN114298902A (zh) | 一种图像对齐方法、装置、电子设备和存储介质 | |
CN111199169A (zh) | 图像处理方法和装置 | |
CN114139564B (zh) | 二维码检测方法、装置、终端设备及检测网络的训练方法 | |
CN112560586B (zh) | 一种杆塔标识牌结构化数据获得方法、装置及电子设备 | |
CN108960246B (zh) | 一种用于图像识别的二值化处理装置及方法 | |
CN111709377B (zh) | 特征提取方法、目标重识别方法、装置及电子设备 | |
CN114049568A (zh) | 基于图像比对的标的物形变检测方法、装置、设备及介质 | |
CN109523570B (zh) | 运动参数计算方法及装置 | |
CN112197708B (zh) | 测量方法及装置、电子设备及存储介质 | |
CN106663317B (zh) | 数字图像的形态学处理方法和数字图像处理装置 | |
CN111080683B (zh) | 图像处理方法、装置、存储介质及电子设备 | |
CN110222576B (zh) | 拳击动作识别方法、装置和电子设备 | |
CN112150522A (zh) | 遥感图像的配准方法、装置、设备、存储介质及系统 | |
CN114170229B (zh) | 印制电路板缺陷图像配准方法、装置、设备及存储介质 | |
CN110717060A (zh) | 图像mask的过滤方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |