CN111414855B - 基于端到端回归模型的电线杆标牌目标检测及识别方法 - Google Patents
基于端到端回归模型的电线杆标牌目标检测及识别方法 Download PDFInfo
- Publication number
- CN111414855B CN111414855B CN202010197247.2A CN202010197247A CN111414855B CN 111414855 B CN111414855 B CN 111414855B CN 202010197247 A CN202010197247 A CN 202010197247A CN 111414855 B CN111414855 B CN 111414855B
- Authority
- CN
- China
- Prior art keywords
- training
- image
- telegraph pole
- target detection
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 63
- 230000011218 segmentation Effects 0.000 claims abstract description 10
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 238000013526 transfer learning Methods 0.000 claims abstract description 8
- 238000013527 convolutional neural network Methods 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 10
- 239000003086 colorant Substances 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 238000005520 cutting process Methods 0.000 claims description 4
- 230000006872 improvement Effects 0.000 claims description 4
- 230000007797 corrosion Effects 0.000 claims description 3
- 238000005260 corrosion Methods 0.000 claims description 3
- 230000007717 exclusion Effects 0.000 claims description 3
- 230000008014 freezing Effects 0.000 claims description 3
- 238000007710 freezing Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000007689 inspection Methods 0.000 abstract description 7
- 238000010191 image analysis Methods 0.000 abstract description 3
- 238000011835 investigation Methods 0.000 abstract description 2
- 239000010410 layer Substances 0.000 description 19
- 230000005540 biological transmission Effects 0.000 description 6
- 238000010276 construction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000002346 layers by function Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于端到端回归模型的电线杆标牌目标检测及识别方法,该方法包括以下步骤:制作电线杆标牌图像的多样化数据集,然后在分类网络框架下对端到端一次性回归目标检测模型进行适用于电线杆标牌的训练;提取出标牌在图像中的位置坐标后综合先验信息和投影分析法进行字符分割;采用迁移学习简化对字符识别网络的训练以提高整体效率;最后选用HSI颜色空间来识别标牌背景色以减小图像分析的工作量。本发明采用高效的端到端目标检测方法实现对电线杆标牌有效信息的准确识别,可以在一定程度上提高巡检路径规划、农网改造勘察的效率。
Description
技术领域
本发明属于输电线路巡检工作中电线杆标牌图象识别技术领域,具体涉及基于一次性回归模型对电线杆标牌进行端到端的目标检测,利用迁移学习简化字符识别网络的训练过程以及在能够简化图像分析工作的HSI颜色空间进行背景色识别的方法。
背景技术
我国电网建设发展迅速,社会生产生活对电力系统的依赖性不断加强,随着政府和国民环保意识的提高,许多耗能领域在电力使用上的比重也都在增加,这些都对电力系统能够安全可靠运行提出了越来越高的要求。而且随着泛在电力物联网的建设,电力系统运维各环节都在数字化、信息化、自动化方面不断完善。通过智能巡检方式保障电力系统运行的安全稳定是大环境下的发展要求。农村电网改造升级任务同样需要对输电线路进行勘察规划,在地理环境复杂或建设水平落后的农村地区,区分种类数量繁多的输电线路显然需要耗费大量的时间和人力资源。根据输电线路标志牌的制作规范,输电线路杆的标牌记录了线路的名称、杆塔号这类对电力线路巡检的路线标识起到重要作用的信息,根据这些信息可以对输电线路按类别进行划分统计。通过计算机图像识别自动检测出指定巡检区域内采集的电线杆图片的标牌,提取位置信息并进一步识别其内容,就可以提高电力系统各环节信息化水平,为运维中巡检线路的标记和规划提供便利,节省大量实地勘察所需的人力劳动和时间,解决复杂地形线路人工勘探困难的问题。
近些年来,对标志牌图像识别的研究一直关注度较高,但主要集中在机动车车牌号识别方面,电力系统的运维检修任务中也需要对电线杆标牌进行识别,但人工采集、经验识别的方式耗时费力,传统的图像处理方法识别效率不高,无法满足当前泛在电力物联网建设大环境下对精益化管理、自动化检测的高要求。随着技术进步,利用端到端图像处理进行目标检测的方法逐渐应用于与电线杆标牌识别类似的机动车车牌识别领域,并获得了比传统方式识别成功率、识别速度更高的识别效果。
发明内容
针对电线杆标牌传统图像识别方法识别率不高和人工识别方法耗时费力的不足,本发明提供了基于端到端回归模型的电线杆标牌目标检测及识别方法,提高整体识别效率。
为达到上述目的,本发明所述基于端到端回归模型的电线杆标牌目标检测及识别方法,包括以下步骤:
步骤1:采集多张包含电线杆标牌的图片形成图片集,所述图片集中的图片具有多样性;
步骤2:用步骤1得到的图片集制作将用于训练目标检测模型的训练集和检验图像识别效果的测试集,标注图片中判定为有效的电杆标牌的边界框中心点坐标位置和宽高尺寸然后将图片与对应生成的标注文件按训练集规定格式保存;
步骤3:基于在Imagenet数据集上预训练的端到端一次性回归目标检测模型,进行参数配置,并在特征提取分类网络框架下用步骤2制作的训练集执行训练,得到训练后的目标检测模型,其中特征提取分类网络框架采用darknet框架;
步骤4:用步骤2得到的测试集验证步骤3训练中loss函数值最低的目标检测模型的识别率,识别率在阈值以下时,回到步骤1采集更多图像作为训练集或重新设置步骤3的参数重新执行训练,识别率在阈值以上时,用所述目标检测模型对电线杆标牌图像进行提取,并执行步骤5;
步骤5:基于电线杆标牌的印刷规则和投影分析法对步骤4中提取的标牌图像中的字符进行分割得到单个标牌中单个字符的图片;
步骤6:利用迁移学习训练标牌字符识别卷积神经网络,训练结束后,将步骤5中分割出的电线杆标牌中每个字符的图片输入标牌字符识别卷积神经网络中进行识别并输出对应文字。
进一步的,步骤3包括以下步骤:
S3.1、根据以下公式配置特征提取分类网络中最后一个卷积层的滤波器数目filters,filters=(m+5)*A;式中,m为所要检测目标的类别数,A为预测边界的候选框个数;
S3.2、将darknet53.conv.74文件放在特征提取分类网络框架下,用其提供的模型预训练卷积权重值作为端到端一次性回归目标检测模型的初始化参数;
S3.3、设置端到端一次性回归目标检测模型训练的次数范围、每次送入模型的样本量batch、初始学习率以及所使用的学习率调整机制;
S3.4:执行端到端一次性回归目标检测模型的训练,特征提取分类网络将每张输入图片划分为S×S个网格,每个网格对应B个预测边界框,计算特征提取分类网络预测的第i个网格对应的第j个边界框的置信度Cij以及预测边界框与目标实际边框交并比IoU,计算第k类目标在第i个网格对应的第j个边界框出现的可能性得分Scorekij,得分最高的边界框为预测结果,输出其中心点坐标(x,y)和宽高尺寸(w,h),具体计算公式如下:
Cij=P(Object)*IoU
Scorekij=P(Classk|Object)*Cij
式中,P(Object)为网格包含检测目标中心点的概率,包含则为1,不包含为0,IoU为预测边界框与实际目标区域的交并比,P(Classk|Object)为预测已经包含目标的边界框中包含第k类目标的条件概率;
S3.5计算损失函数loss来观察训练完成情况,具体计算公式如下:
损失函数loss=loss1+loss2+loss3
式中,loss1为分类误差,loss2为位置误差,loss3为置信度误差,s2为划分的网格数目,Classes为待检测的目标类别,本发明中只有电线杆标牌一类,B为每个网格对应候选边界框的数目,表示物体落入格子i中,落入为1,未落入为0,pi(c)为第c类目标中心点在第i个网格的预测概率,为第c类目标中心点在第i个网格的实际概率,λcoord=5为定位误差的权重,表示划分的第i个网格对应的第j个边界框中包含检测目标,xi,yi,wi,hi分别为第i个网格对应的包含目标的边界框的预测中心横坐标、纵坐标、宽和高, 分别为制作数据集时标注的目标边界框中心横坐标、纵坐标、宽和高,Ci为第i个网格单元包含目标的置信度,为第i个网格单元实际置信度,λnoobj=0.5为置信度误差的权重,表示划分的第i个网格对应的第j个边界框中不包含检测目标。
进一步的,步骤5包括以下步骤:
S5.1、将步骤4中提取出的电线杆标牌原始图像进行灰度处理和二值化操作;
S5.2、对经过预处理的标牌图像按照下式进行三次腐蚀;
式中,A为S5.1得到的二值化图像,B为自动生成的正方形卷积核,E为包括A和B的像素集合,Bz为B包含于A时所有B中心点所能到达的点的集合,z为集合E中的元素;
S5.3、对S5.2腐蚀后的图像按照下式再进行三次膨胀操作;
S5.4、基于投影分析法改进水平方向统计的黑白像素比,根据如下公式得出像素比统计直方图,
取直方图中间位置两个黑白像素之比的峰值点对应的水平线作为水平方向的两条分割线,用这两条分割线对S5.3处理后的图像进行水平行切割,得到标牌图像每一行的字符图片;
S5.5、根据如下改进后垂直方向的黑白像素比统计公式,得出像素比统计直方图,
将除直方图中从左到右第一个和最后一个峰值点之外的其他峰值点对应的垂直列,作为垂直方向的分割线,对水平切割后的单行数据进行垂直分割,得到单个字符图片。。
进一步的,步骤6包括以下步骤:
S6、CASIA-HWDB数据集上预训练标牌字符识别卷积神经网络,预训练完成后冻结卷积神经网络中的前三个卷积层,将预训练后网络的参数迁移用作本发明中标牌字符识别卷积神经网络的初始参数,之后仅对全连接层参数进行训练;
S6.2、生成包含多种常用印刷字体的至少300个常用汉字、阿拉伯数字0-10以及所有英文字母的图片作为数据集,训练标牌字符识别卷积神经网络的全连接层;
S6.3、将步骤5中分割出的字符图像输入到训练后的标牌字符识别卷积神经网络中,输出字符识别结果。
进一步的,步骤4完成后,采用HSI色彩空间对步骤4提取的电线杆标牌图像进行标牌背景色检测。
进一步的,对电线杆标牌图像背景色检测包括以下步骤:
SA1、将电线杆标牌图像从RGB色彩空间映射到HSI色彩空间;
SA2、列出电线杆标牌所使用的所有标准色在HSI色彩空间中各参数的取值范围;
SA3、选择所有标准色中的一种对标牌图像进行过滤,遍历标牌图像中的像素点进行二值化处理,如果某点的HSI值在该种颜色的范围之内就转换为白色,反之为黑色,然后统计图像中白色像素点的个数;
SA4、所有标准色都按照S7.3进行像素点统计,像素点最多的颜色所对应的参考色为电线杆标牌的背景色。
与现有技术相比,本发明至少具有以下有益的技术效果:
本发明首先将端到端一次性回归目标检测模型用于图像中电线杆标牌的目标检测,并在此基础上结合图像处理方法和深度神经网络的方法进行标牌字符分割及识别,最后在HSI颜色空间检测标牌色彩,从而实现对电线杆标牌中有用信息的智能识别和提取。
该方法通过制作电线杆标牌图像的多样化数据集,对端到端一次性回归目标检测模型进行训练使其适用于电线杆图片中对标牌的位置检测,提取出标牌在图像中的位置坐标后基于先验信息和投影分析进行字符分割,采用迁移学习简化训练用于字符识别以提高整体效率。
在目标检测和字符识别环节训练端到端预测模型和采用迁移学习的方法简化训练过程,并采用更符合人体视觉的HSI颜色空间进行标牌的背景色识别来减小图像分析工作量,最终实现对电线杆标牌中线路信息的准确识别,对提高巡检路径规划、农网改造勘察的效率具有一定的意义。
附图说明
图1为本发明所提出的基于端到端回归模型的电线杆标牌目标检测及识别方法的处理流程图;
图2为适用于本发明的包含电线杆标牌的原始图像的灰度图;
图3为将原始图像输入端到端回归模型进行目标检测的结果的灰度图;
图4为标牌字符分割的示意图。
具体实施方式
为了使本发明的目的和技术方案更加清晰和便于理解。以下结合附图和实施例,对本发明进行进一步的详细说明,此处所描述的具体实施例仅用于解释本发明,并非用于限定本发明。
下面结合人工采集的电线杆标牌图片的识别为实例对本发明作更详细的说明。
一种基于端到端回归模型的电线杆标牌目标检测及识别方法,步骤如下:
步骤1:采集300张以上包含电线杆标牌的图片,包含电线杆标牌的图片的灰度图如图1所示,图片集应具有背景差异、时段差异、角度差异等多样性;
步骤2:用步骤1采集的图片制作将用于训练目标检测模型的训练集和检验图像识别效果的测试集,人工标注图片中判定为有效的电杆标牌的边界框中心点坐标位置和宽高尺寸忽略标牌残缺或被遮挡导致目标信息不完整的无效标牌区域,然后将图片与对应生成的标注文件按训练集规定格式保存;
步骤3:基于在Imagenet数据集上预训练的端到端一次性回归目标检测模型,对其应用在检测电线杆标牌方面进行参数配置,并在特征提取分类网络框架下用步骤2制作的训练集执行训练,得到训练后的目标检测模型,其中特征提取分类网络框架采用darknet框架,包含数据结构定义层、输入输出层、核心计算层、功能层、训练执行层和应用层的目标检测模型训练工具包,具体包括以下步骤:
S3.1:根据以下公式配置特征提取分类网络中最后一个卷积层的滤波器数目filters:
filters=(m+5)*A
式中,filters代表滤波器数目,m为所要检测目标的类别数,在本发明中目标类别数为1,A为预测边界的先验框个数,本发明中为3;
S3.2:下载darknet53.conv.74文件放在特征提取分类网络框架下,用其提供的模型预训练卷积权重值作为本发明中端到端一次性回归目标检测模型的初始化参数,以加快收敛速度;
S3.3:设置端到端一次性回归目标检测模型训练的次数范围为[10000,30000]、每次送入模型的样本量batch取64或128(32的倍数)、初始学习率设置在0.001~0.01,以及所使用的学习率调整机制为自适应动量优化算法;
S3.4:执行端到端一次性回归目标检测模型的训练,特征提取分类网络将每张输入图片划分为S×S个网格,每个网格对应B个预测边界框,计算特征提取分类网络预测的第i个网格对应的第j个边界框的置信度Cij以及预测边界框与目标实际边框交并比IoU,计算第k类目标在第i个网格对应的第j个边界框出现的可能性得分Scorekij,得分最高的边界框为预测结果,输出其中心点坐标(x,y)和宽高尺寸(w,h),具体计算公式如下:
Cij=P(Object)*IoU
Scorekij=P(Classk|Object)*Cij
式中,P(Object)为网格包含检测目标中心点的概率,包含则为1,不包含为0,IoU为预测边界框与实际目标区域的交并比,P(Classk|Object)为预测已经包含目标的边界框中包含第k类目标的条件概率。
S3.5计算损失函数loss来观察训练完成情况,具体计算公式如下:
损失函数loss=loss1+loss2+loss3
式中,loss1为分类误差,loss2为位置误差,loss3为置信度误差,s2为划分的网格数目,Classes为检测的目标类别,本发明中只有电线杆标牌一类,B为每个网格对应候选边界框的数目,表示物体落入格子i中,落入为1,未落入为0,pi(c)为第c类目标中心点在第i个网格的预测概率,为第c类目标中心点在第i个网格的实际概率,λcoord=5为定位误差的权重,表示划分的第i个网格对应的第j个边界框中包含检测目标,xi,yi,wi,hi分别为第i个网格对应的包含目标的边界框的预测中心横坐标、纵坐标、宽和高, 分别为制作数据集时标注的目标边界框中心横坐标、纵坐标、宽和高,Ci为第i个网格单元包含目标的置信度,为第i个网格单元实际置信度,λnoobj=0.5为置信度误差的权重,表示划分的第i个网格对应的第j个边界框中不包含检测目标。
步骤4:用步骤2得到的测试集验证步骤3训练中loss函数值最低的目标检测模型的识别率,识别率在90%以下则回到步骤1采集更多电线杆标牌图像增加训练数据或者在S3.3调整特征提取网络的训练参数,重新进行训练,识别率90%以上则可以用此目标检测模型对电线杆标牌图像进行提取,然后执行步骤5,提取到的图像的灰度图如图3所示;
步骤5:基于电线杆标牌的印刷规则和投影分析法对步骤4中提取的标牌图像中的字符进行分割得到单个标牌中单个字符的图片,具体步骤如下:
S5.1:将步骤4中提取出的电线杆标牌原始图像进行灰度处理和二值化操作;
S5.2:对经过预处理的标牌图像按照下式连续进行三次腐蚀;
式中,A为S5.1得到的二值化图像,B为自动生成的正方形卷积核,E为包括A和B的像素集合,Bz为B包含于A时所有B中心点所能到达的点的集合,z为集合E中的元素;
S5.3:对腐蚀后的图像按照下式再进行三次膨胀操作;
S5.4:基于投影分析法改进水平方向统计的黑白像素比,根据如下统计公式得出像素比统计直方图,直方图中间位置的两个峰值点对应的水平线即作为水平方向的两条分割线,据此对经过腐蚀和膨胀处理后的图像进行水平行切割,得到标牌图像每一行的字符图片,
S5.5:根据如下改进后垂直方向的黑白像素比统计公式,得出像素比统计直方图,直方图中除第一个和最后一个峰值点(对应图片左右边缘)之外的其他峰值点对应的垂直列,即作为垂直方向的分割线,对水平切割后的单行数据进行垂直分割,得到单个字符图片:
步骤6:利用迁移学习训练标牌字符识别卷积神经网络,训练结束后,将步骤5中分割出的电线杆标牌每个字符的图像输入标牌字符识别卷积神经网络中进行识别并输出对应文字,标牌字符识别卷积神经网络的结构包括3个卷积层,每个卷积层后的一个池化层,卷积完成后一个过渡的flatten层,一个防止过拟合的dropout层,最后包含两个全连接层,具体步骤如下:
S6.1:首先在CASIA-HWDB数据集上预训练标牌字符识别卷积神经网络,预训练完成后冻结卷积神经网络中的前三个卷积层,将预训练后网络的参数迁移用作本发明中标牌字符识别卷积神经网络的初始参数,之后仅对全连接层参数进行训练;
S6.2:使用计算机自动生成包含多种常用印刷字体的300个常用汉字、阿拉伯数字0-10以及所有英文字母的图片作为数据集,训练标牌字符识别卷积神经网络的全连接层;
S6.3:将步骤5中分割出的字符图像输入到训练后的标牌字符识别卷积神经网络中,输出字符识别结果,如图4所示。
步骤7:采用HSI色彩空间对步骤4提取出来的电线杆标牌图像进行标牌背景色的检测,具体步骤如下:
S7.1:将标牌图像从RGB色彩空间映射到HSI色彩空间,两者转换公式如下:
式中,H为色调,S为饱和度,I为强度,R为红色亮度,B为蓝色亮度,G为绿色亮度;
S7.2:如表1列出电线杆标牌所使用的六种标准色“黑白红黄蓝绿”在HSI色彩空间中各参数的取值范围;
表1 HSI颜色空间中电线杆标牌标准色取值范围
S7.3:选择六种标准色中的一种对标牌图像进行过滤,遍历标牌图像中的像素点进行二值化处理,如果某点的HSI值在该种颜色的范围之内就转换为白色,反之为黑色,然后统计图像中白色像素点的个数;
S7.4:六种标准色都按照S7.3进行像素点统计之后,像素点最多的颜色所对应的参考色即为电线杆标牌的背景色。
输入测试集的图像,经过步骤4目标检测、步骤5字符分割、步骤6字符识别以及步骤7背景色识别流程后,最终输出检测结果与实际情况相符的准确率为90.05%,符合对一般情况下采集的电线杆标牌进行图像识别的要求。
所述的电线杆标牌智能识别方法在目标检测环节采用的是在“暗网”分类网络下训练的端到端一次性回归目标检测模型。字符识别环节采用迁移学习的方法进行训练以及在HSI颜色空间进行标牌背景色识别。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。
Claims (6)
1.基于端到端回归模型的电线杆标牌目标检测及识别方法,其特征在于,包括以下步骤:
步骤1:采集多张包含电线杆标牌的图片形成图片集,所述图片集中的图片具有多样性;
步骤2:用步骤1得到的图片集制作将用于训练目标检测模型的训练集和检验图像识别效果的测试集,标注图片中判定为有效的电杆标牌的边界框中心点坐标位置和宽高尺寸然后将图片与对应生成的标注文件按训练集规定格式保存;
步骤3:基于在Imagenet数据集上预训练的端到端一次性回归目标检测模型,进行参数配置,并在特征提取分类网络框架下用步骤2制作的训练集执行训练,得到训练后的目标检测模型,其中特征提取分类网络框架采用darknet框架;
步骤4:用步骤2得到的测试集验证步骤3训练中loss函数值最低的目标检测模型的识别率,识别率在阈值以下时,回到步骤1采集更多图像作为训练集或重新设置步骤3的参数重新执行训练,识别率在阈值以上时,用所述目标检测模型对电线杆标牌图像进行提取,并执行步骤5;
步骤5:基于电线杆标牌的印刷规则和投影分析法对步骤4中提取的标牌图像中的字符进行分割得到单个标牌中单个字符的图片;
步骤6:利用迁移学习训练标牌字符识别卷积神经网络,训练结束后,将步骤5中分割出的电线杆标牌中每个字符的图片输入标牌字符识别卷积神经网络中进行识别并输出对应文字。
2.根据权利要求1所述的基于端到端回归模型的电线杆标牌目标检测及识别方法,其特征在于,所述步骤3包括以下步骤:
S3.1、根据以下公式配置特征提取分类网络中最后一个卷积层的滤波器数目filters,filters=(m+5)*A;式中,m为所要检测目标的类别数,A为预测边界的候选框个数;
S3.2、将darknet53.conv.74文件放在特征提取分类网络框架下,用其提供的模型预训练卷积权重值作为端到端一次性回归目标检测模型的初始化参数;
S3.3、设置端到端一次性回归目标检测模型训练的次数范围、每次送入模型的样本量batch、初始学习率以及所使用的学习率调整机制;
S3.4:执行端到端一次性回归目标检测模型的训练,特征提取分类网络将每张输入图片划分为S×S个网格,每个网格对应B个预测边界框,计算特征提取分类网络预测的第i个网格对应的第j个边界框的置信度Cij以及预测边界框与目标实际边框交并比IoU,计算第k类目标在第i个网格对应的第j个边界框出现的可能性得分Scorekij,得分最高的边界框为预测结果,输出其中心点坐标(x,y)和宽高尺寸(w,h),具体计算公式如下:
Cij=P(Object)*IoU
Scorekij=P(Classk|Object)*Cij
式中,P(Object)为网格包含检测目标中心点的概率,包含则为1,不包含为0,IoU为预测边界框与实际目标区域的交并比,P(Classk|Object)为预测已经包含目标的边界框中包含第k类目标的条件概率;
S3.5计算损失函数loss来观察训练完成情况,具体计算公式如下:
损失函数loss=loss1+loss2+loss3
式中,loss1为分类误差,loss2为位置误差,loss3为置信度误差,s2为划分的网格数目,Classes为待检测的目标类别,本发明中只有电线杆标牌一类,B为每个网格对应候选边界框的数目,表示物体落入格子i中,落入为1,未落入为0,pi(c)为第c类目标中心点在第i个网格的预测概率,为第c类目标中心点在第i个网格的实际概率,λcoord=5为定位误差的权重,表示划分的第i个网格对应的第j个边界框中包含检测目标,xi,yi,wi,hi分别为第i个网格对应的包含目标的边界框的预测中心横坐标、纵坐标、宽和高, 分别为制作数据集时标注的目标边界框中心横坐标、纵坐标、宽和高,Ci为第i个网格单元包含目标的置信度,为第i个网格单元实际置信度,λnoobj=0.5为置信度误差的权重,表示划分的第i个网格对应的第j个边界框中不包含检测目标。
3.根据权利要求1所述的基于端到端回归模型的电线杆标牌目标检测及识别方法,其特征在于,所述步骤5包括以下步骤:
S5.1、将步骤4中提取出的电线杆标牌原始图像进行灰度处理和二值化操作;
S5.2、对经过预处理的标牌图像按照下式进行三次腐蚀;
式中,A为S5.1得到的二值化图像,B为自动生成的正方形卷积核,E为包括A和B的像素集合,Bz为B包含于A时所有B中心点所能到达的点的集合,z为集合E中的元素;
S5.3、对S5.2腐蚀后的图像按照下式再进行三次膨胀操作;
S5.4、基于投影分析法改进水平方向统计的黑白像素比,根据如下公式得出像素比统计直方图,
取直方图中间位置两个黑白像素之比的峰值点对应的水平线作为水平方向的两条分割线,用这两条分割线对S5.3处理后的图像进行水平行切割,得到标牌图像每一行的字符图片;
S5.5、根据如下改进后垂直方向的黑白像素比统计公式,得出像素比统计直方图,
将除直方图中从左到右第一个和最后一个峰值点之外的其他峰值点对应的垂直列,作为垂直方向的分割线,对水平切割后的单行数据进行垂直分割,得到单个字符图片。
4.根据权利要求1所述的基于端到端回归模型的电线杆标牌目标检测及识别方法,其特征在于,所述步骤6包括以下步骤:
S6、CASIA-HWDB数据集上预训练标牌字符识别卷积神经网络,预训练完成后冻结卷积神经网络中的前三个卷积层,将预训练后网络的参数迁移用作本发明中标牌字符识别卷积神经网络的初始参数,之后仅对全连接层参数进行训练;
S6.2、生成包含多种常用印刷字体的至少300个常用汉字、阿拉伯数字0-10以及所有英文字母的图片作为数据集,训练标牌字符识别卷积神经网络的全连接层;
S6.3、将步骤5中分割出的字符图像输入到训练后的标牌字符识别卷积神经网络中,输出字符识别结果。
5.根据权利要求1所述的基于端到端回归模型的电线杆标牌目标检测及识别方法,其特征在于,所述步骤4完成后,采用HSI色彩空间对步骤4提取的电线杆标牌图像进行标牌背景色检测。
6.根据权利要求5所述的基于端到端回归模型的电线杆标牌目标检测及识别方法,其特征在于,对电线杆标牌图像背景色检测包括以下步骤:
SA1、将电线杆标牌图像从RGB色彩空间映射到HSI色彩空间;
SA2、列出电线杆标牌所使用的所有标准色在HSI色彩空间中各参数的取值范围;
SA3、选择所有标准色中的一种对标牌图像进行过滤,遍历标牌图像中的像素点进行二值化处理,如果某点的HSI值在该种颜色的范围之内就转换为白色,反之为黑色,然后统计图像中白色像素点的个数;
SA4、所有标准色都按照S7.3进行像素点统计,像素点最多的颜色所对应的参考色为电线杆标牌的背景色。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010197247.2A CN111414855B (zh) | 2020-03-19 | 2020-03-19 | 基于端到端回归模型的电线杆标牌目标检测及识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010197247.2A CN111414855B (zh) | 2020-03-19 | 2020-03-19 | 基于端到端回归模型的电线杆标牌目标检测及识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111414855A CN111414855A (zh) | 2020-07-14 |
CN111414855B true CN111414855B (zh) | 2023-03-24 |
Family
ID=71493195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010197247.2A Active CN111414855B (zh) | 2020-03-19 | 2020-03-19 | 基于端到端回归模型的电线杆标牌目标检测及识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111414855B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116958826B (zh) * | 2023-09-21 | 2023-11-24 | 河北霞光电力工程集团有限公司 | 道路侧电线杆置换监测方法、监测系统、设备及介质 |
CN117237363A (zh) * | 2023-11-16 | 2023-12-15 | 国网山东省电力公司曲阜市供电公司 | 一种输电线路外破源识别方法、系统、介质及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102043945A (zh) * | 2010-11-23 | 2011-05-04 | 聊城大学 | 基于车辆实时跟踪和二进指数分类车牌字符识别的方法 |
CN108509954A (zh) * | 2018-04-23 | 2018-09-07 | 合肥湛达智能科技有限公司 | 一种实时交通场景的多车牌动态识别方法 |
WO2019192397A1 (zh) * | 2018-04-04 | 2019-10-10 | 华中科技大学 | 一种任意形状的场景文本端到端识别方法 |
CN110781882A (zh) * | 2019-09-11 | 2020-02-11 | 南京钰质智能科技有限公司 | 一种基于yolo模型的车牌定位和识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304835B (zh) * | 2018-01-30 | 2019-12-06 | 百度在线网络技术(北京)有限公司 | 文字检测方法和装置 |
-
2020
- 2020-03-19 CN CN202010197247.2A patent/CN111414855B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102043945A (zh) * | 2010-11-23 | 2011-05-04 | 聊城大学 | 基于车辆实时跟踪和二进指数分类车牌字符识别的方法 |
WO2019192397A1 (zh) * | 2018-04-04 | 2019-10-10 | 华中科技大学 | 一种任意形状的场景文本端到端识别方法 |
CN108509954A (zh) * | 2018-04-23 | 2018-09-07 | 合肥湛达智能科技有限公司 | 一种实时交通场景的多车牌动态识别方法 |
CN110781882A (zh) * | 2019-09-11 | 2020-02-11 | 南京钰质智能科技有限公司 | 一种基于yolo模型的车牌定位和识别方法 |
Non-Patent Citations (2)
Title |
---|
基于级联卷积神经网络的车牌定位;傅鹏等;《计算机技术与发展》;20171019(第01期);全文 * |
车牌超分辨率重建与识别;曾超等;《计算机测量与控制》;20180325(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111414855A (zh) | 2020-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110059694B (zh) | 电力行业复杂场景下的文字数据的智能识别方法 | |
CN113449594B (zh) | 一种多层网络组合的遥感影像地类语义分割与面积计算方法 | |
CN107392901A (zh) | 一种用于输电线路部件智能自动识别的方法 | |
CN110619282B (zh) | 一种无人机正射影像建筑物自动提取方法 | |
CN111444939B (zh) | 电力领域开放场景下基于弱监督协同学习的小尺度设备部件检测方法 | |
CN114092389A (zh) | 一种基于小样本学习的玻璃面板表面缺陷检测方法 | |
CN111275688A (zh) | 基于注意力机制的上下文特征融合筛选的小目标检测方法 | |
CN109949316A (zh) | 一种基于rgb-t融合的电网设备图像弱监督实例分割方法 | |
CN111401353B (zh) | 一种数学公式的识别方法、装置及设备 | |
CN105825511A (zh) | 一种基于深度学习的图片背景清晰度检测方法 | |
CN112069985B (zh) | 基于深度学习的高分辨率大田图像稻穗检测与计数方法 | |
CN111414855B (zh) | 基于端到端回归模型的电线杆标牌目标检测及识别方法 | |
CN111652214B (zh) | 一种基于深度学习的垃圾瓶分选方法 | |
CN113435407B (zh) | 一种输电系统的小目标识别方法及装置 | |
CN115131747A (zh) | 基于知识蒸馏的输电通道工程车辆目标检测方法及系统 | |
CN111540203B (zh) | 基于Faster-RCNN调节绿灯通行时间的方法 | |
CN111507398A (zh) | 基于目标检测的变电站金属仪器锈蚀识别方法 | |
CN114120094A (zh) | 一种基于人工智能的水污染识别方法及系统 | |
CN112084860A (zh) | 目标对象检测、火力发电厂检测方法和装置 | |
CN111507249A (zh) | 基于目标检测的变电站鸟窝识别方法 | |
CN110765900A (zh) | 一种基于dssd的自动检测违章建筑方法及系统 | |
CN113673534B (zh) | 一种基于Faster RCNN的RGB-D图像果实检测方法 | |
CN112949630B (zh) | 基于边框分级筛选的弱监督目标检测方法 | |
CN112036246B (zh) | 遥感影像分类模型的构建方法,遥感影像分类方法及系统 | |
CN115187878A (zh) | 基于无人机图像分析的风力发电装置叶片缺陷检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |