CN112464928A - 数字式表计读数识别方法、装置、设备及存储介质 - Google Patents
数字式表计读数识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112464928A CN112464928A CN202011364877.0A CN202011364877A CN112464928A CN 112464928 A CN112464928 A CN 112464928A CN 202011364877 A CN202011364877 A CN 202011364877A CN 112464928 A CN112464928 A CN 112464928A
- Authority
- CN
- China
- Prior art keywords
- image
- digital
- target
- reading
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000011218 segmentation Effects 0.000 claims abstract description 36
- 238000012545 processing Methods 0.000 claims description 18
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 7
- 238000007689 inspection Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种数字式表计读数识别方法、装置、设备及存储介质,其中数字式表计读数识别方法,包括:获取包含数字式表计的读数的图像数据;在图像数据中截取包含读数的数字图像;对数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;基于第一目标图像识别第一目标图像中的目标字符;若识别失败,则对数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;基于第二目标图像识别第二目标图像中的目标字符。在识别失败后通过矩形分割的方式对数字图像进行分割获得第二目标图像,以更少影响因素的第二目标图像再次执行字符识别,提升了读数识别的准确度。
Description
技术领域
本发明实施例涉及自动化巡检技术,尤其涉及一种数字式表计读数识别方法、装置、设备及存储介质。
背景技术
变电站是电力系统中对电压和电流进行变换,接受电能及分配电能的场所。变电站的日常运作需要记录各表计的读数并监测其相关状态以保障变电站的正常运作和电力数据的收集、统计。
为解决变电站人工巡检方式存在的劳动强度、巡检效率低、恶劣环境下巡检困难等不足,在变电站中引入了智能巡检机器人,智能巡检机器人可辅助或代替人工开展变电设备自动巡检工作,即通过智能巡检机器人实现对各种表计的读数,以此降低人工巡检的工作量。
但是,现有的智能巡检机器人仅能够实现对机械式表计的读数识别,而对于数字式表计的读数存在数字区域的分割准确低,数字识别率低的问题。
发明内容
本发明提供一种数字式表计读数识别方法、装置、设备及存储介质,以实现提高变电站的数字式表计的读数的识别准确率。
第一方面,本发明实施例提供了一种数字式表计读数识别方法,包括:
获取包含数字式表计的读数的图像数据;
在所述图像数据中截取包含所述读数的数字图像;
对所述数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
基于所述第一目标图像识别所述第一目标图像中的目标字符;
若所述识别失败,则对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
基于所述第二目标图像识别所述第二目标图像中的目标字符。
可选的,所述在所述图像数据中截取包含所述读数的数字图像,包括:
将所述图像数据输入预置的全卷积网络对所述图像数据中的数字进行处理,获得数字区域;
基于所述数字区域在所述图像数据中截取包含所述读数的部分,作为数字图像。
可选的,在所述图像数据中截取包含所述读数的数字图像之后,还包括:
对所述数字图像中的所述读数进行倾斜校正。
可选的,所述对所述数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像,包括:
对所述数字图像进行二值化处理,获得预处理图像;
将所述预处理图像的像素点垂直投影至水平轴上,获得所述预处理图像的水平投影;
基于所述水平轴上的像素分布情况竖向切割所述数字图像,获得至少两张第一目标图像。
可选的,所述基于所述第一目标图像识别所述第一目标图像中的目标字符,包括:
将所述第一目标图像依次输入预置的LeNet卷积神经网络进行字符识别,获得各个所述第一目标图像对应的字符。
可选的,所述若所述识别失败,则对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像,包括:
获取所述目标字符对应的节点的概率值;
将所述概率值与预设的阈值进行比较;
若所述概率值小于所述阈值,则执行对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像。
可选的,所述对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像,包括:
对所述数字图像进行二值化处理,获得预处理图像;
基于最小外接矩形算法确定所述预处理图像中的字符的边界;
基于所述边界切割所述数字图像,获得至少一个包含所述字符的所述第二目标图像。
第二方面,本发明实施例还提供了一种数字式表计读数识别装置,包括:
获取模块,用于获取包含数字式表计的读数的图像数据;
截取模块,用于在所述图像数据中截取包含所述读数的数字图像;
第一分割模块,用于对所述数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
识别模块,用于基于所述第一目标图像识别所述目标图像中的目标字符;
第二分割模块,用于在所述识别失败时,对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
基于所述第二目标图像识别所述第二目标图像中的目标字符。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中所述的数字式表计读数识别方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的数字式表计读数识别方法。
本发明对于包含数字式表计的读数的图像数据,在图像数据中截取包含读数的部分的作为数字图像,将位于读数周部的空白部分去除,从而有效的降低了后续识别是的计算量,以及减少空白区域对识别的成功率的影响;先通过垂直分割的方式将数字图像分割为第一目标图像进行图像识别,识别读数对应的字符,降低了在分割时的计算量,并在识别失败后通过矩形分割的方式对数字图像进行分割获得第二目标图像,以更少影响因素的第二目标图像再次执行字符识别,保证在移动终端等资源较为紧缺的计算机设备中实时进行数字式表计的识别的同时,也提升了读数识别的准确度。
附图说明
图1为本发明实施例一提供的一种数字式表计读数识别方法的流程图;
图2是本发明实施例二提供的一种数字式表计读数识别方法的流程图;
图3是本发明实施例三提供的一种数字式表计读数识别装置的结构示意图;
图4是本发明实施例四提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的数字式表计读数识别方法的流程图,本实施例可适用于变电站中利用智能巡检机器人对数字式表计进行读数的情况,该方法可以由数字式表计读数识别装置来执行,具体包括如下步骤:
步骤110、获取包含数字式表计的读数的图像数据;
在具体实现中,数字式表计的读数具体指在数字式表计上所显示的相关数据的图像。对于变电站的智能巡检机器人的智能巡检场景,可通过智能巡检机器人对变电站的各表计进行视频拍摄或图像拍摄获得包含数字式表计的读数的图像数据。
当然,在其他场景中,还可以是通过其他手段获取包含数字式表计的读数的图像数据,并且并不限定于对变电站的数字式表计的识别,本发明实施例对于数据来源和具体应用不加以限定。
步骤120、在图像数据中截取包含读数的数字图像;
对于图像数据,其中包含有数字式表计的读数部分,以及位于读数周部的空白区域。在本发明实施例中,将包含数字式表计的读数部分由图像数据中截取出来。
当然,在其他场景中对于在图像数据中截取包含读数的数字图像的步骤可以忽略,在本发明实施例中所需要的是数字式表计的读数的图像。
对于数字图像的截取方式有很多,在此不做限定,只要能够将包含数字式表计的读数完整截取出来即可。
步骤130、对数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
对于数字图像,可以对数字式表计的读数进行粗定位,在数字图像中可粗糙的定位出读数的单个字符位置。
应用本发明实施例,可以根据数字图像中的读数的排布将读数进行垂直分割,将数字图像分割为多个图像,并使每个图像中分别包含读数中的一个字符。
针对第一目标图像,可以根据数字图像中的读数排布位置,以及分割顺序的不同进行排序,使得被分割出来的多个第一目标图像包含位置信息。
步骤140、基于第一目标图像识别第一目标图像中的目标字符;
应用本发明实施例,可通过分割后的第一目标图像中的字符识别对应的字符含义,如数字式表计的读数包含的数字“0-9”、小数点“.”以及相数“A、B、C”。
步骤150、若识别失败,则对数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
在识别的过程中,主要依据的是第一目标图像中的字符与数字“0-9”、小数点“.”以及相数“A、B、C”进行比较,确定第一目标图像中的字符与数字“0-9”、小数点“.”以及相数“A、B、C”的相似度,最终确定第一目标图像所对应的字符,确定第一目标图像中的目标字符。若第一目标图像与数字“0-9”、小数点“.”以及相数“A、B、C”的相似度低于一定的程度,则可判断为识别失败。此时对从图像数据中截取获得的数字图像采取矩形分割的方式进行重新分割。
应用于本发明实施例,矩形分割主要是在数字图像中分别获取各个字符,然后以字符的边缘位置为准,作矩形将整个字符进行框选,此时需要确保字符所有的像素点均被框选在内,然后根据该矩形框将对应的字符整体从数字图像中截取出来的,作为用于识别的第二目标图像。
步骤160、基于第二目标图像识别第二目标图像中的目标字符。
应用本发明实施例,第二目标图像的识别方式与过程与第一目标图像的识别一致,详细可以参考步骤140中的描述,在此不再过多的叙述。
在本发明实施例中,对于包含数字式表计的读数的图像数据,在图像数据中截取包含读数的部分的作为数字图像,将位于读数周部的空白部分去除,从而有效的降低了后续识别是的计算量,以及减少空白区域对识别的成功率的影响;先通过垂直分割的方式将数字图像分割为第一目标图像进行图像识别,识别读数对应的字符,降低了在分割时的计算量,并在识别失败后通过矩形分割的方式对数字图像进行分割获得第二目标图像,以更少影响因素的第二目标图像再次执行字符识别,保证在移动终端等资源较为紧缺的计算机设备中实时进行数字式表计的识别的同时,也提升了读数识别的准确度。
实施例二
图2为本发明实施例二提供的一种数字式表计读数识别方法的流程图,该实施例为在上述实施例一的基础上进行细化,详细描述了数据处理过程。该方法具体包括如下步骤:
步骤201、获取包含数字式表计的读数的图像数据;
在本实施例中,对于包含数字式表计的读数的图像数据获取与实施例一中步骤110基本相似,相关之处参见实施例一中的部分说明即可。
步骤202、将图像数据输入预置的全卷积网络对图像数据中的数字进行处理,获得数字区域;
全卷积网络(FCN,Fully Convolutional Networks)是一种图像语义分割算法,通过对现有神经网络模型进行改进,获得的端对端像素级预测,降低了训练的复杂性,并且能够准确的提取图像中的深层语义信息。FCN通过多层卷积、池化等操作较好的地避免了光照不均匀、随机噪声、图像扭曲等问题,广泛应用于图像分割领域。
在本实施例中,主要应用全卷积网络对获取的图像数据进行图像语义分割,从而从图像数据中判别属于数字式表计的读数的部分。
在其他实施例中,还可以通过其他的语义分割算法实现从图像数据中获取包含数字式表计的读数的数字区域,本发明实施例对此不加以限定。
步骤203、基于数字区域在图像数据中截取包含读数的部分,作为数字图像。
在本实施例中,利用全卷积网络对图像数据进行像素点级的图像语义分割,可获得图像数据中语义对应数字式表计的读数的像素点的位置,该部分像素点的集合即对对应着数字式表计的读数的数字区域,该区域的形状实际与数字式表计的读数的形状相一致,为不规则图形。
在发明实施例中,需要基于步骤202中所获得的数字区域从图像数据中截取出来包含全部数字式表计的读数的像素点到数字图像中,以便于后续的字符识别的进行。在截取的过程中可使用最小外接矩形的等形式将数字区域完整的截取出来,从而获得更少非读数区域的数字图像,以减少其余像素点对后续的字符识别的影响,降低信噪比。另外,还可以采用满足本发明实施例中减少数字图像中的空白区域降低信噪比的截取形式将包含数字式表计的读数的部分截取出来作为数字图像,在此不做详尽列出。
步骤204、对数字图像中的读数进行倾斜校正。
在本实施例中,由于图像数据的获取过程中巡检机器人与数字式表计之间存在非正对的情况,使得获取的图像数据朝向某一方向倾斜。
示例性地,对数字图像中的读数进行倾斜校正,可通过预先获取读数在水平方向或垂直方向上的倾斜度,例如获取读数底部的像素的连线所处的直线与水平方向所成的角度作为水平方向上的倾斜度,获得读数的左侧或右侧的像素点的连线所处的直线与垂直方向所成的角度作为水平方向上的倾斜度。在本发明实施例中对于倾斜度的获取和判定不做限定,可以根据实际情况针对数字式表计的读数进行判定。
其次,当数字式表计的读数的倾斜度大于预设值或数字式表计的读数的倾斜度不在预设范围内时,需要对数字图像进行倾斜矫正,该倾斜矫正方法可以采用图像旋转,即将倾斜的数字图像旋转到水平,图像的旋转点可以为图像中心点,也可以基于图像的顶点,本发明实施例对该图像旋转点不作限定,本领域技术人员可以根据图像实际情况进行选择。但是由于读数中存在小数点,在旋转过程中需要注意避免造成像素点重合。
步骤205、对数字图像进行二值化处理,获得预处理图像;
图像二值化(Image Binarization)就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程。即将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的0灰度和255灰度集合的二值化图像。通过对数字图像进行二值化处理,可使数字图像中的数据量大为减少,从而能凸显出读数的轮廓,使得数字式表计的读数能够更容易的被分辨出来。
进一步的,在数字图像进行二值化处理时,优先使用局部自适应二值化的方式进行。在局部自适应二值化中根据像素的邻域块的像素值分布来确定该像素位置上的二值化阈值,使得每个像素位置处的二值化阈值不是固定不变的,而是由其周围邻域像素的分布来决定的。使得数字式表计的读数部分的信息被更好的保存下来,避免造成降低数字式表计的读数的辨识度。
步骤206、将预处理图像的像素点垂直投影至水平轴上,获得预处理图像的水平投影;
在本发明实施例中,基于单行显示读数的数字式表计,即在本发明实施例中所提到的读数均为单行形式的存在。
在实际应用中,对二值化处理后的预处理图像的像素点进行垂直投影,垂直投影至水平轴上,对垂直方向上的像素点数量进行统计,与读数对应的区域的统计值较大,而读数的字符之间的空隙区域的统计值较小,从而可通过检测得到的垂直投影图上的统计值的波谷来确定字符的边界。
步骤207、基于水平轴上的像素分布情况竖向切割数字图像,获得至少两张第一目标图像。
基于前述步骤中垂直投影所得的像素点在水平轴上的分布统计值,可根据统计值的波谷位置确定读数的字符的左右边界,以及每个号码的位置,基于边界即可判定读数中的单个字符的切割位置,从而实现对数字图像的切割,将数字图像中的字符分别切割出来,成为多个包含单个字符的第一目标图像。
步骤208、将第一目标图像依次输入预置的LeNet卷积神经网络进行字符识别,获得各个第一目标图像对应的字符。
在本实施例中,将分割后的获得的第一目标图像输入到预置的LeNet卷积神经网络中进行识别,其中LeNet卷积神经网络可通过预先的训练得到,主要用于识别数字式表计中的数字“0-9”、小数点“.”以及相数“A、B、C”。具体的,在训练过程中以数字式表计中的数字“0-9”、小数点“.”以及相数“A、B、C”进行训练。
步骤209、获取目标字符对应的节点的概率值;
在LeNet卷积神经网络的输出中可获得识别后的结果,包括确定的字符以及对应的字符的预测概率值。
步骤210、将概率值与预设的阈值进行比较;
若概率值小于阈值,则执行步骤211;
在本发明实施例中,当读数的预测概率低于一定值时,则判定本次识别失败,识别结果作废,并且进行再次的分割和识别,以保证识别结果的可靠性。
步骤211、对数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像。
在本发明实施例中,由于在前次采用垂直投影方式分割获得的目标图像的识别概率值不符合预设的要求,在此步骤中改为矩形分割方式对数字图像进行分割,以进一边的截去读数周边的空白区域,以进一步的降低信噪比,提高识别成功率。
在矩形分割方式中,需要对对数字图像进行二值化处理,二值化处理后对字符取轮廓,即获取数字式表计的读数。
步骤2111、对数字图像进行二值化处理,获得预处理图像;
步骤2112、基于最小外接矩形算法确定预处理图像中的字符的边界;
在实际应用中,在对数字图像进行分割之前经过二值化处理,使得数字式表计的读数相对于背景更明显,使得数字式表计的读数的轮廓更明显,然后通过最小外接矩形算法实现单个字符的框选。
步骤2113、基于边界切割数字图像,获得至少一个包含字符的第二目标图像。
在前述步骤中将数字式表计的读数的每个字符的最小外接矩形的确定,在该步骤中需要做的是根据最小外接矩形分别切割数字图像,将数字式表计的读数的每个字符分割出来,作为第二目标图像再次识别。
步骤212、基于所述第二目标图像识别所述第二目标图像中的目标字符。
在重新以最小外接矩形算法分割数字图像获得第二目标图像后,再次进行识别操作,以更少周边像素的第二目标图像为基础进行字符的识别,第二目标图像的识别方法可参考步骤208中的方式进行,详细可以参考步骤208中的描述,在此不再过多的叙述。
步骤213、输出结果。
在本发明实施例中,首先通过垂直投影分割的方式对数字图像进行一次分割,并进行识别,根据识别结果判断是否需要进行二次识别,首先通过简单的垂直投影分割方法进行分割,可减少分割的计算量,简化计算过程。并且在一次识别后加入对识别成功的判断,在成功率低于阈值时采用更精细的最小外接矩形算法进行再次的分割,可尽可能的减少背景噪声,相对于垂直投影分割的方式获得的第二目标图像具有更少的空白区域,可有效的降低背景噪声,进一步的提高识别的精准性。
实施例三
图3为本发明实施例三提供的一种数字式表计读数识别装置的结构示意图,该装置具体可以包括如下模块:
获取模块310,用于获取包含数字式表计的读数的图像数据;
截取模块320,用于在图像数据中截取包含读数的数字图像;
第一分割模块330,用于对数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
第一识别模块340,用于基于第一目标图像识别目标图像中的目标字符;
第二分割模块350,用于在识别失败时,对数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
第二识别模块360,基于第二目标图像识别第二目标图像中的目标字符。
截取模块320包括:
第一处理单元,用于将图像数据输入预置的全卷积网络对图像数据中的数字进行处理,获得数字区域;
第一截取单元,用于基于数字区域在图像数据中截取包含读数的部分,作为数字图像。
在截取模块320之后,还包括:
校正模块321,用于对数字图像中的读数进行倾斜校正。
第一分割模块330包括:
第一二值化单元,对数字图像进行二值化处理,获得预处理图像;
投影单元,用于将预处理图像的像素点垂直投影至水平轴上,获得预处理图像的水平投影;
第一切割单元,用于基于水平轴上的像素分布情况竖向切割数字图像,获得至少两张第一目标图像。
第一识别模块340包括:
LeNet卷积神经网络单元,用于将第一目标图像依次输入预置的LeNet卷积神经网络进行字符识别,获得各个第一目标图像对应的字符。
第二分割模块350包括:
概率值获取单元,用于获取目标字符对应的节点的概率值;
比较单元,用于将概率值与预设的阈值进行比较;
第二分割模块350,包括:
第二二值化单元,用于对数字图像进行二值化处理,获得预处理图像;
最小外接矩形算法单元,用于基于最小外接矩形算法确定预处理图像中的字符的边界;
第二切割单元,基于边界切割数字图像,获得至少一个包含字符的第二目标图像。
本发明实施例所提供的数字式表计读数识别装置可执行本发明任意实施例所提供的数字式表计读数识别方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种数字式表计读数识别设备的结构示意图,如图4所示,该计算机设备包括处理器400、存储器410、输入装置420和输出装置430;计算机设备中处理器400的数量可以是一个或多个,图4中以一个处理器400为例;计算机设备中的处理器400、存储器410、输入装置420和输出装置430可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器410作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的数字式表计读数识别方法对应的程序指令/模块(例如,获取模块310、截取模块320、校正模块321、第一分割模块330、第一识别模块340、第二分割模块350、第二识别模块360)。处理器400通过运行存储在存储器410中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的数字式表计读数识别方法。
存储器410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器410可进一步包括相对于处理器400远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置420可用于获取图像数据入。输出装置430可用于输出识别结果。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种数字式表计读数识别方法,该方法包括:
获取包含数字式表计的读数的图像数据;
在所述图像数据中截取包含所述读数的数字图像;
对所述数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
基于所述第一目标图像识别所述第一目标图像中的目标字符;
若所述识别失败,则对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
基于所述第二目标图像识别所述第二目标图像中的目标字符。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的数字式表计读数识别方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述数字式表计读数识别装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种数字式表计读数识别方法,其特征在于,包括:
获取包含数字式表计的读数的图像数据;
在所述图像数据中截取包含所述读数的数字图像;
对所述数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
基于所述第一目标图像识别所述第一目标图像中的目标字符;
若所述识别失败,则对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
基于所述第二目标图像识别所述第二目标图像中的目标字符。
2.根据权利要求1所述的数字式表计读数识别方法,其特征在于,所述在所述图像数据中截取包含所述读数的数字图像,包括:
将所述图像数据输入预置的全卷积网络对所述图像数据中的数字进行处理,获得数字区域;
基于所述数字区域在所述图像数据中截取包含所述读数的部分,作为数字图像。
3.根据权利要求1所述的数字式表计读数识别方法,其特征在于,在所述图像数据中截取包含所述读数的数字图像之后,还包括:
对所述数字图像中的所述读数进行倾斜校正。
4.根据权利要求1所述的数字式表计读数识别方法,其特征在于,所述对所述数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像,包括:
对所述数字图像进行二值化处理,获得预处理图像;
将所述预处理图像的像素点垂直投影至水平轴上,获得所述预处理图像的水平投影;
基于所述水平轴上的像素分布情况竖向切割所述数字图像,获得至少两张第一目标图像。
5.根据权利要求1所述的数字式表计读数识别方法,其特征在于,所述基于所述第一目标图像识别所述第一目标图像中的目标字符,包括:
将所述第一目标图像依次输入预置的LeNet卷积神经网络进行字符识别,获得各个所述第一目标图像对应的字符。
6.根据权利要求1所述的数字式表计读数识别方法,其特征在于,所述若所述识别失败,则对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像,包括:
获取所述目标字符对应的节点的概率值;
将所述概率值与预设的阈值进行比较;
若所述概率值小于所述阈值,则执行对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像。
7.根据权利要求6所述的数字式表计读数识别方法,其特征在于,所述对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像,包括:
对所述数字图像进行二值化处理,获得预处理图像;
基于最小外接矩形算法确定所述预处理图像中的字符的边界;
基于所述边界切割所述数字图像,获得至少一个包含所述字符的所述第二目标图像。
8.一种数字式表计读数识别装置,其特征在于,包括:
获取模块,用于获取包含数字式表计的读数的图像数据;
截取模块,用于在所述图像数据中截取包含所述读数的数字图像;
第一分割模块,用于对所述数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
第一识别模块,用于基于所述第一目标图像识别所述目标图像中的目标字符;
第二分割模块,用于在所述识别失败时,对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
第二识别模块,用于基于所述第二目标图像识别所述第二目标图像中的目标字符。
9.一种数字式表计读数识别设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的数字式表计读数识别方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的数字式表计读数识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011364877.0A CN112464928B (zh) | 2020-11-27 | 2020-11-27 | 数字式表计读数识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011364877.0A CN112464928B (zh) | 2020-11-27 | 2020-11-27 | 数字式表计读数识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112464928A true CN112464928A (zh) | 2021-03-09 |
CN112464928B CN112464928B (zh) | 2024-03-15 |
Family
ID=74809830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011364877.0A Active CN112464928B (zh) | 2020-11-27 | 2020-11-27 | 数字式表计读数识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112464928B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930842A (zh) * | 2016-04-15 | 2016-09-07 | 深圳市永兴元科技有限公司 | 字符识别方法及装置 |
US20170017836A1 (en) * | 2015-07-17 | 2017-01-19 | Nidec Sankyo Corporation | Character segmenting apparatus, character recognition apparatus, and character segmenting method |
CN106909941A (zh) * | 2017-02-27 | 2017-06-30 | 广东工业大学 | 基于机器视觉的多表字符识别系统及方法 |
CN106960208A (zh) * | 2017-03-28 | 2017-07-18 | 哈尔滨工业大学 | 一种仪表液晶数字自动切分和识别的方法及系统 |
CN108573261A (zh) * | 2018-04-17 | 2018-09-25 | 国家电网公司 | 一种适用于变电站巡检机器人的数字显示仪表识别方法 |
CN109389123A (zh) * | 2018-08-14 | 2019-02-26 | 广东省智能制造研究所 | 一种基于先验知识的自适应喷码字符分割方法及其系统 |
CN109858480A (zh) * | 2019-01-08 | 2019-06-07 | 北京全路通信信号研究设计院集团有限公司 | 一种数字式仪表识别方法 |
CN110210477A (zh) * | 2019-05-24 | 2019-09-06 | 四川阿泰因机器人智能装备有限公司 | 一种数字式仪表读数识别方法 |
CN110414527A (zh) * | 2019-07-31 | 2019-11-05 | 北京字节跳动网络技术有限公司 | 字符识别方法、装置、存储介质及电子设备 |
CN110751158A (zh) * | 2019-10-24 | 2020-02-04 | 江苏瑞尔医疗科技有限公司 | 一种治疗床显示器中的数字识别方法、装置及存储介质 |
CN111027546A (zh) * | 2019-12-05 | 2020-04-17 | 北京嘉楠捷思信息技术有限公司 | 一种字符分割方法、装置以及计算机可读存储介质 |
-
2020
- 2020-11-27 CN CN202011364877.0A patent/CN112464928B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170017836A1 (en) * | 2015-07-17 | 2017-01-19 | Nidec Sankyo Corporation | Character segmenting apparatus, character recognition apparatus, and character segmenting method |
CN105930842A (zh) * | 2016-04-15 | 2016-09-07 | 深圳市永兴元科技有限公司 | 字符识别方法及装置 |
CN106909941A (zh) * | 2017-02-27 | 2017-06-30 | 广东工业大学 | 基于机器视觉的多表字符识别系统及方法 |
CN106960208A (zh) * | 2017-03-28 | 2017-07-18 | 哈尔滨工业大学 | 一种仪表液晶数字自动切分和识别的方法及系统 |
CN108573261A (zh) * | 2018-04-17 | 2018-09-25 | 国家电网公司 | 一种适用于变电站巡检机器人的数字显示仪表识别方法 |
CN109389123A (zh) * | 2018-08-14 | 2019-02-26 | 广东省智能制造研究所 | 一种基于先验知识的自适应喷码字符分割方法及其系统 |
CN109858480A (zh) * | 2019-01-08 | 2019-06-07 | 北京全路通信信号研究设计院集团有限公司 | 一种数字式仪表识别方法 |
CN110210477A (zh) * | 2019-05-24 | 2019-09-06 | 四川阿泰因机器人智能装备有限公司 | 一种数字式仪表读数识别方法 |
CN110414527A (zh) * | 2019-07-31 | 2019-11-05 | 北京字节跳动网络技术有限公司 | 字符识别方法、装置、存储介质及电子设备 |
CN110751158A (zh) * | 2019-10-24 | 2020-02-04 | 江苏瑞尔医疗科技有限公司 | 一种治疗床显示器中的数字识别方法、装置及存储介质 |
CN111027546A (zh) * | 2019-12-05 | 2020-04-17 | 北京嘉楠捷思信息技术有限公司 | 一种字符分割方法、装置以及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112464928B (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220084304A1 (en) | Method and electronic device for image processing | |
CN111368758A (zh) | 一种人脸模糊度检测方法、装置、计算机设备及存储介质 | |
CN109146832B (zh) | 一种视频图像的拼接方法、装置、终端设备及存储介质 | |
CN109413411B (zh) | 一种监控线路的黑屏识别方法、装置及服务器 | |
CN110781882A (zh) | 一种基于yolo模型的车牌定位和识别方法 | |
CN113537037A (zh) | 路面病害识别方法、系统、电子设备及存储介质 | |
CN113158773B (zh) | 一种活体检测模型的训练方法及训练装置 | |
CN111680690A (zh) | 一种文字识别方法及装置 | |
CN110852315A (zh) | 环形文字快速识别方法及装置 | |
CN110969154A (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
CN114359538A (zh) | 一种水表读数定位与识别方法 | |
KR102285269B1 (ko) | 빅데이터 기반 Geo AI를 활용한 이미지 분석 장치 및 방법 | |
CN114283431B (zh) | 一种基于可微分二值化的文本检测方法 | |
CN113449639A (zh) | 一种物联网网关对仪表的无接触数据采集方法 | |
CN112184733A (zh) | 一种宫颈异常细胞检测装置及方法 | |
CN112052702A (zh) | 一种识别二维码的方法和装置 | |
CN106682670B (zh) | 一种台标识别方法及系统 | |
CN115272262A (zh) | 室外绝缘子表面缺陷识别方法、装置及电子设备 | |
CN106469293A (zh) | 快速检测目标的方法及系统 | |
WO2022121021A1 (zh) | 一种身份证号码检测方法、装置、可读存储介质和终端 | |
CN113297514A (zh) | 图像处理方法、装置、电子设备和计算机存储介质 | |
CN111738264A (zh) | 一种机房设备显示面板数据的智能采集方法 | |
CN112464928B (zh) | 数字式表计读数识别方法、装置、设备及存储介质 | |
CN113920068B (zh) | 一种基于人工智能的身体部位检测方法、装置及电子设备 | |
CN111008605A (zh) | 人脸图像中直线处理方法、装置、终端设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |