CN112464928B - 数字式表计读数识别方法、装置、设备及存储介质 - Google Patents

数字式表计读数识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112464928B
CN112464928B CN202011364877.0A CN202011364877A CN112464928B CN 112464928 B CN112464928 B CN 112464928B CN 202011364877 A CN202011364877 A CN 202011364877A CN 112464928 B CN112464928 B CN 112464928B
Authority
CN
China
Prior art keywords
image
digital
target
unit
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011364877.0A
Other languages
English (en)
Other versions
CN112464928A (zh
Inventor
周鹏
陶雄武
陈观辉
陈文添
吴科明
蔡钟皓
罗国威
朱远东
谢勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202011364877.0A priority Critical patent/CN112464928B/zh
Publication of CN112464928A publication Critical patent/CN112464928A/zh
Application granted granted Critical
Publication of CN112464928B publication Critical patent/CN112464928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种数字式表计读数识别方法、装置、设备及存储介质,其中数字式表计读数识别方法,包括:获取包含数字式表计的读数的图像数据;在图像数据中截取包含读数的数字图像;对数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;基于第一目标图像识别第一目标图像中的目标字符;若识别失败,则对数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;基于第二目标图像识别第二目标图像中的目标字符。在识别失败后通过矩形分割的方式对数字图像进行分割获得第二目标图像,以更少影响因素的第二目标图像再次执行字符识别,提升了读数识别的准确度。

Description

数字式表计读数识别方法、装置、设备及存储介质
技术领域
本发明实施例涉及自动化巡检技术,尤其涉及一种数字式表计读数识别方法、装置、设备及存储介质。
背景技术
变电站是电力系统中对电压和电流进行变换,接受电能及分配电能的场所。变电站的日常运作需要记录各表计的读数并监测其相关状态以保障变电站的正常运作和电力数据的收集、统计。
为解决变电站人工巡检方式存在的劳动强度、巡检效率低、恶劣环境下巡检困难等不足,在变电站中引入了智能巡检机器人,智能巡检机器人可辅助或代替人工开展变电设备自动巡检工作,即通过智能巡检机器人实现对各种表计的读数,以此降低人工巡检的工作量。
但是,现有的智能巡检机器人仅能够实现对机械式表计的读数识别,而对于数字式表计的读数存在数字区域的分割准确低,数字识别率低的问题。
发明内容
本发明提供一种数字式表计读数识别方法、装置、设备及存储介质,以实现提高变电站的数字式表计的读数的识别准确率。
第一方面,本发明实施例提供了一种数字式表计读数识别方法,包括:
获取包含数字式表计的读数的图像数据;
在所述图像数据中截取包含所述读数的数字图像;
对所述数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
基于所述第一目标图像识别所述第一目标图像中的目标字符;
若所述识别失败,则对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
基于所述第二目标图像识别所述第二目标图像中的目标字符。
可选的,所述在所述图像数据中截取包含所述读数的数字图像,包括:
将所述图像数据输入预置的全卷积网络对所述图像数据中的数字进行处理,获得数字区域;
基于所述数字区域在所述图像数据中截取包含所述读数的部分,作为数字图像。
可选的,在所述图像数据中截取包含所述读数的数字图像之后,还包括:
对所述数字图像中的所述读数进行倾斜校正。
可选的,所述对所述数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像,包括:
对所述数字图像进行二值化处理,获得预处理图像;
将所述预处理图像的像素点垂直投影至水平轴上,获得所述预处理图像的水平投影;
基于所述水平轴上的像素分布情况竖向切割所述数字图像,获得至少两张第一目标图像。
可选的,所述基于所述第一目标图像识别所述第一目标图像中的目标字符,包括:
将所述第一目标图像依次输入预置的LeNet卷积神经网络进行字符识别,获得各个所述第一目标图像对应的字符。
可选的,所述若所述识别失败,则对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像,包括:
获取所述目标字符对应的节点的概率值;
将所述概率值与预设的阈值进行比较;
若所述概率值小于所述阈值,则执行对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像。
可选的,所述对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像,包括:
对所述数字图像进行二值化处理,获得预处理图像;
基于最小外接矩形算法确定所述预处理图像中的字符的边界;
基于所述边界切割所述数字图像,获得至少一个包含所述字符的所述第二目标图像。
第二方面,本发明实施例还提供了一种数字式表计读数识别装置,包括:
获取模块,用于获取包含数字式表计的读数的图像数据;
截取模块,用于在所述图像数据中截取包含所述读数的数字图像;
第一分割模块,用于对所述数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
识别模块,用于基于所述第一目标图像识别所述目标图像中的目标字符;
第二分割模块,用于在所述识别失败时,对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
基于所述第二目标图像识别所述第二目标图像中的目标字符。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中所述的数字式表计读数识别方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的数字式表计读数识别方法。
本发明对于包含数字式表计的读数的图像数据,在图像数据中截取包含读数的部分的作为数字图像,将位于读数周部的空白部分去除,从而有效的降低了后续识别是的计算量,以及减少空白区域对识别的成功率的影响;先通过垂直分割的方式将数字图像分割为第一目标图像进行图像识别,识别读数对应的字符,降低了在分割时的计算量,并在识别失败后通过矩形分割的方式对数字图像进行分割获得第二目标图像,以更少影响因素的第二目标图像再次执行字符识别,保证在移动终端等资源较为紧缺的计算机设备中实时进行数字式表计的识别的同时,也提升了读数识别的准确度。
附图说明
图1为本发明实施例一提供的一种数字式表计读数识别方法的流程图;
图2是本发明实施例二提供的一种数字式表计读数识别方法的流程图;
图3是本发明实施例三提供的一种数字式表计读数识别装置的结构示意图;
图4是本发明实施例四提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的数字式表计读数识别方法的流程图,本实施例可适用于变电站中利用智能巡检机器人对数字式表计进行读数的情况,该方法可以由数字式表计读数识别装置来执行,具体包括如下步骤:
步骤110、获取包含数字式表计的读数的图像数据;
在具体实现中,数字式表计的读数具体指在数字式表计上所显示的相关数据的图像。对于变电站的智能巡检机器人的智能巡检场景,可通过智能巡检机器人对变电站的各表计进行视频拍摄或图像拍摄获得包含数字式表计的读数的图像数据。
当然,在其他场景中,还可以是通过其他手段获取包含数字式表计的读数的图像数据,并且并不限定于对变电站的数字式表计的识别,本发明实施例对于数据来源和具体应用不加以限定。
步骤120、在图像数据中截取包含读数的数字图像;
对于图像数据,其中包含有数字式表计的读数部分,以及位于读数周部的空白区域。在本发明实施例中,将包含数字式表计的读数部分由图像数据中截取出来。
当然,在其他场景中对于在图像数据中截取包含读数的数字图像的步骤可以忽略,在本发明实施例中所需要的是数字式表计的读数的图像。
对于数字图像的截取方式有很多,在此不做限定,只要能够将包含数字式表计的读数完整截取出来即可。
步骤130、对数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
对于数字图像,可以对数字式表计的读数进行粗定位,在数字图像中可粗糙的定位出读数的单个字符位置。
应用本发明实施例,可以根据数字图像中的读数的排布将读数进行垂直分割,将数字图像分割为多个图像,并使每个图像中分别包含读数中的一个字符。
针对第一目标图像,可以根据数字图像中的读数排布位置,以及分割顺序的不同进行排序,使得被分割出来的多个第一目标图像包含位置信息。
步骤140、基于第一目标图像识别第一目标图像中的目标字符;
应用本发明实施例,可通过分割后的第一目标图像中的字符识别对应的字符含义,如数字式表计的读数包含的数字“0-9”、小数点“.”以及相数“A、B、C”。
步骤150、若识别失败,则对数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
在识别的过程中,主要依据的是第一目标图像中的字符与数字“0-9”、小数点“.”以及相数“A、B、C”进行比较,确定第一目标图像中的字符与数字“0-9”、小数点“.”以及相数“A、B、C”的相似度,最终确定第一目标图像所对应的字符,确定第一目标图像中的目标字符。若第一目标图像与数字“0-9”、小数点“.”以及相数“A、B、C”的相似度低于一定的程度,则可判断为识别失败。此时对从图像数据中截取获得的数字图像采取矩形分割的方式进行重新分割。
应用于本发明实施例,矩形分割主要是在数字图像中分别获取各个字符,然后以字符的边缘位置为准,作矩形将整个字符进行框选,此时需要确保字符所有的像素点均被框选在内,然后根据该矩形框将对应的字符整体从数字图像中截取出来的,作为用于识别的第二目标图像。
步骤160、基于第二目标图像识别第二目标图像中的目标字符。
应用本发明实施例,第二目标图像的识别方式与过程与第一目标图像的识别一致,详细可以参考步骤140中的描述,在此不再过多的叙述。
在本发明实施例中,对于包含数字式表计的读数的图像数据,在图像数据中截取包含读数的部分的作为数字图像,将位于读数周部的空白部分去除,从而有效的降低了后续识别是的计算量,以及减少空白区域对识别的成功率的影响;先通过垂直分割的方式将数字图像分割为第一目标图像进行图像识别,识别读数对应的字符,降低了在分割时的计算量,并在识别失败后通过矩形分割的方式对数字图像进行分割获得第二目标图像,以更少影响因素的第二目标图像再次执行字符识别,保证在移动终端等资源较为紧缺的计算机设备中实时进行数字式表计的识别的同时,也提升了读数识别的准确度。
实施例二
图2为本发明实施例二提供的一种数字式表计读数识别方法的流程图,该实施例为在上述实施例一的基础上进行细化,详细描述了数据处理过程。该方法具体包括如下步骤:
步骤201、获取包含数字式表计的读数的图像数据;
在本实施例中,对于包含数字式表计的读数的图像数据获取与实施例一中步骤110基本相似,相关之处参见实施例一中的部分说明即可。
步骤202、将图像数据输入预置的全卷积网络对图像数据中的数字进行处理,获得数字区域;
全卷积网络(FCN,Fully Convolutional Networks)是一种图像语义分割算法,通过对现有神经网络模型进行改进,获得的端对端像素级预测,降低了训练的复杂性,并且能够准确的提取图像中的深层语义信息。FCN通过多层卷积、池化等操作较好的地避免了光照不均匀、随机噪声、图像扭曲等问题,广泛应用于图像分割领域。
在本实施例中,主要应用全卷积网络对获取的图像数据进行图像语义分割,从而从图像数据中判别属于数字式表计的读数的部分。
在其他实施例中,还可以通过其他的语义分割算法实现从图像数据中获取包含数字式表计的读数的数字区域,本发明实施例对此不加以限定。
步骤203、基于数字区域在图像数据中截取包含读数的部分,作为数字图像。
在本实施例中,利用全卷积网络对图像数据进行像素点级的图像语义分割,可获得图像数据中语义对应数字式表计的读数的像素点的位置,该部分像素点的集合即对对应着数字式表计的读数的数字区域,该区域的形状实际与数字式表计的读数的形状相一致,为不规则图形。
在发明实施例中,需要基于步骤202中所获得的数字区域从图像数据中截取出来包含全部数字式表计的读数的像素点到数字图像中,以便于后续的字符识别的进行。在截取的过程中可使用最小外接矩形的等形式将数字区域完整的截取出来,从而获得更少非读数区域的数字图像,以减少其余像素点对后续的字符识别的影响,降低信噪比。另外,还可以采用满足本发明实施例中减少数字图像中的空白区域降低信噪比的截取形式将包含数字式表计的读数的部分截取出来作为数字图像,在此不做详尽列出。
步骤204、对数字图像中的读数进行倾斜校正。
在本实施例中,由于图像数据的获取过程中巡检机器人与数字式表计之间存在非正对的情况,使得获取的图像数据朝向某一方向倾斜。
示例性地,对数字图像中的读数进行倾斜校正,可通过预先获取读数在水平方向或垂直方向上的倾斜度,例如获取读数底部的像素的连线所处的直线与水平方向所成的角度作为水平方向上的倾斜度,获得读数的左侧或右侧的像素点的连线所处的直线与垂直方向所成的角度作为水平方向上的倾斜度。在本发明实施例中对于倾斜度的获取和判定不做限定,可以根据实际情况针对数字式表计的读数进行判定。
其次,当数字式表计的读数的倾斜度大于预设值或数字式表计的读数的倾斜度不在预设范围内时,需要对数字图像进行倾斜矫正,该倾斜矫正方法可以采用图像旋转,即将倾斜的数字图像旋转到水平,图像的旋转点可以为图像中心点,也可以基于图像的顶点,本发明实施例对该图像旋转点不作限定,本领域技术人员可以根据图像实际情况进行选择。但是由于读数中存在小数点,在旋转过程中需要注意避免造成像素点重合。
步骤205、对数字图像进行二值化处理,获得预处理图像;
图像二值化(Image Binarization)就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程。即将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的0灰度和255灰度集合的二值化图像。通过对数字图像进行二值化处理,可使数字图像中的数据量大为减少,从而能凸显出读数的轮廓,使得数字式表计的读数能够更容易的被分辨出来。
进一步的,在数字图像进行二值化处理时,优先使用局部自适应二值化的方式进行。在局部自适应二值化中根据像素的邻域块的像素值分布来确定该像素位置上的二值化阈值,使得每个像素位置处的二值化阈值不是固定不变的,而是由其周围邻域像素的分布来决定的。使得数字式表计的读数部分的信息被更好的保存下来,避免造成降低数字式表计的读数的辨识度。
步骤206、将预处理图像的像素点垂直投影至水平轴上,获得预处理图像的水平投影;
在本发明实施例中,基于单行显示读数的数字式表计,即在本发明实施例中所提到的读数均为单行形式的存在。
在实际应用中,对二值化处理后的预处理图像的像素点进行垂直投影,垂直投影至水平轴上,对垂直方向上的像素点数量进行统计,与读数对应的区域的统计值较大,而读数的字符之间的空隙区域的统计值较小,从而可通过检测得到的垂直投影图上的统计值的波谷来确定字符的边界。
步骤207、基于水平轴上的像素分布情况竖向切割数字图像,获得至少两张第一目标图像。
基于前述步骤中垂直投影所得的像素点在水平轴上的分布统计值,可根据统计值的波谷位置确定读数的字符的左右边界,以及每个号码的位置,基于边界即可判定读数中的单个字符的切割位置,从而实现对数字图像的切割,将数字图像中的字符分别切割出来,成为多个包含单个字符的第一目标图像。
步骤208、将第一目标图像依次输入预置的LeNet卷积神经网络进行字符识别,获得各个第一目标图像对应的字符。
在本实施例中,将分割后的获得的第一目标图像输入到预置的LeNet卷积神经网络中进行识别,其中LeNet卷积神经网络可通过预先的训练得到,主要用于识别数字式表计中的数字“0-9”、小数点“.”以及相数“A、B、C”。具体的,在训练过程中以数字式表计中的数字“0-9”、小数点“.”以及相数“A、B、C”进行训练。
步骤209、获取目标字符对应的节点的概率值;
在LeNet卷积神经网络的输出中可获得识别后的结果,包括确定的字符以及对应的字符的预测概率值。
步骤210、将概率值与预设的阈值进行比较;
若概率值小于阈值,则执行步骤211;
在本发明实施例中,当读数的预测概率低于一定值时,则判定本次识别失败,识别结果作废,并且进行再次的分割和识别,以保证识别结果的可靠性。
步骤211、对数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像。
在本发明实施例中,由于在前次采用垂直投影方式分割获得的目标图像的识别概率值不符合预设的要求,在此步骤中改为矩形分割方式对数字图像进行分割,以进一边的截去读数周边的空白区域,以进一步的降低信噪比,提高识别成功率。
在矩形分割方式中,需要对对数字图像进行二值化处理,二值化处理后对字符取轮廓,即获取数字式表计的读数。
步骤2111、对数字图像进行二值化处理,获得预处理图像;
步骤2112、基于最小外接矩形算法确定预处理图像中的字符的边界;
在实际应用中,在对数字图像进行分割之前经过二值化处理,使得数字式表计的读数相对于背景更明显,使得数字式表计的读数的轮廓更明显,然后通过最小外接矩形算法实现单个字符的框选。
步骤2113、基于边界切割数字图像,获得至少一个包含字符的第二目标图像。
在前述步骤中将数字式表计的读数的每个字符的最小外接矩形的确定,在该步骤中需要做的是根据最小外接矩形分别切割数字图像,将数字式表计的读数的每个字符分割出来,作为第二目标图像再次识别。
步骤212、基于所述第二目标图像识别所述第二目标图像中的目标字符。
在重新以最小外接矩形算法分割数字图像获得第二目标图像后,再次进行识别操作,以更少周边像素的第二目标图像为基础进行字符的识别,第二目标图像的识别方法可参考步骤208中的方式进行,详细可以参考步骤208中的描述,在此不再过多的叙述。
步骤213、输出结果。
在本发明实施例中,首先通过垂直投影分割的方式对数字图像进行一次分割,并进行识别,根据识别结果判断是否需要进行二次识别,首先通过简单的垂直投影分割方法进行分割,可减少分割的计算量,简化计算过程。并且在一次识别后加入对识别成功的判断,在成功率低于阈值时采用更精细的最小外接矩形算法进行再次的分割,可尽可能的减少背景噪声,相对于垂直投影分割的方式获得的第二目标图像具有更少的空白区域,可有效的降低背景噪声,进一步的提高识别的精准性。
实施例三
图3为本发明实施例三提供的一种数字式表计读数识别装置的结构示意图,该装置具体可以包括如下模块:
获取模块310,用于获取包含数字式表计的读数的图像数据;
截取模块320,用于在图像数据中截取包含读数的数字图像;
第一分割模块330,用于对数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
第一识别模块340,用于基于第一目标图像识别目标图像中的目标字符;
第二分割模块350,用于在识别失败时,对数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
第二识别模块360,基于第二目标图像识别第二目标图像中的目标字符。
截取模块320包括:
第一处理单元,用于将图像数据输入预置的全卷积网络对图像数据中的数字进行处理,获得数字区域;
第一截取单元,用于基于数字区域在图像数据中截取包含读数的部分,作为数字图像。
在截取模块320之后,还包括:
校正模块321,用于对数字图像中的读数进行倾斜校正。
第一分割模块330包括:
第一二值化单元,对数字图像进行二值化处理,获得预处理图像;
投影单元,用于将预处理图像的像素点垂直投影至水平轴上,获得预处理图像的水平投影;
第一切割单元,用于基于水平轴上的像素分布情况竖向切割数字图像,获得至少两张第一目标图像。
第一识别模块340包括:
LeNet卷积神经网络单元,用于将第一目标图像依次输入预置的LeNet卷积神经网络进行字符识别,获得各个第一目标图像对应的字符。
第二分割模块350包括:
概率值获取单元,用于获取目标字符对应的节点的概率值;
比较单元,用于将概率值与预设的阈值进行比较;
第二分割模块350,包括:
第二二值化单元,用于对数字图像进行二值化处理,获得预处理图像;
最小外接矩形算法单元,用于基于最小外接矩形算法确定预处理图像中的字符的边界;
第二切割单元,基于边界切割数字图像,获得至少一个包含字符的第二目标图像。
本发明实施例所提供的数字式表计读数识别装置可执行本发明任意实施例所提供的数字式表计读数识别方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种数字式表计读数识别设备的结构示意图,如图4所示,该计算机设备包括处理器400、存储器410、输入装置420和输出装置430;计算机设备中处理器400的数量可以是一个或多个,图4中以一个处理器400为例;计算机设备中的处理器400、存储器410、输入装置420和输出装置430可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器410作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的数字式表计读数识别方法对应的程序指令/模块(例如,获取模块310、截取模块320、校正模块321、第一分割模块330、第一识别模块340、第二分割模块350、第二识别模块360)。处理器400通过运行存储在存储器410中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的数字式表计读数识别方法。
存储器410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器410可进一步包括相对于处理器400远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置420可用于获取图像数据入。输出装置430可用于输出识别结果。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种数字式表计读数识别方法,该方法包括:
获取包含数字式表计的读数的图像数据;
在所述图像数据中截取包含所述读数的数字图像;
对所述数字图像进行竖向分割,获得包含单个字符的字符图像,作为第一目标图像;
基于所述第一目标图像识别所述第一目标图像中的目标字符;
若所述识别失败,则对所述数字图像进行矩形分割,获得包含单个字符的矩形图像,作为第二目标图像;
基于所述第二目标图像识别所述第二目标图像中的目标字符。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的数字式表计读数识别方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述数字式表计读数识别装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (6)

1.一种数字式表计读数识别方法,其特征在于,包括:
获取包含数字式表计的读数的图像数据;
在所述图像数据中截取包含所述读数的数字图像,包括:将所述图像数据输入预置的全卷积网络对所述图像数据中的数字进行处理,获得数字区域;基于所述数字区域在所述图像数据中截取包含所述读数的部分,作为所述数字图像;
对所述数字图像进行二值化处理,获得预处理图像;将所述预处理图像的像素点垂直投影至水平轴上,获得所述预处理图像的水平投影;基于所述水平轴上的像素分布情况竖向切割所述数字图像,获得至少两张第一目标图像;
基于所述第一目标图像识别所述第一目标图像中的目标字符;
获取各个所述第一目标图像对应的字符以及对应的字符的预测概率值,将所述预测概率值与预设的阈值进行比较;
若所述预测概率值小于所述阈值,则对所述数字图像进行二值化处理,获得预处理图像;基于最小外接矩形算法确定所述预处理图像中的字符的边界;基于所述边界切割所述数字图像,获得至少一个包含所述字符的第二目标图像;
基于所述第二目标图像识别所述第二目标图像中的目标字符。
2.根据权利要求1所述的数字式表计读数识别方法,其特征在于,在所述图像数据中截取包含所述读数的数字图像之后,还包括:
对所述数字图像中的所述读数进行倾斜校正。
3.根据权利要求1所述的数字式表计读数识别方法,其特征在于,所述基于所述第一目标图像识别所述第一目标图像中的目标字符,包括:
将所述第一目标图像依次输入预置的LeNet卷积神经网络进行字符识别,获得各个所述第一目标图像对应的字符。
4.一种数字式表计读数识别装置,其特征在于,包括:
获取模块,用于获取包含数字式表计的读数的图像数据;
截取模块,用于在所述图像数据中截取包含所述读数的数字图像;
所述截取模块包括第一处理单元和第一截取单元;
所述第一处理单元,用于将所述图像数据输入预置的全卷积网络对所述图像数据中的数字进行处理,获得数字区域;
所述第一截取单元,用于基于所述数字区域在所述图像数据中截取包含读数的部分,作为所述数字图像;
第一分割模块包括第一二值化单元、投影单元和第一切割单元;
所述第一二值化单元,用于对所述数字图像进行二值化处理,获得预处理图像;
所述投影单元,用于将所述预处理图像的像素点垂直投影至水平轴上,获得所述预处理图像的水平投影;
所述第一切割单元,用于基于所述水平轴上的像素分布情况竖向切割所述数字图像,获得至少两张第一目标图像;
第一识别模块,用于基于所述第一目标图像识别所述目标图像中的目标字符;
第二分割模块包括概率值获取单元、比较单元、第二二值化单元、最小外接矩形算法单元和第二切割单元;
所述概率值获取单元,用于获取各个所述第一目标图像对应的字符以及对应的字符的预测概率值;
所述比较单元,用于将所述预测概率值与预设的阈值进行比较;
所述第二二值化单元,用于若所述预测概率值小于所述阈值,则对所述数字图像进行二值化处理,获得预处理图像;
所述最小外接矩形算法单元,用于基于最小外接矩形算法确定所述预处理图像中的字符的边界;
所述第二切割单元,用于基于所述边界切割所述数字图像,获得至少一个包含所述字符的第二目标图像;
第二识别模块,用于基于所述第二目标图像识别所述第二目标图像中的目标字符。
5.一种数字式表计读数识别设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3中任一所述的数字式表计读数识别方法。
6.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-3中任一所述的数字式表计读数识别方法。
CN202011364877.0A 2020-11-27 2020-11-27 数字式表计读数识别方法、装置、设备及存储介质 Active CN112464928B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011364877.0A CN112464928B (zh) 2020-11-27 2020-11-27 数字式表计读数识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011364877.0A CN112464928B (zh) 2020-11-27 2020-11-27 数字式表计读数识别方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112464928A CN112464928A (zh) 2021-03-09
CN112464928B true CN112464928B (zh) 2024-03-15

Family

ID=74809830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011364877.0A Active CN112464928B (zh) 2020-11-27 2020-11-27 数字式表计读数识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112464928B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930842A (zh) * 2016-04-15 2016-09-07 深圳市永兴元科技有限公司 字符识别方法及装置
CN106909941A (zh) * 2017-02-27 2017-06-30 广东工业大学 基于机器视觉的多表字符识别系统及方法
CN106960208A (zh) * 2017-03-28 2017-07-18 哈尔滨工业大学 一种仪表液晶数字自动切分和识别的方法及系统
CN108573261A (zh) * 2018-04-17 2018-09-25 国家电网公司 一种适用于变电站巡检机器人的数字显示仪表识别方法
CN109389123A (zh) * 2018-08-14 2019-02-26 广东省智能制造研究所 一种基于先验知识的自适应喷码字符分割方法及其系统
CN109858480A (zh) * 2019-01-08 2019-06-07 北京全路通信信号研究设计院集团有限公司 一种数字式仪表识别方法
CN110210477A (zh) * 2019-05-24 2019-09-06 四川阿泰因机器人智能装备有限公司 一种数字式仪表读数识别方法
CN110414527A (zh) * 2019-07-31 2019-11-05 北京字节跳动网络技术有限公司 字符识别方法、装置、存储介质及电子设备
CN110751158A (zh) * 2019-10-24 2020-02-04 江苏瑞尔医疗科技有限公司 一种治疗床显示器中的数字识别方法、装置及存储介质
CN111027546A (zh) * 2019-12-05 2020-04-17 北京嘉楠捷思信息技术有限公司 一种字符分割方法、装置以及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6599672B2 (ja) * 2015-07-17 2019-10-30 日本電産サンキョー株式会社 文字切り出し装置、文字認識装置、および文字切り出し方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930842A (zh) * 2016-04-15 2016-09-07 深圳市永兴元科技有限公司 字符识别方法及装置
CN106909941A (zh) * 2017-02-27 2017-06-30 广东工业大学 基于机器视觉的多表字符识别系统及方法
CN106960208A (zh) * 2017-03-28 2017-07-18 哈尔滨工业大学 一种仪表液晶数字自动切分和识别的方法及系统
CN108573261A (zh) * 2018-04-17 2018-09-25 国家电网公司 一种适用于变电站巡检机器人的数字显示仪表识别方法
CN109389123A (zh) * 2018-08-14 2019-02-26 广东省智能制造研究所 一种基于先验知识的自适应喷码字符分割方法及其系统
CN109858480A (zh) * 2019-01-08 2019-06-07 北京全路通信信号研究设计院集团有限公司 一种数字式仪表识别方法
CN110210477A (zh) * 2019-05-24 2019-09-06 四川阿泰因机器人智能装备有限公司 一种数字式仪表读数识别方法
CN110414527A (zh) * 2019-07-31 2019-11-05 北京字节跳动网络技术有限公司 字符识别方法、装置、存储介质及电子设备
CN110751158A (zh) * 2019-10-24 2020-02-04 江苏瑞尔医疗科技有限公司 一种治疗床显示器中的数字识别方法、装置及存储介质
CN111027546A (zh) * 2019-12-05 2020-04-17 北京嘉楠捷思信息技术有限公司 一种字符分割方法、装置以及计算机可读存储介质

Also Published As

Publication number Publication date
CN112464928A (zh) 2021-03-09

Similar Documents

Publication Publication Date Title
CN110276767B (zh) 图像处理方法和装置、电子设备、计算机可读存储介质
CN110705583B (zh) 细胞检测模型训练方法、装置、计算机设备及存储介质
CN110008809B (zh) 表格数据的获取方法、装置和服务器
CN111507958B (zh) 目标检测方法、检测模型的训练方法及电子设备
US20200410212A1 (en) Fast side-face interference resistant face detection method
CN110827244A (zh) 一种用于电子设备外观瑕疵检测的方法与设备
WO2021139197A1 (zh) 一种图像处理方法及装置
CN109413411B (zh) 一种监控线路的黑屏识别方法、装置及服务器
CN114972191A (zh) 一种耕地变化检测方法和装置
CN109344864B (zh) 用于密集物体的图像处理方法及装置
CN111680690A (zh) 一种文字识别方法及装置
CN112052702A (zh) 一种识别二维码的方法和装置
CN113158773B (zh) 一种活体检测模型的训练方法及训练装置
CN111597845A (zh) 一种二维码检测方法、装置、设备及可读存储介质
CN113870196A (zh) 一种基于锚点切图的图像处理方法、装置、设备和介质
CN113537037A (zh) 路面病害识别方法、系统、电子设备及存储介质
CN112464928B (zh) 数字式表计读数识别方法、装置、设备及存储介质
CN112001336A (zh) 行人越界报警方法、装置、设备及系统
US11778167B1 (en) Method and system for preprocessing optimization of streaming video data
CN114283431B (zh) 一种基于可微分二值化的文本检测方法
CN114445751A (zh) 视频关键帧图像轮廓特征的提取方法和装置
CN115619796A (zh) 获取光伏组件模板的方法及装置、非易失性存储介质
CN115272262A (zh) 室外绝缘子表面缺陷识别方法、装置及电子设备
CN114612907A (zh) 一种车牌识别方法及装置
CN114724091A (zh) 一种输电线路导线异物识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant