CN109543676A - 一种基于图像处理的字轮型水表数字字符识别方法 - Google Patents

一种基于图像处理的字轮型水表数字字符识别方法 Download PDF

Info

Publication number
CN109543676A
CN109543676A CN201811324700.0A CN201811324700A CN109543676A CN 109543676 A CN109543676 A CN 109543676A CN 201811324700 A CN201811324700 A CN 201811324700A CN 109543676 A CN109543676 A CN 109543676A
Authority
CN
China
Prior art keywords
character
region
image
word
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811324700.0A
Other languages
English (en)
Other versions
CN109543676B (zh
Inventor
窦健
刘宣
阿辽沙·叶
卢继哲
张海龙
郑国权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Electric Power Research Institute Co Ltd CEPRI
Original Assignee
China Electric Power Research Institute Co Ltd CEPRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Electric Power Research Institute Co Ltd CEPRI filed Critical China Electric Power Research Institute Co Ltd CEPRI
Priority to CN201811324700.0A priority Critical patent/CN109543676B/zh
Publication of CN109543676A publication Critical patent/CN109543676A/zh
Application granted granted Critical
Publication of CN109543676B publication Critical patent/CN109543676B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/02Recognising information on displays, dials, clocks

Abstract

本发明公开了一种基于图像处理的字轮型水表数字字符识别方法。读取到由摄像头采集的字轮型水表图像中的字轮图像区域;进行Sobel边缘提取,再进行字轮数字区域的初级定位;通过条件随机场对字轮数字区域进行处理,采用非参数化方法对条件随机场中的能量函数进行建模,求解能量函数的最小化问题,获得已分割字符的二值化图像,对已分割字符的二值化图像,采用模板匹配的方法进行数字识别。本发明能实现图像中字轮型水表数字字符识别,有助于水表超标的自动处理,方法的识别准确率达到99.95%,满足实际的抄表准确度需求。

Description

一种基于图像处理的字轮型水表数字字符识别方法
技术领域
本发明涉及一种数字识别方法,尤其是涉及一种基于图像处理的字轮型水表数字字符识别方法。
背景技术
人工抄表不仅消耗大量的人力、物力,而且具有诸多缺陷。在抄表过程中的不规范操作,如私自调整读数等会造成人为的水表损坏;现场条件的复杂性及人为因素的不确定性造成的少抄、漏抄等均会带来相当的经济损失;自来水公司需雇佣大量的抄表人员,增大管理成本。近年来,随着智能住宅的出现,智能抄表因其具有投资费用和运行费用低,整个过程速度快、效率高、操作简单等特点而得到越来越多的重视。
字轮型水表数字识别系统是一种利用图像传感器获得水表读数图像并通过模式识别技术获得水表读数的系统。该系统在传统水表上加盖一层识别系统,采用低成本的图像传感器获取水表表盘图像,并通过总线协议传输至管理系统以协助水表的智能化管理。与传统抄表方式相比,由于表盘图像通过网络传输至统一的管理端,因此可以方便地实现水表读数的系统管理,便于自来水公司对供水系统的调度。且该系统直接在原有水表上进行升级,部署成本较低。
现有技术中缺少了有效准确的字轮型水表数字字符识别算法。
发明内容
为解决人工抄表的诸多缺陷问题,本发明提出一种基于图像处理的字轮型水表数字字符识别方法,能准确识别字轮型水表的数字并具有良好稳定性。
本发明的技术方案采用如下步骤:
1)从硬件PPI接口通过建立的图像窗口读取到由摄像头采集的字轮型水表图像中的字轮图像区域;
2)对采集的字轮图像区域进行Sobel边缘提取,再进行字轮数字区域的初级定位;
3)将字轮数字区域中一个像素作为一个结点,通过条件随机场(CRF)对字轮数字区域进行处理,采用非参数化方法对条件随机场中的能量函数进行建模,同时考虑单个字符的笔画的像素宽度和字符间的相对位置距离,采用置信传播(BP)来求解能量函数的最小化问题,获得已分割字符的二值化图像;
本发明将字轮数字区域的单个字符的分割与二值化转化为条件随机场(CRF)的一个标记问题,这样巧妙地将字符分割问题转换为标记问题,更易通过算法实现,而且执行效率更高,获得的字符分割结果更好。
4)对步骤3)得到的已分割字符的二值化图像,采用模板匹配的方法进行数字识别:
水表字符存在半字情况,即单个字符由相邻两个字符模板的一半组成(见图6),定义这种存在半字情况的水表字符的上半部分字符为上字,下半部分字符为下字。
字轮型水表中存在上字与下字分别为临近字符的半字情况,上字为显现下半部分的半字,下字为显现完整部分的完整字。
先在模板匹配阶段建立0-9每个数字完整字符的字符模板;将字符模板分别归一化为9×12像素大小的灰度模板,对将已分割字符的二值化图像中分割后的字符进行上字与下字的定位和识别,识别出为整字情况或者半字情况,并对上字与下字的字符进行拆字获得上字图像区域和下字图像区域;
对于整字情况,直接将字符图像区域分别与各个字符模板计算欧式距离,取最小距离对应字符模板的数字作为字符标记;对于半字情况,将上字图像区域和下字图像区域均缩放至9像素宽度大小,高度根据比例缩放至对应大小,然后以上字图像区域的高度为基准,从上方开始,将上字图像区域分别与各个字符模板计算欧式距离;接着以下字图像区域的高度为基准,从下方开始,将下字图像区域分别与各个字符模板计算欧式距离,取各自欧氏距离的最小距离对应字符模板的数字作为字符标记;分别计算上字与下字的模板匹配,最终以模板匹配结果确认水表字符的位置。
所述的步骤1)中,图像采集方式设置为YUYV格式,在读取数据后仅保留Y分量,即灰度图像。
所述的步骤2)中具体为:
a)使用模板[-1 0 1]提取字轮图像区域的水平边缘特征图Gx和垂直边缘特征图Gy;
b)对字轮图像区域进行水平投影得到各行的直方子图Hj,由各行的直方子图Hj构成水平方向的直方图H:
其中,j=1,…,h,j表示行的序数,w,h分别为字轮图像区域的宽、高,i表示像素点所在列的序数,Hj表示字轮图像区域中第j行的所有灰度值构成的直方子图;分别为水平边缘特征图Gx和垂直边缘特征图Gy的第j行第i列像素点的边缘梯度值;
c)再采用以下方式获得水平方向的直方图H中所有可能的第一字符区域部分Rn:定义第一截断参数ρ1,比较直方子图Hj(j=1,…,h)中像素点和第一截断参数ρ1的大小,从j=1行时开始比较,当Hj1时,记下此时行j的序数值j1;然后继续向下比较,当Hj≤ρ1时,记下此时行j的序数值j2,则Rn=[j1,j2],即剔除字轮图像区域中小于行j1和大于行j2的直方子图,保留在行j1和行j2之间的部分;
d)对第一字符区域部分Rn,进行垂直投影得到各列的直方子图Vn i,由各列的直方子图Vn i构成垂直方向的直方图Vn
其中,Vn i表示第一字符区域部分Rn中第i列的所有灰度值构成的直方子图;
e)再采用以下方式获得垂直方向的直方图Vn中所有可能的第二字符区域部分Rn,m:定义第二截断参数ρ2,比较直方子图Vn i(i=1,…,w)和第二截断参数ρ2的大小,从i=1时开始比较,当Vn i2时,记下此时列i的序数值i1;然后继续向下比较,当Vn i≤ρ2时,记下列i的序数值i2,则Rn,m=[j1,j2,i1,i2],即继续剔除第一字符区域部分Rn中小于列i1和大于列i2的直方子图,保留在行j1和行j2之间且列i1和列i2之间的部分;
最终以第二字符区域部分Rn,m所在的图像区域作为字轮数字区域。
通过参数ρ12来控制字符的合理纹理统计结果,该算法计算速度很快,满足有限计算能力下的快速字符定位。
所述的步骤3)中,条件随机场的能量函数建模如下:
将字轮数字区域中一个像素作为一个结点,每相邻的两个像素之间均存在边连接,由结点及连接结点的边组成的集合构成图,结点和边分别记作v和e,结点和边的集合分别记作V和E,图记作G=(V,E),图分为有向图和无向图,无向图是指边没有方向的图;将步骤2)获得的字轮数字区域看作无向图,无向图是指边没有方向的图,结点v对应于字轮数字区域中的一个像素,根据4连通原则两个相邻结点之间都存在一条边;
建立以下能量函数EN:
fh(yv,v|I)=-log(hv)
g(ye,e|I)=exp(-β(a1-a2)2)
其中,I表示字轮数字区域的灰度状态分布,λ,γ,κ分别为第一、第二、第三超参数,ξ是第四超参数,β是第五超参数;yv,ye分别是结点和边的标记变量,hv为直方图中结点v的归一化向量值,hhv是结点v所属的连通区域的高度,a1,a2分别是边e两侧所连接的两个结点的像素值;
以最小化能量函数EN为目标进行求解获得每个结点的标记变量yv,yv∈{1,-1};然后根据每个结点的标记变量yv判断结点对应像素点是否属于字符的情况:若当前结点被条件随机场标记为1,即每个结点的标记变量yv为1,则为字符前景,即该结点属于字轮数字区域的单个字符的一部分;若当前结点被条件随机场标记为-1,即每个结点的标记变量yv为-1,则为字符背景,即该结点不属于字轮数字区域的单个字符的一部分;
然后将标记变量yv为1的结点对应的像素点赋予灰度值255,将标记变量yv为-1的结点对应的像素点赋予灰度值0,由此获得已分割字符的二值化图像。
以最小化能量函数EN为目标具体可采用以下方式过程求解获得每个结点的标记变量yv
a)对采集的字轮图像区域,初始化像素的标记状态Y,使得字轮数字区域的像素全标记为1,其他区域像素全标记为-1;
定义边e的消息量me,初始化各个像素的消息量均为0,即t=0,t表示迭代次数;
b)对每一个结点v,采用以下公式进行迭代计算,获得在迭代t次后的标记权重bt(yv)为:
其中,v,q分别为边e连接的两个结点,yv为结点v的标记变量,yv∈{1,-1},为迭代t次后边e在标记变量yv情况下的消息量,上标t代表进行迭代第t次时的初始状态,为迭代t-1次后边e在标记变量yq情况下的消息量;
c)对每一个结点v,迭代t次后的实际标记变量为:
重复上述步骤进行迭代,当逐渐收敛,停止迭代;迭代完成后,将标记变量的所有像素点组成的区域为字符的精确分割区域。上述迭代过程通常在3-5次即可收敛至稳定。
所述的步骤4)中的字符识别算法如下:
对步骤3)得到的已分割字符的二值化图像,检测相邻连通域之间是否存在4至8个像素距离的且赋予灰度值0的图像区域,若不存在,则将单个连通域作为检测区域进行整字识别算法,否则将相邻两个连通域拆分开单独作为检测区域进行半字识别算法:
4.1a)整字识别算法:
将检测区域缩放至9×12像素大小,并以行优先方式展开为一维向量vec,采用以下公式计算最近邻距离获得字符标记label*
其中,label为0到9的字符,veclabel为字符label对应的字符模板。
4.1b)半字识别算法:
将检测区域分为上字与下字,检测上字与下字的宽高,上字的宽高记为wup,hup,下字的宽高为wdn,hdn,将上字与下字分别按比例缩放至9×(hup*9/wup)像素大小和9×(hdn*9/wdn)像素大小,分别记为vecup与vecdn
采用以下公式计算最近邻距离获得字符标记l*
其中,|| ||dn表示以上字缩放后的高度为基准从下方开始对上字和字符label对应的字符模板计算欧式距离,|| ||up表示以下字缩放后的高度为基准从上方开始对下字和字符label对应的字符模板计算欧式距离;
得到的字符标记label*所对应的字符即为已分割字符的二值化图像所对应的数字,从而完成字轮型水表数字字符识别。
本发明所具备的效果如下:
本发明能从图像中准确识别字轮型水表数字字符,识别方法的识别准确率高,鲁棒性好,使用该方法对字轮型水表的数字进行识别具有非常好的效果,且对处于昏暗、复杂背景下的水表具有通用性。
附图说明
图1为本发明方法流程图。
图2为采集的字轮图像区域图。
图3~5为字轮型水表数字识别结果图(其中(a)为原始图像,(b)为识别结果图)。
图3(a)为字轮型水表数字识别第一原始图。
图3(b)为字轮型水表数字识别第一结果图。
图4(a)为字轮型水表数字识别第二原始图。
图4(b)为字轮型水表数字识别第二结果图。
图5(a)为字轮型水表数字识别第三原始图。
图5(b)为字轮型水表数字识别第三结果图。
图6为存在半字情况的水表字符图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步详细说明。
如图1所示,本发明的实施例及其实施过程如下:
1)从硬件PPI接口通过建立的图像窗口读取到由摄像头采集的字轮型水表图像中的字轮图像区域,采集的字轮图像区域如图2所示;
图像采集方式设置为YUYV格式,在读取数据后仅保留Y分量,即灰度图像。建立的图像窗口读取大小为150×60,占用内存大小9000字节。
2)对采集的字轮图像区域进行Sobel边缘提取,再进行字轮数字区域的初级定位;
2.a)使用模板[-1 0 1]提取字轮图像区域的水平边缘特征图Gx和垂直边缘特征图Gy;
2.b)对字轮图像区域进行水平投影得到各行的直方子图Hj,由各行的直方子图Hj构成水平方向的直方图H:
2.c)再采用以下方式获得水平方向的直方图H中所有可能的第一字符区域部分Rn:定义第一截断参数ρ1,在实际系统中ρ1取10×w;比较直方子图Hj(j=1,…,h)中像素点和第一截断参数ρ1的大小,从j=1行时开始比较,当Hj1时,记下此时行j的序数值j1;然后继续向下比较,当Hj≤ρ1时,记下此时行j的序数值j2,则Rn=[j1,j2],即剔除字轮图像区域中小于行j1和大于行j2的直方子图,保留在行j1和行j2之间的部分;
2.d)对第一字符区域部分Rn,进行垂直投影得到各列的直方子图Vn i,由各列的直方子图Vn i构成垂直方向的直方图Vn
2.e)再采用以下方式获得垂直方向的直方图Vn中所有可能的第二字符区域部分Rn,m:定义第二截断参数ρ2,在实际系统中ρ1取10*(bn-tn);比较直方子图Vn i(i=1,…,w)和第二截断参数ρ2的大小,从i=1时开始比较,当Vn i2时,记下此时列i的序数值i1;然后继续向下比较,当Vn i≤ρ2时,记下列i的序数值i2,则Rn,m=[j1,j2,i1,i2],即继续剔除第一字符区域部分Rn中小于列i1和大于列i2的直方子图,保留在行j1和行j2之间且列i1和列i2之间的部分;
最终以第二字符区域部分Rn,m所在的图像区域作为字轮数字区域。
3)将字轮数字区域中一个像素作为一个结点,通过条件随机场(CRF)对字轮数字区域进行处理,采用非参数化方法对条件随机场中的能量函数进行建模,同时考虑单个字符的笔画的像素宽度和字符间的相对位置距离,采用置信传播(BP)来求解能量函数的最小化问题,获得已分割字符的二值化图像。
将字轮数字区域中一个像素作为一个结点,每相邻的两个像素之间均存在边连接,由结点及连接结点的边组成的集合构成图,结点和边分别记作v和e,结点和边的集合分别记作V和E,图记作G=(V,E);将步骤2)获得的字轮数字区域看作无向图,无向图是指边没有方向的图;
条件随机场的能量函数建模如下:
fh(yv,v|I)=-log(hv)
g(ye,e|I)=exp(-β(a1-a2)2)
其中,具体实施中五个超参数取λ=γ=κ=1,ξ=0.7,β=0.65。以最小化能量函数EN为目标进行求解获得每个结点的标记变量yv,yv∈{1,-1}:
3.a)对采集的字轮图像区域,初始化像素的标记状态Y,使得字轮数字区域的像素全标记为1,其他区域像素全标记为-1;
定义边e的消息量me,初始化各个像素的消息量均为0,即t=0,t表示迭代次数;
3.b)对每一个结点v,采用以下公式进行迭代计算,获得在迭代t次后的标记权重bt(yv)为:
3.c)对每一个结点v,迭代t次后的实际标记变量为:
重复上述步骤进行迭代,当逐渐收敛,停止迭代;迭代完成后,将标记变量的所有像素点组成的区域为字符的精确分割区域。
然后根据每个结点的标记变量yv判断结点对应像素点是否属于字符的情况:若当前结点被条件随机场标记为1,即每个结点的标记变量yv为1,则为字符前景,即该结点属于字轮数字区域的单个字符的一部分;若当前结点被条件随机场标记为-1,即每个结点的标记变量yv为-1,则为字符背景,即该结点不属于字轮数字区域的单个字符的一部分。
然后将标记变量yv为1的结点对应的像素点赋予灰度值255,将标记变量yv为-1的结点对应的像素点赋予灰度值0,由此获得已分割字符的二值化图像。
4)对步骤3)得到的已分割字符的二值化图像,采用模板匹配的方法进行数字识别:
先在模板匹配阶段建立0-9每个数字完整字符的字符模板;将字符模板分别归一化为9×12像素大小的灰度模板,对将已分割字符的二值化图像中分割后的字符进行上字与下字的定位和识别,识别出为整字情况或者半字情况,并对上字与下字的字符进行拆字获得上字图像区域和下字图像区域;
具体措施是,对步骤3)得到的已分割字符的二值化图像,检测相邻连通域之间是否存在4至8个像素距离的且赋予灰度值0的图像区域,若不存在,则将单个连通域作为检测区域进行整字识别算法,否则将相邻两个连通域拆分开单独作为检测区域进行半字识别算法:
4.1a)整字识别算法:
将检测区域缩放至9×12像素大小,并以行优先方式展开为一维向量vec,采用以下公式计算最近邻距离获得字符标记label*
其中,label为0到9的字符,veclabel为字符label对应的字符模板。
4.1b)半字识别算法:
将检测区域分为上字与下字,检测上字与下字的宽高,上字的宽高记为wup,hup,下字的宽高为wdn,hdn,将上字与下字分别按比例缩放至9×(hup*9/wup)像素大小和9×(hdn*9/wdn)像素大小,分别记为vecup与vecdn
采用以下公式计算最近邻距离获得字符标记l*
其中,|| ||dn表示以上字缩放后的高度为基准从下方开始对上字和字符label对应的字符模板计算欧式距离,||| |up表示以下字缩放后的高度为基准从上方开始对下字和字符label对应的字符模板计算欧式距离;
得到的字符标记label*所对应的字符即为已分割字符的二值化图像所对应的数字,从而完成字轮型水表数字字符识别。
实验过程中一共采集了3000张字轮型水表的数字图像,通过文所述的新型的字轮型水表数字识别方法进行识别,得到的结果如表1所示:
表1字轮型水表数字识别结果
待检测图像数 数字“0”检测成功率 数字“1”检测成功率
3000 100% 100%
数字“2”检测成功率 数字“3”检测成功率 数字“4”检测成功率
100% 100% 100%
待检测图像数 数字“5”检测成功率 数字“6”检测成功率
3000 100% 100%
数字“7”检测成功率 数字“8”检测成功率 数字“9”检测成功率
100% 100% 100%
从表1可以看出,数字0~9的检测成功率均可达到100%。
本发明方法的识别和标记结果如图3~图5(b)所示,其中框出了单个字符区域的位置,并输出了该单个字符区域对应的数字以及该结果的置信度。图3(b)中识别出的结果依次为“8”、“7”、“6”、“5”、“4”、“7”、“1”、“6”,对比图3(a)中的数字可以看出该次识别所有的字符均识别正确,其中第一个“6”、“5”、“4”和“1”均是半字识别算法识别的结果;图4(b)中识别出的结果依次为“7”、“6”、“5”、“4”、“3”、“6”、“1”、“5”,对比图4(a)中的数字可以看出该次识别所有的字符均识别正确,其中“4”、第二个“6”和“1”均是半字识别算法识别的结果;图5(b)中识别出的结果依次为“7”、“6”、“9”、“1”、“4”、“8”、“1”、“3”,对比图5(a)中的数字可以看出该次识别所有的字符均识别正确,其中除了“3”其他均是半字识别算法识别的结果。
从结果可以看到,对于正常以及半字状态下的字符区域,本发明方法均能够准确地识别出相应的数字。
实验结果表明,该方法的识别综合准确率达到99.95%,满足实际的抄表准确度需求。
由此可见,本发明能够实现字轮型水表的数字识别,具有较高的准确率,并且具有稳定性好,抗干扰能力强,通用性高等优点,对于较为模糊的图像也能够很好地识别。
上述具体实施方式用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (6)

1.一种基于图像处理的字轮型水表数字字符识别方法,其特征在于:包括以下步骤:
1)从硬件PPI接口通过建立的图像窗口读取到由摄像头采集的字轮型水表图像中的字轮图像区域;
2)对采集的字轮图像区域进行Sobel边缘提取,再进行字轮数字区域的初级定位;
3)将字轮数字区域中一个像素作为一个结点,通过条件随机场(CRF)对字轮数字区域进行处理,采用非参数化方法对条件随机场中的能量函数进行建模,同时考虑单个字符的笔画的像素宽度和字符间的相对位置距离,采用置信传播(BP)来求解能量函数的最小化问题,获得已分割字符的二值化图像;
4)对步骤3)得到的已分割字符的二值化图像,采用模板匹配的方法进行数字识别:
先在模板匹配阶段建立0-9每个数字完整字符的字符模板;将字符模板分别归一化为9×12像素大小的灰度模板,对将已分割字符的二值化图像中分割后的字符进行上字与下字的定位和识别,并对上字与下字的字符进行拆字获得上字图像区域和下字图像区域;
对于整字情况,直接将字符图像区域分别与各个字符模板计算欧式距离,取最小距离对应字符模板的数字作为字符标记;对于半字情况,将上字图像区域和下字图像区域均缩放至9像素宽度大小,高度根据比例缩放至对应大小,然后以上字图像区域的高度为基准,从上方开始,将上字图像区域分别与各个字符模板计算欧式距离;接着以下字图像区域的高度为基准,从下方开始,将下字图像区域分别与各个字符模板计算欧式距离,取各自欧氏距离的最小距离对应字符模板的数字作为字符标记;最终以模板匹配结果确认水表字符的位置。
2.根据权利要求1所述的一种基于图像处理的字轮型水表数字字符识别方法,其特征在于:所述的步骤1)中,图像采集方式设置为YUYV格式,在读取数据后仅保留Y分量,即灰度图像。
3.根据权利要求1所述的一种基于图像处理的字轮型水表数字字符识别方法,其特征在于:所述的步骤2)中具体为:
a)使用模板[-1 0 1]提取字轮图像区域的水平边缘特征图Gx和垂直边缘特征图Gy;
b)对字轮图像区域进行水平投影得到各行的直方子图Hj,由各行的直方子图Hj构成水平方向的直方图H:
其中,j=1,L,h,j表示行的序数,w,h分别为字轮图像区域的宽、高,i表示像素点所在列的序数,Hj表示字轮图像区域中第j行的所有灰度值构成的直方子图;分别为水平边缘特征图Gx和垂直边缘特征图Gy的第j行第i列像素点的边缘梯度值;
c)再采用以下方式获得水平方向的直方图H中所有可能的第一字符区域部分Rn:定义第一截断参数ρ1,比较直方子图Hj(j=1,L,h)中像素点和第一截断参数ρ1的大小,从j=1行时开始比较,当Hj1时,记下此时行j的序数值j1;然后继续向下比较,当Hj≤ρ1时,记下此时行j的序数值j2,则Rn=[j1,j2],即剔除字轮图像区域中小于行j1和大于行j2的直方子图,保留在行j1和行j2之间的部分;
d)对第一字符区域部分Rn,进行垂直投影得到各列的直方子图Vn i,由各列的直方子图Vn i构成垂直方向的直方图Vn
其中,Vn i表示第一字符区域部分Rn中第i列的所有灰度值构成的直方子图;
e)再采用以下方式获得垂直方向的直方图Vn中所有可能的第二字符区域部分Rn,m:定义第二截断参数ρ2,比较直方子图Vn i(i=1,L,w)和第二截断参数ρ2的大小,从i=1时开始比较,当Vn i2时,记下此时列i的序数值i1;然后继续向下比较,当Vn i≤ρ2时,记下列i的序数值i2,则Rn,m=[j1,j2,i1,i2],即继续剔除第一字符区域部分Rn中小于列i1和大于列i2的直方子图,保留在行j1和行j2之间且列i1和列i2之间的部分;
最终以第二字符区域部分Rn,m所在的图像区域作为字轮数字区域。
4.根据权利要求1所述的一种基于图像处理的字轮型水表数字字符识别方法,其特征在于:
所述的步骤3)中,条件随机场的能量函数建模如下:
将字轮数字区域中一个像素作为一个结点,每相邻的两个像素之间均存在边连接,由结点及连接结点的边组成的集合构成图,结点和边分别记作v和e,结点和边的集合分别记作V和E,图记作G=(V,E);将步骤2)获得的字轮数字区域看作无向图,无向图是指边没有方向的图;
建立以下能量函数EN:
fh(yv,v|I)=-log(hv)
g(ye,e|I)=exp(-β(a1-a2)2)
其中,I表示字轮数字区域的灰度状态分布,λ,γ,κ分别为第一、第二、第三超参数,ξ是第四超参数,β是第五超参数;yv,ye分别是结点和边的标记变量,hv为直方图中结点v的归一化向量值,hhv是结点v所属的连通区域的高度,a1,a2分别是边e两侧所连接的两个结点的像素值;
以最小化能量函数EN为目标进行求解获得每个结点的标记变量yv,yv∈{1,-1};然后根据每个结点的标记变量yv判断结点对应像素点是否属于字符的情况:若当前结点被条件随机场标记为1,即每个结点的标记变量yv为1,则为字符前景,即该结点属于字轮数字区域的单个字符的一部分;若当前结点被条件随机场标记为-1,即每个结点的标记变量yv为-1,则为字符背景,即该结点不属于字轮数字区域的单个字符的一部分;
然后将标记变量yv为1的结点对应的像素点赋予灰度值255,将标记变量yv为-1的结点对应的像素点赋予灰度值0,由此获得已分割字符的二值化图像。
5.根据权利要求1所述的一种基于图像处理的字轮型水表数字字符识别方法,其特征在于:以最小化能量函数EN为目标具体可采用以下方式过程求解获得每个结点的标记变量yv
a)对采集的字轮图像区域,初始化像素的标记状态Y,使得字轮数字区域的像素全标记为1,其他区域像素全标记为-1;定义边e的消息量me,初始化各个像素的消息量均为0,即t=0,t表示迭代次数;
b)对每一个结点v,采用以下公式进行迭代计算,获得在迭代t次后的标记权重bt(yv)为:
其中,v,q分别为边e连接的两个结点,yv为结点v的标记变量,yv∈{1,-1},为迭代t次后边e在标记变量yv情况下的消息量,为迭代t-1次后边e在标记变量yq情况下的消息量;
c)对每一个结点v,迭代t次后的实际标记变量为:
重复上述步骤进行迭代,当逐渐收敛,停止迭代;迭代完成后,将标记变量的所有像素点组成的区域为字符的精确分割区域。
6.根据权利要求1所述的一种基于图像处理的字轮型水表数字字符识别方法,其特征在于:所述的步骤4)中的字符识别算法如下:
对步骤3)得到的已分割字符的二值化图像,检测相邻连通域之间是否存在4至8个像素距离的且赋予灰度值0的图像区域,若不存在,则将单个连通域作为检测区域进行整字识别算法,否则将相邻两个连通域拆分开单独作为检测区域进行半字识别算法:
4.1a)整字识别算法:
将检测区域缩放至9×12像素大小,并以行优先方式展开为一维向量vec,采用以下公式计算最近邻距离获得字符标记label*
其中,label为0到9的字符,veclabel为字符label对应的字符模板。
4.1b)半字识别算法:
将检测区域分为上字与下字,检测上字与下字的宽高,上字的宽高记为wup,hup,下字的宽高为wdn,hdn,将上字与下字分别按比例缩放至9×(hup*9/wup)像素大小和9×(hdn*9/wdn)像素大小,分别记为vecup与vecdn
采用以下公式计算最近邻距离获得字符标记l*
其中,||||dn表示以上字缩放后的高度为基准从下方开始对上字和字符label对应的字符模板计算欧式距离,||||up表示以下字缩放后的高度为基准从上方开始对下字和字符label对应的字符模板计算欧式距离;
得到的字符标记label*所对应的字符即为已分割字符的二值化图像所对应的数字,从而完成字轮型水表数字字符识别。
CN201811324700.0A 2018-11-08 2018-11-08 一种基于图像处理的字轮型水表数字字符识别方法 Active CN109543676B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811324700.0A CN109543676B (zh) 2018-11-08 2018-11-08 一种基于图像处理的字轮型水表数字字符识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811324700.0A CN109543676B (zh) 2018-11-08 2018-11-08 一种基于图像处理的字轮型水表数字字符识别方法

Publications (2)

Publication Number Publication Date
CN109543676A true CN109543676A (zh) 2019-03-29
CN109543676B CN109543676B (zh) 2022-12-06

Family

ID=65845075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811324700.0A Active CN109543676B (zh) 2018-11-08 2018-11-08 一种基于图像处理的字轮型水表数字字符识别方法

Country Status (1)

Country Link
CN (1) CN109543676B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110728279A (zh) * 2019-08-30 2020-01-24 南京理工大学 一种基于嵌入式平台机器视觉的水表数字识别方法
CN110991449A (zh) * 2019-11-28 2020-04-10 南京工程学院 一种面向字轮字符的全字半字识别方法
CN111031222A (zh) * 2019-12-27 2020-04-17 山东厚德测控技术股份有限公司 一种摄像式燃气表字轮实时识别装置及方法
CN112149655A (zh) * 2020-09-28 2020-12-29 怀化建南机器厂有限公司 一种水表读数识别方法、装置、设备以及存储介质
CN112464932A (zh) * 2020-11-26 2021-03-09 广东工业大学 水表数值自动读取方法、装置、电子设备及存储介质
CN113269195A (zh) * 2021-06-11 2021-08-17 四川长虹网络科技有限责任公司 读数表图像字符识别方法和装置以及可读存储介质
CN116452615A (zh) * 2023-06-19 2023-07-18 恒银金融科技股份有限公司 冠字号区域前景和背景的分割方法和装置
CN117260100A (zh) * 2023-11-23 2023-12-22 江苏恒康电力科技有限公司 一种变电站电力设备铁附件智能定位焊接系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026805A (ja) * 2008-07-18 2010-02-04 Denso Corp 文字認識装置及び文字認識方法
CN101859382A (zh) * 2010-06-03 2010-10-13 复旦大学 一种基于最大稳定极值区域的车牌检测与识别的方法
CN104700092A (zh) * 2015-03-26 2015-06-10 南京理工大学 一种基于模板和特征匹配相结合的小字符数字识别方法
WO2017031716A1 (zh) * 2015-08-26 2017-03-02 北京云江科技有限公司 自然场景图像中手写体数学公式结构分析与识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026805A (ja) * 2008-07-18 2010-02-04 Denso Corp 文字認識装置及び文字認識方法
CN101859382A (zh) * 2010-06-03 2010-10-13 复旦大学 一种基于最大稳定极值区域的车牌检测与识别的方法
CN104700092A (zh) * 2015-03-26 2015-06-10 南京理工大学 一种基于模板和特征匹配相结合的小字符数字识别方法
WO2017031716A1 (zh) * 2015-08-26 2017-03-02 北京云江科技有限公司 自然场景图像中手写体数学公式结构分析与识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JAN DIRK WEGNER等: "Building Detection From One Orthophoto and High-Resolution InSAR Data Using Conditional Random Fields", 《IEEE JOURNAL OF SELECTED TOPICS IN APPLIED EARTH OBSERVATIONS AND REMOTE SENSING》 *
郭世雄: "医疗仪器中的数字识别技术研究", 《中国优秀硕士学位论文全文数据库(电子期刊) 信息科技辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110728279A (zh) * 2019-08-30 2020-01-24 南京理工大学 一种基于嵌入式平台机器视觉的水表数字识别方法
CN110991449A (zh) * 2019-11-28 2020-04-10 南京工程学院 一种面向字轮字符的全字半字识别方法
CN111031222A (zh) * 2019-12-27 2020-04-17 山东厚德测控技术股份有限公司 一种摄像式燃气表字轮实时识别装置及方法
CN112149655A (zh) * 2020-09-28 2020-12-29 怀化建南机器厂有限公司 一种水表读数识别方法、装置、设备以及存储介质
CN112464932A (zh) * 2020-11-26 2021-03-09 广东工业大学 水表数值自动读取方法、装置、电子设备及存储介质
CN113269195A (zh) * 2021-06-11 2021-08-17 四川长虹网络科技有限责任公司 读数表图像字符识别方法和装置以及可读存储介质
CN116452615A (zh) * 2023-06-19 2023-07-18 恒银金融科技股份有限公司 冠字号区域前景和背景的分割方法和装置
CN116452615B (zh) * 2023-06-19 2023-10-03 恒银金融科技股份有限公司 冠字号区域前景和背景的分割方法和装置
CN117260100A (zh) * 2023-11-23 2023-12-22 江苏恒康电力科技有限公司 一种变电站电力设备铁附件智能定位焊接系统
CN117260100B (zh) * 2023-11-23 2024-03-08 江苏恒康电力科技有限公司 一种变电站电力设备铁附件智能定位焊接系统

Also Published As

Publication number Publication date
CN109543676B (zh) 2022-12-06

Similar Documents

Publication Publication Date Title
CN109543676A (zh) 一种基于图像处理的字轮型水表数字字符识别方法
CN103049763B (zh) 一种基于上下文约束的目标识别方法
CN107784661A (zh) 基于区域生长法的变电站设备红外图像分类识别方法
CN107808375B (zh) 融合多种上下文深度学习模型的水稻病害图像检测方法
CN109766887A (zh) 一种基于级联沙漏神经网络的多目标检测方法
CN103473551A (zh) 基于sift算子的台标识别方法及系统
CN103940824A (zh) 一种空中输电线路绝缘子检测方法
CN108764234B (zh) 一种基于巡检机器人的液位仪表读数识别方法
CN105260738A (zh) 基于主动学习的高分辨率遥感影像变化检测方法及系统
CN105160682B (zh) 图像边缘检测方法及装置
CN109376740A (zh) 一种基于视频的水尺读数检测方法
CN107886507B (zh) 一种基于图像背景和空间位置的显著区域检测方法
CN106127205A (zh) 一种适用于室内轨道机器人的数字仪表图像的识别方法
CN103440510A (zh) 一种面部图像中特征点的定位方法
CN111539330B (zh) 一种基于双svm多分类器的变电站数显仪表识别方法
CN104537367A (zh) 一种vin码的校验方法
CN102184404B (zh) 掌纹图像中手掌区域的获取方法及装置
CN105894041A (zh) 基于高光谱遥感影像提取配电网系统中变电站信息的方法
CN105426825A (zh) 一种基于航拍图像识别的电网地理接线图绘制方法
CN114639064B (zh) 一种水位识别方法及装置
CN109325487B (zh) 一种基于目标检测的全种类车牌识别方法
CN108133213A (zh) 一种面向燃气表外壳式摄像的嵌入式数字识别方法
CN110363101A (zh) 一种基于cnn特征融合框架的花卉识别方法
CN105894501A (zh) 一种高分辨率遥感图像单木探测和树冠描绘方法
CN103093241A (zh) 基于同质化处理的光学遥感图像非匀质云层判别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant