CN109753958A

CN109753958A - 图像字符识别方法

Info

Publication number: CN109753958A
Application number: CN201811556847.2A
Authority: CN
Inventors: 李晨; 叶静萍
Original assignee: Anhui Dian Dian Science And Technology Development Co Ltd
Current assignee: Anhui Dian Dian Science And Technology Development Co Ltd
Priority date: 2018-12-19
Filing date: 2018-12-19
Publication date: 2019-05-14

Abstract

本发明公开了一种图像字符识别方法，具体包括以下步骤：获取稳定的图片源，将采集到的图像通过网络传输系统载入到内存缓冲区；对采集到的图像进行二次处理，提高图像的对比度；使用灰度定位技术，将二次处理后的图像分割为不同的识别单元，对识别单元进行校正和定位；将识别单元映射到网格坐标系统中，形成网格特征区域，计算每个特征区域中灰白点的占用比例数，形成网格特征区域的外形特征；完成所有识别单元的外形特征解析后，进行存储。本发明避免识别过程中的各种干扰因素，提高识别率和准确率。

Description

图像字符识别方法

技术领域

本发明涉及一种图像字符识别方法。

背景技术

目前，各种视频处理系统在生产生活中得到了广泛应用，如，视频监控系统可对指定区域实施全天候的安全监视；产品流水线视频可对生产过程进行全线的监测和管理。但多数情况下，视频系统仅仅处于监视的功能，本身不具备(或较少具备)视频图像中某些信息的自动识别功能；另一方面，视频系统与识别技术相结合，在数字图形图像中提取某些(或某类)重要标识，如文字、数字、人像、指纹等，在实际环境下有着重要意义。从光线、环境等客观因素上而言，图像反应出的类型可能多种多样，颜色、形状、大小、位置、图像质量、噪点、清晰度等都是较为常见的识别难点。为避免识别过程中的各种干扰因素，提高识别率和准确率是需要解决的问题。

发明内容

本发明提出一种图像字符识别方法，避免识别过程中的各种干扰因素，提高识别率和准确率。

本发明的技术方案是这样实现的：

一种图像字符识别方法，具体包括以下步骤：

(1)获取稳定的图片源，将采集到的图像通过网络传输系统载入到内存缓冲区；

(2)对采集到的图像进行二次处理，提高图像的对比度；

(3)使用灰度定位技术，将二次处理后的图像分割为不同的识别单元，对识别单元进行校正和定位；

(4)将识别单元映射到网格坐标系统中，形成网格特征区域，计算每个特征区域中灰白点的占用比例数，形成网格特征区域的外形特征；

(5)完成所有识别单元的外形特征解析后，进行存储。

优选的，步骤(1)中，获取稳定的图片源，具体由成像设备、成像感应装置、照明系统和辅助装置组合工作获取。

优选的，成像设备包括但不限于相机、摄像头，成像感应装置为红外感应装置，辅助装置包括但不限于防抖动设备、远距离放大设备。

优选的，步骤(2)中，对采集到的图像进行二次处理，二次处理包括但不限于灰化、边缘增强、滤波和去除噪点，二次处理的过程中使用傅里叶、沃尔什二种算法同时处理的策略。

优选的，去除噪点具体包括

从图像的左侧开始，顺序向右，对图像的像素点灰度值进行数值排序，当某个像素点的获取值小于定值时，可判断此像素是噪点，去除。

优选的，边缘增强具体包括

梯度边缘检测：按照垂直方向和对角线方向计算相邻两像素之间的差值梯度，小于计算值的部分忽略，大于计算值的部分保留；或

利用微分运算计算像素的变化率，加强高频分量，从而使轮廓清晰。

优选的，步骤(3)中，使用灰度定位技术，将二次处理后的图像分割为不同的识别单元，具体包括

通过比较图片中的纹理，在横向、纵向二个方向将识别单元边缘化，形成连通的封闭空间，再对此封闭空间中的边缘部分进行特征筛选，形成较为准确的识别单元。

优选的，步骤(4)中将识别单元映射到网格坐标系统中，形成网格特征区域，具体包括

在X*Y的坐标系统中，建立12*12的网格坐标，形成144个网格特征区域。

优选的，若存在异同大小的识别单元，使用垂直投影的方法计算列方向的非零像素点个数，当此个数突变一定比例时，结束一次投影面的计算，表示一个识别单元的生成，将此生成单元映射到12*12的网格坐标中，完成形状大小的匹配。

优选的，步骤(5)中，完成所有识别单元的外形特征解析后，进行存储，具体指的是

将所有识别单元的外形特征解析结果存储至共享内存映射SMEMBuffer服务开辟的存储地址段。

本发明的有益效果在于：

(1)PhotoCharAnalyse组件使用灰度图像识别方式，不受色彩、光线或图像分辨率大小等因素的影响，淡化了视觉意义上的颜色、亮度等级、材质等事项。

(2)将图形图像中的特定区域准确分隔是提高识别率的关键步骤，PhotoCharAnalyse组件通过将灰度图像中的各像素点聚集到特定区域，来提高分隔的准确度。

(3)在完成整个图像解析后一次性地执行存储动作，以提高存储速度和性能。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种图像字符识别方法一个实施例的流程图；

图2为液晶单元字符识别效果示例；

图3为仪表盘指针、字符、状态量等识别效果示例；

图4为图像灰度定位效果；

图5为网格解析的识别效果。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1-图5所示，本发明提出了一种图像字符识别方法，本发明中设置了图像字符识别组件(PhotoCharAnalyse组件)，具体包括以下步骤：

(2)对采集到的图像进行二次处理，提高图像的对比度；

(3)使用灰度定位技术，将二次处理后的图像分割为不同的识别单元，对识别单元进行校正和定位；该步骤中，将识别单元的大小、形状、方向等进行校正和定位。

(5)完成所有识别单元的外形特征解析后，进行存储。

步骤(1)中，获取稳定的图片源，具体由成像设备、成像感应装置、照明系统和辅助装置组合工作获取。

成像设备包括但不限于相机、摄像头，成像感应装置为红外感应装置，辅助装置包括但不限于防抖动设备、远距离放大设备。

为了灰度定位和校验的高识别性，图像的数据采集步骤至关重要，比如，平视成像、防抖成像等辅助手段不可或缺。

步骤(2)中，对采集到的图像进行二次处理，二次处理包括但不限于灰化、边缘增强、滤波和去除噪点，二次处理的过程中使用傅里叶、沃尔什二种算法同时处理的策略。二次处理的目的是为了提高图像的对比度，增强图像的表现感，增加图像中可识别单元的基本特征可以被更好的识别。原始图像的二次处理过程，PhotoCharAnalyse组件使用了傅里叶、沃尔什二种算法同时处理的策略，处理时间、系统负荷和清晰度较为高效。

在本发明的具体实施例中，去除噪点具体包括

从图像的左侧开始，顺序向右，对图像的像素点灰度值进行数值排序，当某个像素点的获取值小于定值(使用变量ATOMFRAMEPCAVG＝30P)时，可判断此像素是噪点，去除。变量ATOMFRAMEPCAVG的取值精度范围对噪点的判断较为敏感，实际环境下，可自定义调节该选项，以实现较为合理的筛选数据。

边缘增强具体包括

梯度边缘检测：按照垂直方向和对角线方向计算相邻两像素之间的差值梯度，小于计算值的部分忽略，大于计算值的部分保留；如此，单元边线可能变窄，但显示单元之间的识别度将大大提高。梯度检测在水平、垂直方向上的作用效果明显。

利用微分运算计算像素的变化率，加强高频分量，从而使轮廓清晰。即：找到亮度的一阶导数比指定的范围值大，或找到亮度的二阶导数有零交叉的范围。

在本发明的优选实施例中，步骤(3)中，使用灰度定位技术，将二次处理后的图像分割为不同的识别单元，具体包括

步骤(4)中将识别单元映射到网格坐标系统中，形成网格特征区域，具体包括

若存在异同大小的识别单元，使用垂直投影的方法计算列方向的非零像素点个数，当此个数突变一定比例时，结束一次投影面的计算，表示一个识别单元的生成，将此生成单元映射到12*12的网格坐标中，完成形状大小的匹配。

步骤(5)中，完成所有识别单元的外形特征解析后，进行存储，具体指的是

本发明的有益效果在于：

(1)PhotoCharAnalyse组件使用灰度图像识别方式，不受色彩、光线或图像分辨率大小等因素的影响，淡化了视觉意义上的颜色、亮度等级、材质等事项。采用基于灰度的信息抽取方法，即：比较识别单元和底色的不同灰度值来处理像素突变，像素突变可产生边缘过渡特性或较为明显的像素点峰值差异，在识别单元的定位和分隔过程中可获得更好的识别效果。

(2)将图形图像中的特定区域准确分隔是提高识别率的关键步骤，PhotoCharAnalyse组件通过将灰度图像中的各像素点聚集到特定区域，来提高分隔的准确度。梯度检测可以使识别单元和背景区分出明显的对比度，配合使用微分检测方式，在毛刺、空洞、噪点及特定形状方面可以更加细化被处理的识别单元。

(3)在完成整个图像解析后一次性地执行存储动作，以提高存储速度和性能。由PhotoCharAnalyse组件采集、存储的图片图像是支持压缩编码的(在不影响识别率，图像不失真的前提下)，如此，可大大减少描述图像的数据量，节约传输的时间，也可提高识别处理的效率，降低系统的整体负荷。

上述技术方案公开了本发明的改进点，未详细公开的技术内容，可由本领域技术人员通过现有技术实现。

以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种图像字符识别方法，其特征在于，具体包括以下步骤：

(2)对采集到的图像进行二次处理，提高图像的对比度；

(5)完成所有识别单元的外形特征解析后，进行存储。

2.根据权利要求1所述的图像字符识别方法，其特征在于，步骤(1)中，获取稳定的图片源，具体由成像设备、成像感应装置、照明系统和辅助装置组合工作获取。

3.根据权利要求2所述的图像字符识别方法，其特征在于，成像设备包括但不限于相机、摄像头，成像感应装置为红外感应装置，辅助装置包括但不限于防抖动设备、远距离放大设备。

4.根据权利要求1所述的图像字符识别方法，其特征在于，步骤(2)中，对采集到的图像进行二次处理，二次处理包括但不限于灰化、边缘增强、滤波和去除噪点，二次处理的过程中使用傅里叶、沃尔什二种算法同时处理的策略。

5.根据权利要求4所述的图像字符识别方法，其特征在于，去除噪点具体包括

6.根据权利要求4所述的图像字符识别方法，其特征在于，边缘增强具体包括

7.根据权利要求1所述的图像字符识别方法，其特征在于，步骤(3)中，使用灰度定位技术，将二次处理后的图像分割为不同的识别单元，具体包括

8.根据权利要求7所述的图像字符识别方法，其特征在于，步骤(4)中将识别单元映射到网格坐标系统中，形成网格特征区域，具体包括

9.根据权利要求8所述的图像字符识别方法，其特征在于，若存在异同大小的识别单元，使用垂直投影的方法计算列方向的非零像素点个数，当此个数突变一定比例时，结束一次投影面的计算，表示一个识别单元的生成，将此生成单元映射到12*12的网格坐标中，完成形状大小的匹配。

10.根据权利要求1所述的图像字符识别方法，其特征在于，步骤(5)中，完成所有识别单元的外形特征解析后，进行存储，具体指的是