CN109753958A - 图像字符识别方法 - Google Patents
图像字符识别方法 Download PDFInfo
- Publication number
- CN109753958A CN109753958A CN201811556847.2A CN201811556847A CN109753958A CN 109753958 A CN109753958 A CN 109753958A CN 201811556847 A CN201811556847 A CN 201811556847A CN 109753958 A CN109753958 A CN 109753958A
- Authority
- CN
- China
- Prior art keywords
- image
- character recognition
- recognition methods
- methods according
- secondary treatment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种图像字符识别方法,具体包括以下步骤:获取稳定的图片源,将采集到的图像通过网络传输系统载入到内存缓冲区;对采集到的图像进行二次处理,提高图像的对比度;使用灰度定位技术,将二次处理后的图像分割为不同的识别单元,对识别单元进行校正和定位;将识别单元映射到网格坐标系统中,形成网格特征区域,计算每个特征区域中灰白点的占用比例数,形成网格特征区域的外形特征;完成所有识别单元的外形特征解析后,进行存储。本发明避免识别过程中的各种干扰因素,提高识别率和准确率。
Description
技术领域
本发明涉及一种图像字符识别方法。
背景技术
目前,各种视频处理系统在生产生活中得到了广泛应用,如,视频监控系统可对指定区域实施全天候的安全监视;产品流水线视频可对生产过程进行全线的监测和管理。但多数情况下,视频系统仅仅处于监视的功能,本身不具备(或较少具备)视频图像中某些信息的自动识别功能;另一方面,视频系统与识别技术相结合,在数字图形图像中提取某些(或某类)重要标识,如文字、数字、人像、指纹等,在实际环境下有着重要意义。从光线、环境等客观因素上而言,图像反应出的类型可能多种多样,颜色、形状、大小、位置、图像质量、噪点、清晰度等都是较为常见的识别难点。为避免识别过程中的各种干扰因素,提高识别率和准确率是需要解决的问题。
发明内容
本发明提出一种图像字符识别方法,避免识别过程中的各种干扰因素,提高识别率和准确率。
本发明的技术方案是这样实现的:
一种图像字符识别方法,具体包括以下步骤:
(1)获取稳定的图片源,将采集到的图像通过网络传输系统载入到内存缓冲区;
(2)对采集到的图像进行二次处理,提高图像的对比度;
(3)使用灰度定位技术,将二次处理后的图像分割为不同的识别单元,对识别单元进行校正和定位;
(4)将识别单元映射到网格坐标系统中,形成网格特征区域,计算每个特征区域中灰白点的占用比例数,形成网格特征区域的外形特征;
(5)完成所有识别单元的外形特征解析后,进行存储。
优选的,步骤(1)中,获取稳定的图片源,具体由成像设备、成像感应装置、照明系统和辅助装置组合工作获取。
优选的,成像设备包括但不限于相机、摄像头,成像感应装置为红外感应装置,辅助装置包括但不限于防抖动设备、远距离放大设备。
优选的,步骤(2)中,对采集到的图像进行二次处理,二次处理包括但不限于灰化、边缘增强、滤波和去除噪点,二次处理的过程中使用傅里叶、沃尔什二种算法同时处理的策略。
优选的,去除噪点具体包括
从图像的左侧开始,顺序向右,对图像的像素点灰度值进行数值排序,当某个像素点的获取值小于定值时,可判断此像素是噪点,去除。
优选的,边缘增强具体包括
梯度边缘检测:按照垂直方向和对角线方向计算相邻两像素之间的差值梯度,小于计算值的部分忽略,大于计算值的部分保留;或
利用微分运算计算像素的变化率,加强高频分量,从而使轮廓清晰。
优选的,步骤(3)中,使用灰度定位技术,将二次处理后的图像分割为不同的识别单元,具体包括
通过比较图片中的纹理,在横向、纵向二个方向将识别单元边缘化,形成连通的封闭空间,再对此封闭空间中的边缘部分进行特征筛选,形成较为准确的识别单元。
优选的,步骤(4)中将识别单元映射到网格坐标系统中,形成网格特征区域,具体包括
在X*Y的坐标系统中,建立12*12的网格坐标,形成144个网格特征区域。
优选的,若存在异同大小的识别单元,使用垂直投影的方法计算列方向的非零像素点个数,当此个数突变一定比例时,结束一次投影面的计算,表示一个识别单元的生成,将此生成单元映射到12*12的网格坐标中,完成形状大小的匹配。
优选的,步骤(5)中,完成所有识别单元的外形特征解析后,进行存储,具体指的是
将所有识别单元的外形特征解析结果存储至共享内存映射SMEMBuffer服务开辟的存储地址段。
本发明的有益效果在于:
(1)PhotoCharAnalyse组件使用灰度图像识别方式,不受色彩、光线或图像分辨率大小等因素的影响,淡化了视觉意义上的颜色、亮度等级、材质等事项。
(2)将图形图像中的特定区域准确分隔是提高识别率的关键步骤,PhotoCharAnalyse组件通过将灰度图像中的各像素点聚集到特定区域,来提高分隔的准确度。
(3)在完成整个图像解析后一次性地执行存储动作,以提高存储速度和性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种图像字符识别方法一个实施例的流程图;
图2为液晶单元字符识别效果示例;
图3为仪表盘指针、字符、状态量等识别效果示例;
图4为图像灰度定位效果;
图5为网格解析的识别效果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1-图5所示,本发明提出了一种图像字符识别方法,本发明中设置了图像字符识别组件(PhotoCharAnalyse组件),具体包括以下步骤:
(1)获取稳定的图片源,将采集到的图像通过网络传输系统载入到内存缓冲区;
(2)对采集到的图像进行二次处理,提高图像的对比度;
(3)使用灰度定位技术,将二次处理后的图像分割为不同的识别单元,对识别单元进行校正和定位;该步骤中,将识别单元的大小、形状、方向等进行校正和定位。
(4)将识别单元映射到网格坐标系统中,形成网格特征区域,计算每个特征区域中灰白点的占用比例数,形成网格特征区域的外形特征;
(5)完成所有识别单元的外形特征解析后,进行存储。
步骤(1)中,获取稳定的图片源,具体由成像设备、成像感应装置、照明系统和辅助装置组合工作获取。
成像设备包括但不限于相机、摄像头,成像感应装置为红外感应装置,辅助装置包括但不限于防抖动设备、远距离放大设备。
为了灰度定位和校验的高识别性,图像的数据采集步骤至关重要,比如,平视成像、防抖成像等辅助手段不可或缺。
步骤(2)中,对采集到的图像进行二次处理,二次处理包括但不限于灰化、边缘增强、滤波和去除噪点,二次处理的过程中使用傅里叶、沃尔什二种算法同时处理的策略。二次处理的目的是为了提高图像的对比度,增强图像的表现感,增加图像中可识别单元的基本特征可以被更好的识别。原始图像的二次处理过程,PhotoCharAnalyse组件使用了傅里叶、沃尔什二种算法同时处理的策略,处理时间、系统负荷和清晰度较为高效。
在本发明的具体实施例中,去除噪点具体包括
从图像的左侧开始,顺序向右,对图像的像素点灰度值进行数值排序,当某个像素点的获取值小于定值(使用变量ATOMFRAMEPCAVG=30P)时,可判断此像素是噪点,去除。变量ATOMFRAMEPCAVG的取值精度范围对噪点的判断较为敏感,实际环境下,可自定义调节该选项,以实现较为合理的筛选数据。
边缘增强具体包括
梯度边缘检测:按照垂直方向和对角线方向计算相邻两像素之间的差值梯度,小于计算值的部分忽略,大于计算值的部分保留;如此,单元边线可能变窄,但显示单元之间的识别度将大大提高。梯度检测在水平、垂直方向上的作用效果明显。
利用微分运算计算像素的变化率,加强高频分量,从而使轮廓清晰。即:找到亮度的一阶导数比指定的范围值大,或找到亮度的二阶导数有零交叉的范围。
在本发明的优选实施例中,步骤(3)中,使用灰度定位技术,将二次处理后的图像分割为不同的识别单元,具体包括
通过比较图片中的纹理,在横向、纵向二个方向将识别单元边缘化,形成连通的封闭空间,再对此封闭空间中的边缘部分进行特征筛选,形成较为准确的识别单元。
步骤(4)中将识别单元映射到网格坐标系统中,形成网格特征区域,具体包括
在X*Y的坐标系统中,建立12*12的网格坐标,形成144个网格特征区域。
若存在异同大小的识别单元,使用垂直投影的方法计算列方向的非零像素点个数,当此个数突变一定比例时,结束一次投影面的计算,表示一个识别单元的生成,将此生成单元映射到12*12的网格坐标中,完成形状大小的匹配。
步骤(5)中,完成所有识别单元的外形特征解析后,进行存储,具体指的是
将所有识别单元的外形特征解析结果存储至共享内存映射SMEMBuffer服务开辟的存储地址段。
本发明的有益效果在于:
(1)PhotoCharAnalyse组件使用灰度图像识别方式,不受色彩、光线或图像分辨率大小等因素的影响,淡化了视觉意义上的颜色、亮度等级、材质等事项。采用基于灰度的信息抽取方法,即:比较识别单元和底色的不同灰度值来处理像素突变,像素突变可产生边缘过渡特性或较为明显的像素点峰值差异,在识别单元的定位和分隔过程中可获得更好的识别效果。
(2)将图形图像中的特定区域准确分隔是提高识别率的关键步骤,PhotoCharAnalyse组件通过将灰度图像中的各像素点聚集到特定区域,来提高分隔的准确度。梯度检测可以使识别单元和背景区分出明显的对比度,配合使用微分检测方式,在毛刺、空洞、噪点及特定形状方面可以更加细化被处理的识别单元。
(3)在完成整个图像解析后一次性地执行存储动作,以提高存储速度和性能。由PhotoCharAnalyse组件采集、存储的图片图像是支持压缩编码的(在不影响识别率,图像不失真的前提下),如此,可大大减少描述图像的数据量,节约传输的时间,也可提高识别处理的效率,降低系统的整体负荷。
上述技术方案公开了本发明的改进点,未详细公开的技术内容,可由本领域技术人员通过现有技术实现。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种图像字符识别方法,其特征在于,具体包括以下步骤:
(1)获取稳定的图片源,将采集到的图像通过网络传输系统载入到内存缓冲区;
(2)对采集到的图像进行二次处理,提高图像的对比度;
(3)使用灰度定位技术,将二次处理后的图像分割为不同的识别单元,对识别单元进行校正和定位;
(4)将识别单元映射到网格坐标系统中,形成网格特征区域,计算每个特征区域中灰白点的占用比例数,形成网格特征区域的外形特征;
(5)完成所有识别单元的外形特征解析后,进行存储。
2.根据权利要求1所述的图像字符识别方法,其特征在于,步骤(1)中,获取稳定的图片源,具体由成像设备、成像感应装置、照明系统和辅助装置组合工作获取。
3.根据权利要求2所述的图像字符识别方法,其特征在于,成像设备包括但不限于相机、摄像头,成像感应装置为红外感应装置,辅助装置包括但不限于防抖动设备、远距离放大设备。
4.根据权利要求1所述的图像字符识别方法,其特征在于,步骤(2)中,对采集到的图像进行二次处理,二次处理包括但不限于灰化、边缘增强、滤波和去除噪点,二次处理的过程中使用傅里叶、沃尔什二种算法同时处理的策略。
5.根据权利要求4所述的图像字符识别方法,其特征在于,去除噪点具体包括
从图像的左侧开始,顺序向右,对图像的像素点灰度值进行数值排序,当某个像素点的获取值小于定值时,可判断此像素是噪点,去除。
6.根据权利要求4所述的图像字符识别方法,其特征在于,边缘增强具体包括
梯度边缘检测:按照垂直方向和对角线方向计算相邻两像素之间的差值梯度,小于计算值的部分忽略,大于计算值的部分保留;或
利用微分运算计算像素的变化率,加强高频分量,从而使轮廓清晰。
7.根据权利要求1所述的图像字符识别方法,其特征在于,步骤(3)中,使用灰度定位技术,将二次处理后的图像分割为不同的识别单元,具体包括
通过比较图片中的纹理,在横向、纵向二个方向将识别单元边缘化,形成连通的封闭空间,再对此封闭空间中的边缘部分进行特征筛选,形成较为准确的识别单元。
8.根据权利要求7所述的图像字符识别方法,其特征在于,步骤(4)中将识别单元映射到网格坐标系统中,形成网格特征区域,具体包括
在X*Y的坐标系统中,建立12*12的网格坐标,形成144个网格特征区域。
9.根据权利要求8所述的图像字符识别方法,其特征在于,若存在异同大小的识别单元,使用垂直投影的方法计算列方向的非零像素点个数,当此个数突变一定比例时,结束一次投影面的计算,表示一个识别单元的生成,将此生成单元映射到12*12的网格坐标中,完成形状大小的匹配。
10.根据权利要求1所述的图像字符识别方法,其特征在于,步骤(5)中,完成所有识别单元的外形特征解析后,进行存储,具体指的是
将所有识别单元的外形特征解析结果存储至共享内存映射SMEMBuffer服务开辟的存储地址段。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811556847.2A CN109753958A (zh) | 2018-12-19 | 2018-12-19 | 图像字符识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811556847.2A CN109753958A (zh) | 2018-12-19 | 2018-12-19 | 图像字符识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109753958A true CN109753958A (zh) | 2019-05-14 |
Family
ID=66402838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811556847.2A Withdrawn CN109753958A (zh) | 2018-12-19 | 2018-12-19 | 图像字符识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109753958A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111582262A (zh) * | 2020-05-07 | 2020-08-25 | 京源中科科技股份有限公司 | 段式液晶图片内容识别方法、装置、设备和存储介质 |
CN117372950A (zh) * | 2023-10-10 | 2024-01-09 | 安徽典典科技发展有限责任公司 | 一种新能源车位被非能源车占用的检测装置及检测方法 |
-
2018
- 2018-12-19 CN CN201811556847.2A patent/CN109753958A/zh not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111582262A (zh) * | 2020-05-07 | 2020-08-25 | 京源中科科技股份有限公司 | 段式液晶图片内容识别方法、装置、设备和存储介质 |
CN117372950A (zh) * | 2023-10-10 | 2024-01-09 | 安徽典典科技发展有限责任公司 | 一种新能源车位被非能源车占用的检测装置及检测方法 |
CN117372950B (zh) * | 2023-10-10 | 2024-04-30 | 安徽典典科技发展有限责任公司 | 一种新能源车位被非能源车占用的检测装置及检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10198623B2 (en) | Three-dimensional facial recognition method and system | |
CN109583483B (zh) | 一种基于卷积神经网络的目标检测方法和系统 | |
CN107103320B (zh) | 嵌入式医疗数据图像识别及集成方法 | |
CN102704215B (zh) | 基于dst文件解析与机器视觉结合的绣布自动切割方法 | |
CN108846401A (zh) | 商品检测终端、方法、系统以及计算机设备、可读介质 | |
CN106228528B (zh) | 一种基于决策图与稀疏表示的多聚焦图像融合方法 | |
US8743119B2 (en) | Model-based face image super-resolution | |
CN109360235A (zh) | 一种基于光场数据的混合深度估计方法 | |
CN103530599A (zh) | 一种真实人脸和图片人脸的区别方法和系统 | |
CN110363116A (zh) | 基于gld-gan的不规则人脸矫正方法、系统及介质 | |
US20180357819A1 (en) | Method for generating a set of annotated images | |
CN110110646A (zh) | 一种基于深度学习的手势图像关键帧提取方法 | |
CN110827312B (zh) | 一种基于协同视觉注意力神经网络的学习方法 | |
CN108377374A (zh) | 用于产生与图像相关的深度信息的方法和系统 | |
CN106097354B (zh) | 一种结合自适应高斯肤色检测和区域生长的手部图像分割方法 | |
CN111931751A (zh) | 深度学习训练方法、目标物识别方法、系统和存储介质 | |
JP4952267B2 (ja) | 3次元形状処理装置、3次元形状処理装置の制御方法、および3次元形状処理装置の制御プログラム | |
CN109753958A (zh) | 图像字符识别方法 | |
CN111814564A (zh) | 基于多光谱图像的活体检测方法、装置、设备和存储介质 | |
CN111641822A (zh) | 一种重定位立体图像质量评价方法 | |
CN106778777A (zh) | 一种车辆匹配方法及系统 | |
CN108924434A (zh) | 一种基于曝光变换的立体高动态范围图像合成方法 | |
CN109146834A (zh) | 车辆定损方法及装置、计算机可读存储介质、终端 | |
CN113468954B (zh) | 基于多通道下局部区域特征的人脸伪造检测方法 | |
CN110674817B (zh) | 一种基于双目摄像头的车牌防伪的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190514 |