CN110826360A - Ocr图像预处理与文字识别 - Google Patents
Ocr图像预处理与文字识别 Download PDFInfo
- Publication number
- CN110826360A CN110826360A CN201810901494.9A CN201810901494A CN110826360A CN 110826360 A CN110826360 A CN 110826360A CN 201810901494 A CN201810901494 A CN 201810901494A CN 110826360 A CN110826360 A CN 110826360A
- Authority
- CN
- China
- Prior art keywords
- image
- picture
- ocr
- character recognition
- laplacian
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种计算机技术,主要利用图像处理的方法来解决OCR文字识别率低下问题,属于计算机技术、图像处理技术应用领域。在扫描图片后,当需要提取图像中的文字时候,我们就需要用到文字识别。而当文字识别的时候,图片没有处理时候他的效率是底下的。这里使用图像预处理然后识别的方法。首先对图像进行的灰度化二值化,拉普拉斯锐化,对称均值滤波,图片水平拉伸,图片细化,设置抗锯齿的属性,最后对图像进行OCR文字识别。
Description
技术领域
本发明涉及一种计算机技术,主要利用图像处理的方法来解决OCR文字识别率低下问题,属于计算机技术、图像处理技术应用领域。
背景技术
伴随在扫描图片后,当需要提取图像中的文字时候,我们就需要用到文字识别,而当文字识别的时候,图片没有处理时候他的效率是底下的,这里使用图像预处理然后识别的方法,首先对图像进行的灰度化二值化,拉普拉斯锐化,对称均值滤波,图片水平拉伸,图片细化,设置抗锯齿的属性,最后对图像进行OCR文字识别;
但是使用该方法进行文字识别时仍然存在一定的偏差,较图片未处理之前提升识别率接近一倍。
发明内容
本发明的目的是克服了现有OCR技术的不足而提供了一种图片先行预处理再识别的提取图像文字方法;
为了解决上述存在的技术问题,本发明采用下列技术方案:
图片没有处理时候他的效率是底下的,这里使用图像预处理然后识别的方法,首先对图像进行的灰度化二值化,拉普拉斯锐化,对称均值滤波,图片水平拉伸,图片细化,设置抗锯齿的属性,最后对图像进行OCR文字识别;
其中具体步骤为:
图像二值化:将图像上的像素点的灰度值设置为0或255,图像的二值化使图像中数据量大为减少,从而能凸显出目标的轮廓;
图像拉普拉斯锐化:图像增强中,平滑是为了消除图像中噪声的干扰,或者降低对比度,与之相反,有时为了强调图像的边缘和细节,需要对图像进行锐化,提高对比度,拉普拉斯锐化图像是根据图像某个像素的周围像素到此像素的突变程度有关,也就是说它的依据是图像像素的变化程度,运用拉普拉斯锐化可以增强图像的细节,找到图像的边缘;
图像对称均值滤波:对称均值滤波的核心思想是,在一个局部范围内,通过几对对称点像素的比较,获得相对区域及不同区域的差别,然后将均值计算在所判定的同一个区域内进行,这样可以使边界的保持更加灵活的同时又降低计算,设一个(2N+1)*(2N+1)的模板,则有2N*(2N+1)个对称点,2N*(2N+1)个选择点的像素均值代替原像素值;
图片水平拉伸:对图片进行水平方向的拉伸,防止汉字压缩模糊,使OCR识别效率提高;
图片文字细化:汉字笔画繁多,各个笔画之间容易重叠,使用细化算法提取汉子骨架,细化是从原来的图中去掉一些点,但仍要保持原来的形状,实际上是保持原图的骨架,判断一个点是否能去掉是以8个相邻点(八连通)的情况来作为判据的,具体判据为:内部点不能删除,鼓励点不能删除,直线端点不能删除,如果P是边界点,去掉P后,如果连通分量不增加,则P可删除;
如图11的那些点,第一个点不能去除,因为它是内部点,第二个点不能去除,它也是内部点,第三个点不能去除,删除后会使原来相连的部分断开,第四个点可以去除,这个点不是骨架,第五个点不可以去除,它是直线的端点,第六个点不可以去除,它是直线的端点,对于所有的这样的点,我们可以做出一张表,来判断这样的点能不能删除;
如图12我们对于黑色的像素点,对于它周围的8个点,我们赋予不同的价值,若周围某黑色,我们认为其价值为0,为白色则取九宫格中对应的价值,对于前面那幅图中第一个点,也就是内部点,它周围的点都是黑色,所以他的总价值是0,对应于索引表的第一项,前面那幅图中第二点,它周围有三个白色点,它的总价值为1+4+32=37,对应于索引表中第三十八项,我们用这种方法,把所有点的情况映射到0~255的索引表中,我们扫描原图,对于黑色的像素点,根据周围八点的情况计算它的价值,然后查看索引表中对应项来决定是否要保留这一点;
对字体进行抗锯齿渲染:可以使字体看起来会更清晰舒服,同样OCR识别的效率也会提高,在图标字体成为一种趋势的今天,抗锯齿渲染使用也越来越多。
附图说明
图1是计算流程图;
图2是二值化算法Java示例;
图3是图像灰度化算法Java示例;
图4是对称均值滤波算法Java示例;
图5是对称均值滤波子函数Java示例;
图6是图像锐化处理算法Java示例1;
图7是图像锐化处理算法Java示例2;
图8是拉普拉斯锐化算法Java示例;
图9是设置“抗锯齿”的属性 Java示例;
图10是图片水平拉伸Java示例;
图11是图片文字细化附图;
图12是图片文字细化附图2;
图13实例图片原图片附图;
图14是二值化后图片附图;
图15是拉普拉斯锐化后图片附图;
图16是图像对称均值滤波后图片附图;
图17是图像水平拉伸后图片附图;
图18是图像细化后图片附图;
图19是图像设置抗锯齿属性后图片附图。
具体实施方式
为了加深对本发明的理解,下面结合附图和实施例对本发明进一步说明,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定;
图像二值化
图片首先进行二值化,这一波有利于图像的进一步处理,使图像变得简单,而且数据量减小,能凸显出感兴趣的目标的轮廓。其次,要进行二值图像的处理与分析,首先要把灰度图像二值化,然后得到二值化图像。原图片与二值化后图片如图13,图14。
图像拉普拉斯锐化
运用拉普拉斯锐化可以增强图像的细节,找到图像的边缘,拉普拉斯锐化后图像如图15。
图像对称均值滤波
对待处理的当前像素,选择一个模板,该模板为其邻近的若干个像素组成,用模板的均值来替代原像素的值的方法。可以去除图片的噪声,图像对称均值滤波后如图16。
图像水平拉伸
将图片水平方向拉伸,使图片的文字特征更加明显。图片水平拉伸后如图17。
图像文字细化
提取图片中文字的骨架,对于文字的特征提取,使得进行文字识别时候,可以快速和正确的匹配字库中的对应文字。图像文字细化后如图18。
设置抗锯齿属性
物体边缘总会或多或少的呈现三角形的锯齿,而抗锯齿就是指对图像边缘进行柔化处理,使图像边缘看起来更平滑,更接近实物的物体。使得匹配字库文字更加正确。设置抗锯齿属性后的图片如图19。
本发明的实施例公布的是较佳的实施例,但并不局限于此,本领域的普通技术人员,极易根据上述实施例,领会本发明的精神,并做出不同的引申和变化,但只要不脱离本发明的精神,都在本发明的保护范围内。
Claims (6)
1.OCR 图像预处理与文字识别方法,首先对图像进行的灰度化二值化,拉普拉斯锐化,对称均值滤波,图片水平拉伸,图片细化,设置抗锯齿的属性,最后对图像进行OCR文字识别的步骤;其中:
图像二值化:将图像上的像素点的灰度值设置为0或255,图像的二值化使图像中数据量大为减少,从而能凸显出目标的轮廓;
图像拉普拉斯锐化:图像增强中,平滑是为了消除图像中噪声的干扰,或者降低对比度,与之相反,有时为了强调图像的边缘和细节,需要对图像进行锐化,提高对比度,拉普拉斯锐化图像是根据图像某个像素的周围像素到此像素的突变程度有关,也就是说它的依据是图像像素的变化程度,运用拉普拉斯锐化可以增强图像的细节,找到图像的边缘;
图像对称均值滤波:对称均值滤波的核心思想是,在一个局部范围内,通过几对对称点像素的比较,获得相对区域及不同区域的差别,然后将均值计算在所判定的同一个区域内进行,这样可以使边界的保持更加灵活的同时又降低计算;
图片水平拉伸:对图片进行水平方向的拉伸,防止汉字压缩模糊,使OCR识别效率提高;
图片文字细化:对图片中的文字进行骨架的提取,把识别率提高。
2.根据权利要求1所述的OCR 图像预处理与文字识别方法,其特征在于:图像二值化中首先要把灰度图像二值化,得到二值化图像。
3.根据权利要求2所述的OCR 图像预处理与文字识别方法,其特征在于:在图像二值化后进行图像拉普拉斯锐化,运用拉普拉斯可以增强图像的细节,找到图像的边缘;但是有时候会把噪音也给增强了,那么可以在锐化前对图像进行平滑处理;先看一阶偏微分和推出的二元函数微分:
af/ay = f(x,y)-f(x, y-1)
一阶微分法能够用来检测边缘是否存在;
那么二阶微分法,也就是拉普拉斯算子就可以确定边缘的位置;
这样可以找到一个模板矩阵:
从上面的两种模板中就可以看出,如果一个黑色平面中有一个白点,那么模板矩阵可以使这个白点更亮;由于图像边缘就是灰度发生跳变的区域,所以拉普拉斯模板对边缘检测很有用,八邻域的表示法为:
将算得的值替换原(x,y)处的像素值,可以得到类似边界的地方,然后根据下式得到锐化图像:
根据权利要求3所述的OCR 图像预处理与文字识别方法,其特征在于:图片拉普拉斯锐化后进行图像对称均值滤波,对称均值滤波的核心思想是,在一个局部范围内,通过几对对称点像素的比较,获得相对区域及不同区域的差别,然后将均值计算在所判定的同一个区域内进行,这样可以使边界的保持更加灵活的同时又降低计算;
设一个(2N+1)*(2N+1)的模板,则有2N*(2N+1)个对称点,2N*(2N+1)个选择点的像素均值代替原像素值。
4.根据权利要求3所述的OCR 图像预处理与文字识别方法,其特征在于:图像对称均值滤波后进行图片水平拉伸,对图片进行水平方向的拉伸,防止汉字压缩模糊,使OCR识别效率提高。
5.根据权利要求4所述的OCR 图像预处理与文字识别方法,其特征在于:图片水平拉伸后进行图片文字细化,汉字笔画繁多,各个笔画之间容易重叠,使用细化算法提取汉子骨架;细化是从原来的图中去掉一些点,但仍要保持原来的形状;实际上是保持原图的骨架;判断一个点是否能去掉是以8个相邻点(八连通)的情况来作为判据的,具体判据为:内部点不能删除,鼓励点不能删除,直线端点不能删除,如果P是边界点,去掉P后,如果连通分量不增加,则P可删除。
6.根据权利要求5所述的OCR 图像预处理与文字识别方法,其特征在于:图片细化后对字体进行抗锯齿渲染 ,可以使字体看起来会更清晰舒服,同样OCR识别的效率也会提高,在图标字体成为一种趋势的今天,抗锯齿渲染使用也越来越多。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810901494.9A CN110826360A (zh) | 2018-08-10 | 2018-08-10 | Ocr图像预处理与文字识别 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810901494.9A CN110826360A (zh) | 2018-08-10 | 2018-08-10 | Ocr图像预处理与文字识别 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110826360A true CN110826360A (zh) | 2020-02-21 |
Family
ID=69541505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810901494.9A Withdrawn CN110826360A (zh) | 2018-08-10 | 2018-08-10 | Ocr图像预处理与文字识别 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110826360A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112102219A (zh) * | 2020-11-10 | 2020-12-18 | 卡莱特(深圳)云科技有限公司 | 一种图像中图文抠取方法及装置 |
CN112949514A (zh) * | 2021-03-09 | 2021-06-11 | 广州文石信息科技有限公司 | 一种扫描文档信息处理方法、装置、电子设备及存储介质 |
CN115331232A (zh) * | 2022-07-08 | 2022-11-11 | 黑龙江省科学院智能制造研究所 | 一种满文历史文档图像列分割方法 |
-
2018
- 2018-08-10 CN CN201810901494.9A patent/CN110826360A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112102219A (zh) * | 2020-11-10 | 2020-12-18 | 卡莱特(深圳)云科技有限公司 | 一种图像中图文抠取方法及装置 |
CN112949514A (zh) * | 2021-03-09 | 2021-06-11 | 广州文石信息科技有限公司 | 一种扫描文档信息处理方法、装置、电子设备及存储介质 |
CN115331232A (zh) * | 2022-07-08 | 2022-11-11 | 黑龙江省科学院智能制造研究所 | 一种满文历史文档图像列分割方法 |
CN115331232B (zh) * | 2022-07-08 | 2023-08-18 | 黑龙江省科学院智能制造研究所 | 一种满文历史文档图像列分割方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
Gatos et al. | Automatic table detection in document images | |
US8009928B1 (en) | Method and system for detecting and recognizing text in images | |
US9495343B2 (en) | Horizontal and vertical line detection and removal for document images | |
US9235755B2 (en) | Removal of underlines and table lines in document images while preserving intersecting character strokes | |
US9275030B1 (en) | Horizontal and vertical line detection and removal for document images | |
CN107633253B (zh) | 基于含噪图像中矩形包围框的精确提取和定位方法 | |
CN112183038A (zh) | 一种表格识别套打方法、计算机设备及计算机可读存储介质 | |
CN104361336A (zh) | 一种水下视频图像的文字识别方法 | |
CN105374015A (zh) | 基于局部对比度和笔画宽度估计的低质量文档图像二值化方法 | |
JP2004280832A (ja) | イメージ文字を認識するための前処理装置及び方法 | |
Brisinello et al. | Improving optical character recognition performance for low quality images | |
CN109993161B (zh) | 一种文本图像旋转矫正方法及系统 | |
CN110826360A (zh) | Ocr图像预处理与文字识别 | |
CN113688838B (zh) | 红色笔迹提取方法、系统、可读存储介质及计算机设备 | |
CN111899292A (zh) | 文字识别方法、装置、电子设备及存储介质 | |
Saddami et al. | Improved thresholding method for enhancing Jawi binarization performance | |
CN110060260B (zh) | 一种图像处理方法及系统 | |
CN110717497A (zh) | 图像相似度匹配方法、装置及计算机可读存储介质 | |
Shirai et al. | Removal of background patterns and signatures for magnetic ink character recognition of checks | |
CN108256518B (zh) | 文字区域检测方法及装置 | |
CN103455816B (zh) | 一种笔画宽度提取方法、装置及一种文字识别方法、系统 | |
Saini | Document image binarization techniques, developments and related issues: a review | |
CN113139535A (zh) | 一种ocr文档识别方法 | |
KR20150099116A (ko) | Ocr를 이용한 컬러 문자 인식 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200221 |