CN109344826A - 一种字符识别方法及系统 - Google Patents
一种字符识别方法及系统 Download PDFInfo
- Publication number
- CN109344826A CN109344826A CN201811136500.2A CN201811136500A CN109344826A CN 109344826 A CN109344826 A CN 109344826A CN 201811136500 A CN201811136500 A CN 201811136500A CN 109344826 A CN109344826 A CN 109344826A
- Authority
- CN
- China
- Prior art keywords
- character
- image
- identifying method
- picture
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
公开了一种字符识别方法及系统。所述方法及系统包括:1)输入字符图像;2)对所述图像进行预处理;3)利用OCR框架进行字符处理;4)识别字符;5)输出字符识别结果。本发明通过对图像进行预处理,获得降噪后的图像,利用模板匹配算法进行字符识别,实现了识别率的大幅提升。
Description
技术领域
本发明涉及字符识别领域,更具体地,涉及一种字符识别方法及系统。
背景技术
字符是人类文明发展历史的产物,是人类沟通的工具。字符识别是一个模板识别领域的大多数主题都可以满足最基本的问题。字符识别是一个利用计算机和图像处理技术在各个领域起着重要的作用。工业使用字符识别是非常重要的,它的发展水平已经吸引到了图像界的关注,原因在于:一方面,字符识别技术的发展是非常困难的,难度不仅在于字符图像识别系统,在于实际应用的复杂性和应用部门成本承受能力;另一方面,图像识别发展的效益非常显著,其实际应用系统将产生巨大的经济效益和社会效益。例如,车牌号码识别、手写字符识别,字符识别技术已广泛应用于电脑、手机。在国外,车牌识别作为字符识别的应用领域,技术成熟,但在我国,车牌识别技术的研究主要集中在各种各样的车牌定位、字符分割和识别算法进行了研究。为促进图片的识别率的提升,在框架中已经提供好了相应的字符识别算法,但是识别率比较低,因为框架只是提供的基础服务,它需要面对不同的大众,所以不能进行很完美很精确的识别,需要针对不同的应用场景进行不同的图像处理,然后再调用基础框架来进行字符识别。因此,有必要开发一种字符识别方法及系统。
公开于本发明背景技术部分的信息仅仅旨在加深对本发明的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
本发明提出了一种字符识别方法及系统,其能够通过对图像进行预处理,获得降噪后的图像,利用模板匹配算法进行字符识别,实现了识别率的大幅提升。
根据本发明的一方面,提出了一种字符识别方法。所述方法可以包括:
1)输入字符图像;
2)对所述图像进行预处理;
3)利用OCR框架进行字符处理;
4)识别字符;
5)输出字符识别结果。
优选地,所述预处理包括图像二值化处理。
优选地,所述预处理包括图像锐化处理。
优选地,所述预处理包括图像中值滤波处理。
优选地,所述预处理包括线性灰度变换。
优选地,所述预处理还包括黑白图转换。
优选地,所述OCR框架处理包括:
3-1)输入待处理的字符图像;
3-2)提取字符图像特征;
3-3)将所述字符图像特征与样本库特征进行匹配;
3-4)基于特征匹配识别字符。
优选地,通过以下方式进行特征提取:
3-2-1)搜索字符区域,找出字符区域的上、下、左、右边界;
3-2-2)将字符区域平均分成n*n的小区域;
3-2-3)计算每个区域中像素的所占比例,获得特征结果。
根据本发明的另一方面,提出了一种字符识别系统,其上存储有计算机程序,其中,所述程序被处理器执行时实现以下步骤:
步骤1:输入字符图像;
步骤2:对所述图像进行预处理;
步骤3:利用OCR框架进行字符处理;
步骤4:识别字符;
步骤5:输出字符识别结果。
优选地,所述OCR框架处理包括:
步骤3-1:输入待处理的字符图像;
步骤3-2:提取字符图像特征;
步骤3-3:将所述字符图像特征与样本库特征进行匹配;
步骤3-4:基于特征匹配识别字符。
本发明的有益效果在于,通过对图像的预处理,获得噪声极低的识别图像,利用模板匹配识别字符,大幅度提升了字符识别的速度。
本发明具有其它的特性和优点,这些特性和优点从并入本文中的附图和随后的具体实施方式中将是显而易见的,或者将在并入本文中的附图和随后的具体实施方式中进行详细陈述,这些附图和具体实施方式共同用于解释本发明的特定原理。
附图说明
通过结合附图对本发明示例性实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施例中,相同的参考标号通常代表相同部件。
图1示出了根据本发明的字符识别方法的步骤的流程图;
图2示出了中值滤波算法原理示意图;
图3示出了特征提取的实验图;
图4示出了根据本发明的字符识别系统的应用界面示意图。
具体实施方式
下面将参照附图更详细地描述本发明。虽然附图中显示了本发明的优选实施例,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
图1示出了根据本发明的字符识别方法的步骤的流程图。
在该实施例中,根据本发明的字符识别方法可以包括:
S1,字符图像输入;
S2,图像预处理;
在一个示例中,所述图像预处理包括图像二值化处理。
具体地,图像二值化处理的图像灰度设置为0或255,或整个图像黑白效果明显。大约256个亮度等级的灰度图像通过适当的阈值选择和可以反映整体形象和地方特色的二进制图像。为了得到理想的二进制图像,一般不使用封闭的边界和连接定义重叠区域。所有灰度等于或大于阈值的像素被归类为属于一个特定的对象,灰度值是255,否则,说这些像素被排除在区域灰度值是0,表示背景或异常对象区域。
在一个示例中,所述图像预处理包括图像锐化处理。
具体地,图像的平滑往往是在图像的模糊边界,为了减少这种负面影响的影响,这需要使用图像锐化技术,使图像的边缘是明确的。图像锐化处理,使图像的边缘、轮廓和细节的目的是图像的清晰,平滑的图像模糊的根本原因是图像收到平均或积分操作,因此在逆操作(如微分操作)可以使图像清晰。图像频域考虑,因为高频分量的衰减的本质是模糊,因此高通滤波器可以使图像清晰。
在一个示例中,所述图像预处理还包括图像中值滤波处理。
具体地,值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术,中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近的真实值,从而消除孤立的噪声点。方法是用某种结构的二维滑动模板,将板内像素按照像素值的大小进行排序,生成单调上升(或下降)的为二维数据序列。二维中值滤波输出为g(x,y)=med{f(x-k,y-l),(k,l∈W)},其中,f(x,y),g(x,y)分别为原始图像和处理后图像。W为二维模板,通常为3*3,5*5区域,也可以是不同的的形状,如线状,圆形,十字形,圆环形等。
本发明采用的中值滤波算法原理如图2所示,通过从图像中的某个采样窗口取出奇数个数据进行排序,用排序后的中值取代所有要进行处理的数据。
在一个示例中,所述图像预处理包括线性灰度变换处理。
具体地,灰度的线性变换就是将图像中所有的点按照线性灰度变换函数进行变换。该线性灰度变换函数f(x)是一个一维线性函数:
f(x)=fA*x+fB
灰度变换方程为:
D2=f(D1)=fA*D+fB
式中参数fA为线性函数的斜率,fB为线性函数的在y轴上的截距,D1为输入图像的灰度,D2为输出的图像灰度。当fA>1时,输出的图像的对比度增大;当fA<1时,输出图像的对比度将减小;当fA=1且fB!=0时,操作仅仅使所有像素的灰度值上移或下移,其效果是使整个图像更亮或更暗;特殊情况下,如果fA=1,fB=0时,输出图像和输入图像相同;当fA=-1,fB=255时,输出图像的灰度正好反转。
在一个示例中,所述图像预处理还包括黑白图转换。
具体地,所述黑白图转换采用java已经封装好的算法进行转换,所述算法函数为grayFilter()。
S3,OCR框架处理;
在一个示例中,所述OCR框架处理包括:
3-1)输入待处理的字符图像;
3-2)提取字符图像特征;
3-3)将所述字符图像特征与样本库特征进行匹配;
3-4)基于特征匹配识别字符。
具体地,通过以下方式进行特征提取:
3-2-1)搜索字符区域,找出字符区域的上、下、左、右边界;
3-2-2)将字符区域平均分成n*n的小区域;
3-2-3)计算每个区域中像素的所占比例,获得特征结果。
具体地,通过以下公式计算每个区域中像素所占比例:
其中,图片的行为x,列为y,hi为第i个区域像素为0的参数。
如图3所示,为选取的一个文本字符图像,对其进行特征提取,获得的特征函数提取结果为:
S4,判别字符;
S5,输出识别结果。
本发明通过对图像进行预处理,获得降噪后的图像,利用模板匹配算法进行字符识别,实现了识别率的大幅提升。
应用示例
为便于理解本发明实施例的方案及其效果,以下给出一个具体应用示例。本领域技术人员应理解,该示例仅为了便于理解本发明,其任何具体细节并非意在以任何方式限制本发明。
如图4所示,为根据本发明的一种字符识别系统的应用界面示意图,其能够通过打开按钮进行字符图像的输入,通过勾选进行图像的各种预处理操作,包括图像二值化,图像锐化,图像中值滤波,图像线性灰度变换,黑白图转换。其能够通过其中一种或多种图像预处理方式进行图像的预处理,可以达到不同的图像预处理程度。最终在界面右上方白条中显示出识别结果。
综上所述,本发明通过对图像进行预处理,获得降噪后的图像,利用模板匹配算法进行字符识别,实现了识别率的大幅提升。
本领域技术人员应理解,上面对本发明的实施例的描述的目的仅为了示例性地说明本发明的实施例的有益效果,并不意在将本发明的实施例限制于所给出的任何示例。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。
Claims (10)
1.一种字符识别方法,其特征在于,包括:
1)输入字符图像;
2)对所述图像进行预处理;
3)利用OCR框架进行字符处理;
4)识别字符;
5)输出字符识别结果。
2.根据权利要求1所述的字符识别方法,其特征在于,在步骤2)中,所述预处理包括图像二值化处理。
3.根据权利要求1所述的所述的字符识别方法,其特征在于,在步骤2)中,所述预处理包括图像锐化处理。
4.根据权利要求1所述的所述的字符识别方法,其特征在于,在步骤2)中,所述预处理包括图像中值滤波处理。
5.根据权利要求1所述的所述的字符识别方法,其特征在于,在步骤2)中,所述预处理包括线性灰度变换。
6.根据权利要求1所述的所述的字符识别方法,其特征在于,在步骤2)中,所述预处理还包括黑白图转换。
7.根据权利要求1所述的所述的字符识别方法,其特征在于,在步骤3)中,所述OCR框架处理包括:
3-1)输入待处理的字符图像;
3-2)提取字符图像特征;
3-3)将所述字符图像特征与样本库特征进行匹配;
3-4)基于特征匹配识别字符。
8.根据权利要求7所述的所述的字符识别方法,其特征在于,在步骤3-2)中,通过以下方式进行特征提取:
3-2-1)搜索字符区域,找出字符区域的上、下、左、右边界;
3-2-2)将字符区域平均分成n*n的小区域;
3-2-3)计算每个区域中像素的所占比例,获得特征结果。
9.一种字符识别系统,其上存储有计算机程序,其中,所述程序被处理器执行时实现以下步骤:
步骤1:输入字符图像;
步骤2:对所述图像进行预处理;
步骤3:利用OCR框架进行字符处理;
步骤4:识别字符;
步骤5:输出字符识别结果。
10.根据权利要求9所述的所述的字符识别系统,其特征在于,在步骤3中所述OCR框架处理包括:
步骤3-1:输入待处理的字符图像;
步骤3-2:提取字符图像特征;
步骤3-3:将所述字符图像特征与样本库特征进行匹配;
步骤3-4:基于特征匹配识别字符。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811136500.2A CN109344826A (zh) | 2018-09-28 | 2018-09-28 | 一种字符识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811136500.2A CN109344826A (zh) | 2018-09-28 | 2018-09-28 | 一种字符识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109344826A true CN109344826A (zh) | 2019-02-15 |
Family
ID=65307034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811136500.2A Withdrawn CN109344826A (zh) | 2018-09-28 | 2018-09-28 | 一种字符识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109344826A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144336A (zh) * | 2019-12-30 | 2020-05-12 | 贵州近邻宝科技有限公司 | 面向快递面单的收件人手机号码、运单号的自动识别方法 |
-
2018
- 2018-09-28 CN CN201811136500.2A patent/CN109344826A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144336A (zh) * | 2019-12-30 | 2020-05-12 | 贵州近邻宝科技有限公司 | 面向快递面单的收件人手机号码、运单号的自动识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111401372B (zh) | 一种扫描文档图文信息提取与鉴别的方法 | |
CN105426829B (zh) | 基于人脸图像的视频分类方法和装置 | |
CN110309806B (zh) | 一种基于视频图像处理的手势识别系统及其方法 | |
CN104573674A (zh) | 面向实时嵌入式系统的一维条码识别方法 | |
CN107871137B (zh) | 一种基于图像识别的物料匹配方法 | |
CN111652233A (zh) | 一种针对复杂背景的文本验证码自动识别方法 | |
CN109166092A (zh) | 一种图像缺陷检测方法及系统 | |
Revathi et al. | Comparative analysis of text extraction from color images using tesseract and opencv | |
CN101315664A (zh) | 用于文字识别的文本图像预处理方法 | |
CN114612489A (zh) | 一种基于自编码神经网络的图像边缘提取方法及系统 | |
Durga Devi et al. | Digital acquisition and character extraction from stone inscription images using modified fuzzy entropy-based adaptive thresholding | |
CN109344826A (zh) | 一种字符识别方法及系统 | |
Amin et al. | A binarization algorithm for historical arabic manuscript images using a neutrosophic approach | |
CN111445402B (zh) | 一种图像去噪方法及装置 | |
CN110930358B (zh) | 一种基于自适应算法的太阳能面板图像处理方法 | |
CN109271993A (zh) | 一种文件扫描系统、计算机设备及可读存储介质 | |
Wei et al. | An efficient binarization method for ancient Mongolian document images | |
CN115063679B (zh) | 一种基于深度学习的路面质量评估方法 | |
Liang et al. | Robust table recognition for printed document images | |
CN112767321B (zh) | 一种基于随机森林的荧光结核杆菌检测方法 | |
Dixit et al. | Preprocessing framework for document image analysis | |
Yang | OCR oriented binarization method of document image | |
CN111797838A (zh) | 一种图片类文档盲去噪系统、方法及装置 | |
Chi et al. | Reduction of bleed-through effect in images of Chinese bank items | |
Anilkumar et al. | Framework for statistical machine recognition and translation of ancient tamil script |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190215 |