CN106778752A - 一种文字识别方法 - Google Patents
一种文字识别方法 Download PDFInfo
- Publication number
- CN106778752A CN106778752A CN201611007793.5A CN201611007793A CN106778752A CN 106778752 A CN106778752 A CN 106778752A CN 201611007793 A CN201611007793 A CN 201611007793A CN 106778752 A CN106778752 A CN 106778752A
- Authority
- CN
- China
- Prior art keywords
- image
- word
- character recognition
- recognition method
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/247—Aligning, centring, orientation detection or correction of the image by affine transforms, e.g. correction due to perspective effects; Quadrilaterals, e.g. trapezoids
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Input (AREA)
Abstract
本发明涉及图像识别技术领域,尤其是涉及一种文字识别方法,包括:获取待识别图像;对已获取图像预处理:图像倾斜校正以校正图像和阈值化处理获得前景信息及背景信息单一的图像;分析处理图像:分析图像的行间纹理特征,获取图像的文字矩阵参数;分割图像:基于所述文字矩阵参数对图像进行切割,形成若干个子图像,获取图像的文字字块;识别:对文字字块进行单独处理,获取文字字块的图像特征,并对所述图像特征进行识别;所述图像校正包括:先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度、得到直线角度并旋转图像角度。该方法文字简单易行,识别率高。
Description
【技术领域】
本发明涉及图像识别技术领域,尤其是涉及一种计算机故障检测系统及方法一种文字识别方法。
【背景技术】
随着数码相机、摄像头、超高速扫描仪等图像获取设备的广泛应用,图像中信息越来越引起人们的关注。其中嵌入在图像中的文字是图像语义内容的一种重要表达方式,能够提供一些人们所需要的重要信息。例如图像中的文字可以是该图像的内容概述,如果能够自动提取和识别图像中的文字,就可以让计算机自动理解图像内容。让计算机像人类一样识别图像中的文字,对于图像和视频的存储、分类、理解及检索等来说具有极其重要的意义,它主要应用在中文信息处理、办公室自动化、及其翻译、人工智能等高技术领域,有着广泛的应用前景和商业价值。目前对图像中的文字一般只是通过简单的图像分割处理来进行识别,无法根据图像中的文字特征来进行自适应调节,导致现有的图像文字识别方法精度较低,无法满足实际应用的需求。
【发明内容】
鉴于以上内容,有必要提供一种计算机故障检测系统及方法一种文字识别方法,目的在于解决现有的图像文字识别方法对文字的识别精度较低的技术问题。
本发明的目的通过以下技术方案实现:
一种文字识别方法,包括以下步骤:
获取待识别图像;
对已获取图像预处理:图像倾斜校正以校正图像和阈值化处理获得前景信息及背景信息单一的图像;
分析处理图像:分析图像的行间纹理特征,获取图像的文字矩阵参数;
分割图像:基于所述文字矩阵参数对图像进行切割,形成若干个子图像,获取图像的文字字块;
识别:对文字字块进行单独处理,获取文字字块的图像特征,并对所述图像特征进行识别;
所述图像校正包括:先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度、得到直线角度并旋转图像角度。
进一步的,所述对已获取图像预处理还包括对已识别图像进行图像降噪以提升识别处理的精确度。
进一步的,所述图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法等方法。
进一步的,所述阈值化处理包括固定阈值化方法、自适应阈值化方法、大津法或迭代法。
进一步的,将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示,背景用第二像素值表示,统计图像的矩阵坐标中每行第二像素值的个数,获取一数组;统计对若干行高参数,参数取平均值统计,获取字体大小参数。
进一步的,所述识别基于预设的聚类算法对切分后的文字子块进行图像分割处理,获取文字字块中的文字信息,并根据所述文字信息在预置的系统文字库中进行比对,根据比对结构确定图像中的文字。
进一步的,所述分析处理图像还包括对文字字块进行膨胀处理。
进一步的,所述识别步骤包括所提取文字字块进行归一化处理后再进行识别。
本发明有益效果:本发明通过识别图像的矩阵行高纹理特征进行分析,计算出图像文字的矩阵参数,再基于文字相关的矩阵参数估算出文字字体大小参数,然后在对每一个文字快进行分割,并对文字子块进行识别,提高了切分文字子块的准确性,从而提高文字识别的精度。
【具体实施方式】
一种文字识别方法,其特征在于,包括以下步骤:
获取待识别图像;待识别图像可以是任何需要进行文字识别的图像,待识别图像可以来自外部设备。待识别图像可以是原始图像,也可以是对原始图像进行预处理后得到的图像,待识别的图像可以是jpg、bmp、png等图像格式。
对已获取图像预处理,包括阈值化处理、阈值化处理和倾斜校正。阈值化处理:所述阈值化处理包括固定阈值化方法、自适应阈值化方法、大津法或迭代法。图像的阈值化有利于图像的进一步处理,获得前景信息及背景信息单一的图像,使图像变得简单,而且数据量减小,能凸显出感兴趣的目标的轮廓。阈值化处理:由于待识别图像的品质受限于输入设备、环境、以及文档的印刷质量,在对图像中印刷体字符进行识别处理前,需要根据噪声的特征对待识别图像进行去噪处理,提升识别处理的精确度,图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法等方法。倾斜校正:由于扫描和拍摄过程涉及人工操作,输入计算机的待识别图像或多或少都会存在一些倾斜,在对图像中印刷体字符进行识别处理前,就需要进行图像方向检测,并校正图像方向。本实施例中倾斜校正具体可为包括以下步骤:先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度、得到直线角度并旋转图像角度。
分析处理图像,分析图像的行间纹理特征,获取图像的文字矩阵参数;将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示,背景用第二像素值表示,统计图像的矩阵坐标中每行第二像素值的个数,获取一数组;统计对若干行高参数,参数取平均值统计,获取字体大小参数。
分割图像:基于所述文字矩阵参数对图像进行切割,形成若干个子图像,获取图像的文字字块;在进行图像切割前还包括对图像中文字区域中的文字进行判断排列方向,可以对文字字块逐行逐列扫描像素,得到文字字块中文字的行间距和列间距,并计算文字行的高度方差及文字列的宽度方差。该文字行的高度方差用于反映文字行高度的一致性,而该文字列的宽度方差用于反映文字列宽度的一致性。然后综合该文字间距和文字行的高度或文字列的宽度的一致性等因素来判断该文字是横向排列还是纵向排列。例如,若行间距大于列间距,并且文字行高度一致,则判定文字区域中文字是横向排列。若列间距大于行间距,并且文字列宽度一致,则判定文字区域中文字是纵向排列。对文字字块的切分结果进行修正,例如包括将错误切分后的文字行或列合并,或对英文首字母与第二字母的错误切分进行修正
识别:对文字字块进行单独处理,获取文字字块的图像特征,并对所述图像特征进行识别;使用经过版面分析及单字切分操作后的该文字字块从文字区域中提取文字之前,还可以对该文字字块进行膨胀处理,然后使用该文字字块保留文字边缘梯度,去除局部背景梯度的干扰,从而从该文字区域中将每一个文字提取出来,并对所提取文字进行归一化处理,即将所有文字缩放到统一大小,最后提取每个文字的特征进行识别。
上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭示如上,然而并非用以限定本发明,任何本领域技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰,均仍属于本发明技术方案的范围。
Claims (8)
1.一种文字识别方法,其特征在于,包括以下步骤:
获取待识别图像;
对已获取图像预处理:图像倾斜校正以校正图像,阈值化处理获得前景信息及背景信息单一的图像;所述图像倾斜校正包括以下步骤:先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度、得到直线角度并旋转图像角度。
分析处理图像:分析图像的行间纹理特征,获取图像的文字矩阵参数;
分割图像:基于所述文字矩阵参数对图像进行切割,形成若干个子图像,获取图像的文字字块;
识别:对文字字块进行单独处理,获取文字字块的图像特征,并对所述图像特征进行识别。
2.根据权利要求1所述文字识别方法,其特征在于:所述对已获取图像预处理还包括对已识别图像进行图像降噪以提升识别处理的精确度。
3.根据权利要求2所述文字识别方法,其特征在于:所述图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法进行。
4.根据权利要求1所述文字识别方法,其特征在于:所述阈值化处理包括固定阈值化方法、自适应阈值化方法和大津法或迭代法。
5.根据权利要求1所述文字识别方法,其特征在于:将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示,背景用第二像素值表示,统计图像矩阵坐标中每行第二像素值的个数,获取一数组;统计对若干行高参数,参数取平均值统计,获取字体大小参数。
6.根据权利要求1所述文字识别方法,其特征在于:所述识别基于预设的聚类算法对切分后的文字子块进行图像分割处理,获取文字字块中的文字信息,并根据所述文字信息在预置的系统文字库中进行比对,根据比对结构确定图像中的文字。
7.根据权利要求1所述文字识别方法,其特征在于:所述分析处理图像还包括对文字字块进行膨胀处理。
8.根据权利要求1所述文字识别方法,其特征在于:所述识别步骤包括所提取文字字块进行归一化处理后再进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611007793.5A CN106778752A (zh) | 2016-11-16 | 2016-11-16 | 一种文字识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611007793.5A CN106778752A (zh) | 2016-11-16 | 2016-11-16 | 一种文字识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106778752A true CN106778752A (zh) | 2017-05-31 |
Family
ID=58968494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611007793.5A Pending CN106778752A (zh) | 2016-11-16 | 2016-11-16 | 一种文字识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106778752A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197624A (zh) * | 2018-02-02 | 2018-06-22 | 杭州清本科技有限公司 | 证书图像校正识别方法及装置、计算机存储介质 |
CN108319945A (zh) * | 2018-01-09 | 2018-07-24 | 佛山科学技术学院 | 一种分离式ocr识别方法及其系统 |
CN108537229A (zh) * | 2018-04-24 | 2018-09-14 | 大连民族大学 | 基于满文部件切分的印刷体满文识别方法 |
WO2019056346A1 (zh) * | 2017-09-25 | 2019-03-28 | 深圳传音通讯有限公司 | 一种利用膨胀法校正文本图像倾斜的方法及装置 |
CN110942435A (zh) * | 2019-11-27 | 2020-03-31 | 讯飞智元信息科技有限公司 | 一种文档图像处理的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101038626A (zh) * | 2007-04-25 | 2007-09-19 | 上海大学 | 试卷卷面分数识别方法和装置 |
CN103258198A (zh) * | 2013-04-26 | 2013-08-21 | 四川大学 | 一种表格文档图像中字符提取方法 |
CN104050450A (zh) * | 2014-06-16 | 2014-09-17 | 西安通瑞新材料开发有限公司 | 一种基于视频的车牌识别方法 |
CN104298982A (zh) * | 2013-07-16 | 2015-01-21 | 深圳市腾讯计算机系统有限公司 | 一种文字识别方法及装置 |
CN105631486A (zh) * | 2014-10-27 | 2016-06-01 | 深圳Tcl数字技术有限公司 | 图像文字识别方法及装置 |
-
2016
- 2016-11-16 CN CN201611007793.5A patent/CN106778752A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101038626A (zh) * | 2007-04-25 | 2007-09-19 | 上海大学 | 试卷卷面分数识别方法和装置 |
CN103258198A (zh) * | 2013-04-26 | 2013-08-21 | 四川大学 | 一种表格文档图像中字符提取方法 |
CN104298982A (zh) * | 2013-07-16 | 2015-01-21 | 深圳市腾讯计算机系统有限公司 | 一种文字识别方法及装置 |
CN104050450A (zh) * | 2014-06-16 | 2014-09-17 | 西安通瑞新材料开发有限公司 | 一种基于视频的车牌识别方法 |
CN105631486A (zh) * | 2014-10-27 | 2016-06-01 | 深圳Tcl数字技术有限公司 | 图像文字识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
宁博: "手写体汉字识别实验平台及笔划网格特征提取方法的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019056346A1 (zh) * | 2017-09-25 | 2019-03-28 | 深圳传音通讯有限公司 | 一种利用膨胀法校正文本图像倾斜的方法及装置 |
CN108319945A (zh) * | 2018-01-09 | 2018-07-24 | 佛山科学技术学院 | 一种分离式ocr识别方法及其系统 |
CN108197624A (zh) * | 2018-02-02 | 2018-06-22 | 杭州清本科技有限公司 | 证书图像校正识别方法及装置、计算机存储介质 |
CN108537229A (zh) * | 2018-04-24 | 2018-09-14 | 大连民族大学 | 基于满文部件切分的印刷体满文识别方法 |
CN110942435A (zh) * | 2019-11-27 | 2020-03-31 | 讯飞智元信息科技有限公司 | 一种文档图像处理的方法和装置 |
CN110942435B (zh) * | 2019-11-27 | 2023-05-30 | 讯飞智元信息科技有限公司 | 一种文档图像处理的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106503711A (zh) | 一种文字识别方法 | |
CN106778752A (zh) | 一种文字识别方法 | |
Kasar et al. | Learning to detect tables in scanned document images using line information | |
Pan et al. | A robust system to detect and localize texts in natural scene images | |
Bai et al. | Scene text localization using gradient local correlation | |
Yadav et al. | Text extraction in document images: highlight on using corner points | |
CN102136074B (zh) | 一种基于mmi的木材图像纹理分析与识别方法 | |
Liu et al. | A novel multi-oriented chinese text extraction approach from videos | |
CN107730511B (zh) | 一种基于基线估计的藏文历史文献文本行切分方法 | |
Shitole et al. | Recognition of handwritten Devanagari characters using linear discriminant analysis | |
CN104598881B (zh) | 基于特征压缩与特征选择的歪斜场景文字识别方法 | |
Bai et al. | A fast stroke-based method for text detection in video | |
Zhan et al. | A robust split-and-merge text segmentation approach for images | |
Karanje et al. | Survey on text detection, segmentation and recognition from a natural scene images | |
CN106503713A (zh) | 一种基于粗外围特征文字识别方法 | |
Asif et al. | A novel hybrid method for text detection and extraction from news videos | |
Ahmed et al. | Enhancing the character segmentation accuracy of bangla ocr using bpnn | |
CN117058182A (zh) | 一种用于视觉测距的目标检测边框优化方法 | |
Liu et al. | Detection and segmentation text from natural scene images based on graph model | |
Sharma et al. | A new method for character segmentation from multi-oriented video words | |
Rohini et al. | Segmentation of touching, overlapping, skewed and short handwritten text lines | |
CN102831421B (zh) | 一种基于标点符号的文档上下方向检测方法 | |
TWI430187B (zh) | License plate number identification method | |
Huang | A novel video text extraction approach based on Log-Gabor filters | |
CN113361330A (zh) | 一种电子文档自动识别系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170531 |
|
WD01 | Invention patent application deemed withdrawn after publication |