CN106503713A - 一种基于粗外围特征文字识别方法 - Google Patents
一种基于粗外围特征文字识别方法 Download PDFInfo
- Publication number
- CN106503713A CN106503713A CN201611008157.4A CN201611008157A CN106503713A CN 106503713 A CN106503713 A CN 106503713A CN 201611008157 A CN201611008157 A CN 201611008157A CN 106503713 A CN106503713 A CN 106503713A
- Authority
- CN
- China
- Prior art keywords
- image
- word
- character recognition
- thick periphery
- recognition method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
本发明涉及图像识别技术领域,尤其是涉及一种基于粗外围特征文字识别方法,包括:获取待识别图像;对已获取图像预处理:图像倾斜校正以校正图像和阈值化处理获得前景信息及背景信息单一的图像;分析处理图像:分析图像的行间纹理特征,获取图像的文字矩阵参数;分割图像:基于所述文字矩阵参数对图像进行切割,形成若干个子图像,获取图像的文字字块;识别:对文字字块进行单独处理,获取文字字块的图像特征,并对所述图像特征进行识别。该方法文字简单易行,识别率高。
Description
【技术领域】
本发明涉及图像识别技术领域,尤其是涉及一种计算机故障检测系统及方法一种粗外围特征文字识别方法。
【背景技术】
随着数码相机、摄像头、超高速扫描仪等图像获取设备的广泛应用,图像中信息越来越引起人们的关注。其中嵌入在图像中的文字是图像语义内容的一种重要表达方式,能够提供一些人们所需要的重要信息。例如图像中的文字可以是该图像的内容概述,如果能够自动提取和识别图像中的文字,就可以让计算机自动理解图像内容。让计算机像人类一样识别图像中的文字,对于图像和视频的存储、分类、理解及检索等来说具有极其重要的意义,它主要应用在中文信息处理、办公室自动化、及其翻译、人工智能等高技术领域,有着广泛的应用前景和商业价值。目前对图像中的文字一般只是通过简单的图像分割处理来进行识别,无法根据图像中的文字特征来进行自适应调节,导致现有的图像文字识别方法精度较低,无法满足实际应用的需求。
【发明内容】
鉴于以上内容,有必要提供一种计算机故障检测系统及方法一种基于粗外围特征文字识别方法,目的在于解决现有的图像文字识别方法对文字的识别精度较低的技术问题。
本发明的目的通过以下技术方案实现:
一种基于粗外围特征文字识别方法,包括以下步骤:
获取待识别图像;
对已获取图像预处理:图像倾斜校正以校正图像和阈值化处理获得前景信息及背景信息单一的图像;
分析处理图像:分析图像的行间纹理特征,获取图像的文字矩阵参数;
分割图像:基于所述文字矩阵参数对图像进行切割,形成若干个子图像,获取图像的文字字块;
识别:对文字字块进行单独处理,获取文字字块的图像特征,并将所有子图像的特征值重新组合为一个特征向量,并对所述图像特征进行识别;所述获取文字字块的图像特征方法为:计算出文字字块边框,把p×q点阵文字字块分割成n×n份,从文字字块四边框向各对边扫描,计算最初与文字笔划相碰的非文字部分的面积和全部面积之比作为一次粗外围特征,再将第二次与文字线相碰的非文字部分面积和全部文字面积之比作为二次粗外围特征,次粗外围特征与二次粗外围特征形成总特征向量。
进一步的,所述对已获取图像预处理还包括对已识别图像进行图像降噪以提升识别处理的精确度。
进一步的,所述图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法等方法。
进一步的,所述阈值化处理包括固定阈值化方法、自适应阈值化方法、大津法或迭代法。
进一步的,将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示,背景用第二像素值表示,统计图像的矩阵坐标中每行第二像素值的个数,获取一数组;统计对若干行高参数,参数取平均值统计,获取字体大小参数。
进一步的,所述识别基于预设的聚类算法对切分后的文字子块进行图像分割处理,获取文字字块中的文字信息,并根据所述文字信息在预置的系统文字库中进行比对,根据比对结构确定图像中的文字。
进一步的,所述分析处理图像还包括对文字字块进行膨胀处理。
进一步的,所述识别步骤包括所提取文字字块进行归一化处理后再进行识别。
本发明有益效果:本发明通过识别图像的矩阵行高纹理特征进行分析,计算出图像文字的矩阵参数,再基于文字相关的矩阵参数估算出文字字体大小参数,然后在对每一个文字快进行分割,并对文字子块进行识别,提高了切分文字子块的准确性,从而提高文字识别的精度。
【具体实施方式】
一种基于粗外围特征文字识别方法,其特征在于,包括以下步骤:
获取待识别图像;待识别图像可以是任何需要进行文字识别的图像,待识别图像可以来自外部设备。待识别图像可以是原始图像,也可以是对原始图像进行预处理后得到的图像,待识别的图像可以是jpg、bmp、png等图像格式。
对已获取图像预处理,包括阈值化处理、阈值化处理和倾斜校正。阈值化处理:所述阈值化处理包括固定阈值化方法、自适应阈值化方法、大津法或迭代法。图像的阈值化有利于图像的进一步处理,获得前景信息及背景信息单一的图像,使图像变得简单,而且数据量减小,能凸显出感兴趣的目标的轮廓。阈值化处理:由于待识别图像的品质受限于输入设备、环境、以及文档的印刷质量,在对图像中印刷体字符进行识别处理前,需要根据噪声的特征对待识别图像进行去噪处理,提升识别处理的精确度,图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法等方法。倾斜校正:由于扫描和拍摄过程涉及人工操作,输入计算机的待识别图像或多或少都会存在一些倾斜,在对图像中印刷体字符进行识别处理前,就需要进行图像方向检测,并校正图像方向。
分析处理图像,分析图像的行间纹理特征,获取图像的文字矩阵参数;将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示,背景用第二像素值表示,统计图像的矩阵坐标中每行第二像素值的个数,获取一数组;统计对若干行高参数,参数取平均值统计,获取字体大小参数。
分割图像:基于所述文字矩阵参数对图像进行切割,形成若干个子图像,获取图像的文字字块;在进行图像切割前还包括对图像中文字区域中的文字进行判断排列方向,可以对文字字块逐行逐列扫描像素,得到文字字块中文字的行间距和列间距,并计算文字行的高度方差及文字列的宽度方差。该文字行的高度方差用于反映文字行高度的一致性,而该文字列的宽度方差用于反映文字列宽度的一致性。然后综合该文字间距和文字行的高度或文字列的宽度的一致性等因素来判断该文字是横向排列还是纵向排列。例如,若行间距大于列间距,并且文字行高度一致,则判定文字区域中文字是横向排列。若列间距大于行间距,并且文字列宽度一致,则判定文字区域中文字是纵向排列。对文字字块的切分结果进行修正,例如包括将错误切分后的文字行或列合并,或对英文首字母与第二字母的错误切分进行修正
识别:对文字字块进行单独处理,获取文字字块的图像特征,并对所述图像特征进行识别;使用经过版面分析及单字切分操作后的该文字字块从文字区域中提取文字之前,还可以对该文字字块进行膨胀处理,然后使用该文字字块保留文字边缘梯度,去除局部背景梯度的干扰,从而从该文字区域中将每一个文字提取出来,并对所提取文字进行归一化处理,即将所有文字缩放到统一大小,最后提取每个文字的特征进行识别。所述获取文字字块的图像特征方法为:计算出文字字块边框,把p×q点阵文字字块分割成n×n份,从文字字块四边框向各对边扫描,计算最初与文字笔划相碰的非文字部分的面积和全部面积之比作为一次粗外围特征,再将第二次与文字线相碰的非文字部分面积和全部文字面积之比作为二次粗外围特征,次粗外围特征与二次粗外围特征形成总特征向量。一次粗外围特征反映了文字轮廓特征,二次粗外围特征在某种程度上反映了文字内部结构。
上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭示如上,然而并非用以限定本发明,任何本领域技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰,均仍属于本发明技术方案的范围。
Claims (8)
1.一种基于粗外围特征文字识别方法,其特征在于,包括以下步骤:
获取待识别图像;
对已获取图像预处理:图像倾斜校正以校正图像,阈值化处理获得前景信息及背景信息单一的图像;
分析处理图像:分析图像的行间纹理特征,获取图像的文字矩阵参数;
分割图像:基于所述文字矩阵参数对图像进行切割,形成若干个子图像,获取图像的文字字块;
识别:对文字字块进行单独处理,获取文字字块的图像特征,并将所有子图像的特征值重新组合为一个特征向量,并对所述图像特征进行识别;所述获取文字字块的图像特征方法为:计算出文字字块边框,把p×q点阵文字字块分割成n×n份,从文字字块四边框向各对边扫描,计算最初与文字笔划相碰的非文字部分的面积和全部面积之比作为一次粗外围特征,再将第二次与文字线相碰的非文字部分面积和全部文字面积之比作为二次粗外围特征,次粗外围特征与二次粗外围特征形成总特征向量。
2.根据权利要求1所述基于粗外围特征文字识别方法,其特征在于:所述对已获取图像预处理还包括对已识别图像进行图像降噪以提升识别处理的精确度。
3.根据权利要求2所述基于粗外围特征文字识别方法,其特征在于:所述图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法进行。
4.根据权利要求1所述基于粗外围特征文字识别方法,其特征在于:所述阈值化处理包括固定阈值化方法、自适应阈值化方法和大津法或迭代法。
5.根据权利要求1所述基于粗外围特征文字识别方法,其特征在于:将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示,背景用第二像素值表示,统计图像矩阵坐标中每行第二像素值的个数,获取一数组;统计对若干行高参数,参数取平均值统计,获取字体大小参数。
6.根据权利要求1所述基于粗外围特征文字识别方法,其特征在于:所述识别基于预设的聚类算法对切分后的文字子块进行图像分割处理,获取文字字块中的文字信息,并根据所述文字信息在预置的系统文字库中进行比对,根据比对结构确定图像中的文字。
7.根据权利要求1所述基于粗外围特征文字识别方法,其特征在于:所述分析处理图像还包括对文字字块进行膨胀处理。
8.根据权利要求1所述基于粗外围特征文字识别方法,其特征在于:所述识别步骤包括所提取文字字块进行归一化处理后再进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611008157.4A CN106503713A (zh) | 2016-11-16 | 2016-11-16 | 一种基于粗外围特征文字识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611008157.4A CN106503713A (zh) | 2016-11-16 | 2016-11-16 | 一种基于粗外围特征文字识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106503713A true CN106503713A (zh) | 2017-03-15 |
Family
ID=58324700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611008157.4A Pending CN106503713A (zh) | 2016-11-16 | 2016-11-16 | 一种基于粗外围特征文字识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106503713A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256523A (zh) * | 2018-01-11 | 2018-07-06 | 上海展扬通信技术有限公司 | 基于移动终端的识别方法、装置及计算机可读存储介质 |
CN109472249A (zh) * | 2018-11-22 | 2019-03-15 | 京东方科技集团股份有限公司 | 一种确定书写体优劣等级的方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156688A (zh) * | 2011-05-19 | 2011-08-17 | 深圳市万兴软件有限公司 | 一种文字变形特效处理方法及装置 |
CN104298982A (zh) * | 2013-07-16 | 2015-01-21 | 深圳市腾讯计算机系统有限公司 | 一种文字识别方法及装置 |
CN105069450A (zh) * | 2015-07-16 | 2015-11-18 | 福州大学 | 一种快速的多文字识别方法 |
CN105631486A (zh) * | 2014-10-27 | 2016-06-01 | 深圳Tcl数字技术有限公司 | 图像文字识别方法及装置 |
CN105825211A (zh) * | 2016-03-17 | 2016-08-03 | 世纪龙信息网络有限责任公司 | 名片识别方法、装置及系统 |
-
2016
- 2016-11-16 CN CN201611008157.4A patent/CN106503713A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156688A (zh) * | 2011-05-19 | 2011-08-17 | 深圳市万兴软件有限公司 | 一种文字变形特效处理方法及装置 |
CN104298982A (zh) * | 2013-07-16 | 2015-01-21 | 深圳市腾讯计算机系统有限公司 | 一种文字识别方法及装置 |
CN105631486A (zh) * | 2014-10-27 | 2016-06-01 | 深圳Tcl数字技术有限公司 | 图像文字识别方法及装置 |
CN105069450A (zh) * | 2015-07-16 | 2015-11-18 | 福州大学 | 一种快速的多文字识别方法 |
CN105825211A (zh) * | 2016-03-17 | 2016-08-03 | 世纪龙信息网络有限责任公司 | 名片识别方法、装置及系统 |
Non-Patent Citations (4)
Title |
---|
XINBIAO JIA 等: "Off-Line Handwritten Chinese Character Recognition Based on Double Contour Feature", 《PROCEEDINGS OF THE INTERNATIONAL SYMPOSIUM ON INTELLIGENT INFORMATION SYSTEMS AND APPLICATIONS (IISA’09)》 * |
宁博: "手写体汉字识别实验平台及笔划网格特征提取方法的研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
李红睿: "基于动态粗外围方向线素特征的脱机手写汉字识别", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
王林泉 等: "利用笔划密度函数等特征的手写汉字识别的讨论", 《中文信息学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256523A (zh) * | 2018-01-11 | 2018-07-06 | 上海展扬通信技术有限公司 | 基于移动终端的识别方法、装置及计算机可读存储介质 |
CN108256523B (zh) * | 2018-01-11 | 2022-06-10 | 上海展扬通信技术有限公司 | 基于移动终端的识别方法、装置及计算机可读存储介质 |
CN109472249A (zh) * | 2018-11-22 | 2019-03-15 | 京东方科技集团股份有限公司 | 一种确定书写体优劣等级的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106503711A (zh) | 一种文字识别方法 | |
CN108171104B (zh) | 一种文字检测方法及装置 | |
CN109993040B (zh) | 文本识别方法及装置 | |
WO2017148265A1 (zh) | 一种单词的分割方法和装置 | |
WO2019072233A1 (zh) | 文本行检测方法及文本行检测装置 | |
CN108805076B (zh) | 环境影响评估报告书表格文字的提取方法及系统 | |
CN110766017B (zh) | 基于深度学习的移动终端文字识别方法及系统 | |
CN105760901B (zh) | 一种多语种倾斜文档图像的自动语言判别方法 | |
CN106778752A (zh) | 一种文字识别方法 | |
JP2006067585A (ja) | デジタル画像におけるキャプションを位置特定及び抽出する方法及び装置 | |
CN112364862B (zh) | 一种基于直方图相似度的扰动变形汉字图片匹配的方法 | |
Liu et al. | A novel multi-oriented chinese text extraction approach from videos | |
Shehu et al. | Character recognition using correlation & hamming distance | |
CN106503713A (zh) | 一种基于粗外围特征文字识别方法 | |
Giri | Text information extraction and analysis from images using digital image processing techniques | |
Zhan et al. | A robust split-and-merge text segmentation approach for images | |
Shi et al. | Image enhancement for degraded binary document images | |
Gui et al. | A fast caption detection method for low quality video images | |
Karanje et al. | Survey on text detection, segmentation and recognition from a natural scene images | |
Liu et al. | Detection and segmentation text from natural scene images based on graph model | |
CN109117841B (zh) | 基于笔画宽度变换与卷积神经网络的场景文本检测方法 | |
CN106503712A (zh) | 一种基于笔划密度特征文字识别方法 | |
Mollah et al. | Text region extraction from business card images for mobile devices | |
Saudagar et al. | Efficient Arabic text extraction and recognition using thinning and dataset comparison technique | |
Phan et al. | A skeleton-based method for multi-oriented video text detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170315 |
|
WD01 | Invention patent application deemed withdrawn after publication |