CN106778752A

CN106778752A - 一种文字识别方法

Info

Publication number: CN106778752A
Application number: CN201611007793.5A
Authority: CN
Inventors: 何新霞
Original assignee: Guangxi University
Current assignee: Guangxi University
Priority date: 2016-11-16
Filing date: 2016-11-16
Publication date: 2017-05-31

Abstract

本发明涉及图像识别技术领域，尤其是涉及一种文字识别方法，包括：获取待识别图像；对已获取图像预处理：图像倾斜校正以校正图像和阈值化处理获得前景信息及背景信息单一的图像；分析处理图像：分析图像的行间纹理特征，获取图像的文字矩阵参数；分割图像：基于所述文字矩阵参数对图像进行切割，形成若干个子图像，获取图像的文字字块；识别：对文字字块进行单独处理，获取文字字块的图像特征，并对所述图像特征进行识别；所述图像校正包括：先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度、得到直线角度并旋转图像角度。该方法文字简单易行，识别率高。

Description

一种文字识别方法

【技术领域】

本发明涉及图像识别技术领域，尤其是涉及一种计算机故障检测系统及方法一种文字识别方法。

【背景技术】

随着数码相机、摄像头、超高速扫描仪等图像获取设备的广泛应用，图像中信息越来越引起人们的关注。其中嵌入在图像中的文字是图像语义内容的一种重要表达方式，能够提供一些人们所需要的重要信息。例如图像中的文字可以是该图像的内容概述，如果能够自动提取和识别图像中的文字，就可以让计算机自动理解图像内容。让计算机像人类一样识别图像中的文字，对于图像和视频的存储、分类、理解及检索等来说具有极其重要的意义，它主要应用在中文信息处理、办公室自动化、及其翻译、人工智能等高技术领域，有着广泛的应用前景和商业价值。目前对图像中的文字一般只是通过简单的图像分割处理来进行识别，无法根据图像中的文字特征来进行自适应调节，导致现有的图像文字识别方法精度较低，无法满足实际应用的需求。

【发明内容】

鉴于以上内容，有必要提供一种计算机故障检测系统及方法一种文字识别方法，目的在于解决现有的图像文字识别方法对文字的识别精度较低的技术问题。

本发明的目的通过以下技术方案实现：

一种文字识别方法，包括以下步骤：

获取待识别图像；

对已获取图像预处理：图像倾斜校正以校正图像和阈值化处理获得前景信息及背景信息单一的图像；

分析处理图像：分析图像的行间纹理特征，获取图像的文字矩阵参数；

分割图像：基于所述文字矩阵参数对图像进行切割，形成若干个子图像，获取图像的文字字块；

识别：对文字字块进行单独处理，获取文字字块的图像特征，并对所述图像特征进行识别；

所述图像校正包括：先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度、得到直线角度并旋转图像角度。

进一步的，所述对已获取图像预处理还包括对已识别图像进行图像降噪以提升识别处理的精确度。

进一步的，所述图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法等方法。

进一步的，所述阈值化处理包括固定阈值化方法、自适应阈值化方法、大津法或迭代法。

进一步的，将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示，背景用第二像素值表示，统计图像的矩阵坐标中每行第二像素值的个数，获取一数组；统计对若干行高参数，参数取平均值统计，获取字体大小参数。

进一步的，所述识别基于预设的聚类算法对切分后的文字子块进行图像分割处理，获取文字字块中的文字信息，并根据所述文字信息在预置的系统文字库中进行比对，根据比对结构确定图像中的文字。

进一步的，所述分析处理图像还包括对文字字块进行膨胀处理。

进一步的，所述识别步骤包括所提取文字字块进行归一化处理后再进行识别。

本发明有益效果：本发明通过识别图像的矩阵行高纹理特征进行分析，计算出图像文字的矩阵参数，再基于文字相关的矩阵参数估算出文字字体大小参数，然后在对每一个文字快进行分割，并对文字子块进行识别，提高了切分文字子块的准确性，从而提高文字识别的精度。

【具体实施方式】

一种文字识别方法，其特征在于，包括以下步骤：

获取待识别图像；待识别图像可以是任何需要进行文字识别的图像，待识别图像可以来自外部设备。待识别图像可以是原始图像，也可以是对原始图像进行预处理后得到的图像，待识别的图像可以是jpg、bmp、png等图像格式。

对已获取图像预处理，包括阈值化处理、阈值化处理和倾斜校正。阈值化处理：所述阈值化处理包括固定阈值化方法、自适应阈值化方法、大津法或迭代法。图像的阈值化有利于图像的进一步处理，获得前景信息及背景信息单一的图像，使图像变得简单，而且数据量减小，能凸显出感兴趣的目标的轮廓。阈值化处理：由于待识别图像的品质受限于输入设备、环境、以及文档的印刷质量，在对图像中印刷体字符进行识别处理前，需要根据噪声的特征对待识别图像进行去噪处理，提升识别处理的精确度，图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法等方法。倾斜校正：由于扫描和拍摄过程涉及人工操作，输入计算机的待识别图像或多或少都会存在一些倾斜，在对图像中印刷体字符进行识别处理前，就需要进行图像方向检测，并校正图像方向。本实施例中倾斜校正具体可为包括以下步骤：先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度、得到直线角度并旋转图像角度。

分析处理图像，分析图像的行间纹理特征，获取图像的文字矩阵参数；将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示，背景用第二像素值表示，统计图像的矩阵坐标中每行第二像素值的个数，获取一数组；统计对若干行高参数，参数取平均值统计，获取字体大小参数。

分割图像：基于所述文字矩阵参数对图像进行切割，形成若干个子图像，获取图像的文字字块；在进行图像切割前还包括对图像中文字区域中的文字进行判断排列方向，可以对文字字块逐行逐列扫描像素，得到文字字块中文字的行间距和列间距，并计算文字行的高度方差及文字列的宽度方差。该文字行的高度方差用于反映文字行高度的一致性，而该文字列的宽度方差用于反映文字列宽度的一致性。然后综合该文字间距和文字行的高度或文字列的宽度的一致性等因素来判断该文字是横向排列还是纵向排列。例如，若行间距大于列间距，并且文字行高度一致，则判定文字区域中文字是横向排列。若列间距大于行间距，并且文字列宽度一致，则判定文字区域中文字是纵向排列。对文字字块的切分结果进行修正，例如包括将错误切分后的文字行或列合并，或对英文首字母与第二字母的错误切分进行修正

识别：对文字字块进行单独处理，获取文字字块的图像特征，并对所述图像特征进行识别；使用经过版面分析及单字切分操作后的该文字字块从文字区域中提取文字之前，还可以对该文字字块进行膨胀处理，然后使用该文字字块保留文字边缘梯度，去除局部背景梯度的干扰，从而从该文字区域中将每一个文字提取出来，并对所提取文字进行归一化处理，即将所有文字缩放到统一大小，最后提取每个文字的特征进行识别。

上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭示如上，然而并非用以限定本发明，任何本领域技术人员，在不脱离本发明技术方案范围内，当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案内容，依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰，均仍属于本发明技术方案的范围。

Claims

1.一种文字识别方法，其特征在于，包括以下步骤：

获取待识别图像；

对已获取图像预处理：图像倾斜校正以校正图像，阈值化处理获得前景信息及背景信息单一的图像；所述图像倾斜校正包括以下步骤：先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度、得到直线角度并旋转图像角度。

识别：对文字字块进行单独处理，获取文字字块的图像特征，并对所述图像特征进行识别。

2.根据权利要求1所述文字识别方法，其特征在于：所述对已获取图像预处理还包括对已识别图像进行图像降噪以提升识别处理的精确度。

3.根据权利要求2所述文字识别方法，其特征在于：所述图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法进行。

4.根据权利要求1所述文字识别方法，其特征在于：所述阈值化处理包括固定阈值化方法、自适应阈值化方法和大津法或迭代法。

5.根据权利要求1所述文字识别方法，其特征在于：将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示，背景用第二像素值表示，统计图像矩阵坐标中每行第二像素值的个数，获取一数组；统计对若干行高参数，参数取平均值统计，获取字体大小参数。

6.根据权利要求1所述文字识别方法，其特征在于：所述识别基于预设的聚类算法对切分后的文字子块进行图像分割处理，获取文字字块中的文字信息，并根据所述文字信息在预置的系统文字库中进行比对，根据比对结构确定图像中的文字。

7.根据权利要求1所述文字识别方法，其特征在于：所述分析处理图像还包括对文字字块进行膨胀处理。

8.根据权利要求1所述文字识别方法，其特征在于：所述识别步骤包括所提取文字字块进行归一化处理后再进行识别。