CN111914847B

CN111914847B - 一种基于模板匹配的ocr识别方法及其系统

Info

Publication number: CN111914847B
Application number: CN202010715323.4A
Authority: CN
Inventors: 庄国金; 陈文传; 陈昊; 温亦汝; 杨龙; 吕晓君; 郑宇�
Original assignee: Xiamen Shangji Network Technology Co ltd
Current assignee: Xiamen Shangji Network Technology Co ltd
Priority date: 2020-07-23
Filing date: 2020-07-23
Publication date: 2023-11-17
Anticipated expiration: 2040-07-23
Also published as: CN111914847A

Abstract

本发明涉及一种基于模板匹配的OCR识别方法及其系统，通过对图像进行预处理，投影切割字符，将字符划分为多个网格，并计算网格特征值，将特征值与模板特征值比对计算相似度，以相似度最高的模板作为识别结果。本发明有益效果：适用于大部分场景，算法开发难度低，效率高，识别精度高。

Description

一种基于模板匹配的OCR识别方法及其系统

技术领域

本发明涉及一种基于模板匹配的OCR识别方法及其系统，属于OCR识别领域。

背景技术

传统意义上的OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。随着近年来图像处理技术的进步，对于OCR文字识别的需求越来越多，场景应用也不再局限于纸面文字，包括车牌识别，护照识别，交通标志识别等等。

随着深度学习的进步，目前越来越多的OCR技术采用基于神经网络的识别方法或者传统的机器学习knn分类算法进行识别，这些技术在准确率上虽然满足要求，但算法开发周期长，耗时长且要求的所需要的运行设备硬件要求高，在一些简单的应用场景上性价比不高，如车牌识别领域。

发明内容

为了解决上述技术问题，本发明提供一种基于模板匹配的OCR识别方法及其系统，通过对图像的预处理，对切割后的单字符文字进行快速模板比对识别，设备要求低，适配性高，成本低，识别效果好。

本发明的技术方案一：

一种基于模板匹配的OCR识别方法，包括如下步骤：

S1：获取目标图像；

S2：对所述目标图像进行预处理，所述预处理包括：对获取的目标图像进行定位、图像转正、二值化、去噪。

S3：对经过预处理的目标图像进行字符切割，以获得单独的字符图像，利用投影算法对所述字符进行切割处理。

S4：将所述单独的字符图像进行垂直投影分割获得N个一级网格，对所述一级网格进行水平投影分割获得N²个二级网格，对所述二级网格进行垂直投影分割获得2N²个三级网格，对所述三级网格进行水平投影分割获得4N²个四级网格，其中，N的取值大于2。

S5：计算所有的所述四级网格图像的特征值，所述特征值包括：笔画方向的对比特征值，横竖笔画判断的位特征值，撇捺笔画判断的位特征值，大小判断的位特征值，形状判断的位特征值。

S6：将所述特征值与字符模板的对应特征值按照从左到右的顺序，依次比对对应位置的数值，如果数值一致，则相似度加1，计算所有特征值的相似度总和，取相似度总和最大的字符模板所代表的字符作为字符识别结果。

所述S2步骤具体为：

S21：对所述目标图像进行目标定位，通过彩色图像定位方法，找到符合的颜色特征区域并进行裁剪；

S22：对经过定位裁剪的目标图像进行转正处理。

S23：对经过转正处理的目标图像通过OTSU算法进行二值化处理获得二值化图像。

S24：对所述二值化图像通过连通域去噪方法进行去噪处理，获得经过预处理的目标图像。

所述S3步骤中，对所述经过预处理的目标图像的进行垂直方向投影，对每一列的字符像素点数进行统计，获得表征目标图像的直方图，所述直方图中的波谷位置即为字符间隔，根据字符间隔分割出单独字符图像。

所述S4步骤具体为：

S41：对所述单独字符图像进行垂直投影，统计每列的字符像素点数，并计算字符像素点数总和，从第一列起依次累加每列的字符像素点数，当累计点数达到点数总和的1/N时，此时的列记录为第一垂直分割线，继续累加，当累计点数达到点数总和的2/N时，此时的列记录为第二垂直分割线，以此类推，直至得到第N-1垂直分割线，所述第一至第N-1垂直分割线将所述单独字符图像分割为N个一级网格；

S42：对S41步骤获得的每个一级网格的图像进行水平投影，统计每行的字符像素点数，并计算字符像素点数总和，从第一行起依次累加每行的字符像素点数，当累计点数达到点数总和的1/N时，此时的行记录为第一水平分割线，继续累加，当累计点数达到点数总和的2/N时，此时的行记录为第二水平分割线，以此类推，直至得到第N-1水平分割线，所述第一至第N-1水平分割线将所述每个一级网格的图像分割为N个二级网格，所述单独字符图像被划分为N²个二级网格；

S43：对S42步骤获得的每个二级网格的图像进行垂直投影，统计每列的字符像素点数，并计算字符像素点数总和，从第一列起依次累加每列的字符像素点数，当累计点数达到点数总和的1/2时，此时的列记录为第N垂直分割线，所述第N垂直分割线将所述二级网格图像分割成2个三级网格，所述单独字符图像被划分为2N²个三级网格；

S44：对S43步骤获得的每个三级网格的图像进行水平投影，统计每行的字符像素点数，并计算字符像素点数总和，从第一行起依次累加每行的字符像素点数，当累计点数达到点数总和的1/2时，此时的行记录为第N水平分割线，所述第N水平分割线将所述三级网格图像分割成2个四级网格，最终将所述单独字符图像划分为4N²个四级网格。

所述S5步骤具体为：

S51：计算所述笔画方向的对比特征值，每个字符像素点根据周边8个像素点组成包含9个像素点的九宫格阵列，将所述九宫格阵列和横竖撇捺4个模板阵列比对，判断当前字符像素点的类别，计算判断为横竖撇捺4个类别的字符像素点个数，其中，最小点数和最大点数的比值记为笔画方向的对比特征值。

S52：计算所述横竖笔画判断的位特征值，根据S51计算的像素点类别值，当判断为横的字符像素点个数大于判断为竖的字符像素点个数，则所述四级网格横竖笔画判断的位特征值记为0，反之，则所述四级网格横竖笔画判断的位特征值记为1。

S53：计算所述撇捺笔画判断的位特征值，根据S51计算的像素点类别值，当判断为撇的字符像素点个数大于判断为捺的字符像素点个数，则所述四级网格撇捺笔画判断的位特征值记为0，反之，则所述四级网格横竖笔画判断的位特征值记为1。

S54：计算所述形状判断的位特征值，当所述四级网格的宽大于高时，则所述四级网格的形状判断的位特征值记为0，反之，则所述四级网格的形状判断的位特征值记为1。

S55：计算所述大小判断的位特征值，计算所有所述四级网格的面积大小，并求面积平均值，当所述四级网格的面积小于平均值时，则所述四级网格的大小判断的位特征值记为0，反之，则所述四级网格的大小判断的位特征值记为1。

技术方案二：

一种基于模板匹配的OCR识别系统，包括存储器和处理器，所述存储器存储有指令，所述指令适于由处理器加载并执行以下步骤：

S1：获取目标图像。

所述S2步骤具体为：

S21：对所述目标图像进行目标定位，通过彩色图像定位方法，找到符合的颜色特征区域并进行裁剪。

S22：对经过定位裁剪的目标图像进行转正处理。

所述S4步骤具体为：

所述S5步骤具体为：

本发明具有如下有益效果：

1、通过预处理实现快速识别目标区域并且切割字符；

2、通过统一的投影方法将字符进行分割处理，保证文字的局部细节表达；

3、通过设置多个特征值，并计算每个字符网格的特征值，组成字符特征值数组，使得字符的细节特征表达更丰富，减少因为细节粗糙导致的识别错误；

4、通过将字符特征值与预先设置的模板特征进行相似度计算，确保比对的正确性。

附图说明

图1为本发明的一种基于模板匹配的OCR识别方法的流程示意图；

图2为本发明一个实施例的目标图；

图3为本发明一个实施例的经过图像定位和裁剪的目标示意图；

图4为本发明一个实施例的根据垂直投影直方图进行字符分割的示意图；

图5为本发明一个实施例的经过分割的字符示意图；

图6为本发明一个实施例的单独字符网格划分示意图；

图7为本发明的一种基于模板匹配的OCR识别方法的横竖撇捺模板示意图；

具体实施方式

下面结合附图和具体实施例来对本发明进行详细的说明。

实施例一

请参阅图1，一种基于模板匹配的OCR识别方法，包括如下步骤：

S1：获取目标图像。如图2所示，本实施例是一种车牌识别系统，通过摄像头和红外感应装置联通，当红外感应装置发现有汽车进入区域时，摄像头拍摄一张车头照片。

S2：对所述目标图像进行预处理。

S2步骤具体为：

除了彩色图像定位方法，目前常用定位方法还包括，基于纹理特征分析的方法、基于边缘检测的方法、基于数学形态学定位、基于小波分析定位等。针对不同的应用场景可以选用适合的定位方法，针对本实施例的车牌定位，采用基于彩色图像定位方法更加高效。由于国内车牌一般分为蓝牌、黄牌、绿牌，通过找到符合车牌颜色特征的区域进行筛选，如图3所示，在图2中发现蓝色区域，对蓝色车牌区域进行裁剪。

S22：对经过定位裁剪的目标图像进行转正处理。

因为摄像头的摆放位置和车辆进入的角度问题，大部分获得的图像都会发生侧向畸变，需要进行转正处理，将其转正为正面图像，便于后续的字符分割。

所述OTSU算法为最大类间方差法，是一种常用的二值化方法，将位于阈值上下的像素点统一为黑色像素点或者白色像素点，其中黑色像素点即字符像素点，白色像素点即背景像素点。二值化后的图像可能存在非字符噪点，采用现有的连通域去噪方法，去除未满足字符特征的区域，如宽高太小的连通域的区域，如图3中，车牌的四个固定螺栓，或者车牌上的污染点。

S2步骤中采用的各类预处理方法为现有技术。

S3步骤中，对所述经过预处理的目标图像的进行垂直方向投影，即对每一列的字符像素点数进行统计，获得表征目标图像的直方图，所述直方图中的波谷位置即为字符间隔，根据字符间隔分割出单独字符图像。

如图4所示，投影法为常用的字符分割方法，对二值化图像的垂直方向进行字符像素点的直方图统计，即计算垂直方向上的每一列的字符像素点个数作为纵轴，以列的序号作为横轴制作直方图，直方图中的波谷，即为字符像素点个数最小甚至为0的区域，即为字符的间隔区，从而分割出字符。因为去噪的结果不能达到百分百的去噪，仍会留下一些噪点，所以在直方图的分割过程中，将波谷的阈值设置为10，低于10的波谷位置为间隔区。

本实施例中，N的取值为3，则将所述单独的字符图像进行垂直投影分割获得3个一级网格，对所述一级网格进行水平投影分割获得9个二级网格，对所述二级网格进行垂直投影分割获得18个三级网格，对所述三级网格进行水平投影分割获得36个四级网格。

虽然汉字字符与英文字符和数字字符人眼看去有区别，但通过本发明的模板切割和特征值选取，可以解释任意一个字符的笔画构成与笔画走向。本实施例中，以汉字字符识别为例，英文字符和数字字符的识别同理。

如图6所示，所述单独字符“闽”，从图像中被分割出，经过多次垂直投影和水平投影被划分为36个网格。

S4步骤具体为：

本实施例中，N的取值为3，对所述单独字符图像进行垂直投影，统计每列的字符像素点数，并计算字符像素点数总和，从第一列起依次累加每列的字符像素点数，当累计点数达到点数总和的1/3时，此时的列记录为第一垂直分割线，继续累加，当累计点数达到点数总和的2/3时，此时的列记录为第二垂直分割线，所述第一和第二垂直分割线将所述单独字符图像分割为3个一级网格。

如图6，0-11的12个小块组成的区域为第一一级网格，12-23区域为第二一级网格，24-35区域为第三一级网格。

对上一步骤获得的每个一级网格的图像进行水平投影，统计每行的字符像素点数，并计算字符像素点数总和，从第一行起依次累加每行的字符像素点数，当累计点数达到点数总和的1/3时，此时的行记录为第一水平分割线，继续累加，当累计点数达到点数总和的2/3时，此时的行记录为第二水平分割线，所述第一和第二水平分割线将所述每个一级网格的图像分割为3个二级网格，所述单独字符图像被划分为9个二级网格。

水平投影与上一步骤中的垂直投影同理，不同的是统计字符像素点的方向由列转为行，以0-11区域第一一级网格为例，水平投影后分出的3个二级网格分别为0、1、6、7组成的区域，2、3、8、9组成的区域，4、5、10、11组成的区域。

对获得的每个二级网格的图像进行垂直投影，统计每列的字符像素点数，并计算字符像素点数总和，从第一列起依次累加每列的字符像素点数，当累计点数达到点数总和的1/2时，此时的列记录为第三垂直分割线，所述第三垂直分割线将所述二级网格图像分割成2个三级网格，所述单独字符图像被划分为18个三级网格。

以左上角第一一级网格里的第一二级网格0、1、6、7组成的区域为例，经过垂直投影后，该区域被分割为0、1组成的第一三级网格和6、7组成第二三级网格。

对获得的每个三级网格的图像进行水平投影，统计每行的字符像素点数，并计算字符像素点数总和，从第一行起依次累加每行的字符像素点数，当累计点数达到点数总和的1/2时，此时的行记录为第三水平分割线，所述第三水平分割线将所述三级网格图像分割成2个四级网格，最终将所述单独字符图像划分为36个四级网格。

以上一步骤被分割出的第一三级网格0、1区域为例，经过水平投影后，该区域被分割成标号为0的第一四级网格和标号为1的第二四级网格。最终分割出36个四级网格，按照从上到下，从左至右分别对每个网格进行标号。

S5步骤具体为：

S51：计算所述笔画方向的对比特征值，每个字符像素点根据周边8个像素点组成包含9个像素点的九宫格阵列，将所述九宫格阵列和横竖撇捺4个模板阵列比对，判断当前字符像素点的类别，计算判断为横竖撇捺4个类别的字符像素点个数，其中，最小点数和最大点数的比值记为笔画方向的对比特征值；

图7为横竖撇捺4个模板阵列，1代表字符像素点，0代表背景像素点，36个四级网格中的每个字符像素点根据周边像素点组成上述4个图像中的情况，累加判断为横竖撇捺的点个数。所述方向对比特征为最终组成横竖撇捺的最小点数与最大点数比例。例如图6中，网格(5)为包含37个字符像素点，可判断横线、竖线、撇线、捺线的点数分别为20、10、5、2，那么这个笔画方向的对比特征值为2:20。

本实施例中，“闽”字符的部分网格的笔画方向的对比特征值分别为：(0)2:23，(5)2:20，(30)2:20，(35)2:10，(17)2:10，(18)2:12，(2)2:10，(3)0:40，(32)2:13，(33)2:20，(12)2:23，(23)0:10。

本实施例中，所述横竖笔画判断的位特征值为：1111 1110 1000 0001 0100 11001111 1011 1110，为一个36位数组。

本实施例中，所述撇捺笔画判断的位特征值为：1111 1110 1011 1011 0011 10101111 1011 1110，为一个36位数组。

本实施例中，所述形状判断的位特征值为：1100 1101 0000 1000 0100 00010100 0011 1100，为一个36位数组。

本实施例中，所述大小判断的位特征值为：1011 0011 0011 1010 1111 10110111 0100 0000，为一个36位数组。

系统保存有标准字符模板的特征值数据，计算过程中将字符与所有模板进行匹配计算。

在本实施例中，以S52步骤中的横竖笔画判断的位特征为例，相似度的计算过程为：

目标图像的特征数据为1111 1110 1000 0001 0100 1100 1111 1011 1110；

模板中“闽”的特征数据为1101 1110 1100 0001 0100 1100 1110 1011 1110；

模板中“京”的特征数据为0101 0101 0011 1100 1101 0010 0100 0001 0101；

以位为单位，目标图像与2个模板相似度分别为33、19。同理，计算其它特征值的相似度，累计与模板中“闽”的相似度为：162，累计与模板中“京”得相似度为：81。明显可以看出，“闽”的相似度最高，所以识别结果为“闽”。

本发明通过预处理实现快速识别目标区域并且切割字符；通过统一的投影方法将字符进行分割处理，保证文字的局部细节表达，通过设置多个特征值，并计算每个字符网格的特征值，组成字符特征值数组，使得字符的细节特征表达更丰富，减少因为细节粗糙导致的识别错误，通过将字符特征值与预先设置的模板特征进行相似度计算，确保比对的正确性。

实施例二

S1：获取目标图像。

所述S2步骤具体为：

S22：对经过定位裁剪的目标图像进行转正处理。

所述S4步骤具体为：

所述S5步骤具体为：

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包含在本发明的专利保护范围内。

Claims

1.一种基于模板匹配的OCR识别方法，其特征在于，包括如下步骤：

S1：获取目标图像；

S2：对所述目标图像进行预处理；

S3：对经过预处理的目标图像进行字符切割，以获得单独的字符图像，利用投影算法对所述字符进行切割处理；

S4：将所述单独的字符图像进行垂直投影分割获得N个一级网格，对所述一级网格进行水平投影分割获得N²个二级网格，对所述二级网格进行垂直投影分割获得2N²个三级网格，对所述三级网格进行水平投影分割获得4N²个四级网格，其中，N的取值大于2；

S5：计算所有的所述四级网格的特征值，所述特征值包括：笔画方向的对比特征值，横竖笔画判断的位特征值，撇捺笔画判断的位特征值，大小判断的位特征值，形状判断的位特征值；

2.根据权利要求1所述的一种基于模板匹配的OCR识别方法，其特征在于，所述S2步骤具体为：

S22：对经过定位裁剪的目标图像进行转正处理；

S23：对经过转正处理的目标图像通过OTSU算法进行二值化处理以获得二值化图像；

3.根据权利要求2所述的一种基于模板匹配的OCR识别方法，其特征在于：所述S3步骤中，对所述经过预处理的目标图像的进行垂直方向投影，即对每一列的字符像素点数进行统计，获得表征目标图像的直方图，所述直方图中的波谷位置为字符间隔，根据字符间隔分割出单独字符图像。

4.根据权利要求3所述的一种基于模板匹配的OCR识别方法，其特征在于，所述S4步骤具体为：

5.根据权利要求4所述的一种基于模板匹配的OCR识别方法，其特征在于：所述S5步骤具体为：

S52：计算所述横竖笔画判断的位特征值，根据S51计算的像素点类别值，当判断为横的字符像素点个数大于判断为竖的字符像素点个数，则所述四级网格横竖笔画判断的位特征值记为0，反之，则所述四级网格横竖笔画判断的位特征值记为1；

S53：计算所述撇捺笔画判断的位特征值，根据S51计算的像素点类别值，当判断为撇的字符像素点个数大于判断为捺的字符像素点个数，则所述四级网格撇捺笔画判断的位特征值记为0，反之，则所述四级网格横竖笔画判断的位特征值记为1；

S54：计算所述形状判断的位特征值，当所述四级网格的宽大于高时，则所述四级网格的形状判断的位特征值记为0，反之，则所述四级网格的形状判断的位特征值记为1；

6.一种基于模板匹配的OCR识别系统，其特征在于，包括存储器和处理器，所述存储器存储有指令，所述指令适于由处理器加载并执行以下步骤：

S1：获取目标图像；

S2：对所述目标图像进行预处理；

S5：计算所有的所述四级网格图像的特征值，所述特征值包括：笔画方向的对比特征值，横竖笔画判断的位特征值，撇捺笔画判断的位特征值，大小判断的位特征值，形状判断的位特征值；

7.根据权利要求6所述的一种基于模板匹配的OCR识别系统，其特征在于，所述S2步骤具体为：

S22：对经过定位裁剪的目标图像进行转正处理；

S23：对经过转正处理的目标图像通过OTSU算法进行二值化处理获得二值化图像；

8.根据权利要求7所述的一种基于模板匹配的OCR识别系统，其特征在于：所述S3步骤中，对所述经过预处理的目标图像的进行垂直方向投影，对每一列的字符像素点数进行统计，获得表征目标图像的直方图，所述直方图中的波谷位置即为字符间隔，根据字符间隔分割出单独字符图像。

9.根据权利要求8所述的一种基于模板匹配的OCR识别系统，其特征在于，所述S4步骤具体为：

10.根据权利要求9所述的一种基于模板匹配的OCR识别系统，其特征在于：所述S5步骤具体为：