CN112364862A

CN112364862A - 一种基于直方图相似度的扰动变形汉字图片匹配的方法

Info

Publication number: CN112364862A
Application number: CN202011420541.1A
Authority: CN
Inventors: 任一支; 龚礼春; 姚晔; 袁理锋; 汪云路; 张祯; 王玉娟
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2020-12-08
Filing date: 2020-12-08
Publication date: 2021-02-12
Anticipated expiration: 2040-12-08
Also published as: CN112364862B

Abstract

本发明公开了一种基于直方图相似度的扰动变形汉字图片匹配的方法，包括：获取待匹配文本并转换为图像格式；对文本图像进行图像处理生成白底黑字图像；使用OCR技术识别出图像中每一个字符；从白底黑字图像中分割并提取出所有被识别汉字对应的字符图像；获取本地字库中对应被识别汉字的标准变形字图像，将标准变形字图像裁成标准白底黑字包围盒图像，作为变形字图像；使用图像切边方法切除字符图像多余的白边，生成标准的汉字包围盒图像，作为原图像；分别对原图像与所有变形字图像在水平与垂直方向上进行投影，生成投影直方图；运用相似度度量方法计算直方图相似度，得出最终的匹配结果。本发明有效提高了变形汉字图像匹配的准确率。

Description

一种基于直方图相似度的扰动变形汉字图片匹配的方法

技术领域

本发明属于扰动汉字的识别与匹配领域，具体涉及一种基于直方图相似度的扰动变形汉字图片匹配的方法。

背景技术

随着图像处理技术的发展与成熟，数字图像识别与匹配技术被广泛应用于人们的日常生活中。图像识别和匹配主要是用来判断两张图像是否完全相同或者一张图像中是否包含另一张图像内容的重要技术。当前图像识别与匹配主要采用基于模板和基于特征的两大类算法。基于模板的图像匹配算法可以利用模板图像的灰度值或形状到待匹配图像中搜索相似或者相同区域，从而实现图像匹配，该类匹配算法用于较为清晰的图像匹配中能达到较好的匹配结果。基于特征的图像匹配算法主要使用图像的点、线、面、骨架等特征，通过生成特征描述子向量，计算两幅图像特征向量的距离，从而获得匹配结果，该类算法的准确率高，应用较为广泛。

字符图像相对于人物与景物而言具有图像尺寸小，放大易失真的特点，因此模板匹配的方法并不适用于字符图像的匹配。与此同时，汉字扰动变形主要是通过微调汉字笔画的相对位置实现，其图像的总体特征并未得到显著的改变，因此想要通过特征匹配的方式，识别汉字字符图像中的细微差异，也是较为困难的。目前，关于扰动变形汉字图像识别和匹配的研究成果极少，有实质性突破的匹配算法也较少。

因此，如何设计一种准确、高效的扰动变形汉字识别匹配算法已经成为本领域亟待解决的问题。

发明内容

本发明主要目的在于提供一种汉字变形字图像匹配的方法，用于扰动汉字图像的识别与匹配领域。为了解决现有技术针对汉字变形字图像匹配准确度不高的难点，本发明提出了一种基于直方图相似度的扰动变形汉字图片匹配的方法，通过计算原图像和扰动汉字图片的投影直方图，运用直方图相似度度量方法，有效提高扰动变形汉字匹配的准确率。

为了实现上述目的，本发明采用如下方案：

一种基于直方图相似度的扰动变形汉字图片匹配的方法，包括以下步骤：

(1)获取嵌入了变形汉字的待匹配文本，并将待匹配的文本由文本格式转换为图像格式，得到文本图像，对文本图像进行预处理操作，生成白底黑字图像，使用OCR技术识别出白底黑字图像中对应的每一个字符编码，得到被识别汉字；

(2)利用字符图像分割方法，从白底黑字图像中分割并提取出所有被识别汉字对应的字符图像；

(3)根据字符编码映射关系从本地字库中获取对应被识别汉字的标准变形字图像，采用图像切边方法将标准变形字图像裁成标准白底黑字包围盒图像，作为变形字图像；

(4)使用图像切边方法切除字符图像多余的白边，生成标准的汉字包围盒图像，作为原图像；

(5)将原图像与变形字图像的大小缩放到相同尺寸；

(6)分别对原图像与其所有变形字图像在水平与垂直方向上进行投影，生成投影直方图，并归一化处理；

(7)运用相似度度量方法计算原图像和其所有变形字图像之间直方图相似度，通过对比相似度得出最终的匹配结果。

作为优选方案，所述步骤(1)包括：

对汉字扰动变形生成汉字对应的多个变体，保存于本地字库中，用本地字库的变形字替换文本中的对应汉字，生成嵌入了变形汉字的待匹配文本；通过屏幕截图、拍照或扫描将待匹配文本由文本格式转换为图像格式；对文本图像进行预处理操作，生成白底黑字图像；利用OCR技术识别出白底黑字图像中的每一个字符，并获取每个字符在文本图像中的坐标信息。

作为优选方案，所述步骤(2)中，

采用K-means聚类算法，优化OCR技术识别结果；

根据优化后计算出的字符图像宽度与高度比值的经验值，对白底黑字图像进行水平投影分割文本行；

对每一文本行进行垂直投影，通过经验值调整相邻字符图像间距阈值，准确分割出单个白底黑字字符图像。

作为优选方案，所述步骤(3)包括：

根据被识别汉字获得对应汉字图像的字符编码；

利用字符编码与标准变形汉字编码之间的映射关系，从本地字库中提取对应汉字的所有标准变形字图像；

采用图像切边算法将标准变形字图像裁成标准白底黑字包围盒图像，作为变形字图像。

作为优选方案，所述步骤(4)还包括：

根据字符的坐标信息，获得单个字符的图像，同时使用图像切边方法切除字符图像多余的白边，生成标准的汉字包围盒图像，作为原图像。

作为优选方案，所述步骤(5)包括：

采用Lanczos图像插值算法将原图像与变形字图像的大小缩放到相同尺寸。

作为优选方案，所述步骤(6)包括：

计算原图像在水平方向与垂直方向的投影直方图，并归一化处理；

计算所有变形字图像在水平方向与垂直方向的投影直方图，并归一化处理。

作为优选方案，所述步骤(7)包括：

依次获取变形字图像的水平方向与垂直方向的投影直方图，运用相似度度量方法计算变形字图像与原图像在水平方向和垂直方向的投影直方图的相似度；

将相似度进行比较，相似度最大的为最终匹配结果。

本发明与现有技术相比，有益效果是：本发明利用直方图相似度的比较，获取扰动变形汉字图片匹配的结果，有效提高了变形汉字图像匹配的准确率和效率。

附图说明

图1为本发明实施例的基于直方图相似度的扰动变形汉字图片匹配的方法的流程图；

图2为本发明实施例的对“的”字扰动变形的示意图；

图3为本发明实施例的文本图像的水平投影直方图的示意图；

图4为本发明实施例的文本图像的垂直投影直方图的示意图；

图5为本发明实施例的“法”字在水平、垂直投影方向上的示意图；

图6为本发明实施例的“法”字的分割图像(虚线)与标准字图像(实线)在垂直投影直方图对比示意图。

图7为本发明实施例的“法”字的分割图像(虚线)与标准字图像(实线)在水平投影直方图对比示意图。

具体实施方式

为了更好的理解本发明提供的方法，下面结合附图对本发明具体实施例进行清楚、完整的描述。应当明确，所描述的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

如图1所示，本发明实施例的基于直方图相似度的扰动变形汉字图片匹配的方法，包括以下步骤：

步骤S1，获取待匹配的文本。即获取嵌入了变形汉字的待匹配文本。

具体地，通过微调汉字笔画的相对位置对汉字进行扰动变形，生成汉字对应的多个变体，如图2所示的汉字“的”，保存于本地字库中；将本地字库的变形字通过编码映射的方式替换文本中的对应汉字，生成嵌入了变形汉字的待匹配文本。

步骤S2，待匹配文本转为图像格式。即将待匹配的文本由文本格式转换为图像格式，得到文本图像。

具体地，将步骤S1获得的待匹配文本是以文本格式保存的，为方便后续使用图像匹配方法，需要将嵌入了变形汉字的待匹配文本转换为图像格式。目前，将文本转为文本图像可以使用网上现有的主流的一些格式转换工具，或者利用屏幕截图、扫描以及电子设备拍照的方式将文本转为文本图像。

步骤S3，文本图像预处理操作。即对文本图像进行图像预处理操作，生成白底黑字图像。

具体地，由于文本转换为文本图像的过程中，电子设备会受到一定的外界噪声干扰，使得生成的文本图像上会存在一定的噪点，并引发图像的失真。因此，需要对文本图像进行预处理操作是必要的。针对不同的转换方式，采用不同的图像预处理操作，能达到较好的处理效果。

由于屏幕截图生成的文本图像其噪声较为少，采用大津算法OSTU对其进行二值化处理。OSTU作为一种全局阈值法，在图像光照不均时效果较差，会存在部分的图像区域大面积错误边缘现象，在进行处理时参照自适应阈值二值化的方法对OSTU算法进行改进，具体的采用图像分块的方法，为多个图像分块分别取OSTU阈值，从而使得光照不均的图像也能得到较好的文字背景分离效果。

针对扫描方式生成的文本图像，图像中不仅噪点多，且字符笔画之间还会存在断开、粘连以及偏移现象，因此对文本图像二值化处理的基础上，还要对其进行均值滤波处理，均值滤波的卷积核如下式所示：

W、H为卷积核的宽度和高度，该卷积核的作用是在覆盖的像素中取平均值，再进行滤波处理后，还需进行膨胀、腐蚀等图像形态学操作，以达到较好的处理效果。

针对电子设备拍照生成的文本图像，由于会受到拍摄角度以及拍摄现场光照强度的影响，因此在预处理的过程中使用霍夫变换法对图像进行矫正，并采用图像锐化方法降低光照对图像的影响。

步骤S4，OCR识别文本图像中每个字符。即使用OCR技术识别出白底黑字图像中对应的每一个字符，得到被识别汉字。

具体地，将步骤S3图像预处理操作生成的白底黑字图像输入到OCR系统中，通过OCR技术识别出白底黑字图像中的每一个字符，得到被识别的汉字，并获取单个汉字在文本图像中的坐标信息。

步骤S5，图像分割技术分割文本图像中每个汉字字符图像。即利用字符图像分割方法，从白底黑字图像中分割并提取出所有被识别汉字对应的字符图像；

具体地，字符图像分割方法目前使用较多的算法是投影法。

首先，对步骤S3生成的白底黑字图像进行水平投影，获得文本图像的水平投影直方图，如图3所示，通过对直方图的分割达到文本图像行切分的效果；接着对每个文本行进行垂直投影，如图4所示，从而确定单个汉字起始位置。一般而言，上下结构的汉字就能被较为准确地分割出来，而左右结构或者左中右结构的汉字，由于部件之间会存在一定的空隙，导致不能被完整的分割。为了优化分割算法，采用K-means聚类算法，优化OCR技术识别结果；即采用聚类分析的方法，对嵌入使用的字体进行取样，对样本的宽高进行分析，获得样本的宽度、高度，统计直方图，并计算宽高比，使用K-means聚类算法动态确定字符分割的阈值，从而达到更好的分割效果。具体地，根据优化后计算出的字符图像宽度与高度比值的经验值，对白底黑字图像进行水平投影分割文本行；对每一文本行进行垂直投影，通过经验值调整相邻字符图像间距阈值，准确分割出单个白底黑字字符图像。

步骤S6，字符编码映射关系获取本地字库中对应汉字的标准变形字图像。即根据字符编码映射关系获取本地字库中对应被识别汉字的标准变形字图像，采用图像切边方法将标准变形字图像裁成标准白字黑字包围盒图像，作为变形字图像。

具体地，根据OCR技术的识别结果可以获得文本图像中每个汉字图像的字符编码；接着利用字符编码与标准变形汉字编码之间的映射关系，从本地字库中提取对应汉字的所有标准变形字图像，采用图像切边方法将标准变形字图像裁成标准白字黑字包围盒图像，作为变形字图像。

步骤S7，字符图像切边处理生成白底黑字包围盒图像。即使用图像切边方法切除字符图像多余的白边，生成标准的汉字包围盒图像，作为原图像。

具体地，无论是投影法分割出的字符图像还是字库中获取的标准变形字图像，均是背景为白色，字符为黑色的图像。这些图像四周均可能存在一定的白边，导致后续字体缩放不能较好的对准。为了提高匹配准确率，使用字符图像切边算法，切除图像上下左右多余的白边，生成标准的白底黑字包围盒图像，作为原图像。

步骤S8，调整分割字符图像和标准变形字图像大小到相同尺寸。即将原图像与变形字图像的大小缩放到相同尺寸。

具体地，采用Lanczos图像插值算法，将分割的字符图像和标准的变形字图像大小缩放到相同大小，双立方插值算法的公式如下所示：

其中，f(x,y)是一个三次多项式，i,j∈[0,3)，x和y代表函数f(x,y)上的一个点，a_ij为权重系数。

步骤S9，计算分割图像与变形字图像水平和垂直方向投影直方图，并归一化直方图。即：分别对原图像与其所有变形字图像在水平与垂直方向上进行投影，生成投影直方图，并归一化处理。

具体地，由于单个汉字投影反应的是笔画在一个方向上整体的位置信息，而字形设计时采用尽量挪动水平和垂直笔画的方法，所以不同字形间的水平和垂直投影必定会有部分不同。以“法”字为例，计算该字在水平与垂直方向上的直方图，并归一化处理，如图5所示。

S10，运用相似度度量法度量直方图相似度。即运用相似度度量方法计算原图像和其所有变形字图像之间直方图相似度。

具体地，将分割后字符图像(即原图像)与标准变形字图像的投影直方图归一化处理后，使用相关性比较法计算直方图似度。图6、图7分别为输入分割字符图像(虚线)与变形字形(实线)对比中垂直、水平投影的差异，可见投影能一定程度上反应笔画的移动。

S11，根据计算得出的直方图相似度值，得出匹配结果。

基于相关性的比较方法，相关性系数绝对值取值为0-1，水平和垂直投影两个值总体偏差的影响较小，且直方图整体高度差对相关性系数计算结果影响较小。在相关性系数算法下，综合评分取值最大的即为最佳的匹配结果。

以上所述仅是对本发明的优选实施例及原理进行了详细说明，对本领域的普通技术人员而言，依据本发明提供的思想，在具体实施方式上会有改变之处，而这些改变也应视为本发明的保护范围。

Claims

1.一种基于直方图相似度的扰动变形汉字图片匹配的方法，其特征在于，包括以下步骤：

(5)将原图像与变形字图像的大小缩放到相同尺寸；

2.如权利要求1所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法，其特征在于，所述步骤(1)包括：

3.如权利要求2所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法，其特征在于，所述步骤(2)中，

采用K-means聚类算法，优化OCR技术识别结果；

4.如权利要求3所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法，其特征在于，所述步骤(3)包括：

根据被识别汉字获得对应汉字图像的字符编码；

5.如权利要求4所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法，其特征在于，所述步骤(4)还包括：

6.如权利要求5所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法，其特征在于，所述步骤(5)包括：

7.如权利要求6所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法，其特征在于，所述步骤(6)包括：

8.如权利要求7所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法，其特征在于，所述步骤(7)包括：

将相似度进行比较，相似度最大的为最终匹配结果。