CN112686265A

CN112686265A - 一种基于层级轮廓提取的象形文字分割方法

Info

Publication number: CN112686265A
Application number: CN202110016231.1A
Authority: CN
Inventors: 庄建军; 黎文斯; 申彤; 刘荪荟; 李旭坤; 汪继康; 张志俭; 葛中芹; 张鑫; 杨继琼
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2021-01-07
Filing date: 2021-01-07
Publication date: 2021-04-20
Anticipated expiration: 2041-01-07
Also published as: CN112686265B

Abstract

本发明公开了一种基于层级轮廓提取的象形文字分割方法，首先通过一层高斯滤波器、OTSU二值化和一层双边滤波器对图片预处理，能够有效地去除噪声，并且保留文字边缘信息，可以给后续步骤提供良好的预处理图片；然后通过对轮廓包含的矩形区域是否含有外围矩形的判断，将提取出的轮廓分层，从而抑制文字内部轮廓的输出；接着通过计算轮廓所包含的矩形区域面积大小来设定阈值，只有大于阈值的矩形才包含待输出的文字，以此来抑制噪声点的输出；最后通过坐标排序的方式来顺序输出分割的文字；本方法最终可以在各种角度和不同光线下高效准确地分割出象形文字经书上的文字，具有良好的泛化性和鲁棒性。

Description

一种基于层级轮廓提取的象形文字分割方法

技术领域

本发明涉及文字分割技术领域，主要涉及一种基于层级轮廓提取的象形文字分割方法。

背景技术

东巴古籍由具有独特图形及发音的东巴象形文写成，是当今世界上唯一还在使用的象形文字，东巴文化保护迫在眉睫。

近年来，譬如OCR等文字分割技术相对成熟，但这些技术大多针对标准印刷文字，但对于东巴这种象形文字并没有好的解决方案，并且在经书这种复杂场景下的分割任务是更加困难的。

发明内容

发明目的：本发明针对上述背景技术中存在的问题，本发明提供了一种基于层级轮廓提取的象形文字分割方法，采用高斯滤波、OSTU自适应阈值法进行二值化处理、双边滤波对图片进行预处理，然后基于层级轮廓提取获得象形文字轮廓，最后按照文字阅读顺序进行输出排列。

技术方案：为实现上述目的，本发明采用的技术方案为：

一种基于层级轮廓提取的象形文字分割方法，其特征在于，包括以下步骤：

步骤S1、图片预处理；

步骤S1.1、获取原始图片，读取原图片的灰度图，将灰度图输入至高斯滤波器进行滤波处理；

步骤S1.2、采用OTSU自适应阈值法对所述步骤S1.1获取的图像进行二值化处理；

步骤S1.3、将所述二值化处理后的图像输入至双边滤波器，完成图片预处理；

步骤S2、层级轮廓提取；

步骤S2.1、扫描图片中的每一个像素点，以像素点为中心，判断周围是否存在其他像素点；当存在其他像素点时，将当前像素点标记为已探索点，并以新探测的像素点为中心重复探索，直至整个轮廓都标记为已探索点；将所有已探索点中坐标值(x,y)最大值点和最小值点作为对角点，连接形成矩形区域取出，完成轮廓检测，并将该矩形区域保存到待输出集合中；

步骤S2.2、对于待输出集合中的轮廓，当矩形区域外围没有更大的矩形区域时，则将该轮廓作为第一层级轮廓，否则作为第二层级轮廓；舍弃所有第二层轮廓，只保留第一层轮廓；

步骤S2.3、计算每个第一层轮廓的矩形区域面积，选取阈值res＝0.015*(h*w)，其中h为原始图像的高、w为原始图像的宽；当矩形区域面积大于阈值res时，保留该轮廓并输出，当矩形区域面积小于等于阈值res时，舍弃该轮廓；

步骤S3、将步骤S2输出的矩形轮廓按照象形文字阅读顺序依次输出。

进一步地，所述步骤S1.1中高斯滤波器函数如下：

其中所述高斯滤波器核为3*3；(x、y)代表相对于核中心周围8个像素点的相对坐标，σ代表高斯核函数在x与y方向的标准偏差，取值为0.95。

进一步地，所述步骤S1.2中将大于阈值的像素点设置为255，小于阈值的设置为0。

进一步地，所述步骤S1.3中双边滤波器如下：

其中g(i,j)代表输出点，S(i,j)指以(i,j)为中心的(2N+1)(2N+1)的大小的范围，N代表核直径，取值为5；f(k,l)代表输入点，w(i,j,k,l)代表两个高斯函数计算结果的乘积，且w满足w＝ws*wr，具体地：

其中σ_r与σ_s取值均为75。

进一步地，所述步骤S3中输出文字的顺序具体如下：

比较矩形轮廓的左上角点的位置坐标，分别将x与y坐标分别从小到大排序；固定x值，将y值从小到大保存相应矩形轮廓，然后按x值从小到大的顺序重复上述过程，最终获得排序后的分割图。

有益效果：本发明具备以下优点：

本方法通过一层高斯滤波器、OTSU二值化和一层双边滤波器对图片预处理，能够有效地去除噪声，并且保留文字边缘信息，可以给后续步骤提供良好的预处理图片；本方法通过对轮廓包含的矩形区域是否含有外围矩形的判断，将提取出的轮廓分层，从而抑制文字内部轮廓的输出；本方法通过计算轮廓所包含的矩形区域面积大小来设定阈值，只有大于阈值的矩形才包含待输出的文字，以此来抑制噪声点的输出；本方法通过坐标排序的方式来顺序输出分割的文字。本方法最终可以在各种角度和不同光线下高效准确地分割出象形文字经书上的单个文字，具有良好的泛化性和鲁棒性。

附图说明

图1是本发明提供的基于层级轮廓提取的象形文字分割方法流程图；

图2是本发明实施例中提供的三张象形文字原始图片；

图3是本发明实施例中经过预处理后的输出图片；

图4是本发明实施例中最后输出的分割文字图片。

具体实施方式

下面结合附图对本发明作更进一步的说明。

如图1所示的一种基于层级轮廓提取的象形文字分割方法，包括以下步骤：

步骤S1、图片预处理。

步骤S1.1、如图2所示，通过拍照或者扫描的方式获取原始图片，读取原图片的灰度图，将灰度图输入至高斯滤波器进行滤波处理。

具体地，将灰度图通过一层核为3*3、σ为0.95的高斯滤波器，目的是对图像平滑处理，削弱部分噪声。其中二维高斯函数表达式如下所示：

其中(x、y)代表相对于核中心周围8个像素点的相对坐标，σ代表高斯核函数在x与y方向的标准偏差。

步骤S1.2、采用OTSU自适应阈值法对所述步骤S1.1获取的图像进行二值化处理。将大于阈值的像素点设置为255，小于阈值的设置为0。自适应指使用原生OTSU算法，无需人为设定阈值，这样能更好地处理经书这种复杂场景下的原始图片。

步骤S1.3、将所述二值化处理后的图像输入至双边滤波器，完成图片预处理，目的是在进一步削弱噪声的同时保留文字的边缘信息。具体地，双边滤波器如下：

其中σ_r与σ_s取值均为75。预处理完成后的图片如图3所示。

步骤S2、层级轮廓提取，包括轮廓提取并分层、抑制低层级轮廓输出和抑制高层级噪声输出。

步骤S2.1、扫描图片中的每一个像素点，以像素点为中心，判断周围是否存在其他像素点；当存在其他像素点时，将当前像素点标记为已探索点，并以新探测的像素点为中心重复探索，直至整个轮廓都标记为已探索点；将所有已探索点中坐标值(x,y)最大值点和最小值点作为对角点，连接形成矩形区域取出，完成轮廓检测，并将该矩形区域保存到待输出集合中。

步骤S2.2、对于待输出集合中的轮廓，当矩形区域外围没有更大的矩形区域时，则将该轮廓作为第一层级轮廓，否则作为第二层级轮廓；舍弃所有第二层轮廓，只保留第一层轮廓，达到抑制文字内部其他第二层级轮廓输出的目的。

步骤S2.3、步骤S2.1所得到的轮廓除了包含文字本身外，还会包含文字外的噪声点，这部分噪声也会被识别为一个轮廓，由于这部分轮廓和文字一样是独立的，其外围没有更大的矩形轮廓，会被定义为第一层级轮廓，因此无法通过步骤S2.2去除。为抑制这部分噪声的输出，还需计算每个轮廓矩形区域的面积，虽然噪声比较大，但是其矩形区域面积对于文字来说是很小的，计算每个第一层轮廓的矩形区域面积，选取阈值res＝0.015*(h*w)，其中h为原始图像的高、w为原始图像的宽；当矩形区域面积大于阈值res时，保留该轮廓并输出，当矩形区域面积小于等于阈值res时，舍弃该轮廓，达到抑制高层级噪声输出的目的。

步骤S3、将步骤S2输出的矩形轮廓按照象形文字阅读顺序依次输出。这里的顺序为从左至右、从上至下，本发明采用的方法是比较矩形轮廓的左上角点的位置坐标，将x与y坐标分别从小到大排序；固定x值，将y值从小到大保存相应矩形轮廓，然后按x值从小到大的顺序重复上述过程，最终获得排序后的分割图。分割结果如图4所示。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于层级轮廓提取的象形文字分割方法，其特征在于，包括以下步骤：

步骤S1、图片预处理；

步骤S2、层级轮廓提取；

2.根据权利要求1所述的一种基于层级轮廓提取的象形文字分割方法，其特征在于，所述步骤S1.1中高斯滤波器函数如下：

3.根据权利要求1所述的一种基于层级轮廓提取的象形文字分割方法，其特征在于，所述步骤S1.2中将大于阈值的像素点设置为255，小于阈值的设置为0。

4.根据权利要求1所述的一种基于层级轮廓提取的象形文字分割方法，其特征在于，所述步骤S1.3中双边滤波器如下：

其中σ_r与σ_s取值均为75。

5.根据权利要求1所述的一种基于层级轮廓提取的象形文字分割方法，其特征在于，所述步骤S3中输出文字的顺序具体如下：