CN112686265A - 一种基于层级轮廓提取的象形文字分割方法 - Google Patents

一种基于层级轮廓提取的象形文字分割方法 Download PDF

Info

Publication number
CN112686265A
CN112686265A CN202110016231.1A CN202110016231A CN112686265A CN 112686265 A CN112686265 A CN 112686265A CN 202110016231 A CN202110016231 A CN 202110016231A CN 112686265 A CN112686265 A CN 112686265A
Authority
CN
China
Prior art keywords
outline
point
output
pictograph
contour
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110016231.1A
Other languages
English (en)
Other versions
CN112686265B (zh
Inventor
庄建军
黎文斯
申彤
刘荪荟
李旭坤
汪继康
张志俭
葛中芹
张鑫
杨继琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN202110016231.1A priority Critical patent/CN112686265B/zh
Publication of CN112686265A publication Critical patent/CN112686265A/zh
Application granted granted Critical
Publication of CN112686265B publication Critical patent/CN112686265B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于层级轮廓提取的象形文字分割方法,首先通过一层高斯滤波器、OTSU二值化和一层双边滤波器对图片预处理,能够有效地去除噪声,并且保留文字边缘信息,可以给后续步骤提供良好的预处理图片;然后通过对轮廓包含的矩形区域是否含有外围矩形的判断,将提取出的轮廓分层,从而抑制文字内部轮廓的输出;接着通过计算轮廓所包含的矩形区域面积大小来设定阈值,只有大于阈值的矩形才包含待输出的文字,以此来抑制噪声点的输出;最后通过坐标排序的方式来顺序输出分割的文字;本方法最终可以在各种角度和不同光线下高效准确地分割出象形文字经书上的文字,具有良好的泛化性和鲁棒性。

Description

一种基于层级轮廓提取的象形文字分割方法
技术领域
本发明涉及文字分割技术领域,主要涉及一种基于层级轮廓提取的象形文字分割方法。
背景技术
东巴古籍由具有独特图形及发音的东巴象形文写成,是当今世界上唯一还在使用的象形文字,东巴文化保护迫在眉睫。
近年来,譬如OCR等文字分割技术相对成熟,但这些技术大多针对标准印刷文字,但对于东巴这种象形文字并没有好的解决方案,并且在经书这种复杂场景下的分割任务是更加困难的。
发明内容
发明目的:本发明针对上述背景技术中存在的问题,本发明提供了一种基于层级轮廓提取的象形文字分割方法,采用高斯滤波、OSTU自适应阈值法进行二值化处理、双边滤波对图片进行预处理,然后基于层级轮廓提取获得象形文字轮廓,最后按照文字阅读顺序进行输出排列。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于层级轮廓提取的象形文字分割方法,其特征在于,包括以下步骤:
步骤S1、图片预处理;
步骤S1.1、获取原始图片,读取原图片的灰度图,将灰度图输入至高斯滤波器进行滤波处理;
步骤S1.2、采用OTSU自适应阈值法对所述步骤S1.1获取的图像进行二值化处理;
步骤S1.3、将所述二值化处理后的图像输入至双边滤波器,完成图片预处理;
步骤S2、层级轮廓提取;
步骤S2.1、扫描图片中的每一个像素点,以像素点为中心,判断周围是否存在其他像素点;当存在其他像素点时,将当前像素点标记为已探索点,并以新探测的像素点为中心重复探索,直至整个轮廓都标记为已探索点;将所有已探索点中坐标值(x,y)最大值点和最小值点作为对角点,连接形成矩形区域取出,完成轮廓检测,并将该矩形区域保存到待输出集合中;
步骤S2.2、对于待输出集合中的轮廓,当矩形区域外围没有更大的矩形区域时,则将该轮廓作为第一层级轮廓,否则作为第二层级轮廓;舍弃所有第二层轮廓,只保留第一层轮廓;
步骤S2.3、计算每个第一层轮廓的矩形区域面积,选取阈值res=0.015*(h*w),其中h为原始图像的高、w为原始图像的宽;当矩形区域面积大于阈值res时,保留该轮廓并输出,当矩形区域面积小于等于阈值res时,舍弃该轮廓;
步骤S3、将步骤S2输出的矩形轮廓按照象形文字阅读顺序依次输出。
进一步地,所述步骤S1.1中高斯滤波器函数如下:
Figure BDA0002886864770000021
其中所述高斯滤波器核为3*3;(x、y)代表相对于核中心周围8个像素点的相对坐标,σ代表高斯核函数在x与y方向的标准偏差,取值为0.95。
进一步地,所述步骤S1.2中将大于阈值的像素点设置为255,小于阈值的设置为0。
进一步地,所述步骤S1.3中双边滤波器如下:
Figure BDA0002886864770000022
其中g(i,j)代表输出点,S(i,j)指以(i,j)为中心的(2N+1)(2N+1)的大小的范围,N代表核直径,取值为5;f(k,l)代表输入点,w(i,j,k,l)代表两个高斯函数计算结果的乘积,且w满足w=ws*wr,具体地:
Figure BDA0002886864770000023
Figure BDA0002886864770000024
其中σr与σs取值均为75。
进一步地,所述步骤S3中输出文字的顺序具体如下:
比较矩形轮廓的左上角点的位置坐标,分别将x与y坐标分别从小到大排序;固定x值,将y值从小到大保存相应矩形轮廓,然后按x值从小到大的顺序重复上述过程,最终获得排序后的分割图。
有益效果:本发明具备以下优点:
本方法通过一层高斯滤波器、OTSU二值化和一层双边滤波器对图片预处理,能够有效地去除噪声,并且保留文字边缘信息,可以给后续步骤提供良好的预处理图片;本方法通过对轮廓包含的矩形区域是否含有外围矩形的判断,将提取出的轮廓分层,从而抑制文字内部轮廓的输出;本方法通过计算轮廓所包含的矩形区域面积大小来设定阈值,只有大于阈值的矩形才包含待输出的文字,以此来抑制噪声点的输出;本方法通过坐标排序的方式来顺序输出分割的文字。本方法最终可以在各种角度和不同光线下高效准确地分割出象形文字经书上的单个文字,具有良好的泛化性和鲁棒性。
附图说明
图1是本发明提供的基于层级轮廓提取的象形文字分割方法流程图;
图2是本发明实施例中提供的三张象形文字原始图片;
图3是本发明实施例中经过预处理后的输出图片;
图4是本发明实施例中最后输出的分割文字图片。
具体实施方式
下面结合附图对本发明作更进一步的说明。
如图1所示的一种基于层级轮廓提取的象形文字分割方法,包括以下步骤:
步骤S1、图片预处理。
步骤S1.1、如图2所示,通过拍照或者扫描的方式获取原始图片,读取原图片的灰度图,将灰度图输入至高斯滤波器进行滤波处理。
具体地,将灰度图通过一层核为3*3、σ为0.95的高斯滤波器,目的是对图像平滑处理,削弱部分噪声。其中二维高斯函数表达式如下所示:
Figure BDA0002886864770000031
其中(x、y)代表相对于核中心周围8个像素点的相对坐标,σ代表高斯核函数在x与y方向的标准偏差。
步骤S1.2、采用OTSU自适应阈值法对所述步骤S1.1获取的图像进行二值化处理。将大于阈值的像素点设置为255,小于阈值的设置为0。自适应指使用原生OTSU算法,无需人为设定阈值,这样能更好地处理经书这种复杂场景下的原始图片。
步骤S1.3、将所述二值化处理后的图像输入至双边滤波器,完成图片预处理,目的是在进一步削弱噪声的同时保留文字的边缘信息。具体地,双边滤波器如下:
Figure BDA0002886864770000041
其中g(i,j)代表输出点,S(i,j)指以(i,j)为中心的(2N+1)(2N+1)的大小的范围,N代表核直径,取值为5;f(k,l)代表输入点,w(i,j,k,l)代表两个高斯函数计算结果的乘积,且w满足w=ws*wr,具体地:
Figure BDA0002886864770000042
Figure BDA0002886864770000043
其中σr与σs取值均为75。预处理完成后的图片如图3所示。
步骤S2、层级轮廓提取,包括轮廓提取并分层、抑制低层级轮廓输出和抑制高层级噪声输出。
步骤S2.1、扫描图片中的每一个像素点,以像素点为中心,判断周围是否存在其他像素点;当存在其他像素点时,将当前像素点标记为已探索点,并以新探测的像素点为中心重复探索,直至整个轮廓都标记为已探索点;将所有已探索点中坐标值(x,y)最大值点和最小值点作为对角点,连接形成矩形区域取出,完成轮廓检测,并将该矩形区域保存到待输出集合中。
步骤S2.2、对于待输出集合中的轮廓,当矩形区域外围没有更大的矩形区域时,则将该轮廓作为第一层级轮廓,否则作为第二层级轮廓;舍弃所有第二层轮廓,只保留第一层轮廓,达到抑制文字内部其他第二层级轮廓输出的目的。
步骤S2.3、步骤S2.1所得到的轮廓除了包含文字本身外,还会包含文字外的噪声点,这部分噪声也会被识别为一个轮廓,由于这部分轮廓和文字一样是独立的,其外围没有更大的矩形轮廓,会被定义为第一层级轮廓,因此无法通过步骤S2.2去除。为抑制这部分噪声的输出,还需计算每个轮廓矩形区域的面积,虽然噪声比较大,但是其矩形区域面积对于文字来说是很小的,计算每个第一层轮廓的矩形区域面积,选取阈值res=0.015*(h*w),其中h为原始图像的高、w为原始图像的宽;当矩形区域面积大于阈值res时,保留该轮廓并输出,当矩形区域面积小于等于阈值res时,舍弃该轮廓,达到抑制高层级噪声输出的目的。
步骤S3、将步骤S2输出的矩形轮廓按照象形文字阅读顺序依次输出。这里的顺序为从左至右、从上至下,本发明采用的方法是比较矩形轮廓的左上角点的位置坐标,将x与y坐标分别从小到大排序;固定x值,将y值从小到大保存相应矩形轮廓,然后按x值从小到大的顺序重复上述过程,最终获得排序后的分割图。分割结果如图4所示。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种基于层级轮廓提取的象形文字分割方法,其特征在于,包括以下步骤:
步骤S1、图片预处理;
步骤S1.1、获取原始图片,读取原图片的灰度图,将灰度图输入至高斯滤波器进行滤波处理;
步骤S1.2、采用OTSU自适应阈值法对所述步骤S1.1获取的图像进行二值化处理;
步骤S1.3、将所述二值化处理后的图像输入至双边滤波器,完成图片预处理;
步骤S2、层级轮廓提取;
步骤S2.1、扫描图片中的每一个像素点,以像素点为中心,判断周围是否存在其他像素点;当存在其他像素点时,将当前像素点标记为已探索点,并以新探测的像素点为中心重复探索,直至整个轮廓都标记为已探索点;将所有已探索点中坐标值(x,y)最大值点和最小值点作为对角点,连接形成矩形区域取出,完成轮廓检测,并将该矩形区域保存到待输出集合中;
步骤S2.2、对于待输出集合中的轮廓,当矩形区域外围没有更大的矩形区域时,则将该轮廓作为第一层级轮廓,否则作为第二层级轮廓;舍弃所有第二层轮廓,只保留第一层轮廓;
步骤S2.3、计算每个第一层轮廓的矩形区域面积,选取阈值res=0.015*(h*w),其中h为原始图像的高、w为原始图像的宽;当矩形区域面积大于阈值res时,保留该轮廓并输出,当矩形区域面积小于等于阈值res时,舍弃该轮廓;
步骤S3、将步骤S2输出的矩形轮廓按照象形文字阅读顺序依次输出。
2.根据权利要求1所述的一种基于层级轮廓提取的象形文字分割方法,其特征在于,所述步骤S1.1中高斯滤波器函数如下:
Figure FDA0002886864760000011
其中所述高斯滤波器核为3*3;(x、y)代表相对于核中心周围8个像素点的相对坐标,σ代表高斯核函数在x与y方向的标准偏差,取值为0.95。
3.根据权利要求1所述的一种基于层级轮廓提取的象形文字分割方法,其特征在于,所述步骤S1.2中将大于阈值的像素点设置为255,小于阈值的设置为0。
4.根据权利要求1所述的一种基于层级轮廓提取的象形文字分割方法,其特征在于,所述步骤S1.3中双边滤波器如下:
Figure FDA0002886864760000021
其中g(i,j)代表输出点,S(i,j)指以(i,j)为中心的(2N+1)(2N+1)的大小的范围,N代表核直径,取值为5;f(k,l)代表输入点,w(i,j,k,l)代表两个高斯函数计算结果的乘积,且w满足w=ws*wr,具体地:
Figure FDA0002886864760000022
Figure FDA0002886864760000023
其中σr与σs取值均为75。
5.根据权利要求1所述的一种基于层级轮廓提取的象形文字分割方法,其特征在于,所述步骤S3中输出文字的顺序具体如下:
比较矩形轮廓的左上角点的位置坐标,分别将x与y坐标分别从小到大排序;固定x值,将y值从小到大保存相应矩形轮廓,然后按x值从小到大的顺序重复上述过程,最终获得排序后的分割图。
CN202110016231.1A 2021-01-07 2021-01-07 一种基于层级轮廓提取的象形文字分割方法 Active CN112686265B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110016231.1A CN112686265B (zh) 2021-01-07 2021-01-07 一种基于层级轮廓提取的象形文字分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110016231.1A CN112686265B (zh) 2021-01-07 2021-01-07 一种基于层级轮廓提取的象形文字分割方法

Publications (2)

Publication Number Publication Date
CN112686265A true CN112686265A (zh) 2021-04-20
CN112686265B CN112686265B (zh) 2024-07-26

Family

ID=75456079

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110016231.1A Active CN112686265B (zh) 2021-01-07 2021-01-07 一种基于层级轮廓提取的象形文字分割方法

Country Status (1)

Country Link
CN (1) CN112686265B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114066917A (zh) * 2021-11-11 2022-02-18 深圳市云鼠科技开发有限公司 一种清扫方法、装置、电子设备和存储介质
CN115187996A (zh) * 2022-09-09 2022-10-14 中电科新型智慧城市研究院有限公司 语义识别方法、装置、终端设备和存储介质
CN115331232A (zh) * 2022-07-08 2022-11-11 黑龙江省科学院智能制造研究所 一种满文历史文档图像列分割方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003189090A (ja) * 2001-12-13 2003-07-04 Fuji Xerox Co Ltd 画像処理装置及び画像処理方法、画像処理プログラム、記憶媒体
CN105118036A (zh) * 2015-08-26 2015-12-02 广西小草信息产业有限责任公司 一种对破损图像进行修复的方法和系统
CN107895376A (zh) * 2017-12-11 2018-04-10 福州大学 基于改进Canny算子和轮廓面积阈值的太阳能电池板识别方法
CN109409378A (zh) * 2018-10-17 2019-03-01 北京信息科技大学 一种纳西东巴经书的数字化处理方法
CN109961430A (zh) * 2018-12-13 2019-07-02 长春理工大学 一种金具表面锈蚀区域提取方法
WO2019169772A1 (zh) * 2018-03-06 2019-09-12 平安科技(深圳)有限公司 图片处理方法、电子装置及存储介质
CN111046862A (zh) * 2019-12-05 2020-04-21 北京嘉楠捷思信息技术有限公司 一种字符分割方法、装置以及计算机可读存储介质
CN111325270A (zh) * 2020-02-19 2020-06-23 南京大学 一种基于模板匹配和bp神经网络的东巴文识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003189090A (ja) * 2001-12-13 2003-07-04 Fuji Xerox Co Ltd 画像処理装置及び画像処理方法、画像処理プログラム、記憶媒体
CN105118036A (zh) * 2015-08-26 2015-12-02 广西小草信息产业有限责任公司 一种对破损图像进行修复的方法和系统
CN107895376A (zh) * 2017-12-11 2018-04-10 福州大学 基于改进Canny算子和轮廓面积阈值的太阳能电池板识别方法
WO2019169772A1 (zh) * 2018-03-06 2019-09-12 平安科技(深圳)有限公司 图片处理方法、电子装置及存储介质
CN109409378A (zh) * 2018-10-17 2019-03-01 北京信息科技大学 一种纳西东巴经书的数字化处理方法
CN109961430A (zh) * 2018-12-13 2019-07-02 长春理工大学 一种金具表面锈蚀区域提取方法
CN111046862A (zh) * 2019-12-05 2020-04-21 北京嘉楠捷思信息技术有限公司 一种字符分割方法、装置以及计算机可读存储介质
CN111325270A (zh) * 2020-02-19 2020-06-23 南京大学 一种基于模板匹配和bp神经网络的东巴文识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ABEDIN, MZ;NATH, AC;DHAR, P: ""License Plate Recognition System Based On Contour Properties and Deep Learning Model"", 《 2017 IEEE REGION 10 HUMANITARIAN TECHNOLOGY CONFERENCE (R10-HTC)》, 26 March 2018 (2018-03-26), pages 590 - 593 *
于晓海;张阳;须颖;: "一种改进自适应阈值的Canny算法", 机械与电子, no. 01, 24 January 2020 (2020-01-24), pages 6 - 9 *
李德胜;孟祥伟;刘光明;张颢;刘磊;: "基于水平集的SAR图像预处理方法", 火控雷达技术, no. 03, 25 September 2015 (2015-09-25), pages 41 - 45 *
王红艳;严云洋;: "火灾图像边缘检测和轮廓提取算法研究", 科技信息(学术研究), no. 35, 15 December 2007 (2007-12-15), pages 108 - 109 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114066917A (zh) * 2021-11-11 2022-02-18 深圳市云鼠科技开发有限公司 一种清扫方法、装置、电子设备和存储介质
CN115331232A (zh) * 2022-07-08 2022-11-11 黑龙江省科学院智能制造研究所 一种满文历史文档图像列分割方法
CN115331232B (zh) * 2022-07-08 2023-08-18 黑龙江省科学院智能制造研究所 一种满文历史文档图像列分割方法
CN115187996A (zh) * 2022-09-09 2022-10-14 中电科新型智慧城市研究院有限公司 语义识别方法、装置、终端设备和存储介质
CN115187996B (zh) * 2022-09-09 2023-01-06 中电科新型智慧城市研究院有限公司 语义识别方法、装置、终端设备和存储介质

Also Published As

Publication number Publication date
CN112686265B (zh) 2024-07-26

Similar Documents

Publication Publication Date Title
CN111723585B (zh) 一种风格可控的图像文本实时翻译与转换方法
CN107133622B (zh) 一种单词的分割方法和装置
Karthick et al. Steps involved in text recognition and recent research in OCR; a study
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
CN112686265B (zh) 一种基于层级轮廓提取的象形文字分割方法
LeBourgeois Robust multifont OCR system from gray level images
US8391602B2 (en) Character recognition
CN110119741A (zh) 一种有背景的卡证图像信息识别方法
CN110766020A (zh) 一种面向多语种自然场景文本检测与识别的系统及方法
CN113128442A (zh) 基于卷积神经网络的汉字书法风格识别方法和评分方法
CN110751154B (zh) 一种基于像素级分割的复杂环境多形状文本检测方法
CN114359998B (zh) 一种人脸口罩佩戴状态下的识别方法
WO2024041032A1 (zh) 基于不可编辑的图文类图像生成可编辑文档的方法及装置
Huang et al. Text detection and recognition in natural scene images
CN110276759A (zh) 一种基于机器视觉的手机屏坏线缺陷诊断方法
Qin et al. Robust and accurate text stroke segmentation
CN108205678A (zh) 一种含有亮斑干扰的铭牌文字识别处理方法
CN110378337B (zh) 金属切削刀具图纸标识信息视觉输入方法及系统
CN116485992A (zh) 一种复合型三维扫描方法和装置、三维扫描仪
CN113537216B (zh) 一种点阵字体文本行倾斜校正方法及装置
Rajithkumar et al. Template matching method for recognition of stone inscripted Kannada characters of different time frames based on correlation analysis
CN115082946A (zh) 表格图像处理方法、装置、电子设备及计算机存储介质
CN113421256A (zh) 一种点阵文本行字符投影分割方法及装置
CN113420767A (zh) 一种用于字体分类的特征提取方法、系统和装置
JP2871590B2 (ja) 画像抽出方式

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant