CN108830269A - 确定满文单词中轴线宽度的方法 - Google Patents

确定满文单词中轴线宽度的方法 Download PDF

Info

Publication number
CN108830269A
CN108830269A CN201810580288.2A CN201810580288A CN108830269A CN 108830269 A CN108830269 A CN 108830269A CN 201810580288 A CN201810580288 A CN 201810580288A CN 108830269 A CN108830269 A CN 108830269A
Authority
CN
China
Prior art keywords
wdmax
wdmin
language
axis line
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810580288.2A
Other languages
English (en)
Other versions
CN108830269B (zh
Inventor
郑蕊蕊
李敏
许爽
吴宝春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Minzu University
Original Assignee
Dalian Nationalities University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Nationalities University filed Critical Dalian Nationalities University
Priority to CN201810580288.2A priority Critical patent/CN108830269B/zh
Publication of CN108830269A publication Critical patent/CN108830269A/zh
Application granted granted Critical
Publication of CN108830269B publication Critical patent/CN108830269B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本分案申请公开了一种确定满文单词中轴线宽度的方法,属于文字处理领域,用于解决提高识别准确性的问题,要点是统计纵向边缘图像Iv的每一列中所包含的黑色像素的个数,垂直投影序列以vp1表示,取向量vp1中不重复的元素,并按照数值从大到小的降序方式进行排列,得到新的向量vp2,效果是提高识别准确性。

Description

确定满文单词中轴线宽度的方法
本申请是申请号2015106293443,申请日2015-09-29,发明名称“满文单词中轴线的定位方法”的分案申请。
技术领域
本发明涉及一种文字处理方法,特别是一种满文单词中轴线的定位方法。
背景技术
随着科学技术的发展,计算机已经能够对多种图像格式的文字进行识别和辨认(如英文、日文),满文作为世界语言的一种,还无法做到供计算机自动识别。如果能够让计算机做到自动识别、辨认满文,则可以将大量的满文文献进行电子化处理,这对于满文文献的研究与保存,乃至满族文化的研究与保存都有着十分重要的意义,而要想实现这一目标,首先需要对满文的中轴线进行定位。
发明内容
本发明是为了解决现有技术所存在的上述不足,提出一种准确率高,有助于计算机对满文单词进行正确分隔各识别的满文单词中轴线的定位方法。
本发明的技术解决方案是:一种满文单词中轴线的定位方法,其特征在于:所述的方法依次由满文单词图像预处理、确定满文单词中轴线的宽度、确定满文单词中轴线左右边界位置三个步骤组成,其中:
满文单词图像预处理的步骤为:扫描满文文档,获得满文文档的彩色图像,并对满文文档的彩色图像进行二值化,采用垂直投影法提取每一列满文文档的图像,获得列图像,并对列图像采用水平投影法提取满文单词图像,然后对满文单词图像进行位置归一化处理,归一化处理的步骤是找到满文单词图像最外侧上、下、左、右四个点的坐标位置,以这四个点为边界,重新确定满文单词图像的大小,并用I、W、H分别表示归一化处理后的二值满文单词图像、二值满文单词图像的宽度数值和二值满文单词图像的高度数值,
确定满文单词中轴线宽度的步骤为:对二值满文单词图像I采用数学形态学进行处理,具体方法是采用长度为2的水平方向直线型形态学结构元素,对二值满文单词图像I进行腐蚀处理,得到I的腐蚀图像Ie,并求二值满文单词图像I与腐蚀图像Ie的纵向边缘图像Iv,即Iv=I-Ie,提取到满文单词的纵向边缘,然后对纵向边缘图像Iv进行垂直投影,统计纵向边缘图像Iv的每一列中所包含的黑色像素的个数,垂直投影序列以vp1表示,取向量vp1中不重复的元素,并按照数值从大到小的降序方式进行排列,得到新的向量vp2,并取vp2中的前3个元素分别标记为ind1、ind2和ind3,用wd表示中轴线的宽度,wdmin表示最小中轴线宽度,赋值wdmin=0,wdmax表示最大中轴线宽度,T为最大中轴线宽度的阈值,赋值T=1/3,则最大中轴线宽度wdmax为对T×W的结果向下取整后的值,即
分别定义wd1、wd2、wd3为3个候选中轴线宽度,wd表示最终确定的中轴线宽度,其中wd1=∣ind1-ind2∣-1,wd2=∣ind1-ind3∣-1,wd3=∣ind2-ind3∣-1,
如果(wdmin<wd1<wdmax)并且(wdmin<wd2<wdmax)并且(wdmin<wd3<wdmax),则wd=wd1,
如果(wdmin<wd1<wdmax)并且(wdmin<wd2<wdmax)并且(wd3<=wdmin或者wd3>=wdmax),则取wd1和wd2中值较大的一个做为wd的输出值,即wd=max(wd1,wd2),
如果(wdmin<wd1<wdmax)并且(wdmin<wd3<wdmax)并且(wd2<=wdmin或者wd2>=wdmax),则取wd1和wd3中值较大的一个做为wd的输出值,即wd=max(wd1,wd3),
如果(wdmin<wd2<wdmax)并且(wdmin<wd3<wdmax)并且(wd1<=wdmin或者wd1>=wdmax),则取wd2和wd3中值较大的一个做为wd的输出值,即wd=max(wd2,wd3),
如果(wdmin<wd1<wdmax)并且(wd2<=wdmin或者wd2>=wdmax)并且(wd3<=wdmin或者wd3>=wdmax),则wd=wd1,
如果(wdmin<wd2<wdmax)并且(wd1<=wdmin或者wd1>=wdmax)并且(wd3<=wdmin或者wd3>=wdmax),则wd=wd2,
如果(wdmin<wd3<wdmax)并且(wd1<=wdmin或者wd1>=wdmax)并且(wd2<=wdmin或者wd2>=wdmax),则wd=wd3,
如果(wd1<=wdmin或者wd1>=wdmax)并且(wd2<=wdmin或者wd2>=wdmax)并且(wd3<=wdmin或者wd3>=wdmax),则wd=wdmax,
确定满文单词中轴线左右边界位置的步骤为:用baseline_left表示中轴线最左侧的边界,对于纵向边缘图像Iv按照从左至右的顺序逐列扫描,扫描范围为从第1列至第W-wd+1列,设当前为第i列,则1≤i≤(W-wd+1),用TB表示第i列至第i+wd-1列的黑色像素点的个数,则baseline_left为具有最大TB值所对应的列,
用baseline_right表示中轴线最右侧的边界,则baseline_right=baseline_left+wd-1,
因此在二值满文单词图像I中,baseline_left为该满文单词中轴线的左边界,baseline_right为该满文单词中轴线的右边界,wd为该满文单词中轴线的宽度,从而定位出该满文单词的中轴线。
本发明同现有技术相比,具有如下优点:
利用本发明所公开的方法,能够快速、准确地确定出满文单词的中轴线(包括中轴线的左右边界位置和中轴线的宽度),而满文单词的中轴线的确定,是计算机能够正确分隔并识别满文文字的前提和基础,本种方法的出现,让满文的计算机识别和电子化处理得到进一步的发展,对于满文文献的研究与保存,和满族文化的研究与保存都是有着重大意义的,因此可以说该方法具有多种优点,特别适合于在本领域中推广应用,其市场前景广泛,科研意义重大。
具体实施方式
下面将说明本发明的具体实施方式。
一种满文单词中轴线的定位方法,按照满文单词图像预处理、确定满文单词中轴线的宽度、确定满文单词中轴线左右边界位置三个步骤进行操作,
满文单词图像预处理的步骤为:扫描满文文档,获得满文文档的彩色图像,并对满文文档的彩色图像进行二值化,采用垂直投影法提取每一列满文文档的图像,获得列图像,并对列图像采用水平投影法提取满文单词图像,然后对满文单词图像进行位置归一化处理,归一化处理的步骤是找到满文单词图像最外侧上、下、左、右四个点的坐标位置,以这四个点为边界,重新确定满文单词图像的大小,并用I、W、H分别表示归一化处理后的二值满文单词图像、二值满文单词图像的宽度数值和二值满文单词图像的高度数值,
确定满文单词中轴线宽度的步骤为:对二值满文单词图像I采用数学形态学进行处理,具体方法是采用长度为2的水平方向直线型形态学结构元素,对二值满文单词图像I进行腐蚀处理,得到I的腐蚀图像Ie,并求二值满文单词图像I与腐蚀图像Ie的纵向边缘图像Iv,即Iv=I-Ie,提取到满文单词的纵向边缘,然后对纵向边缘图像Iv进行垂直投影,统计纵向边缘图像Iv的每一列中所包含的黑色像素的个数,垂直投影序列以vp1表示,取向量vp1中不重复的元素,并按照数值从大到小的降序方式进行排列,得到新的向量vp2,并取vp2中的前3个元素分别标记为ind1、ind2和ind3,用wd表示中轴线的宽度,wdmin表示最小中轴线宽度,赋值wdmin=0,wdmax表示最大中轴线宽度,T为最大中轴线宽度的阈值,赋值T=1/3,则最大中轴线宽度wdmax为对T×W的结果向下取整后的值,即
分别定义wd1、wd2、wd3为3个候选中轴线宽度,wd表示最终确定的中轴线宽度,其中wd1=∣ind1-ind2∣-1,wd2=∣ind1-ind3∣-1,wd3=∣ind2-ind3∣-1,
如果(wdmin<wd1<wdmax)并且(wdmin<wd2<wdmax)并且(wdmin<wd3<wdmax),说明wd1、wd2、wd3均在合理宽度范围内,则wd=wd1,
如果(wdmin<wd1<wdmax)并且(wdmin<wd2<wdmax)并且(wd3<=wdmin或者wd3>=wdmax),说明wd1、wd2在合理宽度范围内,而wd3不在合理宽度范围内,则取wd1和wd2中值较大的一个做为wd的输出值,即wd=max(wd1,wd2),
如果(wdmin<wd1<wdmax)并且(wdmin<wd3<wdmax)并且(wd2<=wdmin或者wd2>=wdmax),说明wd1、wd3在合理宽度范围内,而wd2不在合理宽度范围内,则取wd1和wd3中值较大的一个做为wd的输出值,即wd=max(wd1,wd3),
如果(wdmin<wd2<wdmax)并且(wdmin<wd3<wdmax)并且(wd1<=wdmin或者wd1>=wdmax),说明wd2、wd3在合理宽度范围内,而wd1不在合理宽度范围内,则取wd2和wd3中值较大的一个做为wd的输出值,即wd=max(wd2,wd3),
如果(wdmin<wd1<wdmax)并且(wd2<=wdmin或者wd2>=wdmax)并且(wd3<=wdmin或者wd3>=wdmax),说明wd1在合理宽度范围内,而wd2、wd3不在合理宽度范围内,则wd=wd1,
如果(wdmin<wd2<wdmax)并且(wd1<=wdmin或者wd1>=wdmax)并且(wd3<=wdmin或者wd3>=wdmax),说明wd2在合理宽度范围内,而wd1、wd3不在合理宽度范围内,则wd=wd2,
如果(wdmin<wd3<wdmax)并且(wd1<=wdmin或者wd1>=wdmax)并且(wd2<=wdmin或者wd2>=wdmax),说明wd3在合理宽度范围内,而wd1、wd2不在合理宽度范围内则wd=wd3,
如果(wd1<=wdmin或者wd1>=wdmax)并且(wd2<=wdmin或者wd2>=wdmax)并且(wd3<=wdmin或者wd3>=wdmax),说明wd1、wd2、wd3均不在合理宽度范围内,则wd=wdmax,
确定了满文单词中轴线的宽度后,再来确定满文单词中轴线的左右边界,具体步骤为:用baseline_left表示中轴线最左侧的边界,对于纵向边缘图像Iv按照从左至右的顺序逐列扫描,扫描范围为从第1列至第W-wd+1列,设当前为第i列,则1≤i≤(W-wd+1),用TB表示第i列至第i+wd-1列的黑色像素点的个数,则baseline_left为具有最大TB值所对应的列,
用baseline_right表示中轴线最右侧的边界,则baseline_right=baseline_left+wd-1,
因此在二值满文单词图像I中,baseline_left为该满文单词中轴线的左边界,baseline_right为该满文单词中轴线的右边界,wd为该满文单词中轴线的宽度,从而定位出该满文单词的中轴线。

Claims (1)

1.一种确定满文单词中轴线宽度的方法,其特征在于:对二值满文单词图像I采用数学形态学进行处理,具体方法是采用长度为2的水平方向直线型形态学结构元素,对二值满文单词图像I进行腐蚀处理,得到I的腐蚀图像Ie,并求二值满文单词图像I与腐蚀图像Ie的纵向边缘图像Iv,即Iv=I-Ie,提取到满文单词的纵向边缘,然后对纵向边缘图像Iv进行垂直投影,统计纵向边缘图像Iv的每一列中所包含的黑色像素的个数,垂直投影序列以vp1表示,取向量vp1中不重复的元素,并按照数值从大到小的降序方式进行排列,得到新的向量vp2,并取vp2中的前3个元素分别标记为ind1、ind2和ind3,用wd表示中轴线的宽度,wdmin表示最小中轴线宽度,赋值wdmin=0,wdmax表示最大中轴线宽度,T为最大中轴线宽度的阈值,赋值T=1/3,则最大中轴线宽度wdmax为对T×W的结果向下取整后的值,即
分别定义wd1、wd2、wd3为3个候选中轴线宽度,wd表示最终确定的中轴线宽度,其中wd1=∣ind1-ind2∣-1,wd2=∣ind1-ind3∣-1,wd3=∣ind2-ind3∣-1,
如果(wdmin<wd1<wdmax)并且(wdmin<wd2<wdmax)并且(wdmin<wd3<wdmax),则wd=wd1,
如果(wdmin<wd1<wdmax)并且(wdmin<wd2<wdmax)并且(wd3<=wdmin或者wd3>=wdmax),则取wd1和wd2中值较大的一个做为wd的输出值,即wd=max(wd1,wd2),
如果(wdmin<wd1<wdmax)并且(wdmin<wd3<wdmax)并且(wd2<=wdmin或者wd2>=wdmax),则取wd1和wd3中值较大的一个做为wd的输出值,即wd=max(wd1,wd3),
如果(wdmin<wd2<wdmax)并且(wdmin<wd3<wdmax)并且(wd1<=wdmin或者wd1>=wdmax),则取wd2和wd3中值较大的一个做为wd的输出值,即wd=max(wd2,wd3),
如果(wdmin<wd1<wdmax)并且(wd2<=wdmin或者wd2>=wdmax)并且(wd3<=wdmin或者wd3>=wdmax),则wd=wd1,
如果(wdmin<wd2<wdmax)并且(wd1<=wdmin或者wd1>=wdmax)并且(wd3<=wdmin或者wd3>=wdmax),则wd=wd2,
如果(wdmin<wd3<wdmax)并且(wd1<=wdmin或者wd1>=wdmax)并且(wd2<=wdmin或者wd2>=wdmax),则wd=wd3,
如果(wd1<=wdmin或者wd1>=wdmax)并且(wd2<=wdmin或者wd2>=wdmax)并且(wd3<=wdmin或者wd3>=wdmax),则wd=wdmax。
CN201810580288.2A 2015-09-29 2015-09-29 确定满文单词中轴线宽度的方法 Active CN108830269B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810580288.2A CN108830269B (zh) 2015-09-29 2015-09-29 确定满文单词中轴线宽度的方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510629344.3A CN105279506B (zh) 2015-09-29 2015-09-29 满文单词中轴线的定位方法
CN201810580288.2A CN108830269B (zh) 2015-09-29 2015-09-29 确定满文单词中轴线宽度的方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201510629344.3A Division CN105279506B (zh) 2015-09-29 2015-09-29 满文单词中轴线的定位方法

Publications (2)

Publication Number Publication Date
CN108830269A true CN108830269A (zh) 2018-11-16
CN108830269B CN108830269B (zh) 2021-09-07

Family

ID=55148489

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201510629344.3A Active CN105279506B (zh) 2015-09-29 2015-09-29 满文单词中轴线的定位方法
CN201810580288.2A Active CN108830269B (zh) 2015-09-29 2015-09-29 确定满文单词中轴线宽度的方法
CN201810580666.7A Active CN108830270B (zh) 2015-09-29 2015-09-29 对满文单词正确分割各识别的满文单词中轴线的定位方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201510629344.3A Active CN105279506B (zh) 2015-09-29 2015-09-29 满文单词中轴线的定位方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201810580666.7A Active CN108830270B (zh) 2015-09-29 2015-09-29 对满文单词正确分割各识别的满文单词中轴线的定位方法

Country Status (1)

Country Link
CN (3) CN105279506B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993236A (zh) * 2019-04-10 2019-07-09 大连民族大学 基于one-shot Siamese卷积神经网络的少样本满文匹配方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564078B (zh) * 2018-04-24 2020-11-13 大连民族大学 提取满文单词图像中轴线的方法
CN108564139B (zh) * 2018-04-24 2021-03-19 大连民族大学 基于满文部件切分的印刷体满文识别装置
CN108537229B (zh) * 2018-04-24 2020-06-02 大连民族大学 基于满文部件切分的印刷体满文识别方法
CN108549896B (zh) * 2018-04-24 2020-08-04 大连民族大学 满文部件切分中删除多余候选切分行的方法
CN108596183B (zh) * 2018-04-24 2020-08-04 大连民族大学 满文部件切分的过分割区域合并方法
CN108596182B (zh) * 2018-04-24 2020-06-16 大连民族大学 满文部件切分方法
CN113852730B (zh) * 2021-09-28 2023-12-01 科大讯飞股份有限公司 一种倾斜角确定方法及其相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1834872A (zh) * 2005-03-17 2006-09-20 微软公司 基于单词或字符边界的划去手势识别
CN101025791A (zh) * 2007-04-06 2007-08-29 清华大学 印刷蒙古文文本切分方法
EP1881422A1 (en) * 2005-04-20 2008-01-23 Intellectual Property Bank Corp. Device for extracting index work in document to be examined and document feature analyzer
CN102063619A (zh) * 2010-11-30 2011-05-18 汉王科技股份有限公司 文字行提取方法和装置
CN102693423A (zh) * 2012-05-15 2012-09-26 公安部第三研究所 一种在强光条件下车牌精确定位的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5884560B2 (ja) * 2012-03-05 2016-03-15 オムロン株式会社 文字認識のための画像処理方法、およびこの方法を用いた文字認識装置およびプログラム
CN102842034B (zh) * 2012-07-10 2015-09-16 重庆大学 一种激光扫描与自动识别雕刻字符的装置及识别方法
CN104298985A (zh) * 2014-08-11 2015-01-21 东莞中山大学研究院 一种基于迭代的图像文本区域检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1834872A (zh) * 2005-03-17 2006-09-20 微软公司 基于单词或字符边界的划去手势识别
EP1881422A1 (en) * 2005-04-20 2008-01-23 Intellectual Property Bank Corp. Device for extracting index work in document to be examined and document feature analyzer
CN101025791A (zh) * 2007-04-06 2007-08-29 清华大学 印刷蒙古文文本切分方法
CN102063619A (zh) * 2010-11-30 2011-05-18 汉王科技股份有限公司 文字行提取方法和装置
CN102693423A (zh) * 2012-05-15 2012-09-26 公安部第三研究所 一种在强光条件下车牌精确定位的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993236A (zh) * 2019-04-10 2019-07-09 大连民族大学 基于one-shot Siamese卷积神经网络的少样本满文匹配方法
CN109993236B (zh) * 2019-04-10 2020-11-27 大连民族大学 基于one-shot Siamese卷积神经网络的少样本满文匹配方法

Also Published As

Publication number Publication date
CN105279506A (zh) 2016-01-27
CN108830269B (zh) 2021-09-07
CN108830270A (zh) 2018-11-16
CN108830270B (zh) 2021-10-08
CN105279506B (zh) 2018-07-03

Similar Documents

Publication Publication Date Title
CN108830269A (zh) 确定满文单词中轴线宽度的方法
Song et al. A deep learning based framework for accurate segmentation of cervical cytoplasm and nuclei
CN109472761B (zh) 一种基于荧光图像的细胞计数方法及系统
CN108648182B (zh) 一种基于分子亚型的乳腺癌核磁共振图像肿瘤区域分割方法
WO2021217851A1 (zh) 异常细胞自动标注方法、装置、电子设备及存储介质
Liao et al. Automatic segmentation for cell images based on bottleneck detection and ellipse fitting
CN102999886B (zh) 图像边缘检测器及标尺光栅栅线精度检测系统
CN109002834A (zh) 基于多模态表征的细粒度图像分类方法
CN109378052A (zh) 图像标注的预处理方法及系统
CN103886318B (zh) 尘肺病大体成像中病灶区域的提取与分析方法
CN105574531A (zh) 一种基于交点特征提取的数字识别方法
CN106407979A (zh) 一种票据字符校正的方法及装置
CN110400287B (zh) 结直肠癌ihc染色图像肿瘤侵袭边缘和中心的检测系统及方法
CN111368695A (zh) 一种表格结构提取方法
CN109815974A (zh) 一种细胞病理玻片分类方法、系统、设备、存储介质
CN107909068A (zh) 一种大数据图像曲线反向解析方法及系统
CN105447879A (zh) 乳房图像中检测胸肌的方法及装置
Chen et al. Method on water level ruler reading recognition based on image processing
CN113192022A (zh) 基于深度学习的病原孢子识别计数方法和装置
Du et al. Automatic classification of cells in microscopic fecal images using convolutional neural networks
CN105354405A (zh) 基于机器学习的免疫组化图像自动化判读系统
CN111583226A (zh) 细胞病理感染评估方法、电子装置及存储介质
CN106033534A (zh) 基于直线检测的电子阅卷方法
CN112507821B (zh) 基于高内涵成像的细胞耐药性检测方法、介质及电子设备
Zhao et al. Feature quantification and abnormal detection on cervical squamous epithelial cells

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant