CN101697201A - 一种旋转方向无关的手写汉字识别方法 - Google Patents

一种旋转方向无关的手写汉字识别方法 Download PDF

Info

Publication number
CN101697201A
CN101697201A CN200910192677A CN200910192677A CN101697201A CN 101697201 A CN101697201 A CN 101697201A CN 200910192677 A CN200910192677 A CN 200910192677A CN 200910192677 A CN200910192677 A CN 200910192677A CN 101697201 A CN101697201 A CN 101697201A
Authority
CN
China
Prior art keywords
character
main shaft
input
chinese
directions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910192677A
Other languages
English (en)
Other versions
CN101697201B (zh
Inventor
金连文
黄盛明
吕锦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN2009101926779A priority Critical patent/CN101697201B/zh
Publication of CN101697201A publication Critical patent/CN101697201A/zh
Application granted granted Critical
Publication of CN101697201B publication Critical patent/CN101697201B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供了一种旋转方向无关的手写汉字识别方法,用户通过手写输入设备书写汉字,而信息处理设备将采集到的汉字字符图像转换为相应的汉字机器内码,包括如下步骤:(1)对输入字符进行旋转方向的第一次纠正,所述第一次纠正使得该输入字符的起始点位于字符图像的左上部分;(2)对输入字符进行旋转方向的第二次调整,所述第二次调整确定字符在横、45度斜方向、竖和135度斜方向四个方向上的方向主轴,并计算输入字符关于方向主轴的真实主轴,如真实主轴与方向主轴不重合,则旋转字符使之重合;(3)将经过步骤(1)和(2)纠正即调整后的字符图像通过分类器进行识别,得到字符识别结果。

Description

一种旋转方向无关的手写汉字识别方法
技术领域
本发明属于利用计算机模式识别技术进行手写汉字识别的技术领域,特别是涉及一种旋转方向无关的手写汉字识别方法。
背景技术
手写汉字识别一般是指用户通过手写输入设备(比如:手写板、触摸屏、鼠标等)书写汉字,同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别,但是这些传统的手写识别输入法并不是旋转无关的,它要求用户书写的字符倾斜不能超过一定角度,不然它的识别率将得不到保证,一般来说,当输入的字符倾斜超过30度后输入的字符往往不能正确识别,也就是说对于这些倾斜字符而言,传统的输入法的识别率是很低的,这就限制了用户手写输入的方向,不能满足用户自由书写的需要。
发明内容
本发明的目的在于克服上述手写汉字识别方法的不足,提供一种更自由的手写汉字输入识别方式,即旋转方向无关单字识别。
本发明采用的技术方案为:
一种旋转方向无关的手写汉字识别方法,用户通过手写输入设备书写汉字,而信息处理设备将采集到的汉字字符图像转换为相应的汉字机器内码,包括如下步骤:
(1)、对输入字符进行旋转方向的第一次纠正,所述第一次纠正使得该输入字符的起始点位于字符图像的左上部分;
(2)、对输入字符进行旋转方向的第二次调整,所述第二次调整确定汉字字符在横、45度斜方向、竖和135度斜方向四个方向上的方向主轴,并计算输入字符的真实主轴,如真实主轴与方向主轴不重合,则旋转字符使之重合;
(3)、将经过步骤(1)和(2)纠正即调整后的字符图像通过分类器进行识别,得到字符识别结果。
上述技术方案中,所述步骤(1)具体包括如下步骤:
(11)、计算输入字符的重心;
(12)、以字符重心为原点画水平与垂直划分线将字符图像切分为四个部分,分别为左上、右上、左下、右下部分;
(13)、如果输入字符的起始点不在字符图像的左上部分,则旋转字符图像使得起始点位于图像的左上部分。
所述步骤(2)包括如下步骤:
(21)将输入字符所有时序点的方向向量投影在横、45度斜方向、竖、135度斜方向四个方向上;
(22)选取横、45度斜方向、竖、135度斜方向四个方向轴上投影长度最长的方向轴作为该字符的方向主轴,方向主轴表明了该字符主要的笔画方向;
(23)根据公式
Figure G2009101926779D0000021
计算字符关于方向主轴的真实主轴方向
Figure G2009101926779D0000022
其中S表示在方向主轴上投影长度不为0的方向向量集合,θj表示第j个方向向量相对于方向主轴的角度,Li j表示第j个方向在方向主轴上的投影,SLi表示方向主轴上的投影长度和;
(24)旋转字符图像,使得字符的真实主轴与方向主轴重合从而将字符图像旋转到横、或45度斜方向、或竖、或135度斜方向上;
所述第j个时序点的方向向量
Figure G2009101926779D0000031
定义如下,,其中Pj表示输入的第j个时序点,Pj-1表示输入的第(j-1)个时序点,Pj+1表示输入的第(j+1)个时序点:
Figure G2009101926779D0000032
所述时序点在横、45度斜方向、竖、135度斜方向上的投影向量定义为:
L j → = { L 1 j , L 2 j , L 3 j , L 4 j } ;
所述横、45度斜方向、竖、135度斜方向主轴上的投影长度向量定义为:
SL → = { SL 1 , SL 2 , SL 3 , SL 4 } .
所述方向主轴指的是在横、45度斜方向、竖、135度斜方向四个方向轴上所有时序点的方向向量投影长度和最大的方向轴,由于时序点的方向向量表征了当前笔画的方向,将其投影到横、45度斜方向、竖、135度斜方向四个方向轴上,计算所有时序点在这四个方向上的投影长度和,则四个方向上投影和最大的方向就表征了该字符在横竖撇捺四个方向上的主要的笔画方向,也就是说,方向主轴是当前字符在横竖撇捺四个方向上的主要的笔画方向。
所述关于方向主轴的真实主轴指的是根据那些在当前字符的方向主轴上有投影长度的时序点方向向量计算的相比于方向主轴更为精确的字符笔画方向。由于方向主轴只是表征了当前字符在横竖撇捺四个方向上的主要的笔画方向,它并不能精确的描述字符的具体的笔画方向,根据时序点方向向量在方向主轴上的投影长度及其角度计算的方向轴更能体现出当前字符的笔画方向,故称根据公式
Figure G2009101926779D0000041
计算出来的方向为字符的真实主轴方向,因为它更体现出当前字符的笔画方向。
本发明所述步骤(3)将训练样本多次旋转作为新的样本去训练分类器,即把训练样本集经过人为旋转样本,以及步骤(1)和(2)的纠正及调整后,提取训练样本的方向特征,并生成识别字典,以该识别字典构成分类器。
本发明通过步骤(1)的初次纠正,以及步骤(2)的再次调整,再结合有效的分类器进行识别,使得用户手写的汉字可以不受方向的约束,即无论用户所写的汉子如何倾斜,均可有效识别,使得手写汉字的识别领域具有更大的应用,也更进一步方便了用户的使用。
附图说明
图1是本发明的系统结构框图;
图2是本发明的基于起始点的字符角度纠正的流程框图;
图3是对汉字起始点分布统计图;
图4是对具体手写样本的基于起始点的字符角度纠正示例;
图5是本发明的基于汉字主轴信息的二次角度调整的流程框图;
图6是对具体手写样本的基于汉字主轴信息的二次角度调整示例。
具体实施方式
下面结合附图对本发明做进一步的说明,实施本发明所用的识别设备可以采用手写板书写汉字,用计算机进行识别,用纯平型显示器显示用户图形界面,可采用C++语言编制各类处理程序,便能较好地实施本发明。本发明也能在PDA等手持设备上实现。
本发明的系统结构框图如附图1所示,中文手写字符笔画的时序点输入后,首先对输入字符进行基于起始点的字符角度纠正,然后是基于汉字主轴信息的字符角度二次调整,将经过角度纠正调整后的字符通过由旋转多样本方法训练的分类器识别,最后得到字符识别结果。
本发明的字符角度初次纠正方法为基于起始点的字符角度纠正,其流程图如附图2所示,具体步骤如下:
(A)、计算输入字符的重心;
(B)、以字符重心为原点画水平与垂直划分线将字符图像切分为四个部分;
(C)、如果起始点不在字符图像的左上部分,则旋转字符图像使得起始点位于图像的左上部分。
上述的方法是基于一个这样的观察事实,对于大多数汉字而言,它的起始点都是位于字符图像的左上部分。基于863联机手写数据库的60套样本,对GB一级汉字包含的3755个汉字的起始点分布进行了统计,起始点分布图如图3所示,图中蓝色位置表示起始点最密集的位置,统计的起始点数以蓝色位置为中心向四周递减。该分布图证实了上述的关于“对于大多数汉字而言,它的起始点都是位于字符图像的左上部分”的假设,从而提供了基于起始点的字符角度纠正方法的理论根据。
对于具体的一个倾斜书写的手写样本“啊”的基于起始点的字符角度纠正效果如附图4(a),(b),(c),(d)所示,可以看出,不管是旋转了多大角度的倾斜字符在经过了基于起始点的字符角度纠正后,字符的旋转角度被控制在一定范围内,可以证明,相对于非倾斜字符,倾斜字符在纠正后角度倾斜不会超过135度,尤其是对于那些起始点落在非倾斜字符的左上部的字符而言,纠正后角度倾斜不会超过90度,从而有效地防止了字符出现过度倾斜的情况。
本发明的基于汉字主轴信息的二次角度调整具体实施为:
首先定义第j个时序点的方向向量
Figure G2009101926779D0000061
其中Pj表示输入的第j个时序点,Pj-1表示输入的第(j-1)个时序点,Pj+1表示输入的第(j+1)个时序点:
Figure G2009101926779D0000062
定义第j个输入时序点在横,45度斜方向,竖,135度斜方向四个方向上的投影向量
Figure G2009101926779D0000063
定义横,45度斜方向,竖,135度斜方向四个方向主轴上的投影长度向量则有
Figure G2009101926779D0000065
基于汉字主轴信息的角度调整如附图5所示,包括如下步骤:
(I)将输入字符所有时序点的方向向量投影在横,45度斜方向,竖,135度斜方向四个方向上。
(II)选取横、45度斜方向、竖、135度斜方向四个方向轴上投影长度最长的方向轴作为该字符的方向主轴,方向主轴表明了该字符主要的笔画方向;
(III)根据公式
Figure G2009101926779D0000066
计算字符关于方向主轴的真实主轴方向
Figure G2009101926779D0000067
其中S表示在方向主轴上投影长度不为0的方向向量集合,θj表示第j个方向向量相对于方向主轴的角度,Li j表示第j个方向在方向主轴上的投影,SLi表示方向主轴上的投影长度和;
(IV)将字符的真实主轴旋转到与方向主轴重合从而将字符旋转到横,45度斜方向,竖,135度斜方向这四个方向上。
该方法可以有效的将汉字旋转到横,45度斜方向,竖,135度斜方向这四个方向上,从而减少了输入字符的角度的变化范围,为下面的识别奠定了基础。
对于具体的一个倾斜书写的手写样本“啊”,在其经过了基于起始点的字符角度纠正后,再经过基于汉字主轴信息的二次角度调整后的效果如附图6(a),(b),(c),(d)所示,图6(a),(b),(c),(d)左边的汉字对应于附图4(a),(b),(c),(d)所显示的初次纠正后的汉字,右边是经过基于汉字主轴信息的二次角度调整后的结果。
本发明的旋转多样本分类器训练方法具体实施为将训练样本多次旋转作为新的样本去训练分类器。该方法的实施是为了使得分类器可以适应于倾斜的样本,实验证明,旋转多样本训练分类器的方法是有效的。用N表示每个样本的旋转次数,A表示每次旋转的角度的集合,N=10,A=[-45,45]度内随机旋转的十次角度的参数设置在实验中的性能是最好的。
将本发明应用于旋转无关的单字识别,其结果示于下表1-3,其中表1是传统方法与本发明方法在863联机数据库上对一级汉字前500类汉字的识别率对比实验结果;表2是本发明方法在863联机数据库上对一级汉字前500类汉字各种旋转角度下的识别率;表3是传统方法与本发明方法在SCUT-COUCH联机数据库(SCUT-COUCH联机数据库是由华南理工大学人机交互智能接口实验室所采集的联机手写汉字数据库,样本数为168套)上对一级汉字共3755类汉字的识别率对比实验结果。表1与表2中的训练集样本数为45,测试样本数为15。表3中的训练集样本数为132,测试集样本数为36。由表1,3可以看出,本发明相比于传统的单字识别方法,大大提高了倾斜汉字的识别率,并且,由表2可以看出,本发明是稳定的,对于任意倾斜角度的汉字均能很好的识别。
表1
Figure G2009101926779D0000081
表2
Figure G2009101926779D0000082
表3
Figure G2009101926779D0000083

Claims (4)

1.一种旋转方向无关的手写汉字识别方法,用户通过手写输入设备书写汉字,而信息处理设备将采集到的汉字字符图像转换为相应的汉字机器内码,其特征在于包括如下步骤:
(1)、对输入字符进行旋转方向的第一次纠正,所述第一次纠正使得该输入字符的起始点位于字符图像的左上部分;
(2)、对输入字符进行旋转方向的第二次调整,所述第二次调整确定汉字字符在横、45度斜方向、竖和135度斜方向四个方向上的方向主轴,并计算输入字符关于方向主轴的真实主轴,如真实主轴与方向主轴不重合,则旋转字符使之重合;
(3)、将经过步骤(1)和(2)纠正即调整后的字符图像通过分类器进行识别,得到字符识别结果。
2.根据权利要求1所述的旋转方向无关的手写汉字识别方法,其特征在于所述步骤(1)具体包括如下步骤:
(11)、计算输入字符的重心;
(12)、以字符重心为原点画水平与垂直划分线将字符图像切分为四个部分,分别为左上、右上、左下、右下部分;
(13)、如果输入字符的起始点不在字符图像的左上部分,则旋转字符图像使得起始点位于图像的左上部分。
3.根据权利要求1所述的旋转方向无关的手写汉字识别方法,其特征在于所述步骤(2)包括如下步骤:
(21)将输入字符所有时序点的方向向量投影在横、45度斜方向、竖、135度斜方向四个方向上;
(22)选取横、45度斜方向、竖、135度斜方向四个方向轴上时序点投影长度和最大的方向轴作为该字符的方向主轴,用于表明该字符主要的笔画方向;
(23)根据公式
Figure F2009101926779C0000021
计算字符关于方向主轴的真实主轴方向
Figure F2009101926779C0000022
其中S表示在方向主轴上投影长度不为0的方向向量集合,θj表示第j个方向向量相对于方向主轴的角度,Li j表示第j个方向在方向主轴上的投影,SLi表示方向主轴上的投影长度和;
(24)旋转字符图像,使得字符的真实主轴与字符的方向主轴重合从而将字符图像旋转到横、或45度斜方向、或竖、或135度斜方向上;
所述第j个时序点的方向向量
Figure F2009101926779C0000023
定义如下,其中Pj表示输入的第j个时序点,Pj-1表示输入的第(j-1)个时序点,Pj+1表示输入的第(j+1)个时序点:
Figure F2009101926779C0000024
所述第j个时序点在横、45度斜方向、竖、135度斜方向上的投影向量定义为: L j → = { L 1 j , L 2 j , L 3 j , L 4 j } ;
所述横、45度斜方向、竖、135度斜方向主轴上的投影长度向量定义为: SL → = { SL 1 , SL 2 , SL 3 , SL 4 } .
4.根据权利要求1所述的旋转方向无关的手写汉字识别方法,其特征在于所述步骤(3)将训练样本多次旋转作为新的样本去训练分类器,即把训练样本集经过人为旋转样本,以及步骤(1)和(2)的纠正及调整后,提取训练样本的方向特征,并生成识别字典,以该识别字典构成分类器。
CN2009101926779A 2009-09-25 2009-09-25 一种旋转方向无关的手写汉字识别方法 Expired - Fee Related CN101697201B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101926779A CN101697201B (zh) 2009-09-25 2009-09-25 一种旋转方向无关的手写汉字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101926779A CN101697201B (zh) 2009-09-25 2009-09-25 一种旋转方向无关的手写汉字识别方法

Publications (2)

Publication Number Publication Date
CN101697201A true CN101697201A (zh) 2010-04-21
CN101697201B CN101697201B (zh) 2012-05-30

Family

ID=42142305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101926779A Expired - Fee Related CN101697201B (zh) 2009-09-25 2009-09-25 一种旋转方向无关的手写汉字识别方法

Country Status (1)

Country Link
CN (1) CN101697201B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324929A (zh) * 2013-06-25 2013-09-25 天津师范大学 基于子结构学习的手写中文识别方法
CN104408452A (zh) * 2014-11-17 2015-03-11 深圳市比一比网络科技有限公司 一种基于旋转投影宽度的拉丁字符倾斜纠正方法及系统
CN106056161A (zh) * 2016-06-02 2016-10-26 中国人民解放军军事医学科学院卫生装备研究所 一种针对平面旋转目标的视觉检测方法
CN105740860B (zh) * 2016-01-28 2018-04-06 河南大学 自然场景中商铺标牌汉字区域自动检测方法
CN111506348A (zh) * 2020-04-22 2020-08-07 广州光大教育软件科技股份有限公司 手写板校正多线程并行处理方法、装置、设备以及介质
CN112329777A (zh) * 2021-01-06 2021-02-05 平安科技(深圳)有限公司 基于方向检测的文字识别方法、装置、设备及介质
CN114580429A (zh) * 2022-01-26 2022-06-03 云捷计算机软件(江苏)有限责任公司 一种基于人工智能的语言和图像理解集成服务系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324929A (zh) * 2013-06-25 2013-09-25 天津师范大学 基于子结构学习的手写中文识别方法
CN103324929B (zh) * 2013-06-25 2016-05-18 天津师范大学 基于子结构学习的手写中文识别方法
CN104408452A (zh) * 2014-11-17 2015-03-11 深圳市比一比网络科技有限公司 一种基于旋转投影宽度的拉丁字符倾斜纠正方法及系统
CN104408452B (zh) * 2014-11-17 2019-01-15 深圳市比一比网络科技有限公司 一种基于旋转投影宽度的拉丁字符倾斜纠正方法及系统
CN105740860B (zh) * 2016-01-28 2018-04-06 河南大学 自然场景中商铺标牌汉字区域自动检测方法
CN106056161A (zh) * 2016-06-02 2016-10-26 中国人民解放军军事医学科学院卫生装备研究所 一种针对平面旋转目标的视觉检测方法
CN106056161B (zh) * 2016-06-02 2019-05-31 中国人民解放军军事医学科学院卫生装备研究所 一种针对平面旋转目标的视觉检测方法
CN111506348A (zh) * 2020-04-22 2020-08-07 广州光大教育软件科技股份有限公司 手写板校正多线程并行处理方法、装置、设备以及介质
CN112329777A (zh) * 2021-01-06 2021-02-05 平安科技(深圳)有限公司 基于方向检测的文字识别方法、装置、设备及介质
CN114580429A (zh) * 2022-01-26 2022-06-03 云捷计算机软件(江苏)有限责任公司 一种基于人工智能的语言和图像理解集成服务系统

Also Published As

Publication number Publication date
CN101697201B (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
CN101697201B (zh) 一种旋转方向无关的手写汉字识别方法
CN102982557B (zh) 基于深度相机的空间手势姿态指令处理方法
CN110232311B (zh) 手部图像的分割方法、装置及计算机设备
CN102704215B (zh) 基于dst文件解析与机器视觉结合的绣布自动切割方法
CN109597485B (zh) 一种基于双指角域特征的手势交互系统及其工作方法
CN107609489B (zh) 书法书写路径评价装置、方法及电子设备
EP2903256B1 (en) Image processing device, image processing method and program
CN103488972B (zh) 基于深度信息的指尖检测方法
CN106384355B (zh) 一种投影交互系统中的自动标定方法
CN103632142A (zh) 基于局部坐标系特征描述的图像匹配方法
CN110223202B (zh) 一种教学道具识别与评分的方法及系统
CN101901350A (zh) 一种基于特征向量的静态手势识别方法
CN101814185A (zh) 用于微小尺寸测量的线结构光视觉传感器标定方法
US20100103092A1 (en) Video-based handwritten character input apparatus and method thereof
CN113160285B (zh) 一种基于局部深度图像关键性的点云匹配方法
CN104392455B (zh) 基于方向检测的在线掌纹有效区域快速分割方法
CN105913435A (zh) 一种适用于大区域的多尺度遥感影像匹配方法及系统
TW200810518A (en) System and method for boundary scan of an image
CN105893981A (zh) 一种人脸姿态矫正方法
CN108010082A (zh) 一种几何匹配的方法
CN103092437A (zh) 一种基于图像处理技术的便捷式触控交互系统
CN101339661A (zh) 一种基于手持设备运动检测的实时人机交互方法和系统
CN109670447B (zh) 印章选票填涂框图像的识别方法、装置及可读存储介质
WO2020037466A1 (zh) 一种图像匹配方法及视觉系统
JP4308141B2 (ja) デジタルインクのセグメントの方向を推定する方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120530

Termination date: 20140925

EXPY Termination of patent right or utility model