CN102156889A - 一种识别手写文本行语言类别的方法及装置 - Google Patents

一种识别手写文本行语言类别的方法及装置 Download PDF

Info

Publication number
CN102156889A
CN102156889A CN 201110080818 CN201110080818A CN102156889A CN 102156889 A CN102156889 A CN 102156889A CN 201110080818 CN201110080818 CN 201110080818 CN 201110080818 A CN201110080818 A CN 201110080818A CN 102156889 A CN102156889 A CN 102156889A
Authority
CN
China
Prior art keywords
stroke
piece
pieces
handwritten text
much
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110080818
Other languages
English (en)
Inventor
郭育生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanwang Technology Co Ltd
Original Assignee
Hanwang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanwang Technology Co Ltd filed Critical Hanwang Technology Co Ltd
Priority to CN 201110080818 priority Critical patent/CN102156889A/zh
Publication of CN102156889A publication Critical patent/CN102156889A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明公开了一种识别手写文本行语言类别的方法及装置,属于输入法技术领域。该方法包括:将手写文本行分割成多个笔划几何块;分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别。本发明通过先将手写文本行分割成多个笔划几何块,然后分别计算每个笔划几何块的预设语言可信度,最后根据该手写文本行中所有笔划几何块的预设语言可信度,识别该手写文本行的语言类别,使得用户在进行多语言的手写文本行输入时,不必要预先指定手写文本行的语言类别,方便了用户进行手写文本输入,同时有效地提高了手写输入的速度。

Description

一种识别手写文本行语言类别的方法及装置
技术领域
本发明属于输入法技术领域,涉及一种识别手写文本行语言类别的方法,特别是涉及一种识别手写文本行语言类别的方法及装置。
背景技术
随着移动终端和触控技术的发展,手写技术以其方便、快速的优势得到了更加广泛的应用。对手写文本的识别也逐步从单个字符的识别发展到文本行的识别,中文和英文两种语言类别的文本行识别是目前应用最多的。
现有的大部分手写文本行识别技术中,通过在一个终端上加载不同的识别语言包来实现特定语言的手写文本行输入,该方法无法在同一个终端上识别多种语言的手写文本行,当需要识别其他语言的手写文本行时,需要首先卸载当前识别语言包,然后,再安装另一种识别语言包,使用起来非常不方便。一种改进的手写文本行识别技术的应用是同时加载多个识别语言包,进行手写文本行识别之前,首先指定手写文本行的语言类别,在用户完成文本行的输入后,只能按照指定的语言类别对输入的文本行进行识别。这种应用,要求使用者在每次输入不同语言类别的文本行之前,首先设置识别的文本行的语言类别,用户使用起来也非常不方便,也影响输入的速度。
发明内容
本发明的目的在于提供一种识别手写文本行语言类别的方法及装置,能够自动识别手写文本行语言类别,在进行手写文本行识别之前,不需要用户手动设置手写文本行的识别范围,方便用户进行多语言的文本行输入,也提高了输入的速度。
本发明提供了如下方案:
一种识别手写文本行语言类别的方法,包括:
获取手写文本行,将手写文本行分割成多个笔划几何块;
分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;
根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别。
优选的,所述将手写文本行分割成多个笔划几何块,包括:从手写文本行的笔迹数据中提取所有笔划,并将每个笔划初始化为相应的笔划块;通过合并水平投影重叠的笔划块,将多个笔划块合并成至少一个笔划几何块。所述笔迹数据包括构成笔划的笔迹点坐标和笔划结束标志,所述笔划几何块包括至少一个笔划。
优选的,所述合并水平投影重叠的笔划块,将多个笔划块分割成至少一个笔划几何块,包括:
S1、依序取两个相邻的笔划块;
S2、判断所述两个相邻的笔划块的水平投影是否重叠,如果重叠,将所述两个相邻的笔划块合并为合并笔划块;
S3、依序取与所述合并笔划块相邻的笔划块,并判断所述合并笔划块和该相邻的笔划块的水平投影是否重叠,如果重叠,将所述合并笔划块和该相邻的笔划块合并为另一合并笔划块,重复S3;否则,所述合并笔划块形成一个笔划几何块,转至S1;
S4、重复步骤S3,直至所有笔划块合并完成;
其中,所述合并笔划块包括至少两个笔划的笔划块。
所述相邻笔划块指按笔划书写顺序相邻的笔划块。
优选的,在所述合并笔划块和与其相邻的笔划块的笔划四周分别沿水平方向和垂直方向绘制线条形成一个四边形区域,该四边形区域包括:上边框、下边框、左边框和右边框;
其中,所述上边框通过笔划块中的笔划笔迹点中位于最顶侧的笔迹点沿水平方向绘制线条形成,所述下边框通过沿笔划块中的笔划笔迹点中位于最底侧的笔迹点沿水平方向绘制线条形成,所述左边框通过沿笔划块中的笔划笔迹点中位于最左侧的笔迹点沿垂直方向绘制线条形成,所述右边框通过沿笔划块中的笔划笔迹点中位于最右侧的笔迹点沿垂直方向绘制线条形成。
其中,所述两个相邻的笔划块包括第一笔划块和第二笔划块;
判断两个相邻的笔划块的水平投影是否重叠时,若第一笔划块的左边框在第二笔划块的右边框的左侧且第一笔划块的右边框在第二笔划块的左边框的右侧,则该两个笔划块的水平投影重叠。
优选的,所述预设语言包括:中文、日文和韩文,所述笔划几何块的特征包括:预设语言字符识别可信度、高宽比、笔迹点密度和笔划数。
优选的,所述第                                                
Figure 345863DEST_PATH_IMAGE002
个笔划几何块的预设语言可信度
Figure 2011100808185100002DEST_PATH_IMAGE003
通过公式计算得到,其中,所述
Figure 2011100808185100002DEST_PATH_IMAGE005
表示第k个特征的权重,满足条件
Figure 405272DEST_PATH_IMAGE006
,所述
Figure 2011100808185100002DEST_PATH_IMAGE007
表示笔划几何块
Figure 988831DEST_PATH_IMAGE008
的第k个特征的特征值。
优选的,所述根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别,包括:根据多个笔划几何块的预设语言可信度,获得该手写文本行的预设语言可信度;根据手写文本行的预设语言可信度识别所述手写文本行的语言类别。
优选的,通过公式
Figure 2011100808185100002DEST_PATH_IMAGE009
获得手写文本行的预设语言可信度
Figure 411722DEST_PATH_IMAGE010
i为变量,代表笔划几何块的范围,
Figure 2011100808185100002DEST_PATH_IMAGE011
表示手写文本行经分割获得的所有笔划几何块。手写文本行经分割获得的所有笔划几何块的预设语言可信度的最大值即为该手写文本行的预设语言可信度,所述为第i个笔划几何块的预设语言可信度,为大于等于0,且小于等于1的数。
一种识别手写文本行语言类别的装置,包括:
笔划几何块分割单元,用于获取手写文本行,将手写文本行分割成多个笔划几何块;
笔划几何块识别单元,用于分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;
文本行识别单元,用于根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行语言类别。
所述笔划几何块分割单元进一步包括:
笔划提取子单元,用于从手写文本行的笔迹数据中提取多个笔划块,并将每个笔划初始化为相应的笔划块,所述笔迹数据包括构成笔划的笔迹点坐标和笔划结束标志。
笔划块合并子单元,用于通过合并水平投影重叠的笔划块,将多个笔划块合并成至少一个笔划几何块,包括:
S1、依序取两个相邻的笔划块;
S2、判断所述两个相邻的笔划块的水平投影是否重叠,如果重叠,将所述两个相邻的笔划块合并为合并笔划块;
S3、依序取与所述合并笔划块相邻的笔划块,并判断所述合并笔划块和该相邻的笔划块的水平投影是否重叠,如果重叠,将所述合并笔划块和该相邻的笔划块合并为另一合并笔划块,重复S3;否则,所述合并笔划块形成一个笔划几何块,转至S1;
S4、重复步骤S3,直至所有笔划块合并完成;
其中,所述合并笔划块包括至少两个笔划的笔划块。
所述相邻笔划块指按笔划书写顺序相邻的笔划块。
优选的,在所述合并笔划块和与其相邻的笔划块的笔划四周分别沿水平方向和垂直方向绘制线条形成一个四边形区域,该四边形区域包括:上边框、下边框、左边框和右边框;
其中,所述上边框通过笔划块中的笔划笔迹点中位于最顶侧的笔迹点沿水平方向绘制线条形成,所述下边框通过沿笔划块中的笔划笔迹点中位于最底侧的笔迹点沿水平方向绘制线条形成,所述左边框通过沿笔划块中的笔划笔迹点中位于最左侧的笔迹点沿垂直方向绘制线条形成,所述右边框通过沿笔划块中的笔划笔迹点中位于最右侧的笔迹点沿垂直方向绘制线条形成。
其中,所述两个相邻的笔划块包括第一笔划块和第二笔划块;
判断两个相邻的笔划块的水平投影是否重叠时,若第一笔划块的左边框在第二笔划块的右边框的左侧且第一笔划块的右边框在第二笔划块的左边框的右侧,则该两个笔划块的水平投影重叠。
根据本发明提供的具体实施例,本发明具有以下技术效果:
本发明实施例通过先将手写文本行分割成多个笔划几何块;然后分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;最后根据该手写文本行中所有笔划几何块的预设语言可信度,识别该手写文本行的语言类别,使得用户在进行多语言的手写文本行输入时,不必要预先指定手写文本行的语言类别,方便了用户进行手写文本输入,同时有效地提高了手写输入的速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例的部分附图,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的方法的流程图;
图2是本发明实施例手写中文文本行示意图;
图3是本发明实施例手写英文文本行示意图;
图4是本发明实施例手写中文文本行中的笔划形成笔划块的示意图;
图5是本发明实施例图2 所示的手写中文文本行分割成笔划几何块的示意图;
图6是图3所示的手写英文文本行分割成笔划几何块的示意图;
图7是图5 所示的笔划几何块对应的中文可信度示意图;
图8是图6所示的笔划几何块对应的中文可信度示意图;
图9是本发明实施例提供的装置的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
本发明的方法适用于任何二维坐标系,本实施例中仅以常见的如图4所示的坐标系为例。
参见图1,本发明实施例提供的识别手写文本行语言类别的方法包括以下步骤:
S101:获取手写文本行,将手写文本行分割成多个笔划几何块;
在手写识别技术中,可以通过手写板或平板电脑等任何支持手写输入功能的设备获得手写文本行,如何获得手写文本行的笔迹数据已经为本领域的技术人员所熟知,在此不再赘述。手写文本行的笔迹数据由多个笔划的笔迹数据和文本行结束标志组成,每个笔划的笔迹数据又包括构成笔划的笔迹点坐标和笔划结束标志。本实施例中假设文本行结束标志为(-1,-1),笔划结束标志为(-1,0),手写文本行的笔迹数据表示为{(x11,y11),(x12,y12),…,(-1,0), …, (xn1,yn1),(xn2,yn2),…,(-1,0) ,(-1,-1)},其中n为大于1的正整数,以上笔迹数据表示手写文本行由n个笔划组成,(xn1,yn1)为第n个笔划的第一个笔迹点的坐标。
在本步骤中,手写输入如图2和图3所示的文本行,当然也可以输入日文文本行、英文文本行、韩文文本行、俄文文本行等,本实施例仅以中文文本行和英文文本行为例。首先从手写文本行的笔迹数据中提取所有笔划,并将每个笔划初始化为一个相应的笔划块。此处的每个笔划块中包含一个笔划。如图4所示,通过在笔划四周分别沿水平方向和垂直方向绘制线条形成一个四边形区域,该四边形区域包括:上边框、下边框、左边框和右边框。所述上边框、下边框、左边框和右边框叫做笔划块的边框,根据构成笔划块的笔划笔迹点的坐标数据得到。在如图4所示的坐标系中,各边框通过以下方式获得:上边框通过沿笔划块中的笔划笔迹点中位于最顶侧(纵坐标最大)的笔迹点沿水平方向绘制线条形成;下边框通过沿笔划块中的笔划笔迹点中位于最底侧(纵坐标最小)的笔迹点沿水平方向绘制线条形成;左边框通过沿笔划块中的笔划笔迹点中位于最左侧(横坐标最小)的笔迹点沿垂直方向绘制线条形成;右边框通过沿笔划块中的笔划笔迹点中位于最右侧(横坐标最大)的笔迹点沿垂直方向绘制线条形成。以图2中的手写文本行为例,按照上述方法获得的前六个笔划对应的笔划块,如图4所示,分别为:b1、b2、b3、b4、b5、b6。同理可分别获得图2和图3所示的手写文本行中的所有笔划块
Figure 981692DEST_PATH_IMAGE012
(1≤i≤n,其中n为手写文本行中全部笔划数)。
然后,通过合并水平投影重叠的笔划块,将多个笔划块合并成至少一个笔划几何块。水平投影指水平方向的一条线段,通过在笔划块的右边框在水平方向的投影点和左边框在水平方向上的投影点之间连接线段得到,也可以通过笔划块包括的笔划的所有笔迹点分别向水平方向投影得到。上述步骤中获得的笔划块
Figure 872288DEST_PATH_IMAGE012
是由所有字符的笔划组成的。根据多数人的书写习惯,通常在手写输入文本行的过程中字符之间在水平方向上的投影是没有重叠的,而同一个字符内的笔划在水平方向上的投影是有重叠的,通过判断笔划块在水平方向上的投影是否有重叠部分,将水平投影重叠的笔划块合并成一个包括至少两个笔划的合并笔划块,将水平投影与其他笔划块的水平投影没有重叠的笔划块作为一个笔划几何块,可以将多个笔划块合并成至少一个笔划几何块,一个笔划几何块中包括一个或多个笔划,经合并获得的笔划几何块代表一个独立字符的可能性非常大。
经合并获得的笔划几何块中的笔划同样可以确定一个四边形区域,该四边形区域包括:上边框、下边框、左边框和右边框。所述上边框、下边框、左边框和右边框叫做笔划几何块的边框,根据构成笔划几何块的笔划笔迹点的坐标数据得到。笔划几何块的边框形成方法与笔划块的形成方法相同,各边框通过以下方式获得:上边框通过沿笔划几何块中的笔划笔迹点中位于最顶侧(纵坐标最大)的笔迹点沿水平方向绘制线条形成;下边框通过沿笔划几何块中的笔划笔迹点中位于最底侧(纵坐标最小)的笔迹点沿水平方向绘制线条形成;左边框通过沿笔划几何块中的笔划笔迹点中位于最左侧(横坐标最小)的笔迹点沿垂直方向绘制线条形成;右边框通过沿笔划几何块中的笔划笔迹点中位于最右侧(横坐标最大)的笔迹点沿垂直方向绘制线条形成。当然,如果字符之间有连接,可能将多个字符分割到一个笔划几何块中。
合并水平投影重叠的笔划块时,首先需要获得两个相邻的笔划块,分别设为第一笔划块和第二笔划块,在判断两个相邻的笔划块的水平投影重叠是否重叠时,若第一笔划块的左边框在第二笔划块的右边框的左侧且第一笔划块的右边框在第二笔划块的左边框的右侧,则该两个笔划块的水平投影重叠。
具体实施时,分为以下步骤:
S1、依序取两个相邻的笔划块;
按照笔划将文本行进行切分后,得到对应于每个笔划的笔划块,所述笔划块按照笔划的书写顺序排列。依序取两个相邻的笔划块,包括第一笔划块为
Figure 200501DEST_PATH_IMAGE012
和第二笔划块为
Figure 2011100808185100002DEST_PATH_IMAGE013
S2、判断所述两个相邻的笔划块的水平投影是否重叠,如果重叠,将所述两个相邻的笔划块合并为合并笔划块;
如果第一笔划块
Figure 340495DEST_PATH_IMAGE012
的左边框在第二笔划块
Figure 45146DEST_PATH_IMAGE013
的右边框的左侧且第一笔划块
Figure 334789DEST_PATH_IMAGE012
的右边框在第二笔划块
Figure 302745DEST_PATH_IMAGE013
的左边框的右侧,则该两个笔划块的水平投影重叠,将这两个笔划块合并为一个合并笔划块
Figure 930035DEST_PATH_IMAGE014
,所述合并笔划块包括至少两个笔划。否则,第一笔划块
Figure 641639DEST_PATH_IMAGE012
形成一个笔划几何块,其中m为大于等于1的正整数。
S3、依序取与所述合并笔划块相邻的笔划块,并判断所述合并笔划块和该相邻的笔划块的水平投影是否重叠,如果重叠,将所述合并笔划块和该相邻的笔划块合并为另一合并笔划块,重复S3;否则,所述合并笔划块形成一个笔划几何块,转至S1;
取与合并笔划块
Figure 569144DEST_PATH_IMAGE014
中的笔划相邻的下一笔划对应的笔划块
Figure 708001DEST_PATH_IMAGE016
,如果合并笔划块
Figure 573320DEST_PATH_IMAGE014
的左边框在笔划块
Figure 823036DEST_PATH_IMAGE016
的右边框的左侧且合并笔划块
Figure 339468DEST_PATH_IMAGE014
的右边框在笔划块
Figure 180385DEST_PATH_IMAGE016
的左边框的右侧,则该两个笔划块的水平投影重叠,将这两个笔划块合并为另一合并笔划块,转至步骤S4;否则,将当前获得的合并笔划块
Figure 782267DEST_PATH_IMAGE014
作为一个笔划几何块
Figure 835674DEST_PATH_IMAGE015
,其中m为大于等于1的正整数,转至步骤S1,以笔划几何块
Figure 957345DEST_PATH_IMAGE015
中的笔划为参考,依序取下两个相邻的笔划对应的笔划块,继续合并剩余的笔划块。
S4、重复步骤S3,直至所有笔划块合并完成;
重复步骤S3,取与合并笔划块
Figure 969163DEST_PATH_IMAGE017
中的笔划相邻的下一笔划对应的笔划块
Figure 792763DEST_PATH_IMAGE018
,进一步合并剩余的笔划块。依此类推,直到所有的笔划块合并完成,最后即得到多个笔划几何块
图2、图3所示的手写文本行的分割结果分别如图5和图6所示。图2的手写文本行经过合并获得的9个笔划几何块
Figure 2011100808185100002DEST_PATH_IMAGE019
Figure 875305DEST_PATH_IMAGE020
、…、
Figure 2011100808185100002DEST_PATH_IMAGE021
, 如图5所示;图3的手写文本行经过合并获得的7个笔划几何块
Figure 339916DEST_PATH_IMAGE019
、...、
Figure 311600DEST_PATH_IMAGE022
,如图6所示。
S102:分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;
本发明中的预设语言可以是任何方块文字语言,包括:中文、日文、韩文等;本发明的方法适用于识别任何方块文字语言和西文文字语言的手写文本行的语言类别,如手写中文文本行和英文文本行、手写韩文文本行和英文文本行、手写日文文本行和俄文文本行。对不同的方块文字语言文本行进行识别时需要使用该语言的单字符识别核心。
本例中以手写中文文本行和英文文本行为例对本方法进行说明,其中,预设语言为中文,预设语言可信度为中文可信度。所述中文可信度是根据笔划几何块的特征计算得到的值,指笔划几何块是中文几何块的可能性,其取值为大于等于0且小于等于1的数。中文可信度为1说明笔划几何块为中文笔划几何块,中文可信度为0说明笔划几何块为英文笔划几何块。
笔划几何块的特征有很多,本方法提取的笔划几何块的特征包括:预设语言字符识别可信度、高宽比、笔迹点密度和笔划数。当需要识别中、英文手写文本行的语言类别时,所述预设语言字符识别可信度为中文字符识别可信度。其中,中文字符识别可信度是指中文单字符识别核心识别该字符或笔划块或笔划几何块的识别结果候选字符为中文的可能性,其取值为大于等于0且小于等于1的数。根据手写文本行的所有笔划几何块的特征,可以获得手写文本行语言类别。中文字符识别可信度为1说明识别结果候选字符为中文,中文字符识别可信度为0说明识别结果候选字符为英文。笔划几何块的一个特征是笔划几何块的中文字符识别可信度,其获得步骤为:首先将笔划几何块做为一个字符,构成该笔划块的笔划做为字符的笔划,采用中文字符识别技术识别所述笔划几何块,获得每个笔划几何块的识别结果,所述识别结果包括:多个识别身份候选字符及每个身份候选字符的中文字符识别可信度,所述识别身份候选字符按照其对应的中文字符识别可信度降序排列;然后分别遍历每个笔划几何块的识别结果中的识别身份候选字符,找到第一个中文字符(即中文字符识别可信度最大的字符),其对应的中文字符识别可信度即为该几何块的中文字符识别可信度,如果没有找到中文字符,该笔划几何块的中文字符识别可信度为0。通过上述步骤,得到m个笔划几何块
Figure 391551DEST_PATH_IMAGE019
、…、
Figure 25588DEST_PATH_IMAGE015
,将中文字符识别可信度作为该笔划几何块的第一个特征
笔划几何块的第二个特征是笔划几何块的高宽比。根据中文字符和英文字符的字形特点,确定笔划几何块的高宽比为笔划几何块的又一个特征,笔划几何块的高宽比通过下述方法获得:
令笔划几何块的高度为H,宽度为W,笔划几何块高宽比=H/W。
其中,笔划几何块的高度H=|(y1- y2)|,所述y1和y2分别是笔划几何块上边框在垂直方向(即纵轴上)的投影点的纵坐标和笔划几何块下边框在垂直方向(即纵轴上)的投影点的纵坐标。
笔划几何块的宽度W=|(x1- x2)|,所述x1和x2分别是笔划几何块左边框在水平方向(即横轴上)的投影点的横坐标和笔划几何块右边框在水平方向(即横轴上)的投影点的横坐标。
将笔划几何块高宽比H/W作为笔划几何块的第二个特征
Figure 755646DEST_PATH_IMAGE024
笔划几何块的第三个特征
Figure 2011100808185100002DEST_PATH_IMAGE025
是笔划几何块的笔迹点密度。笔划几何块中的笔迹点的数目是已知的,可以从手写文本行的笔迹数据中获得。如果笔划几何块中的笔迹点的数目是D,则笔划几何块的笔迹点密度ρ=D/(H×W)。
笔划几何块的第四个特征
Figure 221263DEST_PATH_IMAGE026
是笔划几何块中的笔划数,可以通过计算手写文本行的笔迹数据中的笔划结束标志获得。
通过以上所述方法提取到的笔划几何块的特征后,根据所述笔划几何块的特征计算所述笔划几何块的中文可信度即是对手写文本行进行语言类别进行判断。
对于笔划几何块
Figure 2011100808185100002DEST_PATH_IMAGE027
,其四个特征为
Figure 762097DEST_PATH_IMAGE028
,该笔划几何块的中文可信度
Figure 47584DEST_PATH_IMAGE004
,其中
Figure 784596DEST_PATH_IMAGE005
为第k个特征的权重,,
Figure 800143DEST_PATH_IMAGE007
为第i个笔划几何块的第k个特征的特征值,若
Figure 58080DEST_PATH_IMAGE003
大于
Figure 2011100808185100002DEST_PATH_IMAGE029
即可认为笔划几何块
Figure 129941DEST_PATH_IMAGE008
为中文几何块。图7和图8中笔划几何块下方的数字如0.95、0.84、0.0等即为该笔划几何块对应的中文可信度。上述阈值
Figure 304570DEST_PATH_IMAGE029
可以为0.6或0.5等,是根据手写文本行训练结果设置的常量。
S103:根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别。
根据获得的每个笔划几何块的中文可信度
Figure 899817DEST_PATH_IMAGE003
计算手写文本行的中文可信度,具体公式如下:
Figure 260522DEST_PATH_IMAGE009
其中,i为变量,代表笔划几何块的范围,
Figure 289658DEST_PATH_IMAGE011
表示手写文本行经分割获得的所有笔划几何块。手写文本行经分割获得的所有笔划几何块的中文可信度的最大值即为该手写文本行的中文可信度。根据手写文本行的中文可信度识别所述手写文本行语言类别,若
Figure 795726DEST_PATH_IMAGE010
大于阈值T,则手写文本行S的语言类别为中文,否则手写文本行S的语言类别为英文。本例中,通过预先训练,得到手写文本行的中文可信度阈值T=0.8。根据上述计算手写文本行的中文可信度的公式,可以得出图7所示的手写文本行的中文可信度
Figure 543102DEST_PATH_IMAGE010
=0.98,因此该手写文本行为中文文本行;图8所示的手写文本行的中文可信度
Figure 425607DEST_PATH_IMAGE010
=0.36,因此该手写文本行为英文文本行。
本发明提供的方法,通过对每一个笔划几何块进行识别,得到其对应的候选字符及候选字符的预设语言可信度,再根据所有笔划几何块的预设语言可信度判断所述手写文本行的语言类别,能够有效地对连笔的西文单词块和过切分的左右结构方块字进行语言识别,因此,利用本发明实施例的技术方案能够避免几何切分不准确对手写文本行识别结果的影响,从而提高了识别手写文本行语言类别的准确性。
本发明实施例通过先将手写文本行分割成多个笔划几何块;然后分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;最后根据该手写文本行中所有笔划几何块的预设语言可信度,识别该手写文本行的语言类别,使得用户在进行多语言的手写文本行输入时,不必要预先指定手写文本行的语言类别,方便了用户进行手写文本输入,同时有效地提高了手写输入的速度。
与本发明实施例提供的识别手写文本行语言类别的方法相对应,本发明实施例还提供了一种识别手写文本行语言类别的装置,参见图9,该装置包括以下单元:
笔划几何块分割单元91,用于获取手写文本行,将手写文本行分割成多个笔划几何块;
笔划几何块识别单元92,用于分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;
文本行识别单元93,用于根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行语言类别。
所述笔划几何块分割单元91进一步包括:
笔划提取子单元,用于从手写文本行的笔迹数据中提取多个笔划块,并将每个笔划初始化为一个相应的笔划块,所述笔迹数据包括构成笔划的笔迹点坐标和笔划结束标志。
笔划块合并子单元,用于通过合并水平投影重叠的笔划块,将多个笔划块合并成至少一个笔划几何块,具体方法同本发明方法实施例提供的方法步骤S101中的步骤S1至S4;
所述笔划几何块识别单元92提取的笔划块的特征包括:预设语言字符识别可信度、高宽比、笔划点密度和笔划数。根据提取的所述笔划几何块的上述特征,计算该笔划几何块的预设语言可信度。
本发明一种识别手写文本行语言类别的装置通过先将手写文本行分割成多个笔划几何块;然后分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;最后根据该手写文本行中所有笔划几何块的预设语言可信度,识别该手写文本行的语言类别,使得用户在进行多语言的手写文本行输入时,不必要预先指定手写文本行的语言类别,方便了用户进行手写文本输入,同时有效地提高了手写输入的速度。
以上对本发明所提供的一种识别手写文本行语言类别的方法及装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种识别手写文本行语言类别的方法,其特征在于,包括:
获取手写文本行,将手写文本行分割成多个笔划几何块;
分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;
根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别。
2.根据权利要求1所述的方法,其特征在于,所述将手写文本行分割成多个笔划几何块,包括:
从手写文本行的笔迹数据中提取所有笔划,并将每个笔划初始化为相应的笔划块;
通过合并水平投影重叠的笔划块,将多个笔划块合并成至少一个笔划几何块;
其中,所述笔迹数据包括手写文本行中构成笔划的笔迹点坐标和笔划结束标志,所述笔划几何块包括至少一个笔划。
3.根据权利要求2所述的方法,其特征在于,所述通过合并水平投影重叠的笔划块,将多个笔划块合并成至少一个笔划几何块,包括:
S1、依序取两个相邻的笔划块;
S2、判断所述两个相邻的笔划块的水平投影是否重叠,如果重叠,将所述两个相邻的笔划块合并为合并笔划块;
S3、依序取与所述合并笔划块相邻的笔划块,并判断所述合并笔划块和该相邻的笔划块的水平投影是否重叠,如果重叠,将所述合并笔划块和该相邻的笔划块合并为另一合并笔划块,重复S3;否则,所述合并笔划块形成一个笔划几何块,转至S1;
S4、重复步骤S3,直至所有笔划块合并完成;
其中,所述合并笔划块为包括至少两个笔划的笔划块。
4.根据权利要求3所述的方法,其特征在于,所述相邻笔划块指笔划书写顺序相邻的笔划块。
5.根据权利要求3所述的方法,其特征在于,所述步骤S3还包括:在所述合并笔划块和与其相邻的笔划块的笔划四周分别沿水平方向和垂直方向绘制线条形成一个四边形区域,该四边形区域包括:上边框、下边框、左边框和右边框;
其中,所述上边框通过笔划块中的笔划笔迹点中位于最顶侧的笔迹点沿水平方向绘制线条形成,所述下边框通过沿笔划块中的笔划笔迹点中位于最底侧的笔迹点沿水平方向绘制线条形成,所述左边框通过沿笔划块中的笔划笔迹点中位于最左侧的笔迹点沿垂直方向绘制线条形成,所述右边框通过沿笔划块中的笔划笔迹点中位于最右侧的笔迹点沿垂直方向绘制线条形成。
6.根据权利要求5所述的方法,其特征在于,所述两个相邻的笔划块包括第一笔划块和第二笔划块;判断两个相邻的笔划块的水平投影是否重叠时,若第一笔划块的左边框在第二笔划块的右边框的左侧且第一笔划块的右边框在第二笔划块的左边框的右侧,则该两个笔划块的水平投影重叠。
7.根据权利要求6所述的方法,其特征在于,所述笔划几何块的特征包括:预设语言字符识别可信度、高宽比、笔迹点密度和笔划数。
8.根据权利要求7所述的方法,其特征在于,所述第i个笔划几何块的预设语言可信度P(B′i)通过公式
Figure FDA0000053362660000021
计算得到,其中,所述ωk表示第k个特征的权重,满足条件所述xk(B′i)表示笔划几何块B′i的第k个特征的特征值。
9.根据权利要求1所述的方法,其特征在于,所述根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别,包括:根据多个笔划几何块的预设语言可信度,获得该手写文本行的预设语言可信度;根据手写文本行的预设语言可信度识别所述手写文本行的语言类别。
10.根据权利要求9所述的方法,其特征在于,手写文本行经分割获得的所有笔划几何块的预设语言可信度的最大值即为该手写文本行的预设语言可信度。
11.根据权利要求10所述的方法,其特征在于,所述预设语言包括:中文、日文和韩文。
12.一种识别手写文本行语言类别的装置,包括:
笔划几何块分割单元,用于获取手写文本行,将手写文本行分割成多个笔划几何块;
笔划几何块识别单元,用于分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;
文本行识别单元,用于根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行语言类别。
13.根据权利要求12所述的装置,其特征在于,所述笔划几何块分割单元还包括:
笔划提取子单元,用于从手写文本行的笔迹数据中获得多个笔划块,所述笔迹数据包括构成笔划的笔迹点坐标和笔划结束标志;
笔划块合并子单元,用于通过合并水平投影重叠的笔划块,将多个笔划块合并成至少一个笔划几何块。
CN 201110080818 2011-03-31 2011-03-31 一种识别手写文本行语言类别的方法及装置 Pending CN102156889A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110080818 CN102156889A (zh) 2011-03-31 2011-03-31 一种识别手写文本行语言类别的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110080818 CN102156889A (zh) 2011-03-31 2011-03-31 一种识别手写文本行语言类别的方法及装置

Publications (1)

Publication Number Publication Date
CN102156889A true CN102156889A (zh) 2011-08-17

Family

ID=44438379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110080818 Pending CN102156889A (zh) 2011-03-31 2011-03-31 一种识别手写文本行语言类别的方法及装置

Country Status (1)

Country Link
CN (1) CN102156889A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103197869A (zh) * 2012-01-05 2013-07-10 汉王科技股份有限公司 简繁体中文输入方法及装置
CN103294259A (zh) * 2012-03-02 2013-09-11 卡西欧计算机株式会社 手写输入装置和手写输入方法
CN103324929A (zh) * 2013-06-25 2013-09-25 天津师范大学 基于子结构学习的手写中文识别方法
CN104704510A (zh) * 2012-10-10 2015-06-10 摩托罗拉解决方案公司 识别在文档中使用的语言并且基于识别的语言执行ocr识别的方法和装置
CN104809483A (zh) * 2014-01-26 2015-07-29 安徽科大讯飞信息科技股份有限公司 实现任意方向书写文本行切分的方法及系统
CN110858317A (zh) * 2018-08-24 2020-03-03 北京搜狗科技发展有限公司 手写识别方法及装置
US10691935B2 (en) * 2017-04-06 2020-06-23 Samsung Electronics Co., Ltd Apparatus for providing graphic effect of handwriting input and method thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1257238A (zh) * 1998-12-11 2000-06-21 高静敏 中文手写输入和检索的简化方法
CN1276077A (zh) * 1997-09-15 2000-12-06 卡艾尔公司 用于多种语言光字符识别的自动语言识别系统
CN1719454A (zh) * 2005-07-15 2006-01-11 清华大学 几何代价和语义-识别代价融合的脱机手写汉字切分方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1276077A (zh) * 1997-09-15 2000-12-06 卡艾尔公司 用于多种语言光字符识别的自动语言识别系统
CN1257238A (zh) * 1998-12-11 2000-06-21 高静敏 中文手写输入和检索的简化方法
CN1719454A (zh) * 2005-07-15 2006-01-11 清华大学 几何代价和语义-识别代价融合的脱机手写汉字切分方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103197869A (zh) * 2012-01-05 2013-07-10 汉王科技股份有限公司 简繁体中文输入方法及装置
CN103197869B (zh) * 2012-01-05 2016-01-27 汉王科技股份有限公司 简繁体中文输入方法及装置
CN103294259A (zh) * 2012-03-02 2013-09-11 卡西欧计算机株式会社 手写输入装置和手写输入方法
CN104704510A (zh) * 2012-10-10 2015-06-10 摩托罗拉解决方案公司 识别在文档中使用的语言并且基于识别的语言执行ocr识别的方法和装置
CN104704510B (zh) * 2012-10-10 2018-08-31 摩托罗拉解决方案公司 识别在文档中使用的语言并且基于识别的语言执行ocr识别的方法和装置
CN103324929A (zh) * 2013-06-25 2013-09-25 天津师范大学 基于子结构学习的手写中文识别方法
CN103324929B (zh) * 2013-06-25 2016-05-18 天津师范大学 基于子结构学习的手写中文识别方法
CN104809483A (zh) * 2014-01-26 2015-07-29 安徽科大讯飞信息科技股份有限公司 实现任意方向书写文本行切分的方法及系统
CN104809483B (zh) * 2014-01-26 2019-04-05 科大讯飞股份有限公司 实现任意方向书写文本行切分的方法及系统
US10691935B2 (en) * 2017-04-06 2020-06-23 Samsung Electronics Co., Ltd Apparatus for providing graphic effect of handwriting input and method thereof
CN110858317A (zh) * 2018-08-24 2020-03-03 北京搜狗科技发展有限公司 手写识别方法及装置

Similar Documents

Publication Publication Date Title
CN102156889A (zh) 一种识别手写文本行语言类别的方法及装置
CN101299236B (zh) 一种中文手写词组识别方法
EP1564675B1 (en) Apparatus and method for searching for digital ink query
CN105260751B (zh) 一种文字识别方法及其系统
EP3522038A1 (en) Method for translating characters and apparatus therefor
CN102208039B (zh) 一种多语言混合手写文本行的识别方法及装置
CN103455264B (zh) 一种手写汉字输入方法及具有该方法的电子装置
CN100555312C (zh) 利用字符结构信息进行后处理的手写识别的方法和装置
KR20180119647A (ko) 문자열에 문자를 삽입하기 위한 방법 및 대응하는 디지털 디바이스
CN102073884A (zh) 一种手写识别方法、系统及手写识别终端
CN102419645A (zh) 组合输入汉字的方法和装置、掌上终端
CN102063620A (zh) 一种手写识别方法、系统及手写识别终端
KR20180119646A (ko) 문자열에 문자 삽입을 위한 방법 및 시스템
Roy et al. Morphology based handwritten line segmentation using foreground and background information
US9519404B2 (en) Image segmentation for data verification
CN104346071A (zh) 显示控制装置和显示控制方法
CN108062301B (zh) 文字翻译方法及其装置
CN115004262B (zh) 处理手写中列表的方法和计算装置
US9418281B2 (en) Segmentation of overwritten online handwriting input
TWI503740B (zh) A method of improving handwriting input efficiency
JP6081606B2 (ja) 電子機器および方法
Ladwani et al. Novel approach to segmentation of handwritten Devnagari word
Silva et al. Segmenting sinhala handwritten characters
CN104794140B (zh) 一种文本高亮显示的方法和装置
US20150169949A1 (en) Segmentation of Devanagari-Script Handwriting for Recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110817