CN102073870A - 一种触摸屏汉字笔迹识别方法 - Google Patents

一种触摸屏汉字笔迹识别方法 Download PDF

Info

Publication number
CN102073870A
CN102073870A CN 201110003656 CN201110003656A CN102073870A CN 102073870 A CN102073870 A CN 102073870A CN 201110003656 CN201110003656 CN 201110003656 CN 201110003656 A CN201110003656 A CN 201110003656A CN 102073870 A CN102073870 A CN 102073870A
Authority
CN
China
Prior art keywords
handwriting
user
standardization
result
chinese character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110003656
Other languages
English (en)
Inventor
吴震东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Hangzhou Electronic Science and Technology University
Original Assignee
Hangzhou Electronic Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Electronic Science and Technology University filed Critical Hangzhou Electronic Science and Technology University
Priority to CN 201110003656 priority Critical patent/CN102073870A/zh
Publication of CN102073870A publication Critical patent/CN102073870A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明涉及触摸屏汉字笔迹识别方法,用户笔迹特征获取过程:一,用户在触摸屏上书写汉字,用触摸屏数据采样函数记录用户书写轨迹,取得采样结果;二,将采样结果标准化;三,将标准化后结果依据用户书写时的笔划进行分段,形成若干笔迹向量;四,将获得的笔迹向量进行向量聚类,结果作为用户笔迹特征存入用户笔迹特征库;用户笔迹鉴别过程:一,用户输入汉字;二,用触摸屏数据采样函数记录用户手写轨迹,取得采样结果;三,将采样结果进行标准化处理;四,将标准化后结果依据用户书写时的笔划进行分段,形成若干笔迹向量;五,将获得的笔迹向量与用户笔迹特征库中同一汉字的笔迹向量进行向量余弦值比对,结果大于设定的阈值即判定为用户笔迹。

Description

一种触摸屏汉字笔迹识别方法
技术领域
本发明属于笔迹识别技术领域,具体涉及一种触摸屏汉字笔迹识别方法。
背景技术
笔迹识别技术作为一种生物特征识别技术,在用户身份鉴定、电子文档保护及基于生物特征的机器操控等领域具有较好的应用前景。
随着智能手机的大量普及,触摸屏输入方式已成为智能终端的标准输入方式之一。在触摸屏上实现手写笔迹识别,对丰富智能终端,尤其是手机的各类应用有很好的帮助。
现有的笔迹识别技术主要源自传统的纸上文字笔迹识别技术,将用户手写的文字视为若干副图像,对图像提取笔迹相关特征,比较图像之间在笔迹特征上的相似程度,从而判定手写文字的笔迹,如中国专利申请号99105851.8公开了一种基于纹理分析的字体和笔迹识别方法。但,纸上文字笔迹识别技术没有充分利用触摸屏手写输入方式自身特点,仅从书写的最终结果-文字图像来判别笔迹,其识别准确率不高,并且图像处理过程的计算耗费较高。
已有的触摸屏笔迹识别方法,在延用纸上文字笔迹识别方法的同时,增加了若干附加信息,如中国专利申请号200410092984.7公开了一种基于视频的笔迹识别系统和方法,其增加了摄像头采集的用户运笔角度信息,计算比较复杂;中国专利申请号201010120172.4公开了一种基于绝对坐标定位的笔迹识别系统及其实现方法,其为触摸屏增加了绝对坐标定位信息,相当于要求用户依照绝对坐标点复写文字,这会降低用户体验效果。以上两项技术方案并没有改变笔迹识别时依靠书写的最终结果-文字图像判别笔迹的传统方法。
发明内容
本发明针对已有技术的不足,提出一种触摸屏手写汉字笔迹识别方法,该方法针对用户在触摸屏上的手写汉字输入,利用触摸屏数据采样特点,将手写汉字输入直接形成汉字向量,根据汉字向量判别用户笔迹。从而摆脱了笔迹识别依赖文字图像处理的传统思路,不仅计算量小,而且识别准确率高。
本发明采取以下技术方案:一种触摸屏汉字笔迹识别方法,包括用户笔迹特征获取和用户笔迹鉴别过程,用户笔迹特征获取过程按如下步骤进行:
第一步,用户在触摸屏上书写汉字,同一汉字重复书写若干次,用触摸屏数据采样函数记录用户书写轨迹,取得采样结果;
第二步,将采样结果进行标准化处理;
第三步,将标准化后结果依据用户书写时的笔划进行分段,形成若干笔迹向量;
第四步,将获得的笔迹向量进行向量聚类,结果作为用户笔迹特征存入用户笔迹特征库;
所述用户笔迹鉴别过程按如下步骤进行:
第一步,提示用户输入汉字;
第二步,用触摸屏数据采样函数记录用户手写轨迹,取得采样结果;
第三步,将采样结果进行标准化处理;
第四步,将标准化后结果依据用户书写时的笔划进行分段,形成若干笔迹向量;
第五步,将获得的笔迹向量与用户笔迹特征库中同一汉字的笔迹向量进行向量余弦值比对,结果大于设定的阈值即判定为用户笔迹。
(注:前述触摸屏采样函数为触摸屏操作系统自带的,具体采样函数视不同的触摸屏操作系统而异,如Android系统提供了如下采样函数android_server_KeyInputQueue_readEvent()。)
优选的,所述用户笔迹特征获取过程的第二步:标准化处理分两步进行,标准化处理一与标准化处理二,以第1个采样点为坐标原点,后续采样点与第1采样点的差值为新坐标值,将采样结果转化为新坐标值,完成标准化处理一;用户书写汉字经过标准化处理二将尺寸规整到预定的一个矩形范围内,扫描采样结果的序列,取出序列中长、宽的最大值做分母,约定的矩形长、宽值做分子,得到长、宽的标准化比值;将采样结果序列乘以标准化比值得到标准化结果。
优选的,用户笔迹鉴别过程的第三步:标准化处理分两步进行,标准化处理一与标准化处理二,以第1个采样点为坐标原点,后续采样点与第1采样点的差值为新坐标值,将采样结果转化为新坐标值,完成标准化处理一;用户书写汉字经过标准化处理二将尺寸规整到预定的一个矩形范围内,扫描采样结果的序列,取出序列中长、宽的最大值做分母,约定的矩形长、宽值做分子,得到长、宽的标准化比值;将采样结果序列乘以标准化比值得到标准化结果。
本发明触摸屏手写汉字笔迹识别方法,该方法针对用户在触摸屏上的手写汉字输入,利用触摸屏数据采样特点,将手写汉字输入直接形成汉字向量,根据汉字向量判别用户笔迹。从而摆脱了笔迹识别依赖文字图像处理的传统思路,不仅计算量小,而且识别准确率高。
附图说明
图1为用户笔迹特征获取流程图。
图2为用户笔迹鉴别流程图。
图3为触摸屏汉字笔迹识别方法使用流程图。
具体实施方式
下面结合附图对本发明作进一步说明。
触摸屏手写汉字输入与传统纸上手写汉字输入相比,其汉字输入的规则度不如纸上手写汉字,但触摸屏可以记录书写汉字的笔划过程,而纸上输入无法记录。另一方面汉字为方块字,有很强的笔划性,并且每一个用户的笔划书写习惯均有差异。以上特点使得在触摸屏上采用传统纸上笔迹识别方法(仅对书写后的最终结果-文字图像进行鉴别)效果不好。而通过笔划及笔划间位置关系对用户笔迹进行识别的准确率较高,触摸屏恰恰能提供所需要的笔划信息。
触摸屏手写汉字笔迹识别方法包括用户笔迹特征获取和用户笔迹鉴别两部分,用户笔迹特征获取流程如图1所示,具体按如下步骤:
第一步,用户在触摸屏上书写汉字。书写的汉字大小无限制,笔划也没有限制,既可以连笔一笔写完,也可以分若干笔写完;用户在放松状态下对同一汉字重复书写若干次(一般>10次);触摸屏数据采样函数(此采样函数为触摸屏操作系统自带的,具体采样函数视不同的触摸屏操作系统而异,如Android系统提供了如下采样函数android_server_KeyInputQueue_readEvent())能够记录用户手在触摸屏上的移动轨迹,取得采样结果。
第二步,将第一步所得的采样结果进行标准化处理。标准化处理分两步进行,标准化处理1与标准化处理2。以第1个采样点为坐标原点,后续采样点与第1采样点的差值为新坐标值,将采样结果转化为新坐标值,完成标准化处理1。用户书写汉字有大有小,需经过标准化处理2将尺寸规整到预定的一个矩形范围内,矩形大小可根据触摸屏的实际情况决定(目前的手机一般设为300×400)。方法为扫描采样结果序列,取出序列中长、宽的最大值做分母,约定的矩形长、宽值做分子,得到长、宽的标准化比值;将采样结果序列乘以标准化比值得到标准化结果。
第三步,将标准化后结果依据用户书写时的笔划进行分段,形成若干笔迹向量。触摸屏数据采样函数能够支持对用户书写过程中离开触摸屏表面的行为进行记录,依据此记录可以对用户书写时的笔划进行准确的分段,分段后笔划数据即为笔迹向量。
第四步,将获得的笔迹向量进行向量聚类,用户书写同一字时会由于书写快慢等因素产生不同的笔划结果,将笔迹向量进行聚类分类,分类算法可以选用向量分类领域的经典算法(参考分类算法为K均值算法或LBG算法)。分类后结果作为用户笔迹特征存入用户笔迹特征库。
用户笔迹鉴别流程如图2所示,具体按如下步骤进行:
第一步,提示用户输入汉字,该汉字为用户笔迹特征库中已有汉字,可任选。
第二步,用触摸屏数据采样函数记录用户手写轨迹,触摸屏数据采样函数能够记录用户手在触摸屏上的移动轨迹。
第三步,将采样结果依一定的长度和宽度进行标准化处理。该步骤与用户笔迹特征获取流程第二步相同。
第四步,将标准化后结果依据用户书写时的笔划进行分段,形成若干笔迹向量。该步骤与用户笔迹特征获取流程第三步相同。
第五步,将获得的笔迹向量与用户笔迹特征库中同一汉字的笔迹向量进行向量余弦值比对,结果大于设定的阈值即判定为用户笔迹。向量余弦值比对公式为:
cos θ = V 1 · V 2 | | V 1 | | · | | V 2 | |
V1、V2分别表示待测笔迹向量与用户笔迹特征向量,用户笔迹特征向量有多个,取最接近的一个。
图3显示了触摸屏汉字笔迹识别方法的使用流程。

Claims (3)

1.一种触摸屏汉字笔迹识别方法,其特征是包括用户笔迹特征获取和用户笔迹鉴别过程,用户笔迹特征获取过程按如下步骤进行:
第一步,用户在触摸屏上书写汉字,同一汉字重复书写若干次,用触摸屏数据采样函数记录用户书写轨迹,取得采样结果;
第二步,将采样结果进行标准化处理;
第三步,将标准化后结果依据用户书写时的笔划进行分段,形成若干笔迹向量;
第四步,将获得的笔迹向量进行向量聚类,结果作为用户笔迹特征存入用户笔迹特征库;
所述用户笔迹鉴别过程按如下步骤进行:
第一步,提示用户输入汉字;
第二步,用触摸屏数据采样函数记录用户手写轨迹,取得采样结果;
第三步,将采样结果进行标准化处理;
第四步,将标准化后结果依据用户书写时的笔划进行分段,形成若干笔迹向量;
第五步,将获得的笔迹向量与用户笔迹特征库中同一汉字的笔迹向量进行向量余弦值比对,结果大于设定的阈值即判定为用户笔迹。
2.如权利要求1所述的触摸屏汉字笔迹识别方法,其特征是:所述用户笔迹特征获取过程的第二步:标准化处理分两步进行,标准化处理一与标准化处理二,以第1个采样点为坐标原点,后续采样点与第1采样点的差值为新坐标值,将采样结果转化为新坐标值,完成标准化处理一;用户书写汉字经过标准化处理二将尺寸规整到预定的一个矩形范围内,扫描采样结果的序列,取出序列中长、宽的最大值做分母,约定的矩形长、宽值做分子,得到长、宽的标准化比值;将采样结果序列乘以标准化比值得到标准化结果。
3.如权利要求1所述的触摸屏汉字笔迹识别方法,其特征是:所述用户笔迹鉴别过程的第三步:标准化处理分两步进行,标准化处理一与标准化处理二,以第1个采样点为坐标原点,后续采样点与第1采样点的差值为新坐标值,将采样结果转化为新坐标值,完成标准化处理一;用户书写汉字经过标准化处理二将尺寸规整到预定的一个矩形范围内,扫描采样结果的序列,取出序列中长、宽的最大值做分母,约定的矩形长、宽值做分子,得到长、宽的标准化比值;将采样结果序列乘以标准化比值得到标准化结果。
CN 201110003656 2011-01-10 2011-01-10 一种触摸屏汉字笔迹识别方法 Pending CN102073870A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110003656 CN102073870A (zh) 2011-01-10 2011-01-10 一种触摸屏汉字笔迹识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110003656 CN102073870A (zh) 2011-01-10 2011-01-10 一种触摸屏汉字笔迹识别方法

Publications (1)

Publication Number Publication Date
CN102073870A true CN102073870A (zh) 2011-05-25

Family

ID=44032404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110003656 Pending CN102073870A (zh) 2011-01-10 2011-01-10 一种触摸屏汉字笔迹识别方法

Country Status (1)

Country Link
CN (1) CN102073870A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102520849A (zh) * 2011-11-28 2012-06-27 北京盛世宣合信息科技有限公司 电子毛笔书写方法及系统
CN102937850A (zh) * 2012-12-04 2013-02-20 上海合合信息科技发展有限公司 实时手写笔迹的美化方法及电子设备
CN102937849A (zh) * 2012-12-04 2013-02-20 上海合合信息科技发展有限公司 实时手写笔迹的美化方法及电子设备
CN103324275A (zh) * 2012-03-23 2013-09-25 原相科技股份有限公司 使用者辨识系统及辨识使用者的方法
CN103389795A (zh) * 2012-05-11 2013-11-13 株式会社东芝 系统和手写文档管理方法
CN103702205A (zh) * 2014-01-08 2014-04-02 乐视致新电子科技(天津)有限公司 一种智能电视的解密方法和装置
CN103971104A (zh) * 2014-05-23 2014-08-06 葛峰 一种基于汉字电子手写特征分析的身份认证方法
CN104346631A (zh) * 2013-07-30 2015-02-11 夏普株式会社 图像判别方法、图像处理装置以及图像输出装置
CN104915627A (zh) * 2014-03-11 2015-09-16 重庆邮电大学 一种文字识别方法及装置
CN105117054A (zh) * 2015-08-12 2015-12-02 珠海优特电力科技股份有限公司 一种手写输入的识别方法及系统
CN108154136A (zh) * 2018-01-15 2018-06-12 众安信息技术服务有限公司 用于识别字迹的方法、装置及计算机可读介质
CN108920550A (zh) * 2018-06-15 2018-11-30 广州视源电子科技股份有限公司 文件查找方法及装置
CN111079499A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种学习环境中的书写内容识别方法及系统
CN112541328A (zh) * 2020-12-07 2021-03-23 四川大学 一种笔迹的存储方法、装置、设备及存储介质
US11126832B2 (en) 2012-03-16 2021-09-21 PixArt Imaging Incorporation, R.O.C. User identification system and method for identifying user
CN116959000A (zh) * 2023-07-24 2023-10-27 奎星控股(深圳)有限公司 笔迹识别方法、装置、计算机设备及存储介质
CN118629055A (zh) * 2024-08-14 2024-09-10 深圳懂你教育科技有限公司 用于教学系统的教学数据快速录入方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《万方数据知识平台服务》 20041231 于昆 基于联机笔迹的身份鉴别 第15-16页,第22-25页 1-3 , *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102520849B (zh) * 2011-11-28 2013-08-07 北京盛世宣合信息科技有限公司 电子毛笔书写方法及系统
CN102520849A (zh) * 2011-11-28 2012-06-27 北京盛世宣合信息科技有限公司 电子毛笔书写方法及系统
US11126832B2 (en) 2012-03-16 2021-09-21 PixArt Imaging Incorporation, R.O.C. User identification system and method for identifying user
CN103324275A (zh) * 2012-03-23 2013-09-25 原相科技股份有限公司 使用者辨识系统及辨识使用者的方法
CN106055948A (zh) * 2012-03-23 2016-10-26 原相科技股份有限公司 使用者辨识系统及辨识使用者的方法
CN103324275B (zh) * 2012-03-23 2016-12-14 原相科技股份有限公司 使用者辨识系统及辨识使用者的方法
CN106055948B (zh) * 2012-03-23 2019-11-08 原相科技股份有限公司 使用者辨识系统及辨识使用者的方法
CN103389795A (zh) * 2012-05-11 2013-11-13 株式会社东芝 系统和手写文档管理方法
CN102937849A (zh) * 2012-12-04 2013-02-20 上海合合信息科技发展有限公司 实时手写笔迹的美化方法及电子设备
CN102937850B (zh) * 2012-12-04 2015-07-22 上海合合信息科技发展有限公司 实时手写笔迹的美化方法及美化装置
CN102937849B (zh) * 2012-12-04 2015-09-23 上海合合信息科技发展有限公司 实时手写笔迹的美化方法及电子设备
CN102937850A (zh) * 2012-12-04 2013-02-20 上海合合信息科技发展有限公司 实时手写笔迹的美化方法及电子设备
CN104346631A (zh) * 2013-07-30 2015-02-11 夏普株式会社 图像判别方法、图像处理装置以及图像输出装置
CN103702205A (zh) * 2014-01-08 2014-04-02 乐视致新电子科技(天津)有限公司 一种智能电视的解密方法和装置
CN104915627B (zh) * 2014-03-11 2019-04-26 重庆邮电大学 一种文字识别方法及装置
CN104915627A (zh) * 2014-03-11 2015-09-16 重庆邮电大学 一种文字识别方法及装置
CN103971104A (zh) * 2014-05-23 2014-08-06 葛峰 一种基于汉字电子手写特征分析的身份认证方法
CN103971104B (zh) * 2014-05-23 2017-05-10 江苏慧世联网络科技有限公司 一种基于汉字电子手写特征分析的身份认证方法
CN105117054A (zh) * 2015-08-12 2015-12-02 珠海优特电力科技股份有限公司 一种手写输入的识别方法及系统
CN105117054B (zh) * 2015-08-12 2018-04-17 珠海优特物联科技有限公司 一种手写输入的识别方法及系统
CN108154136A (zh) * 2018-01-15 2018-06-12 众安信息技术服务有限公司 用于识别字迹的方法、装置及计算机可读介质
CN108154136B (zh) * 2018-01-15 2022-04-05 众安信息技术服务有限公司 用于识别字迹的方法、装置及计算机可读介质
CN108920550A (zh) * 2018-06-15 2018-11-30 广州视源电子科技股份有限公司 文件查找方法及装置
CN111079499A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种学习环境中的书写内容识别方法及系统
CN111079499B (zh) * 2019-07-02 2023-08-25 广东小天才科技有限公司 一种学习环境中的书写内容识别方法及系统
CN112541328A (zh) * 2020-12-07 2021-03-23 四川大学 一种笔迹的存储方法、装置、设备及存储介质
CN112541328B (zh) * 2020-12-07 2022-04-01 四川大学 一种笔迹的存储方法、装置、设备及存储介质
CN116959000A (zh) * 2023-07-24 2023-10-27 奎星控股(深圳)有限公司 笔迹识别方法、装置、计算机设备及存储介质
CN118629055A (zh) * 2024-08-14 2024-09-10 深圳懂你教育科技有限公司 用于教学系统的教学数据快速录入方法
CN118629055B (zh) * 2024-08-14 2024-10-11 深圳懂你教育科技有限公司 用于教学系统的教学数据快速录入方法

Similar Documents

Publication Publication Date Title
CN102073870A (zh) 一种触摸屏汉字笔迹识别方法
CN106354252B (zh) 一种基于stdw的连续字符手势轨迹识别方法
CN110458059B (zh) 一种基于计算机视觉的手势识别方法及识别装置
CN103577843A (zh) 一种空中手写字符串识别方法
CN110050277A (zh) 用于将手写文本转换成数字墨水的方法和系统
CN103150019A (zh) 一种手写输入系统及方法
CN101719142B (zh) 基于分类字典的稀疏表示图片文字检测方法
CN103593464A (zh) 基于视觉特征的视频指纹检测及视频序列匹配方法及系统
CN105260751B (zh) 一种文字识别方法及其系统
CN109472234B (zh) 一种手写输入智能识别的方法
CN102750552B (zh) 一种手写识别方法、系统及手写识别终端
CN103226388A (zh) 一种基于Kinect的手写方法
CN103268166A (zh) 手写输入设备的原笔迹信息采集和显示方法
US11482001B2 (en) Image processing device, image processing method, and image processing system
CN102073884A (zh) 一种手写识别方法、系统及手写识别终端
JP2013246731A (ja) 手書き文字検索装置、方法及びプログラム
CN115461792A (zh) 手写文本识别方法、装置和系统,手写文本搜索方法和系统,以及计算机可读存储介质
CN109558855A (zh) 一种基于手掌轮廓特征与模版匹配法相结合的空间手势识别方法
Aggarwal et al. Online handwriting recognition using depth sensors
CN105320971A (zh) 字符识别装置和字符识别方法
CN101604393B (zh) 一种用于联机手写汉字识别的汉字笔画特征提取方法
CN104794485A (zh) 一种识别书写字的方法及装置
Ramzi et al. Online Arabic handwritten character recognition using online-offline feature extraction and back-propagation neural network
CN104951811B (zh) 应用于毛笔书写的行笔路线识别方法和装置
CN103176651B (zh) 一种手写信息快速采集方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110525