CN1040447A - 联机手写字符识别装置 - Google Patents

联机手写字符识别装置 Download PDF

Info

Publication number
CN1040447A
CN1040447A CN89106539A CN89106539A CN1040447A CN 1040447 A CN1040447 A CN 1040447A CN 89106539 A CN89106539 A CN 89106539A CN 89106539 A CN89106539 A CN 89106539A CN 1040447 A CN1040447 A CN 1040447A
Authority
CN
China
Prior art keywords
character
stroke
degree
approximation
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN89106539A
Other languages
English (en)
Other versions
CN1020213C (zh
Inventor
吉田公義
田守宽文
板野秋夫
茶谷公之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1040447A publication Critical patent/CN1040447A/zh
Application granted granted Critical
Publication of CN1020213C publication Critical patent/CN1020213C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)

Abstract

本发明用于联机手写字符的识别并且具有较好的识别精度。联机手写字符识别装置包含有:字符基本结构元素即预先定义好的多个模板信息,可分别计算出输入笔划信息与所述模板信息的近似度的电路,存有每个字符中对各笔划的限定语的特征词典存储器和评价时,用所述限定语限定所述近似度并且改变字符判定程度来进行评价的评价电路。

Description

本发明涉及联机手写字符的识别装置。
本发明的联机手写字符识别装置中,求出输入笔划与预先定义的字符基本结构元素的近似度,并以这近似度作为特征矢量的成分,据此用模糊性评价输入字符,提高其识别的各种特性。
先有技术联机手写字符的识别方法如图6所示,
1.用输入笔迹上取样点P0,P1,…Pn及其时间序列信息构成的折线(图6B)去近似手写的一笔划的输入笔迹。(图6A)
2.将预先定义的笔迹的基本形状、即“基本笔划类型”与第1项的折线比较进行“笔划识别”。
3.根据第2项的结果,将输入的笔划变换为最接近的基本笔划类型的代码号。
4.对一个字符的所有笔划,重复1-3项。
5.参照词典,将按笔划顺序持有第3项代码号的字符判断为被输入的字符。
上述方法一直被广泛使用着。
如果使用这种方法,由于用一种基本笔化类型置换输入的笔划,在基本输入笔迹取样点P0,P1,…Pn信息中,除了以后识别过程所必需的数据,几乎都可舍去,因此即使存储容量较小的装置也可能用作字符识别。又,由于词典的基本笔划类型的代码号按各字符笔划顺序排列,用它与输入字符的基本笔划类型的代码号顺序作比较,可进行输入字符的识别,因此,既可使词典小型化,又可缩短比较所需要的时间。
文献:“日经”1983年12月5日号
但是,在使用这种方法的场合下,由于输入噪声、手写者输入缺点使输入笔迹的基本形发生变化乃至变形时,在第2项笔划识别中就会产生差错,其结果使识别精度大幅度下降。例如,书写“一”或一横时,如图7A中○内所表示,如有“起笔处”,则其基本笔划类型会被识别成图7B所示。
为此,以前用“笔划s的代号码C1、C2、…Cn”那样的并行描述来处理词典中那些“易于误识别的笔划类型”代码。
但是,如果这样做,既增大了词典尺寸,又延长了检索时间。而且用户要在词典中追加未登录的字符时,由于不能只从输入笔划来确定登录所必需的笔划类型代码,所以实现这样的追加登录是非常困难的。
本发明的目的是解决如上的问题。
为此,在本发明中,求出输入的笔划信息与预先定义的字符基本结构元素的近似度,变换以该近似度构成特征矢量的信息里,输入的笔划信息,根据评价中的限定语改变评价度。
用模糊性进行字符识别,不会降低识别率,可实现词典尺寸的小型化和检索高速化等。
首先,就本发明及其实施例的概要加以说明。
即在本发明中:
1.准备妥例如图2所示的模板式样(基本笔划类型)T1-T26;
2.将手写输入的每个字符中第ⅰ个笔划信息Si与模板T1-T26顺序比较,并算出与各模板Tj(j=1-26)的近似度Eij
例如,如果输入字符为片假名“ ”,那么它的第一笔划s为“丿”,由于与模板T1,T2,T3等的近似度较高,与模板T7等的近似度较低,所以得到E101=90%,E102=80%,E103=95%,…E107=0%,…E126=0%。同样地,由于第二笔划S为“丶”,所以得到E201=5%,E202=0%,E203=0%,…E207=95%,…E226=0%,(数值是为说明而假定的大小)。
3、对于各字符,在各个笔划Si上,将第2项的结果作为特征矢量Vi,Vi=(Ei01,Ei02,…Ei26)存储起来。
如在上例“
Figure 891065393_IMG3
”的情形下,特征矢量为:
V=(90,80,95,…,0,…0)
V=(5,0,0,…,95,…,0)。
4、当片假名“ ”字符书写正确时,其第一笔划S1与模板T3“大体”一致,第二笔划S2与模板T7“确实”一致。
因此,词典里如果字符“ ”,则“ ”的日本工业标准代码(JIS)描述其字符的代码为T3=大体,T7=确定。
即,对每一个字符,描述该字符代码号、与该字符第i笔化Si最接近的模板号Tj以及表示这种近似(一致)程度的限定语。又,该模板号Tj及限定语,仅仅按笔划顺序描述其笔划数。
再根据每一个字符的总笔划数将这些字符分类。
5、再准备好如图3所示的具有模糊性的函数图表。
6、根据第4项的字符数据内,从输入字符的总笔划数项中取出第一项字符的字符数据。
在上例中,“
Figure 891065393_IMG7
”字符的总笔划数为2,所以从2笔划项中取出第一项字符数据。
7、为简单起见,第6项中取得的字符数据为“
Figure 891065393_IMG8
”字符的字符数据的话,由于第1笔划S1的T3=“大体”,那么随着选择图3中“大体”的函数曲线,就可从第3项求出的特征矢量V1的近似度里,取出相对于模板T3的近似度95%(=E103)。
然后,根据图3中“大体”的函数曲线,变化该近似度95%为合格率G1,例如G1=96%。
同样,由于第二笔划S2,T7=“确定”,所以随着选择图3中“确定”的函数曲线,就可从特征矢量V2的近似度里,取出相对于模板T7的近似度95%(=E207),将其变换为合格率G2,例如,G2=98%。
即,在第6项取出字符数据的同时,既要对每一笔划Si选择图4的函数曲线,又要将特征矢量Vi对应的近似值Eij变换为由所选的函数曲线限定的合格度Gi
8、将第7项求得的合格度Gi内的最小合格率作为该字符数据所表示代码号的字符合格度Gm
在上例中,由于G1=96%,G2=98%,所以相对于输入字符“
Figure 891065393_IMG9
”字的合格度Gm为96%(=G1)。
9、其后,对符合笔划数的所有字符数据,重复执行7、8项。
10、如果第9项执行结束,在所得到的合格度Gm(这只得到字符数据的个数)里,将其中给予合格度G最高的字符作为输入字符的第一候选,输出其代码号。
接着,模板式样T1-T26是考虑以下几点确定的,即:
1、汉字的结构元素有“横笔划”,“竖笔划”,“撇”,“弯”等,其种类有限定。
2、即使看似相同的笔划,也会由于运笔的不同出现“撇”“弯”等变形的写法的差异。又,对“撇”等笔划,由于没有规定原来的长度和角度,在可能产生不同变形的笔划中,例如模板式样T1-T3,仅仅是为区分变形类型而准备的另一些模板。
3、由于非常复杂的基本形状在所有汉字中出现频率极低,所以不定义模板,而用其它识别方法来处理。
还有,模板式样T1-T26中用点线表示的笔划部分在求近似度Eij时,表示可减少或忽略它们的评价。
下面说明本发明的一个结构实例。
图1是本发明的一个实施例的系统图。
图2至图7是其说明图。
在图1中,(1)表示图形输入板等的座标输入手段,由这个输入手段(1)输入一个笔划部分的座标充序列Po-Pn,将这个座标序列Po-Pn送到折线压缩电路(2),对折线信息及其端点信息的序列进行压缩变换。即,例如,如果输入的笔划(座标序列)预处理呈图4B所示的折线#1-#4的话,那么该笔划,其每条折线#1-#4既如图4A所示的角度(方向)按8个方向数量化,又对该折线#1-#4的长度和各始点及终点的座标值进行变换,得到如图4C所示那样的数据。
而且,该数据的一个笔划部分通过缓冲存储器(3),送至近似度计算电路(401)-(426),计算模板式样T1-T26的近似度Eij。(前述第2项)再,进行该近似度Eij计算是根据规则存储电路(501-(526)中所描述的算法,独立而且并行地对各模板式样Tj计算求得的。
然后,将算出的近似度Eij送至特征矢量缓冲存储器(6)。图中,模型地表示了该缓冲存储器(6)的结构,既有与模板式样T1-T26对应行方向的26个存储区,又有与识别字符最大笔划数K对应列方向的K个存储区。因此,在这个缓冲存储器(6)中,就一个字符来说其各笔划S的特征矢量Vi,存储在每一个笔划Si里。(前述第3项)。
而且,该一个字符的特征矢量Vi和来自特征词典(7)的字符代码(前述第4项)在评价电路(8)中按前述第5-10项进行处理,将对于输入字符合格度最高代码号加以输出。
图5表示在近似度计算电路(401)中,计算输入笔划Si对模板T1的近似度Ei01的规则实例。
即,在图5A中,夸张表示了“右”、“五”等字中所含的“丿”,对于这个笔划“丿”,在模板T1的时刻,如图5B所示,是通过测量长度L1-L4,Lh,Lw,计算出来的。
Eiol=(aLh-bLw-cL1+dL4+eL3)/L2
但是,当Ei01>1时 Ei01=1
当Ei01<0时 Ei01=0
a-e为求出的常数,(在这里用小数表示近似值Ei01)。
而且,这时在模板T1中,由于点线笔划部分的权为0乃至小于0,所以对于值L3,L4的常数e,d,比其它常数a-c小。
又,在计算电路(402)-(426)中,也按对应模块T2-T26的近似度Ei02-Ei26的计算公式,将各自定义的近似度计算出来。
若根据如上的本发明,进行联机手写字符的识别,这时,特别是如果根据本发明,求出输入笔划Si和预先定义好的模板T1-T26的近似度Eij,并以该近似度Eij及限定语为基础进行字符识别,那么对笔迹的自然变化乃至变形的识别率都不会降低。由于模板Tj象T1-T3那样的处理,即对部分变形也作了处理,从而提高了识别率,加强了对笔迹变化乃至变形的识别能力。
又,由于词典(7)可以基本上只有1组与笔划Si对应的代表性的模板Tj及其限定语,那么,既可使词典(7)小型化,又可使词典(7)的检索高速化。
又可用这样一种方法实现未定义字符的登录,即由用户每输入一个笔划,一方面由图象表示近似度最高的模板的形状,同时可用会话形式确认该模板是否为正确的形状。

Claims (1)

1、一种联机手写字符识别装置,其特征在于它包含有:
字符基本结构元素即预先定义好的多个模板信息,
分别计算出输入笔划信息与上述多个模板信息的近似度的电路,
存有每一个字符中对其各笔划限定语的特征词典存储器,
评价时,用所述限定语限定所述近似度,并且改变字符判定程度来进行评价的评价电路。
CN89106539A 1988-08-17 1989-08-17 联机手写字符识别装置 Expired - Fee Related CN1020213C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPP204144/88 1988-08-17
JP63204144A JP2762472B2 (ja) 1988-08-17 1988-08-17 文字認識方法および文字認識装置
JP204144/88 1988-08-17

Publications (2)

Publication Number Publication Date
CN1040447A true CN1040447A (zh) 1990-03-14
CN1020213C CN1020213C (zh) 1993-03-31

Family

ID=16485566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN89106539A Expired - Fee Related CN1020213C (zh) 1988-08-17 1989-08-17 联机手写字符识别装置

Country Status (3)

Country Link
JP (1) JP2762472B2 (zh)
KR (1) KR0128733B1 (zh)
CN (1) CN1020213C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0548030B1 (en) * 1991-12-19 1998-09-30 Texas Instruments Incorporated Character recognition
TW274135B (zh) * 1994-09-14 1996-04-11 Hitachi Seisakusyo Kk
JPH10124505A (ja) * 1996-10-25 1998-05-15 Hitachi Ltd 文字入力装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0632083B2 (ja) * 1988-06-10 1994-04-27 サン電子株式会社 ファジー推論による手書き文字認識装置
JPH0632084B2 (ja) * 1988-07-25 1994-04-27 サン電子株式会社 ファジー推論による手書き文字認識方法

Also Published As

Publication number Publication date
KR900003771A (ko) 1990-03-27
KR0128733B1 (ko) 1998-04-15
CN1020213C (zh) 1993-03-31
JP2762472B2 (ja) 1998-06-04
JPH0253193A (ja) 1990-02-22

Similar Documents

Publication Publication Date Title
CN1167030C (zh) 使用多分辨率模型的手写字符记录的方法
CN1488120A (zh) 用于识别手写字符的方法、装置和计算机程序
CN1107283C (zh) 手写体输入字符识别的方法和设备
CN1017663B (zh) 打印装置
CN1163841C (zh) 在线手写中文字识别装置
CN113076465A (zh) 一种基于深度哈希的通用跨模态检索模型
CN108491430B (zh) 一种基于对特征方向进行聚类的无监督哈希检索方法
CN110427938A (zh) 一种基于深度学习的不规则文字识别装置和方法
CN1040693A (zh) 手写字符识别装置及方法
CN1282072A (zh) 对语音识别结果中的错误进行校正的方法和语音识别系统
CN1755706A (zh) 图像构造方法、指纹图像构造装置以及程序
US6035063A (en) Online character recognition system with improved standard strokes processing efficiency
CN104881449B (zh) 基于流形学习数据压缩哈希的图像检索方法
CN114745553A (zh) 一种基于大数据的图像数据存储方法
CN1051633A (zh) 目标识别系统
JPH10214267A (ja) 手書き文字記号処理装置および手書き文字記号処理装置の制御プログラムを記録した媒体
CN1135492C (zh) 手迹验证装置
CN115914640A (zh) 一种用于车联网的数据压缩方法
CN1020213C (zh) 联机手写字符识别装置
CN115526310A (zh) 一种网络模型的量化方法、装置及设备
CN1035844C (zh) 在字符识别系统中选取候选字符的方法
CN110941730B (zh) 基于人脸特征数据偏移的检索方法与装置
KR100248601B1 (ko) 온라인 문자 인식 방법 및 장치
CN1019699B (zh) 联机手写字符识别装置
CN1186708C (zh) 一种汉字输入方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C15 Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993)
OR01 Other related matters
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee