JPH0139157B2 - - Google Patents

Info

Publication number
JPH0139157B2
JPH0139157B2 JP56155914A JP15591481A JPH0139157B2 JP H0139157 B2 JPH0139157 B2 JP H0139157B2 JP 56155914 A JP56155914 A JP 56155914A JP 15591481 A JP15591481 A JP 15591481A JP H0139157 B2 JPH0139157 B2 JP H0139157B2
Authority
JP
Japan
Prior art keywords
character
coordinate
point
characters
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56155914A
Other languages
English (en)
Other versions
JPS5856188A (ja
Inventor
Hiromichi Iwase
Masumi Yoshida
Osamu Kato
Shinichi Shimizu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56155914A priority Critical patent/JPS5856188A/ja
Publication of JPS5856188A publication Critical patent/JPS5856188A/ja
Publication of JPH0139157B2 publication Critical patent/JPH0139157B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は1画からなる英大文字、数字、特殊記
号をオンライン方式で認識するようにした1画文
字実時間認識方式に関する。
従来のオンライン文字認識装置、すなわち時間
情報をもつ座標点列というデータの形式で文字を
検出する回路と、検出された文字間を区切る回路
を備えた実時間英大文字、数字、特殊記号認識装
置では、文字を構成するストロークから数ポイン
トずつ、おのおのが各ストロークを代表する点を
抽出し、あらかじめ抽出しておいた各文字の代表
点を登録して記憶してある辞書とのマツチングを
とる方式がある。しかしこのマツチング方式では
文字を構成するストローク間の位置関係により文
字を認識するものであるから画数の少ない文字、
特に1画の文字の認識においては形状の変動の影
響を受けやすく、他の画数の文字に比べ認識率が
著るしく低下するという欠点があつた。
この発明は、従来のオンライン文字認識装置の
欠点を改善し、英大文字、数字、特殊記号を認識
対象とする実時間文字認識装置において、1画か
らなる文字を高い認識率で認識できる実時間認識
方式を提供することを目的とする。そしてこのた
めに本発明における英大文字・数字・特殊記号1
画文字実時間認識方式では時間情報をもつ座標点
列データで文字・記号を検出する回路とペンのア
ツプダウンを検出する回路と文字間を区切る回路
を有する実時間文字認識装置において、1画から
なる文字・記号の座標点列データからその文字・
記号の文字枠情報を抽出する手段と、前記座標点
列データと文字枠情報から、文字・記号の端点の
位置情報と端点の方向を表わす特徴、端点と文字
枠の関係を表わす特徴、X・Y座標への投影を表
わす特徴、投影から求まる特徴を抽出する特徴抽
出手段と、前記認識対象文字・記号を前記各特徴
のみで認識する手段を有することを特徴とする。
この発明が認識対象とする1画からなる英文
字、数字、特殊記号としては、例えば{0,1,
2,3,6,7,8,9,C,J,L,M,N,
O,Q,S,U,V,W,(,),〔,〕,/,\,
@,∧,〓,&,「,」,−, , ,・}等があげられ
る。
以下、本発明の動作原理について第1図〜第7
図にもとづき説明する。ここで第1図〜第6図は
特徴抽出説明図、第7図は特徴抽出識別状態説明
図である。
まず本発明が文字認識のために使用する各特徴
について順次説明する。
(1) 文字枠の情報 第1図は文字枠の情報について説明したもので
ある。第1図において、 ABCDは文字(S)を囲む最小の矩形文字
枠を示す。
XH(=DC=AB)及びYH(=AD=BC)は、
文字枠ABCDのX軸及びY軸方向の幅を示し
たもので、その文字の存在する範囲を表わす特
徴である。
YHMXHはYHからXHを引いた量を示すも
ので、その文字がどの程度縦長の文字かを表わ
すものである。
XC,YCは文字枠ABCDの中心の座標を表
わす。
XTL,XTRは文字枠ABCDのX軸方向を3
等分する座標である。
YTB,YTUは文字枠ABCDのY軸方向を3
等分する座標である。
YQB,YQUは文字枠ABCDのY軸方向の下
1/4および上1/4を表わす座標である。
XMIN,YMINは文字枠(ABCD)の左下
すなわちA点の座標値である。
XMAX,YMAXは文字枠ABCDの右上すな
わちC点の座標値である。
THA,THB,THCは、X座標がXMINの
ときの文字枠のADを3等分した区分を表わ
し、その中に文字が存在するときは1、存在し
ないときは0とする。第1図の場合はTHA=
0,THB=0,THC=1となる。
THD,THE,THFはX座標がXMAXのと
きの文字枠のBCを3等分した区分を表わし、
その中に文字が存在するときは1、存在しない
ときは0とする。第1図の場合は、THD=1,
THE=0,THF=0となる。
これらの情報は直接文字の特徴を表わすものと
はならないが、次に述べる各特徴を生成する際に
必要な情報となる。
(2) 端点の位置情報と端点の方向 第2図は端点の位置情報と端点の方向について
説明した図である。(次に説明する各特徴の番号
は上記(1)に連続した番号で示すものであり、以下
同様である。) XSMEは文字の始点、終点の左右関係を表
わす特徴で、終点が始点の右にあれば1、左に
あれば0とする。
YSMEは文字の始点、終点の上下関係を表
わす特徴であつて、終点が始点より上にあれば
1、下にあれば0とする。
XSMEAは始点、終点間のX方向の距離を表
わす特徴である。
YSMEAは始点、終点間のY方向の距離を表
わす特徴である。
MTSは文字が閉じているか否かを表わす特
徴で、XSMEA及びYSMEAがある値より小さ
いときは1、そうでないときは0とする。すな
わちその文字が閉じているときには1となる。
第2図の場合は0である。
SBPSM,SBPEMはそれぞれ文字の始点と
終点の方向を表わす。
PSM,PEMはそれぞれ調らべる範囲を
SBPSM,SBPEMの2倍にとつたときの文字
の始点と終点の方向を表わす。
なお、ここでにおける方向とは、第3図に
表わすような、0〜7の記号を付された8方向と
する。各方向の中間のものは近い方向の記号を付
すものとする。
第2図の場合は、SBPSM,PSMはいずれも
3、SBPEM,PEMはいずれも7となる。
SBPSM>PSMのときは、文字は始点において時
計方向に変曲し、SBPEM>PEMのときは文字
は終点において時計方向に変曲することになる。
(3) 端点と文字枠の関係 SSIDE,ESIDEはそれぞれ文字の始点、終
点が文字枠ABCDの左側にあるか、右側にあ
るかを表わす特徴で、左側にあれば0、右側に
あれば1とする。
第1図の場合は、始点は文字枠ABCDの右
側、終点は左側にあるので、SSIDE=1,
ESIDE=0となる。
SUQ,EUQはそれぞれ文字の始点、終点が
文字枠ABCDの上部にあるか否かを表わす特
徴で、前記で定義したYQUより端点(始点
と終点をまとめて端点という)が上にある場合
には文字枠の上にあると判断して1とし、その
他は0とする。
第1図の場合は、始点はYQUより大、終点
は小であるので、SUQ=1,EUQ=0となる。
SXFM,EXFMは、それぞれ文字の始点、
終点が文字枠ABCDの左右すなわち左枠AD、
右枠BCに接するかどうかを表わす特徴で、左
右の文字枠のいずれにも接しなければ0、左枠
BCに接すれば1、右枠ADに接すれば2とす
る。第1図の場合は、始点は右枠BCに接し、
終点は左枠ADに接しているので、SXFM=
2,EXFM=1となる。
SYFM,EYFMは、それぞれ文字の始点、
終点が文字枠ABCDの上下、すなわち上枠DC、
下枠ABに接するかどうかを表わす特徴で、上
下の文字枠のいずれにも接しなければ0、下枠
ABに接すれば1、上枠DCに接すれば2とす
る。
第1図の場合は、始点、終点のいずれも上枠
DC、下枠ABに接していないので、SYEM=
0,EYEM=0となる。
〓〓 GPNUMBは、文字の始点、終点がそれぞれ
文字枠ABCDの上半分にあるか下半分にある
か、すなわち前記で定義したYCより上にあ
るのか下にあるのかの組み合わせを表わす特徴
である。始点、終点がともに上半分にあれば
1、両方とも下半分にあれば2、始点が上半分
にあり終点が下半分にあれば3、始点が下半分
にあり終点が上半分にあれば4とする。
第1図の場合は、始点が上半分、終点が下半
分にあるのでGPNUMB=3となる。
(4) X座標、Y座標への投影 第4図は、X座標、Y座標への文字の投影を求
めた図である。
NUMDXはX座標への投影本数を表わす。
〓〓 NUMDL,NUMDRはそれぞれX座標の左
方向、右方向の投影本数を表わす。
第4図の場合、X座標への投影本数は4本で
あり、そのうちX座標の左方は2本、右方向は
2本であるから、NUMDX=4,NUMDL=
2,NUMDR=2となる。
〓〓 NUMDYはY座標への投影本数を表わす。
〓〓 NUMDB,NUMDUは、それぞれY座標の
下方向、上方向の投影本数を表わす。
第4図の場合には、Y座標への投影本数は4
でありそのうちY座標の下方向は2本、上方向
は2本であるから、NUMDY=4,NUMDB
=2,NUMDU=2となる。
(5) 投影から求まる特徴 〓〓 SXD,EXDはX座標への文字の最初と最後
の投影がどちら向きであるかを表わし、左向き
ならば0、右向きならば1とする。
第4図の場合は、始点から始まる最初のX座
標への投影XD1は左向きであり、終点を含む最
後の投影XD4は右向きであるから、SXD=0,
EXD=1となる。
〓〓 SYD,EYDはY座標への文字の最初と最後
の投影がどちら向きであるかを表わし、下向き
ならば0、上向きならば1とする。
第4図の場合は、Y座標への最初の投影YD1
は上向きであり、最後の投影YD4は下向きであ
るからSYD=1,EYD=0となる。
〓〓 LASTYはY座標への投影の最後のものの長
さ(YD4)を表わすもので、YD4が文字枠
ABCDの左、右枠(AD,BC)の長さYH(前
記及び第1図参照)の1/2より長いとき、す
なわちYD4≧YH/2のときは1、YD4
YH/2のときは0である。
第4図の場合は、YD4<YH/2であるの
で、LASTY=0となる。
LYMAXはY座標への投影の最後のものの
長さとY座標への投影の他のものの長さの関係
を表わしたもので、前者が後者より長いときは
1、短かいときは0とする。
第4図の場合はYDの長さはYD1,YD2より
短かいのでLYMAX=0となる。
LYCXはY座標への投影の最後の2本の始
点、終点間のX方向の長さを比べる特徴で、最
後のものが長ければ1、その前のものが長けれ
ば0とする。
第5図aは第4図を再記したものであるが、
この場合はY座標への投影の最後のYD4とその
前のYD3のそれぞれの始点、終点間の距離はlL
とlL-1であり、lL>lL-1であるから、LYCX=1
となる。同様に第5図bの場合はlL<lL-1であ
るからLYCX=0となる。
LXYUBはX座標への投影の最後のものの始
点の位置を表わすもので、その始点のY座標が
文字枠の上半分、すなわちYC(前記及び第1
図参照)より大きいときは1、小さいときは0
とする。
第6図の場合はX座標への最後のものの始点LS
のY座標はYCより上にあるので、LXYUB=1
となる。
第7図はこの発明が認識対象とする1画からな
る英字、数字、特殊記号の中から{0,1,2,
3,6,7,8,9,C,L,M,N,O,Q,
S,U,V,W,@,∧,&}を例にとつて、こ
れまでに説明した特徴により大まかに識別した識
別状態説明図である。
図中、(−)は求まらないか、断定できないも
のを示す。また第7図に記載しなかつた特徴は、
第7図では識別しきれなかつた1画文字等を区別
するのに用いられる。例えば第7図では{U,
V}は第7図に記載の特徴では全て同じ値を示す
のでこれらの識別はこれではできないが、端点の
方向を表わす特徴PSM,PEM(前記参照)を
調らべると、UはPS=6,PEM=2であるのに
対し、VはPSM=7,PEM=1となるから両者
を識別することができる。
この第7図から各文字、数字、特殊記号を認識
する方法としては、例えばトリー方式を挙げるこ
とができる。トリー方式によれば最後のトリーに
達するまでに多くのものが認識される(第7図に
おいて各特徴は、少ないトリーで認識できるよう
な順序で配列したものである)。例えば最初のト
リーの特徴GPNUMBで、英文字「N」が、第3
番のトリーの特徴NUMDXにおいて、数字
「3」,「8」等が認識される。
第8図は本発明の一実施例構成を示す。
第8図において、1は座標点列格納部であつ
て、図示省略したタブレツト等の入力装置から検
出された1画の文字の1文字毎の座標点列の各
X,Y座標がデータ線aを経由して格納される。
2は文字枠情報抽出回路であつて、座標点列格納
部1に格納された座標データから、前記(1)文字枠
の情報において〜で説明したXMIN,
YMIN,XMAX,YMAX,XH,YH,
YHMXH,XC,YC,XTL,XTR,YTB,
YTU,YQB,YQU,THA〜THFを演算し、
データ線bを介して文字枠情報格納部3に出力す
る。このうちXH,YH,YHMXH,THA〜
THFはデータ線cを介して抽出データ格納部7
に出力される。
4は端点・文字枠情報抽出器で、座標点列格納
部1から端点すなわち文字の始点と終点の座標
を、文字枠情報格納部3から文字枠ABCDに関
する情報を参照して、前記(3)端点と文字枠の関係
において〜〓〓で説明したSSIDE,ESIDE,
SUQ,EUQ,SXFM,EXFM,SYFM,
EYFM,GPNUMBを演算し、データ線dを介
して抽出データ格納部7に出力する。
5は端点情報抽出器であつて、座標点列格納部
1から端点の座標を参照して前記(2)端点の位置と
端点の方向において〜で説明したXSME,
YSME,XSMEA,YSMEA,MTS,PSM,
PEM,SBPSM,SBPEMを演算し、データ線e
を介して抽出データ格納部7に出力する。
6は投影情報抽出器で、座標点列格納部1のデ
ータからX座標、Y座標への投影を求め、文字枠
情報格納部3のYC(文字枠ABCDの中心のY座
標)を参照して、前記(4)X座標、Y座標への投影
において〜〓〓で説明したNUMDX,NUMDL,
NUMDR,NUMDY,NUMDB,NUMDU及び
前記(5)投影から求まる特徴におて〓〓で説明した
SXD,EXD,SYD,EYD,LASTY,
LYMAX,LYCX,LXYUBを演算し、データ
線fを介して抽出データ格納部7に出力する。
8は辞書格納部であつて、第7図に示す如く、
あらかじめ識別対象とする英大文字、数字、特殊
記号のうち1画からなる文字について、これまで
に説明した各特徴を抽出し、その文字を表わす記
号とともに格納してあるものである。
9は認識部であつて、抽出データ格納部7に抽
出された1文字分の各特徴と辞書格納部8に格納
されている辞書を比較して、最も特徴が類似する
文字、すなわち一致する特徴点の数の最も多い文
字を表わす記号をデータ線gを介して出力する。
なお入力装置には1画以外の文字が入力される
が、例えば1画文字を入力毎にスタイラスペンで
1画文字であることを示す記号を出力するタブレ
ツト領域に触れること等により容易に1画文字だ
けを抽出し、データ線aを経由してその1文字毎
の座標点列を座標点系列格納部1に格納する。こ
れにより前記の如き各特徴抽出が行なわれ、この
入力文字に対する各特徴が抽出データ格納部7に
格納され、認識部9により辞書格納部8にあらか
じめフアイルされている各1画英大文字や数字、
特殊記号等との比較が行なわれ、もつとも特徴が
類似したものの記号が認識結果として出力される
ことになる。
以上説明の如く、本発明によれば従来のオンラ
イン文字認識装置では認識率の低かつた1画の文
字・記号等を高い認識率で読むことができる。し
たがつて従来のオンライン文字認識装置に本発明
を付加し、2画以上の文字等に関しては従来のマ
ツチング方式にもとづく文字認識を行ない、1画
の文字のときは本発明の文字認識方式により文字
認識を行うことにより、画数によらず高い認識率
で文字を読み取ることができる。
【図面の簡単な説明】
第1図は文字枠の情報に関する説明図、第2図
は文字の端点の位置情報と端点の方向を表わす特
徴に関する説明図、第3図は方向を記号で示す説
明図、第4図は文字のX,Y座標への投影を表わ
す特徴に関する説明図、第5図はY座標への投影
の最後の2本の始点、終点間のX方向の長さを比
べる特徴LYCXに対する説明図、第6図はX座標
への投影の最後のものの始点の位置を示す特徴
LXYUBに対する説明図、第7図は識別状態説明
図、第8図は本発明の一実施例構成図である。 図中、1は座標点列格納部、2は文字枠情報抽
出回路、3は文字枠情報格納部、4は端点・文字
枠情報抽出器、5は端点情報抽出器、6は投影情
報抽出器、7は抽出データ格納部、8は辞書格納
部、9は認識部をそれぞれ示す。

Claims (1)

    【特許請求の範囲】
  1. 1 時間情報をもつ座標点列データで文字・記号
    を検出する回路と、ペンのアツプダウンを検出す
    る回路と文字間を区切る回路を有する実時間文字
    認識装置において、1画からなる文字・記号の座
    標点列データからその文字・記号の文字枠情報を
    抽出する手段と、前記座標点列データと文字枠情
    報から、文字・記号の端点の位置情報と端点の方
    向を表わす特徴、端点と文字枠の関係を表わす特
    徴、X・Y座標への投影を表わす特徴、投影から
    求まる特徴を抽出する特徴抽出手段と、前記認識
    対象文字・記号を前記各特徴のみで認識する手段
    を有することを特徴とする英大文字・数字・特殊
    記号1画文字実時間認識方式。
JP56155914A 1981-09-30 1981-09-30 英大文字・数字・特殊記号1画文字実時間認識方式 Granted JPS5856188A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56155914A JPS5856188A (ja) 1981-09-30 1981-09-30 英大文字・数字・特殊記号1画文字実時間認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56155914A JPS5856188A (ja) 1981-09-30 1981-09-30 英大文字・数字・特殊記号1画文字実時間認識方式

Publications (2)

Publication Number Publication Date
JPS5856188A JPS5856188A (ja) 1983-04-02
JPH0139157B2 true JPH0139157B2 (ja) 1989-08-18

Family

ID=15616266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56155914A Granted JPS5856188A (ja) 1981-09-30 1981-09-30 英大文字・数字・特殊記号1画文字実時間認識方式

Country Status (1)

Country Link
JP (1) JPS5856188A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6366697B1 (en) 1993-10-06 2002-04-02 Xerox Corporation Rotationally desensitized unistroke handwriting recognition
EP0769175B9 (en) 1994-07-01 2005-01-12 Palm Computing, Inc. Multiple pen stroke character set and handwriting recognition system

Also Published As

Publication number Publication date
JPS5856188A (ja) 1983-04-02

Similar Documents

Publication Publication Date Title
JPS6079485A (ja) 手書き文字認識処理装置
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
JPH0139157B2 (ja)
CN115311674A (zh) 手写处理方法、装置、电子设备和可读存储介质
JPH0520794B2 (ja)
JPS62159291A (ja) 文章入力装置
JP2012234345A (ja) 帳票読取装置、角印検出方法、および、角印検出プログラム
JPS6362783B2 (ja)
JPH0150955B2 (ja)
JP2680845B2 (ja) 文字入力コード化方式
KR100367580B1 (ko) 획순독립의온라인문자인식장치
JPH069064B2 (ja) 手書き文字認識装置
JPH0651900A (ja) オンライン文字入力装置
JP2633523B2 (ja) 手書き画入力装置
JPS58169296A (ja) オンライン手書文字認識装置
JPH01316889A (ja) 手書き文字認識方式
WO2010150383A1 (ja) 認識装置
JPH012186A (ja) 手書き文字認識方式
JPS61169975A (ja) 手書き文字認識装置
JP2013041535A (ja) 情報処理装置およびプログラム
JPS6293776A (ja) 情報認識装置
JPS625489A (ja) 手書き文字認識装置
JPS603238B2 (ja) 手書き文字オンライン識別方式
JPH11282965A (ja) 文字認識装置及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JPS61138383A (ja) 手書き文字認識装置