JP2742263B2 - オンライン連続文字認識装置における文字切り出し装置 - Google Patents

オンライン連続文字認識装置における文字切り出し装置

Info

Publication number
JP2742263B2
JP2742263B2 JP63068318A JP6831888A JP2742263B2 JP 2742263 B2 JP2742263 B2 JP 2742263B2 JP 63068318 A JP63068318 A JP 63068318A JP 6831888 A JP6831888 A JP 6831888A JP 2742263 B2 JP2742263 B2 JP 2742263B2
Authority
JP
Japan
Prior art keywords
character
characters
continuous
unit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63068318A
Other languages
English (en)
Other versions
JPH01241686A (ja
Inventor
洋 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63068318A priority Critical patent/JP2742263B2/ja
Publication of JPH01241686A publication Critical patent/JPH01241686A/ja
Application granted granted Critical
Publication of JP2742263B2 publication Critical patent/JP2742263B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 〔概要〕 手書きにより入力される連続文字を所定の認識単位毎
に切り出し、この切り出された入力文字の文字パターン
を辞書内の標準パターンと比較照合することにより入力
文字の認識を自動的に行うようにしたオンライン連続文
字認識装置における文字切り出し装置に関し、 手書きで入力される連続文字を1文字毎に切り分け、
辞書容量を大きくすることなしに認識率を上げることを
目的とし、 入力される連続文字の筆圧を検出し、筆圧が所定の閾
値以下または極小値となる筆跡位置で連続文字中から文
字を切り出すように構成する。
〔産業上の利用分野〕
本発明は、手書きによって入力される連続文字を所定
の認識単位毎に切り出し、この切り出された入力文字の
文字パターンを辞書内の標準パターンと比較照合するこ
とにより入力文字の認識を自動的に行うようにしたオン
ライン連続文字認識装置における文字切り出し装置に関
する。
〔従来の技術〕
従来のオンライン文字認識技術の開発においては定め
られた文字枠の中に1文字書いた単一文字の認識が主流
であったが、近年、より自由な文字の入力環境を提供す
べく、1つの文字枠の中に連続的に手書きした複数個の
文字からなるいわゆる連続文字を自動的に認識するオン
ライン連続文字認識技術の開発が行われている。このよ
うな連続文字の認識においても、認識率を上げるには連
続文字を構成する各文字をできるだけ1文字づつ分かち
書きして入力することが望ましい。しかしながら、英字
や数字のいわゆるアルファニューメリックは字形が簡単
なために第7図(a)〜(e)に例示するように筆記体
あるいは崩し字で書かれることが多く、認識に困難を伴
うことが多かった。
上記原因としては、連続文字の場合には複数の文字が
切れ目なく連なることが多く、1文字づつ分離すること
が困難であったり(第7図(a)(b))、前の文字の
最後の画と後の文字の最初の画の筆跡同士が互いの方向
に伸びて字形が大きく変化したり(第7図(c))、さ
らには、個々の文字が分離して書かれている場合でも連
続的な手書き文字の流れの中で書かれるために画のハネ
や押さえが通常よりも大きく出ることが多く(第7図
(d)(e))、辞書として備えている個々の文字の標
準パターンとの差が大きくなってしまうことなどによる
ものであった。
従来、上記問題を解決するために、1文字毎に分離す
ることが困難な連続文字、例えば第7図(a)〜(c)
に示すような文字の連なった数字や英字などの文字につ
いてはこの連続文字全体を1つの文字パターンとして辞
書登録し、また第7図(d)(e)に示すような字形の
変形した文字についてはその変形文字を1つの文字パタ
ーンとして標準パターンとは別に辞書登録し、連続文字
の認識率が低下することのないように工夫していた。
第8図は上記した原理に基づいて構成した従来のオン
ライン連続文字認識装置の構成を示すもので、座標検出
部1は文字を手書き入力するためのいわゆるデジタイザ
やタブレットなどであり、この座標検出部1の盤面上に
手書き入力用の文字枠2(第7図(a)参照)を予め設
定し、この文字枠2内にスタイラスペンなどを用いて文
字を連続的に手書きするものである。
上記座標検出部1から連続文字が入力されると、その
筆跡の座標データは次々と枠内判定部3に送られ、枠内
判定部3は座標検出部1から送られてくる座標データか
ら入力文字が文字枠2内に存在するか否かを判定し、入
力文字が文字枠2内にある場合にはその座標データを連
続手書き文字データ格納部4に送り、文字データとして
格納する。
上記動作が入力文字が文字枠2内からはみ出すまで繰
り返され、入力文字が文字枠2からはみ出したことを枠
内判定部3が検出すると、1回の処理量の文字列が入力
されたものと判断し、文字切り出し制御部5を起動して
連続文字の認識処理を開始する。
すなわち、文字切り出し制御部5が起動されると空間
位置・画単位文字切り出し部6が起動され、この空間位
置・画単位文字切り出し部6内に予め格納された空間位
置や画単位を用いた種々の文字の切り出し方に従って連
続手書き文字データ格納部4に格納されている連続文字
の座標データから所定の1認識単位分の座標データが切
り出される。例えば、いま第7図(a)に示すような字
形からなる数字「58」が入力されている場合、この数字
「58」は「5」と「8」に分離不可能であるため「58」
全体をひと塊まりの文字として切り出し、このひと塊り
の数字「58」の座標データを文字データ格納部7に送
る。
なお、この文字切り出し処理に際し、文字切り出し履
歴格納部7は上記空間位置・画単位文字切り出し部6か
ら取り出されて使用された文字切り出し方をその都度記
憶し、同一の文字切り出し方が重複して使用されること
のないようにしている。
上記のようにして連続手書き文字データ格納部4に格
納した連続文字の座標データから1認識単位分の座標デ
ータ、すなわち7図(a)に示す数字「58」の座標デー
タが切り出されて文字データ格納部8に格納されると、
照合部9はこの数字「58」の座標データ辞書部10内に格
納されているすべての文字の文字パターンと比較照合す
る。
辞書部10内には個々の文字の標準パターンが文字コー
ドとともに格納されているとともに、第7図(a)〜
(e)に例示した如き各文字の文字パターンもその文字
コードとともに予め登録されている。
したがって、文字データ格納部8に格納された上記数
字「58」の座標データと辞書部10内の文字パターンとが
比較照合されると辞書部10内の文字パターン「58」と一
致し、この一致した文字パターン「58」の文字コードが
認識結果格納部11に格納され、座標位置検出部1から手
書き入力された数字「58」の認識が終了する。
上記文字認識が終了すると、照合部9は文字切り出し
制御部5を介して文字切り出し履歴格納部7の記憶内容
をクリアして次の文字切り出し処理を備えるとともに、
連続手書き文字データ格納部4内に格納されている連続
文字の座標データ中から上記認識に成功した文字部分の
データを消去する。そして、連続手書き文字データ格納
部4内に座標データが残っている場合には、座標データ
がなくなるまで上記の認識処理を繰り返し実行する。
連続手書き文字データ格納部4内に格納された座標デ
ータがなくなった時点で座標検出部1から入力された複
数個の文字からなる連続文字の認識が完了し、このとき
に認識結果格納部11に格納されている文字コードの内容
がそのときに入力された連続文字の認識結果を与える。
〔発明が解決しようとする課題〕
上記したように、従来においては文字の完全な切れ目
毎にひと塊りの文字として切り出し、認識を行っていた
ため、高い認識率を得るには個々の文字についての標準
パターンとともに、連続文字や変形文字などの種々の文
字パターンについても予め辞書登録しておく必要があっ
た。しかしながら、これら辞書登録しておくべき文字パ
ターンの数は膨大な量であり、すべての文字パターンを
用意しておくことは実際上不可能であり、従来は低い認
識率しか達成できないという問題があった。
また、たとえすべての文字パターンを辞書として予め
用意できたとしても、辞書容量が大きくなり過ぎて照合
に時間がかかり、認識時間が長くなってしまうという問
題があった。
本発明は、手書きで入力される連続文字を1文字毎に
切り分け、辞書容量を大きくすることなしに認識率を上
げることのできるオンランイ連続文字認識装置における
文字切り出し装置を提供するものである。
〔課題を解決するための手段〕
第1図にその原理的実施例を示すように、手書きによ
り入力される連続文字を所定の認識単位毎に切り出し、
この切り出された入力文字の文字パターンを辞書内の標
準パターンと比較照合することにより入力文字の認識を
自動的に行うようにしたオンライン連続文字認識装置に
おいて、文字手書き入力時の筆圧を検出する筆圧検出手
段と、前記筆圧検出手段によって筆圧の存在が検出され
ている状態であって、かつ当該筆圧が所定の閾値以下ま
たは極小値となる筆跡位置で連続文字中から文字を切り
出す筆圧文字切り出し手段と、を備えるようにしたもの
である。
〔作用〕
本発明者は手書き入力される連続文字の筆跡とその筆
圧の関係のを実験・研究の結果、以下の様な特徴を見出
した。
すなわち、たとえ連続文字の前後の文字間が筆跡で繋
がって文字間に切れ目がなくなっていても、この繋がっ
た筆跡部分は他の正規の筆跡部分よりも筆圧が弱いこと
が多く、またハネや押さえにより字形の変わった文字
も、そのハネや押さえの筆跡部分は他の正規の筆跡部分
よりも筆圧が弱くなることが多いという特徴を見出し
た。
第2図〜第6図は第7図の(a)〜(e)に例示した
各文字に対応する筆跡とその筆圧の測定例を示すもので
あるが、例えば第2図を例に採って上記筆跡と筆圧の関
係を説明すると、同図(a)に示す数字「58」のA点か
らF点に至る筆跡の各位置の筆圧は同図(b)に示すよ
うな圧力曲線となる。この圧力曲線から明らかなよう
に、数字「5」と数字「8」の間が筆跡D〜Eにより繋
がったとしても、このD〜E点間の筆圧は或る閾値PSH
よりも小さな値となっていることが分かる。同様に、第
3図に示す英字「ab」、第4図に示す数字「60」におい
てもそれぞれの文字と文字との間を結ぶB〜C点間の筆
圧は或る閾値PSHよりも小さくなっていることが分か
る。
また、第5図は数字「9」の画の終端からハネB〜C
が出ている場合の例であり、第6図は同じく数字「2」
の画の初端に押さえA〜Bが出ている場合の例であり、
これらの場合もそれぞれのバネや押さえの部分の筆圧は
他の筆跡部分よりも小さくなっていることが分かる。
本発明は上記のような連続文字の筆圧の特徴に着目し
て創案したもので、筆圧の所定の閾値PSHにより入力さ
れた連続文字中から文字を切り出すりようにしたもので
ある。このように所定の閾値PSHで文字を切り出すと、
連続文字中から文字を1文字毎に切り出すことができる
だけでなく、この切り出し時に閾値PSH以下の筆圧から
なる筆跡部分を消去できるので、切り出された文字中の
不要な筆跡部分がなくなり、個々の文字の標準パターン
に近いパターンに直した上で1文字づつ切り出すことが
できる。
〔実施例〕
以下、本発明を適用して構成したオンライン連続文字
認識装置の実施例を第1図を参照して説明する。なお、
第8図のオンライン連続文字認識装置の構成要素と同一
の構成要素には同一の符号を付してその説明を省略す
る。
上記実施例は、第8図と同一の構成になるオンライン
連続文字認識装置において、従来の文字と文字の間の画
の切れ目で文字を切り出すだけでなく、筆圧の低い部分
も文字の切れ目と判定して切り出すようにしたもので、
これを実現するために、手書きで入力される連続文字の
筆圧を検出する筆圧検出手段12と、筆圧が所定の閾値P
SH以下となる位置で文字を切り出すための筆圧文字切り
出し部13とを付加したものである。なお、筆圧検出部12
としては、例えば座標検出部1を構成するデジタイザの
盤面下に感圧ゴムや感圧シートなどの感圧素子を敷設す
ることにより容易に実現できる。
座標検出部1から入力された連続文字の座標データは
従来と同様に連続手書き文字データ格納部4に格納され
るが、本発明の場合、これと同時に筆圧検出部12におい
て連続文字の筆圧も検出され、その筆圧データも連続手
書き文字データ格納部4に格納される。
そして、手書き入力される連続文字が文字枠2からは
み出すと、文字切り出し制御部5は空間位置・画単位文
字切り出し部6,文字切り出し履歴部7,筆圧文字切り出し
部13を起動し、従来と同様に文字の認識動作を開始す
る。なお、以下の説明においては、簡単のため、連続手
書き文字データ格納部4に格納された連続文字が第2図
(a)に示す数字「58」である場合に例に採ってその動
作を述べる。
上記文字切り出し制御部5により起動された筆圧文字
切り出し部13は、予め設定した第2図(b)中の閾値P
SHを文字切り出しのための判定レベルとして上記連続手
書き文字データ格納部4に格納された数字「58」の筆圧
をその全筆跡に亘って調べる。
筆圧文字切り出し部13は、先ず最初に数字「58」のB
〜C点間でその筆圧が閾値PSHよりも小さくなることを
検出し、このB〜C点を文字切り出し位置として連続手
書き文字データ格納部4に格納されている数字「58」の
座標データから対応する筆跡A〜B間の座標データを1
文字として切り出す。
文字切り出し制御部5は筆圧文字切り出し部13によっ
て切り出された上記筆跡A〜B間の座標データを受ける
と、空間位置・画単位文字切り出し部6に格納されてい
る画を単位とする種々の文字の切り出し方に照らし合わ
せ、該位置における文字の切り出しが正当であるか否か
を検証する。
この場合、1文字として切り出された軌跡A〜Bの上
部付近に他の軌跡C〜Dが存在するため、上記B〜C点
間は文字と文字の境界ではないと判定される。
上記のようにして筆跡B〜C点間が文字の切れ目でな
いことが判定されると、筆圧文字切り出し部13は次の切
り出し位置、すなわち第2図(b)中のD〜E間を次の
文字切り出し位置の候補として挙げ、連続手書き文字デ
ータ格納部4に格納されている数字「58」の座標データ
中から軌跡A〜D間の座標データを切り出す。
文字切り出し制御部5は上記したと同様に空間位置・
画単位文字切り出し部6に格納されている画を単位とす
る種々の文字の切り出し方に照らし合わせ、該位置にお
ける文字の切り出しが正当であるか否かを検証する。
上記D〜E位置で文字を切り出した場合には、その軌
跡D〜Eの上下部付近には他に何らの文字や軌跡も存在
しないので、このD〜E位置は正式な1文字としての切
れ目であると判定され、連続手書き文字データ格納部4
に格納されている数字「58」の座標データ中から軌跡A
〜Dの座標データ、すなわち数字「5」に相当する座標
データが切り出され、文字データ格納部8に格納され
る。
文字データ格納部8に格納された上記数字「5」の座
標データは、照合部9により辞書部10内に格納されてい
る個々の文字の文字パターンと比較照合される。
上記の場合、文字データ格納部8に格納された数字
「5」は第2図(b)中の筆圧が閾値PSH以下となる余
分な軌跡D〜E部分が消去された軌跡A−B−C−Dか
らなる文字パターンとして切り出されているため、辞書
部10内に予め格納されている数字「5」の標準パターン
に殆ど等しい文字パターンとなる。したがって、上記辞
書10内の個々の文字との比較照合により対応する数字
「5」の文字パターンと一致し、上記切り出された文字
が数字「5」であることが認識される。そして、この比
較照合の結果得られた数字「5」の文字コードは認識結
果格納部11に送られ、認識結果として格納れさる。
上記数字「5」の文字認識が成功すると、文字切り出
し制御部5は連続手書き文字デー格納部4に格納されて
いる数字「58」の座標データ中から上記照合に成功した
数字「5」に相当する部分の座標データを削除するとと
もに、文字切り出し履歴格納部7内の記憶をクリアし、
再び第2図(a)中の次の数字「8」の認識動作に移
り、上記と同様にして数字「8」を認識してその文字コ
ードを認識結果格納部11に格納する。
上記のようにして文字の認識が進み、連続手書き文字
データ格納部4に格納された座標データがなくなると認
識処理動作は完了する。したがって、このときに認識結
果格納部11に格納された認識内容、例えば上記数字「5
8」がそのときの認識結果を与える。
なお、上記の文字切り出しのために筆圧の閾値PSH
下の部分を文字間の部分の候補とする代わりに筆圧が極
小値をとる部分を該候補として用いることもでき、ま
た、レベルの異なる複数の閾値を用意して筆圧の低い順
に優先順位を与えて使用することもできる。前者の極小
値を用いる方法は、文字間の切れ目は筆圧が絶対的に低
くなくことも、その周囲よりは筆圧が低くなることが多
いことを利用したものであり、また後者の優先順位を与
える方法は、筆圧が低いほど文字の切れ目であることが
多いことを利用したものである。
また、上記実施例は説明を簡単とするために筆圧と上
下方向の画の重なりのみにより文字を切り出した場合を
例に採って述べたが、従来から用いられている種々の文
字の切り出し方法と組み合わせて用いることもできる。
例えば、文字の切れ目の候補である画の切れ目を第1
順位,本発明の筆圧の低い部分を第2順位として優先順
位に従って文字を切り出す方法、文字の切れ目と仮定し
た部分に右方向の筆跡成分を持つものを優先する方法、
文字の切れ目と仮定した部分の筆跡位置の上下付近に他
の文字や軌跡がないものを優先する方法などを採用する
ことができる。これらの方法は、上記した優先順位で文
字の切れ目である確率が高いことを利用し、あるいは文
字の切れ目の上下の部分には一般に他の文字が存在しな
いことが多い、などの連続文字の性質を利用したもので
ある。
〔発明の効果〕
本発明によれば、手書きによって入力される連続文字
を標準パターンに近い字形に直して1文字毎に切り出す
ことができ、オンライン連続文字認識装置の辞書容量を
増やすことなしに認識率を達成するとともに、誤認時間
を短縮することができるという優れた効果を奏する。
【図面の簡単な説明】
第1図は本発明の原理的実施例を示す図、 第2図ないし第6図は本発明を説明するための連続文字
の筆跡とその筆圧例を示す図、 第7図は英字,数字などの連続文字の筆跡例を示す図、 第8図は従来のオンライン連続文字認識装置を示す図で
ある。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】手書きにより入力される連続文字を所定の
    認識単位毎に切り出し、この切り出された入力文字の文
    字パターンを辞書内の標準パターンと比較照合すること
    により入力文字の認識を自動的に行うようにしたオンラ
    イン連続文字認識装置において、 文字手書き入力時の筆圧を検出する筆圧検出手段と、 前記筆圧検出手段によって筆圧の存在が検出されている
    状態であって、かつ当該筆圧が所定の閾値以下または極
    小値となる筆圧位置で連続文字中から文字を切り出す筆
    圧文字切り出し手段と、 を備えたことを特徴とするオンライン連続文字認識装置
    における文字切り出し装置。
JP63068318A 1988-03-24 1988-03-24 オンライン連続文字認識装置における文字切り出し装置 Expired - Fee Related JP2742263B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63068318A JP2742263B2 (ja) 1988-03-24 1988-03-24 オンライン連続文字認識装置における文字切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63068318A JP2742263B2 (ja) 1988-03-24 1988-03-24 オンライン連続文字認識装置における文字切り出し装置

Publications (2)

Publication Number Publication Date
JPH01241686A JPH01241686A (ja) 1989-09-26
JP2742263B2 true JP2742263B2 (ja) 1998-04-22

Family

ID=13370352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63068318A Expired - Fee Related JP2742263B2 (ja) 1988-03-24 1988-03-24 オンライン連続文字認識装置における文字切り出し装置

Country Status (1)

Country Link
JP (1) JP2742263B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59119485A (ja) * 1982-12-27 1984-07-10 Fujitsu Ltd 文字切出し方式
JPS62287387A (ja) * 1986-06-06 1987-12-14 Yukio Sato 手書き文字のオンライン認識方式

Also Published As

Publication number Publication date
JPH01241686A (ja) 1989-09-26

Similar Documents

Publication Publication Date Title
EP1564675B1 (en) Apparatus and method for searching for digital ink query
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
US5315667A (en) On-line handwriting recognition using a prototype confusability dialog
US5854855A (en) Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
US5768417A (en) Method and system for velocity-based handwriting recognition
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
JP2000353215A (ja) 文字認識装置および文字認識プログラムを記録した記録媒体
JPH0562391B2 (ja)
JP2742263B2 (ja) オンライン連続文字認識装置における文字切り出し装置
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
JP5455364B2 (ja) 情報処理装置及び軌跡データ認識方法
JP3217084B2 (ja) 手書文字認識装置
JPH05225399A (ja) 文書処理装置
JPS6261990B2 (ja)
JP3817281B2 (ja) 情報処理装置及び方法
JPH04337890A (ja) オンライン手書き文字認識装置
JP5630098B2 (ja) 情報処理装置およびプログラム
KR940003828B1 (ko) 온라인 필기체 한글인식 방법
JP2677271B2 (ja) 文字認識装置
KR960013818B1 (ko) 다중획인식을 이용한 한글조합인식장치
JPS5899888A (ja) 手書文字認識装置
JPH0731708B2 (ja) 手書き文字認識装置
JPH012186A (ja) 手書き文字認識方式
KR940001739B1 (ko) 스트로크인식을 통한 온라인 필기체 문자인식방법
JPS6215681A (ja) オンライン手書き文字認識方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees