JP2824704B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2824704B2
JP2824704B2 JP3109220A JP10922091A JP2824704B2 JP 2824704 B2 JP2824704 B2 JP 2824704B2 JP 3109220 A JP3109220 A JP 3109220A JP 10922091 A JP10922091 A JP 10922091A JP 2824704 B2 JP2824704 B2 JP 2824704B2
Authority
JP
Japan
Prior art keywords
stroke
character
input
segment
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3109220A
Other languages
English (en)
Other versions
JPH04336692A (ja
Inventor
斉志 広瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP3109220A priority Critical patent/JP2824704B2/ja
Publication of JPH04336692A publication Critical patent/JPH04336692A/ja
Application granted granted Critical
Publication of JP2824704B2 publication Critical patent/JP2824704B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は文字認識装置に関し、
特に、手書きで入力される文字を即座に認識するための
オンライン手書き文字認識装置に関する。
【0002】
【従来の技術】図11は、この種のオンライン文字認識
装置の従来の一例のブロック図である。図11を参照し
て、従来のオンライン文字認識装置は、タブレットある
いはディジタイザなど、操作者による所定のペンを用い
た手書きの筆記入力を、座標(x、y)で表わされる点
列に変換するための入力部10と、入力部10から送ら
れてくる、ペンオン状態を示す筆記情報から次にペンオ
フ状態となったことを示す筆記情報までの一連の点列を
表わすデータを1つのストロークとして検出するための
ストローク検出部12と、ストローク検出部12によっ
て検出された1ストローク分のデータを格納するための
筆記情報バッファ14と、ストローク検出部12による
ペンオフ状態の検出(ストローク終了の検出)に応答し
て、筆記情報バッファ14に格納されたストロークデー
タを順に読出し、入力されたストロークを認識するため
に必要なストロークの特徴を抽出するためのストローク
特徴抽出部20とを含む。入力部10によって複数個の
ストロークが入力されている間、ストローク検出部12
によるストロークの検出、ストローク特徴抽出部20に
よるストロークの特徴の抽出は繰返し行なわれる。
【0003】この装置はさらに、入力部10による1文
字分の入力の終了をストローク検出部12が検出したこ
とに応答して、ストローク特徴抽出部20から特徴デー
タを受取り、標準的な特徴データとのマッチングにより
入力された文字を認識するための認識部22と、標準的
な特徴データを予め格納しておくための認識辞書24
と、認識部22によって認識された文字を表示するため
の表示部26とを含む。
【0004】上述の説明で「ストローク」とは、手書き
文字を構成する最小の単位となるものをいう。同じ形の
字画であっても、1回のペンの操作で書かれた場合には
1本のストロークを、2回のペンの操作で書かれた場合
には2本のストロークを含むことになる。
【0005】手書き文字のオンライン文字認識で問題と
なるのは、本来分離されたストロークとして入力される
べき字画を続け書きで入力した場合、これをどのように
認識するかである。この手法として従来からよく知られ
ているものに、特徴点パターンマッチング法と、基本ス
トローク認識法とがある。
【0006】パターンマッチングとは以下のようなこと
をいう。この方法においては、入力された文字パターン
を、所定の方法でその文字パターンを表現する特徴量に
変換し、同様に予め特徴量で表わされて準備されている
標準パターンとの間の差(距離)あるいは類似性(類似
度)が求められる。そして、入力文字パターンの特徴量
ともっとも差(距離)が小さい、あるいは類似性(類似
度)がもっとも高い標準パターンを調べることにより、
入力文字の認識が行なわれる。差や類似性を求める方法
として、特徴量のとりかたによってさまざまなものがあ
る。
【0007】たとえば、前述の特徴点パターンマッチン
グにおいては、等間隔で配置された10点で各ストロー
クを近似し、これら各点を特徴点とする。5画(5スト
ローク)で入力された文字は50個の特徴点で表わされ
る。入力部から、各特徴点の座標データが入力されるわ
けであるから、この場合特徴量は50組の座標データと
いうことになる。そして、予め用意された5画の文字を
表わす、同様に50個の特徴点で表された表示パターン
との間で所定の方法により距離が計算される。5画のす
べての標準パターンとの間の距離の計算の結果もっとも
距離がすくないものが入力された文字として認識され
る。
【0008】基本ストローク法では、以下のようなパタ
ーンマッチングが行なわれる。基本ストロークとは、文
字を表現するのに必要な基本的形状をもったストローク
のことをいう。すべての文字は、この基本ストロークの
組合せで表現することができる。すなわち、基本ストロ
ーク認識法は、文字を構成する最小の単位はストローク
であるとし、すべての文字はストロークの組合せで表現
されるという基本的な考えかたをもとにした認識手法で
ある。実際には、以下の手法で文字認識が行なわれる。
まず、入力された文字の各ストロークが基本ストローク
とマッチングされる。入力された文字のすべてのストロ
ークについてこのマッチングが行なわれ、各ストローク
に対応した基本ストロークを表わすコードが得られる。
この基本ストロークを表わすコードの組合せを、予め用
意された文字認識辞書に格納された、基本ストロークを
表わすコードの標準的組合せと比較し、もっとも差が小
さいものあるいはもっとも類似性が高いものを入力され
た文字として認識する。
【0009】特徴点パターンマッチング法においても、
基本ストローク認識法においても、入力パターンと比較
される標準パターンを予め準備しておく必要がある。図
11の認識辞書24はこの標準パターンを予め格納して
おくためのものである。そして、認識部22はストロー
ク特徴抽出部20から与えられた入力文字の特徴量と、
認識辞書24に格納された標準パターンとを比較して文
字を認識する。認識された文字は表示部26によって表
示される。
【0010】
【発明が解決しようとする課題】しかし、従来の装置で
は以下のような問題点があった。特徴点パターンマッチ
ング法では、1文字が1パターンに対応している。とこ
ろが、手書き文字認識においては、たとえば漢字の場合
の「楷書」、「行書」、「草書」などの書体により代表
される、「続け字」が入力される可能性が高い。同一の
文字であっても、上述のような続け字の入力を許容する
ためには、許容した数だけ認識すべき文字パターンが増
えるということである。結果的に、標準パターンを記憶
しておくためのメモリ(図21における認識辞書24)
の容量が、文字数の増加とともに線形的に増加する。比
較すべき標準文字パターンが増加するわけであるから、
入力文字パターンと標準文字パターンとのパターンマッ
チングの回数も文字数の増加につれて線形的に増加す
る。たとえば、前述のように特徴量を、一ストロークを
10点で近似した特徴点とすると、本来6画の文字を続
け字として5画で書いたパターンを文字認識するために
は、さらに50個の特徴点を記憶する必要がある。ま
た、同一の文字を別の態様で続けて5画で入力した場合
の文字を正しく認識するためには、さらにそのパターン
に対応した50個の特徴点を記憶しなければならない。
そして、文字が入力されるたびに、入力文字パターンと
この新たに設けられた標準パターンとのマッチングも行
なわなければならない。したがって認識処理時間も増加
することになる。
【0011】基本ストローク認識法では、各文字の標準
パターンは基本ストロークを表わすコード列で書かれて
いる。したがって1つの文字について他の続け字パター
ンを記憶するためには、その続け字の画数の分の基本ス
トロークのコード列を記憶しておけばよい。したがって
文字認識辞書に必要な容量は、特徴点パターンマッチン
グ法と比較すると少なくてすむ。しかし、基本ストロー
ク認識法でも、特徴点パターンマッチング法ほどではな
いにせよ、文字認識辞書に必要とされる容量が増加する
ことは避けられない。比較のための標準パターンの数が
増えるわけであるから認識処理時間の増加も避けられな
い。さらにこの場合には、標準パターンとして用意され
たストロークの中に類似したものが増加し、ストローク
認識精度が低下し、ひいては文字の認識精度が低下する
おそれがある。
【0012】それゆえにこの発明の目的は、文字認識辞
書のためのメモリ容量の増加を抑え、文字認識のための
処理速度の低下を防ぎつつ、続け字の認識を行なうこと
ができる文字認識装置を提供することである。
【0013】
【課題を解決するための手段】請求項1に記載の文字認
識装置は、使用者が手書き筆記で入力する文字の筆記情
報を検出する為の入力手段と、検出された筆記情報から
前記使用者の手書き筆記のストロークを検出する為のス
トローク検出手段と、筆記情報に基づいて、ストローク
を連続する複数個の線分に分割する為のストローク分割
手段と、各線分の筆記方向を検出して、筆記方向に対応
した方向コードを出力する為の筆記方向検出手段と、筆
記方向が横方向基準軸に対してほぼπ/2〜ほぼπの角
度範囲内であることを示す値である方向コードを有する
線分を検出して、当該線分においてストロークを基本ス
トロークに分離する為の手段と、分離された基本ストロ
ークに基づいて、使用者により入力された文字を認識す
る為の認識手段とを含む。
【0014】
【0015】請求項2に記載の文字認識装置は、使用者
が手書き筆記で入力する文字の筆記情報を検出する為の
入力手段と、検出された筆記情報から使用者の手書き筆
記のストロークを検出する為のストローク検出手段と、
筆記情報に基づいて、ストロークを、連続する複数個の
線分に分割する為のストローク分割手段と、各線分が横
方向基準軸となす角度を検出する為の線分角度検出手段
と、横方向基準軸となす角度がほぼπ/2〜ほぼπの角
度範囲内にある線分を検出し、当該線分においてストロ
ークを基本ストロークに分離する為のストローク分離手
段と、分離された基本ストロークから、前記使用者によ
り入力された文字を認識する為の認識手段とを含む。
【0016】
【0017】
【作用】請求項1に記載の文字認識装置においては、使
用者が手書き筆記で入力する筆記情報から筆記のストロ
ークが検出される。ストローク分割手段が、筆記情報に
基づいて、これらストロークを連続する複数個の線分に
分割して、各線分の筆記方向が検出され、筆記方向に対
応した方向コードが出力される。横方向基準軸に対して
π/2〜πの角度範囲内の筆記方向を有するストローク
が、基本ストロークの切れ目を表すことに着目し、所定
の方向コードを有する線分を検出して、当該線分におい
てストロークを基本ストロークに分離する。分離された
基本ストロークに基づいて、使用者により入力された文
字が認識される。
【0018】
【0019】請求項2に記載の文字認識装置において
は、使用者が手書き筆記で入力する筆記情報から筆記の
ストロークが検出される。ストローク分割手段が、筆記
情報に基づいて、これらストロークを連続する複数個の
線分に分割して、各線分が予め方向となす角度が検出さ
れる。横方向基準軸に対してπ/2〜πの角度範囲内の
筆記方向を有するストロークが、基本ストロークの切れ
目を表すことに着目し、線分が、横方向基準軸に対して
ほぼπ/2〜ほぼπの範囲の角度をなすときにこの線分
でストロークが基本ストロークに分離される。分離され
た基本ストロークに基づいて、使用者により入力された
文字が認識される。
【0020】
【0021】
【実施例】図1は、本発明の一実施例にかかる文字認識
装置のブロック図である。図1に示される装置が図11
に示される従来の装置と異なるのは、ストローク検出部
12の後段に、入力されたストロークの特徴を抽出し、
その特徴に基づいてストロークから1または複数個の基
本ストロークを抽出してストローク特徴抽出部20に与
えるための基本ストローク抽出部34を新たに含むこと
である。基本ストローク抽出部34は、ストローク検出
部12と筆記情報バッファ14とに接続され、操作者に
よる1ストロークの入力の終了をストローク検出部12
が検出したことに応答して、筆記情報バッファ14から
ストロークデータを読出し、ストロークを基本ストロー
クに分離するために必要な分離特徴を抽出するための分
離特徴抽出部16と、分離特徴抽出部16によって抽出
された分離特徴に基づき、ストロークを1または複数個
の基本ストロークに分離してストローク特徴を抽出部2
0に与えるためのストローク分離部18とを含む。
【0022】図1と図11とにおいて、同一のブロック
には同一の参照符号および名称が与えられている。それ
らの機能も同一である。したがってここではそれらにつ
いての詳しい説明は繰返されない。
【0023】図1に示される装置は以下のように動作す
る。入力部10は、操作者が1ストロークの入力を始め
たことを検知して、ペンの動きを表わす点列の座標
(x、y)からなる筆記情報をストローク検出部12に
与える。ストローク検出部12は、入力部10から与え
られる筆記情報を筆記情報バッファ14に格納する。入
力部10は、操作者による1ストロークの入力の終了
(ペンオンからペンオフへの変化)を検知して、ペンオ
フ状態の筆記情報をストローク検出部12に与える。ス
トローク検出部12は、入力部10から与えられたペン
オフ状態の筆記情報に応答して、分離特徴抽出部16に
対してストローク入力の終了を示す信号を与える。
【0024】分離特徴抽出部16は、ストローク検出部
12から与えられるストローク入力の終了を示す信号に
応答して、筆記情報バッファ14に格納された筆記情報
i (i=k…k+m)を順に読出して、所定の方法に
従って、入力されたストロークを基本ストロークに分離
するのに必要な分離特徴を求め、ストローク分離部18
に与える。ここで“k”は、一文字の先頭からの筆記情
報を通算した番号である。
【0025】ストローク分離部18は、分離特徴抽出部
16から与えられた分離特徴により、所定の規則に従っ
てストロークの分離位置を求め、ストロークを1または
複数個の基本ストロークに分離して、基本ストロークご
とに分割された筆記情報をストローク特徴抽出部20に
与える。
【0026】ストローク特徴抽出部20は、ストローク
分離部18から与えられた基本ストロークを示す筆記情
報から、ストロークの認識のために必要な特徴を抽出す
る。
【0027】操作者が入力部10を用いて1文字の入力
を行なっている間、ストローク検出部12により筆記情
報バッファ14への筆記情報の格納、ストローク検出部
12による1ストロークの入力終了の検出、分離特徴抽
出部およびストローク分離部18による基本ストローク
の抽出、ストローク特徴抽出部20によるストローク認
識に必要な特徴の抽出のそれぞれの処理は、繰返し行な
われる。そして、操作者による文字入力の終了をストロ
ーク検出部12が検出すると、ストローク検出部12は
認識部22に対して入力されたストロークの組合せと、
認識辞書24に格納された標準的なストロークパターン
とのマッチングの開始を指示するための信号を与える。
操作者による文字入力の終了は、たとえば以下のように
して行なわれる。入力部10に各々に1文字が入力され
るための複数個の枠が用意されている場合には、1つの
枠から別の枠への入力が開始されたことを検知すること
で、直前まで入力されていた枠内の文字の入力の終了が
検出できる。あるいは、操作者による入力が所定時間な
されないこと(タイムアウト)を検出して文字の入力終
了と判断することもできる。あるいは、入力部10に認
識終了を示すボタンなどを設け、このボタンをペンで押
下することによりストローク検出部12に文字入力の終
了を通知することもできる。
【0028】認識部22は、ストローク検出部12から
マッチングの開始を指示する信号を受取ると、ストロー
ク特徴抽出部20に抽出されている入力文字のストロー
クデータと、認識辞書24に格納されている標準的なス
トロークパターンとのマッチングを行なう。マッチング
の結果入力文字パターンと最も差の少ない、あるいは最
も類似性の高い標準パターンに対応する文字が、入力さ
れた文字として認識される。認識部22は、認識の結果
得られた文字を示す情報を表示部26に与える。表示部
26は、認識部22から与えられた、認識結果を示す文
字を表示する。
【0029】上述のように基本ストローク抽出部34を
設け、本来分離されて入力されるべき2以上のストロー
クが1つのストロークとして入力された場合、これを本
来の1または複数個の基本ストロークに分離してから認
識辞書とのマッチングを行なうことにより、以下のよう
な効果が生ずる。続け字であっても、各ストロークを基
本ストロークに分離するため、続け字の入力ストローク
数に対応した標準ストロークパターンを認識辞書に予め
用意しておく必要がない。したがってメモリ容量の増加
を抑えることができる。標準パターンの数が抑えられる
ため、認識の際のパターンマッチングの回数も増加せ
ず、したがって認識の際の処理速度の低下を防ぐことが
できる。また、認識辞書に格納されているストローク数
が少ないため、類似したストロークが増加することがな
く、ストロークの認識精度の低下を防ぐことができ、結
果として文字の認識精度の低下も防ぐことができる。
【0030】以下、基本ストローク抽出部34において
行なわれる処理を詳述する。分離特徴抽出部16が抽出
する分離特徴としては、ストロークを複数個の線分(セ
グメント)で近似し、各セグメントの方向を表す方向コ
ードを求めるものと、同様に各線分の角度を求めるもの
が例として考えられる。方向コードとは各セグメント
に、その角度に応じて一定の対応関係に基づいて与えら
れるコードを言う。より具体的には、方向コードは以下
の様なものである。
【0031】入力部10から入力された筆記情報は、ス
トローク上の点列である。従ってこの点列を順次接続し
てセグメントとしていくことにより、ストロークは複数
個のセグメントで近似される。このi番目のセグメント
が座標のx軸の正の方向と成す角度をθi とする。する
と、このセグメントに与えられる方向コードhi は以下
の様に定義される。
【0032】方向コードを1〜nのn通りとする。この
場合、360度をn等分する。n等分された各領域に
は、1〜nの方向コードが順に割り当てられる。そして
前述のθi がこのn等分された領域のどこにはいるか
で、その領域に割り当てられた方向コードがそのセグメ
ントに与えられる。具体的にどの様にして方向コードの
定義が行われるかは後に詳述する。また、各セグメント
の角度をどの様にしてもとめるかも後に詳しく述べる。
角度の求め方は、分離特徴として角度を利用する場合に
も同様である。
【0033】以下では、方向コードに16方向コードを
用いた場合を例として、方向コードを分離特徴とした場
合の分離特徴抽出部16及びストローク分離部18の動
作の詳細が説明される。
【0034】i番目のセグメントの始点及び終点の座標
値を(xi ,yi )、(xi+1 ,y i+1 )とする。dx
i =xi + 1 −xi 、dyi=yi + 1 −yi (i=1
〜15)とすると、セグメントの角度θiが以下の式
(1)により計算される。
【0035】
【数1】
【0036】上の式(1)によって求められたセグメン
トの角度θi に対し、以下の関係式(2)によって方向
コードhi が定められる。
【0037】
【数2】
【0038】16方向コードを採用した場合、方向コー
ドとセグメント角度との関係は以下のようになる。
【0039】 −π/16≦θi ≦π/16のときhi =1 π/16<θi <3π/16のときhi =2 3π/16≦θi ≦5π/16のときhi =3 5π/16<θi <7π/16のときhi =4 7π/16≦θi ≦9π/16のときhi =5 9π/16<θi <11π/16のときhi =6 11π/16≦θi ≦13π/16のときhi =7 13π/16<θi <15π/16のときhi =8 15π/16≦θi ≦17π/16のときhi =9 17π/16<θi <19π<16のときhi =10 19π/16≦θi ≦21π/16のときhi =11 21π/16<θi <23π/16のときhi =12 23π/16≦θi ≦25π/16のときhi =13 25π/16<θi <27π<16のときhi =14 27π/16≦θi ≦29π/16のときhi =15 29π/16<θi <31π/16のときhi =16 16方向コード以外の方向コードを使用した場合にも、
式(1)、(2)を用いることによってセグメント角度
と方向コードとを関係付けることができる。図2には、
16方向コードにおける、基準として選ばれる16の方
向が示されている。図2に示されるように、16方向コ
ードにおいては、これらの角度を中心とした前後π/1
6づつの領域を各方向コードに割り当ててあり、セグメ
ント角度がその領域に入った場合に、その方向コードを
そのセグメントに対して割り当てる。
【0040】ストローク筆記情報pi (i=k…k+
m)が得られると、以下の手順に従ってストロークが基
本ストロークに分離される。筆記情報pi の座標データ
(xi 、yi )より、各セグメントの角度θi が求めら
れる。すなわち、角度計算処理が行なわれる。
【0041】セグメントの角度θi が計算されると、前
述の式(2)以下によって定義される変換f(θi )に
よって図2に示される16方向コードhi に変換され
る。すなわち、方向コード化処理が行なわれる。いいか
えると入力された1ストロークが、座標データにより定
まるセグメントによって近似され、さらに各セグメント
の方向コードが求められる。
【0042】ストロークが各セグメントに分割され、か
つ各セグメントの方向コードが求められると、各セグメ
ントの方向コードhi を参照しながら、同一方向コード
を有する連続したセグメントが統合される。すなわち、
方向統合化処理が行なわれる。このとき得られた統合セ
グメントに与えられた方向コードをhj ′(j=k,
…,k+n−1)とする。
【0043】統合されたセグメントの方向コードhj
について、5<hj ′かつhj ′<9を満たすセグメン
トをサーチする。すなわち、統合されたセグメントのセ
グメント角度θj が、下の式(3)を満たすか否かを、
すべての統合セグメントについて検査する。
【0044】 9π/16<θj <15π/16…(3) このような統合されたセグメントをサーチすることによ
り、ストロークの基本ストロークへの分離位置が検出さ
れる。その理由は以下のようである。通常、人が文字を
手書きする場合、基本ストロークとしてストロークの方
向が90°〜180°の方向になることはない。すなわ
ち、手書き入力された文字のストロークのうち、その筆
記方向が90°〜180°付近にある場合には、もとも
との文字の基本ストロークではなく、基本ストロークを
連続させて続け字とするための筆の運びであると考えら
れる。したがって、筆記方向が90°〜180°となる
ところは、2つの基本ストロークの境界である。すなわ
ち、この処理によってストロークを基本ストロークに分
離するための位置が検出される。
【0045】続いて、分離位置検出処理で検出された分
離位置においてストローク筆記情報が分離され、1また
は複数個の基本ストローク筆記情報となる。
【0046】このように連続したストロークを分離特徴
に従った位置で基本ストロークに分離することにより、
パターンマッチングの際に必要なストロークの標準パタ
ーンの数を少なくすることができる。したがって認識辞
書の容量を少なくすることができるとともに、パターン
マッチングの際の処理時間も長くなることはない。
【0047】図3および図4を参照して、具体的な例に
ついて連続したストロークを基本ストロークに分離する
ための処理を説明する。図3には、ある文字30
(「ア」が1画で書かれた場合の字形を示す。図3に示
される文字30が入力部10(図1参照)から入力され
たとき、図4(a)に示される様に筆記情報p〜p
15の15点によって表現されるストロークが得られた
ものとする。
【0048】このとき、図3に示されるような座標軸に
従って入力部10からの筆記情報が得られるものとす
る。各点の座標値は(5,30)、(11,32)、
(18,34)、(23,36)、(29,35)、
(34,31)、(34,26)、(32,22)、
(29,21)、(23,20)、(20,25)、
(22,20)、(22,15)、(20,10)、
(15,5)であるものとする。このとき、各点p1
1 5 を順に連結した14のセグメントのセグメント方
向h i (i=1〜14)は、図4(b)に示されるよう
に、順に以下のようになる。
【0049】2,2,1,1,16,13,11,1
1,9,6,14,13,12,11さらに、同一のセ
グメント方向を有する連続するセグメントを統合して1
つのセグメントとする。このときの各統合セグメントの
セグメント方向hj ′は、図4(c)に示されるよう
に、以下のようになる。
【0050】2,1,16,13,11,9,6,1
4,13,12,11 上の結果から、分離位置となるための条件「5<hj
<9」を満たすセグメント方向hj ′は、h7 ′のみで
ある。したがって、セグメント方向h7 ′を有するセグ
メントの終点である点p1 1 が分離位置となる。点p
1 1 で、文字30のストロークを分離することにより、
図4(d)に示されるように、入力されたストロークは
第1のストローク30a(p1 ,p2 ,…,p1 1
と、第2のストローク30b(p1 1 ,p1 2 ,…,p
1 5 )とに分割される。このように分割された基本スト
ローク30a、30bを用いて基本ストローク認識法に
従って文字認識を行なうことができる。
【0051】図5を参照して、図5(a)に示される文
字32(アルファベットの「A」)の、基本ストローク
への分離処理が説明される。図5(a)に示される文字
32が入力されることにより、図5(b)に示されるよ
うな29点p1 〜p2 9 が、ストローク筆記情報として
得られたものとする。
【0052】図5(b)に示される各点p1 〜p2 9
座標値が以下のようであったものとする:(5,5)、
(7,10)、(9,15)、(12,22)、(1
4,26)(17,31)、(19,33)、(22,
36)、(25,36)、(28,33) (30,29)、(31,25)、(32,20)、
(32,17)、(33,12) (32,9)、(29,4)、(25,4)、(21,
6)、(16,8)(12,11)、(9,14)、
(9,16)、(13,17)、(17,17) (22,16),(26,16)、(30,15)、
(34,15) この場合、各点を順次直線で接続することによって得ら
れるセグメントのセグメント方向hk (k=1〜28)
は、図5(c)に示されるごとく以下のようになる:
4,4,4,4,4,3,3,1,15,14,14,
13,13,13,13,11,9,8,8,7,7,
5,1,1,1,1,1,1 前述のように同一のセグメント方向hk を有する連続す
るセグメントを統合し、統合されたセグメントのセグメ
ント方向hj ′を求めると図4(d)に示されるように
以下のようになる:4,3,1,15,14,13,1
1,9,8,7,5,1 以上の結果から、h9 ′、h1 0 ′が、5<hj ′<9
を満たす。したがって、統合セグメントh1 0 ′の終点
である点p2 2 が分離位置となる。その結果入力された
文字32の位置ストロークは、p2 2 において分離さ
れ、第1のストローク32a(p1 ,p2 ,…,
2 2 )と、第2のストローク32b(p2 2
2 3 ,…,p2 9 )に分割される。(図5(e)参
照)実際には、図1に示される文字認識装置のうち、ス
トローク検出部12〜認識辞書24は、コンピュータ上
で動作するプログラムによって実現される。図6は、そ
のようなプログラムのメインルーチンのフローチャート
である。図6を参照して、ステップS001において、
ストロークの終りが検出されたか否かが判断される。判
断の答がYESであれば制御はステップS002に進
み、さもなければ制御はステップS001に戻る。
【0053】ステップS002においては、今その終了
が検出されたストロークが、1つの文字の入力の終りで
あるか否かが判断される。判断の答がYESであれば制
御はステップS007に進み、さもなければ制御はステ
ップS003に進む。
【0054】ステップS003においては、入力された
ストロークからストローク方向などの分離特徴が抽出さ
れる。制御はステップS004に進む。
【0055】ステップS004においては、ステップS
003において抽出されたストローク分離のための分離
特徴に基づいて、入力されたストロークが1または複数
個の基本ストロークに分離される。制御はステップS0
05に進む。
【0056】ステップS005においては、ステップS
004において分離された基本ストロークの、パターン
マッチングのための特徴が抽出される。制御はステップ
S006に進む。
【0057】ステップS006においては、ステップS
005において抽出された基本ストロークの特徴量と、
認識辞書24(図1参照)に格納されていた、基本スト
ロークの標準パターンとのマッチングが行なわれ、基本
ストロークが認識される。制御はステップS001に戻
る。
【0058】ステップS002における判断の答がYE
Sであれば制御はステップS007に進むが、ステップ
S007においては、認識された基本ストロークの組合
せと、認識辞書24に格納されていたストロークの組合
せの標準パターンとのマッチングが行なわれ、入力文字
と最も距離の少ない(類似度の高い)文字が入力された
ものとして認識され、表示される。その後このプログラ
ムは終了する。
【0059】図7は、図6のステップS003において
行なわれる分離特徴抽出処理のルーチンのフローチャー
トである。図7を参照して、ステップS101において
k番目のセグメントのセグメント角度θk が計算され
る。この計算は前述の式(1)に従って行なわれる。制
御はステップS102に進む。
【0060】ステップS102においては、ステップS
101において求められたセグメント角度θk に基づ
き、各セグメントに対して与えられる方向コードを求め
る処理が行なわれる。すなわち、セグメント角度θ
k を、式(2)以下によって定義される関数f(θk
に従って、方向コードhk に変換する処理が行なわれ
る。
【0061】ステップS101、S102の処理は、k
=1〜m−1の、m−1回だけ行なわれる。ステップS
101、S102の処理がm−1回行なわれた後、制御
はステップS103に進む。
【0062】ステップS103においては、ステップS
101、S102において得られた方向コードに基づい
て、同一の方向コードを有する連続するセグメントが統
合され、統合セグメントとされる。制御はステップS1
04に進む。
【0063】ステップS104においては、統合された
セグメントの方向コードhj ′が条件「5<hj ′<
9」を満たしているか否かを検査することにより、セグ
メントを基本セグメントに分離するための分離位置が検
出される。ステップS104の処理終了後このサブルー
チンは終了する。
【0064】図8は、図7のステップS103において
行なわれる方向統合化処理のためのサブルーチンのフロ
ーチャートである。図8を参照して、ステップS201
において、変数i1、i2に、それぞれ初期値k+1、
2が与えられる。この場合の初期値kは、入力された文
字に複数個のストロークが存在した場合の、最初のスト
ロークの先頭の座標データを1番目とした場合の、入力
される座標データの順番を示す値である。点pk は、入
力文字のうちの何番目かのストローク(現在処理対象と
なっているストローク)の先頭の点である。ステップS
201においてはまた、1番目の統合セグメントの方向
データh1 ′に、対象となっているストロークの先頭の
セグメントの方向コードhk が代入される。制御はステ
ップS202に進む。
【0065】ステップS202においては、
i 2 - 1 ′がhi 1 と等しいか否かが判断される。判
断の答がYESであれば制御はステップS204に進
み、さもなければ制御はステップS203を経てステッ
プS204に進む。
【0066】ステップS203においては、i1番目の
セグメントの方向コードhi 1 が、i2番目の統合セグ
メントの方向コードhi 2 ′に代入される。また、変数
i2が1インクリメントされる。ステップS203の処
理により、同一の方向コードを有するセグメントの終り
が検出され、1つの統合セグメントの形成が終了する。
制御はステップS204に進む。
【0067】ステップS204においては、変数i1の
内容が1インクリメントされる。これにより、セグメン
トの統合のための対象セグメントが次のものに移る。
【0068】ステップS202〜ステップS204の処
理は、統合の対象となるセグメントの数(m−2)と同
じ数だけ、すなわちm−2回だけ繰返される。すべての
処理が終了するとこのサブルーチンは終了する。
【0069】図9は、図7に示されるステップS104
において行なわれる分離位置検出処理を行なうためのサ
ブルーチンのフローチャートである。図9を参照して、
ステップS301において、変数i、jにそれぞれ初期
値1、2が設定される。処理対象となっている統合セグ
メントの方向コードhj ′が、条件「5<hi ′<9」
を満たしているか否かを示すためのフラグに初期値0が
設定される。また、ストローク分離位置を示す変数Sp
1 に初期値「1」が設定される。変数Spk は、その終
点がストローク分離位置となるような統合セグメントの
番号を記憶するための変数であり、複数個用意されてい
る。制御はステップS302に進む。
【0070】ステップS302においては、i番目の統
合セグメントの方向コードhi ′が、条件「5<hi
<9」を満たしているか否かが判断される。判断の答が
YESであれば制御はステップS306に進み、さもな
ければ制御はステップS303に進む。
【0071】ステップS306においては、現在処理対
象となっている統合セグメントが所定の条件を満たして
いるということであるから、フラグに1がセットされ
る。制御はステップS305に進む。
【0072】ステップS302からステップS303に
制御が進んだ場合、ステップS303においては、フラ
グに格納された値が1であるか否かが判断される。判断
の答がYESであれば制御はステップS304に進み、
さもなければ制御はステップS305に進む。ステップ
S304においては、以下のような処理が行なわれる。
このステップに制御が進んできた場合、現在処理対象と
なっている統合セグメントはステップS302の条件を
満たしていない。一方、ステップS303における判断
の答がYESであるから、1つ前の統合セグメントはス
テップS302の条件を満たしている。したがって、こ
の2つの統合セグメントが連結されている点においてス
トロークは分離される。したがってステップS304に
おいては、変数Spj に、変数iの内容が格納される。
変数jの値は1インクリメントされる。フラグが0にク
リアされる。制御はステップS305に進む。
【0073】ステップS305においては、変数iの値
が1インクリメントされる。これにより、次の統合セグ
メントに処理が進むことになる。制御はステップS30
2に戻る。
【0074】ステップS320〜S305の処理は、統
合セグメントの数i2だけ繰返される。i2回だけ繰返
し処理された後、このサブルーチンは終了する。なお、
統合セグメントの数i2は、図8に示される方向統合化
処理において求められている。
【0075】図6に示されるステップS004のストロ
ーク分離処理においては、図9に示される分離位置検出
処理で検出された、i番目の分離位置となる統合セグメ
ントの番号を格納する変数Spi の内容を参照するだけ
で、ストロークを構成するどのセグメントでストローク
を基本ストロークに分離すればよいかが判定できる。
【0076】以上のように、図6〜図9に示される制御
の構造を有するプログラムをコンピュータ上で動作させ
ることにより、本発明にかかる文字認識装置をソフトウ
ェアで実現することが可能となる。
【0077】上述の説明においては、分離位置の検出に
方向コードが用いられた。しかし、前にも説明したよう
に、方向コードではなく各セグメントの角度を用いるこ
ともできる。図10は、図6に示されるメインルーチン
のステップS003における分離特徴抽出処理を、セグ
メント角度を検出することにより行なうときのプログラ
ムのサブルーチンのフローチャートである。図10を参
照して、ステップS501において、k番目のセグメン
トのセグメント角度θk が計算される。ステップS50
1は、m−1個のセグメントのすべてについて計算され
る。制御はステップS502に進む。
【0078】ステップS502においては、計算された
セグメント角度θkのうち、条件「π/2<θk <π」
を満たすセグメントがあるか否かが検査される。セグメ
ント角度θk が上述の条件を満たす場合、前述のように
手書き筆記の場合に筆記方向が90°〜180°となる
ことがないことから、このような条件を満たすセグメン
トは基本ストロークではなく、基本ストロークをつなぐ
ためのストローク部分であると判定することができる。
したがって、ステップS502によって前述の条件を満
たすセグメントを検出することにより、方向コードを用
いた場合と同様にストロークを基本ストロークに分離す
るための位置が検出できる。
【0079】以上、本発明にかかる文字認識装置が、図
面を参照して説明された。しかし、本発明は上述の実施
例に限定されるわけではなく、この他にも種々の変更を
加えて実施することができる。
【0080】
【発明の効果】以上の様に請求項1に記載の文字認識装
置によれば、使用者が手書き筆記で入力する筆記情報か
ら使用者の筆記のストロークが検出され、ストロークの
方向コードに基づいて、横方向基準軸に対してほぼπ/
2〜ほぼπの角度範囲内の筆記方向を示す線分でストロ
ークを分離することにより、文字を構成する基本ストロ
ークが抽出される。文字はこの基本ストロークに基づい
て認識される。基本ストロークの数は少なく、従来のパ
ターンマッチングを用いる場合の様に続け字のバリエー
ションの数だけの文字の特徴の標準パターンを用意して
おく必要も、許容する続け字に対応した数のストローク
パターンを予め用意しておく必要もない。認識の際に参
照されるストロークパターンも少なくてすむ。その結
果、記憶容量が節約できるとともに、認識速度も向上す
る。
【0081】
【0082】請求項2に記載の文字認識装置によれば、
筆記情報に基づいて、ストロークを構成する複数個の線
分が横方向基準軸となす角度が検出される。こうして検
出された線分の角度に基づいて、横方向基準軸に対して
ほぼπ/2〜ほぼπの角度範囲内の筆記方向である線分
でストロークが基準ストロークに分離される。線分の角
度検出は、例えば線分の始点と終点とがわかれば容易に
行う事が出来る上、人の筆記方向がほぼπ/2からほぼ
πという特定の角度範囲内になることは殆どないと言う
事実を利用して、簡単な処理で文字の認識を精度良く行
えるという効果がある。
【0083】
【図面の簡単な説明】
【図1】本発明の一実施例のオンライン文字認識装置の
ブロック図である。
【図2】方向コードを説明するための模式図である。
【図3】手書き入力された文字「ア」を示す模式図であ
る。
【図4】文字「ア」の基本セグメントへの分割の過程を
示す模式図である。
【図5】文字「A」の基本セグメントへの分割の過程を
示す模式図である。
【図6】本発明にかかるオンライン文字認識装置で実行
されるプログラムのメインルーチンのフローチャートで
ある。
【図7】分離特徴抽出処理のフローチャートである。
【図8】方向統合化処理のフローチャートである。
【図9】分離位置検出処理のフローチャートである。
【図10】この発明の第二の実施例における分離特徴抽
出処理のフローチャートである。
【図11】従来のオンライン文字認識装置のブロック図
である。
【符号の説明】
10 入力部 12 ストローク検出部 14 筆記情報バッファ 16 分離特徴抽出部 18 ストローク分離部 20 ストローク特徴抽出部 22 認識部 24 認識辞書 26 表示部 34 基本ストローク抽出部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/62

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 使用者が手書き筆記で入力する文字の筆
    記情報を検出する為の入力手段と、 前記検出された筆記情報から前記使用者の手書き筆記の
    ストロークを検出する為のストローク検出手段と、 前記筆記情報に基づいて、前記ストロークを連続する複
    数個の線分に分割する為のストローク分割手段と、 各前記線分の筆記方向を検出して、筆記方向に対応した
    方向コードを出力する為の筆記方向検出手段と、 筆記方向が横方向基準軸に対してほぼπ/2〜ほぼπの
    角度範囲内であることを示す値である方向コードを有す
    る線分を検出して、当該線分においてストロークを基本
    ストロークに分離する為の手段と、 前記分離された基本ストロークに基づいて、前記使用者
    により入力された文字を認識する為の認識手段とを含
    む、文字認識装置。
  2. 【請求項2】 使用者が手書き筆記で入力する文字の筆
    記情報を検出する為の入力手段と、 前記検出された筆記情報から前記使用者の手書き筆記の
    ストロークを検出する為のストローク検出手段と、 前記筆記情報に基づいて、前記ストロークを連続する複
    数個の線分に分割する為のストローク分割手段と、 各前記線分が予め定める方向となす角度を検出する為の
    線分角度検出手段と、 横方向基準軸となす角度がほぼπ/2〜ほぼπの角度範
    囲内にある線分を検出し、当該線分において前記ストロ
    ークを基本ストロークに分離する為のストローク分離手
    段と、 前記分離された基本ストロークから、前記使用者により
    入力された文字を認識する為の認識手段とを含む、文字
    認識装置。
JP3109220A 1991-05-14 1991-05-14 文字認識装置 Expired - Fee Related JP2824704B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3109220A JP2824704B2 (ja) 1991-05-14 1991-05-14 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3109220A JP2824704B2 (ja) 1991-05-14 1991-05-14 文字認識装置

Publications (2)

Publication Number Publication Date
JPH04336692A JPH04336692A (ja) 1992-11-24
JP2824704B2 true JP2824704B2 (ja) 1998-11-18

Family

ID=14504643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3109220A Expired - Fee Related JP2824704B2 (ja) 1991-05-14 1991-05-14 文字認識装置

Country Status (1)

Country Link
JP (1) JP2824704B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5929909A (ja) * 1982-08-11 1984-02-17 Matsushita Electric Ind Co Ltd 灯芯上下式石油燃焼器
JPS5949656A (ja) * 1982-09-14 1984-03-22 Fujitsu Ltd 線図形の直線・円弧近似装置
JPS6084684A (ja) * 1983-10-14 1985-05-14 Canon Inc 文字認識方式
JPS6128181A (ja) * 1984-07-19 1986-02-07 Sony Corp パタ−ン情報圧縮装置
JPH0738209B2 (ja) * 1987-10-23 1995-04-26 株式会社日立製作所 手書き速記文字認識装置

Also Published As

Publication number Publication date
JPH04336692A (ja) 1992-11-24

Similar Documents

Publication Publication Date Title
JP3143461B2 (ja) 文字認識方法及び文字認識装置
US6556712B1 (en) Methods and apparatus for handwriting recognition
EP1564675B1 (en) Apparatus and method for searching for digital ink query
US5315667A (en) On-line handwriting recognition using a prototype confusability dialog
US5265174A (en) Pattern recognition apparatus
CN111414837A (zh) 手势识别方法、装置、计算机设备及存储介质
EP0542566A2 (en) Character recognition method and apparatus thereof
JP2651009B2 (ja) 情報認識装置
JP2824704B2 (ja) 文字認識装置
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
JPH0442316A (ja) 電子計算機
JP2851865B2 (ja) 文字認識装置
AU764561B2 (en) Method and apparatuses for handwriting recognition
JP3817281B2 (ja) 情報処理装置及び方法
JP3514085B2 (ja) 文字列入力方法及び装置、並びに、文字列入力プログラムを格納した記憶媒体
JPH10247221A (ja) オンライン文字認識装置
JP2677271B2 (ja) 文字認識装置
JP4180137B2 (ja) オンライン手書き文字認識方法
CN114399768A (zh) 基于Tesseract-OCR引擎的工件产品序列号识别方法、装置及系统
JP3146046B2 (ja) オンライン文字認識装置
JPH07107698B2 (ja) 文字認識方法
JP2972443B2 (ja) 文字認識装置
JPH053631B2 (ja)
JP2519782B2 (ja) 文字分離方式
JP3139701B2 (ja) ファジィベクトルによるオンライン手書き入力文字認識方法及び装置並びにその方法を実行するための記録媒体

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980804

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080911

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees