JPH09114929A - 文字認識方法および装置 - Google Patents

文字認識方法および装置

Info

Publication number
JPH09114929A
JPH09114929A JP7271122A JP27112295A JPH09114929A JP H09114929 A JPH09114929 A JP H09114929A JP 7271122 A JP7271122 A JP 7271122A JP 27112295 A JP27112295 A JP 27112295A JP H09114929 A JPH09114929 A JP H09114929A
Authority
JP
Japan
Prior art keywords
character
learning
sub
pattern
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7271122A
Other languages
English (en)
Inventor
Kazuhiko Yamashita
和彦 山下
Norio Nakamura
典夫 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7271122A priority Critical patent/JPH09114929A/ja
Publication of JPH09114929A publication Critical patent/JPH09114929A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 サブパターン単位で認識を行なう手書き文字
認識装置において、当該サブパターンに対応する筆跡を
効果的かつ容易に学習させることができる文字認識装置
を提供する。 【解決手段】 学習筆跡入力部601に学習させたい筆
跡データを入力すると共に、学習文字指定部602に当
該筆跡に対応する文字を指定すると、文字構造情報検索
部603が認識辞書20を検索して当該指定文字のサブ
パターンによる構成を示す文字構造情報を読み出し、こ
の文字構造情報に基づいて筆跡分割部604において上
記筆跡データを分割する。部品学習判定部606は、当
該分割された文字データと同じ位置関係にあるサブパタ
ーンについてマッチング度を求め、このマッチング度が
所定の閾値より低いもののみ学習登録するように学習部
607に指示を送る。学習部607は、この指示に基づ
いて分割された筆跡データと該当するサブパターンを対
応付けて認識辞書に登録する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、手書きワープロや
光学式文字認識(OCR)などにおける手書き文字の認
識の方法および装置に関する。
【0002】
【従来の技術】文字認識は、与えられた文字の筆跡デー
タをコンピュータで扱える文字コードに変換する技術で
あり、ペンとタブレットを用いてリアルタイムな点列デ
ータとして筆跡データを獲得し文字コードに変換するオ
ンライン文字認識や、すでに筆記あるいは印刷された文
字をスキャナで読み込み文字コードに変換する光学式文
字認識(OCR)がある。
【0003】このような文字認識装置においては、例え
ば、図6に示すように、「語」という文字を最終的に
「言」、「五」、「口」の3つのサブパターンに分割し
て(このようにサブパターンによる文字の分割の態様
を、以下「分割構造」と称する)、この分割構造を認識
辞書に登録しておき、認識対象の文字データが入力され
ると、上記認識辞書を検索して該当する分割構造を呼び
出し、そのサブパターンごとに文字データと照合して認
識結果を出力する方法が用いられているものが多い。
【0004】上記文字認識装置の普及に対応して、サブ
パターンごとに個人特有の筆跡を認識辞書に学習登録さ
せることで、癖字や崩し字の筆跡データが入力されて
も、文字認識が可能な文字認識装置も開発されつつある
(例えば、特願平5−309334号)。図7は、この
ようなサブパターンの筆跡学習機能を有する従来の文字
認識装置の一例の構成図である。
【0005】当該文字認識装置100は、タブレットと
ペンなどから構成され、認識させたい筆跡データを入力
する筆跡データ入力部101と、認識候補文字がそのサ
ブパターンによる分割構造と共に登録されている認識辞
書102と、上記入力された筆跡データに基づき認識辞
書102を検索し、当該認識辞書102から該当する分
割構造を検索して、そのサブパターンごとに上記筆跡デ
ータと照合して認識候補文字を抽出し、この認識候補文
字のうち所定のものを認識結果として出力する文字認識
部103と、この認識結果を表示する認識結果表示部1
04と、当該認識結果に誤りがある場合に文字認識部1
03に訂正を指示する訂正指示部105と、上記認識辞
書102に所望の筆跡データを学習登録させる学習登録
部106とからなる。
【0006】当該学習登録部106は、さらに学習筆跡
入力部1061と、学習文字指定部1062と、学習部
1063と、学習指示部1064と、からなる。学習筆
跡入力部1061は、筆跡データ入力部101と同様に
タブレットとペンなどから構成されており、操作者が、
学習させたいサブパターンに対応する自己の筆跡デー
タ、例えば、上述の図6における「語」のサブパターン
である「口」の筆跡を入力する。
【0007】学習文字指定部1062は、当該学習筆跡
入力部1061から入力させた筆跡データに対応する文
字又はサブパターンをコードなどで入力して指定する。
学習指示部1064は、操作者の学習実行の指示を受け
付けて、学習部1063にその旨の指示を送り、学習部
1063は、上記筆跡データと「口」の文字コードを対
応させて、上記認識辞書102に登録させる。
【0008】次に、このように構成された文字認識装置
100の動作を説明する。今、操作者が、「語」に相当
する筆跡データを手書きで入力すると、文字認識部10
3は、当該筆跡データについて認識辞書102を検索す
る。上述のように認識辞書102には、筆跡データの入
力パターンに対応する認識候補文字が、その文字のサブ
パターンによる分割構造と共に登録されており、文字認
識部103は、当該サブパターンごとに筆跡データと照
合して、該当する認識候補文字を抽出する。
【0009】図6の分割構造の例でいえば、「語」とい
う字が、最終的に「言」、「五」、「口」に分解されて
認識されるので、上述のように操作者が予め「口」につ
いて学習登録部106により自己の筆跡データを認識辞
書102に学習させておけば、この学習登録の効果が
「語」の文字認識に役立つことになる(以下、このこと
を『「口」の学習効果が「語」に波及する。』と表現す
る。)。
【0010】もし、文字認識部103において複数の認
識候補文字が抽出された場合には、そのうち1番確実性
が高いもの、すなわち入力された筆跡データと認識辞書
に登録された入力パターンが一番近い認識候補文字が認
識結果として出力され、認識結果表示部104に表示さ
れる。操作者は、その認識結果を見て、期待した認識結
果と異なっておれば、訂正指示部105に訂正を指示し
て、文字認識無103における再認識を促す。
【0011】上述のように、入力された筆跡データをサ
ブパターン単位で照合して文字の認識を行う装置におい
ては、認識辞書に登録された分割構造におけるサブパタ
ーンについて筆跡を学習登録さえしておけば、文字認識
の確実性や処理速度を向上させることができる。
【0012】
【発明が解決しようとする課題】しかしながら、このよ
うなサブパターン単位で照合する文字認識装置において
は、文字を単にへんやつくりに分割してサブパターンと
するのみならず、さらに細分したサブパターンによる独
自の分割構造を形成して効果的な文字認識を行うように
するものが多く、しかも、それらの分割構造は、認識装
置ごとに異なるのが通常である。
【0013】図8は、認識装置ごとの分割構造の相違を
示す図である。本図において、例えば、文字認識装置A
特有の分割構造では、「辞」の文字は、「舌」と「辛」
のサブパターンに分割されているのみなので、「口」の
筆跡を学習登録させてもその学習効果は、「辞」には波
及しないのが分かる。一方、文字認識装置B特有の分割
構造では、サブパターンとして「口」まで分割されてい
るので、「口」の学習効果が「辞」まで波及するのが分
かり、「口」の筆跡を学習登録させる意義が大きい。
【0014】また、文字認識装置C特有の分割構造で
は、「章」の文字は、「音」と「十」に分割され、
「音」は、さらに「立」と「日」に分割されて構成され
ているため、「早」の筆跡を学習登録させてもその学習
効果は「章」には波及しない。一方、文字認識装置D特
有の分割構造では、「章」のサブパターンとして「早」
を構成要素として有するので、「早」の筆跡の学習効果
は「章」にも波及し、これを学習登録させる意義が大き
い。
【0015】このように装置ごとにサブパターンによる
分割構造が相違するため、同じサブパターンに対して新
たに筆跡を学習登録させても、その学習効果が波及する
文字が認識装置ごとに違ってくることは避けられない。
しかしながら、従来の文字認識装置においては、上述の
ような装置ごとに特有の分割構造については、操作者に
は一切知らされず、せいぜい特定のサブパターンに対す
る筆跡について学習登録したということしか示されない
ので、そのサブパターンがどのような文字に波及される
かは、学習させた筆跡で文字を書いて実際に文字認識さ
せてみるしかなかった。
【0016】このような問題を解決するため、各文字の
分割構造に関する一覧表を作成しておき、当該一覧表に
より学習登録させようとするサブパターンの学習効果が
目的の文字に波及するか否かを予め確認してから学習登
録させる方法が考えられるが、一覧表の多くの文字の中
から自分の登録したい文字もしくはサブパターンを探し
出すだけでも手間がかかり、学習登録の操作が煩雑にな
る。
【0017】また、学習させたいサブパターンが目的の
文字に波及することが分かったとしても、当該学習させ
たいサブパターンが複数ある場合には、それに対応する
筆跡を1回ずつ入力して登録させなければならず、これ
にも手間がかかる。本発明は、かかる課題に鑑みてなさ
れたものであり、目的の文字に波及するサブパターンの
学習登録が容易かつ効果的に行える文字認識装置を提供
することを目的とする。
【0018】
【課題を解決するための手段】上記目的を達成するため
本発明は、手書きの文字データを認識辞書に登録された
サブパターンごとに照合して文字を認識する方法であっ
て、認識辞書には、文字データの入力パターンに対応す
る認識候補文字が、その文字の構成要素となるサブパタ
ーンに関する情報と当該サブパターン同士の位置関係に
関する情報とからなる文字構造情報と共に登録されてお
り、操作者による筆跡データの入力および当該筆跡デー
タに対応する文字の指定を受け付けると、当該指定され
た文字について認識辞書を検索して当該文字に関する文
字構造情報を見つけ、この文字構造情報に基づいて上記
筆跡データを分割して分割筆跡データを作成する。上記
文字構造情報を参照して、この分割筆跡データと同じ位
置関係にあるサブパターンをそれぞれ対応付けて前記認
識辞書に登録する。
【0019】これにより、指定した文字に波及するサブ
パターンの学習登録が容易かつ効果的に行える文字認識
装置が得られる。
【0020】
【発明の実施の形態】請求項1の発明は、手書きの文字
データから文字を認識する方法であって、操作者による
文字データの入力を受け付ける文字データ受付ステップ
と、文字データの入力パターンに対応する認識候補文字
が、その文字の構成要素となるサブパターンに関する情
報と当該サブパターン同士の位置関係に関する情報とか
らなる文字構造情報と共に登録された認識辞書を、上記
入力された文字データについて検索し、サブパターン単
位で照合して所定の認識候補文字を認識結果として出力
する文字検索ステップと、上記認識結果を表示する認識
結果表示ステップと、特定の筆跡を上記認識辞書に学習
登録させる学習登録ステップとを含み、前記学習登録ス
テップは、前記認識辞書に学習登録させたい筆跡データ
の入力を受け付ける学習筆跡受付小ステップと、上記筆
跡データに対応する文字の指定を受け付ける学習文字受
付小ステップと、前記認識辞書から前記指定された文字
に関する文字構造情報を検索する文字構造情報検索小ス
テップと、前記検索された文字構造情報に基づいて上記
筆跡データを分割して分割筆跡データを作成する筆跡分
割小ステップと、上記文字構造情報を参照し、上記分割
筆跡データと同じ位置関係にあるサブパターンをそれぞ
れ対応付けて前記認識辞書に登録する学習登録小ステッ
プとを有しており、手書きの文字データを認識辞書に登
録されたサブパターンごとに照合して文字を認識する方
法において、認識辞書には、文字データの入力パターン
に対応する認識候補文字が、その文字の構成要素となる
サブパターンに関する情報と当該サブパターン同士の位
置関係に関する情報とからなる文字構造情報と共に登録
されており、学習筆跡受付ステップにおいて筆跡データ
の入力を受け付けると共に、学習文字受付小ステップに
おいて当該筆跡データに対応する文字の指定を受け付
け、文字構造情報検索ステップにおいて、当該指定され
た文字について認識辞書を検索して当該文字に関する文
字構造情報を見つけ、筆跡分割小ステップにおいて、上
記文字構造情報に基づいて上記筆跡データを分割して分
割筆跡データを作成し、学習登録小ステップにおいてこ
の分割筆跡データと同じ位置関係にあるサブパターンを
それぞれ対応付けて前記認識辞書に登録するという作用
を有する。
【0021】請求項2の発明は、請求項1における学習
登録ステップが、上記対応する分割筆跡データとサブパ
ターンの組を表示する部品対応関係表示小ステップと、
学習登録する分割筆跡データとサブパターンの組の指定
を受け付ける学習指定受付小ステップと、を含み、前記
学習登録小ステップは、上記指定された分割筆跡データ
とサブパターンの組についてのみ学習登録するようにし
ており、部品対応関係表示小ステップにおいて表示され
た分割筆跡データとこれに対応するサブパターンの組を
操作者が確認し、学習登録が必要であると判断した組の
指定を学習指定受付小ステップにおいて受け付け、この
指示に基づいて学習登録小ステップにおいて学習登録す
るという作用を有する。
【0022】請求項3の発明は、請求項1における学習
登録ステップが、上記対応する分割筆跡データとサブパ
ターンの組ごとに、認識の確実度を求める確実度算定小
ステップと、当該確実度と所定の閾値を比較する比較小
ステップと、当該確実度が上記閾値以下の分割筆跡デー
タとサブパターンの組について学習登録するように指示
を発する学習登録指示小ステップとを含み、前記学習登
録小ステップは、上記指示を受けた分割筆跡データとサ
ブパターンの組についてのみ学習登録するようにしてお
り、確実度算定小ステップにおいて分割筆跡データとサ
ブパターンの組ごとに認識の確実度求め、比較小ステッ
プにおいて当該確実度と所定の閾値を比較して、学習登
録指示小ステップにおいて当該確実度が上記閾値以下の
分割筆跡データとサブパターンの組について学習登録す
るように指示を発し、当該指示を受けた組についてのみ
学習登録するという作用を有する。
【0023】請求項4の発明は、手書きの文字データか
ら文字を認識する装置であって、操作者が文字データを
入力する文字データ入力手段と、文字データの入力パタ
ーンに対応する認識候補文字が、その文字の構成要素と
なるサブパターンに関する情報と当該サブパターン同士
の位置関係に関する情報とからなる文字構造情報と共に
登録された認識辞書と、上記入力された文字データにつ
いて前記認識辞書を検索し、上記サブパターン単位で照
合して所定の認識候補文字を認識結果として出力する文
字検索手段と、上記認識結果を表示する認識結果表示手
段と、特定の筆跡を上記認識辞書に学習登録させる学習
登録手段とを備え、前記学習登録手段は、前記認識辞書
に学習登録させたい筆跡データを入力する学習筆跡入力
部と、上記筆跡データに対応する文字を指定する学習文
字指定部と、前記認識辞書から前記指定された文字に関
する文字構造情報を検索する文字構造情報検索部と、上
記検索された文字構造情報に基づいて、上記筆跡データ
を各構成要素に分割して分割筆跡データを作成する筆跡
分割部と、上記文字構造情報を参照し、当該分割筆跡デ
ータと同じ位置関係にあるサブパターンを対応付けて前
記認識辞書に登録する学習部とを有するものであり、手
書きの文字データを認識辞書に登録されたサブパターン
ごとに照合して文字を認識する装置において、認識辞書
には、文字データの入力パターンに対応する認識候補文
字が、その文字の構成要素となるサブパターンに関する
情報と当該サブパターン同士の位置関係に関する情報と
からなる文字構造情報と共に登録されており、操作者が
学習筆跡入力手段から筆跡データを入力すると共に、学
習文字指定手段から当該筆跡データに対応する文字を指
定すると、文字構造情報検索手段は、当該指定された文
字について認識辞書を検索して当該文字に関する文字構
造情報を見つけ、筆跡分割手段において、上記文字構造
情報に基づいて上記筆跡データを分割して分割筆跡デー
タを作成し、学習部においてこの分割筆跡データと同じ
位置関係にあるサブパターンをそれぞれ対応付けて前記
認識辞書に登録するという作用を有する。
【0024】請求項5の発明は、請求項4における学習
登録手段が、上記対応する分割筆跡データとサブパター
ンの組を表示する部品対応関係表示部と、操作者が学習
登録させる分割筆跡データとサブパターンの組を指定す
る部品学習指定部とを備え、前記学習部は、上記指定さ
れた分割筆跡データとサブパターンの組についてのみ学
習登録するようにしており、部品対応関係表示部におい
て表示された分割筆跡データとこれに対応するサブパタ
ーンの組を操作者が確認し、学習登録が必要であると判
断した組について学習指定入力部から指示し、この指示
に基づいて学習部において学習登録するという作用を有
する。
【0025】請求項6の発明は、請求項4における学習
登録手段が、上記対応する分割筆跡データとサブパター
ンの組ごとに、認識の確実度を求める確実度算定部と、
当該確実度と所定の閾値を比較する比較部と、当該確実
度が上記閾値以下の分割筆跡データとサブパターンの組
について学習登録するように指示を発する学習指示発生
部と、を備え、前記学習部は、上記指示を受けた分割筆
跡データとサブパターンの組についてのみ学習登録する
ようにしており、確実度算定部において分割筆跡データ
とサブパターンの組ごとに認識の確実度求め、比較部に
おいて当該確実度と所定の閾値を比較して、学習登録指
示部において当該確実度が上記閾値以下の分割筆跡デー
タとサブパターンの組について学習登録するように指示
を発し、当該指示を受けた組についてのみ学習登録する
という作用を有する。
【0026】以下、本発明の実施の形態について説明す
る。図1は、本発明に係る文字認識装置の実施の形態を
示す構成図である。本図に示すように、この文字認識装
置1は、筆跡データ入力部10と、認識辞書20と、文
字認識部30と、認識結果表示部40と、訂正指示部5
0と、学習登録部60とからなる。
【0027】筆跡データ入力部10は、タブレットとペ
ンを有し、操作者が認識させたい筆跡データを入力す
る。認識辞書20は、大容量のメモリに、筆跡データの
入力パターンに対応する認識候補文字の情報がそのサブ
パターンによる文字構造情報(後述)と共に登録されて
いるものである。
【0028】文字認識部30は、CPUを主体としてお
り、上記入力された筆跡データについて上記認識辞書2
0を検索し、サブパターンごとに当該筆跡データと照合
していくつかの認識候補文字を抽出し、この認識候補文
字のうち一番確実性の高いものを認識結果として出力す
る。認識結果表示部40は、液晶やCRTなどにより、
上記認識結果を表示する。
【0029】訂正指示部50は、上記認識結果に誤りが
ある場合に、操作者からの訂正の指示を受け付け、文字
認識部30に当該誤認識文字について再認識を行うよう
に指示する。学習登録部60は、上記認識辞書20に所
望の筆跡データを学習登録させるユニットであって、学
習させたい筆跡データを入力する学習筆跡入力部601
と、当該筆跡データに対応する文字のコードを指定する
学習文字指定部602と、認識辞書20において各認識
候補文字について登録された文字構造情報を検索する文
字構造情報検索部603と、この検索された文字構造情
報に基づき、学習筆跡入力部601に入力された筆跡デ
ータを分割して分割筆跡データを作成する筆跡分割部6
04と、当該文字構造情報に基づき、上記分割筆跡デー
タと同じ位置関係にあるサブパターンを対応させて記憶
する部品対応関係記憶部605と、この対応関係を表示
する部品対応関係表示部608と、部品対応関係記憶部
605に記憶された対応する分割筆跡データとサブパタ
ーンの各組について学習登録させるべきか否かを判断す
る部品学習判定部606と、この部品学習判定部606
からの学習指示に基づき、当該分割筆跡データとサブパ
ターンを対応付けて認識辞書20に登録させる学習部6
07とからなる。
【0030】なお、入力された筆跡データを除き、文字
はすべてコードで処理されるため、認識結果表示部40
や部品対応関係表示部608などにはフォント記憶部
(図示せず)が設けられ、入力されたコードに対応した
フォントを読み出して表示するようになっている。上述
のように認識辞書20には、入力された筆跡データに対
応する認識候補文字のデータのほか、当該認識候補文字
に関する文字構造情報が保存されている。この文字構造
情報は、文字の構成要素であって文字認識の際の認識の
単位となるサブパターンに関する情報(以下、「サブパ
ターン情報」と称する。)と、当該サブパターン同士の
位置関係に関する情報(以下、「分割位置情報」と称す
る。)とからなる。
【0031】図2は、「松」の文字を例にして、そのサ
ブパターンごとに筆跡を学習登録させる際の処理の流れ
を示す模式図であり、この図に基づいて学習登録部60
の動作を説明する。まず、操作者は、学習させたい文字
の筆跡データを手書きで学習筆跡入力部601に入力す
る(図2のD1)と共に、当該筆跡データに対応する文
字のコードを学習文字指定部602に入力する(図2の
D2、実際は、文字コードで指定されるが、説明の便宜
上そのフォントで示す。)。この文字コードの入力は、
学習文字指定部602に設けられたキーボード(図示せ
ず)に当該文字コードを直接入力する方法の他、さら
に、かな漢字変換機能を持たせてワープロ入力のように
「かな」で入力し、漢字の場合にはさらに漢字変換させ
て、その対応するコードを文字構造情報検索部603に
送るようにすればよい。
【0032】文字コードが入力されると、文字構造情報
検索部603は、認識辞書20内を検索して、当該コー
ドで指定された文字のサブパターンによる文字構造情報
を調べる。上述のように、当該文字構造情報には、
「松」という文字が、「木」と「八」と「ム」の3つの
サブパターンから構成されるというサブパターン情報
と、それらのサブパターンによって、「松」の文字が左
半分(「木」)と右半分(「公」)に分割され、右半分
(「公」)がさらに上半分(「八」)と下半分
(「ム」)に分割されるという分割位置情報とが含まれ
ており、これにより「松」が、D3に示すようにサブパ
ターンD31、D32、D33に部品化される。
【0033】分割位置情報は、筆跡分割部604にも送
られる。筆跡分割部604は、当該分割位置情報に基づ
き筆跡データD1を、同図のD4に示すように分割し、
細分された筆跡データD41,D42,D43(以下、
「分割筆跡データ」と称する。)を得る。この分割筆跡
データD41,D42,D43は、具体的には、例え
ば、学習筆跡入力部601のタブレットから点列として
入力された筆跡データを当該タブレットの入力面に対応
したフレームメモリ等に記憶させ、上記分割位置情報に
基づいて、当該フレームメモリのデータを記憶位置ごと
に分離して読み出すことにより得られる。
【0034】このように作成された分割筆跡データと上
記サブパターン情報は、それぞれ部品対応関係記憶部6
05に送られる。部品対応関係記憶部605は、上記分
割位置情報に基づいて同じ位置関係にある分割筆跡デー
タとサブパターンを対応付けて記憶すると共に、部品対
応関係表示部608に図2のD5に示すように表示させ
る。
【0035】一方、この分割筆跡データとサブパターン
の対応関係に関する情報は、部品学習判定部606に送
られる。部品学習判定部606は、例えば、図3に示す
ようにマッチング度算定部6061と、比較部6062
と、学習指示発生部6063とからなっており、部品対
応関係記憶部605から、対応する分割筆跡データとサ
ブパターンの組を1組ずつ読み出して、まず、マッチン
グ度算定部6061においてそれらについてのマッチン
グ度を計算する。
【0036】このマッチング度は、いわば、当該分割筆
跡データに対するサブパターンの認識の確実性の度合い
を示すものであって、その算定方法は上記対応するサブ
パターンと分割筆跡データの入力パターンとを比較して
得られる公知の技術であり、例えば、画数や1画のスト
ロークの長さまたは曲部の数などの特徴を考慮して求め
られる。
【0037】そして、比較部6062において、上記マ
ッチング度と予め設定された閾値(例えば、完全に一致
した場合を100点として、その40点)とを比較し、
学習指示発生部6063は、その比較された結果、閾値
以下のもの、すなわち当該分割筆跡データを学習登録さ
せないと正しく認識されないと判断されるものについて
のみ学習部607に学習登録の指示を送る。
【0038】図4は、上記マッチング度算定部6061
で求められたマッチング度の例を示すものであり、括弧
内の数値が、それぞれの対応関係におけるマッチング度
を示す。この例によれば、「木」と「ム」のそれぞれの
対応関係については、閾値の40点に及ばず、これによ
り当該分割筆跡データに関して学習登録が必要であるこ
とが分かる。
【0039】学習部607は、この学習登録の指示を受
けたサブパターン(「木」と「ム」)とこれに該当する
分割筆跡データを対応付けて認識辞書20に学習登録さ
せる。この際、どの分割筆跡データが登録されたかを部
品対応関係表示部608において表示させるようにすれ
ば、便利である。
【0040】なお、学習指定された文字が、例えば
「木」などのようにそれ以上分割されない文字であって
も、「木」そのものをサブパターンとみなして、上述と
同じ学習登録の動作がなされる。このように、筆跡を学
習登録すべきサブパターンの選択を、マッチング度を求
めて自動的に行うことにより、正しく認識されるサブパ
ターンまで学習してしまうことなく、必要最小限の効率
的な学習を行なうことができる。
【0041】なお、この学習登録の際に、すでに登録済
みのサブパターンがあれば、その旨を上記部品対応関係
表示部608などに表示させて再登録の要非を操作者に
確認し、操作者が必要と判断した場合に学習部607に
直接学習登録を指示するようにしてもよい。次に、図5
のフローチャートに基づき、文字認識装置1全体の動作
を、本願発明の特徴部分である上記学習登録部60を中
心に説明する。
【0042】なお、実際の文字認識装置の操作において
は、予め筆跡データを学習登録させることは稀であり、
まず、操作者が認識させたい筆跡データを入力して文字
認識を実行させ、当該筆跡データによる文字認識が不可
能である場合に、当該筆跡データもしくはそのサブパタ
ーンの筆跡データについて学習登録させる場合が多いと
思われるので、以下このような操作手順を前提にして動
作説明を行う。
【0043】まず、操作者が筆跡データ入力部10から
文字認識させたい複数の筆跡データを手書きで入力する
(ステップS1)。文字認識部30は、当該筆跡データ
について1文字ずつ認識辞書を参照し、登録された文字
構造情報におけるサブパターンごとに筆跡データを照合
しながら認識候補文字を検索し、その認識候補文字のう
ち一番確実性の高い文字を認識結果として認識結果表示
部40に表示させる。この際、操作者が期待した通りの
認識結果が出なければ、訂正指示部50から訂正したい
文字の指定を行い、この指定に基づき文字認識部30で
再認識を行う。期待した認識結果がでれば、次の筆跡デ
ータの入力に移る(ステップS2、S1)。
【0044】なお、これらの入力方式やサブパターンご
との認識アルゴリズム等については、OCRおよびオン
ライン文字認識に関する文献にその詳細が開示されてい
るので、ここでの詳細な説明は省略する。ステップS2
のおいて、入力された筆跡データが、ひどい癖字や崩し
字などの理由により、何度訂正指示を行っても正しい文
字認識できない場合があり、この場合には、当該筆跡を
認識辞書20に登録させる必要がある。
【0045】そこで操作者は、当該筆跡データを学習筆
跡入力部601から入力する(ステップS3)。この筆
跡データの入力は、通常、学習筆跡入力部601に設け
られたタブレットにペンで手書きすることにより行われ
るが、筆跡データ入力部10の入力画面を上記学習筆跡
入力部601の入力画面と兼用させることにより、もっ
と容易に入力することができる。
【0046】例えば、筆跡データ入力部10に表示手段
を設けると共に当該表示手段の表示画面の前面にタブレ
ット等の透明な入力面を形成して、その入力面に入力し
た筆跡データ通りの筆跡が上記表示画面に表示されるよ
うにし、この入力面を上記学習筆跡入力部601の入力
面に兼用させる。そして、筆跡データ入力部10の表示
画面に文字認識のため既に入力済みの筆跡データを表示
させておき、認識不能の筆跡データがあれば、上記入力
面にペンなどで当該筆跡データを指定することにより、
学習筆跡データの入力を行うようにすればよい。このよ
うにすれば、改めて学習させたい文字を手書きで入力す
る必要がなく大変便利である。
【0047】次に、操作者は、当該筆跡データに対応す
る文字のコードを学習筆跡入力部601から指定する
(ステップS4)。この文字コードの指定は、上述のよ
うに図示しないキーボードから文字コードを入力する方
法、ワープロ等の入力のようにかな漢字変換を用いた入
力方法などが用いられる。
【0048】文字構造情報検索部603は、当該指定さ
れた文字について認識辞書20を検索し、当該指定文字
に関する文字構造情報を取得する(ステップS5)。筆
跡分割部604は、この文字構造情報のうちの分割位置
情報に基づいて、上記学習筆跡入力部601に入力され
た筆跡データを分割し、その結果を部品対応関係記憶部
605に送る。部品対応関係記憶部605では、上記分
割筆跡データと上記サブパターンを同じ位置関係のもの
同士対応付けて記憶すると共にその対応関係を部品対応
関係表示部608に表示させる(ステップS7)。
【0049】部品学習判定部606は、部品対応関係記
憶部605から対応するサブパターンと分割筆跡データ
の組を1組ずつ読み出して、まず、マッチング度算定部
6061(図3)において、それらについて100点を
最高とするマッチング度を算定する(ステップS8)。
そして、比較部6062において、当該算定されたマッ
チング度と予め設定された閾値(図4の例では40点)
とを比較し、学習指示発生部6063は、当該マッチン
グ度が閾値以下の場合のみ学習登録の指示を発生し、学
習部607は、この指示を受けて読み出された分割筆跡
データと該当するサブパターンを対応付けて認識辞書2
0に登録させる(ステップS10)。
【0050】しかし、当該マッチング度が閾値を超える
場合には、当該分割筆跡データを登録させなくても正し
い認識ができると判断されるので、学習登録せずにステ
ップS11に移り、他の対応する分割筆跡データとサブ
パターンの組があるか否かを判断し、あればステップS
8に戻って、以下ステップS10までの動作を繰り返す
と共に、ステップS11において、もう対応する分割筆
跡データとサブパターンの組が残っていないと判断され
れば、当該文字についての学習登録の処理を終了する。
【0051】このように、学習指定された文字に対し
て、そのサブパターンによる文字構造情報が検索され、
これにより入力した筆跡データを分割し、この分割され
た筆跡データとサブパターンをその位置関係に基づいて
対応させ、それらのマッチング度に基づいて自動的にサ
ブパターン単位で必要な学習登録するので、学習登録の
操作を大変容易にすることができる。
【0052】そして、当該筆跡登録されたサブパターン
の学習効果は、少なくとも上記学習指定された文字に波
及することは明らかなので、従来のように学習登録した
いサブパターンが、目的の文字に波及するか否かを一覧
表で調べたりする必要もなく、直接目的の文字を学習文
字指定部602から入力して、当該文字に対応する筆跡
データを学習筆跡入力部601から入力するだけで必要
なサブパターンの筆跡登録がなされる。
【0053】以上、本発明を実施の形態に基づいて説明
したが、本発明は、上述の実施の形態に限定されないの
は勿論である。例えば、部品学習判定部606とは別
に、操作者がマニュアルで学習登録すべき分割筆跡デー
タとサブパターンの組を指定することができる学習指示
部を設け、セレクターにより自動学習指示モードとマニ
ュアル学習指定モードに切り替えるようにしてもよい
し、場合によっては、部品学習判定部606に変えて、
マニュアルの学習指示部のみ設けてもよい。
【0054】この際、操作者の学習指示の判断の資料と
するため、上述の各分割筆跡データとサブパターンの組
ごとに求められたマッチング度を部品対応関係表示部6
08に表示させるようにしてもよい。また、上記部品対
応関係表示部608に表示されたサブパターンを指定す
ることにより、当該サブパターンを構成要素とする文字
(すなわち、当該サブパターンについて学習登録した場
合に波及する文字)のリストもしくはその文字数を当該
部品対応関係表示部608などに表示させるようにして
もよい。この場合、その波及する数が多いほど、操作者
は当該サブパターンの学習登録の意義を認識し、マッチ
ング度が閾値を多少超えていても敢えて学習登録させる
こともできる。
【0055】さらには、部品学習判定部606などによ
って学習登録の対象を選択せずに、部品対応関係表示部
608に記憶された分割筆跡データとサブパターンの組
の全てについて自動的に学習登録させるようにしてもよ
い。この場合には、無駄なサブパターンの学習登録が多
くなされるおそれもがあるが、装置構成が簡易になると
言う利点がある。
【0056】
【発明の効果】以上説明してきたように請求項1の発明
によれば、手書きの文字データを認識辞書に登録された
サブパターンごとに照合して文字を認識する方法であっ
て、上記認識辞書には、文字データの入力パターンに対
応する認識候補文字が、その文字のサブパターンによる
構成を示す文字構造情報と共に登録されており、操作者
が所定の筆跡を上記認識辞書に学習登録させる際に、当
該筆跡データを入力すると共にこの筆跡データに対応す
る文字を指定すると、当該指定された文字について認識
辞書を検索して当該文字に関する文字構造情報を見つ
け、この文字構造情報に基づいて上記筆跡データを分割
して分割筆跡データを作成し、この分割筆跡データと同
じ位置関係にあるサブパターンをそれぞれ対応付けて前
記認識辞書に登録するので、学習登録時にサブパターン
単位で筆跡データを入力しなくても、波及の対象となる
文字全体の筆跡データを入力さえすれば、当該文字に波
及するサブパターンについての筆跡の学習登録が容易か
つ効果的に行うことができる。
【0057】請求項2の発明によれば、部品対応関係表
示小ステップにおいて表示された分割筆跡データとこれ
に対応するサブパターンの組を確認でき、学習登録が必
要と判断される組についてのみ操作者が指定することが
できるので、無駄なサブパターンの学習登録を避けるこ
とができる。請求項3の発明によれば、確実度算定小ス
テップにおいて分割筆跡データとサブパターンの組ごと
に認識の確実度求め、学習登録指示小ステップにおいて
当該確実度が上記閾値以下の分割筆跡データとサブパタ
ーンの組についてのみ学習登録するように指示を発する
ので、筆跡の学習登録が必要なサブパターンを自動的に
判断して学習登録させることができる。
【0058】請求項4の発明によれば、請求項1の文字
認識方法を実施する装置を提供でき、同請求項と同様の
効果を有する。請求項5の発明によれば、請求項2の文
字認識方法を実施する装置を提供でき、同請求項と同様
の効果を有する。請求項6の発明によれば、請求項3の
文字認識方法を実施する装置を提供でき、同請求項と同
様の効果を有する。
【図面の簡単な説明】
【図1】本発明に係る文字認識装置の実施の形態を示す
構成図である。
【図2】上記実施の形態における学習登録の処理の流れ
を説明するための図である。
【図3】上記実施の形態における部品学習判定部の構成
図である。
【図4】分割された筆跡データとこれに対応するサブパ
ターンの各組について、上記部品学習判定部において算
定されたマッチング度の例を示す図である。
【図5】上記実施の形態における動作を示すフローチャ
ートである。
【図6】文字のサブパターンによる分割構造を示す模式
図である。
【図7】学習登録機能を有する従来の文字認識装置の構
成図である。
【図8】文字認識装置ごとに設定されている、文字のサ
ブパターンによる分割構造の例を示した図である。
【符号の説明】
1 文字認識装置 10 筆跡データ入力部 20 認識辞書 30 文字認識部 40 認識結果表示部 50 訂正指示部 60 学習登録部 601 学習筆跡入力部 602 学習文字指定部 603 文字構造情報検索部 604 筆跡分割部 605 部品対応関係記憶部 606 部品学習判定部 607 学習部 608 部品対応関係表示部 6061 マッチング度算定部 6062 比較部 6063 学習指示発生部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 手書きの文字データから文字を認識する
    方法であって、 操作者による文字データの入力を受け付ける文字データ
    受付ステップと、 文字データの入力パターンに対応する認識候補文字が、
    その文字の構成要素となるサブパターンに関する情報と
    当該サブパターン同士の位置関係に関する情報とからな
    る文字構造情報と共に登録された認識辞書を、上記入力
    された文字データについて検索し、サブパターン単位で
    照合して所定の認識候補文字を認識結果として出力する
    文字検索ステップと、 上記認識結果を表示する認識結果表示ステップと、 特定の筆跡を上記認識辞書に学習登録させる学習登録ス
    テップと、を含み、 前記学習登録ステップは、 前記認識辞書に学習登録させたい筆跡データの入力を受
    け付ける学習筆跡受付小ステップと、 上記筆跡データに対応する文字の指定を受け付ける学習
    文字受付小ステップと、 前記認識辞書から前記指定された文字に関する文字構造
    情報を検索する文字構造情報検索小ステップと、 上記検索された文字構造情報に基づいて上記筆跡データ
    を分割して分割筆跡データを作成する筆跡分割小ステッ
    プと、 上記文字構造情報を参照し、上記分割筆跡データと同じ
    位置関係にあるサブパターンを対応付けて前記認識辞書
    に登録する学習登録小ステップと、を有することを特徴
    とする文字認識方法。
  2. 【請求項2】 前記学習登録ステップは、 上記対応する分割筆跡データとサブパターンの組を表示
    する部品対応関係表示小ステップと、 学習登録する分割筆跡データとサブパターンの組の指定
    を受け付ける学習指定受付小ステップと、を含み、 前記学習登録小ステップは、上記指定された分割筆跡デ
    ータとサブパターンの組についてのみ学習登録すること
    を特徴とする請求項1記載の文字認識方法。
  3. 【請求項3】 前記学習登録ステップは、 上記対応する分割筆跡データとサブパターンの組ごと
    に、認識の確実度を求める確実度算定小ステップと、 当該確実度と所定の閾値を比較する比較小ステップと、 当該確実度が上記閾値以下の分割筆跡データとサブパタ
    ーンの組について学習登録するように指示を発する学習
    登録指示小ステップと、を含み、 前記学習登録小ステップは、上記指示を受けた分割筆跡
    データとサブパターンの組についてのみ学習登録するこ
    とを特徴とする請求項1記載の文字認識方法。
  4. 【請求項4】 手書きの文字データから文字を認識する
    装置であって、 操作者が文字データを入力する文字データ入力手段と、 文字データの入力パターンに対応する認識候補文字が、
    その文字の構成要素となるサブパターンに関する情報と
    当該サブパターン同士の位置関係に関する情報とからな
    る文字構造情報と共に登録された認識辞書と、 上記入力された文字データについて前記認識辞書を検索
    し、上記サブパターン単位で照合して所定の認識候補文
    字を認識結果として出力する文字検索手段と、 上記認識結果を表示する認識結果表示手段と、 特定の筆跡を上記認識辞書に学習登録させる学習登録手
    段と、を備え、 前記学習登録手段は、 前記認識辞書に学習登録させたい筆跡データを入力する
    学習筆跡入力部と、 上記筆跡データに対応する文字を指定する学習文字指定
    部と、 前記認識辞書から前記指定された文字に関する文字構造
    情報を検索する文字構造情報検索部と、 上記検索された文字構造情報に基づいて上記筆跡データ
    を各構成要素に分割して分割筆跡データを作成する筆跡
    分割部と、 上記文字構造情報を参照し、当該分割筆跡データと同じ
    位置関係にあるサブパターンを対応付けて前記認識辞書
    に登録する学習部と、を有することを特徴とする文字認
    識装置。
  5. 【請求項5】 前記学習登録手段は、 上記対応する分割筆跡データとサブパターンの組を表示
    する部品対応関係表示部と、 操作者が、学習登録させる分割筆跡データとサブパター
    ンの組を指定する部品学習指定部と、を備え、 前記学習部は、上記指定された分割筆跡データとサブパ
    ターンの組についてのみ学習登録することを特徴とする
    請求項4記載の文字認識装置。
  6. 【請求項6】 前記学習登録手段は、 上記対応する分割筆跡データとサブパターンの組ごと
    に、認識の確実度を求める確実度算定部と、 当該確実度と所定の閾値を比較する比較部と、 当該確実度が上記閾値以下の分割筆跡データとサブパタ
    ーンの組について学習登録するように指示を発する学習
    指示発生部と、を備え、 前記学習部は、上記指示を受けた分割筆跡データとサブ
    パターンの組についてのみ学習登録することを特徴とす
    る請求項4記載の文字認識装置。
JP7271122A 1995-10-19 1995-10-19 文字認識方法および装置 Pending JPH09114929A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7271122A JPH09114929A (ja) 1995-10-19 1995-10-19 文字認識方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7271122A JPH09114929A (ja) 1995-10-19 1995-10-19 文字認識方法および装置

Publications (1)

Publication Number Publication Date
JPH09114929A true JPH09114929A (ja) 1997-05-02

Family

ID=17495643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7271122A Pending JPH09114929A (ja) 1995-10-19 1995-10-19 文字認識方法および装置

Country Status (1)

Country Link
JP (1) JPH09114929A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079503A (zh) * 2019-08-02 2020-04-28 广东小天才科技有限公司 一种文字识别方法及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079503A (zh) * 2019-08-02 2020-04-28 广东小天才科技有限公司 一种文字识别方法及电子设备
CN111079503B (zh) * 2019-08-02 2023-08-25 广东小天才科技有限公司 一种文字识别方法及电子设备

Similar Documents

Publication Publication Date Title
JPH07509576A (ja) 文字の認識方法
JPH10240958A (ja) 画像から管理情報を抽出する管理情報抽出装置および方法
JPH09114929A (ja) 文字認識方法および装置
JP3812719B2 (ja) 文書検索装置
JP3274014B2 (ja) 文字認識装置および文字認識方法
JP3484446B2 (ja) 光学文字認識装置
JP3782467B2 (ja) 文字入力方法及び装置
JPS6228889A (ja) 情報認識装置
JPH1055409A (ja) 手書き入力情報処理装置
JP2922365B2 (ja) Ocr処理システムにおける漢字住所データ処理方法
JP2002259912A (ja) オンライン文字列認識装置及びオンライン文字列認識方法
JPS59229683A (ja) 認識処理装置
JP2917748B2 (ja) 文字入力装置
JP2731394B2 (ja) 文字入力装置
JP3481850B2 (ja) 文字認識装置
JP2874815B2 (ja) 日本語文字読取装置
JPH11120294A (ja) 文字認識装置および媒体
JPH04138583A (ja) 文字認識装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH05120471A (ja) 文字認識装置
JPH09231310A (ja) 情報処理装置
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JP2953162B2 (ja) 文字認識装置
JPH09237322A (ja) 認識装置の候補修正方式
JPH03218567A (ja) 電子辞書