JPH07107698B2 - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JPH07107698B2 JPH07107698B2 JP60132011A JP13201185A JPH07107698B2 JP H07107698 B2 JPH07107698 B2 JP H07107698B2 JP 60132011 A JP60132011 A JP 60132011A JP 13201185 A JP13201185 A JP 13201185A JP H07107698 B2 JPH07107698 B2 JP H07107698B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- partial
- character
- input
- stroke
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 [産業上の利用分野] 本発明は情報認識装置に関し、特に手書文字、記号、図
形等の筆跡情報をもとにして文字、記号、図形等を認識
する情報認識装置に関する。
形等の筆跡情報をもとにして文字、記号、図形等を認識
する情報認識装置に関する。
[開示の概要] 本明細書及び図面は、特に手書文字、記号、図形等の筆
跡情報をもとにして文字、記号、図形等を認識する情報
認識装置において、部分パターンについての特徴情報を
記憶している部分記憶手段と、筆跡入力パターンの部分
パターンと前記部分記憶手段の特徴情報との類否判断を
行う第1の認識手段と、全パターンについての特徴情報
を記憶している辞書手段と、前記筆跡入力パターンと前
記辞書手段の特徴情報との類否判断を行う第2の識別手
段を備え、前記第1の識別手段の識別結果を参照して前
記第2の識別手段の類否判断を行うことにより、認識の
ための参照情報量及び認識のための処理負担が大幅に軽
減される情報認識装置の技術を開示するものである。
跡情報をもとにして文字、記号、図形等を認識する情報
認識装置において、部分パターンについての特徴情報を
記憶している部分記憶手段と、筆跡入力パターンの部分
パターンと前記部分記憶手段の特徴情報との類否判断を
行う第1の認識手段と、全パターンについての特徴情報
を記憶している辞書手段と、前記筆跡入力パターンと前
記辞書手段の特徴情報との類否判断を行う第2の識別手
段を備え、前記第1の識別手段の識別結果を参照して前
記第2の識別手段の類否判断を行うことにより、認識の
ための参照情報量及び認識のための処理負担が大幅に軽
減される情報認識装置の技術を開示するものである。
[従来の技術] データタブレツト等の入力装置からペンの座標とペンの
アツプ・ダウン情報とを入力し、データタブレツト上に
筆記された文字を認識するいわゆるオンライン文字認識
においては、入力された文字について種々の認識方法が
提案されている。この中でも実用化という点から有望と
思われるものには次のようなものがある。
アツプ・ダウン情報とを入力し、データタブレツト上に
筆記された文字を認識するいわゆるオンライン文字認識
においては、入力された文字について種々の認識方法が
提案されている。この中でも実用化という点から有望と
思われるものには次のようなものがある。
(a)各入力ストロークの形状と予め登録されている基
本ストロークの形状とを比較および分類して入力文字パ
ターンを基本ストローク列に変換した後、辞書の文字パ
ターンと比較して識別する。
本ストロークの形状とを比較および分類して入力文字パ
ターンを基本ストローク列に変換した後、辞書の文字パ
ターンと比較して識別する。
(b)各入力ストロークを数点の特徴点で近似し、辞書
の文字パターンと比較して識別する。
の文字パターンと比較して識別する。
(c)入力ストローク列と漢字の部分パターンとを比較
し、入力文字パターンを部分パターン列に変換した後、
辞書の文字パターンと比較して識別する。
し、入力文字パターンを部分パターン列に変換した後、
辞書の文字パターンと比較して識別する。
(d)連続するストロークの始点と終点とを直線で結
び、入力文字パターンを一続きのベクトル列とした後、
辞書の文字パターンとDPマツチングにより識別する。
び、入力文字パターンを一続きのベクトル列とした後、
辞書の文字パターンとDPマツチングにより識別する。
しかし上記(a)〜(c)の方法は楷書で丁寧に書かれ
た文字に対しては認識率が高いが、つづけ字に対しては
極端に認識率が悪いという欠点がある。また、上記
(a)および(b)で示した方法では入力文字パターン
のストロークと辞書の文字パターンのストロークを1対
1対応させて比較するため、入力文字パターンに対し、
対応する文字パターンが辞書に登録されていない場合は
認識されなかつたり、また、誤認識される。この場合、
つづけ字のパターンをすべて辞書に登録することでつづ
け字を認識させることも考えられるが、実用的でない。
た文字に対しては認識率が高いが、つづけ字に対しては
極端に認識率が悪いという欠点がある。また、上記
(a)および(b)で示した方法では入力文字パターン
のストロークと辞書の文字パターンのストロークを1対
1対応させて比較するため、入力文字パターンに対し、
対応する文字パターンが辞書に登録されていない場合は
認識されなかつたり、また、誤認識される。この場合、
つづけ字のパターンをすべて辞書に登録することでつづ
け字を認識させることも考えられるが、実用的でない。
第2図(a)及び(b)は「絵」という字を多くの人に
楷書で書かせた時の「糸へん」と「会」の出現パターン
の例である。この例では8通りの「糸へん」と4通りの
「会」があるので8×4=32通りの「絵」のパターンが
考えられる。このようにつづけ字のパターンが非常に多
いのでこれらを全て辞書に登録すると、容量が非常に大
きくなる外、認識処理に要する時間が非常に多くなり、
実用的でなくなる。前述(c)の方法は、例えば「橋」
という字の筆記時における入力ストローク列に対し、漢
字の部分パターンとのマツチングを行なうもので、入力
ストローク列は「木」、「天」、「口」、 「口」等のように部分パターン列に変換されて文字が識
別される。しかしながら、第2図(c)に示す現実の
「橋」の字のような場合には、2つの小さな と「口」の部分については「口」と判別できないことが
多い。即ち、人の習慣として筆記文字における細かい部
分は類似文字が無い限り明瞭に書かれることが少ないの
で、その部分を抽出して認識すると、誤りを生じたり、
また、認識できないことが多い。また(d)に示す方法
は、DPマツチングにより多少のつづけ字をマツチングの
段階で認識するものであるが、計算量が多くなると共に
認識時間が長くなるという欠点がある。
楷書で書かせた時の「糸へん」と「会」の出現パターン
の例である。この例では8通りの「糸へん」と4通りの
「会」があるので8×4=32通りの「絵」のパターンが
考えられる。このようにつづけ字のパターンが非常に多
いのでこれらを全て辞書に登録すると、容量が非常に大
きくなる外、認識処理に要する時間が非常に多くなり、
実用的でなくなる。前述(c)の方法は、例えば「橋」
という字の筆記時における入力ストローク列に対し、漢
字の部分パターンとのマツチングを行なうもので、入力
ストローク列は「木」、「天」、「口」、 「口」等のように部分パターン列に変換されて文字が識
別される。しかしながら、第2図(c)に示す現実の
「橋」の字のような場合には、2つの小さな と「口」の部分については「口」と判別できないことが
多い。即ち、人の習慣として筆記文字における細かい部
分は類似文字が無い限り明瞭に書かれることが少ないの
で、その部分を抽出して認識すると、誤りを生じたり、
また、認識できないことが多い。また(d)に示す方法
は、DPマツチングにより多少のつづけ字をマツチングの
段階で認識するものであるが、計算量が多くなると共に
認識時間が長くなるという欠点がある。
[発明が解決しようとする問題点] 辞書容量を大幅に増加させることなく、少ない処理時間
と処理量で種々のつづけ字パターンを認識可能な情報認
識装置を提供することにある。
と処理量で種々のつづけ字パターンを認識可能な情報認
識装置を提供することにある。
[問題点を解決するための手段] この問題を解決する一手段として、例えば第1図に示す
実施例の情報認識装置は、予め各種部分パターンについ
ての特徴情報を記憶している部分特徴テーブル4と、前
処理として、タブレツト1からの筆跡入力パターンと部
分特徴テーブル4の部分パターン特徴情報との類否判断
を行う部分識別手段5と、予め各種文字の全パターンに
ついての特徴情報を記憶している文字辞書テーブル7
と、認識処理として、前記筆跡入力パターンと文字辞書
テーブル7の特徴情報との類否判断を行う文字識別手段
を備える。
実施例の情報認識装置は、予め各種部分パターンについ
ての特徴情報を記憶している部分特徴テーブル4と、前
処理として、タブレツト1からの筆跡入力パターンと部
分特徴テーブル4の部分パターン特徴情報との類否判断
を行う部分識別手段5と、予め各種文字の全パターンに
ついての特徴情報を記憶している文字辞書テーブル7
と、認識処理として、前記筆跡入力パターンと文字辞書
テーブル7の特徴情報との類否判断を行う文字識別手段
を備える。
[作用] かかる第1図の構成において、文字識別手段8は、例え
ば部分識別手段5が識別した部分パターンについての全
文字パターンの画数を限定して、類否判断を行う。
ば部分識別手段5が識別した部分パターンについての全
文字パターンの画数を限定して、類否判断を行う。
また、文字識別手段8は、例えば部分識別手段5が識別
した部分パターンの楷書画数を参照して残りの全パター
ンを限定して、類否判断を行う。
した部分パターンの楷書画数を参照して残りの全パター
ンを限定して、類否判断を行う。
このように、入力ストローク列と辞書テーブルに登録さ
れたパターンとの比較に先立ち、入力ストローク列と、
漢字の偏やなどの予め定められた文字の部分パターンと
の類似度を求めて分類を行ない、入力ストローク列と辞
書テーブルに登録された文字パターンとの比較に必要と
される処理量を大幅に減少させると共に、特にサブパタ
ーンにおけるつづけ字による画数の変動を補正して、辞
書テーブルの容量を増加させることなく、多くのつづけ
字パターンを認識可能にした。
れたパターンとの比較に先立ち、入力ストローク列と、
漢字の偏やなどの予め定められた文字の部分パターンと
の類似度を求めて分類を行ない、入力ストローク列と辞
書テーブルに登録された文字パターンとの比較に必要と
される処理量を大幅に減少させると共に、特にサブパタ
ーンにおけるつづけ字による画数の変動を補正して、辞
書テーブルの容量を増加させることなく、多くのつづけ
字パターンを認識可能にした。
[実施例] 以下、本発明の実施例について図面を参照しながら説明
する。第1図の本発明の一実施例の情報認識装置の基本
構成を示す要部ブロツク図である。図において、1はデ
ータタブレツト等により筆跡情報を入力する情報入力
部、2は情報入力部1から入力される文字、図形、記号
等の筆跡パターンを認識する情報認識部である。
する。第1図の本発明の一実施例の情報認識装置の基本
構成を示す要部ブロツク図である。図において、1はデ
ータタブレツト等により筆跡情報を入力する情報入力
部、2は情報入力部1から入力される文字、図形、記号
等の筆跡パターンを認識する情報認識部である。
情報認識部2は、図示しないが、具体的には第5図、第
9図に示す実施例のプログラム及び第4図、第7図に示
す認識のための実施例の辞書テーブルを格納したROM
と、前記プログラムに従つて辞書テーブルを参照し、文
字等の認識をするマイクロプロセツサと、認識に必要な
情報を一時的に蓄えるRAM等を含む。該情報認識部2の
ブロツクには上述した構成により実現される各種機能が
示されており、3はタブレツト入力ペンの筆跡座標やア
ツプダウン情報から一文字及びその構成部分を切り出
し、画数や各ストローク形状の特徴、或いは特徴点の座
標など、入力文字パターンの特徴を抽出する特徴抽出手
段、4は各種態様で入力される文字の部分特徴情報を記
憶している部分特徴テーブル、5は特徴抽出手段3によ
つて抽出された入力文字パターンの特徴と予め用意して
おいた部分特徴テーブルの特徴情報とを比較して類似度
を求める部分識別手段、6はこの部分識別手段5による
識別結果を一時記憶する部分識別バツフア、7は各種態
様で入力される文字の特徴情報を記憶している文字辞書
テーブル、8は部分識別バツフア6に記憶された部分識
別結果と特徴抽出手段3の抽出結果を文字辞書テーブル
7の文字特徴情報によつて比較および識別する文字識別
手段である。
9図に示す実施例のプログラム及び第4図、第7図に示
す認識のための実施例の辞書テーブルを格納したROM
と、前記プログラムに従つて辞書テーブルを参照し、文
字等の認識をするマイクロプロセツサと、認識に必要な
情報を一時的に蓄えるRAM等を含む。該情報認識部2の
ブロツクには上述した構成により実現される各種機能が
示されており、3はタブレツト入力ペンの筆跡座標やア
ツプダウン情報から一文字及びその構成部分を切り出
し、画数や各ストローク形状の特徴、或いは特徴点の座
標など、入力文字パターンの特徴を抽出する特徴抽出手
段、4は各種態様で入力される文字の部分特徴情報を記
憶している部分特徴テーブル、5は特徴抽出手段3によ
つて抽出された入力文字パターンの特徴と予め用意して
おいた部分特徴テーブルの特徴情報とを比較して類似度
を求める部分識別手段、6はこの部分識別手段5による
識別結果を一時記憶する部分識別バツフア、7は各種態
様で入力される文字の特徴情報を記憶している文字辞書
テーブル、8は部分識別バツフア6に記憶された部分識
別結果と特徴抽出手段3の抽出結果を文字辞書テーブル
7の文字特徴情報によつて比較および識別する文字識別
手段である。
部分識別手段の動作を説明するに先立ち、部分パターン
について説明する。第3図は部分パターンの一例を示す
参考図である。これらの部分パターンは原則として漢字
の「偏」、「旁]、「冠」であるが、必ずしも国語学習
において習う漢字の「偏」、「旁」、「冠」とは一致し
ていない。これらの部分パターンに共通する特徴は、現
実に使用する漢字の部分パターンとして多く出現するパ
ターンであることと、一つの漢字における当該パターン
の位置、および筆記される際の筆順が安定していること
等である。例えば、多く人について「絵」という文字の
筆記実験を行つた結果、全ての人が「会」よりも先に
「糸へん」を筆記した。また、全ての人が「糸へん」を
文字枠の左寄りに筆記し、「会」に含まれるいかなるス
トロークを「糸へん」に含まれるストロークより完全に
左に位置することはなかつた。さらに「級」、「紅」、
「約」、「純」等の多くの「糸へん」の文字についても
同様の結果が得られた。なお、「索」、「素」等の文字
は「糸へん」であるが対象外であるとする。第3図はこ
のような部分パターンの一例を示す説明図である。これ
らの部分パターンは多くの文字の部分パターンになるの
みならず、通常の筆記においては画数や筆順の変動に拘
わらず一文字中の位置や一文字を筆記する際の筆順に安
定している。
について説明する。第3図は部分パターンの一例を示す
参考図である。これらの部分パターンは原則として漢字
の「偏」、「旁]、「冠」であるが、必ずしも国語学習
において習う漢字の「偏」、「旁」、「冠」とは一致し
ていない。これらの部分パターンに共通する特徴は、現
実に使用する漢字の部分パターンとして多く出現するパ
ターンであることと、一つの漢字における当該パターン
の位置、および筆記される際の筆順が安定していること
等である。例えば、多く人について「絵」という文字の
筆記実験を行つた結果、全ての人が「会」よりも先に
「糸へん」を筆記した。また、全ての人が「糸へん」を
文字枠の左寄りに筆記し、「会」に含まれるいかなるス
トロークを「糸へん」に含まれるストロークより完全に
左に位置することはなかつた。さらに「級」、「紅」、
「約」、「純」等の多くの「糸へん」の文字についても
同様の結果が得られた。なお、「索」、「素」等の文字
は「糸へん」であるが対象外であるとする。第3図はこ
のような部分パターンの一例を示す説明図である。これ
らの部分パターンは多くの文字の部分パターンになるの
みならず、通常の筆記においては画数や筆順の変動に拘
わらず一文字中の位置や一文字を筆記する際の筆順に安
定している。
第4図は部分識別手段3における入力文字パターンとの
比較のため、部分特徴テーブル4に予め用意された部分
特徴情報の一例を示す概念図である。図中、番号の欄に
記載された数値は第3図の各部分パターンに付された番
号であり、この番号に対応する各種パターンが基本スト
ローク列および各ストロークの特徴点列等を用いて表現
されている。「画数」とは、各部分パターンの画数であ
り、「楷書パターン」とは、ある部分パターンを楷書で
筆記した時の部分パターン番号である。「画数変動」と
は、楷書パターンの画数から部分パターンの画数を引い
た数である。入力文字パターンの欄の「最小画数、最大
画数」とは、当該部分パターンを有する入力文字パター
ン全体の最小画数と最大画数である。「位置」とは、文
字枠中での各部分パターンの位置を示し、「切り出し条
件」とは、入力文字パターンのストローク列中で部分パ
ターンが出現する位置を示す。「詳細判別」とは、入力
文字パターンと部分パターンとの比較および判別におい
て特に付加すべき判別事項を示す。例えば番号12につい
て説明すると、パターンは「糸」であり、画数は5で、
楷書パターンは部分パターン番号11の「糸」であつて、
入力文字パターンの画数が8画以上且つ18画以下である
ときのみ参照すべきであることが分かる。また「糸」は
一文字枠中の左寄りに出現し、入力文字パターンの初め
の5画に出現することを表している。
比較のため、部分特徴テーブル4に予め用意された部分
特徴情報の一例を示す概念図である。図中、番号の欄に
記載された数値は第3図の各部分パターンに付された番
号であり、この番号に対応する各種パターンが基本スト
ローク列および各ストロークの特徴点列等を用いて表現
されている。「画数」とは、各部分パターンの画数であ
り、「楷書パターン」とは、ある部分パターンを楷書で
筆記した時の部分パターン番号である。「画数変動」と
は、楷書パターンの画数から部分パターンの画数を引い
た数である。入力文字パターンの欄の「最小画数、最大
画数」とは、当該部分パターンを有する入力文字パター
ン全体の最小画数と最大画数である。「位置」とは、文
字枠中での各部分パターンの位置を示し、「切り出し条
件」とは、入力文字パターンのストローク列中で部分パ
ターンが出現する位置を示す。「詳細判別」とは、入力
文字パターンと部分パターンとの比較および判別におい
て特に付加すべき判別事項を示す。例えば番号12につい
て説明すると、パターンは「糸」であり、画数は5で、
楷書パターンは部分パターン番号11の「糸」であつて、
入力文字パターンの画数が8画以上且つ18画以下である
ときのみ参照すべきであることが分かる。また「糸」は
一文字枠中の左寄りに出現し、入力文字パターンの初め
の5画に出現することを表している。
次に第5図に示すフローチヤートを参照して部分識別手
段5の動作を説明する。部分識別手段5は、特徴抽出手
段3から一入力文字パターンの画数や各ストロークの特
徴点座標等の特徴が入力されると、入力文字パターンと
予め登録された全ての部分パターンとの比較を行う。こ
の時、第5図のステツプS7において全ての部分パターン
との比較が終了したことが判別されると比較動作が終了
する。また、比較の済んでいない部分パターンがある場
合はステツプS8に進み、比較の済んでいない部分パター
ンに関する性質のデータが用意される。ステツプS9では
入力文字パターンの画数がその部分パターンに定められ
た入力文字パターンの「最小画数」以上でかつ「最大画
数」以下であるかを判別する。入力文字パターンの画数
が条件内でない場合はステツプS7へ戻り、条件内である
場合は部分パターンに定められた「切り出し条件」に従
い入力文字パターンから部分パターンに対応すると予想
されるストローク列を切り出す。「切り出し条件」は第
4図に例示するように入力ストローク列の初めのm画、
或いは終わりのn画であるので簡単に切り出せる。次に
ステツプS11で入力文字パターンから切り出されたスト
ローク列が文字枠内において各部分パターン毎に定めら
れた「位置」にあるか否かが判別される。この判別に際
しては、位置が左と指定された場合であつても切り出さ
れたストローク列が厳格に文字枠の左半分に位置する必
要はない。むしろ切り出したストローク列以外のストロ
ーク列との相対位置関係が問題であり、前記他のストロ
ーク列が切り出したストローク列のストロークよりも左
にはないという程度の判別基準に従つて判別すれば良
い。「位置」が条件に適合しない場合はステツプS7へ戻
り、また、条件に適合する場合はステツプS12において
入力文字パターンとの比較が行なわれ、類似度が求めら
れる。この時は入力文字パターンから切り出したストロ
ーク列と部分パターンの画数が等しいので、一般的なオ
ンライン文字認識方法と同様な方法で類似度を求めるこ
とができる。ステツプS13では類似度が所定値以上か否
かが判別され、この結果、所定値を超える場合はステツ
プS14で部分パターン番号、画数、楷書パターン番号、
画数変動、切り出し条件および類似度を部分識別バツフ
ア6に出力する。なお、ステツプS13で類似度が所定値
以下と判別された場合はステツプS7へ戻る。
段5の動作を説明する。部分識別手段5は、特徴抽出手
段3から一入力文字パターンの画数や各ストロークの特
徴点座標等の特徴が入力されると、入力文字パターンと
予め登録された全ての部分パターンとの比較を行う。こ
の時、第5図のステツプS7において全ての部分パターン
との比較が終了したことが判別されると比較動作が終了
する。また、比較の済んでいない部分パターンがある場
合はステツプS8に進み、比較の済んでいない部分パター
ンに関する性質のデータが用意される。ステツプS9では
入力文字パターンの画数がその部分パターンに定められ
た入力文字パターンの「最小画数」以上でかつ「最大画
数」以下であるかを判別する。入力文字パターンの画数
が条件内でない場合はステツプS7へ戻り、条件内である
場合は部分パターンに定められた「切り出し条件」に従
い入力文字パターンから部分パターンに対応すると予想
されるストローク列を切り出す。「切り出し条件」は第
4図に例示するように入力ストローク列の初めのm画、
或いは終わりのn画であるので簡単に切り出せる。次に
ステツプS11で入力文字パターンから切り出されたスト
ローク列が文字枠内において各部分パターン毎に定めら
れた「位置」にあるか否かが判別される。この判別に際
しては、位置が左と指定された場合であつても切り出さ
れたストローク列が厳格に文字枠の左半分に位置する必
要はない。むしろ切り出したストローク列以外のストロ
ーク列との相対位置関係が問題であり、前記他のストロ
ーク列が切り出したストローク列のストロークよりも左
にはないという程度の判別基準に従つて判別すれば良
い。「位置」が条件に適合しない場合はステツプS7へ戻
り、また、条件に適合する場合はステツプS12において
入力文字パターンとの比較が行なわれ、類似度が求めら
れる。この時は入力文字パターンから切り出したストロ
ーク列と部分パターンの画数が等しいので、一般的なオ
ンライン文字認識方法と同様な方法で類似度を求めるこ
とができる。ステツプS13では類似度が所定値以上か否
かが判別され、この結果、所定値を超える場合はステツ
プS14で部分パターン番号、画数、楷書パターン番号、
画数変動、切り出し条件および類似度を部分識別バツフ
ア6に出力する。なお、ステツプS13で類似度が所定値
以下と判別された場合はステツプS7へ戻る。
第6図(a)及び(b)は部分識別手段5の動作例を説
明するための説明図である。図において、10は入力文字
パターンを示し、11は一画毎に分解した入力文字パター
ンを示す。部分識別手段5で入力文字パターン10と部分
パターン番号12の「糸」との比較を行う場合、第4図に
示される「糸」の切り出し条件に従つて入力文字パター
ンの初めの5画を切り出す。12は切り出したパターンで
ある。次に、切り出したパターン12の位置が「位置」の
条件を満足しているか否かが判別される。図(a)に示
す例では切り出したパターン「糸」12に含まれるストロ
ークが他の切り出したパターン「会」13に含まれる何れ
のストロークよりも左にあるので条件を満足している。
次に、切り出したパターン12と部分パターン番号12の
「パターン」との比較を行ない、この結果類似度が所定
値以上であるときは同図(b)に示すように「部分パタ
ーン番号」“12"、「画数」“5"、「楷書パターン番
号」“11"、「画数変動」“1"、「切り出し条件」が初
めの“5画”、「類似度」“5"といつた部分特徴情報の
出力を行う。
明するための説明図である。図において、10は入力文字
パターンを示し、11は一画毎に分解した入力文字パター
ンを示す。部分識別手段5で入力文字パターン10と部分
パターン番号12の「糸」との比較を行う場合、第4図に
示される「糸」の切り出し条件に従つて入力文字パター
ンの初めの5画を切り出す。12は切り出したパターンで
ある。次に、切り出したパターン12の位置が「位置」の
条件を満足しているか否かが判別される。図(a)に示
す例では切り出したパターン「糸」12に含まれるストロ
ークが他の切り出したパターン「会」13に含まれる何れ
のストロークよりも左にあるので条件を満足している。
次に、切り出したパターン12と部分パターン番号12の
「パターン」との比較を行ない、この結果類似度が所定
値以上であるときは同図(b)に示すように「部分パタ
ーン番号」“12"、「画数」“5"、「楷書パターン番
号」“11"、「画数変動」“1"、「切り出し条件」が初
めの“5画”、「類似度」“5"といつた部分特徴情報の
出力を行う。
次に、文字識別手段8の動作を説明するに先立ち、文字
辞書テーブル7の辞書構造を説明する。第7図は画数毎
に分類された文字辞書テーブル7の記憶構造を示し、そ
の上部には、12画文字の一例を示している。図中、「番
号」の欄には各文字の文字コードを示し、また「部分パ
ターン番号」の欄には各文字の部分パターンに付された
楷書パターン番号を示す。なお、「残りのパターン」の
欄には部分パターンを除いた残りのパターンが示され
る。文字辞書テーブル7において残りパターンが基本ス
トローク列の形で、或いは各ストロークの特徴点座標列
等の形で記憶されている。第7図下部に示す文字の欄で
は「部分パターン番号」が0となつているが、これらの
文字には対応する部分パターンが無いことを示す。また
一つの文字中に部分パターンが2つ以上ある場合は、何
れか一つを部分パターンに選ぶ。
辞書テーブル7の辞書構造を説明する。第7図は画数毎
に分類された文字辞書テーブル7の記憶構造を示し、そ
の上部には、12画文字の一例を示している。図中、「番
号」の欄には各文字の文字コードを示し、また「部分パ
ターン番号」の欄には各文字の部分パターンに付された
楷書パターン番号を示す。なお、「残りのパターン」の
欄には部分パターンを除いた残りのパターンが示され
る。文字辞書テーブル7において残りパターンが基本ス
トローク列の形で、或いは各ストロークの特徴点座標列
等の形で記憶されている。第7図下部に示す文字の欄で
は「部分パターン番号」が0となつているが、これらの
文字には対応する部分パターンが無いことを示す。また
一つの文字中に部分パターンが2つ以上ある場合は、何
れか一つを部分パターンに選ぶ。
次に第8図に示すフローチヤートと共に文字識別手段8
の動作を説明する。特徴抽出手段3から入力文字パター
ンの特徴が入力され、また、部分識別バツフア6から部
分識別手段5の識別結果が入力されると、文字識別手段
8はステツプS15で部分識別バツフア6のすべての部分
パターンに対する処理が終了したか否かを判別する。こ
の結果、部分識別バツフア6に部分識別手段5からの出
力が無い場合、或いは全ての部分パターンに対する処理
が終了している場合はステツプS23へ進む。また、終了
していない場合はステツプS16で部分識別バツフア6か
ら次に処理する部分パターンに関する情報、即ち、「部
分パターン番号」、「画数」、「楷書パターン番号」、
「画数変動」、「切り出し条件」および「類似度」を入
力する。ステツプS17では入力文字パターンの画数に画
数変動を加え、文字辞書テーブル内で参照する文字の画
数を求め、ステツプS18では入力文字パターンから残り
のパターンを条件に従つて切り出す。ステツプS19では
楷書パターンを部分パターンとする全ての文字パターン
を当該参照画数の辞書から入力する。ステツプS20では
ステツプS19で入力された文字の残りパターンと入力文
字パターンの残りパターンとを比較して類似度を求め、
ステツプS21では部分パターンの類似度と残りパターン
の類似度の和を各文字パターンの類似度として求める。
ステツプS22では類似度が所定値を超える文字の文字番
号(コード)とその類似度を出力してステツプS15へ戻
る。尚、ステツプS19で辞書中に該当する文字が存在し
ない場合は、ステツプS20〜S22における処理を行なわず
にステツプS15へ戻る。
の動作を説明する。特徴抽出手段3から入力文字パター
ンの特徴が入力され、また、部分識別バツフア6から部
分識別手段5の識別結果が入力されると、文字識別手段
8はステツプS15で部分識別バツフア6のすべての部分
パターンに対する処理が終了したか否かを判別する。こ
の結果、部分識別バツフア6に部分識別手段5からの出
力が無い場合、或いは全ての部分パターンに対する処理
が終了している場合はステツプS23へ進む。また、終了
していない場合はステツプS16で部分識別バツフア6か
ら次に処理する部分パターンに関する情報、即ち、「部
分パターン番号」、「画数」、「楷書パターン番号」、
「画数変動」、「切り出し条件」および「類似度」を入
力する。ステツプS17では入力文字パターンの画数に画
数変動を加え、文字辞書テーブル内で参照する文字の画
数を求め、ステツプS18では入力文字パターンから残り
のパターンを条件に従つて切り出す。ステツプS19では
楷書パターンを部分パターンとする全ての文字パターン
を当該参照画数の辞書から入力する。ステツプS20では
ステツプS19で入力された文字の残りパターンと入力文
字パターンの残りパターンとを比較して類似度を求め、
ステツプS21では部分パターンの類似度と残りパターン
の類似度の和を各文字パターンの類似度として求める。
ステツプS22では類似度が所定値を超える文字の文字番
号(コード)とその類似度を出力してステツプS15へ戻
る。尚、ステツプS19で辞書中に該当する文字が存在し
ない場合は、ステツプS20〜S22における処理を行なわず
にステツプS15へ戻る。
また、ステツプS23では予め定めた設定値以上の類似度
を有する文字が既に存在しているか否かが判別され、こ
の結果、既に存在する場合は終了し、存在しない場合は
ステツプS24へ進む。ステツプS24では入力文字パターン
の画数と同じ画数の辞書から部分パターン番号が0であ
る文字パターンを全て入力する。ステツプS25では各文
字パターンの残りパターンと入力文字パターン全体とが
比較されて類似度が求められ、ステツプS26では所定値
以上の類似度を有する文字の番号とその類似度を出力し
て終了する。なお、ステツプS24で該当する文字パター
ンが存在しない場合は、ステツプS25およびS26における
処理を行なわずに終了する。
を有する文字が既に存在しているか否かが判別され、こ
の結果、既に存在する場合は終了し、存在しない場合は
ステツプS24へ進む。ステツプS24では入力文字パターン
の画数と同じ画数の辞書から部分パターン番号が0であ
る文字パターンを全て入力する。ステツプS25では各文
字パターンの残りパターンと入力文字パターン全体とが
比較されて類似度が求められ、ステツプS26では所定値
以上の類似度を有する文字の番号とその類似度を出力し
て終了する。なお、ステツプS24で該当する文字パター
ンが存在しない場合は、ステツプS25およびS26における
処理を行なわずに終了する。
第6図に示す例では入力文字パターン10の画数が11であ
り、また、画数変動が1であるから参照辞書画数は12で
ある。このとき、切り出し条件が初めの5画なので残り
6画が残りパターン13となる。また、参照辞書各数が12
であるので第7図に例示する12画の辞書から楷書パター
ン番号11を部分パターン番号とする文字を選んで残りパ
ターン同志の比較を行う。従つて第7図に示す辞書の残
りのパターン比較から、第6図に示す入力文字パターン
10は「絵」と認識される。このとき第6図に示す入力文
字パターンに対応する文字パターンは第7図に示す12画
の辞書に格納されていれば良く、11画の辞書に格納され
ている必要はない。同様に第2図(a)及び(b)に例
示した8×4=32通りの「絵」に対しては、「絵」、
「絵」、「絵」および「絵」から成る4通りの「絵」パ
ターンが辞書に格納されることにより、全て正しく認識
することができる。
り、また、画数変動が1であるから参照辞書画数は12で
ある。このとき、切り出し条件が初めの5画なので残り
6画が残りパターン13となる。また、参照辞書各数が12
であるので第7図に例示する12画の辞書から楷書パター
ン番号11を部分パターン番号とする文字を選んで残りパ
ターン同志の比較を行う。従つて第7図に示す辞書の残
りのパターン比較から、第6図に示す入力文字パターン
10は「絵」と認識される。このとき第6図に示す入力文
字パターンに対応する文字パターンは第7図に示す12画
の辞書に格納されていれば良く、11画の辞書に格納され
ている必要はない。同様に第2図(a)及び(b)に例
示した8×4=32通りの「絵」に対しては、「絵」、
「絵」、「絵」および「絵」から成る4通りの「絵」パ
ターンが辞書に格納されることにより、全て正しく認識
することができる。
尚、上述の実施例では部分識別手段および文字識別手段
において類似度を求めているが単に一致の有無を判別す
るように構成することも可能である。なお第8図に示す
ステツプS23は除去することが可能である。
において類似度を求めているが単に一致の有無を判別す
るように構成することも可能である。なお第8図に示す
ステツプS23は除去することが可能である。
[発明の効果] 以上の説明で明らかなように、本発明によれば、まず、
部分パターン辞書との類否判断を行って文字パターン全
体の類否判断を行う辞書パターンを絞り込むことによ
り、短時間で確実な認識を行うことができる。
部分パターン辞書との類否判断を行って文字パターン全
体の類否判断を行う辞書パターンを絞り込むことによ
り、短時間で確実な認識を行うことができる。
また、部分パターン辞書との類否判断の結果に基づい
て、入力パターンの画数を調整するので、部分パターン
内で画数の変動がおきても、その変動に応じた適切な画
数の文字パターンを選択することができる。
て、入力パターンの画数を調整するので、部分パターン
内で画数の変動がおきても、その変動に応じた適切な画
数の文字パターンを選択することができる。
第1図は本発明の一実施例の情報認識装置の基本構成を
示す要部ブロツク図、 第2図(a)及(b)は「糸」および「会」の手書き文
字例を示す説明図、 第2図(c)は「橋」の手書き文字例を示す説明図、 第3図は部分パターンの一例を示す参考図、 第4図は部分識別手段5における入力部分特徴パターン
との比較参照のため、予め部分特徴テーブル4に用意さ
れた部分特徴パターン及び関連情報の一例を示す概念
図、 第5図は部分識別手段5の動作フローチヤート、 第6図(a)及び(b)は部分識別手段5の動作例を説
明するための説明図、 第7図は文字辞書テーブル7の記憶内容の一例を示す概
念図、 第8図は文字識別手段8の動作フローチヤートである。 図中、1……情報入力部(タブレツト)、2……情報認
識部、3……特徴抽出手段、4……部分特徴テーブル、
5……部分識別手段、6……部分識別バツフア、7……
文字辞書テーブル、8……文字識別手段である。
示す要部ブロツク図、 第2図(a)及(b)は「糸」および「会」の手書き文
字例を示す説明図、 第2図(c)は「橋」の手書き文字例を示す説明図、 第3図は部分パターンの一例を示す参考図、 第4図は部分識別手段5における入力部分特徴パターン
との比較参照のため、予め部分特徴テーブル4に用意さ
れた部分特徴パターン及び関連情報の一例を示す概念
図、 第5図は部分識別手段5の動作フローチヤート、 第6図(a)及び(b)は部分識別手段5の動作例を説
明するための説明図、 第7図は文字辞書テーブル7の記憶内容の一例を示す概
念図、 第8図は文字識別手段8の動作フローチヤートである。 図中、1……情報入力部(タブレツト)、2……情報認
識部、3……特徴抽出手段、4……部分特徴テーブル、
5……部分識別手段、6……部分識別バツフア、7……
文字辞書テーブル、8……文字識別手段である。
Claims (1)
- 【請求項1】部分パターンについての特徴情報、及び前
記部分パターンの画数と前記部分パターンを楷書で入力
した場合の画数とに基づく変動画数の情報を記憶する部
分パターン辞書と、 文字パターン全体についての特徴情報と前記文字パター
ンを楷書で入力した場合の画像情報を対応付けて記憶す
る文字パターン辞書とを利用し、 入力パターンの部分パターンと前記部分パターン辞書に
記憶されている特徴情報との類否判断を行い、 入力パターン全体の入力画数を判定し、 前記類否判断により類似していると判断される部分パタ
ーンの変動画数を、前記部分パターン辞書に記憶されて
いる変動画数の情報を用い判断し、 前記変動画数に従って、前記入力画数を調整し、 前記文字パターン辞書において、前記調整して得た入力
画数に対応付けて記憶されている文字パターンを、前記
入力パターンの類否判断を行う文字パターンとして選択
することを特徴とする文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60132011A JPH07107698B2 (ja) | 1985-06-19 | 1985-06-19 | 文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60132011A JPH07107698B2 (ja) | 1985-06-19 | 1985-06-19 | 文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61290584A JPS61290584A (ja) | 1986-12-20 |
JPH07107698B2 true JPH07107698B2 (ja) | 1995-11-15 |
Family
ID=15071449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60132011A Expired - Fee Related JPH07107698B2 (ja) | 1985-06-19 | 1985-06-19 | 文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07107698B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01293491A (ja) * | 1988-05-20 | 1989-11-27 | Nec Corp | サブパターン作成方式 |
JPH02239387A (ja) * | 1989-03-14 | 1990-09-21 | Oki Electric Ind Co Ltd | 文字認識装置 |
JP5020513B2 (ja) * | 2006-01-11 | 2012-09-05 | シャープ株式会社 | パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57132283A (en) * | 1981-02-06 | 1982-08-16 | Fujitsu Ltd | Character recognition system |
JPS58151685A (ja) * | 1982-03-04 | 1983-09-08 | Ricoh Co Ltd | 文字認識装置 |
JPS59188787A (ja) * | 1983-04-08 | 1984-10-26 | Nec Corp | オンライン手書き文字入力装置 |
JPS6041175A (ja) * | 1983-08-15 | 1985-03-04 | Hitachi Ltd | オンライン手書き文字認識方式 |
-
1985
- 1985-06-19 JP JP60132011A patent/JPH07107698B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPS61290584A (ja) | 1986-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5121441A (en) | Robust prototype establishment in an on-line handwriting recognition system | |
US5796867A (en) | Stroke-number-free and stroke-order-free on-line Chinese character recognition method | |
KR100248917B1 (ko) | 패턴인식장치및방법 | |
KR100249055B1 (ko) | 문자인식장치및방법 | |
US5315667A (en) | On-line handwriting recognition using a prototype confusability dialog | |
US5285505A (en) | Method and apparatus for improving prototypes of similar characters in on-line handwriting recognition | |
JPS60217477A (ja) | 手書き文字認識装置 | |
Lehal et al. | Feature extraction and classification for OCR of Gurmukhi script | |
JPH07509576A (ja) | 文字の認識方法 | |
JPH07107698B2 (ja) | 文字認識方法 | |
JP2002063548A (ja) | 手書き文字認識方法 | |
JPS62271086A (ja) | パタ−ン認識装置 | |
JP2894305B2 (ja) | 認識装置の候補修正方式 | |
Oulhadj et al. | A prediction-verification strategy for automatic recognition of cursive handwriting | |
JP2851865B2 (ja) | 文字認識装置 | |
KR940001739B1 (ko) | 스트로크인식을 통한 온라인 필기체 문자인식방법 | |
JP2953162B2 (ja) | 文字認識装置 | |
JPH04336686A (ja) | 手書文字認識装置 | |
JP2000200323A (ja) | オンライン手書き漢字認識装置 | |
KR100367580B1 (ko) | 획순독립의온라인문자인식장치 | |
JP2824704B2 (ja) | 文字認識装置 | |
JPH01125683A (ja) | 文字認識装置 | |
JPS5810274A (ja) | オンライン手書き文字認識方式 | |
JPH0436885A (ja) | 光学式文字読取装置 | |
JPH07117995B2 (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |