JP2001028035A - 文字認識装置およびコンピュータ可読記録媒体 - Google Patents

文字認識装置およびコンピュータ可読記録媒体

Info

Publication number
JP2001028035A
JP2001028035A JP11200022A JP20002299A JP2001028035A JP 2001028035 A JP2001028035 A JP 2001028035A JP 11200022 A JP11200022 A JP 11200022A JP 20002299 A JP20002299 A JP 20002299A JP 2001028035 A JP2001028035 A JP 2001028035A
Authority
JP
Japan
Prior art keywords
feature
recognition
template
dictionary
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11200022A
Other languages
English (en)
Other versions
JP3428512B2 (ja
Inventor
Masahiko Hamanaka
雅彦 濱中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP20002299A priority Critical patent/JP3428512B2/ja
Publication of JP2001028035A publication Critical patent/JP2001028035A/ja
Application granted granted Critical
Publication of JP3428512B2 publication Critical patent/JP3428512B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 辞書容量の増大を抑え、効率的に個人の字体
を自動学習する。 【解決手段】 個人辞書31は個人的な標準特徴を最大
記憶テンプレート数まで記憶する。照合手段40は照合
により文字カテゴリおよびテンプレート番号を出力す
る。新規特徴登録手段60は、誤認識した場合に、個人
辞書に正解カテゴリと同じテンプレートが存在する場合
は、各標準特徴間の距離値が学習特徴数に依存した所定
のしきい値と比較して小さい場合は加重和して当該標準
特徴を更新し、それ以外は新たにテンプレートを登録
し、更にテンプレート数が最大記憶テンプレート数を越
える場合は、順序の古いテンプレートを削除する。特徴
順序変更手段70は、個人辞書の標準特徴が認識に有効
に利用された場合は、そのテンプレートの個人辞書内で
の順序を新しい方に移動させ、逆に認識に悪影響を及ぼ
した場合は、そのテンプレートの順序を古い方に移動さ
せる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は自動学習機能を有す
る文字認識装置に関し、特に汎用辞書では認識が困難な
個人の字体を自動的に学習できる文字認識装置に関す
る。
【0002】
【従来の技術】認識対象文字の特徴とカテゴリ毎に予め
辞書に記憶された標準特徴とを照合し、認識対象文字と
の間の距離が最も短いカテゴリを決定する光学的文字認
識装置(OCR装置)やオンライン文字認識装置などの
文字認識装置においては、認識精度および認識速度を向
上する上で辞書の性能を高めることが重要である。
【0003】辞書の性能を向上させる方式には、例えば
特公平6−32087号公報、特開平10−21340
号公報に見られるように、学習によって、汎用辞書中の
文字カテゴリ毎の汎用的な標準特徴を変更する方式と、
例えば特公昭60−30993号公報、特公平2−53
833号公報に見られるように、文字カテゴリ毎の汎用
的な標準特徴には変更を加えずに、学習によって、新た
な標準特徴を辞書に追加していく方式とに大別される。
しかし、前者の方式では、学習が進むにつれて汎用的な
標準特徴が失われていくため、特定の個人に対する認識
精度は高まるが、他の個人の認識精度は却って低下す
る。このため、第三者に対する認識精度の低下を防止し
つつ、或る特定の個人に対する認識精度を向上させる場
合、後者の方式が一般に採用される。本発明は、この後
者の方式の改良に関する。
【0004】前記特公平2−53833号公報に記載さ
れた文字認識装置(以下、第1の従来技術と称す)の構
成例を図16に、前記特公昭60−30993号公報に
記載された文字認識装置(以下、第2の従来技術と称
す)の構成例を図17にそれぞれ示す。
【0005】図16に示される従来の自動学習機能を有
する文字認識装置は、データ入力手段10と、特徴抽出
手段20と、汎用辞書30と、個人辞書35と、照合手
段45と、結果訂正手段50と、表示手段51と、訂正
情報入力手段52と、新規特徴登録手段65とから構成
されている。
【0006】このような構成を有する従来の自動学習機
能を有する文字認識装置は次のように動作する。すなわ
ち、図16において、OCR装置の場合、帳票などに書
かれた文字はスキャナ等のデータ入力手段10によって
文字イメージ画像として入力され、特徴抽出手段20
は、当該文字イメージ画像から認識特徴を抽出する。汎
用辞書30には、認識特徴の文字カテゴリ毎の汎用的な
標準特徴が予め記憶されている。個人辞書35には、認
識特徴の文字カテゴリ毎の個人的な標準特徴が記憶され
ている(初期状態は空)。照合手段45は、特徴抽出手
段20より得られる入力文字の認識特徴を、汎用辞書3
0および個人辞書35に記憶されている各標準特徴と順
次照合し、距離値の小さい標準特徴の文字カテゴリの候
補を求める。結果訂正手段50は、表示手段51により
第1候補を表示し、誤認識している場合、利用者はキー
ボード等の訂正情報入力手段52により正解カテゴリを
指定する。新規特徴登録手段65は、誤認識した場合
に、結果訂正手段50より得られる正解カテゴリcと特
徴抽出手段20より得られる入力文字の認識特徴fi
(iは特徴の要素を表す)を用い、個人辞書35に既に
記憶されているカテゴリcのテンプレート{学習特徴数
n(c),標準特徴Si(c)}を下式(1)により更新
する(存在しない場合は新規に登録する)。
【0007】 Si(c)←{n(c)・Si(c)+fi }/{n(c)+1} n(c)←n(c)+1 …(1)
【0008】また、図17に示される従来の自動学習機
能を有する文字認識装置は、データ入力手段10と、特
徴抽出手段20と、辞書36と、照合手段46と、結果
訂正手段50と、表示手段51と、訂正情報入力手段5
2と、新規特徴登録手段66と、仮登録バッファ67と
から構成されている。
【0009】このような構成を有する従来の自動学習機
能を有する文字認識装置は次のように動作する。すなわ
ち、図17において、オンライン文字認識装置の場合、
手書き文字はタブレット等のデータ入力手段10によっ
てストロークの座標点列として入力され、特徴抽出手段
20は、ストロークの座標点列から認識特徴を抽出す
る。辞書36には、文字カテゴリ毎の認識特徴の標準特
徴が記憶されている(初期状態は汎用的な標準特徴の
み)。照合手段46は、特徴抽出手段20より得られる
入力文字の認識特徴を、辞書36に記憶されている各標
準特徴と順次照合し、距離値の小さい標準特徴の文字カ
テゴリの候補を求める。新規特徴登録手段66は、誤認
識した場合に、結果訂正手段50より得られる正解カテ
ゴリcと特徴抽出手段20より得られる入力文字の認識
特徴fiを用い、仮登録バッファ67に認識特徴を登録
する。ここで、仮登録バッファ67に既に記憶されてい
る仮テンプレートの標準特徴と近い場合は当該標準特徴
を更新し、近くない場合は新たに登録する。更に、仮テ
ンプレートの学習特徴数(登録回数)がある数に達した
時、当該仮テンプレートを辞書36に登録する。
【0010】
【発明が解決しようとする課題】上述したように文字カ
テゴリ毎の汎用的な標準特徴には変更を加えずに学習に
よる新たな標準特徴を辞書に追加していく方式によれ
ば、学習が進んでも汎用的な標準特徴は失われないため
第三者に対する認識精度の低下を防止でき、他方特定の
個人に対する認識精度は、学習による新たな標準特徴が
辞書に追加されるので、向上させることができる。しか
しながら、辞書容量が巨大化するという問題点がある。
即ち、第1および第2の従来技術とも新たな標準特徴の
追加に制限がないため、第1の従来技術にあっては個人
辞書35に記憶されるカテゴリ数が増大していき、また
第2の従来技術にあっては辞書36中の個人辞書部分に
記憶されるカテゴリ数が増大していき、何れも辞書全体
の容量が巨大化する。
【0011】従来技術の他の問題点は、辞書容量の巨大
化を防止するために辞書容量に制限を設けると、新たな
標準特徴が追加できなくなって、学習機能が停止するこ
とである。
【0012】本発明はこのような従来の問題点を解決し
ようとするものであり、その目的は、文字カテゴリ毎の
汎用的な標準特徴には変更を加えずに学習によって新た
な標準特徴を辞書に追加していく方式の文字認識装置に
おいて、学習機能を停止させることなく辞書容量の巨大
化を防止することにある。
【0013】
【課題を解決するための手段】本発明は上記の目的を達
成するために、認識対象文字の特徴とカテゴリ毎に予め
辞書に記憶された標準特徴とを照合し、認識対象文字と
の間の距離が最も短いカテゴリを決定する文字認識装置
であって、文字カテゴリ毎の汎用的な標準特徴には変更
を加えずに学習による新たな標準特徴を辞書に追加して
いく方式の自動学習機能を有する文字認識装置におい
て、個人用テンプレートの登録最大数に制限を設けると
共に現在登録されている個人用テンプレートの活用状況
を管理し、新たな個人用テンプレートが登録できなくな
ったとき、有効に活用されていない個人用テンプレート
を削除してから登録する。
【0014】より具体的には、本発明の第1の文字認識
装置は、入力文字データを取得するデータ入力手段(図
1の10)と、前記データ入力手段より得られる文字デ
ータから認識特徴を抽出する特徴抽出手段(図1の2
0)と、認識特徴の文字カテゴリ毎の汎用的な標準特徴
が予め記憶されている汎用辞書(図1の30)と、学習
により個人的な標準特徴が所定数(最大記憶テンプレー
ト数)まで順次記憶されていく個人辞書(図1の31)
と、前記特徴抽出手段より得られる認識特徴を、前記汎
用辞書および前記個人辞書に記憶されている各標準特徴
と順次照合し、距離値の小さい標準特徴の文字カテゴリ
およびテンプレート番号を出力する照合手段(図1の4
0)と、表示手段により認識結果を表示し、訂正情報入
力手段(図1の52)により正解カテゴリの指定を受
け、認識結果を訂正および確定させる結果訂正手段(図
1の50)と、誤認識した場合に、前記結果訂正手段よ
り得られる正解カテゴリと前記特徴抽出手段より得られ
る認識特徴を前記個人辞書に登録する際に、正解カテゴ
リと同じテンプレートが既に存在する場合は、各標準特
徴間の距離値を所定のしきい値と比較し、小さい場合は
加重和して当該標準特徴を更新し、それ以外は新たにテ
ンプレートを登録し、更にテンプレート数が最大記憶テ
ンプレート数を越える場合は、順序の古いテンプレート
を削除する新規特徴登録手段(図1の60)と、前記結
果訂正手段より得られる正解カテゴリと認識候補を用
い、個人辞書の標準特徴が認識に有効に利用された場合
は、当該標準特徴を含むテンプレートの個人辞書内での
順序を新しい方に移動させ、逆に認識に悪影響を及ぼし
た場合は、当該標準特徴を含むテンプレートの個人辞書
内での順序を古い方に移動させる特徴順序変更手段(図
1の70)とを備えている。
【0015】ここで、前記特徴順序変更手段は、テンプ
レートの個人辞書内での物理的な順序を変更しても良い
し、テンプレートの個人辞書内での順序を示す順序番号
を変更しても良い。また、前記新規特徴登録手段が比較
に用いる前記所定のしきい値を学習特徴数に依存させる
ことで、個人辞書の標準特徴作成に用いた特徴数に応じ
て特徴の統合を制御して少数のデータから安定なテンプ
レートを作成できるようにしても良い。
【0016】また本発明の第2の文字認識装置は、個人
辞書にテンプレートの有効利用回数を記憶し、有効利用
回数の大きいテンプレートは削除されにくくする。より
具体的には、標準特徴に加え有効利用回数を記憶する個
人辞書(図10の32)と、最古のテンプレートを削除
する際に、テンプレートの有効利用回数が所定のしきい
値より大きい場合は、当該テンプレートの個人辞書内で
の順序を新しい方に移動させると共に有効利用回数を所
定数減算する新規特徴登録手段(図10の61)と、個
人辞書の標準特徴が有効に利用された場合に、当該標準
特徴を含むテンプレートの個人辞書内での順序を新しい
方に移動させると同時に有効利用回数を加算し、逆に認
識に悪影響を及ぼした場合に、当該標準特徴を含むテン
プレートの個人辞書内での順序を古い方に移動させると
同時に有効利用回数を減算する特徴順序変更手段(図1
0の71)とを有する。
【0017】また本発明の第3の文字認識装置は、認識
特徴を個人辞書に登録する際に、汎用辞書の標準特徴を
用いる。より具体的には、認識特徴を個人辞書に登録す
る際に、汎用辞書における同一カテゴリの標準辞書を、
学習特徴数に応じた比率で加重和して登録する新規特徴
登録手段(図13の62)を有する。
【0018】また本発明の第4の文字認識装置は、照合
の際に、個人辞書のテンプレートに対してペナルティを
加算する。より具体的には、認識特徴と辞書の各標準特
徴との距離値を求める際に、個人辞書の標準特徴に関し
ては、学習特徴数に応じたペナルティを加算する照合手
段(図14の41)を有する。
【0019】なお、本発明では汎用辞書と個人辞書の2
種類の辞書を用いているが、各々の辞書は必ずしも物理
的に分離している必要はなく、汎用辞書部分と個人辞書
部分とを合わせ有する1つの辞書を使用することも可能
である。
【0020】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0021】図1を参照すると、本発明の第1の実施の
形態は、データ入力手段10と、特徴抽出手段20と、
汎用辞書30と、個人辞書31と、照合手段40と、結
果訂正手段50と、表示手段51と、訂正情報入力手段
52と、新規特徴登録手段60と、特徴順序変更手段7
0とから構成されている。
【0022】汎用辞書30は、認識特徴の文字カテゴリ
毎の汎用的な標準特徴が予め記憶されている。標準特徴
は、多数の筆記者により記入された文字データベースを
用い、各データから抽出された認識特徴を文字カテゴリ
毎に平均して作成される。記憶されるテンプレート情報
には、文字カテゴリのコード、テンプレート番号、標準
特徴が含まれる。
【0023】個人辞書31には、初期状態では何も記憶
されていないが、学習により個人的な標準特徴が所定数
(最大記憶テンプレート数)まで順次記憶されていく。
記憶されるテンプレート情報には、文字カテゴリのコー
ド、テンプレート番号、学習特徴数、標準特徴が含まれ
る。ここで、個人辞書31は或る特定の使用者用の辞書
である。使用者は、当該文字認識装置を使用する場合、
自分専用の個人辞書を個人辞書31として文字認識装置
にセットして使用する。汎用辞書30は全ての使用者に
共通なので、各使用者は個人辞書だけを個別に持ってい
れば良い。
【0024】データ入力手段10は、スキャナやタブレ
ット等のデータ入力装置を用い、1文字分の文字データ
を取得する。文字データは、スキャナにより入力された
場合は文字イメージ画像、タブレットにより入力された
場合はストロークの座標点列として記憶される。
【0025】特徴抽出手段20は、データ入力手段10
より得られる文字データから認識特徴を抽出する。文字
認識のための特徴抽出法は、従来より各種のものが提案
されており、従来技術により容易に実現できる。例え
ば、文字イメージ画像をメッシュに分割し、各領域内の
黒画素数の頻度を特徴とする濃淡特徴や、文字イメージ
画像を方向成分に分割し、各方向毎に各領域内の方向成
分の頻度を特徴とする方向特徴などが有名である。例え
ば、このような手法を記載した文献として、「方向パタ
ンマッチング法の改良と手書き漢字認識への応用」(1
990年6月、電子情報通信学会研究会技報、PRU9
0−20)がある。また、文字データがストロークの座
標点列である場合も、文字イメージ画像に変換すること
により同様に扱うことができる。
【0026】照合手段40は、特徴抽出手段20より得
られる入力データの認識特徴を、汎用辞書30および個
人辞書31に記憶されている各標準特徴と順次照合し、
距離値の小さい標準特徴の文字カテゴリの候補を求め
る。距離尺度には、例えばユークリッド距離や市街区距
離が利用できる。ここで、各認識候補は、文字カテゴリ
のコードに加え、照合された標準特徴のテンプレート番
号を含む。
【0027】結果訂正手段50は、表示手段51により
第1候補を表示し、誤認識している場合は、利用者はキ
ーボード等の訂正情報入力手段52により正解カテゴリ
を指定する。
【0028】新規特徴登録手段60は、誤認識した場合
に、結果訂正手段50より得られる正解カテゴリcと特
徴抽出手段20より得られる入力データの認識特徴fi
を個人辞書31に登録する。ここで、個人辞書31にカ
テゴリcのテンプレートが既に存在し、かつ当該テンプ
レートの標準特徴と入力データの認識特徴の距離値が所
定のしきい値より小さい場合は加重和して当該標準特徴
を更新し、それ以外は新たにテンプレートを登録する。
個人辞書31には、登録できるテンプレート数(最大記
憶テンプレート数)が予め設定されており、当該最大記
憶テンプレート数を越える場合は、順序の古いテンプレ
ートを削除する。また、加重和により標準特徴を更新し
た場合は、カテゴリcの他のテンプレートの標準特徴と
距離値を計算し、所定のしきい値より小さい場合は、更
に標準特徴を加重和により統合する。
【0029】特徴順序変更手段70は、結果訂正手段5
0より得られる正解カテゴリcと認識候補を用い、個人
辞書31の標準特徴が認識に有効に利用された場合は、
その標準特徴を含むテンプレートの個人辞書31内での
順序を新しい方に移動させ、逆に認識に悪影響を及ぼし
た場合は、その標準特徴を含むテンプレートの個人辞書
31内での順序を古い方に移動させる。
【0030】次に、図1及び図2のフローチャートを参
照して本実施の形態の全体の動作について詳細に説明す
る。
【0031】まず、データ入力手段10から得られる文
字データは、特徴抽出手段20に供給され、特徴抽出手
段20は、文字データから認識特徴を抽出する(図2の
ステップS1)。次に、照合手段40は、特徴抽出手段
20より得られる入力データの認識特徴fi を、汎用辞
書30および個人辞書31に記憶されている各標準特徴
Si(b)と順次照合し、距離値D(b)の小さい標準特
徴の文字カテゴリの候補を求める(ステップS2)。
【0032】さらに、結果訂正手段50は、表示手段5
1により認識候補の第1候補を表示し(ステップS
3)、誤認識している場合は、利用者はキーボード等の
訂正情報入力手段52により正解カテゴリを指定し、認
識結果を確定する(ステップS4)。
【0033】次に、特徴順序変更手段70は、結果訂正
手段50より得られる正解カテゴリcと認識候補を用
い、個人辞書31の標準特徴が認識に利用された場合
は、当該標準特徴の個人辞書31内での順序を移動させ
る(ステップS5)。ステップS5を図3を参照して、
詳細に説明する。まず、認識候補の第1候補に関して、
照合された標準特徴の特徴番号(テンプレート番号)か
ら、候補が汎用辞書30から得られたか、個人辞書31
から得られたかを判定する(図3のステップS50
0)。個人辞書31から得られた場合は、第1候補のカ
テゴリと正解カテゴリを比較し、正解したかどうかを判
定する(ステップS501)。正解した場合は、その標
準特徴を含むテンプレートの個人辞書31内での順序を
新しい方にPf個移動させ(ステップS502)、逆に
誤認識した場合は、当該テンプレートの個人辞書31内
での順序を古い方にPb個移動させる(ステップS50
3)(移動することにより範囲外に出てしまう場合は、
それぞれ最新、最古の位置に移動させる)。ここで、P
f、Pbは1以上の整数で、予め定められた値である。
【0034】再び図2を参照すると、最後に、新規特徴
登録手段60は、誤認識したかどうかを調べ(図2のス
テップS6)、誤認識した場合は、結果訂正手段50よ
り得られる正解カテゴリcと特徴抽出手段20より得ら
れる入力文字の認識特徴fiを用い、個人辞書31に当
該認識特徴を登録する(ステップS7)。ステップS7
を図4および図5を参照して、詳細に説明する。
【0035】まず、個人辞書において、既に記憶されて
いるカテゴリcのテンプレートを選出する(図4のステ
ップS700)。カテゴリcのテンプレートの数Kが0
かどうかチェックし(ステップS701)、K=0の場
合(存在しない場合)は認識特徴fi を新規テンプレー
トとして登録する(ステップS710へ進む)。
【0036】カテゴリcのテンプレートが既に存在する
場合は、当該テンプレートを学習特徴数の大きい順にソ
ートする(ステップS702)。この時のテンプレート
番号の列をb(k)(k=1, …, K)とする。学習特
徴数の大きい順に、当該テンプレートの標準特徴Si(b
(k))と入力文字の認識特徴fi との距離値D(b)を
計算し、しきい値T(n(b(k))+1)と比較する
(ステップS703,S704)。
【0037】ここで、しきい値T(n)は、特徴を加重
和した場合の学習特徴数nに依存して設定されている。
このしきい値T(n)は、予備実験等により予め設定さ
れるが、一般的に学習特徴数nが小さいときは非常に類
似した特徴のみを平均しないと不安定になるため、T
(n)はnが小さいほど小さく、nが大きいほど大きく
設定される。距離値D(b)がしきい値T(n(b
(k))+1)より小さい場合は、標準特徴Si(b(k))
と認識特徴fiを下式(2)により加重和して当該標準
特徴を更新し(ステップS707)、更にb(k)より
新しいテンプレートをそれぞれ1つずつ古い方にシフト
し、b(k)を最新の位置に移動する(ステップS70
8)。
【0038】 Si(b(k))←{n(b(k))・Si(b(k))+fi }/{n(b(k))+1} n(b(k))←n(b(k))+1 …(2)
【0039】距離値D(b)がしきい値T(n(b
(k))+1)より大きい場合は、次(k+1)のテンプ
レートに関して調べる(ステップS705,S706か
らS704に戻る)。加重和するテンプレートがなかっ
た場合は(k>K)、認識特徴fi を新規テンプレート
として登録する(ステップS710へ進む)。
【0040】記憶されているテンプレート数mが最大記
憶テンプレート数Mに等しい場合は(ステップS71
0)、最古(1番目)のテンプレートを削除し、各テン
プレートを1つずつ古い方に移動し(ステップS71
1)、最新(m番目)の位置に認識特徴fi を新規テン
プレートとして登録する(ステップS713)。m<M
の場合は、mを1加算し(ステップS712)、m番目
の位置に登録する(ステップS713)。
【0041】次に、ステップS707で、認識特徴fi
が加重和で登録され場合、カテゴリcのテンプレートの
統合化を図る。具体的には、加重和されたテンプレート
番号をb0 とすると(図5のステップS750)、b0
を除くカテゴリcのテンプレートが存在する場合(ステ
ップS751,S752)(Kは1減算される)、当該
テンプレートを学習特徴数の大きい順にソートする(ス
テップS753)。この時のテンプレート番号の列をb
(k)(k=1, …, K)とする。学習特徴数の大きい
順に、当該テンプレートの標準特徴Si(b(k))と標準
特徴Si(b0)との距離値D(b)を計算し、しきい値T
(n(b(k))+n(b0))と比較する(ステップS7
54,S755)。
【0042】距離値D(b)がしきい値T(n(b
(k))+n(b0))より小さい場合は、標準特徴Si(b
(k))と認識特徴Si(b0)を加重和する。この時、新し
い位置にあるテンプレートの方を更新する。つまり、b
(k)とb0 の位置を比較し(ステップS760)、b
0 の方が新しい位置にあれば、下式(3)によりb0 の
テンプレートを更新し(ステップS761)、更にb
(k)のテンプレートを削除し(m←m−1)、b
(k)より新しい各テンプレートを1つずつ古い方に移
動する(ステップS762)。
【0043】 Si(b0)←{n(b(k))・Si(b(k))+n(b(k))・Si(b0)}/{n( b(k))+n(b0)} n(b0)←n(b(k))+n(b0) …(3)
【0044】ステップS760において、b(k)の方
が新しい位置にあれば、下式(4)によりb(k)のテ
ンプレートを更新し(ステップS763)、更にb0 の
テンプレートを削除し(m←m−1)、b0 より新しい
各テンプレートを1つずつ古い方に移動し(ステップS
764)、最後にb(k)を新たにb0 とする(ステッ
プS765)。
【0045】 Si(b(k))←{n(b(k))・Si(b(k))+n(b(k))・Si(b0)}/{ n(b(k))+n(b0) n(b(k))←n(b(k))+n(b0) …(4)
【0046】更新した場合は、更にステップS751に
戻り、再度統合化を図る。ステップS755において距
離値D(b)がしきい値T(n(b(k))+n(b0))
より大きい場合は、次(k+1)のテンプレートに関し
て調べる(ステップS756,S757からS755に
戻る)。加重和するテンプレートがなかった場合は(k
>K)、終了する(ステップS757)。
【0047】次に、本実施の形態の効果について説明す
る。
【0048】本実施の形態では、汎用辞書の汎用的な標
準特徴には変更を加えずに学習によって新たな標準特徴
を個人辞書に追加していくので、第三者に対する認識精
度の低下を防止しつつ或る特定の個人に対する認識精度
を向上でき、更に個人辞書に最大記憶テンプレート数を
設定しているため、辞書容量の巨大化を防ぐことができ
る。
【0049】また、本実施の形態では、さらに、誤認識
した場合に全て学習するように構成されているため、学
習の効果を短期間に出すことができる。さらに、認識に
効果的なテンプレートは残し、悪影響を及ぼすテンプレ
ートは順次削除するように構成されているため、認識へ
の悪影響を最小限に抑えることができる。また、特徴を
加重和して登録する場合にはしきい値を学習特徴数によ
り可変にして安定なテンプレートが作成されるように構
成されているため、悪影響のない適切な学習が実現でき
る。
【0050】次に、具体的な実施例を用いて本実施の形
態の動作を説明する。
【0051】汎用辞書30には、100個以下のテンプ
レートが、個人辞書31には、図6に示すような5個の
テンプレートが記憶されているとする(最大記憶テンプ
レート数M=5、標準特徴は図示していない)(漢字認
識の場合は、実際には、汎用辞書のテンプレート数は4
000個程度、個人辞書のテンプレート数は200個程
度になる)。テンプレート番号は、100未満は汎用辞
書30のテンプレート番号、100以上は個人辞書31
のテンプレート番号を表す。また、各パラメータを以下
のように設定しておく。Pf=2,Pb=2、T(n)
=100 ・n。
【0052】(例1)データ入力手段10より文字
「あ」が入力された時に、特徴抽出手段20は認識特徴
を抽出し(ステップS1)、照合手段40は、認識特徴
と汎用辞書30および個人辞書31に記憶されている各
標準特徴との各距離値を計算し、距離値の小さい候補を
選出することによって図7(a)に示すような認識候補
を得たとする(ステップS2)。この場合、認識結果は
正解であるので、結果訂正手段50では、訂正なしに確
定される(ステップS3,S4)。特徴順序変更手段7
0は、第1候補のテンプレート番号が100以上である
ことから個人辞書のテンプレートが利用されたことを検
出し(ステップS500)、更に結果訂正手段50にお
いて確定された正解カテゴリ「あ」と第1候補のカテゴ
リ「あ」が同一であることから第1候補が正解であった
と判定する(ステップS501)。正解なので、第1候
補のテンプレート番号「150」に対応する個人辞書内
のテンプレート番号「150」のテンプレート(図6で
は2番目に記憶されている)を、図8(a)のように順
序の新しい方に2個(Pf個)移動させ、4番目に格納
する。この時、図6で3番目と4番目に記憶されていた
「日」と「あ」(テンプレート番号「153」)はそれ
ぞれ2番目と3番目にシフトして格納される(ステップ
S502)。新規特徴登録手段60は、認識結果が正解
であったことを検出し終了する(ステップS6)。
【0053】(例2)データ入力手段10より文字
「お」が入力された時に、照合手段40は図7(a)に
示すような認識候補を得たとする(ステップS2)。こ
の場合、認識結果は誤認識であるので、結果訂正手段5
0では、第2候補の「お」を選択することにより認識結
果が訂正される(ステップS3,S4)。特徴順序変更
手段70は、第1候補のテンプレート番号が100以上
であることから個人辞書のテンプレートが利用されたこ
とを検出し(ステップS500)、更に結果訂正手段5
0において確定された正解カテゴリ「お」と第1候補の
カテゴリ「あ」が異なることから第1候補が誤認識であ
ったと判定する(ステップS501)。誤認識なので、
第1候補のテンプレート番号が「150」であることか
ら、個人辞書内のテンプレート番号「150」のテンプ
レート(図6では2番目に記憶されている)を、図8
(b)のように順序の古い方に移動させる。この時、P
b =2であることから本来2個移動させるが、1番目ま
でしか移動できないので1番目に格納する。この時、1
番目に記憶されていた図6の「い」は2番目にシフトし
て格納される(ステップS503)。
【0054】次に新規特徴登録手段60は、認識結果が
誤認識であったことを検出し(ステップS6)、特徴抽
出手段20より得られる認識特徴を個人辞書31に登録
する(ステップS7)。この時、個人辞書における
「お」のテンプレートを探索し(ステップS700)、
「お」のテンプレートが存在しないことを検出し(ステ
ップS701)、新規テンプレートとして登録するため
ステップS710へ進む。現在の記憶テンプレート数は
最大記憶テンプレート数M=5と等しいことを検出し
(ステップS710)、最古(1番目)のテンプレート
(図8(b)ではテンプレート番号150の「あ」)を
削除し、2番目から5番目のテンプレートを図8(c)
のようにそれぞれ1番目から4番目にシフトして格納し
(ステップS711)、最新の位置(5番目)に認識特
徴をカテゴリ「お」として登録する(ステップS71
3)。
【0055】(例3)データ入力手段10より文字
「あ」が入力された時に、照合手段40は図7(b)に
示すような認識候補を得たとする(ステップS2)。こ
の場合、認識結果は誤認識であるので、結果訂正手段5
0では、第2候補の「あ」を選択することにより認識結
果が訂正される(ステップS3,S4)。特徴順序変更
手段70は、第1候補のテンプレート番号が100未満
であることから汎用辞書のテンプレートが利用されたこ
とを検出し(ステップS500)、何も実行しない。新
規特徴登録手段60は、認識結果が誤認識であったこと
検出し(ステップS6)、特徴抽出手段20より得られ
る認識特徴を個人辞書31に登録する(ステップS
7)。この時、図6に示す個人辞書における「あ」のテ
ンプレートを探索し(ステップS700)、「あ」のテ
ンプレートが2個(テンプレート番号「150」と「1
53」)存在することを検出し(ステップS701)、
2個のテンプレート番号を学習特徴数の大きい順にソー
トする(ステップS702)。n(150)=2、n
(153)=1であることから、b(1)=150、b
(2)=153となる。
【0056】ここで、認識特徴fi と標準特徴Si(b
(k))の距離値D(b)を順次計算し、しきい値T
(n)と比較すると(ステップS703〜S706)、
例えばD(150)=400の時、D(150)>T(n(150)
+1)=T(3)=300、D(153)=350の時、D
(153)>T(n(153)+1)=T(2)=200とな
り、加重和するテンプレートが存在しないため、新規テ
ンプレートとして登録するためステップS710へ進
む。現在の記憶テンプレート数は最大記憶テンプレート
数M=5と等しいので(ステップS710)、1番目の
テンプレート(図6では「い」)を削除し、2番目から
5番目のテンプレートを図9(a)のようにそれぞれ1
番目から4番目にシフトして格納し(ステップS71
1)、5番目に認識特徴をカテゴリ「あ」(テンプレー
ト番号「155」)として登録する(ステップS71
3)。
【0057】もし、ステップS704で、例えばD(15
0)=250の時、D(150)<T(n(150)+1)とな
り、「150」のテンプレートが加重和により更新され
(ステップS707)、更に図6で3番目から5番目の
テンプレートを図9(b)のようにそれぞれ2番目から
4番目にシフトして格納し、5番目に「150」のテン
プレートを移動する(ステップS708)。次に、図9
(b)の状態で、「150」のテンプレートを除いて個
人辞書における「あ」のテンプレートを探索し(ステッ
プS751)、「あ」のテンプレートが1個(テンプレ
ート番号「153」)存在することを検出し(ステップ
S752)、b(1)=153となる(ステップS75
3)。ここで、標準特徴Si(150)と標準特徴Si(b
(k))の距離値D(b)を計算し、例えばD(153)=3
50の時、D(153)<T(n(153)+1)=T(4)=
400となり、「153」より「150」のテンプレー
トの方が最新の位置にいるので(ステップS760)、
「150」のテンプレートが加重和により更新され(ス
テップS761)、更に3番目の「153」のテンプレ
ートが削除され、4番目と5番目のテンプレートを図9
(c)のようにそれぞれ3番目と4番目にシフトして格
納する(ステップS762)。
【0058】次に、本発明の第2の実施の形態について
図面を参照して詳細に説明する。
【0059】図10を参照すると、本発明の第2の実施
の形態は、データ入力手段10と、特徴抽出手段20
と、汎用辞書30と、個人辞書32と、照合手段40
と、結果訂正手段50と、表示手段51と、訂正情報入
力手段52と、新規特徴登録手段61と、特徴順序変更
手段71とから構成されている。
【0060】データ入力手段10と、特徴抽出手段20
と、汎用辞書30と、照合手段40と、結果訂正手段5
0と、表示手段51と、訂正情報入力手段52は、図1
に示した第1の実施の形態の文字認識装置におけるもの
と同一である。
【0061】第1の実施の形態の文字認識装置と異なる
点は、個人辞書32において、有効利用回数も記憶され
る点にある。
【0062】新規特徴登録手段61は、第1の実施の形
態の文字認識装置の動作に加え、最古のテンプレートを
削除する際に、テンプレートの有効利用回数が所定のし
きい値(R)以上の場合は、そのテンプレートを新しい
方に(Pf 個)移動させると共に有効利用回数を所定数
(Q)減算する。
【0063】特徴順序変更手段71は、結果訂正手段5
0より得られる正解カテゴリcと認識候補を用い、個人
辞書32の標準特徴が有効に利用された場合は、その標
準特徴を含むテンプレートの個人辞書32内での順序を
新しい方に移動させると同時に有効利用回数を1加算
し、逆に認識に悪影響を及ぼした場合は、その標準特徴
を含むテンプレートの個人辞書32内での順序を古い方
に移動させると同時に有効利用回数を1減算する。
【0064】次に、本実施の形態の効果について説明す
る。
【0065】本実施の形態では、有効利用回数を記憶す
るように構成されているため、利用頻度の高いテンプレ
ートは削除されにくくなり、学習の効果を持続させるこ
とができる。
【0066】次に、具体的な実施例を用いて本実施の形
態の動作を説明する。
【0067】個人辞書32には、図11に示すような5
個のテンプレートが記憶されているとする(最大記憶テ
ンプレート数M=5)また、各パラメータを以下のよう
に設定しておく。R=10,Q=5。
【0068】データ入力手段10より文字「あ」が入力
された時に、照合手段40は図7(b)に示すような認
識候補を得たとする(ステップS2)。この場合、認識
結果は誤認識であるので、結果訂正手段50では、第2
候補の「あ」を選択することにより認識結果が訂正され
る(ステップS3,S4)。特徴順序変更手段71は、
第1候補のテンプレート番号が100未満であることか
ら汎用辞書30のテンプレートが利用されたことを検出
し(ステップS500)、何も実行しない。新規特徴登
録手段61は、認識結果が誤認識であったことを検出し
(ステップS6)、特徴抽出手段20より得られる認識
特徴を個人辞書32に登録する(ステップS7)。この
時、個人辞書32における「あ」のテンプレートを探索
し(ステップS700)、「あ」のテンプレートが2個
(テンプレート番号「150」と「153」)存在する
ことを検出し(ステップS701)、2個のテンプレー
ト番号を学習特徴数の大きい順にソートする(ステップ
S702)。n(150)=2、n(153)=1であ
ることから、b(1)=150、b(2)=153とな
る。ここで、認識特徴fi と標準特徴Si(b(k))の距
離値D(b)を順次計算し、しきい値T(n)と比較す
ると(ステップS703〜S706)、例えばD(150)
=400の時、D(150)>T(n(150)+1)=T
(3)=300、D(153)=350の時、D(153)>T
(n(153)+1)=T(2)=200となり、加重和す
るテンプレートが存在しないため、新規テンプレートと
して登録するためステップS710へ進む。現在の記憶
テンプレート数は最大記憶テンプレート数M=5と等し
いので(ステップS710)、最古のテンプレートを削
除する(ステップS711)が、1番目の「い」の有効
利用回数10がR以上なので、図12(a)のように、
「い」を2個(Pf 個)新しい方に移動し、有効利用回
数を5(Q)減算する。ここで、2番目と3番目のテン
プレートはそれぞれ1番目と2番目にシフトして格納す
る。1番目の「あ」の有効利用回数はしきい値R以下な
ので「あ」を削除し、2番目から5番目のテンプレート
を図12(b)のようにそれぞれ1番目から4番目にシ
フトして格納し、5番目に認識特徴をカテゴリ「あ」と
して登録する(ステップS713)。
【0069】次に、本発明の第3の実施の形態について
図面を参照して詳細に説明する。
【0070】図13を参照すると、本発明の第3の実施
の形態は、データ入力手段10と、特徴抽出手段20
と、汎用辞書30と、個人辞書31と、照合手段40
と、結果訂正手段50と、表示手段51と、訂正情報入
力手段52と、新規特徴登録手段62と、特徴順序変更
手段70とから構成されている。
【0071】データ入力手段10と、特徴抽出手段20
と、汎用辞書30と、個人辞書31と、照合手段40
と、結果訂正手段50と、表示手段51と、訂正情報入
力手段52と、特徴順序変更手段70は、図1に示した
第1の実施の形態の文字認識装置におけるものと同一で
ある。
【0072】新規特徴登録手段62は、第1の実施の形
態の文字認識装置において、カテゴリcの認識特徴を個
人辞書31に登録する際に汎用辞書30のカテゴリcの
標準辞書と加重和して登録する点にある。その際、加重
和の重みは学習特徴数に応じて制御される。
【0073】図4のステップS713において、認識特
徴fi を新規に登録する場合は、汎用辞書30のカテゴ
リcの標準辞書gi を用いて、下式(5)により合成特
徴Si を生成し登録する。
【0074】 Si←α(1)・fi+{1−α(1)}・gi …(5) ここで、α(n)は学習特徴数nに依存したパラメータ
(0<α(n)≦1)である。一般的に、学習特徴数n
が小さい時は汎用辞書30の寄与度を高くするためにα
(n)を小さくし、nが大きくなるとα(n)も大きく
なるように設定する。
【0075】図4のステップS707において、認識特
徴fi を加重和して標準特徴Si(b(k))を更新する場
合は、下式(6)により求めることができる。 Si(b(k))←α(n+1)・f'i+{1−α(n+1)}・gi 但し、f'i={n(b(k))・f''i +fi }/{n(b(k))+1} f''i ={Si(b(k))−{1−α(n)・gi }}/α(n) n(b(k)) ← n(b(k))+1 …(6)
【0076】次に、本実施の形態の効果について説明す
る。
【0077】本実施の形態では、認識特徴を汎用辞書の
標準辞書と加重和して登録するように構成されているた
め、安定な辞書が作成され、高精度に認識できる。
【0078】次に、本発明の第4の実施の形態について
図面を参照して詳細に説明する。
【0079】図14を参照すると、本発明の第4の実施
の形態は、データ入力手段10と、特徴抽出手段20
と、汎用辞書30と、個人辞書31と、照合手段41
と、結果訂正手段50と、表示手段51と、訂正情報入
力手段52と、新規特徴登録手段60と、特徴順序変更
手段70とから構成されている。
【0080】データ入力手段10と、特徴抽出手段20
と、汎用辞書30と、個人辞書31と、結果訂正手段5
0と、表示手段51と、訂正情報入力手段52と、新規
特徴登録手段60と、特徴順序変更手段70は、図1に
示した第1の実施の形態の文字認識装置におけるものと
同一である。
【0081】照合手段41は、特徴抽出手段20より得
られる入力文字の認識特徴を、汎用辞書30および個人
辞書31に記憶されている各標準特徴と順次照合し、距
離値Dの小さい標準特徴の文字カテゴリの候補を求め
る。ここで、個人辞書31の標準特徴Si(b)と照合す
る場合は、学習特徴数n(b)によって距離値D(b)
に下式(7)によりペナルティを加える。 D(b)← D(b)+E(n(b))…(7)
【0082】E(n)は標準特徴の安定性を反映した値
であり、予め設定されている。一般的に、学習特徴数n
が小さいときは標準特徴が不安定であるのでE(n)は
大きくし、nが大きくなるにつれてE(n)は小さくな
るように設定される。
【0083】次に、本実施の形態の効果について説明す
る。
【0084】本実施の形態では、個人辞書を用いた照合
処理において、学習特徴数に応じたペナルティを加える
ように構成されているため、不安定な標準特徴の悪影響
を抑え、高精度に認識できる。
【0085】次に、本発明の第5の実施の形態について
図面を参照して詳細に説明する。
【0086】図15を参照すると、本発明の第5の実施
の形態は、第1乃至第4の実施の形態と同様なデータ入
力手段10、表示手段51および訂正情報入力手段52
に接続されたコンピュータ80で構成されている。コン
ピュータ80はMPU等の処理装置81とこれに接続さ
れたメモリ82とを含む。また、記録媒体83は、CD
−ROM、磁気ディスク、半導体メモリ等の機械読み取
り可能な記録媒体であり、文字認識制御プログラムが記
録されている。記録媒体83に記録された文字認識制御
プログラムは、コンピュータ80の立ち上げ時などに処
理装置81によって読み取られ、処理装置81の動作を
制御することにより、前述した第1の実施の形態にあっ
ては、特徴抽出手段20、照合手段40、結果訂正手段
50、新規特徴登録手段60および特徴順序変更手段7
0を処理装置81上に生成すると共に、メモリ82上に
汎用辞書30および個人辞書31をロードする。また、
前述した第2の実施の形態にあっては、特徴抽出手段2
0、照合手段40、結果訂正手段50、新規特徴登録手
段61および特徴順序変更手段71を処理装置81上に
生成すると共に、メモリ82上に汎用辞書30および個
人辞書32をロードする。また、前述した第3の実施の
形態にあっては、特徴抽出手段20、照合手段40、結
果訂正手段50、新規特徴登録手段62および特徴順序
変更手段70を処理装置81上に生成すると共に、メモ
リ82上に汎用辞書30および個人辞書31をロードす
る。また、前述した第4の実施の形態にあっては、特徴
抽出手段20、照合手段41、結果訂正手段50、新規
特徴登録手段60および特徴順序変更手段70を処理装
置81上に生成すると共に、メモリ82上に汎用辞書3
0および個人辞書31をロードする。
【0087】以上、本発明の実施例について説明した。
新規特徴登録手段において、新規に認識特徴を登録する
のは誤認識した場合のみで説明したが、正解の場合にも
学習してもよい。例えば、正解であったとしても、第1
候補の距離値と第2候補の距離値が近ければ、次回は誤
認識する可能性があるので、学習の効果はある。また、
特徴順序変更手段においてテンプレートを移動させる場
合も、第1候補に個人辞書が使用された場合のみ説明し
たが、第2候補以降に使用された場合にも学習してもよ
い。また、新規特徴登録手段においてテンプレートを統
合する場合は、2つのテンプレート毎に順に統合を図っ
たが、3つ以上のテンプレートに対し同時に統合を検討
してもよい。更に、個人辞書に登録できるテンプレート
数を最大記憶テンプレート数に制限したが、各テンプレ
ートの容量が一定でない場合は辞書容量により制限して
もよい。また、特徴順序変更手段において個人辞書内で
テンプレートの順序を変更する場合は、個人辞書内での
物理的な順序を変更したが、テンプレートに個人辞書内
での順序を示す順序番号を付与し、物理的な順序を変更
せずに順序番号を変更することで、各テンプレートの個
人辞書内での順序を管理するようにしても良い。
【0088】
【発明の効果】以上説明したように本発明によれば以下
のような種々の効果が得られる。
【0089】学習機能を停止させることなく辞書容量の
巨大化を防ぐことができる。その理由は、個人辞書への
テンプレートの登録最大数に制限を設けると共に現在登
録されているテンプレートの活用状況を管理し、新たな
テンプレートが登録できなくなったとき、有効に活用さ
れていない個人用テンプレートを削除してから登録する
ためである。
【0090】学習の効果が短期間に出て、かつ悪影響の
少ない適切な学習が実現できる。その理由は、誤認識し
た場合に全て学習するように構成されているためであ
る。更に、認識に効果的なテンプレートは残し、悪影響
を及ぼすテンプレートは順次削除するように構成されて
いるためである。また、特徴を加重和して登録する場合
にはしきい値を学習特徴数により可変にし、安定なテン
プレートが作成されるように構成されているためであ
る。また、有効利用回数を記憶するように構成し、利用
頻度の高いテンプレートは削除されにくくしているため
である。また、認識特徴を汎用辞書の標準辞書と加重和
して登録するように構成されているためである。また、
個人辞書を用いた照合処理において、学習特徴数に応じ
たペナルティを加えるように構成し、不安定な標準特徴
の悪影響を抑えているためである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の構成例を示すブロ
ック図である。
【図2】第1の実施の形態の動作を示す流れ図である。
【図3】第1の実施の形態の特徴順序変更の動作を示す
流れ図である。
【図4】第1の実施の形態の新規特徴登録の動作を示す
流れ図である。
【図5】第1の実施の形態のテンプレート統合の動作を
示す流れ図である。
【図6】第1の実施の形態の個人辞書の具体例を示す図
である。
【図7】第1の実施の形態の認識候補の具体例を示す図
である。
【図8】第1の実施の形態の個人辞書の学習の具体例を
示す図である。
【図9】第1の実施の形態の個人辞書の学習の具体例を
示す図である。
【図10】本発明の第2の実施の形態の構成例を示すブ
ロック図である。
【図11】第2の実施の形態の個人辞書の具体例を示す
図である。
【図12】第2の実施の形態の個人辞書の学習の具体例
を示す図である。
【図13】本発明の第3の実施の形態の構成例を示すブ
ロック図である。
【図14】本発明の第4の実施の形態の構成例を示すブ
ロック図である。
【図15】本発明の第5の実施の形態の構成例を示すブ
ロック図である。
【図16】第1の従来技術の実施の形態の構成を示すブ
ロック図である。
【図17】第2の従来技術の実施の形態の構成を示すブ
ロック図である。
【符号の説明】
10…データ入力手段 20…特徴抽出手段 30…汎用辞書 31、32…個人辞書 40、41…照合手段 50…結果訂正手段 51…表示手段 52…訂正情報入力手段 60、61、62…新規特徴登録手段 70、71…特徴順序変更手段

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 認識対象文字の特徴とカテゴリ毎に予め
    辞書に記憶された標準特徴とを照合し、認識対象文字と
    の間の距離が最も短いカテゴリを決定する文字認識装置
    であって、文字カテゴリ毎の汎用的な標準特徴には変更
    を加えずに学習によって新たな標準特徴を辞書に追加し
    ていく方式の自動学習機能を有する文字認識装置におい
    て、個人用テンプレートの登録最大数に制限を設けると
    共に現在登録されている個人用テンプレートの活用状況
    を管理し、新たな個人用テンプレートが登録できなくな
    ったとき、有効に活用されていない個人用テンプレート
    を削除してから登録することを特徴とする文字認識装
    置。
  2. 【請求項2】 入力文字データを取得するデータ入力手
    段と、 前記データ入力手段より得られる文字データから認識特
    徴を抽出する特徴抽出手段と、 認識特徴の文字カテゴリ毎の汎用的な標準特徴が予め記
    憶されている汎用辞書と、 学習により個人的な標準特徴が所定数(最大記憶テンプ
    レート数)まで順次記憶されていく個人辞書と、 前記特徴抽出手段より得られる認識特徴を、前記汎用辞
    書および前記個人辞書に記憶されている各標準特徴と順
    次照合し、距離値の小さい標準特徴の文字カテゴリおよ
    びテンプレート番号を出力する照合手段と、 表示手段により認識結果を表示し、訂正情報入力手段に
    より正解カテゴリの指定を受け、認識結果を訂正および
    確定させる結果訂正手段と、 誤認識した場合に、前記結果訂正手段より得られる正解
    カテゴリと前記特徴抽出手段より得られる認識特徴を前
    記個人辞書に登録する際に、正解カテゴリと同じテンプ
    レートが既に存在する場合は、各標準特徴間の距離値を
    所定のしきい値と比較し、小さい場合は加重和して当該
    標準特徴を更新し、それ以外は新たにテンプレートを登
    録し、更にテンプレート数が最大記憶テンプレート数を
    越える場合は、順序の古いテンプレートを削除する新規
    特徴登録手段と、 前記結果訂正手段より得られる正解カテゴリと認識候補
    を用い、個人辞書の標準特徴が認識に有効に利用された
    場合は、当該標準特徴を含むテンプレートの個人辞書内
    での順序を新しい方に移動させ、逆に認識に悪影響を及
    ぼした場合は、当該標準特徴を含むテンプレートの個人
    辞書内での順序を古い方に移動させる特徴順序変更手段
    とを備えたことを特徴とする文字認識装置。
  3. 【請求項3】 前記特徴順序変更手段は、テンプレート
    の個人辞書内での物理的な順序を変更することを特徴と
    する請求項2記載の文字認識装置。
  4. 【請求項4】 前記特徴順序変更手段は、テンプレート
    の個人辞書内での順序を示す順序番号を変更することを
    特徴とする請求項2記載の文字認識装置。
  5. 【請求項5】 前記新規特徴登録手段が比較に用いる前
    記所定のしきい値は、学習特徴数に依存することを特徴
    とする請求項3または4記載の文字認識装置。
  6. 【請求項6】 前記個人辞書は、標準特徴に加え有効利
    用回数を記憶し、 前記新規特徴登録手段は、最古のテンプレートを削除す
    る際に、テンプレートの有効利用回数が所定のしきい値
    より大きい場合は、当該テンプレートの個人辞書内での
    順序を新しい方に移動させると共に有効利用回数を所定
    数減算し、 前記特徴順序変更手段は、個人辞書の標準特徴が有効に
    利用された場合に、当該標準特徴を含むテンプレートの
    個人辞書内での順序を新しい方に移動させると同時に有
    効利用回数を加算し、逆に認識に悪影響を及ぼした場合
    に、当該標準特徴を含むテンプレートの個人辞書内での
    順序を古い方に移動させると同時に有効利用回数を減算
    することを特徴とする請求項5記載の文字認識装置。
  7. 【請求項7】 前記新規特徴登録手段は、認識特徴を個
    人辞書に登録する際に、汎用辞書における同一カテゴリ
    の標準特徴と、学習特徴数に応じた比率で加重和して登
    録することを特徴とする請求項5または6記載の文字認
    識装置。
  8. 【請求項8】 前記照合手段は、認識特徴と辞書の各標
    準特徴との距離値を求める際に、個人辞書の標準特徴に
    関しては、学習特徴数に応じたペナルティを加算するこ
    とを特徴とする請求項5、6または7記載の文字認識装
    置。
  9. 【請求項9】 データ入力手段、表示手段および訂正情
    報入力手段に接続されたコンピュータを文字認識装置と
    して機能させるプログラムを記録した記録媒体であっ
    て、前記コンピュータを、 前記データ入力手段より得られる文字データから認識特
    徴を抽出する特徴抽出手段、 認識特徴の文字カテゴリ毎の汎用的な標準特徴が予め記
    憶されている汎用辞書、 学習により個人的な標準特徴が所定数(最大記憶テンプ
    レート数)まで順次記憶されていく個人辞書、 前記特徴抽出手段より得られる認識特徴を、前記汎用辞
    書および前記個人辞書に記憶されている各標準特徴と順
    次照合し、距離値の小さい標準特徴の文字カテゴリおよ
    びテンプレート番号を出力する照合手段、 前記表示手段により認識結果を表示し、前記訂正情報入
    力手段により正解カテゴリの指定を受け、認識結果を訂
    正および確定させる結果訂正手段、 誤認識した場合に、前記結果訂正手段より得られる正解
    カテゴリと前記特徴抽出手段より得られる認識特徴を前
    記個人辞書に登録する際に、正解カテゴリと同じテンプ
    レートが既に存在する場合は、各標準特徴間の距離値を
    学習特徴数に依存した所定のしきい値と比較し、小さい
    場合は加重和して当該標準特徴を更新し、それ以外は新
    たにテンプレートを登録し、更にテンプレート数が最大
    記憶テンプレート数を越える場合は、順序の古いテンプ
    レートを削除する新規特徴登録手段、 前記結果訂正手段より得られる正解カテゴリと認識候補
    を用い、個人辞書の標準特徴が認識に有効に利用された
    場合は、当該標準特徴を含むテンプレートの個人辞書内
    での順序を新しい方に移動させ、逆に認識に悪影響を及
    ぼした場合は、当該標準特徴を含むテンプレートの個人
    辞書内での順序を古い方に移動させる特徴順序変更手
    段、 として機能させるプログラムを記憶したコンピュータ可
    読記録媒体。
JP20002299A 1999-07-14 1999-07-14 文字認識装置およびコンピュータ可読記録媒体 Expired - Fee Related JP3428512B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20002299A JP3428512B2 (ja) 1999-07-14 1999-07-14 文字認識装置およびコンピュータ可読記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20002299A JP3428512B2 (ja) 1999-07-14 1999-07-14 文字認識装置およびコンピュータ可読記録媒体

Publications (2)

Publication Number Publication Date
JP2001028035A true JP2001028035A (ja) 2001-01-30
JP3428512B2 JP3428512B2 (ja) 2003-07-22

Family

ID=16417519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20002299A Expired - Fee Related JP3428512B2 (ja) 1999-07-14 1999-07-14 文字認識装置およびコンピュータ可読記録媒体

Country Status (1)

Country Link
JP (1) JP3428512B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008056767A1 (fr) * 2006-11-10 2008-05-15 Kabushiki Kaisha Kawai Gakki Seisakusho Dispositif et programme de reconnaissance de musique
JP2008123182A (ja) * 2006-11-10 2008-05-29 Kawai Musical Instr Mfg Co Ltd 楽譜認識装置およびプログラム
JP2008123181A (ja) * 2006-11-10 2008-05-29 Kawai Musical Instr Mfg Co Ltd 楽譜認識装置およびプログラム
JP2010102742A (ja) * 2003-05-21 2010-05-06 Microsoft Corp 適応的手書き文字認識のためのシステムおよび方法
JP2014016786A (ja) * 2012-07-09 2014-01-30 Canon Inc 画像処理装置、画像処理方法、及びプログラム

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59794A (ja) * 1982-06-28 1984-01-05 Fujitsu Ltd 文字認識装置
JPS59106085A (ja) * 1982-12-10 1984-06-19 Fujitsu Ltd 認識装置の辞書更新方法
JPS59186075A (ja) * 1983-04-06 1984-10-22 Ricoh Co Ltd パタ−ン認識装置
JPH0749928A (ja) * 1993-08-05 1995-02-21 Fujitsu Ltd 光学的文字読み取り装置
JPH0749951A (ja) * 1993-08-06 1995-02-21 Sharp Corp パターン認識装置
JPH08315076A (ja) * 1995-05-18 1996-11-29 Matsushita Electric Ind Co Ltd 学習内容削除機能付手書き文字認識装置
JPH0935007A (ja) * 1995-07-18 1997-02-07 Matsushita Electric Ind Co Ltd 手書き文字・図形認識装置
JPH0950491A (ja) * 1995-08-10 1997-02-18 Nippon Telegr & Teleph Corp <Ntt> オンライン手書き文字認識方法および装置
JPH11110487A (ja) * 1997-09-30 1999-04-23 Sharp Corp 文字認識の学習方法
JPH11143992A (ja) * 1997-11-07 1999-05-28 Hitachi Ltd 情報処理装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59794A (ja) * 1982-06-28 1984-01-05 Fujitsu Ltd 文字認識装置
JPS59106085A (ja) * 1982-12-10 1984-06-19 Fujitsu Ltd 認識装置の辞書更新方法
JPS59186075A (ja) * 1983-04-06 1984-10-22 Ricoh Co Ltd パタ−ン認識装置
JPH0749928A (ja) * 1993-08-05 1995-02-21 Fujitsu Ltd 光学的文字読み取り装置
JPH0749951A (ja) * 1993-08-06 1995-02-21 Sharp Corp パターン認識装置
JPH08315076A (ja) * 1995-05-18 1996-11-29 Matsushita Electric Ind Co Ltd 学習内容削除機能付手書き文字認識装置
JPH0935007A (ja) * 1995-07-18 1997-02-07 Matsushita Electric Ind Co Ltd 手書き文字・図形認識装置
JPH0950491A (ja) * 1995-08-10 1997-02-18 Nippon Telegr & Teleph Corp <Ntt> オンライン手書き文字認識方法および装置
JPH11110487A (ja) * 1997-09-30 1999-04-23 Sharp Corp 文字認識の学習方法
JPH11143992A (ja) * 1997-11-07 1999-05-28 Hitachi Ltd 情報処理装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010102742A (ja) * 2003-05-21 2010-05-06 Microsoft Corp 適応的手書き文字認識のためのシステムおよび方法
WO2008056767A1 (fr) * 2006-11-10 2008-05-15 Kabushiki Kaisha Kawai Gakki Seisakusho Dispositif et programme de reconnaissance de musique
JP2008123182A (ja) * 2006-11-10 2008-05-29 Kawai Musical Instr Mfg Co Ltd 楽譜認識装置およびプログラム
JP2008123181A (ja) * 2006-11-10 2008-05-29 Kawai Musical Instr Mfg Co Ltd 楽譜認識装置およびプログラム
JP2014016786A (ja) * 2012-07-09 2014-01-30 Canon Inc 画像処理装置、画像処理方法、及びプログラム
US9563823B2 (en) 2012-07-09 2017-02-07 Canon Kabushiki Kaisha Apparatus and method for managing an object extracted from image data

Also Published As

Publication number Publication date
JP3428512B2 (ja) 2003-07-22

Similar Documents

Publication Publication Date Title
US7885464B2 (en) Apparatus, method, and program for handwriting recognition
US7817857B2 (en) Combiner for improving handwriting recognition
JPH05217025A (ja) オンライン手書き文字認識装置および方法
JP2000099632A (ja) 検索装置、検索方法及び検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3428512B2 (ja) 文字認識装置およびコンピュータ可読記録媒体
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
JP2001184509A (ja) パターン認識装置及び方法並びに記録媒体
JP2022103676A (ja) 情報処理装置、情報処理方法、プログラム
JP2000137732A (ja) 検索装置、検索方法及び検索プログラムを記録したコンピュ―タ読み取り可能な記録媒体
JP2002063548A (ja) 手書き文字認識方法
JP2013025390A (ja) 手書き入力方法
JP6320089B2 (ja) 認識装置、認識方法およびプログラム
JP2007272769A (ja) 指紋照合装置、指紋照合方法
JP2010237909A (ja) 知識補正プログラム、知識補正装置および知識補正方法
JP2894305B2 (ja) 認識装置の候補修正方式
Hu et al. A model-based segmentation method for handwritten numeral strings
JP2000123170A (ja) 署名照合方法及び署名照合用プログラムを記録した記録媒体
JP2002163608A (ja) 手書き文字認識装置
JP7404625B2 (ja) 情報処理装置、及びプログラム
JP7401202B2 (ja) 画像処理装置、その制御方法、及びプログラム
JP3930174B2 (ja) 文字認識方法および文字認識装置
WO2021192818A1 (ja) 情報処理装置、情報処理方法、プログラムおよび順序情報
JP3033554B2 (ja) 文字認識装置
JP3164962B2 (ja) 文字認識辞書作成方法および装置
JP3897999B2 (ja) 手書き文字認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090516

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100516

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140516

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees