JPH09223197A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH09223197A
JPH09223197A JP8028104A JP2810496A JPH09223197A JP H09223197 A JPH09223197 A JP H09223197A JP 8028104 A JP8028104 A JP 8028104A JP 2810496 A JP2810496 A JP 2810496A JP H09223197 A JPH09223197 A JP H09223197A
Authority
JP
Japan
Prior art keywords
character
template
dictionary
category
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8028104A
Other languages
English (en)
Inventor
東善 ▲裴▼
Touzen Hai
Seiji Takahashi
清治 高橋
Yasuhiro Ura
康裕 浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP8028104A priority Critical patent/JPH09223197A/ja
Publication of JPH09223197A publication Critical patent/JPH09223197A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 本発明は文字認識装置に関し、同一筆者の文
字を多数集めることなく、認識率を向上させる。 【解決手段】 辞書中の特定のカテゴリの文字に対し
て、新たなテンプレートを登録する際、その文字を変形
させた複数の文字パターンを作成し、該作成した文字パ
ターンより、文字認識の為の特徴パラメータの抽出を行
い、該抽出した特徴パラメータ値の平均値を該カテゴリ
の文字のテンプレートとして登録する。又、該登録する
テンプレートを作成するのに、標準辞書を作成したとき
の学習文字パターンの中から、登録文字の特徴パラメー
タ値と類似の特徴パラメータ値を持つ文字パターンを選
択し、該選択された文字パターンの特徴パラメータ値の
平均値を作成して登録する。又、登録するテンプレート
の特徴パラメータ値と標準テンプレートの特徴パラメー
タ値との距離を計算し、最も距離が近い他のカテゴリの
文字を求め、その距離の大きさにより、該カテゴリの文
字の認識率の劣化の程度を予測してユーザに提示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、読み取りが困難な
ユーザ文字の特徴パラメータ値を、各カテゴリの文字に
対応したテンプレートとして追加登録する手段を有する
文字認識装置に関する。
【0002】
【従来の技術】図7は、従来の文字認識装置を説明する
図であり、図7(a) は構成例を示し、図7(b1),(b2)
は、先行技術の原理を説明する図であり、は、既存の
テンプレートの特徴パラメータを示し、は登録するテ
ンプレートの特徴パラメータを示している。
【0003】先ず、入力部 1で得られた文字画像に対し
て、特徴抽出部 2で特徴パラメータ(方向コードと、そ
の数等)の抽出が行われ、その特徴パラメータ値が照合
部 3で、予め用意されている認識の辞書 5の各カテゴリ
に対応した特徴パラメータ値と照合され、その結果を表
示部 4に表示する。
【0004】
【発明が解決しようとする課題】
(1) 従来の登録機能のある文字認識装置においては、登
録したい文字 (カテゴリ) の特徴パラメータをそのまま
辞書 5に付加することが多く、そのため同一筆者の文字
変動にも対応できず、登録したにも係わらず、その効果
が不十分であった。これは、同一筆者からのたった一文
字の特徴パラメータからなる辞書では良い認識の辞書が
作成できないということを表している。しかし、同一筆
者の文字を多数集めるのは筆記者の負担が大きく実用的
でないという別の問題点がある。
【0005】(2) 更に、あるカテゴリのテンプレートを
辞書 5の対応するカテゴリのテンプレートに追加登録す
ることは、他のカテゴリの認識にどんな悪影響が出るか
という問題が発生する。この影響について、今登録した
自カテゴリのテンプレートがどのように変化するかとい
う観点からの先行技術はあるが、他カテゴリとの影響に
ついては不明のままであるのが現状である。
【0006】本願発明の文字認識装置に類似の技術とし
て、特開昭61-114387 号公報「オンライン手書き文字認
識装置」、特開昭61-117680 号公報「手書き文字認識用
辞書作成方式」、更に、特開平6-162271号公報「文字辞
書作成方式」等がある。
【0007】上記特開昭61-114387 号公報「オンライン
手書き文字認識装置」での辞書作成方法は、図7(b1)に
示されているように、既存のテンプレートの特徴パラメ
ータと入力文字の特徴パラメータの平均を取るもの
である。
【0008】しかし、通常、既存の特徴パラメータ
は、多数の文字の平均によって作られており、例えば、
既存のテンプレートが1000文字のパターンの平均によっ
て作られている場合、新たな入力文字の特徴パラメータ
との平均を取るということは、該新たな入力文字の特
徴パラメータを1000倍重視したことと同じである。
【0009】このことは、上記図7(b1)でにあるテン
プレートを強引にとの平均した×の位置にしてしまう
ことに相当する。もし、汎用性のある認識(書き手によ
らない)を求めるなら、辞書中の各カテゴリに対応した
テンプレートはのままであるべきであり、×の位置に
なるべきでない。また、登録した個人の文字が読めれば
いいのなら、該テンプレートはの付近にあるべきであ
って、×の位置に登録するべきではない。
【0010】つまり、×のテンプレートを持つ辞書は汎
用性から見ても、個人の専用という観点から見ても、中
途半端なものとなっている。本願発明の文字認識装置で
は、後述するように、同じ個人の書く文字でも、いつも
全く同じというわけではなく、多少のブレがあることを
考慮した上で、(その考慮の手段が請求項1,2に対応
している) の近くに、新たなテンプレートを作る(登
録する)手段であり、上記特開昭61-114387 号公報「オ
ンライン手書き文字認識装置」での辞書作成手段に比較
して、よい辞書ができるものである。
【0011】又、特開昭61-117680 号公報「手書き文字
認識用辞書作成方式」では、辞書の登録手段に関して、
本願発明と同様に、学習モードと辞書作成モードの2通
りがあるが、学習モードのときの登録は、リジェクトし
た文字 (カテゴリ) の特徴パラメータを生のまま登録
(本願発明の場合は後述するように、学習文字パターン
の内、特徴パラメータが、登録したい文字の特徴パラメ
ータと距離が近いものを選択して平均したものを登録)
するものであり、辞書作成モードのときは、文字の特徴
パラメータを合成し、ユーザが記入する文字に似た文字
を合成文字より選択する方法であり、登録したいユーザ
の文字は直接には関与しないので、認識率の向上に寄与
することが少ない。
【0012】本願発明によるテンプレートの特徴パラメ
ータの登録手段は、後述するように、ユーザの文字を加
工して登録するものであり、ユーザ文字の認識率の向上
に寄与することが大きいものである。
【0013】又、特開昭63-121991 号公報「文字認識装
置の辞書作成方法」では、前述の特開昭61-114387 号公
報「オンライン手書き文字認識装置」と同様、入力文字
の特徴パラメータと既存テンプレートの特徴パラメータ
より新テンプレートを作成するものである。
【0014】但し、特開昭61-114387 号公報と違い、単
純に2つの特徴パラメータの平均を取るのではなく、既
存辞書での該テンプレートが何文字学習しているかによ
って、その分だけ既存辞書での該テンプレートの特徴パ
ラメータに重みを加える。つまり、既存辞書の学習文字
に、入力文字の特徴を加えて、全部の平均値を辞書とす
ることである。
【0015】この手段では、通常、文字認識での既存辞
書 (あるカテゴリのテンプレートでの) の学習文字数は
膨大な数であり、これに入力文字1文字の特徴パラメー
タを付加しても殆どそれは効果として現れない。例え
ば、既存辞書でのテンプレートを作成するに当たって、
1000文字学習していれば、入力文字の特徴パラメータは
全体の1/1001しか寄与せず、殆どその効果は望めない。
【0016】この点、本願発明では、後述するように、
ユーザの文字を加工して登録するものであり、ユーザ個
人の字形のクセや性質をよく反映した辞書が作成でき
る。又、特開平6-162271号公報「文字辞書作成方式」で
は、前述の特開昭61-114387 号公報と同様に、既存のテ
ンプレートの特徴パラメータと入力文字の特徴パラメ
ータの間に新規辞書を作成する方法である。{図7(b
2)参照} 即ち、図7(b2)の特徴パラメータとの間 (直線上)
に新規辞書を作るものである。前述の特開昭61-114387
号公報では、丁度との中点にテンプレートを作った
が、この特開平6-162271号公報では、特徴パラメータ
との間のどこに作るかは、もし、その位置に作ったと
きに、“特徴パラメータの文字が確実に認識できるよ
うになるかどうかを考えながら決定する”と言うもので
あり、本願発明のように、ユーザ文字の特徴パラメータ
を対象とするものではなく、ユーザ文字の認識率の向上
に寄与することが余り期待できないものである。
【0017】以上のように、上記先行技術の4例は、ど
れも新辞書の作成について述べたものではあるが、上記
4例では、ある個人の書く文字は似通っているが、それ
でも記入の条件によって様々にバラツクという点を考慮
していないもので、本願発明が目的とすることを解決す
るものではない。
【0018】本発明は上記従来の欠点に鑑み、同じ個人
の書く文字でも、何時も、全く同じというわけではな
く、少しブレがあることに着目し、ユーザの文字を加工
して生成した特徴パラメータを登録することで、ユーザ
文字の認識率を向上させることができる文字認識装置を
提供することを目的とするものである。
【0019】
【課題を解決するための手段】図1〜図6は、本発明の
一実施例を示した図であり、図1〜図3は構成例を示
し、図4はユーザに提示するあるカテゴリ1と他のカテ
ゴリとのテンプレート間距離と、認識率との関係表の例
を示し、図5は、カテゴリ間の特徴パラメータ値距離の
マトリックスの例を示し、図6は、特徴パラメータ空間
での、あるテンプレートの特徴パラメータ値の登録例を
示している。上記の問題点は、下記の如くに構成した文
字認識装置によって解決される。
【0020】(1) 辞書 5中の特定のカテゴリの文字に対
して、新たなテンプレートを登録する手段を備えた文字
認識装置であって、上記辞書 5中の特定のカテゴリの文
字を変形させた複数の文字パターンを作成する文字変形
手段 6と、該文字変形手段 6で作成した文字パターンよ
り、文字認識の為の特徴パラメータ値の抽出する特徴抽
出手段 2a と、該特徴抽出手段 2a で抽出した特徴パラ
メータ値に基づいて、該カテゴリの文字のテンプレート
を生成する辞書作成手段 7と、該辞書作成手段 7で生成
したテンプレートを、上記辞書 5の特徴パラメータ空間
の所定の位置に追加して登録する辞書更新手段 8とを備
えるように構成する。
【0021】(2) 辞書 5中の特定のカテゴリの文字に対
して、新たなテンプレートを登録する手段を備えた文字
認識装置であって、上記特定のカテゴリの入力された文
字に対して、該カテゴリの文字の特徴パラメータ値を抽
出する特徴抽出手段 2b と、該カテゴリの文字に対し
て、標準辞書を作成したときの複数の学習文字パターン
の中から、上記入力文字の特徴パラメータ値と類似の特
徴パラメータ値を持つ文字パターンを選択する類似文字
選択手段 11 と、上記類似文字選択手段 11 で選択され
た複数の文字パターンの特徴パラメータ値に基づいて、
該カテゴリの文字のテンプレートを生成する辞書作成手
段 7a と、該辞書作成手段 7a で生成したテンプレート
を、上記辞書 5の特徴パラメータ空間の所定の位置に登
録する辞書更新手段 8とを備えるように構成する。
【0022】(3) 上記(1) 項、又は(2) 項に記載の文字
認識装置であって、標準辞書中の所定のカテゴリの文字
に対して、新たに登録するテンプレートの特徴パラメー
タ値と、上記標準辞書の該カテゴリの文字のテンプレー
トの特徴パラメータ値との距離を計算し、最も距離が近
くなる他のカテゴリの文字を求め、その距離の大きさに
よって、そのカテゴリの文字の認識率の変化を予測する
影響予測手段 12 を備えるように構成する。
【0023】(4) 上記(3) 項に記載の文字認識装置であ
って、上記影響予測手段 12 に、登録前の標準辞書の各
カテゴリ間の特徴パラメータ値距離マトリックス 120b
を備え、該標準辞書に、新たなテンプレートを登録する
度に、上記特徴パラメータ値距離マトリックス 120b を
更新して、該特徴パラメータ値の距離の変化に基づい
て、各カテゴリの文字を認識するときの認識率の変化を
予測するように構成する。
【0024】(5) 上記(3) 項、又は(4) 項に記載の文字
認識装置であって、上記影響予測手段 12 で算出された
予測結果を表示装置に表示し、上記新たなテンプレート
を登録するか否かを選択する表示・入力手段 4a を備え
るように構成する。
【0025】(6) 上記(3) 項、又は(4) 項に記載の文字
認識装置であって、上記標準辞書中の各カテゴリのテン
プレートの登録位置に対して、所定の位置に新たなテン
プレートを追加して登録したとき、該登録したカテゴリ
の文字パターンと、上記標準辞書中の該カテゴリの文字
パターンとの対応をとる対応表 10 を生成し、該生成し
た対応表 10 に基づいて、上記新たに登録されたテンプ
レートを削除するか否かを選択する手段 4a を備えるよ
うに構成する。
【0026】(7) 上記(3) 項、又は(4) 項、又は(5) 項
に記載の文字認識装置であって、新たに登録したテンプ
レートと、標準テンプレートと、該標準テンプレート
に、上記登録テンプレートを付加したテンプレートとを
管理していることを表示するテンプレート管理手段 80
と、上記テンプレート管理手段 80 が表示するテンプレ
ートの管理形態を参照して、どのテンプレートを使用し
て文字認識を行うかを選択する手段 4c を備えるように
構成する。
【0027】即ち、本発明の文字認識装置では、上記課
題 (1)に対処するために、ユーザが登録した登録文字の
変形パターンを利用したり、手持ちのユーザデータから
似た字形の文字を集め、これらによって、各カテゴリに
対応するテンプレートを作成して登録するようにしたも
のである。
【0028】又、上記課題(2) に対処するために、特徴
パラメータ空間上での各テンプレートの各カテゴリ間の
距離を測定し、また、その距離の近い遠いが認識率にど
の程度の影響を及ぼすかを予め計算しておき、そのデー
タによって、新たなテンプレートを登録したときの悪影
響を予測し、ユーザに提示し、ユーザが、新たなテンプ
レートの登録の可否を選択できるようにしたものであ
る。
【0029】従って、本発明の文字認識装置によれば、
同じ個人の書く文字でも、何時も、全く同じというわけ
ではなく、少しブレがあることに着目し、ユーザの文字
を加工して生成した特徴パラメータ値をもるテンプレー
トを登録するようにしているので、ユーザ文字の認識率
を向上させることができる。
【0030】
【発明の実施の形態】以下本発明の実施例を図面によっ
て詳述する。前述の図1〜図6は、本発明の一実施例を
示した図である。
【0031】本発明の文字認識装置においては、辞書 5
中の特定のカテゴリの文字に対して、新たなテンプレー
トを登録する手段を備えた文字認識装置であって、上記
辞書5中の特定のカテゴリの文字を変形させた複数の文
字パターンを作成する文字変形手段 6と、該文字変形手
段 6で作成した文字パターンより、文字認識の為の特徴
パラメータ値を抽出する特徴抽出手段 2a と、該特徴抽
出手段 2a で抽出した特徴パラメータ値の平均値を、該
カテゴリの文字のテンプレートとする辞書作成手段 7
と、該辞書作成手段 7で生成したテンプレートを、上記
辞書 5の特徴パラメータ空間の所定の位置に追加して登
録する辞書更新手段 8、又、上記特定のカテゴリの入力
された文字に対して、該カテゴリの文字の特徴パラメー
タ値を抽出する特徴抽出手段 2b と、該カテゴリの文字
に対して、標準辞書を作成したときの複数の学習文字パ
ターンの中から、上記入力文字の特徴パラメータ値と類
似の特徴パラメータ値を持つ文字パターンを選択する類
似文字選択手段 11 と、上記類似文字選択手段 11 で選
択された複数の文字パターンの特徴パラメータ値の平均
値を、該カテゴリの文字のテンプレートとする辞書作成
手段 7a と、該辞書作成手段 7a で生成したテンプレー
トを、上記辞書 5の特徴パラメータ空間の所定の位置に
追加して登録する辞書更新手段 8等が、本発明を実施す
るのに必要な手段である。
【0032】以下、図7を参照しながら、図1〜図6に
より、本発明の文字認識装置の構成と動作を説明する。
前述の図7に示されているように、通常の文字認識装置
では、入力部 1で得られた文字画像に対し、特徴抽出部
2で、入力された文字パターンの特徴パラメータの抽出
が行われ、その特徴パラメータ値が照合部 3で、予め用
意されている認識の辞書 5と照合され、その結果を表示
部 4に表示する。本発明は、このうち、上記辞書 5を更
新する手段である。
【0033】図1は請求項1に従う本発明の実施例であ
る。先ず、入力部 1で得られた文字画像は、文字変形部
6で複数種の変形文字が生成される。それら複数の変形
文字に対して特徴パラメータの抽出を行い、辞書作成部
7で、上記複数の特徴パラメータ値から、通常は、平均
値を取ることによって、登録したいテンプレートが作成
される。
【0034】辞書更新部 8では、通常の辞書 5の特徴パ
ラメータ空間の所定の位置に、上記新たに出来たテンプ
レートを組み込み、新しい辞書 5とする。同時に組み込
んだ位置と基の文字イメージとの対応表 100を作成す
る。
【0035】該対応表 100は、図1(b) に示されている
ように、テンプレート番号, カテゴリ, カテゴリ番号,
文字パターンのイメージ等から構成されており、新た
に、登録したテンプレートが、どの文字パターンから変
形して作成されたものであるかがユーザにすぐ分かるよ
うになっている。
【0036】従って、ユーザは、後々、現在の認識率を
参照して、この対応表 100に示されているイメージに対
応するテンプレートを削除したいときなどに使用するこ
とができる。
【0037】ここで、上記文字変形部 6での変形文字の
生成方法としては、元の文字に正規化を行うとき、正規
化の種類を変えることによって実施することが一例とし
て考えられる。該正規化とは、文字を揃える手段であ
り、例えば、大きさを揃える正規化手段とか、文字の重
心の位置を合わせる正規化手段等がある。例えば、上記
文字の重心の位置を、少し変えることにより、ユーザ文
字に対応した種々の変形文字を得ることができる。
【0038】又、新たにできたテンプレートを、辞書 5
に組み込む操作とは、例えば、数字の辞書を考えたと
き、標準となるテンプレートが0,1,2,3,.,9
と並んでおり、2のテンプレートを追加するとき、0,
1,2,(2),3,...,9となるようにソートや
マージを行う処理を言う。ここで、( )内のテンプレ
ートが新規に登録されたテンプレートである。{請求項
1に対応する実施例} 図2は、請求項2に従う本発明の実施例である。本実施
例では、学習文字の類似文字選択部 11 において、前
に、標準辞書を作成したときの複数個の学習文字(例え
ば、“0”〜)パターンの特徴パラメータ 110を用意し
ておき、登録したい文字の特徴パラメータと、上記学習
文字の特徴パラメータ(登録したい文字と同カテゴリ
の)値を類似文字の選択部 111で比較し、距離が小さい
ものを所定個数選択し、それらと登録したい文字とを、
辞書作成部 7a で、各特徴パラメータ値の平均値を取
り、辞書更新部 8で、辞書 5を更新して、新たなテンプ
レートを登録した辞書 5を作成する。この辞書更新の処
理は、前述の図2で説明した登録手段と同様である。
【0039】図3は、本発明の文字認識装置の他の特徴
である影響予測の機能をつけた実施例である。図3に示
されている影響予測部 12 では、前述のようにして作成
したテンプレートを登録したとき、他のカテゴリとの関
係を考慮して、認識率の低下を招く恐れのあるカテゴリ
と、その低下の度合いを表示・入力部 4a に表示する。
又、このとき、ユーザがその予測により、新たなテンプ
レートの辞書 5への登録を実施するか, 中止するかの意
思表示を、上記表示・入力部 4a で行い、それに従って
実施するときのは、上記図1,2で説明した辞書更新処
理に移るという構成も可能である。{請求項3,4,5
に対応する実施例} 上記図3は、新たなテンプレートの登録の手段として、
請求項1で示した図2の文字認識装置の場合について示
しているが、請求項2に対応させる場合には、図2で点
線枠で示した影響予測部 12 と、表示・入力部 4a を付
加することで、上記と同様の機能を付加することができ
る。
【0040】以下では、上記影響予測機能の詳細につい
て説明する。上記図3で説明した請求項3に対応する文
字認識装置での影響予測手段について述べる。
【0041】図6は、特徴パラメータ空間(一般に、前
述の「方向コード」等の特徴パラメータの数nのn次空
間)上で、各カテゴリのテンプレート,,〜がどの
ように分布しているかを示している。この図で{図中
はカテゴリ1のテンプレートを示す。また図では、簡単
のため,各カテゴリに1つのテンプレートとしている
が、複数の場合でも同様である}、×の位置に登録した
いテンプレート(カテゴリ1のテンプレート)がきたと
する。
【0042】すると、×と最も距離の近いテンプレート
はであり、このテンプレートの登録により、カテゴリ
7が最も悪影響を受ける可能性が高い。請求項3は、上
記影響予測機能において、カテゴリ7の影響についての
み考慮する手段である。
【0043】図4は、各カテゴリに対応したテンプレー
ト間距離と認識率の関係の表であり、ここでは、カテゴ
リ1と,他のカテゴリ0,・・,7の関係の部分のみを
記述している。実際には、他のカテゴリについても同様
な表を有している。この図で、他のカテゴリ7の欄は、
カテゴリ1と7のテンプレートの距離がdx(d1,d
2,〜dn)のとき、カテゴリ7の認識率がどの程度で
あるかを示している。
【0044】例えば、カテゴリ1と7のテンプレート間
距離がd3のとき、カテゴリ7の正読率,棄却率,誤読
率は各々96.2%,2.6%,1.2% である。今、登録したいテン
プレート×とテンプレートの距離がd3だったとき、
カテゴリ1とカテゴリ7のテンプレート間距離と認識率
の関係表(図4参照)120aより、d3の項を調べ、どの
程度の認識率になるのか、又、元々のカテゴリ1とカテ
ゴリ7の距離(つまりとの距離)がd1だったとす
ると、どの程度認識率が低下するのかが分かる。
【0045】図4の関係表 120a の例では、図6の×の
位置にカテゴリ1のテンプレートを登録することによ
り、カテゴリ7の正読率は99.0% から96.2% に低下する
可能性があることを示している。この数値は、あくまで
も、予め手持ちのデータで作成したものであり、実際の
文字に対して同じ数値を示すわけではないが、認識率の
増減の程度の目安として利用することができる。
【0046】上記図4は、カテゴリ1と他のカテゴリが
どの程度離れているとき(どの程度の距離のとき)に、
他のカテゴリがどの程度の正読,誤読,棄却率になるか
を示しており、本発明の文字認識装置では、これをカテ
ゴリ1のみならず、全てのカテゴリについて、持ってい
る。この表は、例えば、前述の学習文字などから予め作
成しておくができる。{請求項3に対応する実施例} 図5は、請求項4の実施例を説明する図である。請求項
4は、上記請求項3を、より詳細に行うことに相当す
る。
【0047】各カテゴリのテンプレート間の特徴パラメ
ータ値距離マトリクス 120b を、図5に示されているフ
ォーマットで、予め影響予測部 12 に用意しておき、登
録テンプレートを標準テンプレートに付加したとする
と、この距離マトリクス 120bがどう変化するかを計算
する。この計算は、登録するテンプレートがカテゴリA
のテンプレートなら、カテゴリAとの距離のみを計算し
なおせばよい。図5において、何れか一方のカテゴリを
基準としたとき、他方のカテゴリが影響を受けるカテゴ
リとなる。 そして値が小さくなったカテゴリについ
て、請求項3と同様に、認識率の影響を提示するように
する。提示の仕方は、輝度でも良いし、アンダライン表
示等、該値が小さくなったことをユーザに理解できる手
段であれば、どのような手段でも良い。{請求項4に対
応する実施例} 次に、請求項7に対応する実施例を説明する。上記図1
〜図3に示した文字認識装置の上記辞書更新手段 8に、
新たに登録したテンプレートと、標準テンプレートと、
該標準テンプレートに、上記登録テンプレートを付加し
たテンプレートとを管理していることを表示するテンプ
レート管理手段 80 を具備しておき、上記テンプレート
管理手段 80 が表示するテンプレートの管理形態を参照
して、どのテンプレートを使用して文字認識を行うかを
選択する表示・入力手段 4c を備えておくことで、ユー
ザは、上記表示・入力手段 4c で、新たに登録したテン
プレートと、標準テンプレートと、該標準テンプレート
に、上記登録テンプレートを付加したテンプレートとの
何れかを、選択的に使用して入力した文字の認識を行う
ことができ、例えば、ユーザの文字認識の経験を生かす
ことができる。
【0048】このように、本発明の文字認識装置は、辞
書中の特定のカテゴリの文字に対して、新たなテンプレ
ートを登録する際、その文字を変形させた複数の文字パ
ターンを作成し、該作成した文字パターンより、文字認
識の為の特徴パラメータの抽出を行い、該抽出した特徴
パラメータ値の平均値を該カテゴリの文字のテンプレー
トとして登録する。又、該登録するテンプレートを作成
するのに、標準辞書を作成したときの学習文字パターン
の中から、登録文字の特徴パラメータと類似の特徴パラ
メータ値を持つ文字パターンを選択し、該選択された文
字パターンの特徴パラメータ値の平均値を作成して登録
する。又、登録するテンプレートの特徴パラメータ値と
標準テンプレートの特徴パラメータ値との距離を計算
し、最も距離が近い他のカテゴリを求め、その距離の大
きさにより、該カテゴリの文字認識率の劣化の程度を予
測してユーザに提示するようにしたところに特徴があ
る。
【0049】
【発明の効果】以上、詳細に説明したように、本発明の
文字認識装置によれば、同じ個人の書く文字でも、何時
も、全く同じというわけではなく、少しブレがあること
に着目し、ユーザの文字を加工して生成した特徴パラメ
ータを登録するようにしているので、ユーザ文字の認識
率を向上させることができる。
【図面の簡単な説明】
【図1】本発明の一実施例を示した図(その1)
【図2】本発明の一実施例を示した図(その2)
【図3】本発明の一実施例を示した図(その3)
【図4】本発明の一実施例を示した図(その4)
【図5】本発明の一実施例を示した図(その5)
【図6】本発明の一実施例を示した図(その6)
【図7】従来の文字認識装置を説明する図
【符号の説明】
1 入力部、入力手段 2,2a,2b 特
徴抽出部、特徴抽出手段 3 照合部、照合手段 4 表示部 4a,4b,4c 表示・入力部、表示・入力手段 5 辞書 6 文字変形
部、文字変形手段 7,7a 辞書作成部、辞書作成手段 8 辞書更新部、辞書更新手段 80 テンプレート管理手段 9 文字イメージ格納部 10 対応表 11 類似文字選択手段、類似文字選択部 110 学習文字の特徴パラメータ 111 類似文字の選択部 12 影響予測部 120a テンプレート間距離と認識率の関係表、関係
表 120b カテゴリ間の特徴パラメータ値距離マトリッ
クス

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】辞書中の特定のカテゴリの文字に対して、
    新たなテンプレートを登録する手段を備えた文字認識装
    置であって、 上記辞書中の特定のカテゴリの文字を変形させた複数の
    文字パターンを作成する文字変形手段と、 該文字変形手段で作成した文字パターンより、文字認識
    の為の特徴パラメータ値を抽出する特徴抽出手段と、 該特徴抽出手段で抽出した特徴パラメータ値に基づい
    て、該カテゴリの文字のテンプレートを生成する辞書作
    成手段と、 該辞書作成手段で生成したテンプレートを、上記辞書の
    特徴パラメータ空間の所定の位置に登録する辞書更新手
    段とを備えたことを特徴とする文字認識装置。
  2. 【請求項2】辞書中の特定のカテゴリの文字に対して、
    新たなテンプレートを登録する手段を備えた文字認識装
    置であって、 上記特定のカテゴリの入力された文字に対して、該カテ
    ゴリの文字の特徴パラメータを抽出する特徴抽出手段
    と、 該カテゴリの文字に対して、標準辞書を作成したときの
    複数の学習文字パターンの中から、上記入力文字の特徴
    パラメータと類似の特徴パラメータ値を持つ文字パター
    ンを選択する類似文字選択手段と、 上記類似文字選択手段で選択された複数の文字パターン
    の特徴パラメータ値に基づいて、該カテゴリの文字のテ
    ンプレートを生成する辞書作成手段と、 該辞書作成手段で生成したテンプレートを、上記辞書の
    特徴パラメータ空間の所定の位置に登録する辞書更新手
    段とを備えたことを特徴とする文字認識装置。
  3. 【請求項3】請求項1、又は2に記載の文字認識装置で
    あって、標準辞書中の所定のカテゴリの文字に対して、
    新たに登録するテンプレートの特徴パラメータ値と、上
    記標準辞書の該カテゴリの文字のテンプレートの特徴パ
    ラメータ値との距離を計算し、最も距離が近くなる他の
    カテゴリの文字を求め、その距離の大きさによって、そ
    のカテゴリの文字の認識率の変化を予測する影響予測手
    段を備えたことを特徴とする文字認識装置。
  4. 【請求項4】請求項3に記載の文字認識装置であって、
    上記影響予測手段に、登録前の標準辞書の各カテゴリ間
    の特徴パラメータ値距離マトリックスを備え、 該標準辞書に、新たなテンプレートを登録する度に、上
    記特徴パラメータ値距離マトリックスを更新して、該特
    徴パラメータ値の距離の変化に基づいて、各カテゴリの
    文字を認識するときの認識率の変化を予測することを特
    徴とする文字認識装置。
  5. 【請求項5】請求項3、又は4に記載の文字認識装置で
    あって、上記影響予測手段で算出された予測結果を表示
    装置に表示し、上記新たなテンプレートを登録するか否
    かを選択する表示・入力手段を備えたことを特徴とする
    文字認識装置。
  6. 【請求項6】請求項3、又は4、又は5に記載の文字認
    識装置であって、上記標準辞書中の各カテゴリのテンプ
    レートの登録位置に対して、所定の位置に新たなテンプ
    レートを追加して登録したとき、該登録したカテゴリの
    文字パターンと、上記標準辞書中の該カテゴリの文字パ
    ターンとの対応をとる対応表を生成し、該生成した対応
    表に基づいて、上記新たに登録されたテンプレートを削
    除するか否かを選択する手段を備えたことを特徴とする
    文字認識装置。
  7. 【請求項7】請求項3、又は4、又は5に記載の文字認
    識装置であって、新たに登録したテンプレートと、標準
    テンプレートと、該標準テンプレートに、上記登録テン
    プレートを付加したテンプレートとを管理していること
    を表示するテンプレート管理手段と、 上記テンプレート管理手段が表示するテンプレートの管
    理形態を参照して、どのテンプレートを使用して文字認
    識を行うかを選択する手段を備えたことを特徴とする文
    字認識装置。
JP8028104A 1996-02-15 1996-02-15 文字認識装置 Withdrawn JPH09223197A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8028104A JPH09223197A (ja) 1996-02-15 1996-02-15 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8028104A JPH09223197A (ja) 1996-02-15 1996-02-15 文字認識装置

Publications (1)

Publication Number Publication Date
JPH09223197A true JPH09223197A (ja) 1997-08-26

Family

ID=12239510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8028104A Withdrawn JPH09223197A (ja) 1996-02-15 1996-02-15 文字認識装置

Country Status (1)

Country Link
JP (1) JPH09223197A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015007972A (ja) * 2013-05-31 2015-01-15 オムロン株式会社 画像照合方法、画像照合装置、モデルテンプレート生成方法、モデルテンプレート生成装置、およびプログラム
JP2020091602A (ja) * 2018-12-04 2020-06-11 オムロン株式会社 画像処理装置、画像処理方法、および画像処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015007972A (ja) * 2013-05-31 2015-01-15 オムロン株式会社 画像照合方法、画像照合装置、モデルテンプレート生成方法、モデルテンプレート生成装置、およびプログラム
JP2020091602A (ja) * 2018-12-04 2020-06-11 オムロン株式会社 画像処理装置、画像処理方法、および画像処理プログラム

Similar Documents

Publication Publication Date Title
US10007867B2 (en) Systems and methods for identifying entities directly from imagery
JP3469345B2 (ja) 画像のファイリング装置及びファイリング方法
KR100411697B1 (ko) 문자판독방법및주소판독방법
US6289124B1 (en) Method and system of handwritten-character recognition
CN101430758B (zh) 文档识别装置和方法
US20050036712A1 (en) Image retrieving apparatus and image retrieving program
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
JPH1011531A (ja) 帳票読取装置
CN113033271A (zh) 利用人工智能模块学习脸部辨识的处理方法
CN112465805A (zh) 用于钢筋冲压折弯的质量检测的神经网络的训练方法
JP6550163B1 (ja) 文字認識装置、文字認識方法およびプログラム
JPH09223197A (ja) 文字認識装置
JP2021060801A (ja) 情報処理システム、情報処理装置、方法及びプログラム
JP2003346080A (ja) 文字認識方法
WO2019194029A1 (ja) 画像処理装置、画像処理方法、及びプログラムを記憶する記憶媒体
JP7075770B2 (ja) 文字認識システム、文字鮮明化システム、文字鮮明化プログラム、文字鮮明化方法、及び文字鮮明化画像の表示装置
JP3930466B2 (ja) 文字認識装置、文字認識プログラム
JP2002358521A (ja) 帳票フォーマット登録・識別装置、方法及びプログラム
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP2020102041A (ja) 学習データ生成システム、学習データ生成方法、機械学習モデルの学習方法
JPH08101894A (ja) 文字認識装置
JP2783272B2 (ja) 頻度情報を用いた文字認識装置
JPH07160844A (ja) ファイリング装置
JP2001092921A (ja) 文字行領域抽出方法と文字行領域検出に用いられる学習方法
JP2022070553A (ja) 情報処理装置、制御方法及びプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030506