JP4237864B2

JP4237864B2 - 単語認識装置

Info

Publication number: JP4237864B2
Application number: JP11373399A
Authority: JP
Inventors: 悦伸堀田; 浩明武部
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1999-04-21
Filing date: 1999-04-21
Publication date: 2009-03-11
Anticipated expiration: 2019-04-21
Also published as: JP2000306045A

Description

【０００１】
【発明の属する技術分野】
本発明は、手書き文字列を認識する単語認識装置に関する。
【０００２】
【従来の技術】
近年、手書き文字入力機器として文字認識装置ＯＣＲ（ＯｐｔｉｃａｌＣｈａｒａｃｔｏｒＲｅａｄｅｒ）の需要が増加している。
文字認識装置の中には個別文字認識装置のほか、文字認識を向上させるため、文字列に注目した単語認識装置が登場している。
【０００３】
図７（ａ）に従来例の個別文字認識装置31の構成図を示す。
個別文字認識装置31は、画像入力部２、正規化部３、特徴抽出部４、特徴照合部５、認識結果出力部６、個別文字辞書７より構成される。
【０００４】
画像入力部２は、スキャナなどにより手書き文字の入力画像を取得する。正規化部３は、文字の大きさ、位置を一定に揃える。特徴抽出部４は、正規化された入力画像から特徴量を抽出する。特徴照合部５は、個別文字辞書７の文字の特徴量と、特徴抽出部４が抽出した特徴量とを照合する。認識結果出力部６は、特徴照合部５で照合した結果をディスプレイなどに出力する。個別文字辞書７は文字とその特徴量とから構成される。
【０００５】
図７（ｂ）の住所例を参照して、動作を説明する。
【０００６】
画像入力部２から入力された文字列「東京都」は、正規化部３で規定の大きさに揃えられた後、特徴抽出部４で、文字の特徴量を抽出される。抽出結果の「東」の特徴量、「京」の特徴量、「都」の特徴量を特徴照合部５へ渡す。
【０００７】
特徴照合部５では、個別文字辞書７のすべての文字と特徴抽出部４からの「東」「京」「都」の特徴量とを各々比較し、その結果、特徴量の差分が最小値となった文字を認識結果として認識結果出力部６より出力する。
【０００８】
図８（ａ）に従来例の単語認識装置１の構成図を示す。
【０００９】
単語認識装置１は、画像入力部２、正規化部３、特徴抽出部４、特徴照合部５特徴合成部８、認識結果出力部６、単語リスト部９および個別文字辞書７を備える。
【００１０】
画像入力部２は、スキャナなどにより手書き文字の入力画像を取得する。正規化部３は、文字の大きさ、位置を一定に揃える。特徴抽出部４は、入力画像から特徴量を抽出する。特徴合成部８は、単語を選択し、選択された単語を構成する個々の文字の特徴量を個別文字辞書７から抽出し合成する。特徴照合部５は、特徴合成部８が合成した単語の特徴量と特徴抽出部４が抽出した入力画像の特徴量とを照合する。単語リスト部９は、複数の単語リストからなる。認識結果出力部６は、特徴照合部５で照合した結果の中で最も類似した特徴量を持つ単語をディスプレイなどに出力する。個別文字辞書７は、文字とその特徴量とから構成される。
【００１１】
図８（ｂ）は、住所例を示す。
【００１２】
都道府県などのキーとなる文字は、規定の座標に印刷されているものとする。
【００１３】
画像入力部２は入力された画像について、まず都道府県のキーとなる文字が印刷されている位置を検出し、その前の文字列「東京」を切り出す。切り出された文字列を正規化部３で正規化する。正規化された単語は、特徴抽出部４で特徴量を抽出し、特徴照合部５に渡す。特徴合成部８は、単語リスト部９の中にある都道府県の単語リストを選択する。単語リストには、「北海」、「東京」、「沖縄」等が単語として登録されており、個別文字辞書７には、すべての文字の特徴量が登録されている。
【００１４】
まず、特徴合成部８は、都道府県の単語リストに従って、まず「北海」の単語を選択し、個別文字辞書７から、「北」と「海」の特徴量が取り出され、「北海」の特徴量を合成する。その合成結果と入力画像の特徴量とが特徴照合部５で照合され、両者間の特徴量の差を求める。そして同様の処理を単語リストのすべての単語について行う。照合処理が終了するとそれらの単語の中で特徴量の差分の小さいものを認識結果出力部６から認識結果として出力する。
【００１５】
【発明が解決しようとする課題】
文字を個別に認識している装置では、文字が接触している文字列を精度よく切り出すことは、困難であった。そのため、接触文字を分離せずに単語として一括して捉える単語認識方式が登場している。しかし、単語を個々の文字に分離することなく一括して認識する方式では、単語の画像から単語特徴量を抽出しているため、文字同士が同じ高さに並んでいれば、高い認識で行えるが文字列が傾いている場合や単語を構成する文字のサイズがばらばらで異なる場合は、認識精度が低かった。
【００１６】
また、単語認識装置の特徴合成部で単語の特徴量を合成するときには、個別文字辞書を基本にして合成しているため、「太秦馬塚」、「太秦垣内」のように同じ部分文字列が含まれている「太秦」の部分について毎回、合成処理を行うため合成処理に無駄があった。
【００１７】
また、単語認識装置の特徴合成部で単語の特徴量を合成するとき、単一サイズの個別文字辞書からの抽出のため、入力画像の特徴量との間で特徴次元数に差を生じ、誤読の要因となっていた。さらに傾いた単語も誤読の要因になっていた。
【００１８】
また、単語認識装置の特徴照合部では、同一文字が含まれている単語間で、同一文字の特徴量が原因で、誤読が生じやすかった。
本発明の目的は、
（１）傾いた単語および異なる文字サイズの単語の認識精度を高めた単語認識装置の提供と、
（２）合成速度が速く認識精度を高めた特徴合成方式を有する単語認識装置の提供と、
（３）同一文字が含まれている単語間の誤読を防止した特徴照合方式を有する単語認識装置の提供にある。
【００１９】
【課題を解決するための手段】
入力画像の単語を構成する個々の文字を認識する個別文字認識部と、入力画像の単語を一括して認識する単語認識部と、個別文字認識部の認識結果からの単語の確信度の算出と単語認識部の認識結果からの単語の確信度の算出とを行う確信度算出部と、確信度算出部で算出された個別文字認識部と単語認識部の確信度算出結果を比較する確信度比較部とを備え、確信度比較部は、確信度の比較結果に基づき、個別文字認識部と単語認識部の確信度の大きい方を選択する構成の単語認識装置。
【００２０】
この構成により、個別文字認識部と単語認識部を併用することで、それぞれ単独で用いた場合以上の認識精度を出すことが可能である。すなわち単語認識部は接触文字の認識精度が高く、個別認識部は、傾き文字および文字サイズの変化の認識精度が高いというように、お互いを補完し合う。
【００２１】
また、入力画像の個々の文字を認識する個別文字認識部と、入力画像の単語を一括して認識する単語認識部と、入力画像の単語を構成する個々の文字の間隔を検出する文字間隔検出手段と、文字間隔検出手段により検出された間隔を所定の閾値と比較する文字間隔比較手段とを備え、文字間隔比較手段は、検出された文字間隔が所定の閾値より小さければ単語認識部を選択し、検出された文字間隔が所定の閾値より大きければ個別文字認識部を選択する構成の単語認識装置。
【００２２】
この構成により、個別文字認識部と単語認識部を使いわけることで、それぞれ単独で用いた場合以上の認識精度を出すことが可能であり、また高速で処理が可能となる。すなわち文字間隔が狭い場合は、単語認識部を使用することで、接触文字の認識精度を高くし文字間隔が広い場合は、個別認識部を使用して、傾き文字および異なる文字サイズの認識精度を高くするというように、お互いを補完し合う。
【００２３】
また、入力画像から単語の特徴量を抽出した結果と辞書の個々の文字の特徴量から単語の特徴量を合成した結果とを照合することで単語の認識を行う単語認識装置であって、複数の各種サイズの文字、部分文字列の特徴量と複数の各種文字サイズの画像を保持する辞書と、前記辞書に基づいて文字、部分文字列の特徴量から単語の特徴量を合成する手段および前記辞書に基づいて文字の画像から単語の画像を合成し特徴量の抽出を行う手段を有する特徴合成部とを備えた構成である。
【００２４】
この構成により、単語を構成する文字だけでなく、出現頻度の高い部分文字列の特徴量を予め辞書として持つことで、単語の特徴量の合成の高速化が図れるとともに、異なる文字サイズ、部分文字列を持つことで認識精度が高まる。さらに画像合成をすることにより、傾斜した単語の特徴量も抽出できるので、傾斜した単語の認識精度も高まる。
【００２５】
また、所定の単語サイズの特徴量を合成する文字、部分文字列の特徴量を文字数に応じたサイズで辞書より選択する選択手段を有する特徴合成部を備えた構成の単語認識装置。
【００２６】
この構成により、文字数に応じた複数の異なる文字サイズを持ち、同一正規化サイズで、単語の特徴量を合成することで、入力画像の特徴次元数と合成した特徴次元数とが同一となり、認識精度が向上する。
【００２７】
また、辞書から抽出した単語を構成する文字、部分文字列の特徴量から所定のサイズの文字、部分文字列の特徴量に変換する変換手段を有する特徴合成部を備えた構成の単語認識装置。
【００２８】
この構成により、個別文字認識用の標準の文字サイズ、部分文字列サイズの特徴量を基に、異なるサイズの単語の特徴量を合成できるので、小さい辞書容量で認識精度を向上できる。
【００２９】
また、辞書から抽出した単語を構成する文字、部分文字列の線量による複雑度に応じて文字、部分文字列の特徴量に重み付けをする複雑度重み付け手段と、複雑度重み付け手段により算出された重み付けに基づいて、辞書から抽出した単語を構成する文字、部分文字列を所定のサイズの文字、部分文字列に変換する変換手段とを有する特徴合成部を備えた構成の単語認識装置。
【００３０】
この構成により、複雑な形状の文字の特徴次元数を高くし、簡単な形状の文字の特徴次元数を低くすることで、文字の形状に応じた認識となり、小さい辞書容量で高精度の認識が可能となる。
【００３１】
また、入力画像の単語の傾きを検出する傾斜度検出手段と、単語を構成する画像を辞書より抽出して傾斜度検出手段により検出した傾きに沿って単語画像を配置し画像の合成と特徴量の抽出を行う手段を有する特徴合成部とを備えた構成の単語認識装置。
【００３２】
この構成により、入力された単語の傾きに対応した単語の特徴量を生成することができ、傾いた文字列中の単語の認識精度が高くなる。
【００３３】
また、入力画像の単語を構成する文字、部分文字列の特徴量に重み付けをする入力画像重み付け手段と、特徴合成部で生成した文字、部分文字列の特徴量に重み付けをする特徴合成重み付け手段および入力画像重み付け手段により抽出された特徴量を特徴合成重み付け手段により抽出された特徴量と照合する照合手段を有する特徴照合部をさらに備えた構成の単語認識装置。
【００３４】
この構成により、単語を構成する特定の文字、または特定の部分文字列が同一の単語に対して、同一部の特徴量の重み付けを低くし、他の文字または部分文字列の特徴量を上げることにより、類似単語の特徴量の差が明確になり、認識精度が高まる。
【００３５】
【発明の実施の形態】
実施例１の単語認識装置１の構成図を図１（ａ）に示す。
【００３６】
画像入力部２、個別文字認識部21、単語認識部22、確信度算出部10、確信度比較部11、認識結果出力部６、個別文字辞書７より構成される。
【００３７】
個別文字認識部21は、正規化部３、特徴抽出部４、特徴照合部５より構成される。
【００３８】
また単語認識部22は、正規化部３、特徴抽出部４、特徴照合部５、特徴合成部８、単語リスト部９より構成される。
【００３９】
個別文字認識部21、単語認識部22は従来例と同一である。確信度算出部10は、個別文字認識部21からの単語を構成する文字毎の確信度の算出および平均の算出と、単語認識部22からの単語の確信度を算出する。確信度比較部11は、個別文字認識部21の確信度と単語認識部22の確信度の大小を比較する。確信度とは、入力画像の特徴量との類似度が高いことを意味する。
【００４０】
個別文字認識処理と単語一括認識処理の併用の装置であり、画像入力部２で入力された手書き文字は、各認識部で、文字および単語の認識が行われる。そしてその認識結果の確信度を求める。
【００４１】
確信度の算出方法は、以下のようにする。
【００４２】
まず入力画像の特徴量を示す特徴ベクトルを抽出する。
次に個別文字認識部21は、辞書内の文字の特徴量を示す特徴ベクトルを求め、入力画像の特徴ベクトルとの差の距離値を求める。単語を構成するすべての文字について行う。
【００４３】
また、単語認識装置１は、特徴合成部８で合成された単語の特徴量を示す特徴ベクトルを求め、入力画像の特徴ベクトルとの差の距離値を求める。
【００４４】
次に予め、大量のサンプルを用いて、距離値の分布を調べ、分布の範囲が０〜１に収めるように正規化してあるので確信度算出部10は、算出した各認識部の距離値から分布上の距離値に変換する。その分布をｆ（X ）で表すとすると距離値がｄであったときの確信度Ｒ（ｄ）は、以下の式で表される。距離値ｄは、０≦ｄ≦１であり、ｄ＝１のときを最大の類似度と見る。
【００４５】
【数式１】

【００４６】
そして例えば２文字構成の単語の場合、個別文字認識部21からは文字毎の確信度の平均であるＲ（ｄ１）＋Ｒ（ｄ２）／２を求める。次に単語認識部22からは単語の確信度からはＲ（ｄ３）を求める。確信度比較部はその大小を比較する。その結果確信度の大きいものを認識結果として認識結果出力部６から出力する。
【００４７】
実施例２の単語認識装置１の構成図を図２に示す。
【００４８】
画像入力部２、文字間隔検出部12、閾値比較部13、個別文字認識部21、単語認識部22、認識結果出力部６、個別文字辞書７より構成される。
【００４９】
個別文字認識部21は、正規化部３、特徴抽出部４、特徴照合部５より構成される。
【００５０】
また単語認識部22は、正規化部３、特徴抽出部４、特徴照合部５、特徴合成部８、単語リスト部９より構成される。
個別文字認識部21、単語認識部22は従来例と同一である。文字間隔検出部12は、入力された画像の文字間の間隔を検出する。閾値比較部13は、文字間隔検出部12で検出された間隔を閾値と比較する。
【００５１】
実施例２の処理は、２つの認識処理を通すため処理時間がかかるため速い処理速度が要求される場合に使用する。まず入力された単語の文字間隔を検出し、文字間隔が閾値より大きいか小さいかにより、２つの認識処理を使い分ける。
【００５２】
図２を参照して動作を説明する。
【００５３】
画像入力部２から入力された画像が和歌山とすると、文字間隔検出部12で文字間隔を検出する。例えば、連結する黒画素から文字の外接矩形を求め、その外接矩形間を文字間隔として検出する。その検出結果が、閾値より小さければ、文字間が近接している可能性が高いため単語認識部22にて処理を行う。検出結果が、閾値より大きければ、近接していないと判断し、個別文字単位での個別文字認識部21にて処理を行う。
【００５４】
実施例３の単語認識装置１の構成図を図３に示す。
【００５５】
単語認識装置１は、画像入力部２、正規化部３、特徴抽出部４、認識処理部17からなる。認識処理部17は、特徴照合部５、特徴合成部８、認識結果出力部６、単語リスト部９、個別文字辞書７、単語辞書16を備える。
【００５６】
画像入力部２は、スキャナなどから手書き文字の入力画像を取得とともに単語の傾斜度を検出する。正規化部３は、文字の大きさ、位置を一定に揃える。特徴抽出部４は、入力画像から特徴量を抽出する。特徴合成部８は、単語を選択し、選択された単語を構成する個々の文字の特徴量を個別文字辞書７から抽出し、単語を構成する部分文字列の特徴量を単語辞書16から抽出し合成する。また文字、部分文字列サイズ変換、複雑度変換、傾き処理等を行う。特徴照合部５は、特徴合成部８が合成した単語の特徴量と特徴抽出部４が抽出した入力画像の特徴量と照合する。単語リスト部９は、複数の単語リストからなる。認識結果出力部６は、特徴照合部５で照合した結果の中で最も類似した特徴量を持つ単語をディスプレイなどに出力する。個別文字辞書７は、文字とその特徴量とその画像から構成される。単語辞書16は、複合語の共通の部分文字列とその特徴量からなる。
【００５７】
図３〜図６を参照して、単語認識装置１の動作について説明する。
【００５８】
まず入力画像として「東京」が入力された場合について、図４（ｂ）の住所例により説明する。
【００５９】
都道府県などのキーとなる文字は、規定の座標に印刷されているものとする。画像入力部２は入力された画像について、まず都道府県のキーとなる文字が印刷されている位置を検出し、その前の文字列を切り出す。次に連結した黒画素を抽出して、それに外接する矩形を得る。得られたすべての外接矩形の中心に対しての直線を設定する。そしてその傾きを単語の傾きとし、所定の閾値と比較する。
【００６０】
傾斜度＜閾値の場合と傾斜度≧閾値の場合に分けて説明を行う。
（１）傾斜度＜閾値の場合
入力された「東京」の文字列に対して、正規化部３で、例えば６４×６４画素への正規化が完了すると、特徴抽出部４で「東京」の入力画像の特徴量が抽出される。都道府県の単語リストには、北海、東京、沖縄等都道府県の単語が登録されており、個別文字辞書７には、すべての文字の特徴量が登録されている。
【００６１】
次に認識処理部17の処理の流れを図４（ａ）に示す。
【００６２】
個別文字についての説明であるが、部分文字列も同様である。
【００６３】
まず、特徴合成部８は単語リストに従って、まず「北海」の単語を検索する。（Ｓ11ステップ）次に個別文字辞書７より「北」の特徴量および「海」の特徴量を抽出して特徴量の合成を行うがその方式として３種類の方式が有る。特徴合成後の特徴ベクトルの次元数と入力画像の正規化の次元数とが等しくなるように特徴合成の処理がされる。
【００６４】
特徴量としてメッシュ特徴量を用いた場合を示す。メッシュ特徴量とは、画像をｍ×ｎにメッシュで分割したときに各小矩形内の黒画素数を小矩形サイズで割ったものがその小矩形内の特徴量となる。例えば正規化サイズが６４×６４画素だとすると８×８メッシュに分割した小矩形のサイズは８×８となる。ある小矩形内に３２個の黒画素があるとするとそのメッシュ特徴量は３２／６４＝０．５となる。入力画像は、６４×６４画素で８×８メッシュで正規化され特徴量を抽出しているので、特徴合成結果も、６４×６４画素で８×８メッシュになるように合成される。
【００６５】
第１の方式は縮小文字サイズを有する個別文字辞書７による特徴合成である。（図４のＳ121 ステップ）。説明図を図５（ａ）に示す。
【００６６】
ＯＣＲ専用機など高速で辞書用のメモリ容量が大きく取れるものに、使用される。
【００６７】
１つの文字、部分文字列について、複数の文字サイズから抽出した特徴量をそれぞれ個別文字辞書７として持つ。１／２サイズの縮小文字を有する個別文字辞書７を用いた例を示す。１／２サイズの縮小文字は、８×４メッシュとなる。
【００６８】
都道府県の単語リストに基づいて「北海」の１／２サイズの「北」、１／２サイズの「海」の特徴量を個別文字辞書７から抽出し、合成して８×８メッシュサイズの「北海」の単語の特徴量とする。（Ｓ13ステップ）
この単語特徴量と、入力画像の特徴量と照合してその差を記憶する。（図４のＳ14ステップ）
第２の方式は、文字サイズ変換方式の特徴合成である。（図４のＳ122 ステップ）携帯情報端末など辞書用のメモリ容量を大きくとれないものに使用される。
【００６９】
本方式は、標準の文字サイズの特徴量に変換係数を施して種々の文字サイズの特徴量を生成し、単語特徴量を合成する方式である。特徴量合成の説明図を図５（ｂ）に示す。
【００７０】
標準の文字サイズの特徴量に変換係数を施して縮小した文字サイズの特徴量を合成する。
【００７１】
例えば６４×６４画素の標準の文字サイズの特徴量は、縦８×横８メッシュなので、「北」の標準の文字サイズに縦８×横４の変換係数をかけることにより１／２サイズの「北」の文字の特徴量が得られる。又、「海」の標準の文字サイズに縦８×横４の変換係数をかけることで、１／２サイズの「海」の文字の特徴量が得られる。両者を合成したものを「北海」の単語特徴量とする。（図４のＳ13ステップ）この単語特徴量と入力画像の特徴量と照合してその差を記憶する。（図４のＳ14ステップ）
第３の方式は複雑度変換方式の特徴合成である。（図４のＳ123 ステップ）
携帯情報端末など辞書用のメモリ容量を大きくとれないもので、認識精度を高くしたい装置に使用される。
【００７２】
精度の高い処理を行うには、まず単語の構成する文字の複雑度を調べる。複雑度としては、例えば縦方向の線密度を用いた線密度算出の説明図を図５（ｃ）に示す。各文字の線密度の総和の比に応じて、特徴量に重みづけをして単語特徴量を合成する方法である。
【００７３】
例えば「北海」という単語に対して「北」の線密度が30、「海」の線密度が50だとすると、このときの文字サイズを６４×６４画素とすると８×８のメッシュに分割されているので、「北」の特徴量は横のメッシュ数を８×30/(30+50)＝3 とし、「海」の特徴量は、横のメッシュ数を８×50/(30+50)＝５とする。そして、「北」の標準の文字サイズに縦８×横３の変換係数をかけることにより「北」の文字の特徴量が得られる。又「海」の標準の文字サイズに縦８×横５の変換係数をかけることで、「海」の文字の特徴量が得られる。両者を合成したものを「北海」の単語特徴量とする。（図４のＳ13ステップ）
この単語特徴量と入力画像の特徴量と照合してその差を記憶する。（図４のＳ14ステップ）
これらの処理をすべての単語について実施し、最終的に入力画像の特徴量と特徴合成部８からの特徴量との差が最小値の特徴量のものを認識結果として出力する。（図４のＳ15ステップ）
また、図示はしていないが、単語の中には、太秦馬塚、太秦垣内のように、同一部分文字列を含む複合語が多数存在する。そこで特徴量合成時に毎回「太」と「秦」から「太秦」を合成するのではなく、予め「太秦」ついては、例えば単語辞書１６より１／２文字サイズの特徴量を抽出する。そして、個別文字辞書７から１／４サイズの「馬」＋１／４サイズの「塚」の文字の特徴量を抽出し、「太秦」＋「馬」＋「塚」の特徴量から単語特徴量を合成する方式である。
（２）傾斜度≧閾値の場合。
【００７４】
図６に傾斜度≧閾値の場合の認識処理部１７の説明図を示す。
【００７５】
図６（ａ）は、処理の流れ、図６（ｂ）に住所例を示す。
【００７６】
住所例で「東京」という入力画像の文字列を抽出後、正規化部３で、傾斜のある単語として正規化を行ったあと特徴抽出部４で特徴抽出を行う。
次に、都道府県の単語リストから単語「北海」を取得し、単語を構成する文字をキーにして、個別文字辞書７から「北」と「海」の画像を取得する。（Ｓ51ステップ）取得された画像を傾斜度θに沿って配置する。（Ｓ52ステップ）
次に、その画像を入力画像の正規化サイズと同一のサイズに正規化する。（Ｓ53ステップ）正規化された単語画像をもとに特徴抽出を行う。（Ｓ54ステップ）
この抽出された特徴量と入力画像から抽出された特徴量とを比較し差分を記憶する。（Ｓ55ステップ）
以上の処理を単語リストの全単語について実施する。全単語の中で、差分の最小値のものを認識出力部から出力する。（Ｓ56ステップ）
また図示はしていないが、特徴照合部５において、例えば入力された単語が住所であり、「太秦○○」のどれかであると予めわかっているような場合は、「太秦」部分は、照合のための有効な特徴とならない。そこで、この部分の特徴量の重みを低くするかマスクしておき、それ以外の成分の重みを高くするか、そのままにして照合を行うことで、類似単語の特徴量の差を明確化する。これにより認識精度が高まる。
【００７７】
例えば入力画像が「太秦馬塚」だとすると、この文字列を切りだし、共通文字の部分「太秦」をマスクして残りの文字「馬塚」の部分のみで特徴抽出を行う。そして、次に単語リストから「太秦○○」を抽出する。例えば抽出した単語が「太秦垣内」であれば、「太秦」をマスクする。そして残りの「垣内」の部分の特徴量の合成をする。そして入力画像の特徴量と特徴合成した特徴量との照合を行う。この照合を単語リストの中の太秦を含む複合語のすべてについて行い、特徴量の差が最も小さいものを入力単語として特定する。
【００７８】
【発明の効果】
本発明によれば、単語が傾斜していても単語認識が可能であり、また単語を構成する文字が異なる文字サイズにおいても認識が可能である。
【００７９】
また、文字数に応じた文字サイズの選択による特徴量の合成により、単語認識精度を向上できる。さらに傾いた単語に対しても画像合成による特徴量抽出により単語の認識精度を高める。さらに複合語の場合の共通の部分文字列または文字の特徴を予め保持することにより、特徴合成のときの処理を高速化することができる。
【００８０】
また同一の文字または同一の部分文字列からなる単語間での特徴量に重み付けをすることで、誤読を減少することができる。
【図面の簡単な説明】
【図１】実施例１の単語認識装置の構成図
【図２】実施例２の単語認識装置の構成図
【図３】実施例３の単語認識装置の構成図
【図４】実施例３の傾斜度＜閾値の時の認識処理部の説明図
【図５】実施例３の特徴量合成の説明図
【図６】実施例３の傾斜度≧閾値の時の認識処理部の説明図
【図７】従来例の個別文字認識装置の構成図
【図８】従来例の単語認識装置の構成図
【符号の説明】
１単語認識装置
２画像入力部
３正規化部
４特徴抽出部
５特徴照合部
６認識結果出力部
７個別文字辞書
８特徴合成部
９単語リスト部
１０確信度算出部
１１確信度比較部
２１個別文字認識部
２２単語認識部

Claims

個別文字とその特徴量を格納する辞書と、
入力画像の単語を構成する個々の文字の特徴量と辞書の中の個々の文字の特徴量とを照合して単語を認識する個別文字認識部と、
前記入力画像と同一の入力画像から単語の特徴量を抽出した結果と、辞書の個々の文字の特徴量から単語の特徴量を合成した結果とを照合することで単語を認識する単語認識部と、
個別文字認識部の認識結果からの単語の確信度の算出と単語認識部の認識結果からの単語の確信度の算出とを行う確信度算出部と、
確信度算出部で算出された個別文字認識部と単語認識部の確信度算出結果を比較する確信度比較部とを備え、
確信度比較部は、確信度の比較結果に基づき、個別文字認識部と単語認識部の確信度の大きい方を選択することを特徴とする単語認識装置。