JPH08272907A

JPH08272907A - 文字認識装置及び方法

Info

Publication number: JPH08272907A
Application number: JP7069940A
Authority: JP
Inventors: Akinori Kawamura; 聡典河村
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1995-03-28
Filing date: 1995-03-28
Publication date: 1996-10-18

Abstract

(57)【要約】【目的】複数の認識手法による認識結果を効果的に統合
できるようにする。【構成】認識部２-1〜２-Nでの認識手法＃１〜＃Ｎによ
る認識結果を認識統合部３で受けて、認識手法ｉ＃によ
る認識の結果、候補文字ｗ_q が第ｘ_qi候補に現れるとし
た場合に、文字ｗ_q に関する認識候補順位ベクトルＸ_q
＝（ｘ_q1，ｘ_q2，…，ｘ_qN）を引数とする評価関数ｆ
（Ｘ_q ）を用い、評価値の大きい順に候補文字を出力す
る。この評価関数は、多数の学習用サンプルデータを認
識部２-1〜２-Nで認識して得られる認識候補順位ベクト
ルにつき、Ｐ（Ｘ）＝（Ｘに出現する候補文字が正解で
ある頻度総数）／（Ｘに出現する候補文字の頻度総数）
を求め、入力Ｘ、出力Ｐ（Ｘ）の組を、入力層の素子数
Ｎ、出力層の素子数１の３層以上のニューラルネットワ
ークで誤差逆伝播アルゴリズムにより認識統合評価関数
学習部４で学習させて得られる当該ネットワークの入出
力特性をもって求められる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、複数の認識手法を適用
した文字認識装置及び方法に関する。

【０００２】

【従来の技術】従来の文字認識装置は、単一の認識手法
によるものが一般的であった。このため、従来の文字認
識装置は、認識性能に限界があった。

【０００３】

【発明が解決しようとする課題】そこで近年は、単一の
認識手法の性能の限界を打ち破るために、複数の認識手
法を適用し、各認識手法による認識結果を統合して新し
い認識結果を出力する文字認識装置の実現が要望されて
いた。

【０００４】本発明は上記事情を考慮してなされたもの
でその目的は、複数の認識手法による認識結果を効果的
に統合することで、高い認識性能が実現できる文字認識
装置及び方法を提供することにある。

【０００５】

【課題を解決するための手段】本発明の第１の観点に係
る構成は、第１乃至第Ｎ（Ｎは２以上の整数）のＮ種類
の認識手法により同一認識対象に対する文字認識を行
い、第ｉ認識手法（ｉ＝１，２，…，Ｎ）によって認識
した結果、候補文字ｗ_q が第ｘ_qi候補に現れるとした場
合に、文字ｗ_q に関する認識候補順位ベクトルＸ_q ＝（ｘ_q1，ｘ_q2，…，ｘ_qN）を引数とする評価関数ｆ（Ｘ_q ）を用いて、その評価値
の大きい順に候補文字を出力する認識統合処理を行うよ
うにしたもので、多数の学習用サンプルデータを実際に
上記第１乃至第Ｎ認識手法で認識して得られる認識候補
順位ベクトルについて、Ｐ（Ｘ）＝（Ｘに出現する候補文字が正解である頻度総
数）／（Ｘに出現する候補文字の頻度総数）で定義されるＰ（Ｘ）を求め、入力Ｘ、出力Ｐ（Ｘ）の
組を入力層の素子数Ｎ、出力層の素子数１の３層以上の
ニューラルネットワークで誤差逆伝播アルゴリズムによ
って学習させて得られるニューラルネットワークの入出
力特性関数をもって上記認識統合処理で用いる評価関数
ｆ（Ｘ）とするようにしたことを特徴とするものであ
る。

【０００６】本発明の第２の観点に係る構成は、上記評
価関数として、以下に示すｆ（Ｘ）、即ちｎ個の学習用
サンプルデータの第ｊ番目を第ｉ認識手法で認識させた
ときに、その正解文字ｗ_q が第ｘ_qji 候補に現れるとし
た場合に、

【０００７】

【数５】で定義される値Ｅをできる限り大きくする係数ｗ_i （ｉ
＝１，２，…，Ｎ）を用いた

【０００８】

【数６】を用いるようにしたことを特徴とする。

【０００９】本発明の第３の観点に係る構成は、第１乃
至第Ｎ（Ｎは２以上の整数）のＮ種類の認識手法により
同一認識対象に対する文字認識を行い、第ｉ認識手法
（ｉ＝１，２，…，Ｎ）によって認識した結果、候補文
字ｗ_q の認識スコアがｓ_qiである場合に、文字ｗ_q に関
する認識候補スコアベクトルＳ_q ＝（ｓ_q1，ｓ_q2，…，ｓ_qN）を引数とする評価関数ｆ（Ｓ_q ）を用いて、その評価値
の大きい順に候補文字を出力する認識統合処理を行うよ
うにしたもので、多数の学習用サンプルデータを実際に
上記第１乃至第Ｎ認識手法で認識して得られる認識候補
スコアベクトルについて、正解カテゴリーの認識候補ス
コアベクトルＳを入力した場合の出力を１、不正解カテ
ゴリーの認識候補スコアベクトルＳを入力した場合の出
力を０として、入力層の素子数Ｎ、出力層の素子数１の
３層以上のニューラルネットワークで誤差逆伝播アルゴ
リズムによって学習させて得られるニューラルネットワ
ークの入出力特性関数をもって上記認識統合処理で用い
る評価関数ｆ（Ｓ）とするようにしたことを特徴とす
る。

【００１０】

【作用】本発明によれば、上記のように、学習用サンプ
ルデータによる各認識手法（第１乃至第ＮのＮ種類の認
識手法）の出力結果の統計的性質により、Ｎ種類の認識
手法の統合処理が行われることから、Ｎ種類の認識手法
のお互いの弱点が相補われ、認識性能の向上が可能とな
る。

【００１１】

【実施例】以下、本発明の実施例につき図面を参照して
説明する。図１は本発明の一実施例に係る文字認識装置
の全体構成を示すブロック図である。

【００１２】この図１に示す文字認識装置は、文字の手
書き入力等に用いられる座標入力部１と、それぞれ固有
の認識手法（文字認識手法）による文字認識を行うＮ種
類の文字認識部２-1，２-2，…，２-Nと、これら各文字
認識部２-1〜２-Nからの認識結果情報と評価関数とを用
いて新しい認識結果を出力する認識統合部３と、この認
識統合部３で用いる評価関数を学習により決定する認識
統合評価関数学習部４と、認識統合部３で決定された認
識結果を利用者に提示する認識結果出力部５とから構成
される。

【００１３】なお、文字認識部２-1〜２-Nで適用される
各認識手法（認識手法＃１〜＃Ｎ）としては様々な手法
が提案されているが、ここではその認識方法自体につい
ては問わない。

【００１４】次に、図１の構成の動作を、認識統合部３
及び認識統合評価関数学習部４の動作を中心に、文字認
識部２-1〜２-Nでの各認識手法の順位に基づく統合処理
＃１を実施する場合を例に説明する。

【００１５】まず、座標入力部１を通して手書きされた
文字の軌跡を表す座標値列は各文字認識部２-1〜２-Nに
送られる。文字認識部２-1〜２-Nは、この手書き文字の
座標値列（入力パターン）を対象として、それぞれの認
識手法＃１〜＃Ｎにより周知の文字認識処理を行い、そ
の認識結果を順位付きで出力する。

【００１６】この順位付きの認識結果の具体例を、認識
手法＃１，＃２（を適用した文字認識部２-1，２-2）で
の認識結果について、図２に示す。なお、図２中の
（ａ，ｂ）の形式は、ａが順位を、ｂが認識結果の候補
文字を示す。例えば、（１，あ）は、認識結果の候補文
字が「あ」で、その順位（候補順位）が１位（即ち第１
位の候補文字）であることを示す。

【００１７】ここで、座標入力部１からの入力パターン
を文字認識部２-1〜２-Nが認識手法＃１〜＃Ｎで認識し
た結果、カテゴリーｗ_k が認識手法＃ｉ（ｉ＝１，２，
…，Ｎ）の第ｘ_ki候補文字（順位がｘ_ki位の候補文字）
に現れるとき、ベクトルＸ_k ＝（ｘ_k1，ｘ_k2，…，
ｘ_kN）をカテゴリーｗ_k の認識候補順位ベクトルと定義
する。

【００１８】図２の例の場合は、ｗ₁ ＝あ，ｗ₂ ＝め，ｗ₃ ＝おとすれば、Ｎ＝２であることから、Ｘ₁ ＝（１，２），Ｘ₂ ＝（２，１），Ｘ₃ ＝（３，
３）となる。

【００１９】さて、本実施例では、図１の構成の文字認
識装置を用いて（入力パターンに対する）通常の認識処
理を行う前に、予め正解カテゴリーの分かっているｎ個
の学習用のサンプルパターンについて、文字認識部２-1
〜２-Nにてそれぞれ固有の認識手法＃１〜＃Ｎにより認
識処理を行わせるようにしている。

【００２０】認識統合評価関数学習部４は、この文字認
識部２-1〜２-Nでの認識手法＃１〜＃Ｎによるｎ個の学
習用のサンプルパターンに対する順位付きの認識結果を
受けて、その結果から前記した認識候補順位ベクトルＸ
を求め、順位Ｘに候補が出現する総数ａｌｌ（Ｘ）と順
位Ｘに正解が出現する総数ｃｏｒｒｅｃｔ（Ｘ）を求め
る。

【００２１】そして認識統合評価関数学習部４は、求め
たａｌｌ（Ｘ）及びｃｏｒｒｅｃｔ（Ｘ）から、学習用
サンプルパターン（学習用サンプルデータ）について順
位Ｘの候補が正解である確率Ｐ（Ｘ）＝ｃｏｒｒｅｃｔ（Ｘ）／ａｌｌ（Ｘ）を計算する。

【００２２】例えば、文字認識部が文字認識部２-1と文
字認識部２-2の２つであり（Ｎ＝２の場合）、この２つ
の文字認識部２-1，２-2（での認識手法＃１，＃２）に
より図２のような認識結果が得られた場合には、（１）「あ」という候補文字が正解である確率Ｐ（Ｘ）はＰ（１，２）（２）「め」という候補文字が正解である確率Ｐ（Ｘ）はＰ（２，１）（３）「お」という候補文字が正解である確率Ｐ（Ｘ）はＰ（３，３）となる。

【００２３】そこで、認識統合部３を、この確率の大き
い順に候補文字を出力するように構成するならば、学習
用サンプルデータについての統合認識率は最高になるこ
とは数学的に明らかである。

【００２４】しかし、学習用サンプルデータは有限個で
あるため、Ｐ（Ｘ）は順位Ｘの候補が正解である真の確
率を表しているわけではない。このため、学習用サンプ
ルデータ以外のデータ（通常の入力パターン）を認識さ
せた場合に、Ｐ（Ｘ）の大きい順に候補文字を出力する
という統合手法では、必ずしも良い統合結果が得られる
とは限らない。

【００２５】図３は、文字認識部２-1，２-2で適用する
認識手法＃１，＃２から実際に学習により得られた（候
補文字の順位の組み合わせとその）正解確率Ｐ（ｘ₁ ，
ｘ₂）の例を示したものである。

【００２６】正解確率Ｐ（ｘ₁ ，ｘ₂ ）は、本来は、単
調減少する滑らかな曲面になることが望ましいが、図３
の例からは、学習用サンプルデータ数が有限個というこ
ともあり、関数曲面ががたついていることが分かる。

【００２７】そこで本実施例では、認識統合評価関数学
習部４において、図４に示すように、入力Ｘと出力Ｐ
（Ｘ）の組を、入力層の素子数Ｎ（Ｎは文字認識部
数）、出力層の素子数１の３層以上のニューラルネット
ワークで、例えば“麻生英樹著：「ニューラルネットワ
ーク情報処理」，産業図書，2.1.4 節（1988年）”に記
載されているような周知の誤差逆伝播（Error Back Pro
pagation）アルゴリズムによって学習させて、学習終了
後のニューラルネットワークの入出力特性ｆ（Ｘ）を、
認識統合部３での統合処理に用いる評価関数ｆ（Ｘ）と
するようにしている。即ち本実施例では、ニューラルネ
ットワークの汎化能力を利用して、真の確率に近付ける
ようとしている。

【００２８】さて、認識統合評価関数学習部４により得
られるニューラルネットワークの入出力特性ｆ（Ｘ）
は、認識統合部３での統合処理に用いる評価関数ｆ
（Ｘ）として当該認識統合部３に渡される。

【００２９】この結果、認識統合部３は、認識統合評価
関数学習部４により得られた評価関数ｆ（Ｘ）を用いる
ことで、その評価関数の大きい順に候補文字を出力す
る。即ち認識統合部３は、例えばｆ（Ｘ_Q1）≧ｆ（Ｘ_Q2）≧… であった場合であれば、Ｑ₁ ，Ｑ₂ ，…の順に候補文字
を出力する。

【００３０】こうして得られる２つの文字認識部２-1，
２-2（での認識手法＃１，＃２）による出力を認識統合
部３にて統合する評価関数の例を図５に示す。この図５
の例では、図３とは異なって、関数曲面が滑らかとなっ
ていることが分かる。

【００３１】以上、図１の構成の動作につき、文字認識
部２-1〜２-Nでの各認識手法の順位に基づく統合処理＃
１を実施する場合を列に説明したが、図１の構成におい
て、これとは別の統合処理＃２を適用することも可能で
ある。そこで、この文字認識部２-1〜２-Nでの各認識手
法の順位に基づく統合処理＃２について、以下に詳述す
る。

【００３２】まず、文字認識部２-1〜２-Nは、座標入力
部１から与えられる入力パターン（手書き文字の座標値
列）を対象として、それぞれの認識手法＃１〜＃Ｎによ
り文字認識処理を行い、その認識結果を図２の例のよう
に順位付きで出力する。

【００３３】認識統合部３は、座標入力部１からの入力
パターンを文字認識部２-1〜２-Nが認識手法＃１〜＃Ｎ
で認識した結果、カテゴリーｗ_k が認識手法＃ｉ（ｉ＝
１，２，…，Ｎ）の第ｘ_ki候補文字に現れるとき、認識
候補順位のベクトルＸ_q ＝（ｘ_k1，ｘ_k2，…，ｘ_kN）を用いて統合処理＃２を行う。

【００３４】このために、認識統合評価関数学習部４で
は、Ｘを引数とする評価関数ｆ（Ｘ）を学習により決定
する。認識統合部３は、認識統合評価関数学習部４によ
り決定された評価関数の大きい順に候補文字を出力す
る。即ち認識統合部３は、ｆ（Ｘ_Q1）≧ｆ（Ｘ_Q2）≧… であった場合であれば、Ｑ₁ ，Ｑ₂ ，…の順に候補文字
を出力する。

【００３５】さて、統合処理＃２を実施する場合、認識
統合評価関数学習部４は、評価関数を候補順位の線形和
で表すようにしている。例えば、図１の構成中の文字認
識部が文字認識部２-1と文字認識部２-2の２つであるも
のとすると（Ｎ＝２の場合）、認識統合評価関数学習部
４は、評価関数ｆ（ｘ₁ ，ｘ₂ ）をｆ（ｘ₁ ，ｘ₂ ）＝ｗ₁ ｘ₁ ＋ｗ₂ ｘ₂ で表し、最適な係数ｗ₁ ，ｗ₂ を次の方法によって決定
する。

【００３６】まず、第ｊ学習用サンプルパターンを文字
認識部２-1，２-2（での認識手法＃１，＃２）により認
識した結果、候補文字ｗ_k が候補順位の組（ｘ_kj1 ，ｘ
_kj2）に出現するものとする。ここで、正解文字をｗ_q
とすると、ｆ（ｘqj1 ，ｘqj2 ）＞ｆ（ｘ_kj1 ，ｘ_kj2 ）ｆｏｒａｌｌｋ≠ｑとなるように関数ｆ（Ｘ）を定めるならば、全てのｉに
ついてのｆ（ｘ_i1，ｘ_i2）のうちの最大値（ｍａｘｆ
（ｘ_i1，ｘ_i2））により正解カテゴリーを得ることがで
きる。全てのｉについて上記式を満たすことが不可能な
場合には正解カテゴリーを得ることはできないが、でき
るだけ多くのｉについて上記式を満たすように定めるな
らば、正解をより上位候補に上げることができる。そこ
で、認識統合評価関数学習部４は、ｎ個の全学習用サン
プルパターン（第１乃至第ｎ学習用サンプルパターン）
について、

【００３７】

【数７】なる値Ｅを定義し、この値Ｅをできるだけ大きくするＮ
個の係数ｗ₁ ，ｗ₂ ，…，ｗ_N を求める。ここで、係数
ｗ₁ ，ｗ₂ ，…，ｗ_N の総和は１であるものとする。

【００３８】今、Ｎ個の係数ｗ₁ ，ｗ₂ ，…，ｗ_N を、
ベクトルＷを用いてＷ＝（ｗ₁ ，ｗ₂ ，…，ｗ_N ）のように定義すると、認識統合評価関数学習部４は、上
記Ｅの値を大きくする係数（ベクトル）Ｗを、図６のフ
ローチャートに従って、次のようにして求める。

【００３９】まず認識統合評価関数学習部４は、Ｗの初
期値Ｗ₀ （Ｗ_k ＝Ｗ₀ ）を、例えば乱数等により定める
（ステップＳ１）。次に認識統合評価関数学習部４は、
第ｊ学習用サンプルパターンに対する認識手法＃ｉによ
る認識結果のカテゴリーｗ_i についての認識候補順位ベ
クトルＸ_ijについて、正解カテゴリーをｗ_q としたとき
に、Ｗ_k （Ｘ_qj−Ｘ_ij）＜０の場合であれば（ステップＳ２）、Ｗ_k+1 ＝Ｗ_k ＋ｃ（Ｘ_qj−Ｘ_ij）ｃは経験的に求められる係数で、例えば１より小さい正
の係数の計算を行って、Ｗ_k+1 を求め（ステップＳ
３）、Ｗ_k （Ｘ_qj−Ｘ_ij）≧０の場合であれば（ステップＳ２）、Ｗ_k+1 ＝Ｗ_k によりＷ_k+1 を求める（ステップＳ４）。

【００４０】このようにして求められるＷ_k+1 は、先の
Ｗ_k より上記Ｅの値を大きくするものとなる（Ｗ_k （Ｘ
_qj−Ｘ_ij）＜０の場合）。Ｗ_k （Ｘ_qj−Ｘ_ij）≧０の場
合には、Ｗ_k+1 は先のＷ_k と同じ結果となる。

【００４１】認識統合評価関数学習部４は、求めたＷ
_k+1 を新たなＷ_k として（ステップＳ５，Ｓ６）、上記
の計算処理（ステップＳ２，Ｓ３またはステップＳ２，
Ｓ４）を再び行う。

【００４２】認識統合評価関数学習部４は、以上の動作
を予め定められた回数繰り返す。この繰り返し後のＷ
_k+1 が、上記Ｅの値を大きくするＷ、即ち係数ｗ₁ ，ｗ
₂ ，…，ｗ_N を示す。認識統合評価関数学習部４は、以
上の処理により目的とする係数ｗ_i （ｉ＝１，２，…，
Ｎ）を求めると、その係数を用いて、次式

【００４３】

【数８】に従って、認識統合部３で用いる評価関数ｆ（Ｘ）を求
める。

【００４４】この結果、図１の構成の文字認識部が文字
認識部２-1と文字認識部２-2の２つであるものとすると
（Ｎ＝２の場合）、評価関数ｆ（Ｘ）、即ちｆ（ｘ₁ ，
ｘ₂）は、前記したようにｆ（ｘ₁ ，ｘ₂ ）＝ｗ₁ ｘ₁ ＋ｗ₂ ｘ₂ となる。

【００４５】以上は、文字認識部２-1〜２-Nが認識結果
を順位付きで出力する場合について説明したが、本発明
は、認識結果を類似度、距離値などのスコア（評価値）
付きで出力する場合にも、適用可能である。

【００４６】そこで、図１の構成における文字認識部２
-1〜２-Nが認識結果をスコア付きで出力するものとし
て、文字認識部２-1〜２-Nでの各認識手法の評価値（ス
コア）に基づく統合処理＃３を実施する場合の動作につ
き説明する。

【００４７】まず、この例における文字認識部２-1〜２
-Nは、座標入力部１からの入力パターンを対象として、
それぞれの認識手法＃１〜＃Ｎにより文字認識処理を行
い、その認識結果をスコア付きで出力する。

【００４８】このスコア付きの認識結果の具体例を、認
識手法＃１，＃２（を適用した文字認識部２-1，２-2）
での認識結果について、図７に示す。なお、図７中の
（ｃ，ｄ）の形式は、ｃがスコアを、ｂが認識結果の候
補文字を示す。例えば、（０．９７，あ）は、認識結果
の候補文字が「あ」で、そのスコア（例えば類似度）が
０．９７であることを示す。

【００４９】ここで、座標入力部１からの入力パターン
を文字認識部２-i（ｉ＝１，２，…，Ｎ）が認識手法＃
ｉで認識した結果、当該文字認識部２-iから出力され
る、入力パターンとカテゴリーｗ_k との類似度（あるい
は距離値などのスコア）をｓ_kiで表すとき、ベクトルＳ_k ＝（ｓ_k1，ｓ_k2，…，ｓ_kN）をカテゴリーｗ_k の認識候補類似度ベクトル（認識候補
スコアベクトル）と定義する。

【００５０】図７の例の場合は、ｗ₁ ＝あ，ｗ₂ ＝め，ｗ₃ ＝おとすれば、Ｎ＝２であることから、Ｓ₁ ＝（０．９７，０．８８）Ｓ₂ ＝（０．９０，０．９２）Ｓ₃ ＝（０．８７，０．８３）となる。

【００５１】さて、本実施例では、図１の構成の文字認
識装置を用いて（入力パターンに対する）通常の認識処
理を行う前に、予め正解カテゴリーの分かっているｎ個
の学習用のサンプルパターンについて、文字認識部２-1
〜２-Nにてそれぞれ固有の認識手法＃１〜＃Ｎにより認
識処理を行わせるようにしている。

【００５２】認識統合評価関数学習部４は、この文字認
識部２-1〜２-Nでの認識手法＃１〜＃Ｎによるｎ個の学
習用のサンプルパターンに対する類似度（スコア）付き
の認識結果を受けて、その結果から前記した認識候補類
似度ベクトルＳを求める。

【００５３】そして認識統合評価関数学習部４は、入力
層の素子数Ｎ、出力層の素子数１の３層以上のニューラ
ルネットワークに、正解カテゴリーの認識候類似度ベク
トルＳを入力した場合には出力１、不正解カテゴリーの
認識候補スコアベクトルＳを入力した場合には出力０と
なるように、誤差逆伝播アルゴリズムによって学習させ
て、学習終了後のニューラルネットワークの入出力特性
ｆ（Ｓ）を、認識統合部３での統合処理に用いる評価関
数ｆ（Ｓ）とするようにしている。

【００５４】このように認識統合評価関数学習部４は、
Ｓを引数とする評価関数ｆ（Ｓ）を学習により求める
と、それを認識統合部３に渡す。認識統合部３は、認識
統合評価関数学習部４により得られた評価関数ｆ（Ｓ）
を用いることで、その評価関数の大きい順に候補文字を
出力する。即ち認識統合部３は、例えばｆ（Ｓ_Q1）≧ｆ（Ｓ_Q2）≧… であった場合であれば、Ｑ₁ ，Ｑ₂ ，…の順に候補文字
を出力する。

【００５５】以上に述べた、２つの文字認識部２-1，２
-2での認識手法＃１，＃２による出力（認識結果）を認
識統合部３にて統合した結果の性能評価の例を、統合処
理＃１，＃２，＃３を実施したそれぞれの場合につい
て、認識手法＃１，＃２を単独で用いた場合と対比させ
て、図８に示す。ここでは、統合処理＃１，＃２，＃３
により、いずれの場合にも認識率が３０％以上向上して
いることが分かる。

【００５６】なお、前記実施例では、図１の構成の文字
認識装置に認識統合評価関数学習部４が設けられている
ものとして説明したが、これに限るものではない。例え
ば、認識統合評価関数学習部４を文字認識装置から切り
離して設け、文字認識部２-1〜２-Nの持つ認識手法＃１
〜＃Ｎと同様の認識手法でｎ個の学習用サンプルパター
ンをそれぞれ認識させて、その認識結果をもとに、（上
記文字認識装置から切り離して設けた）認識統合評価関
数学習部４にて、前記したような学習により統合処理の
ための評価関数を決定し、この決定した評価関数を文字
認識装置内の認識統合部３に予め設定しておくようにし
ても構わない。

【００５７】

【発明の効果】以上詳述したように本発明の文字認識装
置及び方法によれば、学習用サンプルデータによる複数
の認識手法の出力結果の統計的性質により、各認識手法
の統合処理が行われることから、これら各認識手法によ
る認識結果を効果的に統合して、高い認識性能を実現す
ることができる。

【図面の簡単な説明】

【図１】本発明の一実施例に係る文字認識装置の全体構
成を示すブロック図。

【図２】図１中の文字認識部２-1，２-2からの順位付き
の認識結果の出力例を示す図。

【図３】２つの認識手法による候補文字の順位の組み合
わせとその正解確率の例を示す図。

【図４】ニューラルネットワークを説明するための図。

【図５】２つの認識手法による候補文字の順位の組み合
わせとその正解確率をニューラルネットワークで学習し
た結果得られた評価関数で表した図。

【図６】候補順位の線形和で表される評価関数の係数を
求める手順を説明するためのフローチャート。

【図７】図１中の文字認識部２-1，２-2からのスコア付
きの認識結果の出力例を示す図。

【図８】文字認識部２-1，２-2での認識手法＃１，＃２
による出力を認識統合部３にて統合した結果の性能評価
の例を、統合処理＃１，＃２，＃３を実施したそれぞれ
の場合について、認識手法＃１，＃２を単独で用いた場
合と対比させて示す図。

【符号の説明】

１…座標入力部、２-1〜２-N…文字認識部、３…認識統
合部、４…認識統合評価関数学習部、５…認識結果出力
部。

Claims

【特許請求の範囲】

【請求項１】第１乃至第Ｎ認識手法（Ｎは２以上の整
数）による文字認識を行う第１乃至第Ｎの文字認識手段
と、この第１乃至第Ｎの文字認識手段からの同一認識対象に
対する各認識結果情報を用いて新しい認識結果を出力す
る認識統合手段であって、第ｉ認識手法（ｉ＝１，２，
…，Ｎ）によって認識した結果、候補文字ｗ_q が第ｘ_qi
候補に現れるとした場合に、文字ｗ_q に関する認識候補
順位ベクトルＸ_q ＝（ｘ_q1，ｘ_q2，…，ｘ_qN）を引数とする評価関数ｆ（Ｘ_q ）を用いて、その評価値
の大きい順に候補文字を出力する認識統合手段と、この認識統合手段で用いる評価関数ｆ（Ｘ）を学習によ
り決定する認識統合評価関数学習手段であって、多数の
学習用サンプルデータを実際に前記第１乃至第Ｎ文字認
識手段で認識して得られる認識候補順位ベクトルについ
て、Ｐ（Ｘ）＝（Ｘに出現する候補文字が正解である頻度総
数）／（Ｘに出現する候補文字の頻度総数）で定義されるＰ（Ｘ）を求め、入力Ｘ、出力Ｐ（Ｘ）の
組を、入力層の素子数Ｎ、出力層の素子数１の３層以上
のニューラルネットワークで誤差逆伝播アルゴリズムに
よって学習させて得られるニューラルネットワークの入
出力特性関数をもって前記評価関数ｆ（Ｘ）とする認識
統合評価関数学習手段とを具備することを特徴とする文
字認識装置。
【請求項２】第１乃至第Ｎ認識手法（Ｎは２以上の整
数）による文字認識を行う第１乃至第Ｎの文字認識手段
と、この第１乃至第Ｎの文字認識手段からの同一認識対象に
対する各認識結果情報を用いて新しい認識結果を出力す
る認識統合手段であって、第ｉ認識手法（ｉ＝１，２，
…，Ｎ）によって認識した結果、候補文字ｗ_q が第ｘ_qi
候補に現れるとした場合に、文字ｗ_q に関する認識候補
順位ベクトルＸ_q ＝（ｘ_q1，ｘ_q2，…，ｘ_qN）を引数とする評価関数ｆ（Ｘ_q ）を用いて、その評価値
の大きい順に候補文字を出力する認識統合手段と、この認識統合手段で用いる評価関数ｆ（Ｘ）を学習によ
り決定する認識統合評価関数学習手段であって、ｎ個の
学習用サンプルデータの第ｊ番目を第ｉ認識手法で認識
させたときに、その正解文字ｗ_q が第ｘ_qji 候補に現れ
るとした場合に、【数１】で定義される値Ｅをできる限り大きくする係数ｗ_i （ｉ
＝１，２，…，Ｎ）を用いた【数２】を前記評価関数とする認識統合評価関数学習手段とを具
備することを特徴とする文字認識装置。
【請求項３】第１乃至第Ｎ認識手法（Ｎは２以上の整
数）による文字認識を行う第１乃至第Ｎの文字認識手段
と、この第１乃至第Ｎの文字認識手段からの同一認識対象に
対する各認識結果情報を用いて新しい認識結果を出力す
る認識統合手段であって、第ｉ認識手法（ｉ＝１，２，
…，Ｎ）によって認識した結果、候補文字ｗ_q の認識ス
コアがｓ_qiである場合に、文字ｗ_q に関する認識候補ス
コアベクトルＳ_q ＝（ｓ_q1，ｓ_q2，…，ｓ_qN）を引数とする評価関数ｆ（Ｓ_q ）を用いて、その評価値
の大きい順に候補文字を出力する認識統合手段と、この認識統合手段で用いる評価関数ｆ（Ｓ）を学習によ
り決定する認識統合評価関数学習手段であって、多数の
学習用サンプルデータを実際に前記第１乃至第Ｎ文字認
識手段で認識して得られる認識候補スコアベクトルにつ
いて、正解カテゴリーの認識候補スコアベクトルＳを入
力した場合の出力を１、不正解カテゴリーの認識候補ス
コアベクトルＳを入力した場合の出力を０として、入力
層の素子数Ｎ、出力層の素子数１の３層以上のニューラ
ルネットワークで誤差逆伝播アルゴリズムによって学習
させて得られるニューラルネットワークの入出力特性関
数をもって前記評価関数ｆ（Ｓ）とする認識統合評価関
数学習手段とを具備することを特徴とする文字認識装
置。
【請求項４】第１乃至第Ｎ（Ｎは２以上の整数）のＮ
種類の認識手法により同一認識対象に対する文字認識を
行い、第ｉ認識手法（ｉ＝１，２，…，Ｎ）によって認識した
結果、候補文字ｗ_q が第ｘ_qi候補に現れるとした場合
に、文字ｗ_q に関する認識候補順位ベクトルＸ_q ＝（ｘ_q1，ｘ_q2，…，ｘ_qN）を引数とする評価関数ｆ（Ｘ_q ）を用いて、その評価値
の大きい順に候補文字を出力する認識統合処理を行う文
字認識方法であって、多数の学習用サンプルデータを実際に前記第１乃至第Ｎ
認識手法で認識して得られる認識候補順位ベクトルにつ
いて、Ｐ（Ｘ）＝（Ｘに出現する候補文字が正解である頻度総
数）／（Ｘに出現する候補文字の頻度総数）で定義されるＰ（Ｘ）を求め、入力Ｘ、出力Ｐ（Ｘ）の
組を、入力層の素子数Ｎ、出力層の素子数１の３層以上
のニューラルネットワークで誤差逆伝播アルゴリズムに
よって学習させて得られるニューラルネットワークの入
出力特性関数をもって前記認識統合処理で用いる評価関
数ｆ（Ｘ）とするようにしたことを特徴とする文字認識
方法。
【請求項５】第１乃至第Ｎ（Ｎは２以上の整数）のＮ
種類の認識手法により同一認識対象に対する文字認識を
行い、第ｉ認識手法（ｉ＝１，２，…，Ｎ）によって認識した
結果、候補文字ｗ_q が第ｘ_qi候補に現れるとした場合
に、文字ｗ_q に関する認識候補順位ベクトルＸ_q ＝（ｘ_1q，ｘ_2q，…，ｘ_Nq）を引数とする評価関数ｆ（Ｘ_q ）を用いて、その評価値
の大きい順に候補文字を出力する認識統合処理を行う文
字認識方法であって、ｎ個の学習用サンプルデータの第ｊ番目を第ｉ認識手法
で認識させたときに、その正解文字ｗ_q が第ｘ_qji 候補
に現れるとした場合に、【数３】で定義される値Ｅをできる限り大きくする係数ｗ_i （ｉ
＝１，２，…，Ｎ）を用いた【数４】を前記認識統合処理で用いる評価関数とするようにした
ことを特徴とする文字認識方法。
【請求項６】第１乃至第Ｎ（Ｎは２以上の整数）のＮ
種類の認識手法により同一認識対象に対する文字認識を
行い、第ｉ認識手法（ｉ＝１，２，…，Ｎ）によって認識した
結果、候補文字ｗ_q の認識スコアがｓ_qiである場合に、
文字ｗ_q に関する認識候補スコアベクトルＳ_q ＝（ｓ_q1，ｓ_q2，…，ｓ_qN）を引数とする評価関数ｆ（Ｓ_q ）を用いて、その評価値
の大きい順に候補文字を出力する認識統合処理を行う文
字認識方法であって、多数の学習用サンプルデータを実際に前記第１乃至第Ｎ
認識手法で認識して得られる認識候補スコアベクトルに
ついて、正解カテゴリーの認識候補スコアベクトルＳを
入力した場合の出力を１、不正解カテゴリーの認識候補
スコアベクトルＳを入力した場合の出力を０として、入
力層の素子数Ｎ、出力層の素子数１の３層以上のニュー
ラルネットワークで誤差逆伝播アルゴリズムによって学
習させて得られるニューラルネットワークの入出力特性
関数をもって前記認識統合処理で用いる評価関数ｆ
（Ｓ）とするようにしたことを特徴とする文字認識方
法。