JP5344956B2

JP5344956B2 - 文字認識方法および文字認識装置

Info

Publication number: JP5344956B2
Application number: JP2009047291A
Authority: JP
Inventors: 和歳鵜飼
Original assignee: Glory Ltd
Current assignee: Glory Ltd
Priority date: 2009-02-27
Filing date: 2009-02-27
Publication date: 2013-11-20
Anticipated expiration: 2029-02-27
Also published as: JP2010204766A

Description

この発明は、光学的に読み取った文字データを各文字に対応した文字テンプレートとそれぞれ対比することで文字認識を行う文字認識方法および文字認識装置に関し、特に、認識対象とする文字種の傾向が異なる場合であっても文字認識に用いる閾値を適切に設定することができるとともに、文字認識精度を向上させることができる文字認識方法および文字認識装置に関する。

従来から、ＯＣＲ（Optical Character Reader）と呼ばれる光学式文字読取装置が知られている。かかるＯＣＲでは、スキャナで読み取った入力文字画像を、字種ごとに用意された文字テンプレートと比較することで、文字を認識する。

しかし、文字を正しく読み取る（以下、「正読」と記載する）ことは容易ではなく、所定の割合で、文字を誤って読み取る（以下、「誤読」と記載する）ケースが発生する。このため、実際の読み取り結果を学習することによって、上記した正読の確率（正読率）を向上させる試みが種々行われている。

たとえば、特許文献１には、所定の文字種に対応する文字テンプレートに対し、正解でありながら誤読と判定された入力文字画像を正解カテゴリの追加テンプレートとして登録する技術が開示されている。これにより、追加テンプレートの登録前には誤読としてしまっていた入力文字画像を、追加テンプレートの登録後には正読とすることができる。

特開平１１−１７５６６０号公報

しかしながら、特許文献１の技術は、いわば文字テンプレートの適用範囲を拡大する手法であるので、特定の文字種についての正読率を向上させると、他の文字種、特に、特定の文字種に類似する近傍文字種についての正読率を低下させてしまうという問題がある。このため、追加テンプレートの登録前には正読とされていた近傍文字種が、追加テンプレートの登録後には誤読とされてしまうケースが発生する。

ところで、入力文字画像と、字種ごとに用意された文字テンプレートとを比較し、最も良好な文字テンプレートを選択する場合、入力文字画像と文字テンプレートとの差異の数値化が行われる。そして、算出された数値を、正読と誤読とを分離するための所定の閾値と比較することが一般的に行われている。

しかし、かかる閾値は、開発段階では多次元で設定されているため、ＯＣＲ（光学式文字読取装置）ごとにある程度（たとえば、１次元へ）固定化されることが一般的であり、利用者には１次元での簡易的な変更しか認められていなかった。このため、利用者の業務種別などによって文字種の出現傾向が変化するにもかかわらず、多次元のレベルで細かく閾値を調整することが困難であった。なお、仮に、利用者に対して多次元の閾値の変更を認めた場合であっても、閾値の調整には高度な経験が必要であるため、利用者が適切な閾値を設定することが困難であるという問題もあった。

これらのことから、認識対象とする文字種の傾向が異なる場合であっても文字認識に用いる閾値を適切に設定することができるとともに、文字認識精度を向上させることができる文字認識方法あるいは文字認識装置をいかにして実現するかが大きな課題となっている。

本発明は、上述した従来技術による問題点を解消するためになされたものであって、認識対象とする文字種の傾向が異なる場合であっても文字認識に用いる閾値を適切に設定することができるとともに、文字認識精度を向上させることができる文字認識方法および文字認識装置を提供することを目的とする。

上述した課題を解決し、目的を達成するために、本発明は、光学的に読み取った文字データを各文字に対応した文字テンプレートとそれぞれ対比することで文字認識を行う文字認識方法であって、前記文字データと前記文字テンプレートとの違いをあらわす距離値をそれぞれ算出したうえで、前記距離値が最も小さい前記文字テンプレートを１位候補とするとともに、前記距離値が２番目に小さい前記文字テンプレートを２位候補とした場合に、前記文字データと前記１位候補との前記距離値をあらわす１位候補距離値と、前記文字データと前記２位候補との前記距離値から前記１位候補距離値を差し引いた距離差とを算出する距離算出工程と、同一文字種の各文字データについての前記１位候補距離値および前記距離差を正読または誤読の別と対応付けてサンプル値として記憶するサンプル値記憶工程と、前記サンプル値記憶工程によって記憶された前記サンプル値を、前記１位候補距離値を第１の軸、前記距離差を第２の軸とする２次元空間に配置したうえで、正読のサンプル値の分布について所定の正読率をあらわす形状が楕円である正読確率楕円からなる閉領域の正読確率領域と、誤読のサンプル値の分布について所定の誤読率をあらわす形状が楕円である誤読確率楕円からなる閉領域の誤読確率領域とを生成する確率領域生成工程と、前記確率領域生成工程によって生成された前記正読確率領域および前記誤読確率領域の位置関係に基づいて前記文字データに対する文字認識結果を正読とするか否かの判定に用いる境界線を決定する境界線決定工程と、前記文字認識結果に対応する前記１位候補距離値および前記距離差の組を前記境界線決定工程で決定された前記境界線と対比することで当該文字認識結果を正読として受け付けるか否かを判定する判定工程とを含み、前記境界線決定工程は、前記正読確率楕円と前記誤読確率楕円との中間点を通過するとともに前記第２の軸と平行な直線である第１の境界線と、前記中間点および前記正読確率楕円の重心を前記第１の軸へ射影した点を通過する直線である第２の境界線とを決定し、前記判定工程は、前記第１の境界線以下であり、かつ、前記第２の境界線以上である前記２次元空間に含まれる前記文字認識結果を正読として受け付けると判定することを特徴とする。

また、本発明は、上記の発明において、前記境界線決定工程は、前記正読確率楕円と前記誤読確率楕円とが交差して前記中間点が存在しない場合に、前記中間点を通過する代わりに前記正読確率楕円または前記誤読確率楕円に接するように前記第１の境界線および前記第２の境界線を決定することを特徴とする。

また、本発明は、上記の発明において、前記確率領域生成工程は、複数の前記正読率について前記正読確率楕円をそれぞれ生成するとともに、複数の前記誤読率について前記誤読確率楕円をそれぞれ生成し、前記境界線決定工程は、複数の前記正読確率楕円のうち１つと複数の前記誤読確率楕円のうち１つとを用いて前記境界線を決定することを特徴とする。

また、本発明は、上記の発明において、前記正読確率楕円と前記誤読確率楕円とが交差して前記中間点が存在しない場合に、前記第１の境界線および前記第２の境界線について、前記中間点を通過させる代わりに複数の前記正読確率楕円または複数の前記誤読確率楕円のうちいずれの接線とするかを利用者に選択させる選択工程と、前記選択工程における選択によって決定された前記第１の境界線および前記第２の境界線と前記サンプル値の分布とを含んだ分布図と、当該分布図における前記第１の境界線および前記第２の境界線によって正読であるにも関わらずリジェクトされた前記サンプル値の割合をあらわす正読リジェクト率および／または誤読を誤読として正当にリジェクトされた前記サンプル値の割合をあらわす誤読リジェクト率を示すリジェクト率グラフとを表示する表示工程とをさらに含んだことを特徴とする。

また、本発明は、上記の発明において、前記境界線決定工程は、前記第１の境界線を複数の前記正読確率楕円または複数の前記誤読確率楕円のうちいずれの接線とするかをあらわす第１の接線候補と、前記第２の境界線を複数の前記正読確率楕円または複数の前記誤読確率楕円のうちいずれの接線とするかをあらわす第２の接線候補との各組合せについて、前記正読リジェクト率が所定の許容上限値以下であり、かつ、前記誤読リジェクト率が所定の許容下限値以上である前記組合せを抽出し、前記表示工程は、前記境界線決定工程によって抽出された前記組合せを前記リジェクト率グラフに含めて表示することを特徴とする。

また、本発明は、上記の発明において、前記境界線決定工程は、複数の前記組合せが抽出された場合に、前記各組合せについて予め定められた優先度に基づいて１つの前記組合せを決定し、当該組合せに対応する前記第１の境界線および前記第２の境界線を決定することを特徴とする。

また、本発明は、上記の発明において、前記境界線決定工程は、前記サンプル値記憶工程によって記憶された前記サンプル値の個数が所定の基準値を超えるたびに、前記境界線を再決定することを特徴とする。
また、本発明は、上記の発明において、前記サンプル値記憶工程は、前記サンプル値に対して、正しい読みや、スキャナによる文字データを追加して記憶することを特徴とする。

また、本発明は、光学的に読み取った文字データを各文字に対応した文字テンプレートとそれぞれ対比することで文字認識を行う文字認識装置であって、前記文字データと前記文字テンプレートとの違いをあらわす距離値をそれぞれ算出したうえで、前記距離値が最も小さい前記文字テンプレートを１位候補とするとともに、前記距離値が２番目に小さい前記文字テンプレートを２位候補とした場合に、前記文字データと前記１位候補との前記距離値をあらわす１位候補距離値と、前記文字データと前記２位候補との前記距離値から前記１位候補距離値を差し引いた距離差とを算出する距離算出手段と、同一文字種の各文字データについての前記１位候補距離値および前記距離差を正読または誤読の別と対応付けてサンプル値として記憶するサンプル値記憶手段と、前記サンプル値記憶手段によって記憶された前記サンプル値を、前記１位候補距離値を第１の軸、前記距離差を第２の軸とする２次元空間に配置したうえで、正読のサンプル値の分布について所定の正読率をあらわす形状が楕円である正読確率楕円からなる閉領域の正読確率領域と、誤読のサンプル値の分布について所定の誤読率をあらわす形状が楕円である誤読確率楕円からなる閉領域の誤読確率領域とを生成する確率領域生成手段と、前記確率領域生成手段によって生成された前記正読確率領域および前記誤読確率領域の位置関係に基づいて前記文字データに対する文字認識結果を正読とするか否かの判定に用いる境界線を決定する境界線決定手段と、前記文字認識結果に対応する前記１位候補距離値および前記距離差の組を前記境界線決定手段で決定された前記境界線と対比することで当該文字認識結果を正読として受け付けるか否かを判定する判定手段とを備え、前記境界線決定手段は、前記正読確率楕円と前記誤読確率楕円との中間点を通過するとともに前記第２の軸と平行な直線である第１の境界線と、前記中間点および前記正読確率楕円の重心を前記第１の軸へ射影した点を通過する直線である第２の境界線とを決定し、前記判定手段は、前記第１の境界線以下であり、かつ、前記第２の境界線以上である前記２次元空間に含まれる前記文字認識結果を正読として受け付けると判定することを特徴とする。

本発明によれば、文字データと文字テンプレートとの違いをあらわす距離値をそれぞれ算出したうえで、距離値が最も小さい文字テンプレートを１位候補とするとともに、距離値が２番目に小さい文字テンプレートを２位候補とした場合に、文字データと１位候補との距離値をあらわす１位候補距離値と、文字データと２位候補との距離値から１位候補距離値を差し引いた距離差とを算出し、同一文字種の各文字データについての１位候補距離値および距離差を正読または誤読の別と対応付けてサンプル値として記憶し、記憶されたサンプル値を、１位候補距離値を第１の軸、距離差を第２の軸とする２次元空間に配置したうえで、正読のサンプル値の分布について所定の正読率をあらわす形状が楕円である正読確率楕円からなる閉領域の正読確率領域と、誤読のサンプル値の分布について所定の誤読率をあらわす形状が楕円である誤読確率楕円からなる閉領域の誤読確率領域とを生成し、生成された正読確率領域および誤読確率領域の位置関係に基づいて文字データに対する文字認識結果を正読とするか否かの判定に用いる境界線を決定し、文字認識結果に対応する１位候補距離値および距離差の組を決定された境界線と対比することで文字認識結果を正読として受け付けるか否かを判定することとしたので、正読率および誤読率を加味した境界線を用いることで、文字認識に用いる閾値を適切に設定することができるとともに、文字認識の認識精度を向上させることができるという効果を奏する。
特に、正読確率領域として形状が楕円である正読確率楕円を生成するとともに、誤読確率領域として形状が楕円である誤読確率楕円を生成することとしたので、幾何的な計算を行いやすい確率楕円を、境界線を決定するための指標として利用することによって、境界線の決定を容易に行うことができるという効果を奏する。また、正読確率楕円と誤読確率楕円との中間点を通過するとともに第２の軸と平行な直線である第１の境界線と、中間点および正読確率楕円の重心を第１の軸へ射影した点を通過する直線である第２の境界線とを決定し、第１の境界線以下であり、かつ、第２の境界線以上である２次元空間に含まれる文字認識結果を正読として受け付けると判定することとしたので、簡単な処理で境界線を決定することができるとともに、文字認識精度を向上させることができるという効果を奏する。

また、本発明によれば、正読確率楕円と誤読確率楕円とが交差して中間点が存在しない場合に、中間点を通過する代わりに正読確率楕円または誤読確率楕円に接するように第１の境界線および第２の境界線を決定することとしたので、正読確率楕円と誤読確率楕円とが交差する場合であっても各確率楕円の位置に応じて境界線を決定することができるという効果を奏する。

また、本発明によれば、複数の正読率について正読確率楕円をそれぞれ生成するとともに、複数の誤読率について誤読確率楕円をそれぞれ生成し、複数の正読確率楕円のうち１つと複数の誤読確率楕円のうち１つとを用いて境界線を決定することとしたので、利用者のニーズに応じた境界線を決定することができるという効果を奏する。

また、本発明によれば、正読確率楕円と誤読確率楕円とが交差して中間点が存在しない場合に、第１の境界線および第２の境界線について、中間点を通過させる代わりに複数の正読確率楕円または複数の誤読確率楕円のうちいずれの接線とするかを利用者に選択させ、選択によって決定された第１の境界線および第２の境界線とサンプル値の分布とを含んだ分布図と、この分布図における第１の境界線および第２の境界線によって正読であるにも関わらずリジェクトされたサンプル値の割合をあらわす正読リジェクト率および／または誤読を誤読として正当にリジェクトされたサンプル値の割合をあらわす誤読リジェクト率を示すリジェクト率グラフとを表示することとしたので、専門知識がない利用者に対しても、境界線選択を容易に行わせることができるという効果を奏する。

また、本発明によれば、第１の境界線を複数の正読確率楕円または複数の誤読確率楕円のうちいずれの接線とするかをあらわす第１の接線候補と、第２の境界線を複数の正読確率楕円または複数の誤読確率楕円のうちいずれの接線とするかをあらわす第２の接線候補との各組合せについて、正読リジェクト率が所定の許容上限値以下であり、かつ、誤読リジェクト率が所定の許容下限値以上である組合せを抽出し、抽出された組合せをリジェクト率グラフに含めて表示することとしたので、利用者による境界線選択を容易化することができるという効果を奏する。

また、本発明によれば、複数の組合せが抽出された場合に、各組合せについて予め定められた優先度に基づいて１つの組合せを決定し、この組合せに対応する第１の境界線および第２の境界線を決定することとしたので、複数の組合せが抽出された場合であっても自動的に境界線を決定することができるという効果を奏する。

また、本発明によれば、記憶されたサンプル値の個数が所定の基準値を超えるたびに、境界線を再決定することとしたので、サンプル個数の増加に伴って適宜最適な境界線へと更新していくことができるという効果を奏する。

図１は、本発明に係る文字認識手法の概要を示す図である。図２は、文字認識装置の構成を示すブロック図である。図３は、文字認識結果と閾値判定結果との関係を示す図である。図４は、確率楕円および境界線を付加したサンプル分布図である。図５は、確率楕円が交差する場合のサンプル分布図である。図６は、境界線の組合せ候補を示す図である。図７は、境界線の組合せ例および各組合せにおける正読リジェクト率および誤読リジェクト率を示す図である。図８は、組合せに対応する境界線を示す図である。図９は、優先度を付加した組合せ候補を示す図である。図１０は、組合せ候補の絞り込み例を示す図である。図１１は、境界線決定の例外処理の概要を示す図である。図１２は、文字認識装置が実行する処理手順を示すフローチャートである。図１３は、閾値変更処理の処理手順を示すフローチャートである。

以下に添付図面を参照して、本発明に係る文字認識方法および文字認識装置の実施例を詳細に説明する。なお、以下の説明では、本発明に係る文字認識手法の概要について図１を用いて説明した後に、本発明に係る文字認識手法を適用した文字認識装置の実施例について説明することとする。

まず、実施例の詳細な説明に先立って、本発明に係る文字認識手法の概要について図１を用いて説明する。図１は、本発明に係る文字認識手法の概要を示す図である。なお、同図の１ａには、所定の文字（同図では「也」）についてのスキャンデータと、各候補文字種に対応するテンプレートとの差異を示す「距離値」算出の概要について、同図の１ｂには、所定の文字（同図では「也」）について取得したサンプルの分布について、それぞれ示している。

本発明に係る文字認識手法では、所定の文字についてのスキャンデータを、各候補文字種に対応するテンプレートと対比する。そして、両者の差異を所定の文字認識関数を用いて数値化し、距離値として算出する。ここで、文字認識関数としては、特開２００２−１４０６６３号公報に開示されている文字認識関数を使用するものとするが、他の一般的な文字認識関数を用いることとしてもよい。

同図の１ａに示したように、文字認識関数を用いて各距離値を算出したならば、各テンプレートを距離値が小さい順に並べる。すなわち、最も距離値が小さい（最もスキャンデータと類似している）テンプレートが、１位となり、以下、２位、３位のようになる。

ここで、本発明に係る文字認識手法では、１位となったテンプレート（同図では「也」）の距離値（同図では「１１５」）を、「１位候補距離値」とするとともに、１位となったテンプレート（同図では「也」）の距離値（同図では「１１５」と２位となったテンプレート（同図では「壱」）の距離値（同図では「２５５」）との差を、「１位／２位距離差（同図では「１４０」）」とする。

そして、このスキャンデータについて、１位候補距離値、１位／２位距離差および正読／誤読の別をサンプルデータとして取得し、記憶する。ここで、正読／誤読の別については、たとえば、別途入力された正しい読みに基づく判定結果を用いることができる。なお、サンプルデータは、文字種ごとに区分けして記憶されるものとする。

つづいて、上記した処理によって取得されたサンプルデータの分布に基づき、正読を正読としてアクセプトする（受け付ける）ための閾値を再設定する処理を行う。具体的には、同図の１ｂに示したように、「１位候補距離値」および「１位／２位距離差」を２軸とするグラフ上に、同一文字種についての各サンプルを配置する。

ここで、本発明に係る文字認識手法では、正読サンプルデータの分布が２次元正規分布となると仮定したうえで、正読確率をあらわす正読確率楕円を生成する。なお、同図には、正読確率が９５％である正読確率楕円（９５％）と、正読確率が９０％である正読確率楕円（９０％）とを示している。たとえば、サンプル分布が２次元正規分布であるとすれば、正読確率楕円（９５％）には、正読サンプルデータの９５％が含まれることになる。

また、本発明に係る文字認識手法では、誤読サンプルデータの分布についても２次元正規分布であると仮定し、誤読確率をあらわす誤読確率楕円を生成する。なお、同図には、誤読確率が９５％である誤読確率楕円（９５％）と、誤読確率が９０％である誤読確率楕円（９０％）とを示している。

そして、本発明に係る文字認識手法では、たとえば、正読確率楕円（９５％）と、誤読確率楕円（９５％）との位置関係に基づき、１位／２位距離差軸と平行な「境界線α」と、１位候補距離値軸上の所定の切片を通過する「境界線β」との２本の境界線を決定する。

たとえば、同図の１ｂに示したように、正読確率楕円（９５％）と、誤読確率楕円（９５％）とが交点を持たない場合、すなわち、正読確率楕円（９５％）と、誤読確率楕円（９５％）とが離れている場合には、「境界線α」および「境界線β」は、２つの確率楕円間の中間点を通過するように決定される。

そして、２本の境界線が決定されると、正読としてアクセプトされる領域は、同図の１ｂに示した斜線領域となる。すなわち、正読としてアクセプトされる領域は、境界線α以下、かつ、境界線β以上の領域となる。たとえば、あらたなスキャンデータが、同図の１ｂに示した斜線領域に含まれる場合、このスキャンデータは、「也」として認識されることになる。

このように、本発明に係る文字認識手法では、１位候補距離値、１位／２位距離差および正読／誤読の別を含んだサンプルデータを蓄積し（同図の（１）参照）、サンプルデータの分布に基づいて正読確率楕円および誤読確率楕円を生成する（同図の（２）参照）。そして、正読確率楕円／誤読確率楕円間の位置関係に基づいて境界線αおよび境界線βを更新し（同図の（３）参照）、更新された境界線（境界線αおよび境界線β）を用いて正読としてアクセプトする（受け付ける）か否かを判定することとした（同図の（４）参照）。

また、本発明に係る文字認識手法では、上記した２本の境界線を自動的に決定するので、利用者が用いる文字種、サイズあるいはフォントの出現頻度にあわせて適切な閾値を設定することができる。なお、確率楕円の位置関係によっては、境界線の自動決定ができない場合もあるが、このような場合であっても、２本の境界線の候補を利用者に対して提示するので、利用者は、簡単な操作で適切な閾値を設定することが可能となる。また、境界線が２本あるので、たとえば、一方を正読重視、他方を誤読重視とすることで、利用者のニーズに合わせて、正読率と誤読率との多彩なバランスを実現することができる。

このように、１位候補距離値に対応する境界線αと、１位／２位距離差に対応する境界線βとの２本の境界線を用いることで、正読としてアクセプトするか否かの判定をきめ細かく行うことが可能となり、誤読を低減することができる。たとえば、１位候補距離値が大きい場合には、１位／２位距離差が所定値以上であることを条件としてアクセプトすることが可能となるので、誤読を低減することができる。

また、本発明に係る文字認識手法では、出現頻度が高い文字種ほどより多くのサンプルデータを集めることができるので、特に、出現頻度が高い文字種についての認識精度を向上させることができる。さらに、誤読の多発、正読としてアクセプトする確率の低下などが顕著となった場合など、所定の条件を満たした場合に境界線を再設定することができるので、装置の経年変化や、認識対象文字種の傾向が変わった場合であっても、柔軟に対応することができる。

以下では、かかる文字認識手法を適用した文字認識装置についての実施例を詳細に説明する。

図２は、文字認識装置１０の構成を示すブロック図である。同図に示すように、文字認識装置１０は、スキャナ１１と、キーボード１２と、ディスプレイ１３と、制御部１４と、記憶部１５とを備えている。また、制御部１４は、文字認識部１４ａと、認識結果確定部１４ｂと、認識結果登録部１４ｃと、閾値変更判定部１４ｄと、確率領域生成部１４ｅと、境界線決定部１４ｆとをさらに備えており、記憶部１５は、テンプレート情報１５ａと、サンプル情報１５ｂと、閾値情報１５ｃとを記憶する。

スキャナ１１は、帳票などに印字された文字を光学的に読み取り、読み取った文字データを文字ごとに制御部１４の文字認識部１４ａへ渡すデバイスである。また、キーボード１２は、文字の正しい読みや、操作コマンドなどを利用者に入力させるための入力デバイスである。なお、本実施例では、入力デバイスとしてキーボード１２を例示したが、マウスやポインティングデバイスといった他の入力デバイスを用いることとしてもよい。

ディスプレイ１３は、文字認識結果や、制御部１４の境界線決定部１４ｆで決定された境界線、サンプル情報１５ｂといった情報を表示する表示デバイスである。また、境界線決定を半自動で行う場合には、ディスプレイ１３には境界線の候補が表示され、利用者は、キーボード１２を用いて所望する境界線候補を選択することになる。

制御部１４は、スキャナ１１から受け取った文字データと、各文字種に対応するテンプレート情報１５ａとを、境界線決定部１４ｆによって決定された閾値情報１５ｃを用いて対比することで、文字認識処理を行う処理部である。また、この制御部１４は、認識結果をサンプル情報１５ｂとして蓄積する処理を行うとともに、所定の条件を満たした場合に、境界線の再決定を行う処理部でもある。

ここで、文字認識結果と閾値判定結果との関係について図３を用いて説明しておく。図３は、文字認識結果と閾値判定結果との関係を示す図である。なお、「文字認識結果」が「正読」とは、文字認識部１４ａによる読みと、キーボード１２経由で入力された正しい読みとが一致した場合を指し、「誤読」とは、文字認識部１４ａによる読みと、正しい読みとが一致しない場合を指す。

また、「閾値判定結果」が「アクセプト」とは、文字認識部１４ａが閾値情報１５ｃを用いて認識した結果が、図１に示した斜線領域にあることを指し、「リジェクト」とは、図１に示した斜線領域以外の領域にあることを指す。

図３に示したように、文字認識結果と閾値判定結果との関係には、４つの場合が存在する（同図のａ、ｂ、ｃおよびｄ参照）。同図に示したａは、文字認識結果が正読であった場合に、正読である旨を正しくアクセプトした場合である。また、同図に示したｄは、文字認識結果が誤読であった場合に、誤読である旨を正しくリジェクトした場合である。このように、正読を正しくアクセプトし、誤読を正しくリジェクトすることが、文字認識装置１０としては望ましい。

一方、同図のｂに示したように、文字認識結果が正読であるのに、リジェクトしてしまったり、同図のｃに示したように、文字認識結果が誤読であるのに、アクセプトしてしまったり、という事態は、文字認識装置１０としては望ましくない。

そこで、文字認識装置１０は、サンプル情報１５ｂを用いて閾値情報１５ｃを更新していくことで、正読を正しくアクセプトする確率を向上させつつ、誤読を正しくリジェクトする確率を向上させていく。

図２の説明に戻り、制御部１４の各処理部について説明する。文字認識部１４ａは、スキャナ１１から受け取った文字データと、記憶部１５のテンプレート情報１５ａとを対比することで、各距離値を算出したうえで、１位候補距離値および１位／２位距離差を算出し（図１の１ａ参照）、算出した値を、閾値情報１５ｃに含まれる境界線αおよび境界線βと対比することで（図１の１ｂ参照）、文字認識処理を行う処理部である。

たとえば、この文字認識部１４ａは、算出した１位候補距離値および１位／２位距離差の組が、図１の１ｂに示した斜線領域に含まれる場合に、正読としてアクセプトする。そして、文字認識部１４ａは、文字の読みを含む認識結果を認識結果確定部１４ｂへ通知する。

認識結果確定部１４ｂは、文字認識部１４ａから受け取った認識結果をディスプレイ１３に表示させるとともに、読みが間違っていた場合やリジェクトの場合などに、利用者によってキーボード１２経由で入力された正しい読みを受け取ることで、認識結果を確定する処理を行う処理部である。

また、認識結果確定部１４ｂは、文字認識部１４ａから受け取った認識結果および認識結果が間違っている旨（誤読である旨）を認識結果登録部１４ｃへ通知する。なお、認識結果確定部１４ｂは、文字認識部１４ａから受け取った認識結果が正しかった場合には、受け取った認識結果および認識結果が正しい旨（正読である旨）を認識結果登録部１４ｃへ通知する。また、認識結果確定部１４ｂは、リジェクトの場合には、閾値処理を行う前の１位候補が正読または誤読であるかについて認識結果登録部１４ｃへ通知する。

認識結果登録部１４ｃは、認識結果確定部１４ｂから受け取ったサンプルデータごとの１位候補距離値、１位／２位距離差および正読／誤読の別をサンプル情報１５ｂとして記憶部１５へ蓄積する処理を行う処理部である。なお、サンプル情報１５ｂに対し、正しい読みや、スキャナ１１による文字データ（認識画像）を付加することとしてもよい。

閾値変更判定部１４ｄは、サンプル情報１５ｂに基づく閾値変更処理の開始タイミングを判定する処理を行う処理部である。具体的には、この閾値変更判定部１４ｄは、サンプル情報１５ｂを文字種ごとに検査し、サンプル数が所定数を上回るたびに、確率領域生成部１４ｅに対して閾値変更処理の開始を指示する。

なお、本実施例では、記憶部１５に記憶されたサンプル数に基づいて閾値変更処理の開始を指示する場合について説明するが、リジェクト（該当文字種なしの認識結果）数やリジェクト率、誤読数や誤読率が所定値以上となった場合に、閾値変更処理の開始を指示することとしてもよい。

また、正読リジェクト率（正読と認識されたサンプルのうち閾値比較によって誤ってリジェクトされたサンプルの割合）が、予め定めた許容上限値を超えた場合や、誤読リジェクト率（誤読と認識されたサンプルのうち閾値比較によって正しくリジェクトされたサンプルの割合）が、予め定めた許容下限値を下回った場合に、閾値変更処理の開始を指示することとしてもよい。

確率領域生成部１４ｅは、閾値変更判定部１４ｄから閾値変更処理の開始を指示された場合に、該当する文字種について正読サンプルおよび誤読サンプルの分布グラフを生成するとともに、正読サンプルの確率分布をあらわす正読確率楕円および誤読サンプルの確率分布をあらわす誤読確率楕円をそれぞれ生成する処理を行う処理部である。なお、本実施例では、正読確率領域および誤読確率領域の形状を、いずれも、楕円とした場合について説明するが、閉領域であることを条件として他の形状とすることとしてもよい。

境界線決定部１４ｆは、確率領域生成部１４ｅが生成した正読確率楕円および誤読確率楕円に基づき、１位／２位距離差軸と平行な「境界線α」と、１位候補距離値軸上の所定の切片を通過する「境界線β」との２本の境界線を決定する処理を行う処理部である。

ここで、確率領域生成部１４ｅによって生成される各確率楕円、境界線決定部１４ｆによって決定される各境界線について図４を用いて説明しておく。図４は、確率楕円および境界線を付加したサンプル分布図である。ここで、同図では、正読確率楕円と誤読確率楕円とが交差しない場合を示している。なお、正読確率楕円と誤読確率楕円が交差する場合については、図５等を用いて後述することとする。

図４に示したように、確率領域生成部１４ｅは、正読サンプル（同図の「●」参照）の分布が２次元正規分布であると仮定し、９５％の正読サンプルが含まれる正読確率楕円（９５％）４１ａと、９０％の正読サンプルが含まれる正読確率楕円（９０％）４１ｂとを生成する。また、確率領域生成部１４ｅは、誤読サンプル（同図の「○」参照）の分布が２次元正規分布であると仮定し、９５％の誤読サンプルが含まれる誤読確率楕円（９５％）４２ａと、９０％の誤読サンプルが含まれる誤読確率楕円（９０％）４２ｂとを生成する。

このように、確率領域生成部１４ｅによって各確率楕円が生成されたならば、境界線決定部１４ｆは、正読確率楕円および誤読確率楕円の位置関係に基づいて各境界線（境界線αおよび境界線β）を決定する。ここで、境界線αは、１位／２位距離差軸と平行であり、境界線βは、１位候補距離値軸における所定の切片４０を通過する。なお、同図では、正読確率楕円（９５％）４１ａおよび誤読確率楕円（９５％）４２ａに基づいて各境界線を決定する場合について示している。

具体的には、図４に示したように、境界線αを、正読確率楕円（９５％）４１ａからの距離４４と、誤読確率楕円（９５％）４２ａからの距離４３とが等しい位置に決定する。また、境界線βを、正読確率楕円（９５％）４１ａからの距離４６と、誤読確率楕円（９５％）４２ａからの距離４５とが等しい位置に決定する。ここで、距離４４および距離４３に付した矢印の向きは、境界線αと垂直であり、距離４６および距離４５に付した矢印の向きは、境界線βと垂直である。

なお、切片４０については、正読確率楕円の重心を１位候補距離値軸へ射影した位置とすることができるが、切片４０を実験値に基づいて変更したり、文字種によって大きな変化がみられなければ、全文字種に対して共通の値を用いることとしたりしてもよい。

このように、境界線αおよび境界線βが決定された場合、正読としてアクセプトされる領域は、同図の斜線領域となる。すなわち、各境界線が決定された後に、スキャナ１１経由で取得された文字データが、同図の斜線領域に含まれる場合には、この文字データは、正読としてアクセプトされる。なお、文字データが斜線領域以外の領域に含まれる場合には、該当文字種ではないとしてリジェクトされる。

なお、図４では、確率がそれぞれ等しい正読確率楕円および誤読確率楕円を用いて各境界線を決定する場合について示したが、それぞれ確率が異なる正読確率楕円および誤読確率楕円を用いて各境界線を決定することとしてもよい。

図２の説明に戻り、記憶部１５について説明する。記憶部１５は、ハードディスクドライブやメモリといった記憶デバイスで構成される記憶部であり、テンプレート情報１５ａと、サンプル情報１５ｂと、閾値情報１５ｃとを記憶する。

テンプレート情報１５ａは、文字種ごとに予め用意された文字テンプレートであり、文字認識部１４ａが、スキャナ１１経由の文字データとの各距離値を算出するために用いられる。また、サンプル情報１５ｂは、文字種ごとに区分けされたサンプルデータであり、認識結果登録部１４ｃによって蓄積されていく。

ここで、サンプル情報１５ｂは、１位候補距離値、１位／２位距離差および正読／誤読の別を含んだ情報である。なお、サンプル情報１５ｂに対し、スキャナ１１による文字データ（認識画像）を付加することとしてもよい。また、サンプル情報１５ｂに対して文字データ（認識画像）を付加することとした場合、図１の１ｂや、図４に示したサンプル分布図の「●」や「○」の代わりに、縮小した文字データ（認識画像）を表示することとしてもよい。

閾値情報１５ｃは、境界線決定部１４ｆによって決定された２本の境界線（境界線αおよび境界線β）を、文字種ごとに区分けした情報である。なお、閾値情報１５ｃは、境界線決定部１４ｆによって決定された最新の境界線で、以前に使用していた境界線が更新されていくものとするが、以前の境界線を所定世代に渡って保持しておき、利用者の指示等に応じて最新の境界線と切り替えることとしてもよい。

ところで、これまでは、図４のサンプル分布図に示したように、正読確率楕円と誤読確率楕円とが交点を持たない場合に、２本の境界線（境界線αおよび境界線β）を自動生成する旨を説明してきたが、上記した境界線決定部１４ｆは、正読確率楕円と誤読確率楕円とが交点を持つ場合であっても、２本の境界線（境界線αおよび境界線β）を自動決定することができる（境界線の自動決定）。また、複数の境界線候補をディスプレイ１３に表示するなどして、境界線の最終決定を利用者に委ねることもできる（境界線の半自動決定）。

そこで、以下では、正読確率楕円と誤読確率楕円とが交点を持つ場合における境界線の自動決定処理および半自動決定処理について図５〜図１０を用いて説明することとする。

図５は、確率楕円が交差する場合のサンプル分布図である。同図に示したようなサンプル分布の場合、正読確率楕円（９５％）５１ａと、誤読確率楕円（９５％）５２ａとが交差する。この場合、図４の場合のように正読確率楕円（９５％）５１ａと、誤読確率楕円（９５％）５２ａとの間に中間点が存在しないので、中間点を通過する境界線αおよび境界線βを得ることができない。

そこで、境界線決定部１４ｆは、境界線αを、正読確率楕円（９５％）５１ａ、正読確率楕円（９０％）５１ｂ、誤読確率楕円（９５％）５２ａおよび誤読確率楕円（９０％）５２ｂのうち、いずれか１つの確率楕円の接線となるように決定する。また、境界線βについても、正読確率楕円（９５％）５１ａ、正読確率楕円（９０％）５１ｂ、誤読確率楕円（９５％）５２ａおよび誤読確率楕円（９０％）５２ｂのうち、いずれか１つの確率楕円の接線となるように決定する。

すなわち、境界線決定部１４ｆは、境界線αについて４種類、境界線βについて４種類の境界線候補を生成し、これらの組合せ候補（１６種類＝４種類×４種類）の中から最終的に１つの組合せを選択する。

図６は、境界線の組合せ候補を示す図である。なお、同図における境界線αについて「誤読９５％の接線」との記載は、境界線αを、誤読確率楕円（９５％）５２ａの接線とする旨をあらわしている。また、同図における境界線βについて「正読９０％の接線」との記載は、境界線βを、正読確率楕円（９０％）５１ｂの接線とする旨をあらわしている。

このように、各境界線（境界線αまたは境界線β）について、接線の対象となる確率楕円を４種類とした場合には、組合せ候補は、「Ａ」〜「Ｐ」の１６種類となる。なお、本実施例では、１６種類の組合せ候補の中から最終的に１つの組合せを選択する場合について説明するが、組合せ候補の数を増加させたり減少させたりすることとしてもよい。また、以下の説明では、図６に示した「Ａ」を「組合せ候補Ａ」のように記載することとする。

次に、境界線の半自動決定処理を行う場合について、図７および図８を用いて説明する。図７は、境界線の組合せ例および各組合せにおける正読リジェクト率および誤読リジェクト率を示す図であり、図８は、組合せに対応する境界線を示す図である。なお、図７の（Ａ）には、境界線決定部１４ｆによってディスプレイ１３に表示される「組合せ選択画面」を、図７の（Ｂ）には、同じく「リジェクト率表示画面」を、それぞれ示している。また、図８には、同じく「境界線表示画面」を示している。

図７の（Ａ）に示したように、境界線決定部１４ｆは、境界線の半自動決定処理を行う場合、組合せ候補Ａ〜組合せ候補Ｐが選択ボタン等の形式で含まれた組合せ選択画面を表示し、どの組合せ候補を使用するかを利用者に選択させる。なお、同図には、利用者によって組合せ候補Ａ、組合せ候補Ｋおよび組合せ候補Ｎが選択された場合を示している。

このようにして、利用者によって任意の組合せ候補が選択されると、境界線決定部１４ｆは、図７の（Ｂ）に示した境界線表示画面を表示する。同図に示したように、境界線表示画面には、すべての組合せ候補についての正読リジェクト率および誤読リジェクト率がグラフ形式で表示される。また、組合せ選択画面において選択された各組合せ候補（同図では、左から組合せ候補Ｎ、組合せ候補Ｋおよび組合せ候補Ａ）については、強調表示（同図の破線矩形参照）されるとともに、詳細な誤読リジェクト率および正読リジェクト率が表示される。

このように、複数の組合せ候補について、詳細な誤読リジェクト率および正読リジェクト率を表示することで、利用者は、複数の組合せ候補について、誤読リジェクト率や正読リジェクト率を比較しつつ、所望する組合せ候補を絞り込むことができる。そして、利用者が最終的に１つの組合せ候補を選択することで、境界線αおよび境界線βが決定されることになる。

たとえば、利用者が最終的に選択した組合せ候補が組合せ候補Ｎであった場合には、境界線αは、正読確率楕円（９５％）５１ａの接線となり、境界線βは、誤読確率楕円（９０％）５２ｂの接線となる。

また、境界線決定部１４ｆは、利用者による最終選択を補助するために、図８に示した境界線表示画面を表示する。なお、図８における「（Ｎ）」、「（Ｋ）」および「（Ａ）」は、図７に示した組合せ候補Ｎ、組合せ候補Ｋおよび組合せ候補Ａに、それぞれ対応している。また、図８に示した各確率楕円は、図５に示した各確率楕円と同一であるものとする。

ここで、境界線表示画面には、利用者によって選択された組合せ候補すべてについて、実際の境界線がどのように決定されるかが表示される。同図に示した場合には、組合せ候補Ｎ、組合せ候補Ｋおよび組合せ候補Ａについて、境界線がそれぞれ表示される。

たとえば、図８の（Ｎ）には、組合せ候補Ｎが選択された場合の、境界線α（同図の境界線αＮ参照）および境界線β（同図の境界線βＮ参照）が表示される。ここで、境界線αＮは、正読確率楕円（９５％）５１ａの接線となり、境界線βＮは、誤読確率楕円（９０％）５２ｂの接線となる（図７の（Ａ）における組合せ候補Ｎ参照）。

また、図８の（Ｋ）には、組合せ候補Ｋが選択された場合の、境界線α（同図の境界線αＫ参照）および境界線β（同図の境界線βＫ参照）が表示される。ここで、境界線αＫは、正読確率楕円（９０％）５１ｂの接線となり、境界線βＫについても、正読確率楕円（９０％）５１ｂの接線となる（図７の（Ａ）における組合せ候補Ｋ参照）。

また、図８の（Ａ）には、組合せ候補Ａが選択された場合の、境界線α（同図の境界線αＡ参照）および境界線β（同図の境界線βＡ参照）が表示される。ここで、境界線αＡは、誤読確率楕円（９５％）５２ａの接線となり、境界線βＡについても、誤読確率楕円（９５％）５２ａの接線となる（図７の（Ａ）における組合せ候補Ａ参照）。

このように、利用者によって選択された組合せ候補のそれぞれについて、実際の境界線がどのように引かれるのかを示すことで、利用者による最終選択をより行いやすくすることができる。なお、図８では、図５に示した正読サンプル（●）および誤読サンプル（○）の表示を省略した場合について示しているが、これらのサンプルを併せて表示することとしてもよい。

ところで、図７および図８では、正読確率楕円と誤読確率楕円とが交点を持つ場合に、最終的な組合せ候補の選択を利用者に委ねる半自動決定処理について示した。しかしながら、これに限らず、正読確率楕円と誤読確率楕円とが交点を持たない場合であっても、かかる半自動決定処理を行うこととしてもよい。

次に、かかる半自動決定処理を自動的に行う自動決定処理について図９および図１０を用いて説明する。図９は、優先度を付加した組合せ候補を示す図である。なお、図９の（Ａ）および（Ｂ）には、図６に示した各組合せ候補（組合せ候補Ａ〜組合せ候補Ｐ）に対して異なる優先度を付加した場合を示している。

図９の（Ａ）に示した場合では、各組合せ候補を、４つずつ４個のグループにグループ分けし、各グループ内において同図に示した破線矢印の順序で優先順位を付している。また、各グループについては、同図に示した実線矢印の順序で優先順位を付している。たとえば、同図に示した「Ｅ（３）」は、組合せ候補Ｅの優先順位が３であることをあらわしており、同図に示した「Ｌ（１４）」は、組合せ候補Ｌの優先順位が１４であることをあらわしている。

ここで、優先順位は、誤読の低減を優先する場合には、数値が小さいほど順位が高くなり、正読の向上を優先する場合には、数値が大きいほど順位が高くなる。たとえば、組合せ候補Ｍ（優先順位は１１）および組合せ候補Ｏ（優先順位は１５）のうちどちらかを選択すると仮定すると、誤読の低減を優先する場合には、組合せ候補Ｍが選択され、正読の向上を優先する場合には、組合せ候補Ｏが選択されることになる。

また、図９の（Ｂ）には、グループ内における組合せ候補の優先順位を示す破線矢印の向きおよびグループ間における優先順位を示す実線矢印の向きが、図９の（Ａ）とは異なる場合について示している。たとえば、同図に示した「Ｅ（２）」は、組合せ候補Ｅの優先順位が２であることをあらわしており、同図に示した「Ｌ（１５）」は、組合せ候補Ｌの優先順位が１５であることをあらわしている。

なお、図９の（Ａ）に示した優先順位は、境界線βよりも境界線αを優先しているが、これは、境界線αが、文字認識において誤読を低減するために最も一般的な１位候補距離値についての境界線であるためである。しかし、図９の（Ｂ）に示したように、境界線αよりも境界線βを優先した優先順位とすることとしてもよい。

このように、各組合せ候補に対して予め優先順位をつけておくことで、たとえば、所定の条件を満たす組合せ候補が複数ある場合であっても、自動的に１つの組合せ候補に絞り込むことが可能となる。

図１０は、組合せ候補の絞り込み例を示す図である。なお、同図では、組合せ候補を絞り込む条件として、誤読リジェクト率の許容下限値および正読リジェクト率の許容上限値を用いた場合について示している。ここで、誤読リジェクト率の許容下限値とは、許容されるべき誤読リジェクト率の最小値を指し、正読リジェクト率の許容上限値とは、許容されるべき正読リジェクト率の最大値を指す。なお、同図では、誤読リジェクト率の許容下限値を９８％とし、正読リジェクト率の許容上限値を４％とした場合について示している。

境界線決定部１４ｆは、各組合せ候補の誤読リジェクト率および正読リジェクト率が、図１０に示したグラフとしてあらわされる場合に、各組合せ候補のうち、誤読リジェクト率が許容下限値（同図では９８％）以上である組合せ候補を抽出する（同図では１３個の組合せ候補が抽出されている）。また、正読リジェクト率が許容上限値（同図では４％）である組合せ候補を抽出する（同図では４個の組合せ候補が抽出されている）。

つづいて、誤読リジェクト率が許容下限値以上であり、かつ、正読リジェクト率が許容上限値以下である組合せ候補を抽出する（同図では組合せ候補Ｍおよび組合せ候補Ｏが抽出されている）。このようにして、複数の候補が抽出された場合には、図９の（Ａ）または（Ｂ）に示した優先順位に従って１つの組合せ候補に絞り込む。

次に、境界線決定部１４ｆによって行われる境界線決定の例外処理について図１１を用いて説明する。図１１は、境界線決定の例外処理の概要を示す図である。

図１１の（Ｅ−１）に示したのは、正読確率楕円１１１が、１位候補距離値軸と交差し、境界線βを正読確率楕円１１１の接線とすると傾きが負になる場合である。この場合、境界線決定部１４ｆは、境界線βが１位候補距離値軸と一致するように決定する。なお、境界線αについては、正読確率楕円１１１と誤読確率楕円１１２との中間点を通過するように決定する。

また、図１１の（Ｅ−２）に示したのは、確率楕円は交差しないが、境界線βについては、通過させるべき中間点が存在しない場合である。この場合、境界線決定部１４ｆは、境界線βについては、正読確率楕円１１４および誤読確率楕円１１５のうち、いずれかの確率の確率楕円の接線となるように決定する。

また、図１１の（Ｅ−３）に示したのは、確率楕円は交差しないが、境界線αについては、通過させるべき中間点が存在しない場合である。この場合、境界線決定部１４ｆは、境界線αについては、正読確率楕円１１７および誤読確率楕円１１８のうち、いずれかの確率の確率楕円の接線となるように決定する。

次に、文字認識装置１０が実行する処理手順について図１２を用いて説明する。図１２は、文字認識装置１０が実行する処理手順を示すフローチャートである。同図に示すように、文字認識部１４ａは、スキャナ１１から受け取った画像から文字画像を切り出し（ステップＳ１０１）、最初の文字画像をセットする（ステップＳ１０２）。

つづいて、文字認識部１４ａは、閾値情報１５ｃを用いた文字認識を行い（ステップＳ１０３）、認識結果確定部１４ｂは、認識結果の確定を行う（ステップＳ１０４）。そして、認識結果登録部１４ｃは、確定された認識結果をサンプル情報１５ｂとして登録する（ステップＳ１０５）。

また、閾値変更判定部１４ｄは、閾値変更の条件が成立したか否かを判定し（ステップＳ１０６）、閾値変更の条件が成立した場合には（ステップＳ１０６，Ｙｅｓ）、境界線決定部１４ｆは、確率領域生成部１４ｅが生成した確率領域（たとえば、確率楕円）に基づく閾値変更処理を実行する（ステップＳ１０７）。

なお、ステップＳ１０６の判定条件を満たさなかった場合には（ステップＳ１０６，Ｎｏ）、ステップＳ１０７の処理を行うことなく、ステップＳ１０８へと進む。また、ステップＳ１０７の詳細な処理手順については、図１３を用いて後述する。

つづいて、文字認識部１４ａは、次の文字画像があるか否かを判定し（ステップＳ１０８）、次の文字画像がある場合には（ステップＳ１０８，Ｙｅｓ）、次の文字画像をセットしたうえで（ステップＳ１０９）、ステップＳ１０３以降の処理を繰り返す。一方、ステップＳ１０８の判定条件を満たさなかった場合には（ステップＳ１０８，Ｎｏ）、処理を終了する。

次に、図１２のステップＳ１０７に示した閾値変更処理の詳細な処理手順について図１３を用いて説明する。図１３は、閾値変更処理の処理手順を示すフローチャートである。なお、同図には、境界線を自動決定する場合について示している。

同図に示すように、確率領域生成部１４ｅは、正読確率楕円（９０％）、正読確率楕円（９５％）、誤読確率楕円（９０％）および誤読確率楕円（９５％）を生成する（ステップＳ２０１）。

つづいて、境界線決定部１４ｆは、境界線αおよび境界線βともに９５％確率楕円間の中間点を通過するように引けるか否かを判定し（ステップＳ２０２）、境界線αおよび境界線βともに９５％確率楕円間の中間点を通過するように引ける場合には（ステップＳ２０２Ｙｅｓ）、９５％確率楕円間の中間点を通過するように境界線αおよび境界線βを決定し（ステップＳ２１０）、処理を終了する。

一方、ステップＳ２０２の判定条件を満たさなかった場合には（ステップＳ２０２，Ｎｏ）、境界線αの候補（４種類）および境界線βの候補（４種類）の各組合せ（１６種類）について各リジェクト率（正読リジェクト率および誤読リジェクト率）を算出する（ステップＳ２０３）。なお、境界線αまたは境界線βの一方を９５％確率楕円間の中間点を通過するように引ける場合には、かかる中間点を通過する境界線のみを決定しておく。

つづいて、境界線決定部１４ｆは、正読リジェクト率が許容上限値以下、かつ、誤読リジェクト率が許容下限値以上の組合せを抽出する（ステップＳ２０４）。そして、抽出された候補が０個であるか否かを判定し（ステップＳ２０５）、候補が０個である場合には（ステップＳ２０５，Ｙｅｓ）、許容上限値あるいは許容下限値のうち一方あるいは双方を変更することによって許容値のレベルを変更したうえで（ステップＳ２０６）、ステップＳ２０４以降の処理を繰り返す。

一方、ステップＳ２０５の判定条件を満たさなかった場合には（ステップＳ２０５，Ｎｏ）、複数の候補があるか否かを判定し（ステップＳ２０７）、１つの候補しかない場合には（ステップＳ２０７，Ｎｏ）、ステップＳ２０９へ進む。

一方、ステップＳ２０７の判定条件を満たした場合には（ステップＳ２０７，Ｙｅｓ）、複数の候補について最も優先順位が高い組合せを選択する（ステップＳ２０８）。つづいて、境界線決定部１４ｆは、選択した組合せに基づいて境界線αおよび境界線βを決定し（ステップＳ２０９）、処理を終了する。

上述してきたように、本実施例では、文字認識部が、文字データと文字テンプレートとの違いをあらわす距離値をそれぞれ算出したうえで、距離値が最も小さい文字テンプレートを１位候補とするとともに、距離値が２番目に小さい文字テンプレートを２位候補とした場合に、文字データと１位候補との距離値をあらわす１位候補距離値と、文字データと２位候補との距離値から１位候補距離値を差し引いた距離差とを算出した。また、認識結果登録部が、同一文字種の各文字データについての１位候補距離値および距離差を正読または誤読の別と対応付けてサンプル値として記憶し、確率領域生成部が、記憶されたサンプル値を、１位候補距離値を第１の軸、距離差を第２の軸とする２次元空間に配置したうえで、正読のサンプル値の分布について所定の正読率をあらわす閉領域である正読確率領域と、誤読のサンプル値の分布について所定の誤読率をあらわす閉領域である誤読確率領域とを生成した。そして、境界線決定部が、生成された正読確率領域および誤読確率領域の位置関係に基づいて文字データに対する文字認識結果を正読とするか否かの判定に用いる境界線を決定し、文字認識部が、文字認識結果に対応する１位候補距離値および距離差の組を決定された境界線と対比することで文字認識結果を正読として受け付けるか否かを判定するように文字認識装置を構成した。

したがって、利用者の利用環境に合わせて正読率および誤読率を加味した境界線を用いることで、文字認識に用いる閾値を適切に設定することができるとともに、文字認識の認識精度を向上させることができる。

以上のように、本発明に係る文字認識方法および文字認識装置は、文字認識精度を向上させたい場合に有用であり、特に、利用者の利用環境ごとに異なる文字種、サイズあるいはフォントの出現頻度に応じ、きめ細かい閾値設定を利用者側に提供したい場合に適している。

１０文字認識装置
１１スキャナ
１２キーボード
１３ディスプレイ
１４制御部
１４ａ文字認識部
１４ｂ認識結果確定部
１４ｃ認識結果登録部
１４ｄ閾値変更判定部
１４ｅ確率領域生成部
１４ｆ境界線決定部
１５記憶部
１５ａテンプレート情報
１５ｂサンプル情報
１５ｃ閾値情報

Claims

光学的に読み取った文字データを各文字に対応した文字テンプレートとそれぞれ対比することで文字認識を行う文字認識方法であって、
前記文字データと前記文字テンプレートとの違いをあらわす距離値をそれぞれ算出したうえで、前記距離値が最も小さい前記文字テンプレートを１位候補とするとともに、前記距離値が２番目に小さい前記文字テンプレートを２位候補とした場合に、前記文字データと前記１位候補との前記距離値をあらわす１位候補距離値と、前記文字データと前記２位候補との前記距離値から前記１位候補距離値を差し引いた距離差とを算出する距離算出工程と、
同一文字種の各文字データについての前記１位候補距離値および前記距離差を正読または誤読の別と対応付けてサンプル値として記憶するサンプル値記憶工程と、
前記サンプル値記憶工程によって記憶された前記サンプル値を、前記１位候補距離値を第１の軸、前記距離差を第２の軸とする２次元空間に配置したうえで、正読のサンプル値の分布について所定の正読率をあらわす形状が楕円である正読確率楕円からなる閉領域の正読確率領域と、誤読のサンプル値の分布について所定の誤読率をあらわす形状が楕円である誤読確率楕円からなる閉領域の誤読確率領域とを生成する確率領域生成工程と、
前記確率領域生成工程によって生成された前記正読確率領域および前記誤読確率領域の位置関係に基づいて前記文字データに対する文字認識結果を正読とするか否かの判定に用いる境界線を決定する境界線決定工程と、
前記文字認識結果に対応する前記１位候補距離値および前記距離差の組を前記境界線決定工程で決定された前記境界線と対比することで当該文字認識結果を正読として受け付けるか否かを判定する判定工程と
を含み、
前記境界線決定工程は、
前記正読確率楕円と前記誤読確率楕円との中間点を通過するとともに前記第２の軸と平行な直線である第１の境界線と、前記中間点および前記正読確率楕円の重心を前記第１の軸へ射影した点を通過する直線である第２の境界線とを決定し、
前記判定工程は、
前記第１の境界線以下であり、かつ、前記第２の境界線以上である前記２次元空間に含まれる前記文字認識結果を正読として受け付けると判定する
ことを特徴とする文字認識方法。
前記境界線決定工程は、
前記正読確率楕円と前記誤読確率楕円とが交差して前記中間点が存在しない場合に、前記中間点を通過する代わりに前記正読確率楕円または前記誤読確率楕円に接するように前記第１の境界線および前記第２の境界線を決定することを特徴とする請求項１に記載の文字認識方法。
前記確率領域生成工程は、
複数の前記正読率について前記正読確率楕円をそれぞれ生成するとともに、複数の前記誤読率について前記誤読確率楕円をそれぞれ生成し、
前記境界線決定工程は、
複数の前記正読確率楕円のうち１つと複数の前記誤読確率楕円のうち１つとを用いて前記境界線を決定することを特徴とする請求項１または２に記載の文字認識方法。
前記正読確率楕円と前記誤読確率楕円とが交差して前記中間点が存在しない場合に、前記第１の境界線および前記第２の境界線について、前記中間点を通過させる代わりに複数の前記正読確率楕円または複数の前記誤読確率楕円のうちいずれの接線とするかを利用者に選択させる選択工程と、
前記選択工程における選択によって決定された前記第１の境界線および前記第２の境界線と前記サンプル値の分布とを含んだ分布図と、当該分布図における前記第１の境界線および前記第２の境界線によって正読であるにも関わらずリジェクトされた前記サンプル値の割合をあらわす正読リジェクト率および／または誤読を誤読として正当にリジェクトされた前記サンプル値の割合をあらわす誤読リジェクト率を示すリジェクト率グラフとを表示する表示工程と
をさらに含んだことを特徴とする請求項１に記載の文字認識方法。
前記境界線決定工程は、
前記第１の境界線を複数の前記正読確率楕円または複数の前記誤読確率楕円のうちいずれの接線とするかをあらわす第１の接線候補と、前記第２の境界線を複数の前記正読確率楕円または複数の前記誤読確率楕円のうちいずれの接線とするかをあらわす第２の接線候補との各組合せについて、前記正読リジェクト率が所定の許容上限値以下であり、かつ、前記誤読リジェクト率が所定の許容下限値以上である前記組合せを抽出し、
前記表示工程は、
前記境界線決定工程によって抽出された前記組合せを前記リジェクト率グラフに含めて表示することを特徴とする請求項４に記載の文字認識方法。
前記境界線決定工程は、
複数の前記組合せが抽出された場合に、前記各組合せについて予め定められた優先度に基づいて１つの前記組合せを決定し、当該組合せに対応する前記第１の境界線および前記第２の境界線を決定することを特徴とする請求項５に記載の文字認識方法。
前記境界線決定工程は、
前記サンプル値記憶工程によって記憶された前記サンプル値の個数が所定の基準値を超えるたびに、前記境界線を再決定することを特徴とする請求項１〜６のいずれか一つに記載の文字認識方法。
前記サンプル値記憶工程は、前記サンプル値に対して、正しい読みや、スキャナによる文字データを追加して記憶することを特徴とする請求項１〜７のいずれか一つに記載の文字認識方法。
光学的に読み取った文字データを各文字に対応した文字テンプレートとそれぞれ対比することで文字認識を行う文字認識装置であって、
前記文字データと前記文字テンプレートとの違いをあらわす距離値をそれぞれ算出したうえで、前記距離値が最も小さい前記文字テンプレートを１位候補とするとともに、前記距離値が２番目に小さい前記文字テンプレートを２位候補とした場合に、前記文字データと前記１位候補との前記距離値をあらわす１位候補距離値と、前記文字データと前記２位候補との前記距離値から前記１位候補距離値を差し引いた距離差とを算出する距離算出手段と、
同一文字種の各文字データについての前記１位候補距離値および前記距離差を正読または誤読の別と対応付けてサンプル値として記憶するサンプル値記憶手段と、
前記サンプル値記憶手段によって記憶された前記サンプル値を、前記１位候補距離値を第１の軸、前記距離差を第２の軸とする２次元空間に配置したうえで、正読のサンプル値の分布について所定の正読率をあらわす形状が楕円である正読確率楕円からなる閉領域の正読確率領域と、誤読のサンプル値の分布について所定の誤読率をあらわす形状が楕円である誤読確率楕円からなる閉領域の誤読確率領域とを生成する確率領域生成手段と、
前記確率領域生成手段によって生成された前記正読確率領域および前記誤読確率領域の位置関係に基づいて前記文字データに対する文字認識結果を正読とするか否かの判定に用いる境界線を決定する境界線決定手段と、
前記文字認識結果に対応する前記１位候補距離値および前記距離差の組を前記境界線決定手段で決定された前記境界線と対比することで当該文字認識結果を正読として受け付けるか否かを判定する判定手段と
を備え、
前記境界線決定手段は、
前記正読確率楕円と前記誤読確率楕円との中間点を通過するとともに前記第２の軸と平行な直線である第１の境界線と、前記中間点および前記正読確率楕円の重心を前記第１の軸へ射影した点を通過する直線である第２の境界線とを決定し、
前記判定手段は、
前記第１の境界線以下であり、かつ、前記第２の境界線以上である前記２次元空間に含まれる前記文字認識結果を正読として受け付けると判定する
ことを特徴とする文字認識装置。