JP5034398B2

JP5034398B2 - 文字認識プログラム、文字認識方法および文字認識装置

Info

Publication number: JP5034398B2
Application number: JP2006249833A
Authority: JP
Inventors: 悦伸堀田; 克仁藤本; 聡直井
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2006-09-14
Filing date: 2006-09-14
Publication date: 2012-09-26
Anticipated expiration: 2026-09-14
Also published as: US7796817B2; US20080069447A1; JP2008071173A

Description

この発明は、パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する方法をコンピュータに実行させる文字認識プログラム等に関する。

従来より、電子化されて入力された帳票上に記入されている文字画像と、その帳票上の罫線とが接触してしまっている罫線接触文字画像から、記入されている文字画像が何であるかを認識する技術が開示されている（例えば、特許文献１参照）。例えば、罫線と文字画像とが接触した罫線接触文字画像から罫線を除去し、その除去に伴って欠損した文字画像の一部を補完することにより、帳票上に記入されている文字画像を認識するというのが一般的である。

しかし、上記した従来の技術は、文字画像と罫線との接触の仕方が多様であることや、英数字のように単純な字形の文字ばかりでなく漢字のような複雑な字形の文字が存在することなどから、文字の一部を補完することが容易でないという問題があった（例えば、図１５参照）。

そこで、例えば、帳票上の罫線と記入された文字画像とが接触した罫線接触文字画像の特徴を予め辞書として保持しておき、罫線接触文字画像から罫線を除去することなく、予め保持する辞書に基づいて、帳票上に記入されている文字画像を認識する技術が開示されている（例えば、特許文献２参照）。

特許第２８７１５９０号公報特許第３４５５６４９号公報

ところで、罫線接触文字画像から罫線を除去することなく、帳票上に記入されている文字画像を認識する上記した従来の技術は、辞書容量が大きくなるという問題点があった。すなわち、罫線接触文字画像の特徴を予め辞書として保持する場合、太線、細線、点線および一点鎖線など罫線の種類や、上、下、左、右および文字内部など考え得る罫線と文字画像との接触位置が多岐にわたるため、保持する辞書容量が大きくなるという問題点があった。

そこで、この発明は、上述した従来技術の課題を解決するためになされたものであり、大きな辞書容量を確保することなく、精度よく文字画像を認識することが可能な文字認識プログラム、文字認識方法および文字認識装置を提供することを目的とする。

上述した課題を解決し、目的を達成するため、請求項１に係る発明は、パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する方法をコンピュータに実行させる文字認識プログラムであって、外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手順と、前記推定手順により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手順と、前記推定手順により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手順と、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手順と、をコンピュータに実行させることを特徴とする。

また、請求項２に係る発明は、上記の発明において、前記推定手順は、外部から入力された文字列が前記パターンである罫線と文字とが重なって罫線重なり文字画像を構成する場合に、当該罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、前記切出手順は、前記推定手順により推定された前記罫線位置および前記罫線幅に基づいて、前記罫線重なり文字画像から罫線を除去するとともに、当該推定手順により推定された前記文字列高さに基づいて、当該罫線を除去した前記罫線重なり文字画像から文字領域を特定した後、当該罫線を除去する前の罫線重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、前記生成手順は、前記推定手順により推定された前記罫線位置および前記罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成し、前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする。

また、請求項３に係る発明は、パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識方法であって、外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定工程と、前記推定工程により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出工程と、前記推定工程により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成工程と、前記切出工程により切り出された前記対象領域の画像特徴と前記生成工程により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識工程と、を含んだことを特徴とする。

また、請求項４に係る発明は、パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識装置であって、外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手段と、前記推定手段により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手段と、前記推定手段により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手段と、前記切出手段により切り出された前記対象領域の画像特徴と前記生成手段により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手段と、を備えたことを特徴とする。

また、請求項５に係る発明は、上記の発明において、前記推定手順は、外部から入力された文字列が前記パターンであるスタンプと文字とが重なってスタンプ重なり文字画像を構成する場合に、当該スタンプ重なり文字画像について、当該スタンプの位置を推定し、前記切出手順は、前記推定手順により推定された前記スタンプの位置に基づいて、前記スタンプ重なり文字画像からスタンプを除去するとともに、当該スタンプを除去した前記スタンプ重なり文字画像から文字領域を特定した後、当該スタンプを除去する前のスタンプ重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、前記生成手順は、前記推定手順により推定された前記スタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を生成し、前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記スタンプ重なり文字画像を構成する文字を認識することを特徴とする。

本発明によれば、外部から入力された文字列が前記パターン重なり文字（例えば、帳票上の罫線と文字とが重なったものやスタンプと文字とが重なったものなど）を構成している場合に、予め保持するパターンの特徴（例えば、帳票上の罫線やスタンプの輪郭などの画素特徴や方向特徴）と文字の特徴（例えば、フォントやスタイルなどを加味した文字の画素特徴や方向特徴）とを合成することで当該パターン重なり文字の特徴（例えば、帳票上の罫線と数字とを合成したものの画素特徴や方向特徴）を生成し、当該パターン重なり文字の特徴と入力されたパターン重なり文字の特徴とを照合して、当該入力されたパターン重なり文字を認識するので、外部から文字列が入力されるたびに、パターン重なり文字の特徴を動的に生成することができ、パターンと文字との重なり位置を考慮した場合に多岐にわたるパターン重なり文字の特徴を記憶するための辞書容量を確保することなく、パターン重なり文字を構成する文字を精度よく認識することが可能である。

また、本発明によれば、外部から入力された文字列が罫線重なり文字画像を構成する場合に、罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、推定された罫線位置および罫線幅に基づいて罫線重なり文字画像から罫線を除去するとともに、文字列高さに基づいて罫線を除去した罫線重なり文字画像から文字領域を特定した後、罫線を除去する前の罫線重なり文字画像から、特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、推定された罫線位置および罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、罫線重なり文字画像と照合するための参照用画像を生成し、切り出された対象領域の特徴と生成された参照用画像の特徴とを照合（例えば、対象領域および参照用画像から抽出した画素特徴や方向特徴を照合）して、罫線重なり文字画像を構成する文字を認識するので、外部から文字列が入力されるたびに、罫線重なり文字の特徴を動的に生成することができ、罫線と文字との重なり位置を考慮した場合に多岐にわたる罫線重なり文字の特徴を記憶するための辞書容量を確保することなく、罫線重なり文字を構成する文字を精度よく認識することが可能である。

また、本発明によれば、スタンプ重なり文字画像についてスタンプの位置を推定し、推定されたスタンプの位置に基づいて、スタンプ重なり文字画像からスタンプを除去するとともに、スタンプを除去したスタンプ重なり文字画像から文字領域を特定した後、スタンプを除去する前のスタンプ重なり文字画像から、特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、推定されたスタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、スタンプ重なり文字画像と照合するための参照用画像を生成し（例えば、図１３参照）、スタンプを除去する前のスタンプ重なり文字画像から切り出された対象領域の画像特徴（例えば、スタンプ輪郭の形状とその内部を構成する文字の画素特徴や方向特徴）と生成された参照用画像の画像特徴（例えば、画素特徴や方向特徴）とを照合して、スタンプ重なり文字画像を構成する文字を認識するので、スタンプと文字とが重なったスタンプ重なり文字が外部から入力されるたびに、スタンプ重なり文字の特徴を動的に生成することができ、スタンプおよび文字からなるスタンプ重なり文字の特徴を記憶するための辞書容量を確保することなく、スタンプ重なり文字を構成する文字を精度よく認識することが可能である。

以下に添付図面を参照して、本発明に係る文字認識プログラム、文字認識方法および文字認識装置の実施例を詳細に説明する。なお、以下では、本発明に係る文字認識プログラムを実行する文字認識装置において、電子化された帳票上の文字を認識する場合を例に挙げ、実施例１として説明した後、本発明に含まれる他の実施例を説明する。

以下の実施例１では、実施例１に係る文字認識装置の概要および特徴、文字認識装置の構成および処理を説明し、最後に実施例１による効果を説明する。

［文字認識装置の概要および特徴（実施例１）］
まず最初に、図１等を用いて、実施例１に係る概要および特徴を説明する。図１は、実施例１に係る文字認識装置の概要および特徴を説明するための図である。

実施例１に係る文字認識装置は、罫線と文字とが重なって構成される罫線接触文字画像（特許請求の範囲に記載の「罫線重なり文字画像」に対応する）から文字を認識することを概要とするが、外部から文字列が入力されるたびに、罫線重なり文字の特徴を動的に生成することができ、罫線と文字との重なり位置を考慮した場合に多岐にわたる罫線重なり文字の特徴を記憶するための辞書容量を確保することなく、罫線重なり文字を構成する文字を精度よく認識することが可能である点に主たる特徴がある。

この主たる特徴について具体的に説明すると、実施例１に係る文字認識装置は、例えば、文字列が記入された帳票データが外部から入力されると（図１の（１）参照）、帳票上の罫線と文字（例えば、活字数字やアルファベット、仮名文字や漢字など）とが接触している（もしくは、重なっている）罫線接触文字列画像から罫線を検出し、検出した罫線を仮除去して文字領域を推定する（図１の（２）参照）。

具体的には、まず、実施例１に係る文字認識装置は、図２および図３に例示するように、外部から入力された帳票データについて黒画素ヒストグラム投影を行い、黒画素の度数のピークに基づいて罫線の位置（Ｌ_S）および罫線の幅（Ｈ_L）を検出するとともに、黒画素の度数の境界から文字列高さ（Ｈ_S）を検出する。次に、検出した罫線の位置および幅に基づいて、罫線接触文字列画像から罫線を仮除去した後、文字列が個別に分断された（すなわち、罫線を除去することで一続きになっていた文字と罫線から文字個別に分かれた）文字列画像に対して、検出した文字列高さを各々あてはめて文字領域を推定する。

なお、図４に例示するように、入力された罫線接触文字列画像に傾きがある場合（図４の（１）参照）には、部分文字列単位に区切ってから黒画素ヒストグラムを行って罫線を検出し（図４の（２）参照）、罫線を仮除去するようにしてもよい（図４の（３）参照）。文字列に傾きがある場合には、黒画素ヒストグラムのピークが明瞭に出ない点を考慮する趣旨である。

文字領域の推定を終えると、実施例１に係る文字認識装置は、図５に例示するように、推定した文字領域に基づいて（図５の（１）参照）、外部から入力された罫線接触文字列画像（原画像）から罫線接触文字画像を抽出する（図５の（２）および図１の（３）参照）。

罫線接触文字画像を抽出した後、実施例１に係る文字認識装置は、予め保持する参照用文字画像に擬似罫線を付加して参照用罫線付き文字画像を生成する（図１の（４）参照）。具体的には、実施例１に係る文字認識装置は、検出した罫線位置および罫線幅に基づいて、予め保持する参照用画像に擬似罫線を付加して参照用罫線付き文字画像を生成する。ここで、実施例１に係る文字認識装置は、図６に例示するように、既存フォントの画像を大量に用いて生成した平均文字画像を参照用文字画像として予め保持するようにしてもよい。

参照用罫線付き文字画像を生成した後、実施例１に係る文字認識装置は、罫線接触文字列画像（原画像）から抽出した罫線接触文字画像、および生成した参照用罫線付き文字画像から画素特徴を各々抽出して、抽出した画素特徴同士を照合する（図１の（５）参照）。具体的には、罫線接触文字画像を構成する各画素濃度の配列と、参照用罫線付き文字画像を構成する各画素濃度の配列と照合して、例えば、所定の照合度が得られる場合には、生成した参照用罫線付き文字画像（例えば、活字数字の「５」および罫線の組み合わせからなる参照用罫線付き文字画像）とを構成する文字（例えば、活字数字の「５」）であると認識する。

このようなことから、実施例１に係る文字認識装置は、上述した主たる特徴の如く、外部から文字列が入力されるたびに、罫線重なり文字の特徴を動的に生成することができ、罫線と文字との重なり位置を考慮した場合に多岐にわたる罫線重なり文字の特徴を記憶するための辞書容量を確保することなく、罫線重なり文字を構成する文字を精度よく認識することが可能である。

［文字認識装置の構成（実施例１）］
次に、図７を用いて、実施例１に係る文字認識装置の構成を説明する。図７は、実施例１に係る文字認識装置の構成を示すブロック図である。なお、同図では、実施例１に係る文字認識装置を実現する上で必要な処理部等の構成のみを図示し、その他の構成については記載を省略する。

同図に示すように、実施例１に係る文字認識装置１０は、入力部１１と、データ読取部１２と、出力部１３と、記憶部１４と、制御部１５とから構成される。

このうち、入力部１１は、各種の情報の入力を受け付ける入力受付部であり、キーボードやマウス、マイクなどを備えて構成され、例えば、文字認識装置の管理者などから電子化された帳票データの指定などを受け付けて入力する。なお、後述するモニタも、マウスと協働してポインティングディバイス機能を実現する。

データ読取部１２は、各種データの読取を読取る読取部であり、例えば、帳票上に文字列（例えば、活字数字やアルファベット、仮名文字や漢字など）が記入された帳票データを読み取って、制御部１５へ出力する。

出力部１３は、各種の情報を出力する出力部であり、モニタ（若しくはディスプレイ、タッチパネル）やスピーカを備えて構成され、例えば、後述する文字認識部１５ｄによる文字認識結果を表示出力する。

記憶部１４は、制御部１５による各種処理に必要なデータおよびプログラムを記憶する記憶部であり、特に本発明に密接に関連するものとしては、参照用画像記憶部１４ａを備える。

参照用画像記憶部１４ａは、後述する文字認識部１５ｄにおいて文字認識処理において利用される参照用画像を記憶し、例えば、図６に例示するように、既存フォントの画像を大量に用いて生成した平均文字画像を参照用文字画像として各々記憶する。

制御部１５は、ＯＳ（Operating System）などの制御プログラム、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する処理部であり、特に本発明に密接に関連するものとしては、罫線検出部１５ａと、文字領域抽出部１５ｂと、照合用画像生成部１５ｃと、文字認識部１５ｄとを備える。

このうち、罫線検出部１５ａは、外部から入力された帳票データから罫線を検出する処理部である。具体的には、罫線検出部１５ａは、データ読取部１２によって読取られた帳票データを受け付けると、帳票データについて黒画素ヒストグラム投影を行い、黒画素の度数のピークに基づいて罫線の位置（Ｌ_S）および罫線の幅（Ｈ_L）を検出するとともに、黒画素の度数の境界から文字列高さ（Ｈ_S）を検出する（図２および図３参照）。そして、罫線検出Ｂ１５ａは、各検出結果を文字領域抽出部１５ｂおよび照合用画像生成部１５ｃへ出力する。

文字領域抽出部１５ｂは、罫線接触文字列画像から文字領域を推定して、罫線接触文字画像を抽出する処理部である。具体的には、文字領域抽出部１５ｂは、帳票データが帳票上の罫線と文字（例えば、活字数字やアルファベット、仮名文字や漢字など）とが接触している（もしくは、重なっている）罫線接触文字列画像を構成している場合に、罫線検出部１５ａから受け付けた罫線の位置および幅に基づいて、罫線接触文字列画像から罫線を仮除去した後、文字列が個別に分断された罫線接触文字列画像に対して、罫線検出部１５ａから受け付けた文字列高さを各々あてはめて文字領域を推定する。文字領域の推定を終えると、文字領域抽出部１５ｂは、推定した文字領域に基づいて、外部から入力された罫線接触文字列画像（原画像）から罫線接触文字画像を抽出する。そして、文字領域抽出部１５ｂは、抽出した罫線接触文字画像を文字認識部１５ｄへ出力する。

なお、図４に例示するように、入力された罫線接触文字列画像に傾きがある場合（図４の（１）参照）には、罫線検出部１５ａは、罫線接触文字列画像を部分文字列単位に区切ってから黒画素ヒストグラムを行って罫線を検出し（図４の（２）参照）、文字領域抽出部１５ｂは、その検出結果に応じて罫線を仮除去した後（図４の（３）参照）、文字領域を推定して抽出するようにしてもよい。文字列に傾きがある場合には、黒画素ヒストグラムのピークが明瞭に出ない点を考慮する趣旨である。

照合用画像生成部１５ｃは、文字画像の認識に用いられる参照用罫線付き文字画像を生成する処理部である。具体的には、照合用画像生成部１５ｃは、罫線検出部１５ａから受け付けた罫線位置および罫線幅に基づいて、予め保持する参照用画像に擬似罫線を付加して参照用罫線付き文字画像を生成する。そして、照合用画像生成部１５ｃは、生成した参照用罫線付き文字画像を文字認識部１５ｄへ出力する。

文字認識部１５ｄは、文字領域抽出部１５ｂから受け付けた罫線接触文字画像、および照合用画像生成部１５ｃから受け付けた参照用罫線付き文字画像から画素特徴を各々抽出して照合することで、罫線接触文字画像を構成する文字を認識する処理部である。具体的には、文字認識部１５ｄは、罫線接触文字画像を構成する各画素濃度の配列と、参照用罫線付き文字画像を構成する各画素濃度の配列と照合して、例えば、所定の照合度が得られる場合には、生成した参照用罫線付き文字画像（例えば、活字数字の「５」および罫線の組み合わせからなる参照用罫線付き文字画像）とを構成する文字（例えば、活字数字の「５」）であると認識する。そして、文字認識部１５ｄは、文字認識結果を出力部１３から表示出力する。

［文字認識装置による処理（実施例１）］
次に、図８を用いて、実施例１に係る文字認識装置による処理を説明する。図８は、実施例１に係る文字認識装置の処理の流れを示すフローチャートである。

同図に示すように、帳票上に文字列（例えば、活字数字やアルファベット、仮名文字や漢字など）が記入された帳票データが入力されると（ステップＳ８０１肯定）、罫線検出部１５ａは、データ読取部１２によって読取られた帳票データを受け付けると、帳票データについて黒画素ヒストグラム投影を行い、黒画素の度数のピークに基づいて罫線の位置（Ｌ_S）および罫線の幅（Ｈ_L）を検出するとともに、黒画素の度数の境界から文字列高さ（Ｈ_S）を検出する（ステップＳ８０２、図２および図３参照）。そして、罫線検出部１５ａは、各検出結果を文字領域抽出部１５ｂおよび照合用画像生成部１５ｃへ出力する。

文字領域抽出部１５ｂは、罫線接触文字列画像から文字領域を推定する（ステップＳ８０３）。具体的には、文字領域抽出部１５ｂは、帳票データが帳票上の罫線と文字（例えば、活字数字やアルファベット、仮名文字や漢字など）とが接触している（もしくは、重なっている）罫線接触文字列画像を構成している場合に、罫線検出部１５ａから受け付けた罫線の位置および幅に基づいて、罫線接触文字列画像から罫線を仮除去した後、文字列が個別に分断された罫線接触文字列画像に対して、罫線検出部１５ａから受け付けた文字列高さを各々あてはめて文字領域を推定する。

続いて、文字領域抽出部１５ｂは、罫線接触文字列画像から罫線接触文字画像を抽出する（ステップＳ８０４）。具体的には、文字領域抽出部１５ｂは、推定した文字領域に基づいて、外部から入力された罫線接触文字列画像（原画像）から罫線接触文字画像を抽出する。そして、文字領域抽出部１５ｂは、抽出した罫線接触文字画像を文字認識部１５ｄへ出力する。

照合用画像生成部１５ｃは、文字画像の認識に用いられる参照用罫線付き文字画像を生成する（ステップＳ８０５）。具体的には、照合用画像生成部１５ｃは、罫線検出部１５ａから受け付けた罫線位置および罫線幅に基づいて、予め保持する参照用画像に擬似罫線を付加して参照用罫線付き文字画像を生成する。そして、照合用画像生成部１５ｃは、生成した参照用罫線付き文字画像を文字認識部１５ｄへ出力する。

文字認識部１５ｄは、文字領域抽出部１５ｂから受け付けた罫線接触文字画像、および照合用画像生成部１５ｃから受け付けた参照用罫線付き文字画像から画素特徴を各々抽出する（ステップＳ８０６）。次に、文字認識部１５ｄは、罫線接触文字画像を構成する各画素濃度の配列と、参照用罫線付き文字画像を構成する各画素濃度の配列と照合する（ステップＳ８０７）。

そして、文字認識部１５ｄは、例えば、所定の照合度が得られる場合には、罫線接触文字画像が生成した参照用罫線付き文字画像（例えば、活字数字の「５」および罫線の組み合わせからなる参照用罫線付き文字画像）を構成する文字（例えば、活字数字の「５」）であると認識する。

このようなことから、実施例１によれば、外部から入力された文字列が罫線重なり文字画像を構成する場合に、罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、推定された罫線位置および罫線幅に基づいて罫線重なり文字画像から罫線を除去するとともに、文字列高さに基づいて罫線を除去した罫線重なり文字画像から文字領域を特定した後、罫線を除去する前の罫線重なり文字画像から、特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、推定された罫線位置および罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、罫線重なり文字画像と照合するための参照用画像を生成し、切り出された対象領域の特徴と生成された参照用画像の特徴とを照合（例えば、対象領域および参照用画像から抽出した画素特徴や方向特徴を照合）して、罫線重なり文字画像を構成する文字を認識するので、外部から文字列が入力されるたびに、罫線重なり文字の特徴を動的に生成することができ、罫線と文字との重なり位置を考慮した場合に多岐にわたる罫線重なり文字の特徴を記憶するための辞書容量を確保することなく、罫線重なり文字を構成する文字を精度よく認識することが可能である。

また、実施例１によれば、罫線除去前の罫線重なり画像から切り出された対象領域の各画素濃度の配列である画素特徴と、生成された参照用画像の各画素濃度の配列である画素特徴とを照合して罫線重なり文字画像を構成する文字を認識するので、罫線重なり文字画像を構成する文字を画素濃度の配列から簡易に認識することが可能である。

さて、これまで本発明の実施例１について説明したが、本発明は上述した実施例１以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下では、本発明に含まれる他の実施例を説明する。

（１）方向特徴を照合して文字認識
上記の実施例１では、罫線接触文字画像および参照用罫線付き文字画像から各々抽出した画素特徴同士を照合することにより、罫線接触文字画像を構成する文字を認識する場合を説明したが、本発明はこれに限定されるものではなく、罫線接触文字画像および参照用罫線付き文字画像から各々抽出した方向特徴同士を照合することにより、罫線接触文字画像を構成する文字を認識するようにしてもよい。

具体的には、図９に例示するように、参照用文字画像を構成する各画素（画素濃度）の配列方向である方向特徴を生成して、記憶部１４に予め記憶しておき、照合用画像生成部１５ｃは、記憶部１４に予め記憶してある方向特徴と罫線の方向特徴とを組み合わせて、参照用罫線付き文字画像の方向特徴を生成し、文字認識部１５ｄは、生成された方向特徴と、罫線接触画像から抽出した方向特徴とを照合することで、罫線接触文字画像を構成する文字を認識する。

このように、予め保持する文字画像の各画素濃度の垂直方向および水平方向への配列から定まる配列方向と、罫線を構成する各画素濃度の水平方向への配列から定まる配列方向とを組み合わせて、参照用画像の画素濃度が配列している方向の特徴である方向特徴を生成し、罫線除去前の罫線重なり画像から切り出された対象領域の方向特徴と、生成された参照用画像の方向特徴とを照合して罫線重なり文字画像を構成する文字を認識するので、画素の配列によっては同一の文字であっても認識結果が左右されやすい画素特徴で文字認識を行うよりも、より精度よく罫線重なり文字画像を構成する文字を認識することが可能である。

（２）互いに接触している（重なっている）文字領域の抽出および認識
また、上記の実施例１では、罫線接触文字列画像から罫線を仮除去した後、推定した文字領域に応じて、認識の対象となる対象領域を罫線接触文字列画像か抽出する場合を説明したが、本発明はこれに限定されるものではなく、罫線を仮除去した後、互いに接触している（重なっている）文字画像を一塊の文字領域として抽出するようにしてもよい。

例えば、図１０に例示するように、罫線を除去しても、文字画像が互いに接触していて文字領域の推定が難しく、対象領域の抽出（切出し）が困難である場合には、いくつかの分割パターンごとに罫線除去後の罫線重なり文字画像を所定の領域に分割した上で、分割した所定の領域のそれぞれについて仮認識を行って、各認識信頼度が所定の信頼度に到達している場合には、信頼度が最も高い分割パターンを選択して、選択したパターンに応じて認識の対象となる対象領域を抽出する。一方、仮認識の結果、各認識信頼度が所定の信頼度に到達していない場合には、罫線除去後の罫線重なり文字画像を一塊の文字領域として特定し、罫線除去前の罫線重なり文字画像から、一塊として特定された文字領域に応じて対象領域を抽出する。

また、一塊として特定された文字領域に応じて対象領域を抽出した場合には、予め保持する文字画像をいくつか組合せて生成した組合せ文字画像ごとに罫線画像を付加して、参照用画像をそれぞれ生成して認識を行う。

このように、罫線除去後の罫線重なり文字画像から、一文字からなる文字領域を特定できない場合に、いくつかの分割パターンごとに、罫線除去後の罫線重なり文字画像を所定の領域に分割した上で、所定の領域のそれぞれについて仮認識を行って、所定の領域の各認識信頼度が所定の信頼度に到達している場合には、信頼度が最も高い分割パターンを選択し、選択された分割パターンに応じて、罫線除去前の罫線重なり文字画像内から文字認識の対象となる対象領域を切り出す一方で、所定の領域の認識信頼度がいずれも所定の信頼度に到達していない場合には、罫線除去後の罫線重なり文字画像を一塊の文字領域として特定し、罫線除去前の罫線重なり文字画像から、当該一塊として特定された領域に応じて対象領域として切り出し、一塊として特定した文字領域に応じた対象領域が切り出された場合に、予め保持する文字画像をいくつか組合せて生成した組合せ文字画像ごとに罫線画像を付加して参照用画像をそれぞれ生成するので、罫線重なり文字画像から罫線を除去しても、入力文字列の各文字が互いに重なって文字領域を特定できない場合であっても、文字である蓋然性の高い領域を特定して、罫線重なり文字画像から対象領域を切り出すことができ、一方、文字である蓋然性の高い領域を特定できない場合には、罫線を除去した罫線重なり文字画像から切り出した一塊の対象領域について、文字認識を行うための参照用画像を生成することができ、罫線重なり文字を構成する文字を精度よく認識することが可能である。

（３）罫線が点線である場合に実線に変換
また、上記の実施例１において、罫線が点線である場合には、例えば、図１１に例示するように、点線を実線に変換して罫線接触文字列画像の罫線位置と文字列高さと罫線幅とをそれぞれ推定するようにしてもよい。

このように、罫線重なり文字画像を構成する罫線が点線である場合に点線を実線に変換して、点線が実線に変換された罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定するので、検出の困難な点線の検出を行う必要がなく、また、点線を実線に変換することで参照用画像を生成するために点線の空白位置を特定する必要もなく、結果として、罫線重なり文字画像を効率的に認識することが可能である。

（４）認識結果により確定した文字フォントに応じて参照用画像生成
また、上記の実施例１において、罫線接触文字画像の認識結果から、入力された文字列のフォントを推定して、予めフォントごとに保持する文字画像の中から、推定されたフォントに応じて選択した文字画像に罫線画像を付加して、罫線重なり文字画像と照合するための参照用画像を生成するようにしてもよい。

このように、罫線接触文字画像の認識結果から入力された文字列のフォントを推定して、予めフォントごとに保持する文字画像の中から、推定されたフォントに応じて選択した文字画像に罫線画像を付加して、罫線重なり文字画像と照合するための参照用画像を生成するので、例えば、罫線重なり文字画像の認識処理の過程で推定した文字のフォントを用いて、残りの文字画像認識を行うことができ、特殊なフォントに左右されることなく、罫線重なり文字画像を構成する文字を精度よく認識することが可能である。

（５）スタンプ重なり文字画像の認識
また、上記の実施例１では、罫線と文字とが重なって構成される罫線重なり文字画像について文字認識を行う場合を説明したが、本発明はこれに限定されるものではなく、例えば、図１２に例示するように、スタンプと文字とが重なって構成されるスタンプ重なり文字画像について文字認識を行うようにしてもよい。

具体的には、スタンプ重なり文字画像についてスタンプの位置を推定し、推定されたスタンプの位置に基づいて、スタンプ重なり文字画像からスタンプを除去するとともに、スタンプを除去したスタンプ重なり文字画像から文字領域を特定した後、スタンプを除去する前のスタンプ重なり文字画像から、特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、推定されたスタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、スタンプ重なり文字画像と照合するための参照用画像を生成し（例えば、図１３参照）、スタンプを除去する前のスタンプ重なり文字画像から切り出された対象領域の画像特徴と生成された参照用画像の画像特徴とを照合して、スタンプ重なり文字画像を構成する文字を認識する。

このように、スタンプ重なり文字画像についてスタンプの位置を推定し、推定されたスタンプの位置に基づいて、スタンプ重なり文字画像からスタンプを除去するとともに、スタンプを除去したスタンプ重なり文字画像から文字領域を特定した後、スタンプを除去する前のスタンプ重なり文字画像から、特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、推定されたスタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、スタンプ重なり文字画像と照合するための参照用画像を生成し（例えば、図１３参照）、スタンプを除去する前のスタンプ重なり文字画像から切り出された対象領域の画像特徴（例えば、スタンプ輪郭の形状とその内部を構成する文字の画素特徴や方向特徴）と生成された参照用画像の画像特徴（例えば、画素特徴や方向特徴）とを照合して、スタンプ重なり文字画像を構成する文字を認識するので、スタンプと文字とが重なったスタンプ重なり文字が外部から入力されるたびに、スタンプ重なり文字の特徴を動的に生成することができ、スタンプおよび文字からなるスタンプ重なり文字の特徴を記憶するための辞書容量を確保することなく、スタンプ重なり文字を構成する文字を精度よく認識することが可能である。

また、スタンプ重なり文字画像を認識する場合に、予め保持する文字画像ごとに、スタンプの傾きや濃度、色の異なるスタンプ画像を付加して、スタンプ重なり文字画像と照合するための参照用画像を複数生成し、スタンプを除去する前のスタンプ重なり文字画像から切り出された対象領域の画像特徴と、予め保持する文字画像ごとに複数生成した参照用画像の画像特徴とをそれぞれ照合して、スタンプ重なり文字を構成する文字を認識するようにしてもよい。

このように、スタンプ重なり文字画像を認識する場合に、予め保持する文字画像ごとに、スタンプの傾きや濃度、色の異なるスタンプ画像を付加して、スタンプ重なり文字画像と照合するための参照用画像を複数生成し、スタンプを除去する前のスタンプ重なり文字画像から切り出された対象領域の画像特徴と、予め保持する文字画像ごとに複数生成した参照用画像の画像特徴とをそれぞれ照合して、スタンプ重なり文字を構成する文字を認識するので、考え得るパターン重なり文字の複数の特徴について考慮することができ、パターン重なり文字を構成する文字を精度よく認識することが可能である。

（６）装置構成等
また、図７に示した文字認識装置１０の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、文字認識装置１０の分散・統合の具体的形態は図示のものに限られず、罫線検出部１５ａと文字領域抽出部１５ｂとを統合するなど、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、文字認識装置１０にて行なわれる各処理機能（罫線検出機能、文字領域抽出機能、照合用画像生成機能および文字認識機能、図８参照）は、その全部または任意の一部が、ＣＰＵおよび当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

（７）文字認識プログラム
ところで、上記の実施例１で説明した文字認識装置１０にかかる各種の処理（図８参照）は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することができる。そこで、以下では、図１４を用いて、上記の実施例１と同様の機能を有する文字認識プログラムを実行するコンピュータの一例を説明する。図１４は、文字認識プログラムを実行するコンピュータを示す図である。

まず、図１４に示すように、文字認識装置としてのコンピュータ２０は、入力部２１、データ読取部２２、出力部２３、ＨＤＤ２４、ＲＡＭ２５、ＲＯＭ２６およびＣＰＵ２７をバス３０で接続して構成される。ここで、入力部２１、データ読取部２２および出力部２３は、図７に示した入力部１１、データ読取部１２および出力部１３にそれぞれ対応する。

そして、ＲＯＭ２６には、上記の実施例１に示した文字認識装置１０と同様の機能を発揮する文字認識プログラム、つまり、図１４に示すように、罫線検出プログラム２６ａ、文字領域抽出プログラム２６ｂ、照合用画像生成プログラム２６ｃおよび文字認識プログラム２７ｄがあらかじめ記憶されている。なお、これらのプログラム２６ａ、２６ｂ、２６ｃおよび２６ｄについては、図７に示した文字認識装置１０の各構成要素と同様、適宜統合または分散してもよい。なお、ＲＯＭ２６は、不揮発性の「ＲＡＭ」でもよい。

そして、ＣＰＵ２７が、これらのプログラム２６ａ、２６ｂ、２６ｃおよび２６ｄをＲＯＭ２６から読み出して実行することで、図１４に示すように、各プログラム２６ａ、２６ｂ、２６ｃおよび２６ｄは、罫線検出プロセス２７ａ、文字領域抽出プロセス２７ｂ、照合用画像生成プロセス２７ｃおよび文字認識プロセス２７ｄとして機能するようになる。なお、各プロセス２７ａ、２７ｂ、２７ｃおよび２７ｄは、図７に示した罫線検出部１５ａ、文字領域抽出部１５ｂ、照合用画像生成部１５ｃおよび文字認識部１５ｄにそれぞれ対応する。

また、ＨＤＤ２４には、図１４に示すように、参照用画像テーブル２４ａが設けられる。この参照用画像テーブル２４ａは、図７に示した参照用画像記憶部１４ａに対応する。そして、ＣＰＵ２７は、参照用画像テーブル２４ａから参照用画像データ２５ａを読み出してＲＡＭ２５に格納し、ＲＡＭ２５に格納された参照用画像データ２５ａに基づいて文字認識処理を実行する。

なお、上記した各プログラム２６ａ、２６ｂ、２６ｃおよび２６ｄについては、必ずしも最初からＲＯＭ２６に記憶させておく必要はなく、例えば、コンピュータ２０に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ−ＲＯＭ、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」、または、コンピュータ２０の内外に備えられるＨＤＤなどの「固定用の物理媒体」、さらには、公衆回線、インターネット、ＬＡＮ、ＷＡＮなどを介してコンピュータ２０に接続される「他のコンピュータ（またはサーバ）」などに各プログラムを記憶させておき、コンピュータ２０がこれらから各プログラムを読み出して実行するようにしてもよい。

（付記１）パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する方法をコンピュータに実行させる文字認識プログラムであって、
外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手順と、
前記推定手順により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像から文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手順と、
前記推定手順により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手順と、
前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手順と、
をコンピュータに実行させることを特徴とする文字認識プログラム。

（付記２）前記推定手順は、外部から入力された文字列が前記パターンである罫線と文字とが重なって罫線重なり文字画像を構成する場合に、当該罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、
前記切出手順は、前記推定手順により推定された前記罫線位置および前記罫線幅に基づいて、前記罫線重なり文字画像から罫線を除去するとともに、当該推定手順により推定された前記文字列高さに基づいて、当該罫線を除去した前記罫線重なり文字画像から文字領域を特定した後、当該罫線を除去する前の罫線重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成手順は、前記推定手順により推定された前記罫線位置および前記罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする付記１に記載の文字認識プログラム。

（付記３）前記切出手順により罫線除去後の罫線重なり文字画像から、一文字からなる文字領域を特定できない場合に、いくつかの分割パターンごとに当該罫線除去後の罫線重なり文字画像を所定の領域に分割した上で、当該所定の領域のそれぞれについて仮認識を行って、当該所定の領域の各認識信頼度が所定の信頼度に到達している場合には、当該信頼度が最も高い分割パターンを選択する分割パターン選択手順をさらにコンピュータに実行させ、
前記切出手順は、前記分割パターン選択手順により選択された前記分割パターンに応じて、罫線除去前の罫線重なり文字画像内から前記対象領域を切り出す一方で、前記分割パターン選択手順において前記所定の領域の認識信頼度がいずれも所定の信頼度に到達していない場合には、罫線除去後の罫線重なり文字画像を一塊の文字領域として特定し、罫線除去前の罫線重なり文字画像から、当該一塊として特定された文字領域に応じて前記対象領域として切り出し、
前記生成手順は、前記切出手順により前記一塊として特定した文字領域に応じた前記対象領域が切り出された場合に、予め保持する文字画像をいくつか組合せて生成した組合せ文字画像ごとに罫線画像を付加して、前記参照用画像をそれぞれ生成することを特徴とする付記２に記載の文字認識プログラム。

（付記４）前記罫線重なり文字画像を構成する罫線が点線である場合に、当該点線を実線に変換する変換手順をさらにコンピュータに実行させ、
前記推定手順は、前記変換手段により点線が実線に変換された前記罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定することを特徴とする付記２に記載の文字認識プログラム。

（付記５）前記認識手順は、前記切出手順により切り出された前記対象領域の各画素濃度の配列である画素特徴と、前記参照用画像の各画素濃度の配列である画素特徴とを照合して、前記罫線重なり文字画像を構成する文字を認識することを特徴とする付記２に記載の文字認識プログラム。

（付記６）前記生成手順は、予め保持する文字画像の各画素濃度の垂直方向および水平方向への配列から定まる配列方向と、罫線を構成する各画素濃度の水平方向への配列から定まる配列方向とを組み合わせて、前記参照用画像の画素濃度が配列している方向の特徴である方向特徴を生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の方向特徴と前記生成手順により生成された前記参照用画像の方向特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする付記１に記載の文字認識プログラム。

（付記７）前記認識手順による認識結果から前記入力された文字列のフォントを推定する推定手順をさらにコンピュータに実行させ、
前記生成手順は、予めフォントごとに保持する文字画像の中から、前記推定手段により推定された前記フォントに応じて選択した文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成することを特徴とする文字認識プログラム。

（付記８）前記推定手順は、外部から入力された文字列が前記パターンであるスタンプと文字とが重なってスタンプ重なり文字画像を構成する場合に、当該スタンプ重なり文字画像について、当該スタンプの位置を推定し、
前記切出手順は、前記推定手順により推定された前記スタンプの位置に基づいて、前記スタンプ重なり文字画像からスタンプを除去するとともに、当該スタンプを除去した前記スタンプ重なり文字画像から文字領域を特定した後、当該スタンプを除去する前のスタンプ重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成手順は、前記推定手順により推定された前記スタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記スタンプ重なり文字画像を構成する文字を認識することを特徴とする付記１に記載の文字認識プログラム。

（付記９）前記生成手順は、前記推定手順により推定された前記スタンプの位置を用いて、予め保持する文字画像ごとに、スタンプの傾きや濃度、色の異なるスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を複数生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と、前記生成手順により予め保持する文字画像ごとに複数生成した参照用画像の画像特徴とをそれぞれ照合して、前記スタンプ重なり文字を構成する文字を認識することを特徴とする付記８に記載の文字認識プログラム。

（付記１０）パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識方法であって、
外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定工程と、
前記推定工程により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像から文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出工程と、
前記推定工程により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成工程と、
前記切出工程により切り出された前記対象領域の画像特徴と前記生成工程により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識工程と、
を含んだことを特徴とする文字認識方法。

（付記１１）前記推定工程は、外部から入力された文字列が前記パターンである罫線と文字とが重なって罫線重なり文字画像を構成する場合に、当該罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、
前記切出工程は、前記推定工程により推定された前記罫線位置および前記罫線幅に基づいて、前記罫線重なり文字画像から罫線を除去するとともに、当該推定工程により推定された前記文字列高さに基づいて、当該罫線を除去した前記罫線重なり文字画像から文字領域を特定した後、当該罫線を除去する前の罫線重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成工程は、前記推定工程により推定された前記罫線位置および前記罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成し、
前記認識工程は、前記切出工程により切り出された前記対象領域の画像特徴と前記生成工程により生成された前記参照用画像の画像特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする付記１０に記載の文字認識方法。

（付記１２）前記推定工程は、外部から入力された文字列が前記パターンであるスタンプと文字とが重なってスタンプ重なり文字画像を構成する場合に、当該スタンプ重なり文字画像について、当該スタンプの位置を推定し、
前記切出工程は、前記推定工程により推定された前記スタンプの位置に基づいて、前記スタンプ重なり文字画像からスタンプを除去するとともに、当該スタンプを除去した前記スタンプ重なり文字画像から文字領域を特定した後、当該スタンプを除去する前のスタンプ重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成工程は、前記推定工程により推定された前記スタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を生成し、
前記認識工程は、前記切出工程により切り出された前記対象領域の画像特徴と前記生成工程により生成された前記参照用画像の画像特徴とを照合して前記スタンプ重なり文字画像を構成する文字を認識することを特徴とする付記１０に記載の文字認識方法。

（付記１３）パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識装置であって、
外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手段と、
前記推定手段により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像から文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手段と、
前記推定手段により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手段と、
前記切出手段により切り出された前記対象領域の画像特徴と前記生成手段により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手段と、
を備えたことを特徴とする文字認識装置。

（付記１４）前記推定手段は、外部から入力された文字列が前記パターンである罫線と文字とが重なって罫線重なり文字画像を構成する場合に、当該罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、
前記切出手段は、前記推定手段により推定された前記罫線位置および前記罫線幅に基づいて、前記罫線重なり文字画像から罫線を除去するとともに、当該推定手段により推定された前記文字列高さに基づいて、当該罫線を除去した前記罫線重なり文字画像から文字領域を特定した後、当該罫線を除去する前の罫線重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成手段は、前記推定手順により推定された前記罫線位置および前記罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成し、
前記認識手段は、前記切出手段により切り出された前記対象領域の画像特徴と前記生成手段により生成された前記参照用画像の画像特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする付記１３に記載の文字認識装置。

（付記１５）前記推定手順は、外部から入力された文字列が前記パターンであるスタンプと文字とが重なってスタンプ重なり文字画像を構成する場合に、当該スタンプ重なり文字画像について、当該スタンプの位置を推定し、
前記切出手順は、前記推定手順により推定された前記スタンプの位置に基づいて、前記スタンプ重なり文字画像からスタンプを除去するとともに、当該スタンプを除去した前記スタンプ重なり文字画像から文字領域を特定した後、当該スタンプを除去する前のスタンプ重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成手順は、前記推定手順により推定された前記スタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記スタンプ重なり文字画像を構成する文字を認識することを特徴とする付記１３に記載の文字認識装置。

以上のように、本発明に係る文字認識プログラム、文字認識方法および文字認識装置は、パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する方法をコンピュータに実行させる場合等に有用であり、特に、大きな辞書容量を確保することなく、精度よく文字画像を認識することに適する。

実施例１に係る文字認識装置の概要および特徴を説明するための図である。実施例１に係る黒画素ヒストグラムを示す図である。実施例１に係る罫線位置、文字列高さおよび罫線幅を示す模式図である。実施例１に係る罫線検出および除去例を示す図である。実施例１に係る罫線接触文字画像の抽出例を示す図である。実施例１に係る参照用文字画像として採用される平均文字画像例を示す図である。実施例１に係る文字認識装置の構成を示すブロック図である。実施例１に係る文字認識装置の処理の流れ示すフローチャートである。実施例２に係る方向特徴の概念を示す図である。実施例２に係る文字列の構成例を示す図である。実施例２に係る参照用罫線付き文字画像の構成例を示す図である。実施例２に係るスタンプと重畳した文字例を示す図である。実施例２に係るスタンプと重畳させた文字の生成例を示す図である。文字認識プログラムを実行するコンピュータを示す図である。従来技術を説明するための図である。

符号の説明

１０文字認識装置
１１入力部
１２データ読取部
１３出力部
１４記憶部
１４ａ参照用画像記憶部
１５制御部
１５ａ罫線検出部
１５ｂ文字領域抽出部
１５ｃ照合用画像生成部
１５ｄ文字認識部
２０コンピュータ
２１入力部
２２データ読取部
２３出力部
２４ＨＤＤ（Hard Disk Drive）
２５ＲＡＭ（Random Access Memory）
２６ＲＯＭ（Read Only Memory）
２７ＣＰＵ（Central Processing Unit）
３０バス

Claims

パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する方法をコンピュータに実行させる文字認識プログラムであって、
外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手順と、
前記推定手順により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手順と、
前記推定手順により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手順と、
前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手順と、
をコンピュータに実行させることを特徴とする文字認識プログラム。
前記推定手順は、外部から入力された文字列が前記パターンである罫線と文字とが重なって罫線重なり文字画像を構成する場合に、当該罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、
前記切出手順は、前記推定手順により推定された前記罫線位置および前記罫線幅に基づいて、前記罫線重なり文字画像から罫線を除去するとともに、当該推定手順により推定された前記文字列高さに基づいて、当該罫線を除去した前記罫線重なり文字画像から文字領域を特定した後、当該罫線を除去する前の罫線重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成手順は、前記推定手順により推定された前記罫線位置および前記罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする請求項１に記載の文字認識プログラム。
パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識方法であって、
外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定工程と、
前記推定工程により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出工程と、
前記推定工程により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成工程と、
前記切出工程により切り出された前記対象領域の画像特徴と前記生成工程により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識工程と、
を含んだことを特徴とする文字認識方法。
パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識装置であって、
外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手段と、
前記推定手段により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手段と、
前記推定手段により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手段と、
前記切出手段により切り出された前記対象領域の画像特徴と前記生成手段により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手段と、
を備えたことを特徴とする文字認識装置。
前記推定手順は、外部から入力された文字列が前記パターンであるスタンプと文字とが重なってスタンプ重なり文字画像を構成する場合に、当該スタンプ重なり文字画像について、当該スタンプの位置を推定し、
前記切出手順は、前記推定手順により推定された前記スタンプの位置に基づいて、前記スタンプ重なり文字画像からスタンプを除去するとともに、当該スタンプを除去した前記スタンプ重なり文字画像から文字領域を特定した後、当該スタンプを除去する前のスタンプ重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成手順は、前記推定手順により推定された前記スタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記スタンプ重なり文字画像を構成する文字を認識することを特徴とする請求項１に記載の文字認識プログラム。