JP5034398B2 - 文字認識プログラム、文字認識方法および文字認識装置 - Google Patents

文字認識プログラム、文字認識方法および文字認識装置 Download PDF

Info

Publication number
JP5034398B2
JP5034398B2 JP2006249833A JP2006249833A JP5034398B2 JP 5034398 B2 JP5034398 B2 JP 5034398B2 JP 2006249833 A JP2006249833 A JP 2006249833A JP 2006249833 A JP2006249833 A JP 2006249833A JP 5034398 B2 JP5034398 B2 JP 5034398B2
Authority
JP
Japan
Prior art keywords
character
image
pattern
ruled line
overlapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006249833A
Other languages
English (en)
Other versions
JP2008071173A (ja
Inventor
悦伸 堀田
克仁 藤本
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006249833A priority Critical patent/JP5034398B2/ja
Priority to US11/654,180 priority patent/US7796817B2/en
Publication of JP2008071173A publication Critical patent/JP2008071173A/ja
Application granted granted Critical
Publication of JP5034398B2 publication Critical patent/JP5034398B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

この発明は、パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する方法をコンピュータに実行させる文字認識プログラム等に関する。
従来より、電子化されて入力された帳票上に記入されている文字画像と、その帳票上の罫線とが接触してしまっている罫線接触文字画像から、記入されている文字画像が何であるかを認識する技術が開示されている(例えば、特許文献1参照)。例えば、罫線と文字画像とが接触した罫線接触文字画像から罫線を除去し、その除去に伴って欠損した文字画像の一部を補完することにより、帳票上に記入されている文字画像を認識するというのが一般的である。
しかし、上記した従来の技術は、文字画像と罫線との接触の仕方が多様であることや、英数字のように単純な字形の文字ばかりでなく漢字のような複雑な字形の文字が存在することなどから、文字の一部を補完することが容易でないという問題があった(例えば、図15参照)。
そこで、例えば、帳票上の罫線と記入された文字画像とが接触した罫線接触文字画像の特徴を予め辞書として保持しておき、罫線接触文字画像から罫線を除去することなく、予め保持する辞書に基づいて、帳票上に記入されている文字画像を認識する技術が開示されている(例えば、特許文献2参照)。
特許第2871590号公報 特許第3455649号公報
ところで、罫線接触文字画像から罫線を除去することなく、帳票上に記入されている文字画像を認識する上記した従来の技術は、辞書容量が大きくなるという問題点があった。すなわち、罫線接触文字画像の特徴を予め辞書として保持する場合、太線、細線、点線および一点鎖線など罫線の種類や、上、下、左、右および文字内部など考え得る罫線と文字画像との接触位置が多岐にわたるため、保持する辞書容量が大きくなるという問題点があった。
そこで、この発明は、上述した従来技術の課題を解決するためになされたものであり、大きな辞書容量を確保することなく、精度よく文字画像を認識することが可能な文字認識プログラム、文字認識方法および文字認識装置を提供することを目的とする。
上述した課題を解決し、目的を達成するため、請求項1に係る発明は、パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する方法をコンピュータに実行させる文字認識プログラムであって、外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手順と、前記推定手順により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手順と、前記推定手順により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手順と、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手順と、をコンピュータに実行させることを特徴とする。
また、請求項2に係る発明は、上記の発明において、前記推定手順は、外部から入力された文字列が前記パターンである罫線と文字とが重なって罫線重なり文字画像を構成する場合に、当該罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、前記切出手順は、前記推定手順により推定された前記罫線位置および前記罫線幅に基づいて、前記罫線重なり文字画像から罫線を除去するとともに、当該推定手順により推定された前記文字列高さに基づいて、当該罫線を除去した前記罫線重なり文字画像から文字領域を特定した後、当該罫線を除去する前の罫線重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、前記生成手順は、前記推定手順により推定された前記罫線位置および前記罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成し、前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする。
また、請求項3に係る発明は、パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識方法であって、外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定工程と、前記推定工程により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出工程と、前記推定工程により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成工程と、前記切出工程により切り出された前記対象領域の画像特徴と前記生成工程により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識工程と、を含んだことを特徴とする。
また、請求項4に係る発明は、パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識装置であって、外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手段と、前記推定手段により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手段と、前記推定手段により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手段と、前記切出手段により切り出された前記対象領域の画像特徴と前記生成手段により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手段と、を備えたことを特徴とする。
また、請求項5に係る発明は、上記の発明において、前記推定手順は、外部から入力された文字列が前記パターンであるスタンプと文字とが重なってスタンプ重なり文字画像を構成する場合に、当該スタンプ重なり文字画像について、当該スタンプの位置を推定し、前記切出手順は、前記推定手順により推定された前記スタンプの位置に基づいて、前記スタンプ重なり文字画像からスタンプを除去するとともに、当該スタンプを除去した前記スタンプ重なり文字画像から文字領域を特定した後、当該スタンプを除去する前のスタンプ重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、前記生成手順は、前記推定手順により推定された前記スタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を生成し、前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記スタンプ重なり文字画像を構成する文字を認識することを特徴とする。
本発明によれば、外部から入力された文字列が前記パターン重なり文字(例えば、帳票上の罫線と文字とが重なったものやスタンプと文字とが重なったものなど)を構成している場合に、予め保持するパターンの特徴(例えば、帳票上の罫線やスタンプの輪郭などの画素特徴や方向特徴)と文字の特徴(例えば、フォントやスタイルなどを加味した文字の画素特徴や方向特徴)とを合成することで当該パターン重なり文字の特徴(例えば、帳票上の罫線と数字とを合成したものの画素特徴や方向特徴)を生成し、当該パターン重なり文字の特徴と入力されたパターン重なり文字の特徴とを照合して、当該入力されたパターン重なり文字を認識するので、外部から文字列が入力されるたびに、パターン重なり文字の特徴を動的に生成することができ、パターンと文字との重なり位置を考慮した場合に多岐にわたるパターン重なり文字の特徴を記憶するための辞書容量を確保することなく、パターン重なり文字を構成する文字を精度よく認識することが可能である。
また、本発明によれば、外部から入力された文字列が罫線重なり文字画像を構成する場合に、罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、推定された罫線位置および罫線幅に基づいて罫線重なり文字画像から罫線を除去するとともに、文字列高さに基づいて罫線を除去した罫線重なり文字画像から文字領域を特定した後、罫線を除去する前の罫線重なり文字画像から、特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、推定された罫線位置および罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、罫線重なり文字画像と照合するための参照用画像を生成し、切り出された対象領域の特徴と生成された参照用画像の特徴とを照合(例えば、対象領域および参照用画像から抽出した画素特徴や方向特徴を照合)して、罫線重なり文字画像を構成する文字を認識するので、外部から文字列が入力されるたびに、罫線重なり文字の特徴を動的に生成することができ、罫線と文字との重なり位置を考慮した場合に多岐にわたる罫線重なり文字の特徴を記憶するための辞書容量を確保することなく、罫線重なり文字を構成する文字を精度よく認識することが可能である。
また、本発明によれば、スタンプ重なり文字画像についてスタンプの位置を推定し、推定されたスタンプの位置に基づいて、スタンプ重なり文字画像からスタンプを除去するとともに、スタンプを除去したスタンプ重なり文字画像から文字領域を特定した後、スタンプを除去する前のスタンプ重なり文字画像から、特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、推定されたスタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、スタンプ重なり文字画像と照合するための参照用画像を生成し(例えば、図13参照)、スタンプを除去する前のスタンプ重なり文字画像から切り出された対象領域の画像特徴(例えば、スタンプ輪郭の形状とその内部を構成する文字の画素特徴や方向特徴)と生成された参照用画像の画像特徴(例えば、画素特徴や方向特徴)とを照合して、スタンプ重なり文字画像を構成する文字を認識するので、スタンプと文字とが重なったスタンプ重なり文字が外部から入力されるたびに、スタンプ重なり文字の特徴を動的に生成することができ、スタンプおよび文字からなるスタンプ重なり文字の特徴を記憶するための辞書容量を確保することなく、スタンプ重なり文字を構成する文字を精度よく認識することが可能である。
以下に添付図面を参照して、本発明に係る文字認識プログラム、文字認識方法および文字認識装置の実施例を詳細に説明する。なお、以下では、本発明に係る文字認識プログラムを実行する文字認識装置において、電子化された帳票上の文字を認識する場合を例に挙げ、実施例1として説明した後、本発明に含まれる他の実施例を説明する。
以下の実施例1では、実施例1に係る文字認識装置の概要および特徴、文字認識装置の構成および処理を説明し、最後に実施例1による効果を説明する。
[文字認識装置の概要および特徴(実施例1)]
まず最初に、図1等を用いて、実施例1に係る概要および特徴を説明する。図1は、実施例1に係る文字認識装置の概要および特徴を説明するための図である。
実施例1に係る文字認識装置は、罫線と文字とが重なって構成される罫線接触文字画像(特許請求の範囲に記載の「罫線重なり文字画像」に対応する)から文字を認識することを概要とするが、外部から文字列が入力されるたびに、罫線重なり文字の特徴を動的に生成することができ、罫線と文字との重なり位置を考慮した場合に多岐にわたる罫線重なり文字の特徴を記憶するための辞書容量を確保することなく、罫線重なり文字を構成する文字を精度よく認識することが可能である点に主たる特徴がある。
この主たる特徴について具体的に説明すると、実施例1に係る文字認識装置は、例えば、文字列が記入された帳票データが外部から入力されると(図1の(1)参照)、帳票上の罫線と文字(例えば、活字数字やアルファベット、仮名文字や漢字など)とが接触している(もしくは、重なっている)罫線接触文字列画像から罫線を検出し、検出した罫線を仮除去して文字領域を推定する(図1の(2)参照)。
具体的には、まず、実施例1に係る文字認識装置は、図2および図3に例示するように、外部から入力された帳票データについて黒画素ヒストグラム投影を行い、黒画素の度数のピークに基づいて罫線の位置(LS)および罫線の幅(HL)を検出するとともに、黒画素の度数の境界から文字列高さ(HS)を検出する。次に、検出した罫線の位置および幅に基づいて、罫線接触文字列画像から罫線を仮除去した後、文字列が個別に分断された(すなわち、罫線を除去することで一続きになっていた文字と罫線から文字個別に分かれた)文字列画像に対して、検出した文字列高さを各々あてはめて文字領域を推定する。
なお、図4に例示するように、入力された罫線接触文字列画像に傾きがある場合(図4の(1)参照)には、部分文字列単位に区切ってから黒画素ヒストグラムを行って罫線を検出し(図4の(2)参照)、罫線を仮除去するようにしてもよい(図4の(3)参照)。文字列に傾きがある場合には、黒画素ヒストグラムのピークが明瞭に出ない点を考慮する趣旨である。
文字領域の推定を終えると、実施例1に係る文字認識装置は、図5に例示するように、推定した文字領域に基づいて(図5の(1)参照)、外部から入力された罫線接触文字列画像(原画像)から罫線接触文字画像を抽出する(図5の(2)および図1の(3)参照)。
罫線接触文字画像を抽出した後、実施例1に係る文字認識装置は、予め保持する参照用文字画像に擬似罫線を付加して参照用罫線付き文字画像を生成する(図1の(4)参照)。具体的には、実施例1に係る文字認識装置は、検出した罫線位置および罫線幅に基づいて、予め保持する参照用画像に擬似罫線を付加して参照用罫線付き文字画像を生成する。ここで、実施例1に係る文字認識装置は、図6に例示するように、既存フォントの画像を大量に用いて生成した平均文字画像を参照用文字画像として予め保持するようにしてもよい。
参照用罫線付き文字画像を生成した後、実施例1に係る文字認識装置は、罫線接触文字列画像(原画像)から抽出した罫線接触文字画像、および生成した参照用罫線付き文字画像から画素特徴を各々抽出して、抽出した画素特徴同士を照合する(図1の(5)参照)。具体的には、罫線接触文字画像を構成する各画素濃度の配列と、参照用罫線付き文字画像を構成する各画素濃度の配列と照合して、例えば、所定の照合度が得られる場合には、生成した参照用罫線付き文字画像(例えば、活字数字の「5」および罫線の組み合わせからなる参照用罫線付き文字画像)とを構成する文字(例えば、活字数字の「5」)であると認識する。
このようなことから、実施例1に係る文字認識装置は、上述した主たる特徴の如く、外部から文字列が入力されるたびに、罫線重なり文字の特徴を動的に生成することができ、罫線と文字との重なり位置を考慮した場合に多岐にわたる罫線重なり文字の特徴を記憶するための辞書容量を確保することなく、罫線重なり文字を構成する文字を精度よく認識することが可能である。
[文字認識装置の構成(実施例1)]
次に、図7を用いて、実施例1に係る文字認識装置の構成を説明する。図7は、実施例1に係る文字認識装置の構成を示すブロック図である。なお、同図では、実施例1に係る文字認識装置を実現する上で必要な処理部等の構成のみを図示し、その他の構成については記載を省略する。
同図に示すように、実施例1に係る文字認識装置10は、入力部11と、データ読取部12と、出力部13と、記憶部14と、制御部15とから構成される。
このうち、入力部11は、各種の情報の入力を受け付ける入力受付部であり、キーボードやマウス、マイクなどを備えて構成され、例えば、文字認識装置の管理者などから電子化された帳票データの指定などを受け付けて入力する。なお、後述するモニタも、マウスと協働してポインティングディバイス機能を実現する。
データ読取部12は、各種データの読取を読取る読取部であり、例えば、帳票上に文字列(例えば、活字数字やアルファベット、仮名文字や漢字など)が記入された帳票データを読み取って、制御部15へ出力する。
出力部13は、各種の情報を出力する出力部であり、モニタ(若しくはディスプレイ、タッチパネル)やスピーカを備えて構成され、例えば、後述する文字認識部15dによる文字認識結果を表示出力する。
記憶部14は、制御部15による各種処理に必要なデータおよびプログラムを記憶する記憶部であり、特に本発明に密接に関連するものとしては、参照用画像記憶部14aを備える。
参照用画像記憶部14aは、後述する文字認識部15dにおいて文字認識処理において利用される参照用画像を記憶し、例えば、図6に例示するように、既存フォントの画像を大量に用いて生成した平均文字画像を参照用文字画像として各々記憶する。
制御部15は、OS(Operating System)などの制御プログラム、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する処理部であり、特に本発明に密接に関連するものとしては、罫線検出部15aと、文字領域抽出部15bと、照合用画像生成部15cと、文字認識部15dとを備える。
このうち、罫線検出部15aは、外部から入力された帳票データから罫線を検出する処理部である。具体的には、罫線検出部15aは、データ読取部12によって読取られた帳票データを受け付けると、帳票データについて黒画素ヒストグラム投影を行い、黒画素の度数のピークに基づいて罫線の位置(LS)および罫線の幅(HL)を検出するとともに、黒画素の度数の境界から文字列高さ(HS)を検出する(図2および図3参照)。そして、罫線検出B15aは、各検出結果を文字領域抽出部15bおよび照合用画像生成部15cへ出力する。
文字領域抽出部15bは、罫線接触文字列画像から文字領域を推定して、罫線接触文字画像を抽出する処理部である。具体的には、文字領域抽出部15bは、帳票データが帳票上の罫線と文字(例えば、活字数字やアルファベット、仮名文字や漢字など)とが接触している(もしくは、重なっている)罫線接触文字列画像を構成している場合に、罫線検出部15aから受け付けた罫線の位置および幅に基づいて、罫線接触文字列画像から罫線を仮除去した後、文字列が個別に分断された罫線接触文字列画像に対して、罫線検出部15aから受け付けた文字列高さを各々あてはめて文字領域を推定する。文字領域の推定を終えると、文字領域抽出部15bは、推定した文字領域に基づいて、外部から入力された罫線接触文字列画像(原画像)から罫線接触文字画像を抽出する。そして、文字領域抽出部15bは、抽出した罫線接触文字画像を文字認識部15dへ出力する。
なお、図4に例示するように、入力された罫線接触文字列画像に傾きがある場合(図4の(1)参照)には、罫線検出部15aは、罫線接触文字列画像を部分文字列単位に区切ってから黒画素ヒストグラムを行って罫線を検出し(図4の(2)参照)、文字領域抽出部15bは、その検出結果に応じて罫線を仮除去した後(図4の(3)参照)、文字領域を推定して抽出するようにしてもよい。文字列に傾きがある場合には、黒画素ヒストグラムのピークが明瞭に出ない点を考慮する趣旨である。
照合用画像生成部15cは、文字画像の認識に用いられる参照用罫線付き文字画像を生成する処理部である。具体的には、照合用画像生成部15cは、罫線検出部15aから受け付けた罫線位置および罫線幅に基づいて、予め保持する参照用画像に擬似罫線を付加して参照用罫線付き文字画像を生成する。そして、照合用画像生成部15cは、生成した参照用罫線付き文字画像を文字認識部15dへ出力する。
文字認識部15dは、文字領域抽出部15bから受け付けた罫線接触文字画像、および照合用画像生成部15cから受け付けた参照用罫線付き文字画像から画素特徴を各々抽出して照合することで、罫線接触文字画像を構成する文字を認識する処理部である。具体的には、文字認識部15dは、罫線接触文字画像を構成する各画素濃度の配列と、参照用罫線付き文字画像を構成する各画素濃度の配列と照合して、例えば、所定の照合度が得られる場合には、生成した参照用罫線付き文字画像(例えば、活字数字の「5」および罫線の組み合わせからなる参照用罫線付き文字画像)とを構成する文字(例えば、活字数字の「5」)であると認識する。そして、文字認識部15dは、文字認識結果を出力部13から表示出力する。
[文字認識装置による処理(実施例1)]
次に、図8を用いて、実施例1に係る文字認識装置による処理を説明する。図8は、実施例1に係る文字認識装置の処理の流れを示すフローチャートである。
同図に示すように、帳票上に文字列(例えば、活字数字やアルファベット、仮名文字や漢字など)が記入された帳票データが入力されると(ステップS801肯定)、罫線検出部15aは、データ読取部12によって読取られた帳票データを受け付けると、帳票データについて黒画素ヒストグラム投影を行い、黒画素の度数のピークに基づいて罫線の位置(LS)および罫線の幅(HL)を検出するとともに、黒画素の度数の境界から文字列高さ(HS)を検出する(ステップS802、図2および図3参照)。そして、罫線検出部15aは、各検出結果を文字領域抽出部15bおよび照合用画像生成部15cへ出力する。
文字領域抽出部15bは、罫線接触文字列画像から文字領域を推定する(ステップS803)。具体的には、文字領域抽出部15bは、帳票データが帳票上の罫線と文字(例えば、活字数字やアルファベット、仮名文字や漢字など)とが接触している(もしくは、重なっている)罫線接触文字列画像を構成している場合に、罫線検出部15aから受け付けた罫線の位置および幅に基づいて、罫線接触文字列画像から罫線を仮除去した後、文字列が個別に分断された罫線接触文字列画像に対して、罫線検出部15aから受け付けた文字列高さを各々あてはめて文字領域を推定する。
続いて、文字領域抽出部15bは、罫線接触文字列画像から罫線接触文字画像を抽出する(ステップS804)。具体的には、文字領域抽出部15bは、推定した文字領域に基づいて、外部から入力された罫線接触文字列画像(原画像)から罫線接触文字画像を抽出する。そして、文字領域抽出部15bは、抽出した罫線接触文字画像を文字認識部15dへ出力する。
照合用画像生成部15cは、文字画像の認識に用いられる参照用罫線付き文字画像を生成する(ステップS805)。具体的には、照合用画像生成部15cは、罫線検出部15aから受け付けた罫線位置および罫線幅に基づいて、予め保持する参照用画像に擬似罫線を付加して参照用罫線付き文字画像を生成する。そして、照合用画像生成部15cは、生成した参照用罫線付き文字画像を文字認識部15dへ出力する。
文字認識部15dは、文字領域抽出部15bから受け付けた罫線接触文字画像、および照合用画像生成部15cから受け付けた参照用罫線付き文字画像から画素特徴を各々抽出する(ステップS806)。次に、文字認識部15dは、罫線接触文字画像を構成する各画素濃度の配列と、参照用罫線付き文字画像を構成する各画素濃度の配列と照合する(ステップS807)。
そして、文字認識部15dは、例えば、所定の照合度が得られる場合には、罫線接触文字画像が生成した参照用罫線付き文字画像(例えば、活字数字の「5」および罫線の組み合わせからなる参照用罫線付き文字画像)を構成する文字(例えば、活字数字の「5」)であると認識する。
このようなことから、実施例1によれば、外部から入力された文字列が罫線重なり文字画像を構成する場合に、罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、推定された罫線位置および罫線幅に基づいて罫線重なり文字画像から罫線を除去するとともに、文字列高さに基づいて罫線を除去した罫線重なり文字画像から文字領域を特定した後、罫線を除去する前の罫線重なり文字画像から、特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、推定された罫線位置および罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、罫線重なり文字画像と照合するための参照用画像を生成し、切り出された対象領域の特徴と生成された参照用画像の特徴とを照合(例えば、対象領域および参照用画像から抽出した画素特徴や方向特徴を照合)して、罫線重なり文字画像を構成する文字を認識するので、外部から文字列が入力されるたびに、罫線重なり文字の特徴を動的に生成することができ、罫線と文字との重なり位置を考慮した場合に多岐にわたる罫線重なり文字の特徴を記憶するための辞書容量を確保することなく、罫線重なり文字を構成する文字を精度よく認識することが可能である。
また、実施例1によれば、罫線除去前の罫線重なり画像から切り出された対象領域の各画素濃度の配列である画素特徴と、生成された参照用画像の各画素濃度の配列である画素特徴とを照合して罫線重なり文字画像を構成する文字を認識するので、罫線重なり文字画像を構成する文字を画素濃度の配列から簡易に認識することが可能である。
さて、これまで本発明の実施例1について説明したが、本発明は上述した実施例1以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下では、本発明に含まれる他の実施例を説明する。
(1)方向特徴を照合して文字認識
上記の実施例1では、罫線接触文字画像および参照用罫線付き文字画像から各々抽出した画素特徴同士を照合することにより、罫線接触文字画像を構成する文字を認識する場合を説明したが、本発明はこれに限定されるものではなく、罫線接触文字画像および参照用罫線付き文字画像から各々抽出した方向特徴同士を照合することにより、罫線接触文字画像を構成する文字を認識するようにしてもよい。
具体的には、図9に例示するように、参照用文字画像を構成する各画素(画素濃度)の配列方向である方向特徴を生成して、記憶部14に予め記憶しておき、照合用画像生成部15cは、記憶部14に予め記憶してある方向特徴と罫線の方向特徴とを組み合わせて、参照用罫線付き文字画像の方向特徴を生成し、文字認識部15dは、生成された方向特徴と、罫線接触画像から抽出した方向特徴とを照合することで、罫線接触文字画像を構成する文字を認識する。
このように、予め保持する文字画像の各画素濃度の垂直方向および水平方向への配列から定まる配列方向と、罫線を構成する各画素濃度の水平方向への配列から定まる配列方向とを組み合わせて、参照用画像の画素濃度が配列している方向の特徴である方向特徴を生成し、罫線除去前の罫線重なり画像から切り出された対象領域の方向特徴と、生成された参照用画像の方向特徴とを照合して罫線重なり文字画像を構成する文字を認識するので、画素の配列によっては同一の文字であっても認識結果が左右されやすい画素特徴で文字認識を行うよりも、より精度よく罫線重なり文字画像を構成する文字を認識することが可能である。
(2)互いに接触している(重なっている)文字領域の抽出および認識
また、上記の実施例1では、罫線接触文字列画像から罫線を仮除去した後、推定した文字領域に応じて、認識の対象となる対象領域を罫線接触文字列画像か抽出する場合を説明したが、本発明はこれに限定されるものではなく、罫線を仮除去した後、互いに接触している(重なっている)文字画像を一塊の文字領域として抽出するようにしてもよい。
例えば、図10に例示するように、罫線を除去しても、文字画像が互いに接触していて文字領域の推定が難しく、対象領域の抽出(切出し)が困難である場合には、いくつかの分割パターンごとに罫線除去後の罫線重なり文字画像を所定の領域に分割した上で、分割した所定の領域のそれぞれについて仮認識を行って、各認識信頼度が所定の信頼度に到達している場合には、信頼度が最も高い分割パターンを選択して、選択したパターンに応じて認識の対象となる対象領域を抽出する。一方、仮認識の結果、各認識信頼度が所定の信頼度に到達していない場合には、罫線除去後の罫線重なり文字画像を一塊の文字領域として特定し、罫線除去前の罫線重なり文字画像から、一塊として特定された文字領域に応じて対象領域を抽出する。
また、一塊として特定された文字領域に応じて対象領域を抽出した場合には、予め保持する文字画像をいくつか組合せて生成した組合せ文字画像ごとに罫線画像を付加して、参照用画像をそれぞれ生成して認識を行う。
このように、罫線除去後の罫線重なり文字画像から、一文字からなる文字領域を特定できない場合に、いくつかの分割パターンごとに、罫線除去後の罫線重なり文字画像を所定の領域に分割した上で、所定の領域のそれぞれについて仮認識を行って、所定の領域の各認識信頼度が所定の信頼度に到達している場合には、信頼度が最も高い分割パターンを選択し、選択された分割パターンに応じて、罫線除去前の罫線重なり文字画像内から文字認識の対象となる対象領域を切り出す一方で、所定の領域の認識信頼度がいずれも所定の信頼度に到達していない場合には、罫線除去後の罫線重なり文字画像を一塊の文字領域として特定し、罫線除去前の罫線重なり文字画像から、当該一塊として特定された領域に応じて対象領域として切り出し、一塊として特定した文字領域に応じた対象領域が切り出された場合に、予め保持する文字画像をいくつか組合せて生成した組合せ文字画像ごとに罫線画像を付加して参照用画像をそれぞれ生成するので、罫線重なり文字画像から罫線を除去しても、入力文字列の各文字が互いに重なって文字領域を特定できない場合であっても、文字である蓋然性の高い領域を特定して、罫線重なり文字画像から対象領域を切り出すことができ、一方、文字である蓋然性の高い領域を特定できない場合には、罫線を除去した罫線重なり文字画像から切り出した一塊の対象領域について、文字認識を行うための参照用画像を生成することができ、罫線重なり文字を構成する文字を精度よく認識することが可能である。
(3)罫線が点線である場合に実線に変換
また、上記の実施例1において、罫線が点線である場合には、例えば、図11に例示するように、点線を実線に変換して罫線接触文字列画像の罫線位置と文字列高さと罫線幅とをそれぞれ推定するようにしてもよい。
このように、罫線重なり文字画像を構成する罫線が点線である場合に点線を実線に変換して、点線が実線に変換された罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定するので、検出の困難な点線の検出を行う必要がなく、また、点線を実線に変換することで参照用画像を生成するために点線の空白位置を特定する必要もなく、結果として、罫線重なり文字画像を効率的に認識することが可能である。
(4)認識結果により確定した文字フォントに応じて参照用画像生成
また、上記の実施例1において、罫線接触文字画像の認識結果から、入力された文字列のフォントを推定して、予めフォントごとに保持する文字画像の中から、推定されたフォントに応じて選択した文字画像に罫線画像を付加して、罫線重なり文字画像と照合するための参照用画像を生成するようにしてもよい。
このように、罫線接触文字画像の認識結果から入力された文字列のフォントを推定して、予めフォントごとに保持する文字画像の中から、推定されたフォントに応じて選択した文字画像に罫線画像を付加して、罫線重なり文字画像と照合するための参照用画像を生成するので、例えば、罫線重なり文字画像の認識処理の過程で推定した文字のフォントを用いて、残りの文字画像認識を行うことができ、特殊なフォントに左右されることなく、罫線重なり文字画像を構成する文字を精度よく認識することが可能である。
(5)スタンプ重なり文字画像の認識
また、上記の実施例1では、罫線と文字とが重なって構成される罫線重なり文字画像について文字認識を行う場合を説明したが、本発明はこれに限定されるものではなく、例えば、図12に例示するように、スタンプと文字とが重なって構成されるスタンプ重なり文字画像について文字認識を行うようにしてもよい。
具体的には、スタンプ重なり文字画像についてスタンプの位置を推定し、推定されたスタンプの位置に基づいて、スタンプ重なり文字画像からスタンプを除去するとともに、スタンプを除去したスタンプ重なり文字画像から文字領域を特定した後、スタンプを除去する前のスタンプ重なり文字画像から、特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、推定されたスタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、スタンプ重なり文字画像と照合するための参照用画像を生成し(例えば、図13参照)、スタンプを除去する前のスタンプ重なり文字画像から切り出された対象領域の画像特徴と生成された参照用画像の画像特徴とを照合して、スタンプ重なり文字画像を構成する文字を認識する。
このように、スタンプ重なり文字画像についてスタンプの位置を推定し、推定されたスタンプの位置に基づいて、スタンプ重なり文字画像からスタンプを除去するとともに、スタンプを除去したスタンプ重なり文字画像から文字領域を特定した後、スタンプを除去する前のスタンプ重なり文字画像から、特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、推定されたスタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、スタンプ重なり文字画像と照合するための参照用画像を生成し(例えば、図13参照)、スタンプを除去する前のスタンプ重なり文字画像から切り出された対象領域の画像特徴(例えば、スタンプ輪郭の形状とその内部を構成する文字の画素特徴や方向特徴)と生成された参照用画像の画像特徴(例えば、画素特徴や方向特徴)とを照合して、スタンプ重なり文字画像を構成する文字を認識するので、スタンプと文字とが重なったスタンプ重なり文字が外部から入力されるたびに、スタンプ重なり文字の特徴を動的に生成することができ、スタンプおよび文字からなるスタンプ重なり文字の特徴を記憶するための辞書容量を確保することなく、スタンプ重なり文字を構成する文字を精度よく認識することが可能である。
また、スタンプ重なり文字画像を認識する場合に、予め保持する文字画像ごとに、スタンプの傾きや濃度、色の異なるスタンプ画像を付加して、スタンプ重なり文字画像と照合するための参照用画像を複数生成し、スタンプを除去する前のスタンプ重なり文字画像から切り出された対象領域の画像特徴と、予め保持する文字画像ごとに複数生成した参照用画像の画像特徴とをそれぞれ照合して、スタンプ重なり文字を構成する文字を認識するようにしてもよい。
このように、スタンプ重なり文字画像を認識する場合に、予め保持する文字画像ごとに、スタンプの傾きや濃度、色の異なるスタンプ画像を付加して、スタンプ重なり文字画像と照合するための参照用画像を複数生成し、スタンプを除去する前のスタンプ重なり文字画像から切り出された対象領域の画像特徴と、予め保持する文字画像ごとに複数生成した参照用画像の画像特徴とをそれぞれ照合して、スタンプ重なり文字を構成する文字を認識するので、考え得るパターン重なり文字の複数の特徴について考慮することができ、パターン重なり文字を構成する文字を精度よく認識することが可能である。
(6)装置構成等
また、図7に示した文字認識装置10の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、文字認識装置10の分散・統合の具体的形態は図示のものに限られず、罫線検出部15aと文字領域抽出部15bとを統合するなど、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、文字認識装置10にて行なわれる各処理機能(罫線検出機能、文字領域抽出機能、照合用画像生成機能および文字認識機能、図8参照)は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
(7)文字認識プログラム
ところで、上記の実施例1で説明した文字認識装置10にかかる各種の処理(図8参照)は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することができる。そこで、以下では、図14を用いて、上記の実施例1と同様の機能を有する文字認識プログラムを実行するコンピュータの一例を説明する。図14は、文字認識プログラムを実行するコンピュータを示す図である。
まず、図14に示すように、文字認識装置としてのコンピュータ20は、入力部21、データ読取部22、出力部23、HDD24、RAM25、ROM26およびCPU27をバス30で接続して構成される。ここで、入力部21、データ読取部22および出力部23は、図7に示した入力部11、データ読取部12および出力部13にそれぞれ対応する。
そして、ROM26には、上記の実施例1に示した文字認識装置10と同様の機能を発揮する文字認識プログラム、つまり、図14に示すように、罫線検出プログラム26a、文字領域抽出プログラム26b、照合用画像生成プログラム26cおよび文字認識プログラム27dがあらかじめ記憶されている。なお、これらのプログラム26a、26b、26cおよび26dについては、図7に示した文字認識装置10の各構成要素と同様、適宜統合または分散してもよい。なお、ROM26は、不揮発性の「RAM」でもよい。
そして、CPU27が、これらのプログラム26a、26b、26cおよび26dをROM26から読み出して実行することで、図14に示すように、各プログラム26a、26b、26cおよび26dは、罫線検出プロセス27a、文字領域抽出プロセス27b、照合用画像生成プロセス27cおよび文字認識プロセス27dとして機能するようになる。なお、各プロセス27a、27b、27cおよび27dは、図7に示した罫線検出部15a、文字領域抽出部15b、照合用画像生成部15cおよび文字認識部15dにそれぞれ対応する。
また、HDD24には、図14に示すように、参照用画像テーブル24aが設けられる。この参照用画像テーブル24aは、図7に示した参照用画像記憶部14aに対応する。そして、CPU27は、参照用画像テーブル24aから参照用画像データ25aを読み出してRAM25に格納し、RAM25に格納された参照用画像データ25aに基づいて文字認識処理を実行する。
なお、上記した各プログラム26a、26b、26cおよび26dについては、必ずしも最初からROM26に記憶させておく必要はなく、例えば、コンピュータ20に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」、または、コンピュータ20の内外に備えられるHDDなどの「固定用の物理媒体」、さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータ20に接続される「他のコンピュータ(またはサーバ)」などに各プログラムを記憶させておき、コンピュータ20がこれらから各プログラムを読み出して実行するようにしてもよい。
(付記1)パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する方法をコンピュータに実行させる文字認識プログラムであって、
外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手順と、
前記推定手順により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像から文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手順と、
前記推定手順により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手順と、
前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手順と、
をコンピュータに実行させることを特徴とする文字認識プログラム。
(付記2)前記推定手順は、外部から入力された文字列が前記パターンである罫線と文字とが重なって罫線重なり文字画像を構成する場合に、当該罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、
前記切出手順は、前記推定手順により推定された前記罫線位置および前記罫線幅に基づいて、前記罫線重なり文字画像から罫線を除去するとともに、当該推定手順により推定された前記文字列高さに基づいて、当該罫線を除去した前記罫線重なり文字画像から文字領域を特定した後、当該罫線を除去する前の罫線重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成手順は、前記推定手順により推定された前記罫線位置および前記罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする付記1に記載の文字認識プログラム。
(付記3)前記切出手順により罫線除去後の罫線重なり文字画像から、一文字からなる文字領域を特定できない場合に、いくつかの分割パターンごとに当該罫線除去後の罫線重なり文字画像を所定の領域に分割した上で、当該所定の領域のそれぞれについて仮認識を行って、当該所定の領域の各認識信頼度が所定の信頼度に到達している場合には、当該信頼度が最も高い分割パターンを選択する分割パターン選択手順をさらにコンピュータに実行させ、
前記切出手順は、前記分割パターン選択手順により選択された前記分割パターンに応じて、罫線除去前の罫線重なり文字画像内から前記対象領域を切り出す一方で、前記分割パターン選択手順において前記所定の領域の認識信頼度がいずれも所定の信頼度に到達していない場合には、罫線除去後の罫線重なり文字画像を一塊の文字領域として特定し、罫線除去前の罫線重なり文字画像から、当該一塊として特定された文字領域に応じて前記対象領域として切り出し、
前記生成手順は、前記切出手順により前記一塊として特定した文字領域に応じた前記対象領域が切り出された場合に、予め保持する文字画像をいくつか組合せて生成した組合せ文字画像ごとに罫線画像を付加して、前記参照用画像をそれぞれ生成することを特徴とする付記2に記載の文字認識プログラム。
(付記4)前記罫線重なり文字画像を構成する罫線が点線である場合に、当該点線を実線に変換する変換手順をさらにコンピュータに実行させ、
前記推定手順は、前記変換手段により点線が実線に変換された前記罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定することを特徴とする付記2に記載の文字認識プログラム。
(付記5)前記認識手順は、前記切出手順により切り出された前記対象領域の各画素濃度の配列である画素特徴と、前記参照用画像の各画素濃度の配列である画素特徴とを照合して、前記罫線重なり文字画像を構成する文字を認識することを特徴とする付記2に記載の文字認識プログラム。
(付記6)前記生成手順は、予め保持する文字画像の各画素濃度の垂直方向および水平方向への配列から定まる配列方向と、罫線を構成する各画素濃度の水平方向への配列から定まる配列方向とを組み合わせて、前記参照用画像の画素濃度が配列している方向の特徴である方向特徴を生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の方向特徴と前記生成手順により生成された前記参照用画像の方向特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする付記1に記載の文字認識プログラム。
(付記7)前記認識手順による認識結果から前記入力された文字列のフォントを推定する推定手順をさらにコンピュータに実行させ、
前記生成手順は、予めフォントごとに保持する文字画像の中から、前記推定手段により推定された前記フォントに応じて選択した文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成することを特徴とする文字認識プログラム。
(付記8)前記推定手順は、外部から入力された文字列が前記パターンであるスタンプと文字とが重なってスタンプ重なり文字画像を構成する場合に、当該スタンプ重なり文字画像について、当該スタンプの位置を推定し、
前記切出手順は、前記推定手順により推定された前記スタンプの位置に基づいて、前記スタンプ重なり文字画像からスタンプを除去するとともに、当該スタンプを除去した前記スタンプ重なり文字画像から文字領域を特定した後、当該スタンプを除去する前のスタンプ重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成手順は、前記推定手順により推定された前記スタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記スタンプ重なり文字画像を構成する文字を認識することを特徴とする付記1に記載の文字認識プログラム。
(付記9)前記生成手順は、前記推定手順により推定された前記スタンプの位置を用いて、予め保持する文字画像ごとに、スタンプの傾きや濃度、色の異なるスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を複数生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と、前記生成手順により予め保持する文字画像ごとに複数生成した参照用画像の画像特徴とをそれぞれ照合して、前記スタンプ重なり文字を構成する文字を認識することを特徴とする付記8に記載の文字認識プログラム。
(付記10)パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識方法であって、
外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定工程と、
前記推定工程により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像から文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出工程と、
前記推定工程により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成工程と、
前記切出工程により切り出された前記対象領域の画像特徴と前記生成工程により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識工程と、
を含んだことを特徴とする文字認識方法。
(付記11)前記推定工程は、外部から入力された文字列が前記パターンである罫線と文字とが重なって罫線重なり文字画像を構成する場合に、当該罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、
前記切出工程は、前記推定工程により推定された前記罫線位置および前記罫線幅に基づいて、前記罫線重なり文字画像から罫線を除去するとともに、当該推定工程により推定された前記文字列高さに基づいて、当該罫線を除去した前記罫線重なり文字画像から文字領域を特定した後、当該罫線を除去する前の罫線重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成工程は、前記推定工程により推定された前記罫線位置および前記罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成し、
前記認識工程は、前記切出工程により切り出された前記対象領域の画像特徴と前記生成工程により生成された前記参照用画像の画像特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする付記10に記載の文字認識方法。
(付記12)前記推定工程は、外部から入力された文字列が前記パターンであるスタンプと文字とが重なってスタンプ重なり文字画像を構成する場合に、当該スタンプ重なり文字画像について、当該スタンプの位置を推定し、
前記切出工程は、前記推定工程により推定された前記スタンプの位置に基づいて、前記スタンプ重なり文字画像からスタンプを除去するとともに、当該スタンプを除去した前記スタンプ重なり文字画像から文字領域を特定した後、当該スタンプを除去する前のスタンプ重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成工程は、前記推定工程により推定された前記スタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を生成し、
前記認識工程は、前記切出工程により切り出された前記対象領域の画像特徴と前記生成工程により生成された前記参照用画像の画像特徴とを照合して前記スタンプ重なり文字画像を構成する文字を認識することを特徴とする付記10に記載の文字認識方法。
(付記13)パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識装置であって、
外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手段と、
前記推定手段により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像から文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手段と、
前記推定手段により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手段と、
前記切出手段により切り出された前記対象領域の画像特徴と前記生成手段により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手段と、
を備えたことを特徴とする文字認識装置。
(付記14)前記推定手段は、外部から入力された文字列が前記パターンである罫線と文字とが重なって罫線重なり文字画像を構成する場合に、当該罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、
前記切出手段は、前記推定手段により推定された前記罫線位置および前記罫線幅に基づいて、前記罫線重なり文字画像から罫線を除去するとともに、当該推定手段により推定された前記文字列高さに基づいて、当該罫線を除去した前記罫線重なり文字画像から文字領域を特定した後、当該罫線を除去する前の罫線重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成手段は、前記推定手順により推定された前記罫線位置および前記罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成し、
前記認識手段は、前記切出手段により切り出された前記対象領域の画像特徴と前記生成手段により生成された前記参照用画像の画像特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする付記13に記載の文字認識装置。
(付記15)前記推定手順は、外部から入力された文字列が前記パターンであるスタンプと文字とが重なってスタンプ重なり文字画像を構成する場合に、当該スタンプ重なり文字画像について、当該スタンプの位置を推定し、
前記切出手順は、前記推定手順により推定された前記スタンプの位置に基づいて、前記スタンプ重なり文字画像からスタンプを除去するとともに、当該スタンプを除去した前記スタンプ重なり文字画像から文字領域を特定した後、当該スタンプを除去する前のスタンプ重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
前記生成手順は、前記推定手順により推定された前記スタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を生成し、
前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記スタンプ重なり文字画像を構成する文字を認識することを特徴とする付記13に記載の文字認識装置。
以上のように、本発明に係る文字認識プログラム、文字認識方法および文字認識装置は、パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する方法をコンピュータに実行させる場合等に有用であり、特に、大きな辞書容量を確保することなく、精度よく文字画像を認識することに適する。
実施例1に係る文字認識装置の概要および特徴を説明するための図である。 実施例1に係る黒画素ヒストグラムを示す図である。 実施例1に係る罫線位置、文字列高さおよび罫線幅を示す模式図である。 実施例1に係る罫線検出および除去例を示す図である。 実施例1に係る罫線接触文字画像の抽出例を示す図である。 実施例1に係る参照用文字画像として採用される平均文字画像例を示す図である。 実施例1に係る文字認識装置の構成を示すブロック図である。 実施例1に係る文字認識装置の処理の流れ示すフローチャートである。 実施例2に係る方向特徴の概念を示す図である。 実施例2に係る文字列の構成例を示す図である。 実施例2に係る参照用罫線付き文字画像の構成例を示す図である。 実施例2に係るスタンプと重畳した文字例を示す図である。 実施例2に係るスタンプと重畳させた文字の生成例を示す図である。 文字認識プログラムを実行するコンピュータを示す図である。 従来技術を説明するための図である。
符号の説明
10 文字認識装置
11 入力部
12 データ読取部
13 出力部
14 記憶部
14a 参照用画像記憶部
15 制御部
15a 罫線検出部
15b 文字領域抽出部
15c 照合用画像生成部
15d 文字認識部
20 コンピュータ
21 入力部
22 データ読取部
23 出力部
24 HDD(Hard Disk Drive)
25 RAM(Random Access Memory)
26 ROM(Read Only Memory)
27 CPU(Central Processing Unit)
30 バス

Claims (5)

  1. パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する方法をコンピュータに実行させる文字認識プログラムであって、
    外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手順と、
    前記推定手順により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手順と、
    前記推定手順により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手順と、
    前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手順と、
    をコンピュータに実行させることを特徴とする文字認識プログラム。
  2. 前記推定手順は、外部から入力された文字列が前記パターンである罫線と文字とが重なって罫線重なり文字画像を構成する場合に、当該罫線重なり文字画像について、罫線位置と文字列高さと罫線幅とをそれぞれ推定し、
    前記切出手順は、前記推定手順により推定された前記罫線位置および前記罫線幅に基づいて、前記罫線重なり文字画像から罫線を除去するとともに、当該推定手順により推定された前記文字列高さに基づいて、当該罫線を除去した前記罫線重なり文字画像から文字領域を特定した後、当該罫線を除去する前の罫線重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
    前記生成手順は、前記推定手順により推定された前記罫線位置および前記罫線幅を用いて、予め保持する文字画像に罫線画像を付加して、前記罫線重なり文字画像と照合するための参照用画像を生成し、
    前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記罫線重なり文字画像を構成する文字を認識することを特徴とする請求項1に記載の文字認識プログラム。
  3. パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識方法であって、
    外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定工程と、
    前記推定工程により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出工程と、
    前記推定工程により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成工程と、
    前記切出工程により切り出された前記対象領域の画像特徴と前記生成工程により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識工程と、
    を含んだことを特徴とする文字認識方法。
  4. パターンと文字とが重なって構成されるパターン重なり文字から当該文字を認識する文字認識装置であって、
    外部から入力された文字列が前記パターン重なり文字を構成している場合に、当該パターン重なり文字画像について、前記パターンの位置を推定する推定手段と、
    前記推定手段により推定された前記位置に基づいて、前記パターン重なり文字画像から前記パターンを除去するとともに、当該パターンを除去した前記パターン重なり文字画像を予め決められた複数の分割パターンで分割し、分割した文字画像に対して仮認識を行い各分割パターンの認識信頼度を求め、認識信頼度の最も高い分割パターンを用いて文字領域を特定した後、当該パターンを除去する前のパターン重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出す切出手段と、
    前記推定手段により推定された前記位置を用いて、予め保持する文字画像に前記パターンの画像を付加して、前記パターン重なり文字画像と照合するための参照用画像を生成する生成手段と、
    前記切出手段により切り出された前記対象領域の画像特徴と前記生成手段により生成された前記参照用画像の画像特徴とを照合して前記パターン重なり文字画像を構成する文字を認識する認識手段と、
    を備えたことを特徴とする文字認識装置。
  5. 前記推定手順は、外部から入力された文字列が前記パターンであるスタンプと文字とが重なってスタンプ重なり文字画像を構成する場合に、当該スタンプ重なり文字画像について、当該スタンプの位置を推定し、
    前記切出手順は、前記推定手順により推定された前記スタンプの位置に基づいて、前記スタンプ重なり文字画像からスタンプを除去するとともに、当該スタンプを除去した前記スタンプ重なり文字画像から文字領域を特定した後、当該スタンプを除去する前のスタンプ重なり文字画像から、当該特定した文字領域に応じた領域を認識の対象となる対象領域として切り出し、
    前記生成手順は、前記推定手順により推定された前記スタンプの位置を用いて、予め保持する文字画像にスタンプ画像を付加して、前記スタンプ重なり文字画像と照合するための参照用画像を生成し、
    前記認識手順は、前記切出手順により切り出された前記対象領域の画像特徴と前記生成手順により生成された前記参照用画像の画像特徴とを照合して前記スタンプ重なり文字画像を構成する文字を認識することを特徴とする請求項1に記載の文字認識プログラム。
JP2006249833A 2006-09-14 2006-09-14 文字認識プログラム、文字認識方法および文字認識装置 Expired - Fee Related JP5034398B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006249833A JP5034398B2 (ja) 2006-09-14 2006-09-14 文字認識プログラム、文字認識方法および文字認識装置
US11/654,180 US7796817B2 (en) 2006-09-14 2007-01-16 Character recognition method, character recognition device, and computer product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006249833A JP5034398B2 (ja) 2006-09-14 2006-09-14 文字認識プログラム、文字認識方法および文字認識装置

Publications (2)

Publication Number Publication Date
JP2008071173A JP2008071173A (ja) 2008-03-27
JP5034398B2 true JP5034398B2 (ja) 2012-09-26

Family

ID=39188678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006249833A Expired - Fee Related JP5034398B2 (ja) 2006-09-14 2006-09-14 文字認識プログラム、文字認識方法および文字認識装置

Country Status (2)

Country Link
US (1) US7796817B2 (ja)
JP (1) JP5034398B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8467614B2 (en) * 2007-11-28 2013-06-18 Lumex As Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images
US8699796B1 (en) 2008-11-11 2014-04-15 Trend Micro Incorporated Identifying sensitive expressions in images for languages with large alphabets
JP2011166403A (ja) * 2010-02-09 2011-08-25 Seiko Epson Corp 画像処理装置、方法及びコンピュータプログラム
JP5280425B2 (ja) * 2010-11-12 2013-09-04 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP5906788B2 (ja) * 2012-02-17 2016-04-20 オムロン株式会社 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
US9832328B2 (en) * 2015-11-30 2017-11-28 Kabushiki Kaisha Toshiba Character recognition apparatus and character recognition method
US10217020B1 (en) * 2016-12-19 2019-02-26 Matrox Electronic Systems Ltd. Method and system for identifying multiple strings in an image based upon positions of model strings relative to one another
CN107958252A (zh) * 2017-11-23 2018-04-24 深圳码隆科技有限公司 一种商品识别方法和设备
CN109816743A (zh) * 2018-12-19 2019-05-28 华为技术有限公司 生成标识图案的方法和终端设备
JP7406884B2 (ja) * 2019-06-27 2023-12-28 キヤノン株式会社 情報処理装置、プログラム及び制御方法
US20230368445A1 (en) * 2022-05-13 2023-11-16 Adobe Inc. Layout-aware text rendering and effects execution

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4741045A (en) * 1983-09-23 1988-04-26 Dest Corporation Optical character isolation system, apparatus and method
JPS6115284A (ja) * 1984-06-29 1986-01-23 Toshiba Corp 光学的文字読取装置
JPH08221518A (ja) * 1995-02-17 1996-08-30 Nec Eng Ltd 光学文字読取装置
JP3345224B2 (ja) * 1995-03-06 2002-11-18 富士通株式会社 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP2871590B2 (ja) 1996-05-13 1999-03-17 日本電気株式会社 画像抽出方式
JP3455649B2 (ja) * 1997-05-02 2003-10-14 株式会社日立製作所 文字認識装置
JP3794285B2 (ja) * 2001-06-12 2006-07-05 日本電気株式会社 光学式文字読取装置
JP4300083B2 (ja) * 2003-09-18 2009-07-22 株式会社日立製作所 帳票読取り装置
US7551779B2 (en) * 2005-03-17 2009-06-23 Microsoft Corporation Word or character boundary-based scratch-out gesture recognition

Also Published As

Publication number Publication date
US7796817B2 (en) 2010-09-14
US20080069447A1 (en) 2008-03-20
JP2008071173A (ja) 2008-03-27

Similar Documents

Publication Publication Date Title
JP5034398B2 (ja) 文字認識プログラム、文字認識方法および文字認識装置
JP3445394B2 (ja) 少なくとも二つのイメージセクションの比較方法
JP3919617B2 (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
JPH07200732A (ja) ワードオブジェクト抽出方法及びラスタ化イメージ内のノイズ除去方法
JP6003047B2 (ja) 画像処理装置及び画像処理プログラム
JP2010157107A (ja) 業務文書処理装置
JP3913985B2 (ja) 文書画像中の基本成分に基づく文字列抽出装置および方法
Zhu et al. DocBed: A multi-stage OCR solution for documents with complex layouts
CN107220981B (zh) 字符分割方法、装置、设备及存储介质
JP5483467B2 (ja) 帳票読取装置、角印検出方法、および、角印検出プログラム
JP3467437B2 (ja) 文字認識装置及びその方法とプログラム記録媒体
JP5288915B2 (ja) 文字認識装置、文字認識方法、コンピュータプログラム、記憶媒体
JP2009294704A (ja) ナンバー認識装置およびナンバー認識方法
JP6310155B2 (ja) 文字認識装置、文字認識方法及び文字認識プログラム
JP6201838B2 (ja) 情報処理装置及び情報処理プログラム
JP2000137728A (ja) 文書解析装置及びプログラム記録媒体
JP3815934B2 (ja) 手書き文字認識装置および方法
KR102673900B1 (ko) 표 데이터 추출 시스템 및 그 방법
JP6187307B2 (ja) 画像処理装置及び画像処理プログラム
JP2918666B2 (ja) 文字画像切出し方法
CN110163203B (zh) 字符识别方法、装置、存储介质及计算机设备
JP7417116B2 (ja) 情報処理システム、情報処理方法、プログラム
JP4209511B2 (ja) 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11265424A (ja) 文字認識方法、装置および記録媒体
CN113903040A (zh) 购物小票的文字识别方法、设备、系统和计算机可读介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090512

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120618

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees