JP2003223610A - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法

Info

Publication number
JP2003223610A
JP2003223610A JP2002019062A JP2002019062A JP2003223610A JP 2003223610 A JP2003223610 A JP 2003223610A JP 2002019062 A JP2002019062 A JP 2002019062A JP 2002019062 A JP2002019062 A JP 2002019062A JP 2003223610 A JP2003223610 A JP 2003223610A
Authority
JP
Japan
Prior art keywords
label
area
model
target area
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002019062A
Other languages
English (en)
Inventor
Akihiro Uda
明弘 宇田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002019062A priority Critical patent/JP2003223610A/ja
Publication of JP2003223610A publication Critical patent/JP2003223610A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文字認識装置において帳票における個々の読
取対象領域を的確かつ効率的に抽出できるようにする。 【解決手段】 文字認識装置1は、ラベル文字が記入さ
れたラベル領域と文字が記入された読取対象領域とを有
する帳票の文字認識を行うものである。領域定義部11
は、帳票における個々の読取対象領域を定義する。間接
定義部12は、帳票における個々の読取対象領域と当該
領域の周辺にあるラベル領域との相対位置関係と、当該
ラベル領域とを定義する。ラベル領域抽出部21は、上
記帳票の画像からラベル領域を抽出する。読取領域抽出
部24は、上記相対位置関係を利用することにより、個
々のラベル領域の位置から対応する読取対象領域の位置
を特定してこれを抽出する。文字認識部30は、抽出さ
れた読取対象領域の文字を認識する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、読取対象領域を有
する帳票の文字認識を行う文字認識装置及び文字認識方
法に関する。
【0002】
【従来の技術】従来より、所定の表形式(フォーマッ
ト)を有するOCR帳票の画像を取り込み、その帳票に
記入された文字を認識するための文字認識装置が存在す
る。この文字認識装置においては、対応する帳票のモデ
ルが予め作成され、このモデルにおいて帳票の読取対象
領域を構成する罫線や枠などが定義されている。
【0003】このOCR帳票の画像を取り込んで実際に
文字認識を行う際には、まず、その画像から罫線や枠が
抽出される。なお、帳票画像から罫線や枠を抽出する技
術については、特開2000−172780号公報など
に詳しく開示されている。
【0004】次に、抽出した罫線等と、帳票のモデルに
おいて予め定義しておいた罫線等とが合うように画像全
体を傾斜、並行移動、拡大縮小させる処理を行うことに
より、帳票の読取対象領域が推定され、その領域の文字
が認識されるようになっている。
【0005】また、一般に、罫線や枠の配置が異なる様
々な表形式の帳票に対応できるよう、様々なモデルが予
め用意されており、取り込まれた帳票の表形式がどのモ
デルに適合するかを識別した上で、対応するモデルを用
いて読取対象領域の抽出が行われる。
【0006】
【発明が解決しようとする課題】ところで、従来、帳票
の画像を取り込んで罫線や枠を抽出した後は、上述した
ように、抽出した罫線等と、帳票のモデルにおいて予め
定義しておいた罫線等とが合うように画像全体を変換す
る処理を行っている。
【0007】このような処理は、紙面全体のずれには対
処できるが、局所的に位置ずれを起こしている場合に
は、位置ずれに関わる読取対象領域を的確に抽出するこ
とができない。また、上記処理は、罫線や枠の位置が微
妙に異なる膨大な種類の帳票を扱う必要がある場合にも
対処することができないという問題がある。
【0008】本発明は上記実情に鑑みてなされたもので
あり、帳票における個々の読取対象領域を的確かつ効率
的に抽出することのできる文字認識装置及び文字認識方
法を提供することを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するため
に、本発明に係る文字認識装置は、ラベル文字が記入さ
れたラベル領域と文字が記入された読取対象領域とを有
する帳票の文字認識を行う文字認識装置において、複数
の帳票について、少なくとも帳票上の読取対象領域の定
義、および前記読取対象領域と当該読取対象領域の周辺
のラベル文字が記入されたラベル領域との相対位置関係
を定義した帳票モデルを予め作成するモデル作成手段
と、読取られた帳票からラベル領域およびラベル文字の
ラベル情報を認識するラベル認識手段と、前記ラベル認
識手段によって認識した前記ラベル情報の認識結果と前
記帳票モデルとを比較して当該読取帳票に最適な帳票モ
デルを抽出し、その抽出された帳票モデルの前記定義さ
れた情報から前記読取帳票の読取対象領域を抽出する読
取領域抽出手段と、前記抽出された読取対象領域に位置
する前記読取帳票の文字画像を認識する文字認識手段と
を具備することを特徴とする。
【0010】また、上記目的を達成するために、本発明
に係る文字認識方法は、ラベル文字が記入されたラベル
領域と文字が記入された読取対象領域とを有する帳票の
文字認識を行う文字認識方法において、複数の帳票につ
いて、少なくとも帳票上の読取対象領域の定義、および
前記読取対象領域と当該読取対象領域の周辺のラベル文
字が記入されたラベル領域との相対位置関係を定義した
帳票モデルを予め作成し、読取られた帳票からラベル領
域およびラベル文字のラベル情報を認識し、認識した前
記ラベル情報の認識結果と前記帳票モデルとを比較して
当該読取帳票に最適な帳票モデルを抽出し、その抽出さ
れた帳票モデルの前記定義された情報から前記読取帳票
の読取対象領域を抽出し、前記抽出された読取対象領域
に位置する前記読取帳票の文字画像を認識することを特
徴とする。
【0011】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。図1は、本発明の一実施形態に係る
文字認識装置の構成を示すブロック図である。
【0012】文字認識装置1は、所定の表形式(フォー
マット)を有するOCR帳票の画像を取り込み、その帳
票に記入された文字を認識するものである。この場合の
帳票としては、例えば図2に示されるように入力項目は
同じであるが表形式(レイアウト)が少しずつ異なるも
の(帳票フォーマット51及び52)が存在し、それぞ
れの帳票には「姓」、「名」、「金額」といったラベル
文字が予め記されたラベル領域と、そのラベル領域に対
応して文字が手書きされた読取対象領域とが設けられ
る。
【0013】上記文字認識装置1は、モデル作成部1
0、領域抽出部20、文字認識部30を有するほか、モ
デル保管部41、画像入力部42、入力装置43、表示
装置44などを備えている。
【0014】モデル作成部10は、文字認識を行うべき
帳票のモデルを作成する際に使用されるものである。こ
のモデル作成部10は、各種モデルを作成するのに必要
な基本モデルをモデル保管部41から取り出したり、帳
票モデルを編集しやすくするために実画像(オーバーレ
イ用画像)を画像入力部42から取り込んだり、オーバ
ーレイ用画像に含まれる文字を文字認識部20に認識さ
せたり、作成したモデルをモデル保管部41に保管した
りする。
【0015】上記モデル作成部10は、領域定義部1
1、間接定義部12、GUI(Graphical User Interfa
ce)13などを有する。
【0016】領域定義部11は、帳票における個々の読
取対象領域を定義するものである。この場合、定義され
る読取対象領域は、例えば座標で表現される。また、読
取対象領域を構成する罫線もしくは枠も含めて定義する
ようにしてもよい。
【0017】間接定義部12は、帳票における個々の読
取対象領域と当該領域の周辺にあるラベル領域との相対
位置関係と、当該ラベル領域とを、定義するものであ
る。例えば、帳票フォーマット51の「田中」の読取対
象領域はラベル領域「姓」の下にあることが定義され
る。この場合、定義されるラベル領域は、例えば座標で
表現される。また、ラベル領域を構成する罫線もしくは
枠も含めて定義するようにしてもよい。
【0018】また、この間接定義部12においては、一
つの読取対象領域に対して複数のラベル領域を関連付け
て定義するようにしてもよい。例えば、帳票フォーマッ
ト51の「田中」の読取対象領域はラベル領域「姓」の
下にあり、ラベル領域「名」の左下にあり、ラベル領域
「金額」の上にあることが定義される。これにより、帳
票の実画像の読み取りを行う際にその読取対象領域をよ
り高精度に抽出することが可能となる。
【0019】GUI13は、帳票モデルにおいて定義さ
れるべき読取対象領域及びラベル領域を、使用者が画面
上でマウスなどのポインティングデバイスにより指定す
ることを可能とするものである。
【0020】このGUI13は、図3に示されるよう
に、例えば使用者が画面上で形成したモデルにおける任
意の読取対象領域をクリックし(手順1)、この読取対
象領域に関連付けしたいラベル領域をクリックすると
(手順2)、当該読取対象領域とラベル領域との関係
を、間接定義部12に定義される内容として自動的に登
録する機能を有している。この機能により、使用者は、
読取対象領域とラベル領域との関連付けを迅速かつ簡単
に行うことができる。
【0021】また、GUI13は、帳票モデルに対し、
帳票の実画像もしくは設計された画像をオーバーレイ表
示した状態で、当該モデルを編集することも可能とす
る。図4の(a)に示されるようにオーバーレイ表示を
行わない場合に比べ、図4の(b)に示されるようにオ
ーバーレイ表示を行う場合の方が、使用者にとってモデ
ル編集を行いやすい。
【0022】また、GUI13は、図5に示されるよう
に、あるラベル領域が画面上でポインティングデバイス
により指定されたときに、当該ラベル領域の文字を文字
認識部30により認識させ、認識された文字を間接定義
部12に定義される内容として登録する機能を有してい
る。この機能により、帳票の実画像の読み取りを行う際
にそのラベル領域をより的確に抽出することが可能とな
る。
【0023】また、GUI13は、図6に示されるよう
に、ビュー61中のある読取対象領域が画面上でポイン
ティングデバイスにより指定されたときに、当該読取対
象領域に関連付けできる近傍のラベル領域の候補をリス
トアップしたビュー62を自動的に画面上に表示する機
能を有している。ビュー62中では、例えば第1〜第2
候補毎に、ラベル領域のラベル文字「名」、「姓」及び
ラベル領域の位置の情報(上、左上)が示される。この
機能により、使用者は、読取対象領域に関連付けるべき
ラベル領域を簡単に指定することが可能となる。
【0024】一方、領域抽出部20は、実画像の読み取
り処理における領域抽出等を行うものである。この領域
抽出部20は、文字認識すべき帳票の実画像(帳票画
像)を画像入力部42から取り込んだり、取り込んだ帳
票画像に対応する種類のモデルをモデル保管部41から
取り込んだり、帳票画像のラベル領域や文字読取領域に
含まれる文字を文字認識部20に認識させたりする。
【0025】上記領域抽出部20は、ラベル領域抽出部
21、ラベル評価部22、位置補正部23、読取領域抽
出部24などを有する。
【0026】ラベル領域抽出部21は、取り込んだ帳票
画像から個々のラベル領域の罫線もしくは枠などを検出
することにより、当該ラベル領域を特定して抽出するも
のである。
【0027】ラベル評価部22は、ラベル領域抽出部2
1により抽出されたラベル領域を、モデルにおいて定義
された各ラベル領域に照らして評価し、当該帳票のモデ
ルの中から、読取対象領域の抽出に使用すべきラベル領
域を選択するものである。なお、このラベル評価部22
は、抽出されたラベル領域を評価するにあたり、そのラ
ベル領域に含まれる文字を文字認識部30に認識させ、
その認識された文字を、モデルにおける文字に照らして
判別する機能も有する。
【0028】すなわち、上記ラベル評価部22は、ラベ
ル領域抽出部21により抽出された実画像のラベル領域
に一致するラベル領域がモデルの中に存在するか否かを
判別し、一致するものがあればそのラベル領域を選択す
る。一方、一致するものがなければ、以下のような方法
を用いて適切なラベル領域を選択する。
【0029】ラベル評価部22によるラベル領域の選択
方法としては、例えば図7の(a)〜(c)に示される
ものが挙げられる。
【0030】図7の(a)の方法では、抽出された実画
像のラベル領域における文字列の編集距離と、モデル中
の各ラベル領域における文字列の編集距離とを比較す
る。この場合、双方の編集距離の差が小さければ小さい
ほど、当該ラベル領域が適切である度合いが高い。
【0031】図7の(b)の方法では、抽出された実画
像のラベル領域の位置と、モデル中の各ラベル領域の位
置との差(ずれ量)を算出する。この場合、その差が小
さければ小さいほど、当該ラベル領域が適切である度合
いが高い。
【0032】図7の(c)の方法では、抽出された実画
像のラベル領域の面積と、モデル中の各ラベル領域の面
積との差を算出する。この場合、その差が小さければ小
さいほど、当該ラベル領域が適切である度合いが高い。
【0033】よって、ラベル評価部22は、上記図7の
(a)〜(c)の方法のいずれかもしくはそれらの組み
合わせに基づいて、前記読取対象領域の抽出に使用すべ
き最も適切なラベル領域を選択する。このような手法を
採ると、帳票の実画像の読み取りを行う際にノイズ等に
起因して、認識された文字列がモデル中の文字列に完全
一致していなくても、領域を適切に特定することが可能
となる。
【0034】位置補正部23は、帳票画像における個々
の読取対象領域に関する位置補正を行うものである。こ
の位置補正においては、例えばアフィン変換(行列)を
用いた変換処理が行われる。この位置補正部23は、例
えば、抽出された実画像のラベル領域を構成する罫線も
しくは枠が、帳票モデルのラベル領域を構成する罫線も
しくは枠に一致するように(双方のずれを無くすよう
に)、個々のラベル領域に関して部分的な画像変換を行
う。この場合、図8の(a)に示されるように画像全体
の領域71に対してアフィン変換を行うのではなく、図
8の(b)に示されるように対象となっている一部の領
域72に対してアフィン変換を行う。これにより、領域
毎に細やかな位置調整を施すことが可能となる。
【0035】このような位置補正の結果、予め定義して
おいた前述の相対位置関係に則って、抽出すべき個々の
読取対象領域が画面上で適切な位置に自動的に移動する
ことになる。
【0036】読取領域抽出部24は、帳票モデル上で予
め定義しておいた相対位置関係を利用することにより、
個々のラベル領域の位置から対応する読取対象領域の位
置を特定してこれを抽出する。また、この読取領域抽出
部24は、読取対象領域を構成する罫線もしくは枠の配
置に基づく領域抽出を併用する機能も備えている。この
機能により、領域抽出をより高精度に行うことが可能と
なる。読取領域抽出部24は、抽出した読取対象領域の
実画像を文字認識部30に渡して文字認識を行わせる。
【0037】なお、領域抽出部20は、上述した各要素
(機能)21〜24のほか、読取対象領域が誤って抽出
されたときに修正を行う修正機能を有する。この修正機
能は、読取領域抽出部24により、ある読取対象領域に
関連付けられたラベル領域以外のラベル領域に基づいて
当該読取対象領域が誤って抽出されてしまった場合(あ
る読取対象領域の枠が重複して検出されてしまった場
合)などに起動される。
【0038】例えば、図9の(a)に示される実画像に
対し、図9の(b)に示されるモデル(ラベル「姓」の
ラベル領域のすぐ下に対応する読取対象領域が位置し、
ラベル「名」のすぐ下に対応する読取対象領域が位置す
るよう定義したモデル)が適用されている場合を考え
る。このとき、罫線もしくは枠が正しく検出できなかっ
た等の原因により、図9(c)に示されるように、ラベ
ル「姓」のラベル領域に対応する読取対象領域として、
ラベル「名」のすぐ下に位置する読取対象領域が誤って
抽出されてしまう場合がある。
【0039】このような場合、修正機能は、(1)当該
読取対象領域と各ラベル領域との位置の差、(2)双方
の文字列の編集距離の差、(3)双方の文字列の大きさ
の差、(4)双方を個々にアフィン変換した場合の変化
量と画像全体をアフィン変換した場合の変化量との差、
のいずれかもしくはそれらの組み合わせに基づいて適切
に対応する方のラベル領域を決定する。なお、上記
(1)〜(4)の方法においては、それぞれの差が小さ
ければ小さいほど、当該ラベル領域が適切である度合い
が高い。
【0040】上記修正機能は、決定したラベル領域以外
のラベル領域についてはその座標情報を使用することに
より(例えば枠を定義する4点のうち、3点だけしか検
出できていない場合、これら3点の座標に基づき)、適
切な読取対象領域を推定して抽出する。
【0041】また、領域抽出部20は、こうした機能の
ほか、ラベル評価部22により評価されるラベル領域の
文字を文字認識部30に文字認識させ、認識された文字
に一致する文字がモデルの中に存在しない場合、画面上
に特定の表示を行う特定表示機能を有する。この特定表
示機能は、例えば、認識されたラベルの文字「タロ」が
モデルの中に存在しなかった場合、図10に示されるよ
うに、代わりに正しいものと推定されるモデル中の文字
「名」を表示すると共に、文字認識結果の信頼性が低い
ことを示すためにその領域を画面上で反転表示させた
り、色を変えたり、点滅させたり、もしくはメッセージ
を表示する等の処理を行い、使用者に注意を喚起させ
る。
【0042】文字認識部30は、モデル作成部10から
の要求に応じてオーバーレイ用画像中の文字を認識し、
その認識結果をモデル作成部10に返す。また、文字認
識部30は、領域抽出部20からの要求に応じてラベル
領域に含まれる文字を認識し、その認識結果を領域抽出
部20に返したり、領域抽出部20からの要求に応じて
読取対象領域に含まれる文字を認識し、その認識結果を
出力したりする。
【0043】モデル保管部41は、モデル作成部10に
より使用される基本モデルを保持すると共に、モデル作
成部10により作成された各種モデルを保管するもので
ある。
【0044】画像入力部42は、帳票の画像を取り込
み、当該画像をオーバーレイ用画像としてモデル作成部
10に供給したり、読取処理されるべき画像として領域
抽出部20に供給したりするものである。
【0045】入力装置43は、使用者が入力操作を行う
ための装置である。また、表示装置44は、モデルや帳
票の実画像を画面表示するための装置である。
【0046】次に、図11のフローチャートを参照し
て、モデルの作成処理の流れを説明する。
【0047】まず、モデル作成部10により、モデル保
管部41から所望の基本モデルが取り込まれ、使用者が
GUI13を通じて帳票のモデルを作成するためのモデ
ル作成用画面が表示装置44に表示される(ステップA
1)。
【0048】この場合、例えば画像入力部42から帳票
の実画像も取り込まれ、モデルに対するオーバーレイ表
示が行われる。また、画像中の文字については、文字認
識部30により認識され、これにより認識された文字も
同時に表示される。使用者は、こうした表示状態でモデ
ルの作成・修正を行う。
【0049】使用者は、画面上で形成したモデルにおけ
る任意の読取対象領域をクリックし、次いで、この読取
対象領域に関連付けしたいラベル領域をクリックする。
【0050】このような操作を行うと、領域定義部11
により、指定された読取対象領域が座標などに基づいて
モデル上で定義され(ステップA2)、間接定義部12
により、領域定義部11で定義した読取対象領域と所定
のラベル領域との相対位置関係と、当該ラベル領域と
が、座標などに基づいて同じモデル上で定義される(ス
テップA3)。
【0051】使用者がモデル作成を完了すると、モデル
作成部10により、作成したモデルがモデル保管部41
に保管される(ステップA4)。
【0052】次に、図12のフローチャートを参照し
て、実画像の読取処理の流れを説明する。
【0053】まず、領域抽出部20により、文字認識す
べき帳票の実画像が画像入力部42から取り込まれ、ま
た、取り込んだ帳票画像に対応する最適なモデルがモデ
ル保管部41から取り込まれ、画面上に表示される(ス
テップB1)。
【0054】取り込んだ帳票画像からは、ラベル領域抽
出部21により個々のラベル領域の罫線もしくは枠など
が検出され、これにより当該ラベル領域が特定され、ラ
ベル領域の抽出処理が行われる(ステップB2)。
【0055】抽出されたラベル領域は、モデルにおいて
定義された各ラベル領域に照らしてラベル評価部22に
より評価され、当該帳票のモデルの中から、読取対象領
域の抽出に使用すべきラベル領域が選択される(ステッ
プB3)。この場合、そのラベル領域に含まれる文字
は、文字認識部30により認識され、その認識された文
字は、モデルにおける文字に照らして判別される。この
判別結果も、ラベル評価において使用される。
【0056】評価の結果、選択された個々のラベル領域
に関して、部分的な画像変換(アフィン変換など)によ
る位置補正が行われる(ステップB4)。
【0057】このような位置補正の結果、予め定義して
おいた前述の相対位置関係に則って、抽出すべき個々の
読取対象領域が画面上で適切な位置に自動的に移動する
ことになる。
【0058】個々のラベル領域について上記ステップB
3〜B4の処理が繰り返され、全てのラベル領域につい
て処理が完了すると、読取領域抽出部24により、モデ
ル上で予め定義しておいた相対位置関係を利用して、個
々のラベル領域の位置から対応する読取対象領域の位置
が特定されて抽出が行われる(ステップB6)。なお、
この際に読取対象領域を構成する罫線もしくは枠の配置
に基づく領域抽出を併用してもよい。
【0059】読取領域抽出部24により読取対象領域が
抽出された後、誤って抽出された読取対象領域があるか
否か(ある読取対象領域の枠が重複して検出されてしま
ったか等)が判別される(ステップB7)。
【0060】ここで、誤って抽出された読取対象領域が
あった場合には(ステップB7のYes)、領域抽出部
20の修正機能によって修正処理が行われる(ステップ
B8)。この修正処理では、当該読取対象領域と各ラベ
ル領域とが比較され、適切に対応する方のラベル領域が
決定され、決定したラベル領域以外のラベル領域につい
てはその座標情報を使用することにより適切な読取対象
領域が推定・抽出される(ステップB8)。読取対象領
域の抽出が修正された後は、当該読取対象領域の実画像
が文字認識部30に渡されて、文字認識が行われる(ス
テップB9)。
【0061】一方、誤って抽出された読取対象領域が無
ければ、その領域の実画像が文字認識部30に渡され
て、文字認識が行われる(ステップB9)。
【0062】このように本実施形態によれば、帳票のモ
デル作成処理において、GUI13の機能により、使用
者はモデルにおいて定義されるべき読取対象領域及びラ
ベル領域を、画面上でマウスなどのポインティングデバ
イスにより指定するだけで、読取対象領域とラベル領域
との関連付けを迅速かつ簡単に行うことができ、間接定
義部12に定義される内容として自動的に登録すること
が可能となる。
【0063】また、実画像読取処理において、ラベル領
域の抽出結果や文字の認識結果などが芳しくない場合で
あっても、ラベル領域に対する評価、部分的な領域の位
置補正、予め定義しておいた相対位置関係の使用などを
通じて、個々の読取対象領域を的確かつ効率的に抽出す
ることが可能となる。
【0064】なお、本発明は、上述した実施形態に限定
されるものではなく、その要旨を逸脱しない範囲内で種
々変形して実施することが可能である。
【0065】
【発明の効果】以上詳記したように本発明によれば、帳
票における個々の読取対象領域を的確かつ効率的に抽出
することのできる文字認識装置及び文字認識方法を提供
することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る文字認識装置の構成
を示すブロック図。
【図2】上記文字認識装置で使用する帳票におけるラベ
ル領域及び読取対象領域を説明するための図。
【図3】使用者がGUIを通じてモデルを作成する際に
読取対象領域とラベル領域との関連付けを行う手順を説
明するための図。
【図4】オーバーレイ表示なしでモデルを編集する場合
と、オーバーレイ表示ありでモデルを編集する場合とを
説明するための図。
【図5】マウスで指定したラベル領域の文字が自動認識
されることを説明するための図。
【図6】マウスで指定した読取対象領域に関連付けでき
る近傍のラベル領域の候補が自動的に画面上に表示され
ることを説明するための図。
【図7】ラベル領域の評価において適切なラベル領域を
選択する方法を説明するための図。
【図8】画像全体の領域に対してアフィン変換を行う場
合と、一部の領域に対してアフィン変換を行う場合とを
説明するための図。
【図9】誤って抽出された読取対象領域があった場合に
修正処理を行うことを説明するための図。
【図10】文字認識結果の信頼性が低いことを示すため
の画面表示を説明するための図。
【図11】モデルの作成処理の流れを説明するためのフ
ローチャート。
【図12】実画像の読取処理の流れを説明するためのフ
ローチャート。
【符号の説明】
1…文字認識装置 10…モデル作成部 11…領域定義部 12…間接定義部 13…GUI 20…領域抽出部 21…ラベル領域抽出部 22…ラベル評価部 23…位置補正部 24…読取領域抽出部 30…文字認識部 41…モデル保管部 42…画像入力部 43…入力装置 44…表示装置 51,52…帳票フォーマット 61,62…ビュー 71…画像全体の領域 72…一部の領域

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 ラベル文字が記入されたラベル領域と文
    字が記入された読取対象領域とを有する帳票の文字認識
    を行う文字認識装置において、 複数の帳票について、少なくとも帳票上の読取対象領域
    の定義、および前記読取対象領域と当該読取対象領域の
    周辺のラベル文字が記入されたラベル領域との相対位置
    関係を定義した帳票モデルを予め作成するモデル作成手
    段と、 読取られた帳票からラベル領域およびラベル文字のラベ
    ル情報を認識するラベル認識手段と、 前記ラベル認識手段によって認識した前記ラベル情報の
    認識結果と前記帳票モデルとを比較して当該読取帳票に
    最適な帳票モデルを抽出し、その抽出された帳票モデル
    の前記定義された情報から前記読取帳票の読取対象領域
    を抽出する読取領域抽出手段と、 前記抽出された読取対象領域に位置する前記読取帳票の
    文字画像を認識する文字認識手段とを具備することを特
    徴とする文字認識装置。
  2. 【請求項2】 前記モデル作成手段は、一つの読取対象
    領域に対して複数のラベル領域を関連付けて定義するこ
    とを特徴とする請求項1記載の文字認識装置。
  3. 【請求項3】 前記前記モデル作成手段は、前記ラベル
    領域を構成する罫線もしくは枠も含めて定義し、 前記ラベル認識手段は、前記読取帳票におけるラベル領
    域を構成する罫線もしくは枠も含めて抽出することを特
    徴とする請求項1記載の文字認識装置。
  4. 【請求項4】 前記モデル作成手段は、前記帳票モデル
    の定義において参照される前記読取対象領域及び前記ラ
    ベル領域を、画面上でポインティングデバイスにより指
    定することにより自動的に定義情報を作成することを特
    徴とする請求項1記載の文字認識装置。
  5. 【請求項5】 前記定義情報の作成に際し、前記帳票の
    画像もしくは設計された画像をオーバーレイ表示した状
    態で、モデルの編集を行うことを可能とすることを特徴
    とする請求項4記載の文字認識装置。
  6. 【請求項6】 前記ラベル領域が画面上でポインティン
    グデバイスにより指定されたときに、当該ラベル領域の
    文字を認識し、その文字を前記定義される内容として登
    録することを特徴とする請求項4記載の文字認識装置。
  7. 【請求項7】 前記読取対象領域が画面上でポインティ
    ングデバイスにより指定されたときに、当該読取対象領
    域に関連付けできるラベル領域の候補を画面上に表示す
    ることを特徴とする請求項4記載の文字認識装置。
  8. 【請求項8】 前記最適な帳票モデルが存在しない場
    合、前記帳票モデルの中から、前記ラベル認識手段によ
    り認識されたラベル領域と各ラベル領域との位置の差、
    双方の文字列の編集距離の差、双方の面積の差、のいず
    れかもしくはそれらの組み合わせに基づいて前記読取対
    象領域の抽出に使用すべきラベル領域を選択することを
    特徴とする請求項1記載の文字認識装置。
  9. 【請求項9】 前記帳票の画像における個々の読取対象
    領域に関する位置補正を行う位置補正手段を更に具備す
    ることを特徴とする請求項1記載の文字認識装置。
  10. 【請求項10】 ラベル文字が記入されたラベル領域と
    文字が記入された読取対象領域とを有する帳票の文字認
    識を行う文字認識方法において、 複数の帳票について、少なくとも帳票上の読取対象領域
    の定義、および前記読取対象領域と当該読取対象領域の
    周辺のラベル文字が記入されたラベル領域との相対位置
    関係を定義した帳票モデルを予め作成し、 読取られた帳票からラベル領域およびラベル文字のラベ
    ル情報を認識し、 認識した前記ラベル情報の認識結果と前記帳票モデルと
    を比較して当該読取帳票に最適な帳票モデルを抽出し、
    その抽出された帳票モデルの前記定義された情報から前
    記読取帳票の読取対象領域を抽出し、 前記抽出された読取対象領域に位置する前記読取帳票の
    文字画像を認識することを特徴とする文字認識方法。
JP2002019062A 2002-01-28 2002-01-28 文字認識装置及び文字認識方法 Pending JP2003223610A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002019062A JP2003223610A (ja) 2002-01-28 2002-01-28 文字認識装置及び文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002019062A JP2003223610A (ja) 2002-01-28 2002-01-28 文字認識装置及び文字認識方法

Publications (1)

Publication Number Publication Date
JP2003223610A true JP2003223610A (ja) 2003-08-08

Family

ID=27743115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002019062A Pending JP2003223610A (ja) 2002-01-28 2002-01-28 文字認識装置及び文字認識方法

Country Status (1)

Country Link
JP (1) JP2003223610A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009122722A (ja) * 2007-11-09 2009-06-04 Fujitsu Ltd 帳票認識プログラム、帳票認識装置および帳票認識方法
JP2013041388A (ja) * 2011-08-15 2013-02-28 Fujitsu Marketing Ltd レシート定義データ作成装置およびそのプログラム
JP2015052864A (ja) * 2013-09-06 2015-03-19 株式会社東芝 帳票読取装置およびプログラム
JP2017091379A (ja) * 2015-11-13 2017-05-25 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム
JP2018081578A (ja) * 2016-11-17 2018-05-24 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
JP2019071134A (ja) * 2019-02-06 2019-05-09 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム
CN111832554A (zh) * 2019-04-15 2020-10-27 顺丰科技有限公司 一种图像检测方法、装置及存储介质
CN112949450A (zh) * 2021-02-25 2021-06-11 北京百度网讯科技有限公司 票据处理方法、装置、电子设备和存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009122722A (ja) * 2007-11-09 2009-06-04 Fujitsu Ltd 帳票認識プログラム、帳票認識装置および帳票認識方法
JP2013041388A (ja) * 2011-08-15 2013-02-28 Fujitsu Marketing Ltd レシート定義データ作成装置およびそのプログラム
CN103150652A (zh) * 2011-08-15 2013-06-12 株式会社富士通商务系统 收据定义数据编制装置
JP2015052864A (ja) * 2013-09-06 2015-03-19 株式会社東芝 帳票読取装置およびプログラム
JP2017091379A (ja) * 2015-11-13 2017-05-25 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム
JP2018081578A (ja) * 2016-11-17 2018-05-24 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
JP2019071134A (ja) * 2019-02-06 2019-05-09 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム
CN111832554A (zh) * 2019-04-15 2020-10-27 顺丰科技有限公司 一种图像检测方法、装置及存储介质
CN112949450A (zh) * 2021-02-25 2021-06-11 北京百度网讯科技有限公司 票据处理方法、装置、电子设备和存储介质
CN112949450B (zh) * 2021-02-25 2024-01-23 北京百度网讯科技有限公司 票据处理方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
KR101783337B1 (ko) 이미지 문서에서 텍스트를 추출하는 방법 및 장치
US20070098263A1 (en) Data entry apparatus and program therefor
JP6569532B2 (ja) 管理システム、リスト作成装置、リスト作成方法、管理方法及び管理用プログラム
US20100128922A1 (en) Automated generation of form definitions from hard-copy forms
US20070242882A1 (en) Image processing apparatus for identifying the position of a process target within an image
JPH08255236A (ja) 画像のファイリング装置及びファイリング方法
JP7206729B2 (ja) 情報処理装置及びプログラム
JP2004258706A (ja) 帳票定義データ作成方法および帳票処理装置
JP7444495B2 (ja) Ocrベース文書分析システム及び方法
JP6886100B2 (ja) 情報処理装置、その処理方法及びプログラム
JP2003223610A (ja) 文字認識装置及び文字認識方法
JPH09231291A (ja) 帳票読取方法及びその装置
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP4102365B2 (ja) アプリケーション間のデータ連携支援方法
JP2004013813A (ja) 情報管理システムおよび情報管理方法
JP2002203206A (ja) 文書書式識別装置および識別方法
JP4935459B2 (ja) 文字認識方法、文字認識プログラムおよび文字認識装置
JP2001202475A (ja) 文字認識装置及び文字認識装置の制御方法
JPH10171920A (ja) 文字認識装置、その文字認識方法およびその記録媒体
JPH08329187A (ja) 文書読取装置
JP5051174B2 (ja) 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム
JP2004062351A (ja) レイアウト情報登録システム、レイアウト情報登録プログラム、およびレイアウト情報登録方法
JPH10207981A (ja) 帳票認識方法
JPH0660222A (ja) 文字認識装置
JP3817442B2 (ja) 画像認識装置、画像認識方法、及び画像認識方法を実現するプログラムとこのプログラムの記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050610

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050823