JP2003242441A - 帳票処理方法および装置並びにプログラム - Google Patents

帳票処理方法および装置並びにプログラム

Info

Publication number
JP2003242441A
JP2003242441A JP2002038479A JP2002038479A JP2003242441A JP 2003242441 A JP2003242441 A JP 2003242441A JP 2002038479 A JP2002038479 A JP 2002038479A JP 2002038479 A JP2002038479 A JP 2002038479A JP 2003242441 A JP2003242441 A JP 2003242441A
Authority
JP
Japan
Prior art keywords
recognition result
field
image
display
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002038479A
Other languages
English (en)
Inventor
Shigeko Kaneichi
滋子 金一
Takeshi Nozaki
剛 野崎
Mayumi Ueda
真弓 植田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP2002038479A priority Critical patent/JP2003242441A/ja
Publication of JP2003242441A publication Critical patent/JP2003242441A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】OCR処理を利用して帳票データの入力を行う
際に、その確認作業におけるオペレータの負担を低減す
ることのできる帳票処理方法および装置並びにプログラ
ムを提供する。 【解決手段】帳票画像取得部1が予め帳票種別毎に認識
すべき領域とその属性とを設定した帳票の帳票イメージ
を取得するとともに、帳票判別部2が帳票イメージの帳
票種別を判別し、当該判別結果に基づいてOCR部3が
領域の文字認識処理を実行し、表示・修正部4が各領域
の認識結果をその属性に応じて異なる態様で表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、帳票処理方法お
よび装置並びにプログラムに関し、特に、OCRを利用
して帳票データの入力を行う帳票処理方法および装置並
びにプログラムに関する。
【0002】
【従来の技術】近年、コンピュータ技術の発達に伴っ
て、様々な処理がコンピュータを利用して行われるよう
になってきた。このような処理の1つには、帳票に記入
された帳票データの処理も含まれる。
【0003】帳票データに対してコンピュータを利用し
て各種処理を施す場合には、予め帳票データを電子化す
る必要がある。帳票データの電子化に際しては、オペレ
ータが帳票を目視してキーボード等からコンピュータへ
の入力を行う場合や帳票をスキャナ等でイメージ化した
帳票イメージに対してOCR(光学式文字認識)処理を
施して入力を行う場合等があるが、最近では、OCR処
理を施して帳票データの入力を行う機会が増大してい
る。
【0004】OCR処理を施して帳票データの入力を行
う場合、理想的には全て自動処理で行うこととなるが、
実際には、オペレータによる確認作業が伴うことが多
い。オペレータによる確認作業は、OCR処理により入
力されたデータをディスプレイ装置等に表示し、これを
帳票若しくはディスプレイ装置に表示した帳票イメージ
と比較することで行い、必要に応じて帳票データの修正
を行うこととなる。
【0005】
【発明が解決しようとする課題】上述したように、帳票
データの入力に際してOCR処理を利用した場合には、
オペレータ等が、入力された帳票データを帳票若しくは
帳票イメージと比較して確認作業を行っている。
【0006】しかしながら、この確認作業は、処理すべ
き帳票の数が多い場合には、オペレータ等に多大な負担
を強いることとなる。
【0007】そこで、この発明は、OCR処理を利用し
て帳票データの入力を行う際に、その確認作業における
オペレータの負担を低減することのできる帳票処理方法
および装置並びにプログラムを提供することを目的とす
る。
【0008】
【課題を解決するための手段】上述した目的を達成する
ため、請求項1の発明は、種別毎に予め認識すべき領域
と該領域の属性とが設定された帳票の帳票イメージに文
字認識処理を施し、該認識結果を前記帳票イメージと併
せて表示する帳票処理方法において、前記領域の認識結
果を該領域の属性に応じた態様で、前記帳票イメージか
ら前記領域を切り出した領域イメージとともに表示する
ことを特徴とする。
【0009】また、請求項2の発明は、請求項1の発明
において、前記領域イメージは、前記領域の属性に応じ
た態様で表示されることを特徴とする。
【0010】また、請求項3の発明は、請求項1の発明
において、前記認識結果は、前記文字認識処理による信
頼度に応じて表示方法を変えることを特徴とする。
【0011】また、請求項4の発明は、請求項1の発明
において、前記認識結果に対する修正方法を前記領域の
属性に応じて異ならせたことを特徴とする。
【0012】また、請求項5の発明は、種別毎に予め認
識すべき領域と該領域の属性とが設定された帳票の帳票
イメージに文字認識処理を施し、該認識結果を前記帳票
イメージと併せて表示する帳票処理装置において、前記
帳票イメージの種別を判別する帳票種別判別手段と、前
記帳票種別判別手段により判別された種別に基づいて文
字認識処理を施す領域を決定する領域決定手段と、前記
領域決定手段により決定された領域に文字認識処理を施
す認識手段と、前記認識手段による認識結果を対応する
領域の属性に応じた態様で、前記帳票イメージから前記
領域を切り出した領域イメージとともに表示する表示手
段とを具備することを特徴とする。
【0013】また、請求項6の発明は、請求項5の発明
において、前記表示手段、前記領域イメージを該領域の
属性に応じた態様で表示することを特徴とする。
【0014】また、請求項7の発明は、請求項5の発明
において、前記表示手段は、前記認識手段による認識結
果の信頼度に応じて該認識結果の表示方法を変えること
を特徴とする。
【0015】また、請求項8の発明は、請求項5の発明
において、前記認識手段による認識結果を対応する属性
に応じた態様で修正させる認識結果修正手段をさらに具
備することを特徴とする。
【0016】また、請求項9の発明は、種別毎に予め認
識すべき領域と該領域の属性とが設定された帳票の帳票
イメージに対する文字認識処理と、該認識結果を前記帳
票イメージと併せて表示する表示処理とをコンピュータ
に実行させる帳票処理プログラムにおいて、前記領域の
認識結果を該領域の属性に応じた態様で、前記帳票イメ
ージから前記領域を切り出した領域イメージとともに表
示させることを特徴とする。
【0017】また、請求項10の発明は、請求項9の発
明において、前記領域イメージは、前記領域の属性に応
じた態様で表示されることを特徴とする。
【0018】また、請求項11の発明は、請求項9の発
明において、前記認識結果は、前記文字認識処理による
信頼度に応じて表示方法を変えることを特徴とする。
【0019】また、請求項12の発明は、請求項9の発
明において、前記認識結果に対する修正方法を前記領域
の属性に応じて異ならせたことを特徴とする。
【0020】
【発明の実施の形態】以下、この発明に係る帳票処理方
法および装置並びにプログラムの一実施の形態につい
て、添付図面を参照して詳細に説明する。
【0021】図1は、帳票処理装置の機能的な構成を示
すブロック図である。同図(a)に示すように、帳票処
理装置は、帳票画像取得部1と帳票判別部2、OCR処
理部3、表示・修正部4を具備して構成される。帳票画
像取得部1は、図示しないスキャナ等で帳票を読み取っ
て得た帳票イメージ(画像)を取得する。帳票判別部2
は、帳票イメージからその罫線情報等に基づいて、当該
帳票イメージの帳票種別を判別する。OCR部3は、帳
票判別部2により判別された帳票種別に基づいて、予め
帳票種別毎に定められているフィールド(領域)の認識
を行う。表示・修正部4は、OCR部3が認識した認識
結果と該当するフィールドのフィールドイメージを表示
するとともに、認識結果の修正を受け付ける。なお、表
示・修正部4による処理の詳細は、後述する。
【0022】ところで、図1(a)に示した構成では、
帳票イメージの生成から認識結果の修正までを一連の処
理として行うこととなるが、実際には、一連の処理とし
て行われるとは限らない。例えば、スキャナ等による帳
票イメージの生成を予めまとめて行い、その後に、帳票
種別の判別や認識処理を行うこととなる。この場合に
は、帳票処理装置の構成は、図1(b)に示すようにな
る。
【0023】図1(b)に示した帳票処理装置において
は、帳票画像取得部1、帳票判別部2、OCR処理部
3、表示・修正部4は、それぞれ図1(a)に示したも
のと同様のものであり、蓄積部5は、帳票イメージや認
識結果等を蓄積、保存するものである。この構成におい
ては、スキャナ等が生成した帳票イメージは、蓄積部5
に蓄積される。その後、帳票画像取得部1が蓄積部5か
ら帳票イメージを取得し、帳票判別部2が帳票種別の判
別を行い、OCR部3で認識処理が施される。そして、
OCR部3での認識結果は、該当するフィールドイメー
ジとともに表示・修正部4に渡されるか蓄積部5に蓄積
される。また、表示・修正部4は、OCR部3から渡さ
れた若しくは蓄積部5に蓄積されている認識結果とフィ
ールドイメージを表示するとともに、その修正を受け付
ける。
【0024】なお、帳票処理装置は、専用の装置として
構成しても良く、汎用のコンピュータ装置を用いて構成
しても良い。コンピュータ装置を用いる場合には、帳票
画像取得部1、帳票判別部2、OCR処理部3、表示・
修正部4の各部は、ソフトウェアおよびそのソフトウェ
アによって動作するCPU、メモリ等の周辺装置により
構成される。また、蓄積部5は、ハードディスクドライ
ブ等の外部記憶装置により構成される。
【0025】次に、表示・修正部4について説明する。
図2は、表示・修正部4の構成を示すブロック図であ
る。
【0026】同図に示すように、表示・修正部4は、フ
ィールドイメージ・認識結果処理部41と表示部42、
認識結果修正部43を具備して構成される。フィールド
イメージ・認識結果処理部41は、OCR部3若しくは
蓄積部5から認識結果とフィールドイメージを取得して
保持し、認識結果に対する修正等があった場合には、修
正結果等を蓄積部5に登録する。表示部42は、フィー
ルドイメージ・認識結果処理部41が取得したフィール
ドイメージと認識結果を当該フィールドイメージに対し
て予め設定されている属性に応じた態様で図示しないデ
ィスプレイ装置等に表示する。認識結果修正部43は、
オペレータにより認識結果等の修正が指示された場合に
は、当該指示を受け付けてフィールドイメージ・認識結
果処理部41に保持されている認識結果を修正する。
【0027】続いて、表示・修正部4の動作について説
明する。図3は、表示・修正部4の動作の流れを示すフ
ローチャートである。ただし、図3に示すフローチャー
トには、一部、OCR部3での処理も含まれている。
【0028】帳票画像取得部1が取得した帳票イメージ
は、まず、帳票判別部2で帳票種別が判別され、その判
別結果に基づいて、OCR部3が帳票イメージ中の所定
のフィールドの認識処理を行う(ステップ101)。O
CR部3での認識処理が終了すると、表示・修正部4の
フィールドイメージ・認識結果取得部41が全フィール
ドのフィールドイメージと認識結果を取得する(ステッ
プ102)。このフィールドイメージと認識結果は、O
CR部3から直接取得してもよく、蓄積部5に蓄積され
たものを取得してもよい。
【0029】フィールドイメージ・認識結果取得部41
は、フィールドイメージと認識結果を取得すると、変数
nをフィールド数に設定するとともに変数iを1に設定
する(ステップ103)。そして、変数iの値が変数n
の値以下であれば(ステップ104でYES)、i番目
のフィールドの種別を確認し(ステップ105)、表示
部42に確認したフィールド種別に応じた態様でフィー
ルドイメージと認識結果を表示させる(ステップ10
6)。
【0030】その後、オペレータによる認識結果の修正
指示を認識結果修正部42が受け付けると(ステップ1
07でYES)、フィールドイメージ・認識結果取得部
41は、認識結果の修正を行う(ステップ108)。認
識結果の修正は、認識結果修正部42がオペレータによ
る確認指示を受け付けるまで(ステップ109でN
O)、修正指示がある毎に行われ、認識結果修正部42
が確認指示を受け付けると(ステップ109でYE
S)、フィールドイメージ・認識結果処理部41は、蓄
積部5等へフィールドイメージと認識結果を登録する
(ステップ110)。
【0031】続いて、フィールドイメージ・認識結果処
理部41は、変数iの値を1だけインクリメントし(ス
テップ111)、変数iの値が変数nの値以下であれば
同様の処理を繰り返す。そして、変数iの値が変数nの
値を越えると(ステップ104でNO)、全てのフィー
ルドに対する処理が終了したこととなるので、処理を終
了する。
【0032】なお、ここで説明した処理は、1の帳票イ
メージに対する処理であり、複数の帳票イメージに対し
て処理を行う場合には、この処理を繰り返して行うこと
となる。
【0033】次に、表示部42によるフィールドイメー
ジと認識結果の表示について説明する。図4は、表示部
42により表示される表示画面の例を示した図である。
表示部42は、フィールドイメージと認識結果を表示す
る際に、図4に示す画面200を図示しないディスプレ
イ装置等に表示する。画面200は、フィールド表示欄
201とイメージ表示欄202、認識結果表示欄203
により構成される。
【0034】フィールド表示欄201は、フィールドイ
メージと対応する認識結果を表示する欄である。このフ
ィールド表示欄201での表示の態様は、対応するフィ
ールドの属性により異なる。イメージ表示欄202は、
帳票イメージ(全体イメージ)を表示し、認識結果表示
欄203は、全フィールドの認識結果を表示する。
【0035】ここで、フィールド表示欄201での表示
の態様について説明する。図5は、フィールド表示欄2
01での表示態様の種別を示したものである。ここで
は、表示態様をAからJの10通り用意し、フィールド
イメージ・認識結果処理部41は、表示部42に表示す
るフィールドの属性に応じて表示態様を選択させる。
【0036】表示態様Aは、個別枠のあるフィールドを
対象として英数カタカナの認識処理を行う場合の態様で
ある。表示態様Aを選択するフィールドとしては、郵便
番号欄やフリガナ欄等がある。
【0037】この表示態様Aでは、フィールドイメージ
を文字・背景・定型情報の3値イメージとして表示し、
認識処理時のセグメント領域と認識結果を併せて表示す
る。また、表示態様Aでの認識結果の修正は、直接入力
若しくは候補文字の選択により行う。
【0038】例えば、フィールドが郵便番号欄であった
場合には、図6に示すようにフィールド表示欄201−
A1には、認識結果210−A1とフィールドイメージ
211−A1が表示される。フィールドイメージ211
−A1は、文字・背景・定型情報が異色となる3値イメ
ージとして表示される(ただし、図では同色で示してい
る)。表示色としては、例えば、記入された文字が黒
色、背景が白色、定型情報が灰色となる。定型情報と
は、予め帳票に記載(印刷)されている同種の帳票で共
通の情報であり、この場合には、郵便番号記入枠が該当
する。
【0039】また、フィールドイメージ211−A1に
は、各文字に対してセグメント212−A1等が異なる
色、例えば、赤色で表示されるとともに、文字認識結果
213−A1等がさらに異なる色、例えば、青色で表示
される。
【0040】そして、認識結果210−A1を修正する
場合には、直接数字を入力する。ただし、修正は、候補
文字からの選択も可能であるが、候補文字からの選択に
ついては、次の例で説明する。
【0041】また、フィールドがフリガナ欄であった場
合には、図7に示すようにフィールド表示欄201−A
2には、認識結果210−A2とフィールドイメージ2
11−A2が表示される。フィールドイメージ211−
A2は、文字・背景・定型情報が異色となる3値イメー
ジとして表示される。この場合の定型情報は、フリガナ
記入枠が該当する。
【0042】また、フィールドイメージ211−A2に
は、各文字に対してセグメント212−A2等が異なる
色、例えば、赤色で表示されるとともに、文字認識結果
213−A2等がさらに異なる色、例えば、青色で表示
されるが、認識結果の信頼度が低場合には、結果が注目
できるように、さらに異なる色、例えば、緑色で表示さ
れる(図中の文字認識結果213−A2は、緑色表示で
あるものとする)。
【0043】そして、認識結果210−A2を修正する
場合には、各文字の認識結果に基づく候補文字を選択す
ることで行う。例えば、文字認識結果213−A2を修
正する場合には、候補文字選択欄214−A2を表示さ
せ、表示された候補文字から適切な文字を選択する。も
ちろん、直接文字を入力して修正を行ってもよい。
【0044】表示態様Bは、個別枠のないフリー記入を
行うフィールドを対象として英数カタカナの認識処理を
行う場合の態様である。表示態様Bを選択するフィール
ドとしては、日付欄等がある。
【0045】この表示態様Bでは、フィールドイメージ
を文字・背景・定型情報の3値イメージとして表示し、
認識結果の修正は、直接入力により行う。
【0046】例えば、フィールドが日付欄であった場合
には、図8に示すようにフィールド表示欄201−Bに
は、認識結果210−Bとフィールドイメージ211−
Bが表示される。フィールドイメージ211−Bは、文
字・背景・定型情報が異色となる3値イメージとして表
示される。この場合の定型情報は、「年」、「月」、
「日」の各文字と文字が記入される外枠が該当する。
【0047】表示態様Bにおいては、認識結果210−
Bに認識結果の信頼度が低いものが存在する場合には、
表示方法を変えて認識結果210−Bの表示自体を行わ
ない。これは、1部のみを「?」等で表示するとオペレ
ータの見落としを誘発する恐れがあるとともに、英数カ
タカナの入力であれば直接入力を行った方が早い場合が
多いからである。
【0048】表示態様Cは、名前(氏名)を入力するフ
ィールドを対象として日本語(漢字を含む)の認識処理
を行う場合の態様である。表示態様Cを選択するフィー
ルドとしては、氏名欄等がある。
【0049】この表示態様Cでは、フィールドイメージ
を文字・背景・定型情報の3値イメージとして表示し、
認識処理時のセグメント領域と認識結果を併せて表示す
る。また、表示態様Cでの認識結果の修正は、直接入力
若しくは候補文字列、候補文字の選択により行う。
【0050】例えば、フィールドが氏名欄であった場合
には、図9に示すようにフィールド表示欄201−Cに
は、認識結果210−Cとフィールドイメージ211−
Cが表示される。フィールドイメージ211−Cは、文
字・背景・定型情報が異色となる3値イメージとして表
示される。この場合の定型情報は、「様」の文字と文字
が記入される外枠が該当する。
【0051】そして、認識結果210−Cを修正する場
合には、文字列の認識結果に基づく候補文字列を選択す
ることで行う。例えば、認識結果210−Cを修正する
場合には、候補文字列選択欄214−Cを表示させ、表
示された候補文字から適切な文字列を選択する。もちろ
ん、直接文字を入力して修正を行ってもよく、各文字を
個別に選択して修正を行ってもよい。なお、候補文字
(列)は、例えば、イメージ画像上で、マウスを右クリ
ックすると表示される。
【0052】ここで、表示態様Cにおける認識結果の他
の修正方法について説明する。図10および図11は、
表示態様Cにおける認識結果の修正例を示した図であ
る。
【0053】表示態様Cにおける認識結果の修正方法と
しては、まず、図10(a)に示す画面300−C1を
ポップアップ表示し、この画面300−C1の表示に従
って修正を行う方法がある。画面300−C1には、フ
ィールドイメージ301−C1が表示され、このフィー
ルドイメージ301−C1上の各文字に対してセグメン
ト302−C1等と文字認識結果303−C1等が表示
される。セグメント302−C1等や文字認識結果30
3−C1等は、図6に示したフィールド表示欄201−
A1の場合と同様にそれぞれ異なる色で表示される。
【0054】そして、認識結果を文字単位で修正する場
合には、文字認識結果303−C1をマウス等のポイン
ティングデバイスで指示することで行う。
【0055】また、認識結果を文字列単位で修正する場
合には、文字列候補選択欄304−C1から所望の文字
列を選択すると、選択された文字列が文字列表示欄30
5−C1に表示されることとなる。文字列候補選択欄3
04−C1に表示される候補文字列は、文字認識の結果
に加え、知識辞書が用いられて文字列としての認識処理
を施した結果選択されたものとなる。
【0056】この画面300−C1により修正を行う場
合には、基本的には、候補文字列からの選択を行い、候
補文字列に正確な文字列がない場合に、文字毎の修正を
行うこととなる。文字毎の修正を行う際には、候補文字
は、セグメントの違いにより異なるため、セグメントが
異なる場合には、セグメントが正しい候補文字列を選択
してから候補文字を選択する。
【0057】例えば、候補文字列として、「山本 紹
予」を選択した場合、画面300−C1は、図10
(b)に示す画面300−C2のように変化する。この
場合、セグメント302−C2は、誤りであるため、候
補文字303−C2に対する候補文字群306−C2に
は、正解となる文字は存在しない。
【0058】一方、候補文字列として「山本 太郎」を
選択した場合、画面300−C1は、図11に示す画面
300−C3のように変化する。この場合、セグメント
302−C3は、正しいため、候補文字303−C3に
対する候補文字群306−C3には、正解となる文字が
存在する(図11の場合には、既に正解である「太」の
文字が候補とされている)。
【0059】表示態様Dは、住所を入力するフィールド
を対象として日本語(漢字を含む)の認識処理を行う場
合の態様である。表示態様Dを選択するフィールドとし
ては、住所欄等がある。
【0060】この表示態様Dでは、フィールドイメージ
を文字・背景・定型情報の3値イメージとして表示し、
認識処理時のセグメント領域と認識結果を併せて表示す
る。また、表示態様Dでの認識結果の修正は、直接入力
若しくは候補文字列、候補文字の選択、郵便番号変換に
より行う。
【0061】例えば、フィールドが住所欄であった場合
には、図12に示すようにフィールド表示欄201−D
には、認識結果210−Dとフィールドイメージ211
−Dが表示される。フィールドイメージ211−Dは、
文字・背景・定型情報が異色となる3値イメージとして
表示される。
【0062】そして、認識結果210−Dを修正する場
合には、文字列の認識結果に基づく候補文字列を選択す
ることで行う。例えば、認識結果210−Dを修正する
場合には、候補文字列選択欄214−Dを表示させ、表
示された候補文字から適切な文字列を選択する。もちろ
ん、直接文字を入力して修正を行ってもよく、各文字を
個別に選択して修正を行ってもよい。
【0063】また、認識結果210−Dを修正する際
に、郵便番号の入力を住所の入力に代えることができ
る。この場合には、図13に示す画面400−Dをポッ
プアップ表示させて郵便番号の入力を行う。画面400
−Dでは、郵便番号入力欄401−Dに郵便番号を入力
して、変換ボタン402−Dを押下すると、住所表示欄
403−Dに郵便番号に対応する住所が表示される。こ
の状態でOKボタン404−Dを押下すると認識結果2
10−Dは、住所表示欄403−Dに表示されている文
字列と置き換えられる。また、キャンセルボタン405
−Dを押下した場合には、認識結果210−Dは、その
まま保持される。
【0064】表示態様Eは、基本的には、表示態様Cお
よび表示態様Dと同じ処理となるが、候補文字列を選出
する際に利用する知識辞書が、ユーザ定義辞書である点
が異なる。
【0065】知識辞書として、ユーザ定義辞書を用いた
場合、例えば、氏名欄に記入される可能性のある氏名
(顧客の氏名)を辞書に登録しておくことで、より正確
な候補文字列を選出することができる。
【0066】表示態様Fは、知識辞書を利用しない認識
処理を行う場合の態様である。住所や氏名のような知識
辞書がないため、候補文字列を選出することができな
い。表示態様Fでの読み取り結果の修正は、直接入力も
しくは文字単位の候補を選択することにより行う。
【0067】表示態様Gは、マークを記入するフィール
ドを対象としてマーク位置の認識処理を行う場合の態様
である。表示態様Gを選択するフィールドとしては、男
女選択欄等がある。
【0068】この表示態様Gでは、フィールドイメージ
を文字(マーク)・背景・定型情報の3値イメージとし
て表示する。また、表示態様Gでの認識結果の修正は、
マーク位置の選択により行う。
【0069】例えば、フィールドが男女選択欄であった
場合には、図14(a)に示すようにフィールド表示欄
201−G1には、認識結果210−G1とフィールド
イメージ211−G1が表示される。フィールドイメー
ジ211−G1は、マーク・背景・定型情報が異色とな
る3値イメージとして表示される。この場合の定型情報
は、「男」、「女」の文字が該当する。また、フィール
ドイメージ211−G1上には、検出位置212−G
1、212−G2がさらに異なる色として表示される。
【0070】そして、認識結果210−G1の修正は、
検出位置212−G1、検出位置212−G2をマウス
等のポインティングデバイスで選択指示することで行
う。例えば、フィールドが男女選択欄であれば、「男」
と「女」のいずれか一方しか選択することができないた
め、検出位置212−G1、検出位置212−G2のい
ずれかのうち、最後に選択された方に対応する文字が認
識結果210−G1と置き換えられる。
【0071】また、認識結果として選択項目のそれぞれ
をON、OFFとして認識する場合には、図14(b)
に示すように、フィールド表示欄201−G3には、認
識結果210−G3とフィールドイメージ211−G3
が表示される。フィールドイメージ211−G3は、マ
ーク・背景・定型情報が異色となる3値イメージとして
表示される。この場合の定型情報は、「男」、「女」の
文字が該当する。また、フィールドイメージ211−G
3上には、検出位置212−G3、212−G4がさら
に異なる色として表示される。
【0072】そして、認識結果210−G3の修正は、
検出位置212−G3、検出位置212−G4をマウス
等のポインティングデバイスで選択指示することで行
う。例えば、検出位置212−G3を選択すると、その
選択毎にONとOFFが切り替わり、検出位置212−
G4を選択した場合にも同様に、その選択毎にONとO
FFが切り替わる。
【0073】また、マークを記入するフィールドが図1
5(a)に示すように、縦方向に項目(銀行、信用金
庫、農協や本店、支店)が並んでいる場合、同様に、図
15(b)に示すようにフィールド表示欄201−G5
に、認識結果210−G5とフィールドイメージ211
−G5を表示してもよいが、図16(a)に示すフィー
ルド表示欄201−G6のように、フィールドイメージ
を各項目(検出位置)毎に切り出して、フィールドイメ
ージ211−G7、フィールドイメージ211−G8、
フィールドイメージ211−G9として横方向に並べて
表示するようにしても良い。
【0074】また、認識結果の修正に際しては、上述の
場合と同様に検出位置を選択する他にも、図16(b)
に示す画面500−Gをポップアップ表示して認識結果
を修正してもよい。画面500−Gには、検出位置イメ
ージ501−G1等や認識結果欄502−G1、502
−G2等が表示される。この場合、認識結果は、認識結
果欄502−G2に示すように、マークが検出された検
出位置の定型情報が文字として表示され、この文字を修
正することを可能としている。
【0075】表示態様Hは、定型情報のないフィールド
を対象として英数カタカナの認識処理を行う場合の態様
である。表示態様Hを選択するフィールドとしては、E
13B文字欄等がある。
【0076】この表示態様Hでは、フィールドイメージ
を濃淡イメージとして表示し、認識結果の修正は、直接
入力により行う。
【0077】例えば、フィールドがE13B文字欄であ
った場合には、図17に示すようにフィールド表示欄2
01−Hには、認識結果210−Hとフィールドイメー
ジ211−Hが表示される。フィールドイメージ211
−Hは、濃淡イメージとして表示される。
【0078】表示態様Hにおいては、認識結果210−
Hに認識結果の信頼度が低いものが存在する場合には、
認識結果210−Hの表示自体を行わない。これは、1
部のみを「?」等で表示するとオペレータの見落としを
誘発する恐れがあるとともに、英数カタカナの入力であ
れば直接入力を行った方が早い場合が多いからである。
【0079】表示態様Iは、バーコードの認識処理を行
う場合の態様である。この表示態様Iでは、フィールド
イメージを濃淡イメージとして表示し、認識結果の修正
は、直接入力により行う。
【0080】例えば、フィールドがバーコード欄であっ
た場合には、図18に示すようにフィールド表示欄20
1−Iには、認識結果210−Iとフィールドイメージ
211−Iが表示される。フィールドイメージ211−
Iは、濃淡イメージとして表示される。
【0081】なお、バーコードの認識処理を行った読み
取り結果210−Iは、信頼度がなく、リジェクトかリ
ジェクトでないかの判定しかないため、リジェクトの場
合は認識結果210−Iの表示を行うことができない。
【0082】表示態様Jは、認識処理を行わない場合の
態様である。この表示態様Jでは、フィールドイメージ
を濃淡イメージとして表示する。そして、認識処理自体
を行わないため、修正は必要としない。
【0083】例えば、捺印欄であった場合には、図19
に示すようにフィールド表示欄201−Jには、フィー
ルドイメージ211−Jが表示される。フィールドイメ
ージ211−Jは、濃淡イメージとして表示される。
【0084】なお、上述した表示態様は、一例であり、
この他にも、適宜表示態様を変更すること等も可能であ
る。
【0085】
【発明の効果】以上説明したように、この発明によれ
ば、予め帳票種別毎に認識すべき領域とその属性とを設
定した帳票の帳票イメージに文字認識処理を施す際に、
各領域の認識結果をその属性に応じて異なる態様で表示
するように構成したので、オペレータは、領域の属性毎
に最適な表示で認識結果を確認することができ、文字認
識処理の確認作業を容易に行うことができる。
【図面の簡単な説明】
【図1】帳票処理装置の機能的な構成を示すブロック図
である。
【図2】表示・修正部4の構成を示すブロック図であ
る。
【図3】表示・修正部4の動作の流れを示すフローチャ
ートである。
【図4】表示部42により表示される表示画面の例を示
した図である。
【図5】フィールド表示欄201での表示態様の種別を
示したものである。
【図6】表示態様Aでのフィールド表示欄201の表示
例を示した図(1)である。
【図7】表示態様Aでのフィールド表示欄201の表示
例を示した図(2)である。
【図8】表示態様Bでのフィールド表示欄201の表示
例を示した図である。
【図9】表示態様Cでのフィールド表示欄201の表示
例を示した図である。
【図10】表示態様Cにおける認識結果の修正例を示し
た図(1)である。
【図11】表示態様Cにおける認識結果の修正例を示し
た図(2)である。
【図12】表示態様Dでのフィールド表示欄201の表
示例を示した図である。
【図13】郵便番号の入力を住所の入力に代える際の表
示画面例を示した図である。
【図14】表示態様Gでのフィールド表示欄201の表
示例を示した図(1)である。
【図15】表示態様Gでのフィールド表示欄201の表
示例を示した図(2)である。
【図16】表示態様Gでのフィールド表示欄201の表
示例を示した図(3)である。
【図17】表示態様Hでのフィールド表示欄201の表
示例を示した図である。
【図18】表示態様Iでのフィールド表示欄201の表
示例を示した図である。
【図19】表示態様Jでのフィールド表示欄201の表
示例を示した図である。
【符号の説明】
1 帳票画像取得部 2 帳票判別部 3 OCR部 4 表示・修正部 5 蓄積部 41 フィールドイメージ・認識結果処理部 42 表示部 43 認識結果修正部 200 画面 201 フィールド表示欄 202 イメージ表示欄 203 認識結果表示欄 201−A1 フィールド表示欄 210−A1 認識結果 211−A1 フィールドイメージ 212−A1 セグメント 213−A1 文字認識結果 201−A2 フィールド表示欄 210−A2 認識結果 211−A2 フィールドイメージ 212−A2 セグメント 213−A2 文字認識結果 214−A2 候補文字選択欄 201−B フィールド表示欄 210−B 認識結果 211−B フィールドイメージ 201−C フィールド表示欄 210−C 認識結果 211−C フィールドイメージ 214−C 候補文字列選択欄 300−C1 画面 301−C1 フィールドイメージ 302−C1 セグメント 303−C1 文字認識結果 304−C1 文字列候補選択欄 305−C1 文字列表示欄 300−C2 画面 301−C2 フィールドイメージ 302−C2 セグメント 303−C2 文字認識結果 304−C2 文字列候補選択欄 305−C2 文字列表示欄 306−C2 候補文字群 300−C3 画面 301−C3 フィールドイメージ 302−C3 セグメント 303−C3 文字認識結果 304−C3 文字列候補選択欄 305−C3 文字列表示欄 306−C3 候補文字群 201−D フィールド表示欄 210−D 認識結果 211−D フィールドイメージ 214−D 候補文字列選択欄 400−D 画面 401−D 郵便番号入力欄 402−D 変換ボタン 403−D 住所表示欄 404−D OKボタン 405−D キャンセルボタン 201−G1 フィールド表示欄 210−G1 認識結果 211−G1 フィールドイメージ 212−G1 検出位置 212−G2 検出位置 201−G3 フィールド表示欄 210−G3 認識結果 211−G3 フィールドイメージ 212−G3 検出位置 212−G4 検出位置 201−G5 フィールド表示欄 210−G5 認識結果 211−G5 フィールドイメージ 201−G6 フィールド表示欄 210−G6 認識結果 211−G7 フィールドイメージ 211−G8 フィールドイメージ 211−G9 フィールドイメージ 500−G 画面 501−G1 検出位置イメージ 502−G1 認識結果欄 502−G2 認識結果欄 201−H フィールド表示欄 210−H 認識結果 211−H フィールドイメージ 201−I フィールド表示欄 210−I 認識結果 211−I フィールドイメージ 201−J フィールド表示欄 211−J フィールドイメージ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 植田 真弓 兵庫県姫路市下手野一丁目3番1号 グロ ーリー工業株式会社内 Fターム(参考) 5B029 AA01 BB02 CC25 5B064 AA01 EA11 EA12 FA03 FA04 FA05 FA06 FA13

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 種別毎に予め認識すべき領域と該領域の
    属性とが設定された帳票の帳票イメージに文字認識処理
    を施し、該認識結果を前記帳票イメージと併せて表示す
    る帳票処理方法において、 前記領域の認識結果を該領域の属性に応じた態様で、前
    記帳票イメージから前記領域を切り出した領域イメージ
    とともに表示することを特徴とする帳票処理方法。
  2. 【請求項2】 前記領域イメージは、 前記領域の属性に応じた態様で表示されることを特徴と
    する請求項1記載の帳票処理方法。
  3. 【請求項3】 前記認識結果は、 前記文字認識処理による信頼度に応じて表示方法を変え
    ることを特徴とする請求項1記載の帳票処理方法。
  4. 【請求項4】 前記認識結果に対する修正方法を前記領
    域の属性に応じて異ならせたことを特徴とする請求項1
    記載の帳票処理方法。
  5. 【請求項5】 種別毎に予め認識すべき領域と該領域の
    属性とが設定された帳票の帳票イメージに文字認識処理
    を施し、該認識結果を前記帳票イメージと併せて表示す
    る帳票処理装置において、 前記帳票イメージの種別を判別する帳票種別判別手段
    と、 前記帳票種別判別手段により判別された種別に基づいて
    文字認識処理を施す領域を決定する領域決定手段と、 前記領域決定手段により決定された領域に文字認識処理
    を施す認識手段と、 前記認識手段による認識結果を対応する領域の属性に応
    じた態様で、前記帳票イメージから前記領域を切り出し
    た領域イメージとともに表示する表示手段とを具備する
    ことを特徴とする帳票処理装置。
  6. 【請求項6】 前記表示手段、 前記領域イメージを該領域の属性に応じた態様で表示す
    ることを特徴とする請求項5記載の帳票処理装置。
  7. 【請求項7】 前記表示手段は、前記認識手段による認
    識結果の信頼度に応じて該認識結果の表示方法を変える
    ことを特徴とする請求項5記載の帳票処理装置。
  8. 【請求項8】 前記認識手段による認識結果を対応する
    属性に応じた態様で修正させる認識結果修正手段をさら
    に具備することを特徴とする請求項5記載の帳票処理装
    置。
  9. 【請求項9】 種別毎に予め認識すべき領域と該領域の
    属性とが設定された帳票の帳票イメージに対する文字認
    識処理と、該認識結果を前記帳票イメージと併せて表示
    する表示処理とをコンピュータに実行させる帳票処理プ
    ログラムにおいて、 前記領域の認識結果を該領域の属性に応じた態様で、前
    記帳票イメージから前記領域を切り出した領域イメージ
    とともに表示させることを特徴とする帳票処理プログラ
    ム。
  10. 【請求項10】 前記領域イメージは、 前記領域の属性に応じた態様で表示されることを特徴と
    する請求項9記載の帳票処理プログラム。
  11. 【請求項11】 前記認識結果は、 前記文字認識処理による信頼度に応じて表示方法を変え
    ることを特徴とする請求項9記載の帳票処理プログラ
    ム。
  12. 【請求項12】 前記認識結果に対する修正方法を前記
    領域の属性に応じて異ならせたことを特徴とする請求項
    9記載の帳票処理プログラム。
JP2002038479A 2002-02-15 2002-02-15 帳票処理方法および装置並びにプログラム Pending JP2003242441A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002038479A JP2003242441A (ja) 2002-02-15 2002-02-15 帳票処理方法および装置並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002038479A JP2003242441A (ja) 2002-02-15 2002-02-15 帳票処理方法および装置並びにプログラム

Publications (1)

Publication Number Publication Date
JP2003242441A true JP2003242441A (ja) 2003-08-29

Family

ID=27779779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002038479A Pending JP2003242441A (ja) 2002-02-15 2002-02-15 帳票処理方法および装置並びにプログラム

Country Status (1)

Country Link
JP (1) JP2003242441A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005141463A (ja) * 2003-11-06 2005-06-02 Nihon Daiko Shoji Co Ltd データ入力方法、データ入力支援情報入力装置、及びデータ入力装置
JP2005234790A (ja) * 2004-02-18 2005-09-02 Ricoh Co Ltd 手書き帳票処理システム、手書き帳票処理方法
JP2007164314A (ja) * 2005-12-12 2007-06-28 Seiko Epson Corp タイムカード読取システム、読取装置、タイムカード読取システムの読取方法、プログラム
JP2008186450A (ja) * 2007-01-29 2008-08-14 Toshiba Corp ワークフロー管理システム、ワークフロー管理方法
JP2013012223A (ja) * 2012-08-29 2013-01-17 Canon Software Inc 画像処理装置及び方法、並びにプログラム
JP2014182477A (ja) * 2013-03-18 2014-09-29 Fuji Xerox Co Ltd プログラム及び帳票処理装置
JP5632110B1 (ja) * 2014-03-20 2014-11-26 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP5661214B1 (ja) * 2014-09-02 2015-01-28 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
WO2018037520A1 (ja) * 2016-08-24 2018-03-01 株式会社Pfu モバイル端末、画像処理方法、および、プログラム
WO2019194026A1 (ja) * 2018-04-02 2019-10-10 日本電気株式会社 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
JP2019185141A (ja) * 2018-04-02 2019-10-24 日本電気株式会社 画像処理装置、画像処理方法およびプログラム

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005141463A (ja) * 2003-11-06 2005-06-02 Nihon Daiko Shoji Co Ltd データ入力方法、データ入力支援情報入力装置、及びデータ入力装置
JP2005234790A (ja) * 2004-02-18 2005-09-02 Ricoh Co Ltd 手書き帳票処理システム、手書き帳票処理方法
JP2007164314A (ja) * 2005-12-12 2007-06-28 Seiko Epson Corp タイムカード読取システム、読取装置、タイムカード読取システムの読取方法、プログラム
JP2008186450A (ja) * 2007-01-29 2008-08-14 Toshiba Corp ワークフロー管理システム、ワークフロー管理方法
JP2013012223A (ja) * 2012-08-29 2013-01-17 Canon Software Inc 画像処理装置及び方法、並びにプログラム
JP2014182477A (ja) * 2013-03-18 2014-09-29 Fuji Xerox Co Ltd プログラム及び帳票処理装置
JP2015184711A (ja) * 2014-03-20 2015-10-22 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP5632110B1 (ja) * 2014-03-20 2014-11-26 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP5661214B1 (ja) * 2014-09-02 2015-01-28 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP2015185157A (ja) * 2014-09-02 2015-10-22 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
WO2018037520A1 (ja) * 2016-08-24 2018-03-01 株式会社Pfu モバイル端末、画像処理方法、および、プログラム
WO2019194026A1 (ja) * 2018-04-02 2019-10-10 日本電気株式会社 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
JP2019185141A (ja) * 2018-04-02 2019-10-24 日本電気株式会社 画像処理装置、画像処理方法およびプログラム
JP2019185138A (ja) * 2018-04-02 2019-10-24 日本電気株式会社 画像処理装置、画像処理方法およびプログラム
US11328504B2 (en) 2018-04-02 2022-05-10 Nec Corporation Image-processing device for document image, image-processing method for document image, and storage medium on which program is stored
US11514700B2 (en) 2018-04-02 2022-11-29 Nec Corporation Image-processing device, image-processing method, and storage medium on which program is stored

Similar Documents

Publication Publication Date Title
US10489682B1 (en) Optical character recognition employing deep learning with machine generated training data
US6400845B1 (en) System and method for data extraction from digital images
JP6702629B2 (ja) 活字ocrシステム
JP6472218B2 (ja) 文字認識システム及び文字認識方法
US6614929B1 (en) Apparatus and method of detecting character writing area in document, and document format generating apparatus
CN101430758A (zh) 文档识别装置和方法
JP2003242441A (ja) 帳票処理方法および装置並びにプログラム
JP3001065B2 (ja) プログラムの作成方法
US6958755B1 (en) Personalized computer fonts
CN111860450A (zh) 票证识别装置以及票证信息管理系统
JP6302317B2 (ja) 帳票フォーマット情報登録方法及びシステム並びにプログラム
JP4935459B2 (ja) 文字認識方法、文字認識プログラムおよび文字認識装置
JP4518212B2 (ja) 画像処理装置及びプログラム
JP4517822B2 (ja) 画像処理装置及びプログラム
JP3930466B2 (ja) 文字認識装置、文字認識プログラム
JP2007128160A (ja) 情報処理装置
JP3221968B2 (ja) 文字認識装置
US11699021B1 (en) System for reading contents from a document
JP4224914B2 (ja) 文字読取システム及び文字読取方法
US20210271808A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JPH1185899A (ja) 文字読み取り装置、その読み取り方法および記録媒体
JP4081074B2 (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム
JP2006252575A (ja) 財務諸表自動入力装置及び財務諸表自動入力方法
JP3335494B2 (ja) 文字認識処理装置
JPH05303661A (ja) イメージデータ部分取得表示装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071009

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080228

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080409

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080509