JPH08161436A - 領収書読取装置 - Google Patents

領収書読取装置

Info

Publication number
JPH08161436A
JPH08161436A JP6302411A JP30241194A JPH08161436A JP H08161436 A JPH08161436 A JP H08161436A JP 6302411 A JP6302411 A JP 6302411A JP 30241194 A JP30241194 A JP 30241194A JP H08161436 A JPH08161436 A JP H08161436A
Authority
JP
Japan
Prior art keywords
receipt
item
character
image
line image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6302411A
Other languages
English (en)
Inventor
Masanori Terasaki
正則 寺崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6302411A priority Critical patent/JPH08161436A/ja
Publication of JPH08161436A publication Critical patent/JPH08161436A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 FCデータを必要とせずに、個人向けの各種
領収書から領収情報を読み取ることができる領収書読取
装置を提供する。 【構成】 認識部4は、イメージ検出部1によって検出
された領収書のイメージから射影を検出し、その射影に
基づいて読取フィールドを自動判別してその読取フィー
ルドに対応する行イメージを切り出した後、その行イメ
ージから文字パターンを切り出し、その文字パターンと
認識辞書とを照合して文字の認識結果を得る。これによ
り、FCデータを必要とせずに、各種領収書から領収情
報を読み取ることができる。また、項目理解部6は、各
文字列毎に項目を理解し、認識結果に項目情報を付加し
て出力バッファ7に出力する。これにより、項目毎に認
識結果の利用が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、個人向けの各種領収書
から領収情報を光学的に読み取る領収書読取装置に関す
る。
【0002】
【従来の技術】従来、領収書から領収情報を光学的に読
み取る領収書専用の読取装置が、商用機として存在して
いるが、読み取れる領収書は1種類に固定されているか
又は数種類に限られ、しかも読取フィールドの位置情報
等が予め登録されたFC(フォーマットコントロール)
データ等が領収書の種類毎に必要であった。
【0003】
【発明が解決しようとする課題】上述のように、従来の
領収書専用の読取装置は、読み取れる領収書の種類が制
限されて汎用性に欠けていたため、従来の領収書専用の
読取装置により、多種類の個人向けの一般レシートを読
み取るには、膨大な量のFCデータが必要となり、実用
的でないという問題があった。
【0004】一方、近年の家事労働の省力化,効率化等
に伴い、家計簿の作成の効率化が望まれてきている。
【0005】そこで、本発明は、上記事情に鑑みてなさ
れたものであり、FCデータを必要とせずに、個人向け
の各種領収書から領収情報を読み取ることができる領収
書読取装置を提供することを目的とするものである。
【0006】
【課題を解決するための手段】請求項1記載の領収書読
取装置は、各種領収書に記入された複数の文字列を光学
的に読み取る領収書読取装置であって、前記領収書のイ
メージを検出するイメージ検出手段と、検出された領収
書のイメージから射影を検出し、その射影に基づいて行
イメージを切り出す行イメージ切出し手段と、切り出さ
れた行イメージから文字パターンを切り出す文字パター
ン切出し手段と、切り出された文字パターンと認識辞書
とを照合して領収書に記入された文字の認識結果を得る
文字認識手段と、前記認識結果と単語辞書とを照合して
各文字列毎に項目を理解する項目理解手段と、前記認識
結果に前記理解された項目情報を付加して出力する出力
手段とを有することを特徴とするものである。
【0007】請求項2記載の領収書読取装置は、各種領
収書に記入された複数の文字列を光学的に読み取る領収
書読取装置であって、前記領収書のイメージを検出する
イメージ検出手段と、検出された領収書のイメージから
射影を検出し、その射影に基づいて行イメージを切り出
す行イメージ切出し手段と、切り出された行イメージか
ら文字パターンを切り出す文字パターン切出し手段と、
切り出された文字パターンと認識辞書とを正逆両方向に
ついて照合して文字の認識結果を得る文字認識手段と、
前記認識結果に基づいて正しい方向を判別する方向判別
手段と、正しい方向について得られた文字の認識結果と
単語辞書とを照合して各文字列毎に項目を理解する項目
理解手段と、正しい方向について得られた認識結果に前
記理解された項目情報を付加して出力する出力手段とを
有することを特徴とするものである。
【0008】請求項3記載の領収書読取装置は、各種領
収書に記入された複数の文字列を光学的に読み取る領収
書読取装置であって、前記領収書のイメージを検出する
イメージ検出手段と、検出された領収書のイメージから
射影を検出し、その射影に基づいて複数の行イメージ候
補を切り出す行イメージ切出し手段と、切り出された複
数の行イメージ候補から文字パターンを切り出す文字パ
ターン切出し手段と、切り出された文字パターンと認識
辞書とを照合して領収書に記入された文字の認識結果を
得るとともに、前記照合結果を示す評価値を求め、行イ
メージ候補毎の評価値に基づいて正しい行イメージを決
定する文字認識手段と、前記正しい行イメージについて
得られた認識結果と単語辞書とを照合して各文字列毎に
項目を理解する項目理解手段と、前記正しい行イメージ
について得られた認識結果に前記理解された項目情報を
付加して出力する出力手段とを有することを特徴とする
ものである。
【0009】請求項4記載の領収書読取装置は、理解さ
れた項目情報に基づいて前記認識結果のうち金額間の整
合性の有無を判定する金額判定手段を備え、前記出力手
段は、前記整合性の有無の判定結果をも出力することを
特徴とするものである。
【0010】
【作用】請求項1記載の領収書読取装置によれば、行イ
メージ切出し手段は、イメージ検出手段によって検出さ
れた領収書のイメージから射影を検出し、その射影に基
づいて読取フィールドを自動判別してその読取フィール
ドに対応する行イメージを切り出す。文字パターン切出
し手段は、その行イメージから文字パターンを切り出
し、文字認識手段は、切り出された文字パターンと認識
辞書とを照合して文字の認識結果を得る。これにより、
FCデータを必要とせずに、各種領収書から領収情報を
読み取ることができる。また、項目理解手段は、各文字
列毎に項目を理解し、出力手段は、認識結果に項目情報
を付加して出力する。これにより、項目毎に認識結果の
利用が可能となる。
【0011】請求項2記載の領収書読取装置によれば、
イメージ検出手段が、各種領収書を正方向又は逆方向か
ら走査して領収書のイメージを検出すると、行イメージ
切出し手段は、その領収書のイメージから射影を検出
し、その射影に基づいて行イメージを切り出し、文字パ
ターン切出し手段は、切り出された行イメージから文字
パターンを切り出す。文字認識手段は、切り出された文
字パターンと認識辞書とを正逆両方向について照合して
文字の認識結果を得る。方向判別手段は、認識結果に基
づいて正しい方向を判別する。項目理解手段は、各文字
列毎に項目を理解する。これにより、請求項1記載と同
様、項目毎に認識結果の利用が可能となり、正方向及び
逆方向のいずれの方向で領収書を走査しても、正しい方
向を判別するようにしているので、認識率の高い認識結
果を得ることができる。
【0012】請求項3記載の領収書読取装置によれば、
行イメージ切出し手段は、イメージ検出手段によって検
出された領収書のイメージから射影を検出し、その射影
に基づいて複数の読取フィールドを設定してその読取フ
ィールドに対応する複数の行イメージ候補を切り出す。
文字パターン切出し手段は、その行イメージ候補から文
字パターンを切り出し、文字認識手段は、切り出された
文字パターン候補と認識辞書とを照合して文字の認識結
果を得るとともに、照合結果を示す評価値を求め、行イ
メージ候補毎の評価値に基づいて正しい行イメージを決
定する。これにより、FCデータを必要とせずに、より
多種類の領収書から領収情報を読み取ることができる。
また、請求項1記載の装置と同様に、項目理解手段は、
各文字列毎に項目を理解し、出力手段は、認識結果に項
目情報を付加して出力する。これにより、項目毎に認識
結果の利用が可能となる。
【0013】請求項4記載の領収書読取装置によれば、
金額判定手段が、認識された金額間の整合性の有無を判
定する。これにより、信頼性の高い金額の認識結果を得
ることができる。
【0014】
【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。
【0015】図1は本発明の領収書読取装置の一実施例
を示すブロック図である。
【0016】この領収書読取装置は、個人向けの各種領
収書に記入された複数の文字列(領収情報)を光学的に
読み取るものであり、領収書のイメージを検出するイメ
ージ検出部1と、検出された領収書のイメージを格納す
るイメージバッファ2と、領収書のイメージから行イメ
ージ及び文字パターンを切り出し、その切り出した文字
パターンと認識辞書部3に格納された認識辞書とを照合
して文字の認識結果を得る認識部4と、認識結果と単語
辞書部5に格納された単語辞書とを照合して項目を理解
する項目理解部6と、項目理解部6からの出力データを
保持する出力バッファ7とを具備している。
【0017】前記イメージ検出部1は、領収書上に光を
照射する光源と、領収書からの反射光を受けてその光量
に応じた電気信号に変換する光電変換器と、この光電変
換器からの電気信号を多値のディジタルデータに変換す
るA/D変換器と、このA/D変換器の出力データを2
値化する2値化部とを備え、領収書全体を光学的に走査
して領収書のイメージを検出するものである。
【0018】前記認識辞書部3には、少なくとも各種領
収書で多く使用される領収に関する文字、例えば
「小」,「計」,「合」,「預」,「釣」,「¥」,
「*」,「★」,数字などからなる例えばマルチフォン
ト認識辞書が予め格納されている。
【0019】前記認識部4は、行イメージ候補抽出処
理,方向判別処理及び文字認識処理を行うものである。
以下、この認識部4が行う各処理について説明する。
【0020】この行イメージ候補抽出処理では、イメー
ジバッファ2に格納された領収書のイメージから縦方向
及び横方向の射影を検出し、その射影に基づいてラベリ
ングを行いながら複数の読取フィールドを設定し、さら
に、ラベリングを行いながら上下方向で一部重なってい
るか又は上下方向の間隔が所定値以下の複数の読取フィ
ールドの組合せからなる読取フィールドを設定し、設定
した各読取フィールドに対応する行イメージ候補を抽出
し、その抽出した行イメージ候補から射影検出により1
文字ごとに文字パターンを切り出すものである。
【0021】また、方向判別処理では、抽出した行イメ
ージ候補のうち候補として正しそうな行イメージ、例え
ば上下方向の間隔が所定値以上の読取フィールドに対応
する行イメージを1つ選択し、その行イメージから1文
字毎に文字パターンを切り出し、領収書のイメージを検
出した際の方向(正方向)のままで文字パターンと認識
辞書とを照合して照合結果を示す評価値としての類似度
値を演算して求め、その類似度値を点数に換算して、最
も点数の高い第1位文字候補から順に第n位文字候補ま
で複数の文字候補を選択して文字の認識結果(文字コー
ド)を得るものである。また、同一の行イメージを18
0度回転した方向(逆方向)についても同様に文字の認
識を行い、類似度値を求める。次に、各正方向及び逆方
向毎に類似度値の合計を文字数で割った平均類似度値を
求め、その平均類似度値がある閾値を超えた場合は、そ
の方向を正しい方向と決定する。両方向とも閾値を超え
ない場合は、残りの行イメージ候補から次に正しそうな
行イメージを決め、それについて方向判別処理を繰り返
すものである。
【0022】また、文字認識処理では、方向判別処理で
判別された正しい方向について行イメージ候補の全てに
ついて方向判別処理で行ったのと同様に行イメージ候補
から切り出した文字パターンと認識辞書とを照合して各
文字毎に照合結果を示す評価値としての類似度値を求
め、複数の文字候補を選択して文字の認識結果を得、各
行イメージ毎に平均類似度値を求め、その求めた平均類
似度値が所定の閾値を越える正しい行イメージを最終的
に決定し、その決定した行イメージについて得た認識結
果(複数の文字候補)に、領収書全体のイメージに対す
る行イメージの位置情報及び文字パターンの位置情報な
どの付加情報を付した認識情報を項目理解部6に出力す
るようになっている。
【0023】前記単語辞書格納部5には、少なくとも各
種領収書で多く使用される項目に関する単語、例えば
「小計」,「合計」,「預」,「釣」,「¥」,
「*」,「★」などからなる単語辞書が予め格納されて
いる。
【0024】前記項目理解部6は、項目理解処理と金額
チェック処理を行うものである。
【0025】この項目理解処理では、認識部4からの読
取結果である文字列を単語単位に分割して単語辞書とを
照合し、文字列毎に項目を理解するものである。項目理
解部6が理解する項目としては、領収書の発行日を意味
する「日付項目」,物品名やサービス名等の取引対象名
を意味する「取引対象名項目」,小さなグループ単位の
金額を意味する「小計項目」,小計に対する外税を意味
する「外税計項目」,小計と外税計との合計金額を意味
する「合計項目」,預かり金額を意味する「預項目」,
釣銭額を意味する「釣項目」,金額そのものを意味する
「金額項目」,これらの項目に属さないために項目を理
解できなかったことを意味する「その他の項目」等があ
る。また、この項目理解部6は、「¥」,「*」,
「計」,「預」,「釣」等の金額に関する文字以降の文
字列は、「金額項目」である場合がほとんどであるの
で、「¥」,「*」,「計」,「預」,「釣」等の金額
に関する文字以降の文字列の認識結果である第1位文字
候補の中に数字以外の文字が存在していた場合は、下位
の文字候補のうち第1位に近い文字候補から数字の文字
候補を探し出してそれを第1位の文字候補と置換するも
のである。例えばアルファベットの「l」は数字の
「1」に、アルファベットの「O」は数字の「0」に置
換する。
【0026】また、金額チェック処理では、項目理解処
理で理解した項目情報に基づいて認識部5による認識結
果のうち金額間の整合性の有無を判定するものである。
【0027】そして、項目理解部6は、項目理解処理で
理解した項目情報を認識部4からの認識情報に付加する
とともに、金額チェック処理で整合性が無いと判定した
場合は、金額エラー情報をも付加して、出力バッファ7
に出力するようになっている。なお、必要であれば、イ
メージも出力バッファ7に出力するようにしてもよい。
これにより、出力バッファ7から外部装置にデータを転
送する場合に、外部装置側でイメージと認識結果の照合
が行え、誤読等があった場合にその修正が容易となる。
【0028】次に、本実施例の動作を図2乃至図5をも
参照し、図6のフローチャートに従って説明する。図2
は領収書8の一例を示す図であり、この動作説明では本
実施例装置が図2に示す領収書7を読み取るものとす
る。同図に示す領収書8の上部には、「御計算書」80
が押印され、左側には、「94−07−19」の「日付
項目」81,「ライス」,「ミソシル」等の物品名を示
す「取引対象名項目」82,「小計項目」83,「外税
計項目」84,「合計項目」85,「預項目」86,
「釣項目」87,「その他の項目」88等の各項目が印
字されており、右側には、「その他の項目」88,「金
額項目」89等の各項目が印字されている。図3は図2
の領収書8のイメージを示す図である。図4及び図5は
本実施例の方向判別処理を説明するための図であり、図
4は正方向の行イメージを示す図、図5は逆方向の行イ
メージを示す図である。
【0029】まず、イメージ検出部1は、図2に示す領
収書8全体を光学的に走査して図3に示す領収書8のイ
メージを検出してイメージバッファ2に格納する(S
1)。
【0030】次に、認識部4は、行イメージ候補抽出処
理を行う(S2)。すなわち、認識部4は、イメージバ
ッファ2に格納された領収書8のイメージから縦方向及
び横方向の射影を検出し、その射影に基づいて、ラベリ
ングを行いながら複数の読取フィールドA,B,C,
D,E,F,G,H,I,J,K,L,M,N,Oを設
定し、さらに、ラベリングを行いながら上下方向で一部
重なっているか又は上下方向の間隔が所定値以下の複数
の読取フィールドの組合せからなる読取フィールドE
F,FG,GH,IJ,JK,LM,MN,NOを設定
し、領収書8のイメージから読取フィールドA,B,
C,D,E,F,G,H,I,J,K,L,M,N,
O,EF,FG,GH,IJ,JK,LM,MN,NO
に対応する行イメージ候補を抽出する。
【0031】続いて、認識部4は、正しい方向の判別を
行う(S3)。すなわち、認識部4は、候補として正し
そうな行イメージ、例えば上下方向の間隔が所定値以上
の読取フィールドDに対応する行イメージを選択し、そ
の行イメージ「94−07−19NO0005」から射影
検出により「9」,「4」,「−」,「0」,「7」,
「−」,「1」,「9」,「NO」「0」,「0」,
「0」,「5」の如く1文字毎に文字パターンを切り出
し、図4に示すように領収書8のイメージを検出した際
の方向(正方向)のままで文字パターンと認識辞書とを
照合して類似度値を演算して求め、その類似度値を点数
に換算して、最も点数の高い第1位文字候補から順に第
n位文字候補まで複数の文字候補を選択して文字の認識
結果(文字コード)を得る。また、図5に示すように同
一の行イメージを180度回転した方向(逆方向)につ
いても同様に文字の認識を行い、類似度値を求める。次
に、各正方向及び逆方向毎に類似度値の合計を文字数で
割った平均類似度値を求める。図4に示す正方向の場合
の各文字の類似度値が、それぞれ「82」,「78」,
「91」,「80」,「78」,「90」,「95」,
「80」,「70」,「80」,「81」,「82」,
「75」とすると、類似度値の総和は「1062」とな
るので、平均類似度値は、その総和「1062」を文字
数(13)で割って「81」となる。図6に示す逆方向
の場合も同様に平均類似度値を求めて、「60」が得ら
れたとする。ここで、認識部4は、両平均類似度値のう
ち一定の閾値(例えば75)を越えたか否かにより正し
い方向を判別する。図4の場合のみ平均類似度値が閾値
を越えているので、図4に示す方向(正方向)が正しい
方向と判別する。なお、両方向とも閾値を越えない場合
は、残りの行イメージ候補から次に正しそうな行イメー
ジを決め、それについて方向判別処理を繰り返す。
【0032】そして、認識部4は、方向判別処理で判別
された正しい方向について全ての読取フィールドA,
B,C,D,E,F,G,H,I,J,K,L,M,
N,O,EF,FG,GH,IJ,JK,LM,MN,
NOに対応する行イメージ候補について方向判別処理で
行ったのと同様に文字の認識処理を行い、認識結果を得
るとともに平均類似度値を算出する(S4)。なお、読
取フィールドDに対応する行イメージついては、文字の
認識処理を行わずに方向判別処理の際に行った認識結果
を用いる。
【0033】次に、認識部4は、正しい行イメージを決
定する(S5)。すなわち、例えば、読取フィールドE
Fの平均類似度値が「45」、読取フィールドEの平均
類似度値が「80」、読取フィールドFの平均類似度値
が「90」とすると、平均類似度値が閾値(例えば7
5)を越えた読取フィールドE、読取フィールドFを候
補として残し、越えていない読取フィールドEFを候補
から除外する。このようにして、読取フィールドFG,
GH,IJ,JK,LM,MN,NOも候補から除外し
て最終的に読取フィールドA,B,C,D,E,F,
G,H,I,J,K,L,M,N,Oを確定する。
【0034】続いて、項目理解部6は、項目理解処理を
行う(S6)。すなわち、項目理解部6は、認識部4に
より確定された読取フィールドA,B,C,D,E,
F,G,H,I,J,K,L,M,N,Oに対応する行
イメージについて得られた読取結果である文字列を単語
単位に分割して単語辞書を照合し、文字列毎に項目を理
解する。図2に示す領収書8の場合は、「94−07−
19」の文字列に対しては「日付項目」81、「NO00
05」の文字列に対しては「その他の項目」88、「ラ
イス」,「ミソシル」,「シュサイA」,「コバチA」
の文字列に対しては「取引対象名項目」82、「小計」
の文字列に対しては「小計項目」83、「外税計」の文
字列に対しては「外税計項目」84、「合計」の文字列
に対しては「合計項目」85、「預」の単語に対しては
「預項目」86、「釣」の単語に対しては「釣項目」8
7、「¥80」,「¥30」,「¥250」,「¥7
0」,「¥430」,「¥13」,「¥443」,「¥
1000」,「¥557」の文字列に対しては「金額項
目」89の如く各項目を理解する。また、項目理解部6
は、「¥」,「*」,「計」,「預」,「釣」等の金額
に関する文字以降の文字列の認識結果である第1位文字
候補の中に数字以外の文字が存在しているか否かを調
べ、数字以外の文字が存在していた場合は、下位の文字
候補のうち第1位に近い文字候補から数字の文字候補を
探し出してそれを第1位の文字候補と置換する。
【0035】次に、項目理解部6は、金額チェック処理
を行う(S7)。すなわち、項目理解部6は、「取引対
象名項目」82に対応する「金額項目」89の「¥8
0」,「¥30」,「¥250」,「¥70」を合計し
て小計金額(430)を求め、その小計金額(430)
が「小計金額項目」83に対応する「金額項目」89の
「¥430」と一致するか否かを判定する。また、項目
理解部6は、「小計金額」項目83に対応する「金額項
目」89の金額「¥430」と「外税計項目」84に対
応する「金額項目」89の「¥13」とを合計して合計
金額(443)を求め、その合計金額(443)が「合
計項目」85に対応する「金額項目」89の「¥44
3」と一致するか否かを判定する。また、「預項目」8
6に対応する金額「1000」と「預」項目86に対応
する金額「557」との差額「443」を求め、その差
額「443」が「合計」項目85に対応する「金額項
目」89の「¥443」と一致するか否かを判定する。
項目理解部6は、項目理解処理で理解した項目情報を認
識部4からの認識情報に付加するとともに、これらの判
定結果で一致しない場合は、金額エラー情報をも付加し
て、出力バッファ7に出力する。なお、この金額エラー
情報は、対応する読取フィールドの属性として付加す
る。
【0036】このような本実施例によれば、読取フィー
ルドを自動判別しているので、FCデータを必要とせず
に、種々な形式の領収書から領収情報を読み取ることが
できる。また、出力バッファ7への出力データには各文
字列がどの項目かを示す項目情報が含まれているので、
項目毎に認識結果の利用が可能となる。また、正方向及
び逆方向のいずれの方向で領収書を走査しても、正しい
方向を判別するようにしているので、認識率の高い認識
結果を得ることができる。さらに、認識結果のうち金額
について整合性をチェックしているので、信頼性の高い
金額の認識結果を得ることができる。また、出力バッフ
ァ7への出力データをさらにパーソナルコンピュータや
ワープロ等の外部装置に転送し、外部装置にて項目情報
等を検索キーとして認識結果を自由に読み出して家計簿
等を作成する際の手間を少しでも省けるようにしたり、
自動的に家計簿等を作成するようにしてもよい。このよ
うな構成とすることにより、家庭等の個人レベルの収支
決算の補助OA機器として利用することができる。
【0037】
【発明の効果】以上詳述した本発明によれば、以下の効
果を奏する。
【0038】請求項1記載の発明によれば、読取フィー
ルドを自動判別しているので、FCデータ無しで各種領
収書から領収情報を読み取ることができ、各文字列がど
の項目かを示す項目情報を理解しているので、項目毎に
認識結果の利用が可能となる。
【0039】請求項2記載の発明によれば、請求項1記
載と同様の効果を奏するとともに、正方向及び逆方向の
いずれの方向で領収書を走査しても、正しい方向を判別
するようにしているので、認識率の高い認識結果を得る
ことができる。
【0040】請求項3記載の発明によれば、請求項1記
載と同様の効果を奏するとともに、行イメージ候補毎の
評価値に基づいて正しい行イメージを決定して読取フィ
ールドを自動判別しているので、FCデータ無しでより
多種類の領収書から領収情報を読み取ることができる。
【0041】請求項4記載の発明によれば、請求項1,
2又は3記載と同様の効果を奏するとともに、認識結果
のうち金額について整合性をチェックしているので、信
頼性の高い金額の認識結果を得ることができる。
【図面の簡単な説明】
【図1】本実施例のブロック図
【図2】領収書の一例を示す図
【図3】図2の領収書のイメージを示す図
【図4】本実施例の方向判別処理を説明するための図
【図5】本実施例の方向判別処理を説明するための図
【図6】本実施例の動作を示すフローチャート
【符号の説明】
1 イメージ検出部 2 イメージバッファ 3 認識辞書部 4 認識部 5 単語辞書部 6 項目理解部 7 出力バッファ 8 領収書 81乃至89 項目

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 各種領収書に記入された複数の文字列を
    光学的に読み取る領収書読取装置であって、前記領収書
    のイメージを検出するイメージ検出手段と、検出された
    領収書のイメージから射影を検出し、その射影に基づい
    て行イメージを切り出す行イメージ切出し手段と、切り
    出された行イメージから文字パターンを切り出す文字パ
    ターン切出し手段と、切り出された文字パターンと認識
    辞書とを照合して領収書に記入された文字の認識結果を
    得る文字認識手段と、前記認識結果と単語辞書とを照合
    して各文字列毎に項目を理解する項目理解手段と、前記
    認識結果に前記理解された項目情報を付加して出力する
    出力手段とを有することを特徴とする領収書読取装置。
  2. 【請求項2】 各種領収書に記入された複数の文字列を
    光学的に読み取る領収書読取装置であって、前記領収書
    のイメージを検出するイメージ検出手段と、検出された
    領収書のイメージから射影を検出し、その射影に基づい
    て行イメージを切り出す行イメージ切出し手段と、切り
    出された行イメージから文字パターンを切り出す文字パ
    ターン切出し手段と、切り出された文字パターンと認識
    辞書とを正逆両方向について照合して文字の認識結果を
    得る文字認識手段と、前記認識結果に基づいて正しい方
    向を判別する方向判別手段と、正しい方向について得ら
    れた文字の認識結果と単語辞書とを照合して各文字列毎
    に項目を理解する項目理解手段と、正しい方向について
    得られた認識結果に前記理解された項目情報を付加して
    出力する出力手段とを有することを特徴とする領収書読
    取装置。
  3. 【請求項3】 各種領収書に記入された複数の文字列を
    光学的に読み取る領収書読取装置であって、前記領収書
    のイメージを検出するイメージ検出手段と、検出された
    領収書のイメージから射影を検出し、その射影に基づい
    て複数の行イメージ候補を切り出す行イメージ切出し手
    段と、切り出された複数の行イメージ候補から文字パタ
    ーンを切り出す文字パターン切出し手段と、切り出され
    た文字パターンと認識辞書とを照合して領収書に記入さ
    れた文字の認識結果を得るとともに、前記照合結果を示
    す評価値を求め、行イメージ候補毎の評価値に基づいて
    正しい行イメージを決定する文字認識手段と、前記正し
    い行イメージについて得られた認識結果と単語辞書とを
    照合して各文字列毎に項目を理解する項目理解手段と、
    前記正しい行イメージについて得られた認識結果に前記
    理解された項目情報を付加して出力する出力手段とを有
    することを特徴とする領収書読取装置。
  4. 【請求項4】 理解された項目情報に基づいて前記認識
    結果のうち金額間の整合性の有無を判定する金額判定手
    段を備え、前記出力手段は、前記整合性の有無の判定結
    果をも出力することを特徴とする請求項1,2又は3記
    載の領収書読取装置。
JP6302411A 1994-12-06 1994-12-06 領収書読取装置 Pending JPH08161436A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6302411A JPH08161436A (ja) 1994-12-06 1994-12-06 領収書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6302411A JPH08161436A (ja) 1994-12-06 1994-12-06 領収書読取装置

Publications (1)

Publication Number Publication Date
JPH08161436A true JPH08161436A (ja) 1996-06-21

Family

ID=17908601

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6302411A Pending JPH08161436A (ja) 1994-12-06 1994-12-06 領収書読取装置

Country Status (1)

Country Link
JP (1) JPH08161436A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11272794A (ja) * 1998-03-24 1999-10-08 Sanyo Electric Co Ltd レシートデータ処理装置
JP2001325562A (ja) * 2000-05-17 2001-11-22 Minolta Co Ltd 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2005326972A (ja) * 2004-05-12 2005-11-24 Sun Corp 購入情報管理装置
JP2006511896A (ja) * 2002-10-21 2006-04-06 スペロ,ラファエル 領収書および関連データの取り入れ、記憶および処理のシステムならびに方法
JP2012027524A (ja) * 2010-07-20 2012-02-09 Sharp Corp 画像処理装置、画像処理方法およびそのプログラム
JP2012194862A (ja) * 2011-03-17 2012-10-11 Fujitsu Ltd 情報処理装置、プログラム、およびデータの抽出方法
JP2014041442A (ja) * 2012-08-22 2014-03-06 Fujitsu Marketing Ltd レシート定義データ作成装置およびプログラム
JP2015118488A (ja) * 2013-12-17 2015-06-25 株式会社日本デジタル研究所 会計データ入力システム、方法、およびプログラム
JP2015138396A (ja) * 2014-01-22 2015-07-30 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
WO2018003153A1 (ja) * 2016-06-30 2018-01-04 株式会社日立ソリューションズ 認識装置及び認識方法
KR20190089334A (ko) * 2018-01-22 2019-07-31 숭실대학교산학협력단 광학문자인식 기반 전자 가계부 관리 시스템 및 방법, 이를 수행하기 위한 기록매체
EP3541057A1 (en) 2018-03-14 2019-09-18 Seiko Epson Corporation Scan apparatus and scan result display program

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11272794A (ja) * 1998-03-24 1999-10-08 Sanyo Electric Co Ltd レシートデータ処理装置
JP2001325562A (ja) * 2000-05-17 2001-11-22 Minolta Co Ltd 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
USRE47309E1 (en) 2002-10-21 2019-03-19 The Neat Company, Inc. System and method for capture, storage and processing of receipts and related data
JP2006511896A (ja) * 2002-10-21 2006-04-06 スペロ,ラファエル 領収書および関連データの取り入れ、記憶および処理のシステムならびに方法
JP2005326972A (ja) * 2004-05-12 2005-11-24 Sun Corp 購入情報管理装置
JP2012027524A (ja) * 2010-07-20 2012-02-09 Sharp Corp 画像処理装置、画像処理方法およびそのプログラム
JP2012194862A (ja) * 2011-03-17 2012-10-11 Fujitsu Ltd 情報処理装置、プログラム、およびデータの抽出方法
JP2014041442A (ja) * 2012-08-22 2014-03-06 Fujitsu Marketing Ltd レシート定義データ作成装置およびプログラム
JP2015118488A (ja) * 2013-12-17 2015-06-25 株式会社日本デジタル研究所 会計データ入力システム、方法、およびプログラム
JP2015138396A (ja) * 2014-01-22 2015-07-30 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
WO2018003153A1 (ja) * 2016-06-30 2018-01-04 株式会社日立ソリューションズ 認識装置及び認識方法
KR20190089334A (ko) * 2018-01-22 2019-07-31 숭실대학교산학협력단 광학문자인식 기반 전자 가계부 관리 시스템 및 방법, 이를 수행하기 위한 기록매체
EP3541057A1 (en) 2018-03-14 2019-09-18 Seiko Epson Corporation Scan apparatus and scan result display program
US11288500B2 (en) 2018-03-14 2022-03-29 Seiko Epson Corporation Scan apparatus and scan result display program

Similar Documents

Publication Publication Date Title
JP3689455B2 (ja) 情報処理方法及び装置
US6345119B1 (en) Handwritten character recognition apparatus and method using a clustering algorithm
US7801392B2 (en) Image search system, image search method, and storage medium
JP2734386B2 (ja) 文字列読み取り装置
JP3452774B2 (ja) 文字認識方法
JPH08161436A (ja) 領収書読取装置
JP2003524258A (ja) 電子ドキュメントを処理する方法および装置
US11615244B2 (en) Data extraction and ordering based on document layout analysis
US5909509A (en) Statistical-based recognition of similar characters
CN113269101A (zh) 一种票据识别方法、装置和设备
JP4356908B2 (ja) 財務諸表自動入力装置
Shtok et al. CHARTER: heatmap-based multi-type chart data extraction
Blomqvist et al. Reading the ransom: Methodological advancements in extracting the swedish wealth tax of 1571
JP3243000B2 (ja) 郵便物処理装置および郵便物処理方法
JP2001344427A (ja) 払込帳票判別方法及びその装置
JP2998054B2 (ja) 文字認識方法及び文字認識装置
JPH05314320A (ja) 認識距離の差と候補順を利用した認識結果の評価方式
JP2002183667A (ja) 文字認識装置及び記録媒体
JP7421384B2 (ja) 情報処理装置、修正候補表示方法、及びプログラム
Blomqvist et al. Joint handwritten text recognition and word classification for tabular information extraction
Sporleder et al. Spotting the ‘odd-one-out’: Data-driven error detection and correction in textual databases
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
JP2006252575A (ja) 財務諸表自動入力装置及び財務諸表自動入力方法
JP3648270B2 (ja) 帳票類読取装置及び会計帳票読取装置