JP2011090418A - 帳票読取装置およびプログラム - Google Patents
帳票読取装置およびプログラム Download PDFInfo
- Publication number
- JP2011090418A JP2011090418A JP2009241996A JP2009241996A JP2011090418A JP 2011090418 A JP2011090418 A JP 2011090418A JP 2009241996 A JP2009241996 A JP 2009241996A JP 2009241996 A JP2009241996 A JP 2009241996A JP 2011090418 A JP2011090418 A JP 2011090418A
- Authority
- JP
- Japan
- Prior art keywords
- reading
- show
- definition
- image
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
提供することを目的とする。
【解決手段】本発明の帳票読取装置1は、帳票2の表面と裏面の画像を読み取り、別々に
イメージデータに変換する画像取得手段3と、このイメージデータで認識の対象となる領
域の座標を読取定義として帳票の種類毎に記憶するデータ記憶手段11と、読取定義にも
とづき、領域の重複があるかを検出する裏写り検出手段7と、帳票2に記入後の表面の画
像を、画像取得手段3で読み取って変換したイメージデータについて、読取定義にもとづ
いて帳票2の種類を特定し、裏写り検出手段7の検出結果に領域の重複があるかを判定す
る判定手段13と、重複があると判定された領域に対して裏写り除去を行う裏写り除去手
段8と、この結果得られた表面の画像のイメージデータについて、読取定義にもとづき文
字認識を行う文字認識手段9とを備えている。
【選択図】図1
Description
グラムに関する。
な部分を人手によるキーパンチなどで補うシステムが増えている。また薄紙を扱う場面も
多くなってきており、裏面に記入された内容や押印された印影などが裏写りしている場合
には、文字認識にノイズ等として悪影響を与える。
、
裏面の鏡像画像を生成し、画素の濃度を比較することで裏写り画像データを判別する方法
がある(例えば、特許文献1参照)。
処理である。さらに従来はノイズ除去手法を用いて、ノイズのないきれいな画像の取得を
目的として鏡像を生成していたため処理時間が余分にかかり、処理の高速化の妨げとなる
問題があった。
けて高速に表面の文字認識ができる帳票読取装置およびプログラムを提供することを目的
とする。
帳票の表面と裏面の画像を読み取り、前記表面と裏面の画像をそれぞれ別々にイメージ
データに変換する画像取得手段と、
このイメージデータで認識の対象となる領域の座標を読取定義として前記帳票の種類毎に
記憶するデータ記憶手段と、
このデータ記憶手段に記憶された前記帳票の表面と裏面の前記読取定義にもとづいて、前
記領域の重複があるかを検出する裏写り検出手段と、
前記帳票に記入を施した後の表面の画像を、前記画像取得手段で読み取って変換したイメ
ージデータについて、前記データ記憶手段に記憶された読取定義にもとづいて、前記帳票
の種類を特定し、前記裏写り検出手段の検出結果に前記領域の重複があるかを判定する判
定手段と、
この判定手段による判定の結果、重複があると判定された前記領域に対して裏写り除去を
行う裏写り除去手段と、
この裏写り除去手段による裏写り除去の結果得られた前記表面の画像のイメージデータに
ついて、前記読取定義にもとづいて文字認識を行う文字認識手段と
を備えることを特徴とする。
読取装置を提供することができる。
本発明の帳票読取装置の構成例を図1に示す。同図に示すように、本実施形態に係る帳
票読取装置1は、認識の対象となる領域が予め表裏両面にプレプリントされた帳票2を処
理可能な帳票読取装置であって、この帳票2の表面および裏面の画像を読み取り、前記表
面の画像および裏面の画像をそれぞれ別のイメージデータに変換する画像取得手段3と、
この画像取得手段3が接続されるホスト装置4とで構成される。
、表面に文字記入欄41が4ヶ所とプレプリント文字列43、裏面には押印欄42が1ヶ
所とプレプリント文字列43が設けられた薄紙である。また、表面の文字記入欄41dと
裏面の押印欄42に重複部分が存在している。
示している。
ている。
入欄41cと裏面のプレプリント文字列43および、文字記入欄41dと裏面の押印欄4
2とに重複部分があることを示している。
のプレプリント文字列および裏面に押印した印影が裏写りしていることを示している。
ことを示している。
をスキャンして表面と裏面それぞれの画像を取得し、イメージデータに変換する手段であ
る。本実施例では、読取定義の時に表・裏の両面について、それぞれカラー画像を取得し
、後の処理で裏写り定義に利用する。
力手段5、フォーム解析手段6、裏写り検出手段7、裏写り除去手段8、文字認識手段9
、辞書10、データ記憶手段11、メモリ12及びこれら各部を統括的に制御する制御手
段13を備える。
段8、文字認識手段9などを含む各構成部分は、例えばハードディスク装置を用いた外部
記憶装置、CPU及びメインメモリなどのハードウェア、上記外部記憶装置などにインス
トールされたオペレーティングシステム、並びに制御ソフトウェアなどが協働して実現さ
れている。
部記憶装置に構築された例えばデータベースなどである。さらに外部記憶装置又はメイン
メモリには、CPUによって実行される手書き入力のために必要なプログラムや各種のデ
ータテーブルなどが格納されている。
制御手段13の制御にもとづいて受信し、メモリ12に記憶する。
析手段6bとを備えている。
より読取エリアを抽出し、帳票上の座標位置を定義する。
名、読取座標定義、読取文字定義で表される。読取座標定義は、当該エリアの帳票2上の
位置を示すX・Y座標で表される。読取文字定義は、当該読取エリアで読み取る文字タイ
プ、文字ピッチ、文字幅、文字高さ、桁数で表される。プレプリント文字列を読み取って
定義されるようにしてもよいし、ユーザが指定するようにしても良い。
技術を用いてプレプリント文字列の領域を検出する。また、読取定義用フォーム解析手段
6aと同様に表形式画像を解析して、記入領域を抽出する。さらに、これら2種類の領域
(プレプリント文字列領域と記入領域)について、帳票の伸び縮みを考慮して各々座標軸
を帳票画像の内分点として保持する。
32は、図に示すように読取エリア名、裏写り座標定義、RGB色定義、読取タイプで表
される。裏写り座標定義は、当該エリアの帳票2上の位置を示すX・Y座標で表される。
RGB色定義は、赤青緑の最大値と最小値で表される。読取タイプはC(文字列)、L(
線分)、S(印影)のうち、1つまたは幾つかの組合せで表される。
座標:(x0,x1)―(y0,y1)=(202,156)−(245,199)
、
色:RGB(200,0,0)―(255,50,50)、
読取タイプ:CLS(文字列/線分/印影)
であることが示されている。
ようにしてもよいし、ユーザが指定するようにしても良い。
の読取精度の向上を図ることが可能である。
領域または記入領域に重複があるかを検出する。
とづいて読取エリアの裏写りを除去する。
の情報収集を行うため、ノイズ除去対象領域やノイズ除去手法を制限し、より高速にノイ
ズ除去を行うことが可能となる。結果的に高速かつ高精度な帳票読取を実現することがで
きる。
ようなノイズなのか不明なため、全方式でノイズ除去する必要があり時間がかかっていた
。
影をノイズ除去する。ここで、裏写り定義用フォーム解析手段での裏写り定義処理で印影
の色や分布が予めわかっているので、方式を制限して印影ノイズ除去することが可能とな
る。また、帳票全体に対してノイズ除去処理をしないので、従来の方法より高速に処理す
ることが可能になる。
使うが、帳票読取時には表面(図3(d)参照)のみをスキャンすればよく、裏面(図3
(e)参照)のスキャンは不要なため、メモリの使用量も少なく、処理自体も高速となる
。
。
字コード(テキストデータ)とが保存されている。
と裏写り定義32が記憶される。
識してこれにマッチングしたテキストデータとがそれぞれ対応付けられて記憶される。
段13は読取処理実行時に、データ入力手段5、文字認識手段9、データ記憶手段11、
メモリ12を制御し、文字記入欄41の枠内を文字認識範囲として認識するとともに、
文字記入欄41内の一文字毎のイメージの切り出し処理などの画像処理や、切り出した
イメージの文字認識処理を文字認識部9を介して実行する。なお文字記入欄41や、押印
欄42の枠線自体は、文字読取の処理対象から除外される。
図1に示す文字読取装置1の処理の概要を、図2を用いて説明する。文字読取装置1の
処理は、事前準備のための未記入の帳票を用いた読取定義処理と、記入後の帳票を読み取
って文字認識をする読取処理からなる。
ぞれ読み取る。表面画像はフォーム解析手段6で読取定義31を作成し、裏面画像は裏写
り定義処理をして、読取定義31と裏写り定義32をデータ記憶手段11に記憶する。
、データ記憶手段11に記憶されたこのフォーマットの読取定義31を参照し、裏写り定
義があれば、裏写りを除去した後に文字認識を実行する。
図2に示す帳票読取装置1の読取定義処理を、図5(a)のフローチャートを用いて説
明する。本発明において、読取定義作成時に入力される帳票は、記入前のプレプリントさ
れた帳票を用いる。
4で読み取られ、イメージデータに変換される(S401)。
、データ入力手段5でイメージデータを受信し、メモリ12に記憶する(S402)。
像のイメージデータにもとづいて、読取定義を作成し、データ記憶手段11で記憶する。
(S403)。
405)。
裏写り定義処理を図5(b)のフローチャートを用いて説明する。
位置情報を表面座標から裏面座標に変換する(S411)。
する(S412)。検出があった場合は、S413に進む。検出がなかった場合はS41
4に進む。
(S413)。
414)。検出があった場合は、S415に進む。検出がなかった場合はS416に進む
。
415)。
位置情報を裏面座標から表面座標へ変換する(S416)。
図2に示す帳票読取装置1の読取処理を図6(a)のフローチャートを用いて説明する
。なお、読取時には表面のみのスキャンでよい。
タに変換される(S501)。
、データ入力手段5でイメージデータを受信し、メモリ12に記憶する(S502)。
ジデータについて帳票フォームを特定して読取定義領域を抽出する。(S503)
(4)制御手段13の制御により、データ記憶手段11に記憶された読取定義を参照し、
裏写り定義があるか判定する(S504)。
505)。
裏写り除去処理を図6(b)のフローチャートを用いて説明する。
取エリアのプレプリント枠を除去する(S511)。
る(S512)。
が抽出された場合には、読取手段で赤い丸を検出し、ノイズ除去手段で赤い丸をノイズと
して除去し、文字認識の精度を高めることで認識できずに「?」となる結果を減らすこと
が可能となる。或いは誤読を避けるために積極的に文字を棄却し確実に認識できない文字
は「?」とし、修正時に例えば「?」を文字認識できた文字とは別の色にする等して警告
を提示することが可能となる。
2・・・帳票
3・・・画像取得手段
3a・・・表面画像取得手段
3b・・・裏面画像取得手段
4・・・ホスト装置
5・・・データ入力手段
6・・・フォーム解析手段
6a・・・読取定義用フォーム解析手段
6b・・・裏写り定義用フォーム解析手段
7・・・裏写り検出手段
8・・・裏写り除去手段
9・・・文字認識手段
10・・・辞書
11・・・データ記憶手段
12・・・メモリ
13・・・制御手段
31・・・読取定義
32・・・裏写り定義
41・・・文字記入欄
42・・・押印欄
43・・・プレプリント文字列
Claims (3)
- 帳票の表面と裏面の画像を読み取り、前記表面と裏面の画像をそれぞれ別々にイメージ
データに変換する画像取得手段と、
このイメージデータで認識の対象となる領域の座標を読取定義として前記帳票の種類毎に
記憶するデータ記憶手段と、
このデータ記憶手段に記憶された前記帳票の表面と裏面の前記読取定義にもとづいて、前
記領域の重複があるかを検出する裏写り検出手段と、
前記帳票に記入を施した後の表面の画像を、前記画像取得手段で読み取って変換したイメ
ージデータについて、前記データ記憶手段に記憶された読取定義にもとづいて、前記帳票
の種類を特定し、前記裏写り検出手段の検出結果に前記領域の重複があるかを判定する判
定手段と、
この判定手段による判定の結果、重複があると判定された前記領域に対して裏写り除去を
行う裏写り除去手段と、
この裏写り除去手段による裏写り除去の結果得られた前記表面の画像のイメージデータに
ついて、前記読取定義にもとづいて文字認識を行う文字認識手段と
を備えたことを特徴とする帳票読取装置。 - 前記文字認識手段での文字認識の結果、裏写りの可能性がある場合に警告する表示手段
をさらに備えたことを特徴とする請求項1に記載の帳票読取装置。 - 帳票読取装置において、
帳票の表面と裏面の画像を読み取り、前記表面と裏面の画像をそれぞれ別々にイメージデ
ータに変換する機能と、
このイメージデータで認識の対象となる領域の座標を読取定義として前記帳票の種類毎に
記憶する機能と、
この記憶された前記帳票の表面と裏面の読取定義にもとづいて、前記領域の重複があるか
を検出する機能と、
前記帳票に記入を施した後の表面の画像を変換したイメージデータについて、前記読取定
義にもとづいて、前記帳票の種類を特定し、前記検出の結果に前記領域の重複があるかを
判定する機能と、
この判定の結果、重複があると判定された前記領域に対して裏写り除去を行う機能と、
この裏写り除去の結果得られた前記表面の画像のイメージデータについて、前記読取定義
にもとづいて文字認識を行う機能と
を実現させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009241996A JP2011090418A (ja) | 2009-10-21 | 2009-10-21 | 帳票読取装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009241996A JP2011090418A (ja) | 2009-10-21 | 2009-10-21 | 帳票読取装置およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011090418A true JP2011090418A (ja) | 2011-05-06 |
Family
ID=44108632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009241996A Pending JP2011090418A (ja) | 2009-10-21 | 2009-10-21 | 帳票読取装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011090418A (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61281379A (ja) * | 1985-06-06 | 1986-12-11 | Sumitomo Electric Ind Ltd | 位置警告機能付ocr |
JPH0620088A (ja) * | 1992-07-06 | 1994-01-28 | Fujitsu Ltd | 光学式文字読取装置および文字認識方法 |
JPH0637974A (ja) * | 1992-07-21 | 1994-02-10 | Canon Inc | 画像記録装置 |
JPH07182443A (ja) * | 1993-12-22 | 1995-07-21 | Toshiba Corp | 光学的文字読取装置 |
JP2006215964A (ja) * | 2005-02-07 | 2006-08-17 | Toshiba Corp | 文字認識装置 |
JP2009116520A (ja) * | 2007-11-05 | 2009-05-28 | Oki Electric Ind Co Ltd | 画像認識装置、画像認識方法及びプログラム |
-
2009
- 2009-10-21 JP JP2009241996A patent/JP2011090418A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61281379A (ja) * | 1985-06-06 | 1986-12-11 | Sumitomo Electric Ind Ltd | 位置警告機能付ocr |
JPH0620088A (ja) * | 1992-07-06 | 1994-01-28 | Fujitsu Ltd | 光学式文字読取装置および文字認識方法 |
JPH0637974A (ja) * | 1992-07-21 | 1994-02-10 | Canon Inc | 画像記録装置 |
JPH07182443A (ja) * | 1993-12-22 | 1995-07-21 | Toshiba Corp | 光学的文字読取装置 |
JP2006215964A (ja) * | 2005-02-07 | 2006-08-17 | Toshiba Corp | 文字認識装置 |
JP2009116520A (ja) * | 2007-11-05 | 2009-05-28 | Oki Electric Ind Co Ltd | 画像認識装置、画像認識方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2014071698A (ja) | 画像処理装置および画像処理方法 | |
CN103136527B (zh) | 图像处理设备及方法 | |
TW200842734A (en) | Image processing program and image processing device | |
US20130077856A1 (en) | Processes and systems for training machine typesets for character recognition | |
JP7433887B2 (ja) | 画像を処理するための装置、プログラム、画像処理方法 | |
JP2008011484A (ja) | 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体 | |
JP4565396B2 (ja) | 画像処理装置および画像処理プログラム | |
JP2005266907A (ja) | バーコード検出切り出し方法及びその装置、並びにプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
JP3728224B2 (ja) | 文書処理装置及び方法 | |
JP2007072642A (ja) | 画像処理装置および画像処理装置の制御方法 | |
US20200311478A1 (en) | Optical character recognition systems and methods | |
JP5601027B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2007041832A (ja) | 差分画像抽出装置 | |
JP5483467B2 (ja) | 帳票読取装置、角印検出方法、および、角印検出プログラム | |
JP4867894B2 (ja) | 画像認識装置、画像認識方法及びプログラム | |
JP4798296B1 (ja) | 帳票 | |
JP2011090418A (ja) | 帳票読取装置およびプログラム | |
JP4492258B2 (ja) | 文字・図形の認識方法および検査方法 | |
CN117475453B (zh) | 一种基于ocr的文书检测方法、装置及电子设备 | |
JP2005071134A (ja) | 光学的文字読取装置 | |
Gayashan et al. | Old Sinhala newspaper article segmentation for content recognition using image processing | |
JP5035443B2 (ja) | 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム | |
JP4810995B2 (ja) | 画像処理装置、方法及びプログラム | |
CA2848120A1 (en) | Processes and systems for optical character recognition using generated font templates | |
Bagoriya et al. | Font type identification of hindi printed document |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111028 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111128 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111206 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120228 |