JP5483467B2 - 帳票読取装置、角印検出方法、および、角印検出プログラム - Google Patents
帳票読取装置、角印検出方法、および、角印検出プログラム Download PDFInfo
- Publication number
- JP5483467B2 JP5483467B2 JP2011102224A JP2011102224A JP5483467B2 JP 5483467 B2 JP5483467 B2 JP 5483467B2 JP 2011102224 A JP2011102224 A JP 2011102224A JP 2011102224 A JP2011102224 A JP 2011102224A JP 5483467 B2 JP5483467 B2 JP 5483467B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- ruled line
- square mark
- image
- mark detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title claims description 51
- 230000006870 function Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 description 31
- 238000010586 diagram Methods 0.000 description 8
- 230000002093 peripheral effect Effects 0.000 description 2
- 244000205754 Colocasia esculenta Species 0.000 description 1
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Collating Specific Patterns (AREA)
- Image Input (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
また、特許文献2では、角印の周辺を取り囲む枠と罫線とでは、線の太さが違い、ヒストグラム上に違いが生じることを利用し、角印の検出を行っている。
角印の文字は複数文字ある場合が多く、偽造を容易に行わせない等の要請から、その角印の文字においては、文字と文字の間の境界が明確でなくつながっていることが多い。このため、実在する角印のほとんどは、文字を複数文字有する場合でも、角印の複数文字全体として未登録の1文字候補として認識されることが多い。
この帳票読取装置は、帳票を読み取る帳票読取部11と、読み取った帳票に対するイメージ画像(以下、「帳票画像」という)から角印を含む画像部分を切り出して処理対象イメージ画像として取得する処理対象イメージ取得部12と、処理対象イメージ画像上の罫線を罫線情報DB21に格納する罫線情報格納部13と、各罫線の情報が格納された後に起動され、処理対象イメージ画像上の罫線を除去する罫線除去部14と、処理対象イメージ画像に対し、文字認識を行ない、文字認識結果を文字認識結果DB22に出力する文字認識部15と、円印の検出を行う円印検出部16と、角印の検出を行う角印検出部17と、検出された角印(円印)などを表示するイメージ表示部18と、帳票画像や、その帳票画像中で検出された角印(円印)などのイメージデータを帳票DB23に格納する処理を行う帳票画像格納部19と、を有する。なお、DBアクセス制御部20は、各DB(罫線情報DB21、文字認識結果DB22、帳票DB23)に対するデータの読み書きを制御する汎用インターフェイスである。
図2Aの(1)で、処理対象イメージ取得部12は、帳票画像から角印を含むイメージ領域を処理対象イメージ画像として切り出す。
続く、(4)で、文字認識部15は、処理対象イメージ画像に対し、文字認識を行ない、文字らしき画素(ドット)の塊を文字候補として抽出し、そのドットの塊がある領域を特定するために、そのドットの塊を囲う矩形(以下、「外接矩形」という)を設定する。文字認識結果は、文字認識結果DB22に出力される。図4は、処理対象イメージ画像上で認識された文字に対して文字認識結果DB22に記憶される文字認識結果テーブル27のデータ構造を示す図である。
図3に示すように、罫線情報テーブル26は「罫線番号(直線番号)」、「始点座標」、「終点座標」の各項目を有する。
「罫線番号(直線番号)」は、罫線として検出された直線状のドットの識別番号を示している。
図4に示すように、文字認識結果テーブル27は、「認識結果」、「左上座標」、「右下座標」の各項目を有する。
図5のステップS1で、帳票読取部11が帳票を読み取って得た帳票画像に対し、処理対象イメージ取得部12によるイメージ切り出し処理が行なわれる。すなわち、帳票画像のうちの角印の印影を含む領域が処理対象イメージ画像として切り出される。
ステップS4では、処理対象イメージ画像に対し、文字認識部15による文字認識処理が実行される。例えば、処理対象とする帳票上の記入欄に手書きで記入された文字列や印字された文字列、印鑑の文字、プレプリント文字、が認識対象となる。帳票フォーマットが既知の場合、プレプリント文字は認識対象とする必要はないが、記入欄内の文字列や印鑑の文字は認識対象となる。印鑑の印影は登録されているが、印鑑の文字については、認識処理で参照するデータとして登録されることはないので、この文字認識処理で、印鑑の文字に対しては認識エラーが出力されることになる。
ステップS6で円印を検出したと判定された場合(ステップS6の判定結果がYesの場合)、一連の処理を終了する。
図7のステップS9で、処理対象イメージ画像上の検出された全ての文字候補のうちから現在の文字候補(文字候補A)が設定され、ステップS10で、文字候補Aに隣接する上下左右の直線が取り出され、ステップS11で、角印検出部17により図3の罫線情報テーブル26および図4の文字認識結果テーブル27が参照されて、文字候補Aの領域面積S1が算出される。
ステップS13で面積S1が面積S2の95%以上であると判定された場合(ステップS13の判定結果がYesの場合)、ステップS14で、文字候補Aを角印の文字に相当するドットの塊と判断し、文字候補Aに対してステップS10で取り出された直線を復活させて、文字候補Aとこの文字候補Aに隣接する上下左右の直線とを合わせて角印として検出する。
例えば図2Bの(5)、図3、図4を参照すると、手書きの「富士通太郎」の「富」の字は、処理対象イメージ画像上で上側に直線がないことから、上側に隣接する直線がない。また、この「富」の字は、左側に隣接する直線が罫線(直線)102、右側に隣接する直線が罫線(直線)103、下側に隣接する直線が罫線(直線)105である。「富士通太郎」を構成するほかの文字(「士」、「通」、「太」、「郎」)についても同様のことがいえる。
S1=(205−30)×(80−10)=175×70=12250
そして、ステップS12で、この手書きの「富」の字の外接矩形の面積S2が、図4の文字認識結果テーブル27を参照して下記式で算出される。
S2=(66−42)×(75−27)=24×48=1152
この結果、面積比(S2/S1)=1152/12250=0.094・・・、となり、9.4%となるので、95%未満となり、ステップS13の判定結果はNoとなる。
具体的には、罫線107と罫線109の交点の座標として(215,30)が求められ、罫線109と罫線108の交点の座標として(285,30)が求められ、罫線107と罫線110の交点の座標として(215,100)が求められ、罫線108と罫線110の交点の座標として(285,100)が求められる。
S1=S2=(285−215)×(100−30)=70×70=4900
この結果、面積比(S2/S1)=4900/4900=1.000・・・、となり、100%となるので、95%以上となり、ステップS13の判定結果はYesとなる。なお、文字候補Aに隣接する上下左右の直線と外接矩形との間に若干のずれが生じた場合でも、面積比S2/S1は1にかなり近い値となるので、ステップS13の判定結果はYesとなり変更はない。
図8に示すコンピュータは、CPU41、メモリ42、入力装置43、出力装置44、外部記憶装置45、媒体駆動装置46、及びネットワーク接続装置47を有し、これらがバス48によって互いに接続された構成となっている。同図に示す構成は一例であり、これに限定されるものではない。
メモリ42は、プログラム実行、データ更新等の際に、外部記憶装置45(あるいは可搬型の記録媒体49)に記憶されているプログラムあるいはデータを一時的に格納する例えばRAMである。CPU41は、プログラムをメモリ42に読み出して実行することにより、全体の制御を行う。
ネットワーク接続装置47は、例えばイントラネットやインターネット等のネットワークを介して、外部装置と通信を行うためのものである。外部装置は、画像読取装置であってもよく、その画像読取装置と接続されたものであってもよい。外部記憶装置45は、例えばハードディスク装置である。主に各種データやプログラムの保存に用いられる。
本実施形態による帳票を読み取る帳票読取装置は、それに必要な機能を搭載したプログラム(以降「帳票読取ソフト」と呼ぶ)をCPU41が実行することで実現される。帳票読取ソフトは、可搬型の記録媒体49に記録して配布してもよく、或いはネットワーク接続装置47により取得できるようにしてもよい。ここでは、外部記憶装置45に帳票読取ソフトが格納されていると想定する。
12 処理対象イメージ取得部
13 罫線情報格納部
14 罫線除去部
15 文字認識部
16 円印検出部
17 角印検出部
18 イメージ表示部
19 帳票画像格納部
20 DBアクセス制御部
21 罫線情報DB
22 文字認識結果DB
23 帳票DB
26 罫線情報テーブル
27 文字認識結果テーブル
41 CPU
42 メモリ
43 入力装置
44 出力装置
45 外部記憶装置
46 媒体駆動装置
47 ネットワーク接続装置
48 バス
49 可搬型記録媒体
101,102,103,104,105,106,107,108,109,110 罫線
Claims (4)
- 帳票を読み取る帳票読取装置において、
前記帳票を読み取って得られる帳票画像上の各文字を認識し、前記各文字に対する認識結果および外接矩形を求める文字認識部と、
前記文字の外接矩形と一致または略一致する帳票画像上の罫線の組み合わせが存在する文字を検出し、その文字と罫線の組み合わせとを合わせて角印の画像として検出する角印検出部と、を有することを特徴とする帳票読取装置。 - 前記帳票を読み取って得られる帳票画像上の罫線を記憶する罫線記憶部と、
前記帳票画像から罫線を消去する罫線消去部と、をさらに有し、
前記文字認識部は、前記罫線が消去された帳票画像上の各文字を認識し、前記各文字に対する認識結果および外接矩形を求め、
前記角印検出部は、前記文字の外接矩形と一致または略一致する記憶された帳票画像上の罫線の組み合わせが存在する文字を検出し、その文字と罫線の組み合わせとを合わせて角印の画像として検出する、ことを特徴とする請求項1記載の帳票読取装置。 - 帳票を読み取る帳票読取装置が実行する角印検出方法において、
前記帳票を読み取って得られる帳票画像上の各文字を認識し、前記各文字に対する認識結果および外接矩形を求める文字認識ステップと、
前記文字の外接矩形と一致または略一致する帳票画像上の罫線の組み合わせが存在する文字を検出し、その文字と罫線の組み合わせとを合わせて角印の画像として検出する角印検出ステップと、を有することを特徴とする角印検出方法。 - 帳票を読み取る処理を行わせるようにコンピュータを機能させるプログラムであり、
該プログラムは、コンピュータを、
前記帳票を読み取って得られる帳票画像上の各文字を認識し、前記各文字に対する認識結果および外接矩形を求める文字認識部、
前記文字の外接矩形と一致または略一致する帳票画像上の罫線の組み合わせが存在する文字を検出し、その文字と罫線の組み合わせとを合わせて角印の画像として検出する角印検出部、として機能させる角印検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011102224A JP5483467B2 (ja) | 2011-04-28 | 2011-04-28 | 帳票読取装置、角印検出方法、および、角印検出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011102224A JP5483467B2 (ja) | 2011-04-28 | 2011-04-28 | 帳票読取装置、角印検出方法、および、角印検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012234345A JP2012234345A (ja) | 2012-11-29 |
JP5483467B2 true JP5483467B2 (ja) | 2014-05-07 |
Family
ID=47434614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011102224A Expired - Fee Related JP5483467B2 (ja) | 2011-04-28 | 2011-04-28 | 帳票読取装置、角印検出方法、および、角印検出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5483467B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9836665B2 (en) | 2013-10-31 | 2017-12-05 | Nec Corporation | Management system, list production device, method, computer readable recording medium, data structure, and printed label |
JP6190346B2 (ja) * | 2014-09-25 | 2017-08-30 | 富士通フロンテック株式会社 | 角印検出プログラム、角印検出方法、および角印検出装置 |
WO2023032177A1 (ja) * | 2021-09-03 | 2023-03-09 | 株式会社KPMG Ignition Tokyo | オブジェクト除去システム、オブジェクト除去方法、及びオブジェクト除去プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4442044B2 (ja) * | 2001-03-14 | 2010-03-31 | 沖電気工業株式会社 | 印影読取方法および装置 |
JP4300083B2 (ja) * | 2003-09-18 | 2009-07-22 | 株式会社日立製作所 | 帳票読取り装置 |
-
2011
- 2011-04-28 JP JP2011102224A patent/JP5483467B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012234345A (ja) | 2012-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4996940B2 (ja) | 帳票認識装置およびそのプログラム | |
US7796817B2 (en) | Character recognition method, character recognition device, and computer product | |
JP2004258706A (ja) | 帳票定義データ作成方法および帳票処理装置 | |
JP2019079347A (ja) | 文字種推定システム、文字種推定方法、および文字種推定プログラム | |
JP5483467B2 (ja) | 帳票読取装置、角印検出方法、および、角印検出プログラム | |
JP2006227768A (ja) | 携帯端末における文字認識のための方法およびプログラム | |
JP4935459B2 (ja) | 文字認識方法、文字認識プログラムおよび文字認識装置 | |
JP2008282094A (ja) | 文字認識処理装置 | |
CN111414914A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
JP2008027133A (ja) | 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体 | |
US7133556B1 (en) | Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition | |
CN104412277B (zh) | 比较两个含有图形元素和文本元素的文件的设备和方法 | |
JP5169648B2 (ja) | 原画像探索装置及び原画像探索プログラム | |
JP2021157375A (ja) | 情報処理装置及びプログラム | |
JP2010157078A (ja) | 情報処理装置及び軌跡データ認識方法 | |
JP2016173710A (ja) | 情報入力装置、およびプログラム | |
JP7445364B2 (ja) | 画像処理プログラム、画像処理方法、及び画像処理装置 | |
JP4083723B2 (ja) | 画像処理装置 | |
JP2002170077A (ja) | 文字認識装置及び文字認識方法 | |
JP2010258627A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP2009217308A (ja) | 印鑑照合装置および印鑑照合方法 | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP4318311B2 (ja) | 帳票並びに帳票処理装置および帳票処理プログラム | |
JP4050677B2 (ja) | 画像処理装置、画像処理方法及びプログラム並びに記録媒体 | |
JPS638513B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5483467 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |