JP2009025856A - 帳票識別プログラム及び帳票識別装置 - Google Patents
帳票識別プログラム及び帳票識別装置 Download PDFInfo
- Publication number
- JP2009025856A JP2009025856A JP2007185212A JP2007185212A JP2009025856A JP 2009025856 A JP2009025856 A JP 2009025856A JP 2007185212 A JP2007185212 A JP 2007185212A JP 2007185212 A JP2007185212 A JP 2007185212A JP 2009025856 A JP2009025856 A JP 2009025856A
- Authority
- JP
- Japan
- Prior art keywords
- image
- feature
- identification
- dictionary
- feature point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【解決手段】 帳票画像間でずれが存在する場合にも、帳票特徴点ベクトル照合を用いて、位置ずれを吸収して帳票ロゴマーク類の判定を可能とする。更に、帳票識別辞書を作成する学習過程において、特徴点ベクトルに独立・従属の属性を判別し、ロゴマーク類の存在しないことも一つの特徴として扱うことを可能とする。更に、類似帳票間で自動的に推定した帳票ロゴマーク類の位置を強調表示することで、帳票辞書の作成処理の効率化を図る。
【選択図】 図3
Description
本発明においては、帳票種の大まかな絞込みを、帳票画像の全体を特徴ベクトル化して辞書との間で距離計算を行う帳票画像ベクトル照合で行い、かつ類似した帳票間の識別をロゴマーク類を用いて認識する際には、帳票から特徴点を抽出し、特徴点近傍の部分画像情報から構成したベクトルとの距離計算を行う帳票特徴点ベクトル照合を行う。その際、ロゴマーク類が存在しないことを一つの特徴として扱うために、帳票特徴点ベクトルとして2つのカテゴリ、独立特徴点と従属特徴点とを設けて,これを判別する。更に、差異のあるロゴマーク箇所を強調表示して辞書作成時の補助を行う帳票識別装置とそのプログラムを提供する。
桝目特徴方式とは、帳票全体を桝目上に区切って特徴ベクトルを抽出する方式である。
差分マップ方式の説明では補正後の画像をI(x、y)で表すとする。初めに帳票種毎にカテゴリ平均画像を作成する。カテゴリ平均画像は、カテゴリiのk番目の画像をIik(x、y)とした場合、式2から求められる。
画像ベクトルの特徴抽出領域として平均マップ画像が小さな値を持つ箇所(黒っぽい所)を選択すれば、帳票の特徴を表すプレ印刷領域を選択することとなり、識別がより行い易くなると考えられる。そこで、特徴点の優先度Prio(x、y)を、平均マップの部分平均値と定義し、式5に従って計算する。
A)画像濃度特徴ベクトル
特徴ベクトルの値を、選ばれた特徴点を中心とする(2Rx+1)×(2Ry+1)サイズの矩形(特徴領域)内における平均画素値とする方法である。平均マップから得られた特徴点群を(xd、yd)とすると、特徴ベクトル(v1、・・・、vD)は式6に従って計算される。
B)輪郭濃度特徴ベクトル
単純に画像濃度を取るだけでは、塗り潰し領域やバーコードが存在する帳票において識別精度が低下する問題が起こる。この場合、濃度を取る場合に全ての画像を使うのではなく、輪郭点(白画素と隣接する黒画素)のみを考慮することで、これに対処できる。輪郭からの特徴ベクトル計算は式7のように定式化できる。
続いて、類似した帳票をロゴマーク等により識別するための辞書作成を行う。まず、学習用の帳票画像に対して帳票画像正規化0202を行う。次に、帳票画像ベクトル辞書を用いて、各学習画像に対して帳票識別を行う。この時、画像ベクトル辞書との距離計算で出てくる尺度を元に、帳票間の類似性を判定する(0208)。画像ベクトル辞書との距離計算については後述する。更に類似した帳票については、それを区別するための帳票ロゴマーク類と思われる位置を自動計算し、更に局所的な画像の特徴を表す特徴点ベクトルの学習を行う(0209)。この処理については、図3から図6の説明で述べる。特徴点ベクトル学習0209の結果として、帳票特徴点ベクトル辞書0210が得られる。帳票特徴点ベクトル辞書には、帳票種、各帳票種に対する特徴点の数、特徴点の位置、特徴点に対応する局所的画像ベクトルが格納される。
帳票画像ベクトルを使う場合の距離計算方法としては、主にユークリッド距離と適応型マスク距離の2つがある。ユークリッド距離の計算方式は式8に、適応型マスク距離の計算方式は式9に示される。
・帳票1で抽出された特徴点は、独立特徴点候補とし、その近傍内で帳票2と照合しない特徴点ほど、独自の特徴点とする。
・帳票2で抽出された特徴点で、帳票1の近傍に他の特徴点が存在しない場合は、従属特徴点とする。
という条件で定まる。
0102 高速帳票読取装置を構成する操作端末装置
0103 高速帳票読取装置を構成する表示端末装置
0104 高速帳票読取装置を構成するソータ装置
0105 高速帳票読取装置を構成する外部記憶装置
0106 高速帳票読取装置を構成するメモリ
0107 高速帳票読取装置を構成する中央演算装置
0108 高速帳票読取装置を構成する内部バス
0109 高速帳票読取装置を構成する通信装置
0301 帳票学習処理の入力データ
0302 帳票学習処理の特徴点抽出
0303 帳票学習処理の特徴点照合
0304 帳票学習処理の特徴点差分判定
0305 帳票学習処理の独立・従属判定
0306 帳票学習処理の独立点属性付け
0307 帳票学習処理の従属点追加・属性付け
0308 帳票学習処理の周辺独立点リンク付け
0309 帳票学習処理の特徴点ベクトル計算
0401 特徴点ベクトル辞書
0402 各帳票種の特徴点ベクトル情報
0403 入力帳票から得られた特徴点ベクトル情報
0404 辞書との照合結果1
0405 辞書との照合結果2
0406 特徴点の対応関係。
Claims (5)
- 帳票の画像を撮像して識別を行う帳票識別装置であって、帳票画像上から特徴点を計算し、特徴点とその近傍にある部分画像から得られたベクトルとの組合せを帳票特徴点ベクトルとして、帳票上に描かれたロゴマーク類によって類似帳票間を識別する手段を有する帳票識別装置。
- 請求項1記載の帳票識別装置であって、前記処理部は、帳票識別辞書の作成時に類似帳票の計算を行い、類似帳票間で特徴量の存在しない領域を検知し、特徴量の存在しない領域における仮想特徴点を従属特徴点として登録する機能を有する帳票識別装置。
- 請求項1記載の帳票識別装置であって、前記処理部は、帳票画像の輪郭線の屈曲点を特徴点として抽出するよう計算する帳票識別装置。
- 請求項1記載の帳票識別装置であって、前記処理部は、帳票識別辞書の作成時に類似帳票の計算を行い、類似帳票間で差異のある箇所を帳票ロゴマーク類が存在するものと推定して、辞書帳票画像を重ね合わせて表示する際、前記入力帳票画像のロゴマーク類存在エリアを強調して表示するよう制御する帳票識別装置。
- 複数の見本帳票画像の特徴量を記述した帳票識別特徴辞書を記憶する記憶部と、入力帳票を読取った入力帳票画像を処理する処理部とを含む帳票識別装置に用いる帳票識別プログラムであって、前記処理部を、前記入力帳票画像と、前記複数の見本帳票画像のいずれと符合するかを識別する識別ステップと、前記識別ステップによって得られた識別結果を表示する際、前記入力帳票画像と、最も一致した特徴量を有する前記見本帳票画像を重ね合わせて表示するよう制御する表示制御ステップとを実行するよう制御する帳票識別プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007185212A JP2009025856A (ja) | 2007-07-17 | 2007-07-17 | 帳票識別プログラム及び帳票識別装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007185212A JP2009025856A (ja) | 2007-07-17 | 2007-07-17 | 帳票識別プログラム及び帳票識別装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009025856A true JP2009025856A (ja) | 2009-02-05 |
Family
ID=40397639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007185212A Pending JP2009025856A (ja) | 2007-07-17 | 2007-07-17 | 帳票識別プログラム及び帳票識別装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009025856A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011118513A (ja) * | 2009-12-01 | 2011-06-16 | Toshiba Corp | 文字認識装置および帳票識別方法 |
JP2012146147A (ja) * | 2011-01-12 | 2012-08-02 | Hitachi Solutions Ltd | 文書処理装置、及び文書処理プログラム |
JP2015115025A (ja) * | 2013-12-16 | 2015-06-22 | 三菱電機株式会社 | 帳票識別装置および帳票識別方法 |
CN111242124A (zh) * | 2020-01-13 | 2020-06-05 | 支付宝实验室(新加坡)有限公司 | 一种证件分类方法、装置及设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09259222A (ja) * | 1996-03-21 | 1997-10-03 | Oki Electric Ind Co Ltd | フォーマット認識装置及び文字読取り装置 |
JPH11259597A (ja) * | 1998-03-12 | 1999-09-24 | Oki Electric Ind Co Ltd | フォーマット認識装置及び文字読み取り装置 |
JP2000105112A (ja) * | 1998-09-30 | 2000-04-11 | Matsushita Electric Ind Co Ltd | 画像認識方法 |
JP2001155168A (ja) * | 1999-11-30 | 2001-06-08 | Toshiba Corp | 画像照合装置及び画像照合方法 |
JP2002150263A (ja) * | 2000-11-15 | 2002-05-24 | Glory Ltd | 辞書作成装置、辞書作成方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003187217A (ja) * | 2001-12-20 | 2003-07-04 | Nef:Kk | 画像検索システム |
JP2007156764A (ja) * | 2005-12-05 | 2007-06-21 | Hitachi Computer Peripherals Co Ltd | 図形検出処理プログラム及び紙葉処理装置 |
JP2007179307A (ja) * | 2005-12-28 | 2007-07-12 | Hitachi Computer Peripherals Co Ltd | 帳票識別装置 |
-
2007
- 2007-07-17 JP JP2007185212A patent/JP2009025856A/ja active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09259222A (ja) * | 1996-03-21 | 1997-10-03 | Oki Electric Ind Co Ltd | フォーマット認識装置及び文字読取り装置 |
JPH11259597A (ja) * | 1998-03-12 | 1999-09-24 | Oki Electric Ind Co Ltd | フォーマット認識装置及び文字読み取り装置 |
JP2000105112A (ja) * | 1998-09-30 | 2000-04-11 | Matsushita Electric Ind Co Ltd | 画像認識方法 |
JP2001155168A (ja) * | 1999-11-30 | 2001-06-08 | Toshiba Corp | 画像照合装置及び画像照合方法 |
JP2002150263A (ja) * | 2000-11-15 | 2002-05-24 | Glory Ltd | 辞書作成装置、辞書作成方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003187217A (ja) * | 2001-12-20 | 2003-07-04 | Nef:Kk | 画像検索システム |
JP2007156764A (ja) * | 2005-12-05 | 2007-06-21 | Hitachi Computer Peripherals Co Ltd | 図形検出処理プログラム及び紙葉処理装置 |
JP2007179307A (ja) * | 2005-12-28 | 2007-07-12 | Hitachi Computer Peripherals Co Ltd | 帳票識別装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011118513A (ja) * | 2009-12-01 | 2011-06-16 | Toshiba Corp | 文字認識装置および帳票識別方法 |
JP2012146147A (ja) * | 2011-01-12 | 2012-08-02 | Hitachi Solutions Ltd | 文書処理装置、及び文書処理プログラム |
JP2015115025A (ja) * | 2013-12-16 | 2015-06-22 | 三菱電機株式会社 | 帳票識別装置および帳票識別方法 |
CN111242124A (zh) * | 2020-01-13 | 2020-06-05 | 支付宝实验室(新加坡)有限公司 | 一种证件分类方法、装置及设备 |
CN111242124B (zh) * | 2020-01-13 | 2023-10-31 | 支付宝实验室(新加坡)有限公司 | 一种证件分类方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5387193B2 (ja) | 画像処理システム、画像処理装置およびプログラム | |
JP2012203458A (ja) | 画像処理装置及びプログラム | |
US9020214B2 (en) | Striped pattern image examination support device, striped pattern image examination support method and program | |
KR101685473B1 (ko) | 화상 처리 장치 및 화상 처리 방법 | |
US9575935B2 (en) | Document file generating device and document file generation method | |
JP2009025856A (ja) | 帳票識別プログラム及び帳票識別装置 | |
JP5100688B2 (ja) | 対象物検出装置及びプログラム | |
JP5201184B2 (ja) | 画像処理装置及びプログラム | |
CN109074646B (zh) | 图像识别装置以及图像识别程序 | |
US8254693B2 (en) | Image processing apparatus, image processing method and program | |
CN113033559A (zh) | 一种基于目标检测的文本检测方法及装置、存储介质 | |
JP2002109521A (ja) | 文書処理装置及び方法 | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
JP5010627B2 (ja) | 文字認識装置及び文字認識方法 | |
JP4935459B2 (ja) | 文字認識方法、文字認識プログラムおよび文字認識装置 | |
JP2009223612A (ja) | 画像認識装置及びプログラム | |
JP5439069B2 (ja) | 文字認識装置及び文字認識方法 | |
JP4936250B2 (ja) | 書込み抽出方法、書込み抽出装置および書込み抽出プログラム | |
JP5723803B2 (ja) | 画像処理装置及びプログラム | |
JP2008269131A (ja) | 画像処理装置及び画像処理プログラム | |
JP2009259190A (ja) | 文字認識プログラムおよび文字認識装置 | |
JP4881722B2 (ja) | 帳票識別装置、及び帳票識別プログラム | |
JP2002170079A (ja) | 文書書式識別装置および識別方法 | |
CN111401365A (zh) | Ocr图像自动生成方法及装置 | |
JP4803001B2 (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100528 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110930 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120403 |