JP2005157938A - 帳票認識装置、方法、プログラムおよび記憶媒体 - Google Patents
帳票認識装置、方法、プログラムおよび記憶媒体 Download PDFInfo
- Publication number
- JP2005157938A JP2005157938A JP2003398425A JP2003398425A JP2005157938A JP 2005157938 A JP2005157938 A JP 2005157938A JP 2003398425 A JP2003398425 A JP 2003398425A JP 2003398425 A JP2003398425 A JP 2003398425A JP 2005157938 A JP2005157938 A JP 2005157938A
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- image
- color information
- color
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】 評価対象とされた登録帳票と検索帳票との対応構成要素、たとえば表枠の対応セル、対応罫線、対応文字などについて色情報を比較し、同一色と判断された場合、形状特徴量について得られた類似度に所定の数値を加算する。
【選択図】 図7
Description
入力・分類処理に際しては、スキャナ等から読み取った帳票画像のデータから特徴量を抽出して、帳票書式データを生成し、入力帳票と登録帳票の書式データの類似度を求め、類似度の最も高い登録帳票を、認識結果とする。
(1)帳票の表枠に着目し、各表枠の面積の全表枠の面積の合計に対する割合を、人の視覚的な感覚に近い類似度として、使用する帳票認識処理(例えば特許文献1)。この帳票認識処理では、罫線の形状が類似している帳票画像において高い類似度が得られ、その値を比較することで、登録されている帳票から、同一帳票を特定する。
(2)帳票の特定部分(カラーID領域)の色情報に注目する帳票認識処理(例えば特許文献2)。
(3)帳票画像の特徴量として複数種類の特徴量を使用し、1つの特徴量で判別できなかったときに、該特徴量で候補を絞り込んだ後、他の特徴量を用いて帳票を認識する(例えば特許文献3)。
図2において、帳票を登録する処理は以下の各ステップにより実行される。
102・・・ROM
103・・・RAM
104・・・外部記憶装置
105・・・ディスプレイ
106・・・キーボード
107・・・ポインティングデバイス
108・・・スキャナ部
109・・・ネットワークインターフェース
Claims (22)
- 帳票画像の特徴量を、登録帳票の特徴量と比較して、登録帳票の中から類似する登録帳票を抽出して、帳票画像の認識結果とする帳票認識装置であって、
前記帳票画像に含まれる構成要素から形状の特徴量を抽出する形状特徴量抽出手段と、
前記帳票画像がカラー画像であるときに前記帳票画像の色情報を抽出する色情報抽出手段と、
前記抽出された形状の特徴量によって登録帳票との類似度を計算する類似度計算手段と、
前記抽出された色情報についての類似度を算出し、前記類似度計算手段によって計算された類似度に、前記色情報についての類似度を加算する色情報類似度加算手段と、
前記色情報類似度加算手段によって求められた類似度に基づいて、類似する登録帳票を決定する決定手段と、
を有することを特徴とする帳票認識装置。 - 前記カラー画像とは、カラー多値画像と、カラー2値画像と、白黒多値画像とのうち、少なくともいずれかであることを特徴とする請求項1に記載の帳票認識装置。
- 前記帳票画像がカラー画像でないときに、前記決定手段は、前記形状特徴量抽出手段で抽出された特徴量に基づいて、類似する登録帳票を決定することを特徴とする請求項1に記載の帳票認識装置。
- 前記色情報類似度加算手段は、前記形状の特徴量から計算された類似度が閾値以上のときのみ、前記色情報についての類似度を算出し、前記類似度計算手段によって得られた類似度に、前記色情報についての類似度を加算することを特徴とする請求項1乃至3のいずれかに記載の帳票認識装置。
- 前記色情報類似度加算手段は、前記帳票画像および比較対象の登録帳票の両者がカラー画像である場合に、前記色情報についての類似度を算出し、前記類似度計算手段によって得られた類似度に、前記色情報についての類似度を加算することを特徴とする請求項1乃至4のいずれかに記載の帳票認識装置。
- 前記色情報抽出手段は、前記帳票画像に含まれる構成要素それぞれについて前記色情報を抽出することを特徴とする請求項1に記載の帳票認識装置。
- 前記色情報とは表枠内のセルの色、文字の色、表枠の罫線色のうちの少なくともいずれかであることを特徴とする請求項1に記載の帳票認識装置。
- 前記帳票画像の前記色情報と前記比較対象の登録帳票の前記色情報の差が所定値以下のとき、前記帳票画像と前記比較対象の登録帳票を同一色と判断することを特徴とする請求項1に記載の帳票認識装置。
- 前記色情報類似度加算手段は、形状特徴量の類似度と色情報の類似度とを重み付き加算することを特徴とする請求項1に記載の帳票認識装置。
- 重み付き加算の重みは可変であることを特徴とする請求項9に記載の帳票認識装置。
- 帳票画像の特徴量を、登録帳票の特徴量と比較して、登録帳票の中から類似する登録帳票を抽出して、帳票画像の認識結果とする帳票認識方法であって、
前記帳票画像に含まれる構成要素から形状の特徴量を抽出する形状特徴量抽出工程と、
前記帳票画像がカラー画像であるときに前記帳票画像の色情報を抽出する色情報抽出工程と、
前記抽出された形状の特徴量によって登録帳票との類似度を計算する類似度計算工程と、
前記抽出された色情報についての類似度を算出し、前記類似度計算工程で計算された類似度に、前記色情報についての類似度を加算する色情報類似度加算工程と、
前記色情報類似度加算工程で求められた類似度に基づいて、類似する登録帳票を決定する決定工程と、
を有することを特徴とする帳票認識方法。 - 前記カラー画像とは、カラー多値画像と、カラー2値画像と、白黒多値画像とのうち、少なくともいずれかであることを特徴とする請求項11に記載の帳票認識方法。
- 前記帳票画像がカラー画像でないときに、前記決定工程では、前記形状特徴量抽出工程で抽出された特徴量に基づいて、類似する登録帳票を決定することを特徴とする請求項11に記載の帳票認識方法。
- 前記色情報類似度加算工程は、前記形状の特徴量から計算された類似度が閾値以上のときのみ、前記色情報についての類似度を算出し、前記類似度計算手段によって得られた類似度に、前記色情報についての類似度を加算することを特徴とする請求項11乃至13のいずれかに記載の帳票認識方法。
- 前記色情報類似度加算工程では、前記帳票画像および比較対象の登録帳票の両者がカラー画像である場合に、前記色情報についての類似度を算出し、前記類似度計算工程で得られた類似度に、前記色情報についての類似度を加算することを特徴とする請求項11乃至14のいずれかに記載の帳票認識方法。
- 前記色情報抽出工程は、前記帳票画像に含まれる構成要素それぞれについて前記色情報を抽出することを特徴とする請求項11に記載の帳票認識方法。
- 前記色情報とは表枠内のセルの色、文字の色、表枠の罫線色のうちの少なくともいずれかであることを特徴とする請求項11に記載の帳票認識方法。
- 前記帳票画像の前記色情報と前記比較対象の登録帳票の前記色情報の差が所定値以下のとき、前記帳票画像と前記比較対象の登録帳票を同一色と判断することを特徴とする請求項11に記載の帳票認識方法。
- 前記色情報類似度加算工程は、形状特徴量の類似度と色情報の類似度とを重み付き加算することを特徴とする請求項11に記載の帳票認識方法。
- 重み付き加算の重みは可変であることを特徴とする請求項19に記載の帳票認識方法。
- 請求項11乃至20のいずれかに記載の帳票認識方法をコンピュータによって実現させるためのコンピュータ実行可能プログラム。
- 請求項11乃至20のいずれかに記載の帳票認識方法をコンピュータによって実現させるためのコンピュータ読取可能なプログラムを格納する記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003398425A JP2005157938A (ja) | 2003-11-28 | 2003-11-28 | 帳票認識装置、方法、プログラムおよび記憶媒体 |
US10/997,537 US7508986B2 (en) | 2003-11-28 | 2004-11-23 | Document recognition device, document recognition method and program, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003398425A JP2005157938A (ja) | 2003-11-28 | 2003-11-28 | 帳票認識装置、方法、プログラムおよび記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005157938A true JP2005157938A (ja) | 2005-06-16 |
Family
ID=34723272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003398425A Pending JP2005157938A (ja) | 2003-11-28 | 2003-11-28 | 帳票認識装置、方法、プログラムおよび記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005157938A (ja) |
-
2003
- 2003-11-28 JP JP2003398425A patent/JP2005157938A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107093172B (zh) | 文字检测方法及系统 | |
JP5298831B2 (ja) | 画像処理装置及びプログラム | |
JP4065460B2 (ja) | 画像処理方法及び装置 | |
JP4859025B2 (ja) | 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体 | |
US7623712B2 (en) | Image processing method and apparatus | |
JP3792747B2 (ja) | 文字認識装置及び方法 | |
JP4607633B2 (ja) | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 | |
JP3727974B2 (ja) | 画像処理装置及び方法 | |
US20040213458A1 (en) | Image processing method and system | |
JP2010062911A (ja) | 画像処理装置、画像処理方法およびプログラム | |
US7277584B2 (en) | Form recognition system, form recognition method, program and storage medium | |
JP4772819B2 (ja) | 画像検索装置および画像検索方法 | |
EP0933719B1 (en) | Image processing method and apparatus | |
US6944340B1 (en) | Method and apparatus for efficient determination of recognition parameters | |
CN110210467B (zh) | 一种文本图像的公式定位方法、图像处理装置、存储介质 | |
JP4867620B2 (ja) | 画像処理装置及び画像処理プログラム | |
CN112560857B (zh) | 文字区域边界检测方法、设备、存储介质及装置 | |
US7508986B2 (en) | Document recognition device, document recognition method and program, and storage medium | |
CN105868768A (zh) | 一种识别图片是否带有特定标记的方法及系统 | |
JP2005157938A (ja) | 帳票認識装置、方法、プログラムおよび記憶媒体 | |
JP2020047138A (ja) | 情報処理装置 | |
JP4328511B2 (ja) | パターン認識装置、パターン認識方法、プログラムおよび記憶媒体 | |
JP4697387B2 (ja) | 原稿画像判定装置、原稿画像判定方法及びそのプログラム | |
JP4973603B2 (ja) | 画像処理装置および画像処理プログラム | |
JP2002269574A (ja) | 囲み領域抽出アルゴリズムの性能を向上させるランレングスに基づく連結成分と輪郭追跡 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050613 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060606 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080204 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080304 |