JP4420443B2 - 帳票認識装置及びその制御方法、プログラム - Google Patents
帳票認識装置及びその制御方法、プログラム Download PDFInfo
- Publication number
- JP4420443B2 JP4420443B2 JP2004080984A JP2004080984A JP4420443B2 JP 4420443 B2 JP4420443 B2 JP 4420443B2 JP 2004080984 A JP2004080984 A JP 2004080984A JP 2004080984 A JP2004080984 A JP 2004080984A JP 4420443 B2 JP4420443 B2 JP 4420443B2
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- color information
- registered
- form image
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置であって、
認識対象の帳票画像を入力する入力手段と、
前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出手段と、
前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出手段と、
前記色情報抽出手段で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合手段と、
前記複数の登録帳票画像それぞれに対して、前記特徴量抽出手段で抽出した前記形状特徴量に基づく第1類似度と前記統合手段による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出手段と、
前記算出手段で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定手段と
を備える。
前記第1類似度が前記閾値以上であると判定した場合は、前記第2類似度を算出して前記加算後の類似度を算出する一方、
前記第1類似度が前記閾値以上でないと判定した場合は前記第2類似度および前記加算後の類似度の算出は行わない。
記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置の制御方法であって、
認識対象の帳票画像を入力する入力工程と、
前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出工程と、
前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出工程と、
前記色情報抽出工程で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合工程と、
前記複数の登録帳票画像それぞれに対して、前記特徴量抽出工程で抽出した前記形状特徴量に基づく第1類似度と前記統合工程による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出工程と、
前記算出工程で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定工程と
を備える。
記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置の制御をコンピュータに実行させるためのプログラムであって、
認識対象の帳票画像を入力する入力工程と、
前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出工程と、
前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出工程と、
前記色情報抽出工程で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合工程と、
前記複数の登録帳票画像それぞれに対して、前記特徴量抽出工程で抽出した前記形状特徴量に基づく第1類似度と前記統合工程による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出工程と、
前記算出工程で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定工程と
を備える。
図1は本発明を実施形態1の帳票認識装置の構成を示すブロック図である。
実施形態1では、検索処理において、登録画像中のすべての登録画像に対して、入力画像との色情報に関する類似度算出処理を実行する構成としているが、比較対象の登録画像の形状が、入力画像の形状と類似していない場合は、その色情報も類似していなかったり、共通する構成要素がない可能性が高い。そのため、このような登録画像に対して、入力画像との色情報に関する類似度算出処理を実行しても、その登録画像との類似度は低く、最終的な入力画像に対応する登録画像となることは低いので、この色情報に関する類似度算出処理そのものが冗長となる。
102 ROM
103 RAM
104 外部記憶装置
105 ディスプレイ
106 キーボード
107 ポインティングデバイス
108 スキャナ部
109 ネットワークインターフェース
Claims (5)
- 記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置であって、
認識対象の帳票画像を入力する入力手段と、
前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出手段と、
前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出手段と、
前記色情報抽出手段で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合手段と、
前記複数の登録帳票画像それぞれに対して、前記特徴量抽出手段で抽出した前記形状特徴量に基づく第1類似度と前記統合手段による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出手段と、
前記算出手段で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定手段と
を備えることを特徴とする帳票認識装置。 - 前記算出手段は、前記第1類似度を算出した後、前記第1類似度が閾値以上であるか否かを判定し、
前記第1類似度が前記閾値以上であると判定した場合は、前記第2類似度を算出して前記加算後の類似度を算出する一方、
前記第1類似度が前記閾値以上でないと判定した場合は前記第2類似度および前記加算後の類似度の算出は行わない
ことを特徴とする請求項1に記載の帳票認識装置。 - 前記統合手段は、前記罫線を挟んで隣接するセル領域それぞれの色情報の差が一定範囲内にある場合、当該セル領域が同一の色情報を有していると判定する
ことを特徴とする請求項1に記載の帳票認識装置。 - 記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置の制御方法であって、
認識対象の帳票画像を入力する入力工程と、
前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出工程と、
前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出工程と、
前記色情報抽出工程で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合工程と、
前記複数の登録帳票画像それぞれに対して、前記特徴量抽出工程で抽出した前記形状特徴量に基づく第1類似度と前記統合工程による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出工程と、
前記算出工程で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定工程と
を備えることを特徴とする帳票認識装置の制御方法。 - 記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置の制御をコンピュータに実行させるためのプログラムであって、
認識対象の帳票画像を入力する入力工程と、
前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出工程と、
前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出工程と、
前記色情報抽出工程で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合工程と、
前記複数の登録帳票画像それぞれに対して、前記特徴量抽出工程で抽出した前記形状特徴量に基づく第1類似度と前記統合工程による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出工程と、
前記算出工程で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定工程と
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004080984A JP4420443B2 (ja) | 2004-03-19 | 2004-03-19 | 帳票認識装置及びその制御方法、プログラム |
US10/997,537 US7508986B2 (en) | 2003-11-28 | 2004-11-23 | Document recognition device, document recognition method and program, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004080984A JP4420443B2 (ja) | 2004-03-19 | 2004-03-19 | 帳票認識装置及びその制御方法、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2005267408A JP2005267408A (ja) | 2005-09-29 |
JP2005267408A5 JP2005267408A5 (ja) | 2007-02-08 |
JP4420443B2 true JP4420443B2 (ja) | 2010-02-24 |
Family
ID=35091877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004080984A Expired - Fee Related JP4420443B2 (ja) | 2003-11-28 | 2004-03-19 | 帳票認識装置及びその制御方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4420443B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001331764A (ja) * | 2000-03-13 | 2001-11-30 | Fujitsu Ltd | 文字認識方法 |
JP3842006B2 (ja) * | 2000-03-30 | 2006-11-08 | グローリー工業株式会社 | 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP4558232B2 (ja) * | 2001-03-26 | 2010-10-06 | 株式会社リコー | 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
-
2004
- 2004-03-19 JP JP2004080984A patent/JP4420443B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005267408A (ja) | 2005-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3796500B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4266784B2 (ja) | 画像処理システム及び画像処理方法 | |
US7391917B2 (en) | Image processing method | |
CN100448257C (zh) | 图像处理装置及其方法 | |
US7640269B2 (en) | Image processing system and image processing method | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
US8244035B2 (en) | Image processing apparatus and control method thereof | |
JP2007042092A (ja) | 電子ドキュメント処理装置、方法およびプログラム | |
CN102171708A (zh) | 商业文档处理器 | |
JP2005167937A (ja) | 画像処理システム及び画像処理方法 | |
JP4968293B2 (ja) | 文書処理装置、文書処理方法およびプログラム | |
US7453594B2 (en) | Document filing apparatus for storing information added to a document file | |
JP4338189B2 (ja) | 画像処理システム及び画像処理方法 | |
CN101625752A (zh) | 图像处理设备和图像处理方法 | |
JP2006025129A (ja) | 画像処理システム及び画像処理方法 | |
US20200396351A1 (en) | Character recognition device, method of generating document file, and storage medium | |
US8339622B2 (en) | Image processing apparatus and integrated document generating method | |
CN101123663B (zh) | 图像处理设备和方法 | |
JP4420443B2 (ja) | 帳票認識装置及びその制御方法、プログラム | |
JP2007221340A (ja) | 画像ファイル生成方法及び画像ファイル生成装置 | |
CN100588218C (zh) | 图像形成装置和电子邮件传送服务器 | |
CN101206708A (zh) | 图像处理装置及图像处理方法 | |
JP4804433B2 (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
JP2005149097A (ja) | 画像処理システム及び画像処理方法 | |
JP5673277B2 (ja) | 画像処理装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061207 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090831 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091027 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091127 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091130 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4420443 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131211 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |