JP4347675B2 - 帳票ocrプログラム、方法及び装置 - Google Patents
帳票ocrプログラム、方法及び装置 Download PDFInfo
- Publication number
- JP4347675B2 JP4347675B2 JP2003407836A JP2003407836A JP4347675B2 JP 4347675 B2 JP4347675 B2 JP 4347675B2 JP 2003407836 A JP2003407836 A JP 2003407836A JP 2003407836 A JP2003407836 A JP 2003407836A JP 4347675 B2 JP4347675 B2 JP 4347675B2
- Authority
- JP
- Japan
- Prior art keywords
- item name
- item
- frame
- ocr
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
11 メインユニット
16 帳票
21 CPU
22 RAM
27 HDD
35 帳票イメージデータ
36 全面OCR結果ファイル
37 項目定義ファイル
38 項目名枠特定データファイル
39 再OCR項目定義ファイル
41 再OCRエリアデータファイル
42 部分OCR結果ファイル
Claims (12)
- 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR処理をコンピュータに実行させる帳票OCRプログラムにおいて、
予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理ステップと、
この後、特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理ステップとからなり、
前記項目名枠特定処理ステップは、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定するサブステップを含むことを特徴とする帳票OCRプログラム。 - 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項1記載の帳票OCRプログラム。
- 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項2記載の帳票OCRプログラム。
- 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項2又は3記載の帳票OCRプログラム。
- 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR方法において、
予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理ステップと、
この後、特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理ステップとからなり、
前記項目名枠特定処理ステップは、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定するサブステップを含むことを特徴とする帳票OCR方法。 - 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項5記載の帳票OCR方法。
- 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項6記載の帳票OCR方法。
- 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項6又は7記載の帳票OCR方法。
- 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR装置において、
予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理部と、
前記項目名枠特定処理部によって特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理部とからなり、
前記項目名枠特定処理部は、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定することを特徴とする帳票OCR装置。 - 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項9記載の帳票OCR装置。
- 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項10記載の帳票OCR装置。
- 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項10又は11記載の帳票OCR装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003407836A JP4347675B2 (ja) | 2003-12-05 | 2003-12-05 | 帳票ocrプログラム、方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003407836A JP4347675B2 (ja) | 2003-12-05 | 2003-12-05 | 帳票ocrプログラム、方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005165978A JP2005165978A (ja) | 2005-06-23 |
JP4347675B2 true JP4347675B2 (ja) | 2009-10-21 |
Family
ID=34729760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003407836A Expired - Fee Related JP4347675B2 (ja) | 2003-12-05 | 2003-12-05 | 帳票ocrプログラム、方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4347675B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4754889B2 (ja) * | 2005-07-01 | 2011-08-24 | 株式会社日立エンジニアリング・アンド・サービス | 文字列抽出方法および装置 |
JP5810568B2 (ja) * | 2011-03-17 | 2015-11-11 | 富士通株式会社 | 情報処理装置、プログラム、およびデータの抽出方法 |
JP5003837B2 (ja) * | 2011-08-26 | 2012-08-15 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP6247103B2 (ja) * | 2014-01-16 | 2017-12-13 | グローリー株式会社 | 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム |
JP6303531B2 (ja) * | 2014-01-22 | 2018-04-04 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP7452809B1 (ja) | 2023-08-09 | 2024-03-19 | ファーストアカウンティング株式会社 | 情報処理装置、情報処理方法及びプログラム |
-
2003
- 2003-12-05 JP JP2003407836A patent/JP4347675B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005165978A (ja) | 2005-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
US9613267B2 (en) | Method and system of extracting label:value data from a document | |
US6782144B2 (en) | Document scanner, system and method | |
US8467614B2 (en) | Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images | |
US6600834B1 (en) | Handwriting information processing system with character segmentation user interface | |
JP4996940B2 (ja) | 帳票認識装置およびそのプログラム | |
KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
US8208737B1 (en) | Methods and systems for identifying captions in media material | |
US20120170829A1 (en) | Check Boundary Detection by String Literal Analysis | |
CN102289667A (zh) | 对经历光学字符识别(ocr)过程的文本文档中出现的错误的用户纠正 | |
WO2007117334A2 (en) | Document analysis system for integration of paper records into a searchable electronic database | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP2003308480A (ja) | オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
CN112084748A (zh) | 一种文本比对方法 | |
JP2008021068A (ja) | 帳票認識装置及び帳票認識プログラム | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
WO2007070010A1 (en) | Improvements in electronic document analysis | |
JP2009093305A (ja) | 帳票認識装置 | |
JP4983464B2 (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
JP2012181653A (ja) | 採点方法、採点方法のプログラム及び採点システム | |
JPH08320914A (ja) | 表認識方法および装置 | |
JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
JP3435374B2 (ja) | 文字読取装置および文字認識方法 | |
US7133556B1 (en) | Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060413 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20061220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090708 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090716 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130724 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |