JP2005165978A - 帳票ocrプログラム、方法及び装置 - Google Patents
帳票ocrプログラム、方法及び装置 Download PDFInfo
- Publication number
- JP2005165978A JP2005165978A JP2003407836A JP2003407836A JP2005165978A JP 2005165978 A JP2005165978 A JP 2005165978A JP 2003407836 A JP2003407836 A JP 2003407836A JP 2003407836 A JP2003407836 A JP 2003407836A JP 2005165978 A JP2005165978 A JP 2005165978A
- Authority
- JP
- Japan
- Prior art keywords
- item name
- item
- frame
- ocr
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 240000000220 Panda oleosa Species 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Character Input (AREA)
Abstract
【解決手段】 帳票OCRプログラムは、複数の項目が配列された帳票のOCR処理をコンピュータに実行させる。帳票OCRプログラムは、予め項目名を定義した項目定義データから所望の第1項目名を読み出し、その第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名枠を特定し、この後、特定された項目名枠からそれに対応する記入欄の位置を特定する。前記第1項目名枠を特定する際に、前記第1項目名と一致する認識文字が無い場合に、前記第1項目名とは異なる第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、予め定義された複数の項目名の相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定する。
【選択図】 図7
Description
11 メインユニット
16 帳票
21 CPU
22 RAM
27 HDD
35 帳票イメージデータ
36 全面OCR結果ファイル
37 項目定義ファイル
38 項目名枠特定データファイル
39 再OCR項目定義ファイル
41 再OCRエリアデータファイル
42 部分OCR結果ファイル
Claims (12)
- 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR処理をコンピュータに実行させる帳票OCRプログラムにおいて、
予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理ステップと、
この後、特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理ステップとからなり、
前記項目名枠特定処理ステップは、前記第1項目名と一致する認識文字が無い場合に、前記第1項目名とは異なる第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、予め定義された複数の項目名の相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定するサブステップを含むことを特徴とする帳票OCRプログラム。 - 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項1記載の帳票OCRプログラム。
- 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項2記載の帳票OCRプログラム。
- 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項2又は3記載の帳票OCRプログラム。
- 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR方法において、
予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理ステップと、
この後、特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理ステップとからなり、
前記項目名枠特定処理ステップは、前記第1項目名と一致する認識文字が無い場合に、前記第1項目名とは異なる第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、予め定義された複数の項目名の相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定するサブステップを含むことを特徴とする帳票OCR方法。 - 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項5記載の帳票OCR方法。
- 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項6記載の帳票OCR方法。
- 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項6又は7記載の帳票OCR方法。
- 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR装置において、
予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理部と、
前記項目名枠特定処理部によって特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理部とからなり、
前記項目名枠特定処理部は、前記第1項目名と一致する認識文字が無い場合に、前記第1項目名とは異なる第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、予め定義された複数の項目名の相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定することを特徴とする帳票OCR装置。 - 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項9記載の帳票OCR装置。
- 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項10記載の帳票OCR装置。
- 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項10又は11記載の帳票OCR装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003407836A JP4347675B2 (ja) | 2003-12-05 | 2003-12-05 | 帳票ocrプログラム、方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003407836A JP4347675B2 (ja) | 2003-12-05 | 2003-12-05 | 帳票ocrプログラム、方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005165978A true JP2005165978A (ja) | 2005-06-23 |
JP4347675B2 JP4347675B2 (ja) | 2009-10-21 |
Family
ID=34729760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003407836A Expired - Fee Related JP4347675B2 (ja) | 2003-12-05 | 2003-12-05 | 帳票ocrプログラム、方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4347675B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007011824A (ja) * | 2005-07-01 | 2007-01-18 | Hitachi Engineering & Services Co Ltd | 文字列抽出方法および装置 |
JP2011233178A (ja) * | 2011-08-26 | 2011-11-17 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP2012194862A (ja) * | 2011-03-17 | 2012-10-11 | Fujitsu Ltd | 情報処理装置、プログラム、およびデータの抽出方法 |
JP2015135576A (ja) * | 2014-01-16 | 2015-07-27 | グローリー株式会社 | 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム |
JP2015138396A (ja) * | 2014-01-22 | 2015-07-30 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP7452809B1 (ja) | 2023-08-09 | 2024-03-19 | ファーストアカウンティング株式会社 | 情報処理装置、情報処理方法及びプログラム |
-
2003
- 2003-12-05 JP JP2003407836A patent/JP4347675B2/ja not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007011824A (ja) * | 2005-07-01 | 2007-01-18 | Hitachi Engineering & Services Co Ltd | 文字列抽出方法および装置 |
JP2012194862A (ja) * | 2011-03-17 | 2012-10-11 | Fujitsu Ltd | 情報処理装置、プログラム、およびデータの抽出方法 |
JP2011233178A (ja) * | 2011-08-26 | 2011-11-17 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP2015135576A (ja) * | 2014-01-16 | 2015-07-27 | グローリー株式会社 | 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム |
JP2015138396A (ja) * | 2014-01-22 | 2015-07-30 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP7452809B1 (ja) | 2023-08-09 | 2024-03-19 | ファーストアカウンティング株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4347675B2 (ja) | 2009-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
US8467614B2 (en) | Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images | |
US20160063322A1 (en) | Method and system of extracting label:value data from a document | |
JP4996940B2 (ja) | 帳票認識装置およびそのプログラム | |
US8208737B1 (en) | Methods and systems for identifying captions in media material | |
KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
US20070168382A1 (en) | Document analysis system for integration of paper records into a searchable electronic database | |
JP2003308480A (ja) | オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
JP4733577B2 (ja) | 帳票認識装置及び帳票認識プログラム | |
US11321558B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2010055142A (ja) | 文書処理装置およびプログラム | |
CN112084748A (zh) | 一种文本比对方法 | |
EP2884425B1 (en) | Method and system of extracting structured data from a document | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
WO2007070010A1 (en) | Improvements in electronic document analysis | |
JP2009093305A (ja) | 帳票認識装置 | |
JP2019057311A (ja) | 帳票情報認識装置および帳票情報認識方法 | |
JP4983464B2 (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
CN113806472A (zh) | 一种对文字图片和图像型扫描件实现全文检索的方法及设备 | |
JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
US20210042555A1 (en) | Information Processing Apparatus and Table Recognition Method | |
JP2021140831A (ja) | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム | |
JP3435374B2 (ja) | 文字読取装置および文字認識方法 | |
JP6007720B2 (ja) | 情報処理装置及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060413 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20061220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090708 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090716 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130724 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |