JP4996940B2 - 帳票認識装置およびそのプログラム - Google Patents
帳票認識装置およびそのプログラム Download PDFInfo
- Publication number
- JP4996940B2 JP4996940B2 JP2007040489A JP2007040489A JP4996940B2 JP 4996940 B2 JP4996940 B2 JP 4996940B2 JP 2007040489 A JP2007040489 A JP 2007040489A JP 2007040489 A JP2007040489 A JP 2007040489A JP 4996940 B2 JP4996940 B2 JP 4996940B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- item name
- data
- relationship
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 46
- 238000004458 analytical method Methods 0.000 description 24
- 238000007796 conventional method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012015 optical character recognition Methods 0.000 description 5
- 230000003252 repetitive effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Description
(1)「氏名」と「名前」のように,同じ属性であるにもかかわらず,属性を表す項目名の文字列が帳票ごとに異なる。
(2)階層関係や2次元関係も含めて,項目名の文字列とデータの文字列との位置関係が不明である。
(3)一つの枠内に複数の属性のデータが記載されている。
(4)項目名とデータの文字列が枠で囲まれていない。
(5)複数の項目のデータが一組(レコード)となっており,それらのデータが繰返し記載されている。
(6)データが記載されている領域内に,読取りに不必要な別の文字列が含まれている。例えば,金額欄に「円」の文字が記載されている場合である。
これらの処理の一部もしくは全てを実行することにより,本発明では、認識率の高い帳票認識を実現できる。
ステップ140では,ステップ130の文字認識結果と項目名単語辞書180に登録されている項目名の単語とを照合する。130と140の処理の一実施例としては,例えば、特開2004−171316号公報記載の方式を利用することが可能である。
ステップ160では,ステップ140にて単語照合に失敗した文字列をデータ文字列と判定する。単語照合に失敗したため,文字認識結果はステップ130の結果をそのまま利用する。ただし,文字認識の誤りなどによる単語照合の失敗の可能性もあるため,データ文字列の候補と判定し,データ文字列か否かは後段の処理に基づいて判定してもよい。
Claims (7)
- 認識辞書及び項目名単語辞書を記憶する記憶部と,帳票画像の認識処理を行う処理部とからなる帳票認識装置であって,
前記処理部は,
前記帳票画像中の,文字列が含まれる領域を検出し,
検出された前記領域内の文字列を検出し,
検出された前記文字列の文字を、前記認識辞書を用いて認識し,
前記文字列の文字認識結果と前記項目名単語辞書中の項目名単語とを照合し,
項目名単語照合に成功した前記文字列を項目名文字列と,項目名単語照合に成功しなかった文字列をデータ文字列と判定し,
前記項目名文字列と前記データ文字列の縦方向,或いは横方向の配置関係に基づいて,前記データ文字列のデータと項目名を対応付け,
前記項目名文字列と前記データ文字列の縦方向の配置関係に基づいて前記対応付けを行った場合,横方向に繰り返された前記データ文字列が含まれる領域の隣接関係と高さ情報とに基づいて,該複数の繰り返された領域に含まれるデータ文字列を一組の情報として扱い,
前記項目名文字列と前記データ文字列の横方向の配置関係に基づいて前記対応付けを行った場合,縦方向に繰り返された前記データ文字列が含まれる領域の隣接関係と高さ情報とに基づいて,該複数の繰り返された領域に含まれるデータ文字列を一組の情報として扱う
ことを特徴とする帳票認識装置。 - 請求項1記載の帳票認識装置であって,
前記処理部は,
前記項目名文字列と前記データ文字列との配置関係から前記データと項目名を対応付けして,前記項目名に相当する属性を判定する際,前記項目名文字列の配置から前記項目名の属性間の階層関係を解析する
帳票認識装置。 - 請求項1記載の帳票認識装置であって,
前記項目名文字列と前記データ文字列との配置関係から前記データと項目名を対応付けして,前記項目名に相当する属性を判定する際,
同一の前記領域内に複数の属性の前記データ文字列が存在する場合に,当該領域内の前記項目名文字列の配置と前記データ文字列の配置を対応付けすることにより,個々の前記データ文字列の属性を解析する
帳票認識装置。 - 請求項1記載の帳票認識装置であって,
前記項目名文字列と前記データ文字列との配置関係から前記データと項目名を対応付けして,前記項目名に相当する属性を判定する際,
同一の前記領域内に前記項目名文字列と前記データ文字列の両方が存在する場合に,両者の属性が同じであると判定する
帳票認識装置。 - 請求項1記載の帳票認識装置であって,
前記項目名文字列と前記データ文字列との配置関係から前記データと項目名を対応付けして,前記項目名に相当する属性を判定する際,
項目名単語辞書に項目名単語とプレ印刷単語を格納することにより,プレ印刷文字が記載されている文字列を判定する
帳票認識装置。 - 認識辞書及び項目名単語辞書を記憶する記憶部と、帳票画像の認識処理を行う処理部とからなる帳票認識装置で実行される帳票認識用プログラムであって,
前記処理部で,
帳票画像中の文字列が含まれる領域を検出するステップと,
前記領域内の文字列を検出するステップと,
検出された前記文字列の文字を認識するステップと,
文字列の文字認識結果と前記記憶部に記憶された項目名単語とを照合するステップと,
項目名単語照合に成功した文字列を項目名文字列と判定するステップと,
項目名単語照合に成功しなかった文字列をデータ文字列と判定するステップと,
前記項目名文字列と前記データ文字列の縦方向,或いは横方向の配置関係に基づいて,前記データ文字列のデータと項目名を対応付けするステップを含み,
前記項目名文字列と前記データ文字列の縦方向の配置関係に基づいて前記対応付けを行った場合,横方向に繰り返された前記データ文字列が含まれる領域の隣接関係と高さ情報とに基づいて,該複数の繰り返された領域に含まれるデータ文字列を一組の情報として扱い,
前記項目名文字列と前記データ文字列の横方向の配置関係に基づいて前記対応付けを行った場合,縦方向に繰り返された前記データ文字列が含まれる領域の隣接関係と高さ情報とに基づいて,該複数の繰り返された領域に含まれるデータ文字列を一組の情報として扱う
ことを特徴とする帳票認識用プログラム。 - 請求項6記載の帳票認識用プログラムであって,
前記属性を判定するステップにおいて,
前記項目名文字列の配置から前記項目名の属性間の階層関係を解析するステップを備える
帳票認識用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007040489A JP4996940B2 (ja) | 2007-02-21 | 2007-02-21 | 帳票認識装置およびそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007040489A JP4996940B2 (ja) | 2007-02-21 | 2007-02-21 | 帳票認識装置およびそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008204226A JP2008204226A (ja) | 2008-09-04 |
JP4996940B2 true JP4996940B2 (ja) | 2012-08-08 |
Family
ID=39781658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007040489A Active JP4996940B2 (ja) | 2007-02-21 | 2007-02-21 | 帳票認識装置およびそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4996940B2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5588213B2 (ja) * | 2010-04-13 | 2014-09-10 | 富士通フロンテック株式会社 | 帳票認識プログラム、帳票認識装置、および帳票認識方法 |
JP5216890B2 (ja) * | 2011-04-15 | 2013-06-19 | 株式会社富士通マーケティング | レシートデータ認識装置およびそのプログラム |
JPWO2014068770A1 (ja) * | 2012-11-02 | 2016-09-08 | 株式会社日立製作所 | データ抽出方法、データ抽出装置及びそのプログラム |
JP6081298B2 (ja) * | 2013-06-10 | 2017-02-15 | 富士通フロンテック株式会社 | 文字認識装置、文字認識方法、および文字認識プログラム |
JP6256079B2 (ja) * | 2014-02-14 | 2018-01-10 | 富士通株式会社 | 検索プログラム、検索方法及び検索装置 |
JP6541936B2 (ja) * | 2014-03-17 | 2019-07-10 | 株式会社日立システムズ | 情報処理装置、帳票読取方法、及びプログラム |
JP6887233B2 (ja) * | 2016-09-02 | 2021-06-16 | 株式会社アイリックコーポレーション | 保険証券画像解析システム、記載内容解析装置、携帯端末および携帯端末用のプログラム |
JP6947971B2 (ja) * | 2016-11-17 | 2021-10-13 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、プログラム |
JP6702198B2 (ja) * | 2017-01-11 | 2020-05-27 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置及びプログラム |
JP6527256B1 (ja) * | 2018-01-29 | 2019-06-05 | 株式会社 みずほ銀行 | 帳票対応システム、帳票対応方法及び帳票対応プログラム |
JP7383882B2 (ja) * | 2019-01-22 | 2023-11-21 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
JP7275617B2 (ja) * | 2019-02-06 | 2023-05-18 | 日本電信電話株式会社 | 情報処理装置、判別方法および判別プログラム |
JP7491107B2 (ja) * | 2020-07-14 | 2024-05-28 | 株式会社リコー | 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム |
CN112052835B (zh) | 2020-09-29 | 2022-10-11 | 北京百度网讯科技有限公司 | 信息处理方法、信息处理装置、电子设备和存储介质 |
KR102575085B1 (ko) * | 2021-11-19 | 2023-09-06 | 조남제 | 문서 분석 시스템 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2740335B2 (ja) * | 1990-05-18 | 1998-04-15 | 富士ファコム制御株式会社 | 自動セル属性判定機能を有する表読取装置 |
JPH08221510A (ja) * | 1995-02-16 | 1996-08-30 | Toshiba Corp | 帳票文書処理装置および帳票文書処理方法 |
JP3463008B2 (ja) * | 1995-07-31 | 2003-11-05 | 富士通株式会社 | 媒体処理方法及び媒体処理装置 |
JP2000029983A (ja) * | 1998-07-10 | 2000-01-28 | Oki Electric Ind Co Ltd | 文書読取装置 |
JP4078009B2 (ja) * | 2000-02-28 | 2008-04-23 | 東芝ソリューション株式会社 | 帳票における文字記録領域の検出装置、帳票における文字記録領域の検出方法、記憶媒体及び帳票フォーマット作成装置 |
JP3898645B2 (ja) * | 2003-01-15 | 2007-03-28 | 富士通株式会社 | 帳票書式編集装置および帳票書式編集プログラム |
JP2005275830A (ja) * | 2004-03-25 | 2005-10-06 | Hitachi Computer Peripherals Co Ltd | 帳票認識方法 |
-
2007
- 2007-02-21 JP JP2007040489A patent/JP4996940B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008204226A (ja) | 2008-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4996940B2 (ja) | 帳票認識装置およびそのプログラム | |
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
US6782144B2 (en) | Document scanner, system and method | |
JP3824209B2 (ja) | 文書自動分割装置 | |
JP4733577B2 (ja) | 帳票認識装置及び帳票認識プログラム | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
JP4977368B2 (ja) | 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP3422924B2 (ja) | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4280355B2 (ja) | 文字認識装置 | |
JP3525997B2 (ja) | 文字認識方法 | |
JP2009093305A (ja) | 帳票認識装置 | |
JP5566971B2 (ja) | 情報処理プログラム、情報処理装置および文字認識方法 | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP3215176B2 (ja) | 文書画像処理装置及び文書画像処理方法 | |
JP4160206B2 (ja) | 文字認識装置を利用したデータベース登録方法 | |
JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
JP5483467B2 (ja) | 帳票読取装置、角印検出方法、および、角印検出プログラム | |
JP4566510B2 (ja) | 帳票認識装置および帳票認識方法 | |
JP3732254B2 (ja) | フォーマット情報生成方法及びフォーマット情報生成装置 | |
JP2009087378A (ja) | 帳票処理装置 | |
JP3673616B2 (ja) | 商品券識別方法及び装置 | |
JPH07114619A (ja) | 文書認識装置 | |
TWI807467B (zh) | 要項偵測模型建立方法、業務導向要項鍵值辨識系統及方法 | |
JP3000349B2 (ja) | キー入力編集方法及び編集装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090717 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110708 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120314 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120319 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120508 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120514 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4996940 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |