JP4733577B2 - 帳票認識装置及び帳票認識プログラム - Google Patents
帳票認識装置及び帳票認識プログラム Download PDFInfo
- Publication number
- JP4733577B2 JP4733577B2 JP2006191324A JP2006191324A JP4733577B2 JP 4733577 B2 JP4733577 B2 JP 4733577B2 JP 2006191324 A JP2006191324 A JP 2006191324A JP 2006191324 A JP2006191324 A JP 2006191324A JP 4733577 B2 JP4733577 B2 JP 4733577B2
- Authority
- JP
- Japan
- Prior art keywords
- item name
- detected
- frame
- character string
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 156
- 230000002040 relaxant effect Effects 0.000 description 10
- 238000012015 optical character recognition Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/225—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
20 画像入力装置
30 帳票認識装置
40 認識辞書
50 表示装置
60 画像データベース
Claims (8)
- 演算処理をするプロセッサと、前記プロセッサに接続される記憶部と、帳票の画像情報を帳票認識装置に入力する画像入力装置に接続されるインターフェースと、を備え、前記画像入力装置によって入力された帳票の画像情報を認識する帳票認識装置において、
前記記憶部には、各帳票に含まれるべき項目名が登録された項目名辞書、及び項目名と項目名との隣接関係が登録された項目名枠間隣接関係が格納され、
前記プロセッサは、
前記入力された帳票の画像情報の枠及び文字行を検出し、
前記検出された枠内の文字列を前記検出された文字行から検出し、前記検出された文字列から帳票内の項目名を認識し、
前記認識された項目名が存在する枠を項目名枠として検出し、
前記検出された項目名枠に基づいて、前記認識された項目名に対応するデータ枠を検出し、
前記検出されたデータ枠内の文字列を認識する認識処理を実行し、
前記項目名辞書に登録された項目名と前記認識された項目名とを比較し、
前記項目名辞書に登録された項目名のうち前記認識された項目名を除外し、前記除外されなかった項目名を前記認識されなかった項目名として特定し、
前記認識されなかった項目名がある場合、前記検出された項目名枠及び前記検出されたデータ枠を前記入力された帳票の画像情報から除外した不読領域を検出し、
前記認識されなかった項目名の項目名枠の前記検出された不読領域における位置を、前記認識された項目名及び前記項目名枠間隣接関係を参照して特定し、
前記特定された前記認識されなかった項目名の項目名枠に基づいて、前記認識されなかった項目名に対応するデータ枠を検出し、
前記検出されたデータ枠の文字列を認識し、
前記認識されなかった項目名の項目名枠の前記不読領域における位置が前記項目名枠間隣接関係を参照しても特定されなかった場合、リトライ処理を実行し、
前記リトライ処理は、
前記不読領域内の文字列を検出し、
前記認識されなかった項目名の文字列と前記不読領域で検出された文字列とを照合することによって、前記認識されなかった項目名を認識し、前記認識した項目名の項目名枠及び当該項目名枠に対応するデータ枠を検出することを特徴とする帳票認識装置。 - 前記プロセッサは、
前記リトライ処理において、前記認識されなかった項目名の文字列と前記不読領域で検出された文字列とを照合する場合、前記項目名辞書の項目名には、当該項目名が表す意味と同じ意味の文字列が登録されており、前記不読領域で検出された文字列が前記認識されなかった項目名と異なる場合であっても、前記不読領域で検出された文字列が前記項目名辞書に前記認識されなかった項目名が表す意味と同じ意味の文字列として登録されている場合、前記不読領域で検出された文字列を前記認識されなかった文字列と認識する方法を用いて、前記認識されなかった項目名を認識することを特徴とする請求項1に記載の帳票認識装置。 - 前記プロセッサは、
前記リトライ処理でも前記項目名が認識されなかった場合、
前記検出された枠から、前記不読領域内に含まれる枠を再度検出し、
前記再度検出された枠内の文字列を検出し、
前記検出された文字列と前記認識されなかった項目名とを照合することによって、前記認識されなかった項目名を再度認識することを特徴とする請求項1に記載の帳票認識装置。 - 前記プロセッサは、
前記リトライ処理でも前記項目名が認識されなかった場合、
前記検出された文字行から、前記認識されなかった領域内に含まれる文字行を再度検出し、
前記再度検出された文字行に基づいて文字列を検出し、
前記検出された文字列と前記認識されなかった項目名とを照合することによって、前記認識されなかった項目名を再度認識することを特徴とする請求項1に記載の帳票認識装置。 - 演算処理をするプロセッサと、前記プロセッサに接続される記憶部と、帳票の画像情報
を帳票認識装置に入力する画像入力装置に接続されるインターフェースと、を備える帳票
認識装置に、前記画像入力装置によって入力された帳票の画像情報を認識させるプログラ
ムであって、
前記記憶部には、各帳票に含まれるべき項目名が登録された項目名辞書、及び項目名と項目名との隣接関係が登録された項目名枠間隣接関係が格納され、
前記プログラムは、前記帳票認識装置に、
前記入力された帳票の画像情報の枠及び文字行を検出させ、
前記検出された枠内の文字列を前記検出された文字行から検出させ、前記検出された文字列から帳票内の項目名を認識させ、
前記認識された項目名が存在する枠を項目名枠として検出させ、
前記検出された項目名枠に基づいて、前記認識された項目名に対応するデータ枠を検出させ、
前記検出されたデータ枠内の文字列を認識する認識処理を実行させ、
前記項目名辞書に登録された項目名と前記認識された項目名とを比較させ、
前記項目名辞書に登録された項目名のうち前記認識された項目名を除外させ、前記除外されなかった項目名を前記認識されなかった項目名として特定させ、
前記認識されなかった項目名がある場合、前記検出された項目名枠及び前記検出されたデータ枠を前記入力された帳票の画像情報から除外した不読領域を検出させ、
前記認識されなかった項目名の項目名枠の前記検出された不読領域における位置を、前記認識された項目名及び前記項目名枠間隣接関係を参照して特定させ、
前記特定された前記認識されなかった項目名の項目名枠に基づいて、前記認識されなかった項目名に対応するデータ枠を検出させ、
前記検出されたデータ枠の文字列を認識させ、
前記認識されなかった項目名の項目名枠の前記不読領域における位置が前記項目名枠間隣接関係を参照しても特定されなかった場合、リトライ処理を実行させ、
前記リトライ処理は、
前記不読領域内の文字列を検出させ、
前記認識されなかった項目名の文字列と前記不読領域で検出された文字列とを照合することによって、前記認識されなかった項目名を認識し、前記認識した項目名の項目名枠及び当該項目名枠に対応するデータ枠を検出させることを特徴とするプログラム。 - 前記プログラムは、前記帳票認識装置に、
前記認識されなかった項目名の文字列と前記不読領域で検出された文字列とを照合させる場合、前記項目名辞書の項目名には、当該項目名が表す意味と同じ意味の文字列が登録されており、前記不読領域で検出された文字列が前記認識されなかった項目名と異なる場合であっても、前記不読領域で検出された文字列が前記項目名辞書に前記認識されなかった項目名が表す意味と同じ意味の文字列として登録されている場合、前記不読領域で検出された文字列を前記認識されなかった文字列と認識させる方法を用いて、前記認識されなかった項目名を認識させることを特徴とする請求項5に記載のプログラム。 - 前記プログラムは、前記帳票認識装置に、
前記リトライ処理でも前記項目名が認識されなかった場合、
前記検出された枠から、前記不読領域内に含まれる枠を再度検出させ、
前記再度検出された枠内の文字列を検出させ、
前記検出された文字列と前記認識されなかった項目名とを照合することによって、前記認識されなかった項目名を再度認識させることを特徴とする請求項5に記載のプログラム。 - 前記プログラムは、前記帳票認識装置に、
前記リトライ処理でも前記項目名が認識されなかった場合、
前記検出された文字行から、前記認識されなかった領域内に含まれる文字行を再度検出させ、
前記再度検出された文字行に基づいて文字列を検出させ、
前記検出された文字列と前記認識されなかった項目名とを照合することによって、前記認識されなかった項目名を再度認識させること請求項5に記載のプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006191324A JP4733577B2 (ja) | 2006-07-12 | 2006-07-12 | 帳票認識装置及び帳票認識プログラム |
KR1020060074608A KR20080006422A (ko) | 2006-07-12 | 2006-08-08 | 장표 인식 장치 및 장표 인식 프로그램 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006191324A JP4733577B2 (ja) | 2006-07-12 | 2006-07-12 | 帳票認識装置及び帳票認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008021068A JP2008021068A (ja) | 2008-01-31 |
JP4733577B2 true JP4733577B2 (ja) | 2011-07-27 |
Family
ID=39076957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006191324A Active JP4733577B2 (ja) | 2006-07-12 | 2006-07-12 | 帳票認識装置及び帳票認識プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4733577B2 (ja) |
KR (1) | KR20080006422A (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5216985B2 (ja) * | 2010-04-13 | 2013-06-19 | 寛 江川 | データ処理装置及び保険証照合システム |
JP5674615B2 (ja) * | 2011-09-28 | 2015-02-25 | 株式会社日立情報通信エンジニアリング | 文字認識装置及び文字認識方法 |
JP5703191B2 (ja) * | 2011-11-02 | 2015-04-15 | 株式会社日立製作所 | 文書認識支援装置、文書検索装置及び文書管理方法 |
JP6373664B2 (ja) * | 2014-07-09 | 2018-08-15 | 株式会社東芝 | 電子機器、方法及びプログラム |
JP6364051B2 (ja) * | 2016-09-15 | 2018-07-25 | 株式会社アイエスピー | ガイダンス付き文書情報取得方法、プログラム、及び携帯端末装置 |
JP6900164B2 (ja) * | 2016-09-27 | 2021-07-07 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP6736012B2 (ja) * | 2018-07-23 | 2020-08-05 | 日本生命保険相互会社 | 情報処理装置、情報処理方法、プログラム及び帳票読取システム |
JP7275617B2 (ja) * | 2019-02-06 | 2023-05-18 | 日本電信電話株式会社 | 情報処理装置、判別方法および判別プログラム |
JP7491107B2 (ja) | 2020-07-14 | 2024-05-28 | 株式会社リコー | 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム |
KR102643324B1 (ko) * | 2020-10-29 | 2024-03-07 | 닛폰세이테츠 가부시키가이샤 | 식별 장치, 식별 방법 및 프로그램 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0291785A (ja) * | 1988-09-29 | 1990-03-30 | Canon Inc | 画像認識方法及び装置 |
JPH10207981A (ja) * | 1997-01-20 | 1998-08-07 | Ricoh Co Ltd | 帳票認識方法 |
JP2002366893A (ja) * | 2001-06-08 | 2002-12-20 | Hitachi Ltd | 帳票認識方法 |
JP2005173730A (ja) * | 2003-12-08 | 2005-06-30 | Fuji Photo Film Co Ltd | 帳票ocrプログラム、方法及び装置 |
-
2006
- 2006-07-12 JP JP2006191324A patent/JP4733577B2/ja active Active
- 2006-08-08 KR KR1020060074608A patent/KR20080006422A/ko not_active Application Discontinuation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0291785A (ja) * | 1988-09-29 | 1990-03-30 | Canon Inc | 画像認識方法及び装置 |
JPH10207981A (ja) * | 1997-01-20 | 1998-08-07 | Ricoh Co Ltd | 帳票認識方法 |
JP2002366893A (ja) * | 2001-06-08 | 2002-12-20 | Hitachi Ltd | 帳票認識方法 |
JP2005173730A (ja) * | 2003-12-08 | 2005-06-30 | Fuji Photo Film Co Ltd | 帳票ocrプログラム、方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2008021068A (ja) | 2008-01-31 |
KR20080006422A (ko) | 2008-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4733577B2 (ja) | 帳票認識装置及び帳票認識プログラム | |
JP4996940B2 (ja) | 帳票認識装置およびそのプログラム | |
KR101122854B1 (ko) | 스캔된 문서들로부터 전자 서식들을 채우기 위한 방법 및장치 | |
US7991709B2 (en) | Method and apparatus for structuring documents utilizing recognition of an ordered sequence of identifiers | |
JP4841227B2 (ja) | 不正文字を検出するための装置、システム、プログラム、および方法(複数スキャン手法を用いる不正文字検出のための装置、システム、および方法) | |
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
US20020141660A1 (en) | Document scanner, system and method | |
US20170323170A1 (en) | Method and system for data extraction from images of semi-structured documents | |
JP2016048444A (ja) | 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法 | |
US11574211B2 (en) | Log analysis system, log analysis method, log analysis program, and storage medium | |
JP2014115781A (ja) | 文字認識装置及び方法、文字認識プログラム | |
JP7282989B2 (ja) | テキスト分類 | |
JP2009093305A (ja) | 帳票認識装置 | |
JP5669041B2 (ja) | 文書処理装置及び文書処理方法 | |
JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
JP4160206B2 (ja) | 文字認識装置を利用したデータベース登録方法 | |
JP3467437B2 (ja) | 文字認識装置及びその方法とプログラム記録媒体 | |
US20210042555A1 (en) | Information Processing Apparatus and Table Recognition Method | |
JP2005165978A (ja) | 帳票ocrプログラム、方法及び装置 | |
JPH07114619A (ja) | 文書認識装置 | |
JP4224914B2 (ja) | 文字読取システム及び文字読取方法 | |
JP5669044B2 (ja) | 文書検定システム及び文書検定方法 | |
JP2010205122A (ja) | レイアウト構造解析装置及びレイアウト構造解析方法 | |
KR20230013836A (ko) | 컴퓨터를 이용한 문서 분류 및 문자 추출 방법 | |
JPH117492A (ja) | キー入力編集方法及び編集装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110422 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140428 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4733577 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |