JP2007328820A - 帳票認識方法 - Google Patents
帳票認識方法 Download PDFInfo
- Publication number
- JP2007328820A JP2007328820A JP2007229653A JP2007229653A JP2007328820A JP 2007328820 A JP2007328820 A JP 2007328820A JP 2007229653 A JP2007229653 A JP 2007229653A JP 2007229653 A JP2007229653 A JP 2007229653A JP 2007328820 A JP2007328820 A JP 2007328820A
- Authority
- JP
- Japan
- Prior art keywords
- identification
- type
- image
- form type
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
帳票の種類が多様な読み取り対象に対して,高精度な帳票認識手法を提案することである。また,種類の識別手法を提案することである。また,帳票に記載されている下線を抽出する手法を提供することである。
【解決手段】
帳票画像200から罫線枠204,206と文字行212を抽出し,文字識別結果と単語辞書を照合することにより,文字識別の誤りを修正する。表の特徴と,照合により求めた帳票名と項目名から帳票の種類を識別する。帳票画像から文字行と罫線を抽出し,抽出した罫線から枠を構成する罫線を除去し,残りの罫線と文字行の配置を比較することにより,下線を抽出する。
【効果】
登記済通知書のような非定型帳票に対しても高精度に帳票の種類を識別することができ,下線を文字中のストロークなどと間違うことなく,高精度に抽出することができる。
【選択図】 図2
Description
第1は,全ての種類の帳票に対して同じ位置に記載された帳票の種類を表すID番号を読み取ることにより,帳票の種類を識別する方式である。第2は,帳票の種類ごとに枠の構造が異なる場合に,枠の構造を識別することにより帳票の種類を識別する方式である。この例は,特開平7―141462号公報に記載されている。
物登記済通知書(専有)」,「表示に関する土地登記済通知書」,「表示に関する建物登記済通知書(一般)」,「表示に関する建物登記済通知書(一棟)」,「表示に関する建物登記済通知書(専有)」の7種類である。このうち,「表示に関する建物登記済通知書(一般)」と「表示に関する建物登記済通知書(一棟)」は,一字しか違わないため,この二種類に対する識別精度が低くなる可能性がある。
高精度な帳票識別手段を有する帳票認識手段を提案することである。
とを具備し,当該3つの手段の結果を組み合わせることにより,登記済通知書の種類を識別する帳票認識方法を提供する。
当該枠内の文字行と当該枠内の枠罫線でない罫線との位置関係から,当該枠内の枠罫線でない罫線が下線か否かを判定する下線検出手段を具備する帳票認識方法を提供する。
記情報を読み出す。当該読み出した登録情報と認識結果の一部を照合し,矛盾がないかどうかの検定を行う。
画像縮小部202では,後続の処理の高速化のため帳票画像を縮小し,縮小画像248を出力する。縮小処理は,細い罫線が縮小後かすれないよう,画素ごとのOR処理を行う。縮小した画像に対し,罫線抽出部204において実線と点線の罫線を抽出する。実線は,黒画素の連続するつながりをもとに抽出される。点線は,黒画素の連結成分の外接矩形の配置,サイズの拘束条件をもとに抽出される。枠抽出部206では,204で抽出した罫線から罫線が四方を取り囲む枠を求め,枠の頂点座標250を出力する。表特徴抽出部208では,206で抽出された枠の情報から,枠の集まりである表の特徴量を抽出する。この特徴量とは,縦横の罫線の本数や,罫線同士の接続関係,枠の位置関係等である。
ステップ324では,文字識別結果を項目名の単語と照合して項目名を識別する。ステップ326では,文字識別結果を内容の単語と照合して内容を識別する。
ステップ328では,ステップ308の処理結果である表の特徴とステップ322の処理結果である帳票名とステップ324の処理結果である項目名から帳票の種類を識別する。ステップ330では,300から328の処理で得た結果を出力する。
罫線抽出処理304,枠抽出処理306,文字行抽出処理310の結果を用いて,ステップ800では,枠を構成しない罫線を抽出する。ステップ802では,ステップ800で抽出した罫線の本数分だけ,以下の処理を繰り返す。ステップ804では,文字行の座標と罫線の座標を比較する。比較の方法については図9と図10を用いて説明する。ステップ806では,比較した値が基準を満たすか否かを判定する。基準値を満たす場合,ステップ808で,比較対象の罫線を下線とする。なお,上記ステップ808において抽出された2本の下線について,端点同士がが微小な間隔で離れており,延長線上に存在する場合には,1本の下線であるとすることもできる。また,上記ステップ808において抽出した下線の長さが基準値以下であれば,下線とみなさないとすることもできる。
ステップ1606において,1708と1710について,許容範囲w(1712)の範囲内の面積を基準値と比較する。この場合,1708は基準値以上,1710は基準値未満であるとすると,1700,1702,1704は下線であり,1706は下線ではないと判定できる。
ステップ308では表の特徴量を抽出する。ステップ322では帳票名の単語照合結果を求める。ステップ324では項目名の単語照合結果を求める。ステップ1800では,308,322,324の結果からそれぞれ導出される帳票の種類を用いて,多数決により帳票種類を識別する。
Claims (11)
- 帳票の種類を認識する帳票種類認識装置であって、
帳票画像の入力を受ける入力部と、
該帳票画像の全体の特徴を抽出し、該特徴を既存の帳票の全体の特徴データと照合して、前記帳票画像の種類の認識に用いる第1の帳票種類認識系と、
該帳票画像の一部の特徴を抽出し、該特徴を既存の帳票の一部の特徴データと照合して、前記帳票画像の種類の認識に用いる第2の帳票種類認識系とを具備し、
前記第1の帳票種類認識系は、前記帳票画像から罫線パタンについての特徴を抽出し、かつ、前記既存の帳票の全体の特徴データとして該帳票の罫線パタンについての特徴データを用いる認識系であることを特徴とする帳票種類認識装置。 - 請求項1記載の帳票種類認識装置であって、
前記既存の帳票の全体の特徴データを保持している第1の辞書と、
前記既存の帳票の一部の特徴を保持している第2の辞書とを備えたことを特徴とする帳票種類認識装置。 - 請求項1記載の帳票種別認識装置であって、
前記第2の帳票種類認識系は、前記帳票画像から複数の部分パタンについての特徴を抽出し、かつ、前記既存の帳票の一部の特徴データとして該帳票の複数の部分パタンについての特徴データを用いる認識系であることを特徴とする帳票種類認識装置。 - 請求項1記載の帳票種別認識装置であって、
前記第1の帳票種類認識系と前記第2の帳票種類認識系との認識結果により帳票種類候補を絞り込むことを特徴とする帳票種類認識装置。 - 請求項1記載の帳票種別認識装置であって、
前記帳票の一部が、1帳票中に複数設定されていることを特徴とする帳票種別認識装置。 - 請求項1記載の帳票種類認識装置であって、
前記第2の帳票種類認識系で用いる帳票画像の一部の特徴は、帳票中の文字列であり、前記既存の帳票の一部の特徴データとして、各帳票種類についての特徴的な文字列を用いる認識系であることを特徴とする帳票種類識別装置。 - 請求項1記載の帳票種類認識装置であって、
前記第2の帳票種類認識系で用いる帳票画像の一部の特徴は、帳票中の文字列であり、前記既存の帳票の一部の特徴データとして、各帳票種類についての項目名を用いる認識系であることを特徴とする帳票種類識別装置。 - 帳票種類を識別する帳票識別装置であって、
帳票画像の入力を受ける入力部と、該帳票画像の帳票種類を識別する識別部とを有し、
前記識別部は、
入力された帳票画像から表の特徴量を抽出して帳票種別を識別する第1処理部と、
前記帳票画像から帳票名に関する単語を抽出して帳票種別を識別する第2処理部と、
前記帳票画像から帳票名以外の項目に関する単語を抽出して帳票種別を識別する第3処理部と、
からなり、
前記第1処理部による識別結果と、前記第2処理部による識別結果と、前記第3処理部による
識別結果との、いずれか1つの識別結果を用いて帳票種別を決定することを特徴とする帳票識別装置。 - 請求項8に記載の帳票識別装置であって、
前記識別部は、
前記第1処理部による識別結果と、前記第2処理部による識別結果と、前記第3処理部による識別結果との、いずれか1つの識別結果を用いて帳票種別を決定し、他の1つの識別結果を用いてその決定内容を検証することを特徴とする帳票識別装置。 - 請求項8もしくは請求項9に記載の帳票識別装置であって、
前記識別部は、
前記第1処理部による識別処理を行い、次に前記第2処理部による識別処理を行い、最後に前記第3処理部による識別処理を行うことを特徴とする帳票識別装置。 - 請求項8に記載の帳票識別装置であって、
前記識別部は、
前記第1処理部による識別結果と、前記第2処理部による識別結果と、前記第3処理部による識別結果との多数決を用いて帳票種別を決定することを特徴とする帳票識別装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007229653A JP2007328820A (ja) | 2007-09-05 | 2007-09-05 | 帳票認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007229653A JP2007328820A (ja) | 2007-09-05 | 2007-09-05 | 帳票認識方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005127313A Division JP2005293605A (ja) | 2005-04-26 | 2005-04-26 | 帳票認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007328820A true JP2007328820A (ja) | 2007-12-20 |
Family
ID=38929182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007229653A Pending JP2007328820A (ja) | 2007-09-05 | 2007-09-05 | 帳票認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007328820A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106649420A (zh) * | 2015-11-02 | 2017-05-10 | 富士施乐株式会社 | 图像处理设备和图像处理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6238984A (ja) * | 1985-08-14 | 1987-02-19 | Hitachi Ltd | 光学文字読取方式 |
JPH07141462A (ja) * | 1993-11-19 | 1995-06-02 | Hitachi Ltd | 文書システム |
JPH09305701A (ja) * | 1996-05-09 | 1997-11-28 | Hitachi Ltd | 帳票認識方法 |
-
2007
- 2007-09-05 JP JP2007229653A patent/JP2007328820A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6238984A (ja) * | 1985-08-14 | 1987-02-19 | Hitachi Ltd | 光学文字読取方式 |
JPH07141462A (ja) * | 1993-11-19 | 1995-06-02 | Hitachi Ltd | 文書システム |
JPH09305701A (ja) * | 1996-05-09 | 1997-11-28 | Hitachi Ltd | 帳票認識方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106649420A (zh) * | 2015-11-02 | 2017-05-10 | 富士施乐株式会社 | 图像处理设备和图像处理方法 |
JP2017090974A (ja) * | 2015-11-02 | 2017-05-25 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
CN106649420B (zh) * | 2015-11-02 | 2021-03-30 | 富士施乐株式会社 | 图像处理设备和图像处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8792715B2 (en) | System and method for forms classification by line-art alignment | |
US7120318B2 (en) | Automatic document reading system for technical drawings | |
US8059868B2 (en) | License plate recognition apparatus, license plate recognition method, and computer-readable storage medium | |
JP6286866B2 (ja) | 画像処理装置および画像処理方法 | |
US8781229B2 (en) | System and method for localizing data fields on structured and semi-structured forms | |
JP4661921B2 (ja) | 文書処理装置およびプログラム | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP6831951B2 (ja) | 画像認識システム | |
JPH09245173A (ja) | 画像処理方法 | |
JP2000285190A (ja) | 帳票識別方法および帳票識別装置および記憶媒体 | |
US7227997B2 (en) | Image recognition apparatus, image recognition method, and image recognition program | |
JP3689485B2 (ja) | 帳票認識方法 | |
JP2003109007A (ja) | 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置 | |
US7853194B2 (en) | Material processing apparatus, material processing method and material processing program | |
JP2007328820A (ja) | 帳票認識方法 | |
JP2005293605A (ja) | 帳票認識方法 | |
JP4046941B2 (ja) | 文書書式識別装置および識別方法 | |
JP4853313B2 (ja) | 文字認識装置 | |
JP2005250786A (ja) | 画像認識方法 | |
JP2009087378A (ja) | 帳票処理装置 | |
US20060188863A1 (en) | Material processing apparatus, material processing method, and material processing program product | |
JP4521377B2 (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP2006234996A (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
JP4221960B2 (ja) | 帳票識別装置及びその識別方法 | |
JP6941331B2 (ja) | 画像認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070919 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100422 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100518 |