JP7267854B2 - 帳票認識装置、帳票認識方法、及び帳票認識システム - Google Patents
帳票認識装置、帳票認識方法、及び帳票認識システム Download PDFInfo
- Publication number
- JP7267854B2 JP7267854B2 JP2019118900A JP2019118900A JP7267854B2 JP 7267854 B2 JP7267854 B2 JP 7267854B2 JP 2019118900 A JP2019118900 A JP 2019118900A JP 2019118900 A JP2019118900 A JP 2019118900A JP 7267854 B2 JP7267854 B2 JP 7267854B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- pixels
- form recognition
- image
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
Description
本実施形態における帳票装置100は、図2の(A)に示す入力画像から図2の(B)に示す網掛けを除去した画像を生成する。図3を用いて、制御部150における帳票認識の概略の処理フローを示す。網掛け領域は、処理対象となる帳票上の領域が所定の微小パターン(例えば、点)や細い線の交差が周期的に配置された領域である。また、以下の説明において、文字といった場合には、かな、漢字等の文字情報のほか、英数字をはじめ、記号、符号、図形等の様々な識別情報を含む。これらの点は、第1実施形態以降、第3実施形態までの各実施形態についても同様である。本実施形態の説明においては、図4の網掛け画像を例として説明する。図2が孤立点の網掛けであるのに対し、図4は孤立点ではなく、線の交差で網掛けを表現している。なお、以下の例は図2の孤立点で表現した網掛けに対しても有効である。
まず、ステップ300の画像入力では、制御部150(網掛け領域抽出部)が、画像入力部130が入力した帳票画像を読み出す。以降の処理は2値画像を前提とした処理であるため、カラー画像の帳票が入力された場合は制御部150(2値化部)が2値化し、2値画像の帳票が入力された場合はそのまま後段の処理に用いる。
第1実施形態では、入力画像から網掛け領域を抽出し、抽出した領域内の網掛け画素を除去した。これに対し、第2実施形態は、網掛け領域抽出や網掛け除去のパラメータ調整のためのGUIに関する。
第2実施形態では、網掛け領域抽出や網掛け除去のパラメータを、GUIを用いて調整した。これに対し、第3実施形態は、最適なパラメータを自動的に決定する。
まず、ステップ1200において、制御部150(パラメータ設定部)は、最大スコアの初期値をセットする。
110 操作部
120 表示部
130 画像入力部
140 記憶部
150 制御部
160 インターフェース(IF)
200 サーバ装置
210 操作部
220 表示部
230 制御部
240 記憶部
250 インターフェース(IF)
Claims (6)
- 画像入力部から入力された帳票画像を行単位、および列単位で黒画素の連続している長さが所定の値以下の画素を抽出することにより、前記帳票画像の中から網掛け領域を抽出する網掛け領域抽出部と、
前記帳票画像の網掛け領域内において、行単位、および列単位で黒画素の連続している長さが所定の値以下の画素を除去することにより、前記帳票画像の中から網掛け画素を除去する網掛け除去部と、
画像入力部から入力された帳票画像に対して、前記網掛け領域抽出部が行う網掛け領域抽出のパラメータ、および前記網掛け除去部が行う網掛け除去のパラメータを設定するパラメータ設定部と、
設定されたパラメータを用いて帳票認識を実行する帳票認識部と、
帳票認識の結果を用いて、網掛け除去を評価するためのスコアを計算するスコア計算部と、
パラメータを変更して前記パラメータ設定部、前記帳票認識部、前記スコア計算部の処理を繰り返し、前記スコアが最大となるパラメータを前記網掛け領域の抽出および前記網掛け除去のパラメータに決定するパラメータ記録部と、
を備えることを特徴とする帳票認識装置。 - 請求項1に記載された帳票認識装置であって、
前記網掛け領域抽出部は、前記帳票画像の横方向の黒画素の連続性を評価して、横方向の網掛け画素の候補を抽出し、前記帳票画像の縦方向の黒画素の連続性を評価して、縦方向の網掛け画素の候補を抽出し、前記横方向の網掛け画素の候補と縦方向の網掛け画素の候補の両方で共通する黒画素を網掛け画素として抽出し、前記網掛け画素候補を連結して得られた隣接して得られた領域を網掛け領域とする、
ことを特徴とする帳票認識装置。 - 請求項1に記載された帳票認識装置であって、
前記網掛け除去部は、前記網掛け領域抽出部により抽出された前記網掛け領域に対応する入力帳票の画像から、横方向、および縦方向の黒画素の連続性を評価することにより、網掛けの画素であると判別し、網掛けの画素を除去する、
ことを特徴とする帳票認識装置。 - 請求項1に記載された帳票認識装置であって、
前記画像入力部から入力された帳票画像の表示領域と、前記網掛け領域抽出部の処理結果として得られた画像の表示領域と、前記網掛け除去部の処理結果として得られた画像の表示領域と、網掛け領域抽出のパラメータを入力および表示する領域と、網掛け除去のパラメータを入力および表示する領域と、を含む画面を表示部に表示する制御部、
を備えたことを特徴とする帳票認識装置。 - 網掛け領域抽出部が、画像入力部から入力された帳票画像を行単位、および列単位で黒画素の連続している長さが所定の値以下の画素を抽出することにより、前記帳票画像の中から網掛け領域を抽出し、
網掛け除去部が、前記帳票画像の網掛け領域内において、行単位、および列単位で黒画素の連続している長さが所定の値以下の画素を除去することにより、前記帳票画像の中から網掛け画素を除去する場合において、
パラメータ設定部が、画像入力部から入力された帳票画像に対して、前記網掛け領域抽出部が行う網掛け領域抽出のパラメータ、および前記網掛け除去部が行う網掛け除去のパラメータを設定し、
帳票認識部が、設定されたパラメータを用いて帳票認識を実行し、
スコア計算部が、帳票認識の結果を用いて、網掛け除去を評価するためのスコアを計算し、
パラメータ記録部が、パラメータを変更して前記パラメータ設定部、前記帳票認識部、前記スコア計算部の処理を繰り返し、前記スコアが最大となるパラメータを前記網掛け領域の抽出および前記網掛け除去のパラメータに決定する、
ことを特徴とする帳票認識方法。 - 帳票認識装置とサーバ装置とがネットワークを介して接続された帳票認識システムであって、
前記帳票認識装置は、
帳票画像を入力する画像入力部と、
前記画像入力部が入力した帳票画像を前記サーバ装置に送信し、前記サーバ装置から網掛け画素が除去された画像を受信する通信部と、
前記通信部が受信した前記網掛け画素が除去された画像を出力する制御部と、を備え、
前記サーバ装置は、
前記帳票認識装置から前記帳票画像を受信し、前記網掛け画素が除去された画像を前記帳票認識装置に送信するサーバ通信部と、
前記帳票認識装置から受信した前記帳票画像を行単位、および列単位で黒画素の連続している長さが所定の値以下の画素を抽出することにより、前記帳票画像の中から網掛け領域を抽出する網掛け領域抽出部と、
前記帳票画像の網掛け領域内において、行単位、および列単位で黒画素の連続している長さが所定の値以下の画素を除去することにより、前記帳票画像の中から網掛け画素を除去する網掛け除去部と、を有し、
前記帳票認識装置は、
画像入力部から入力された帳票画像に対して、前記網掛け領域抽出部が行う網掛け領域抽出のパラメータ、および前記網掛け除去部が行う網掛け除去のパラメータを設定するパラメータ設定部と、
設定されたパラメータを用いて帳票認識を実行する帳票認識部と、
帳票認識の結果を用いて、網掛け除去を評価するためのスコアを計算するスコア計算部と、
パラメータを変更して前記パラメータ設定部、前記帳票認識部、前記スコア計算部の処理を繰り返し、前記スコアが最大となるパラメータを前記網掛け領域の抽出および前記網掛け除去のパラメータに決定するパラメータ記録部と、
を備えることを特徴とする帳票認識システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019118900A JP7267854B2 (ja) | 2019-06-26 | 2019-06-26 | 帳票認識装置、帳票認識方法、及び帳票認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019118900A JP7267854B2 (ja) | 2019-06-26 | 2019-06-26 | 帳票認識装置、帳票認識方法、及び帳票認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021005234A JP2021005234A (ja) | 2021-01-14 |
JP7267854B2 true JP7267854B2 (ja) | 2023-05-02 |
Family
ID=74097260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019118900A Active JP7267854B2 (ja) | 2019-06-26 | 2019-06-26 | 帳票認識装置、帳票認識方法、及び帳票認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7267854B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116071770B (zh) * | 2023-03-06 | 2023-06-16 | 深圳前海环融联易信息科技服务有限公司 | 表格通用识别方法、装置、设备和介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000196882A (ja) | 1998-12-25 | 2000-07-14 | Fujitsu Ltd | 二値画像変換装置 |
JP2003223612A (ja) | 2002-01-31 | 2003-08-08 | Ricoh Co Ltd | 画像処理方法および装置 |
JP2010219577A (ja) | 2009-03-13 | 2010-09-30 | Murata Machinery Ltd | 画像処理装置 |
JP2010244472A (ja) | 2009-04-09 | 2010-10-28 | Hitachi Omron Terminal Solutions Corp | 画像処理装置及び方法 |
JP2013084071A (ja) | 2011-10-07 | 2013-05-09 | Hitachi Computer Peripherals Co Ltd | 帳票認識方法および帳票認識装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0877294A (ja) * | 1994-09-06 | 1996-03-22 | Toshiba Corp | 文書画像処理装置 |
JP3426747B2 (ja) * | 1994-11-24 | 2003-07-14 | 京セラミタ株式会社 | カラー網点領域判定装置 |
-
2019
- 2019-06-26 JP JP2019118900A patent/JP7267854B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000196882A (ja) | 1998-12-25 | 2000-07-14 | Fujitsu Ltd | 二値画像変換装置 |
JP2003223612A (ja) | 2002-01-31 | 2003-08-08 | Ricoh Co Ltd | 画像処理方法および装置 |
JP2010219577A (ja) | 2009-03-13 | 2010-09-30 | Murata Machinery Ltd | 画像処理装置 |
JP2010244472A (ja) | 2009-04-09 | 2010-10-28 | Hitachi Omron Terminal Solutions Corp | 画像処理装置及び方法 |
JP2013084071A (ja) | 2011-10-07 | 2013-05-09 | Hitachi Computer Peripherals Co Ltd | 帳票認識方法および帳票認識装置 |
Non-Patent Citations (2)
Title |
---|
Arturo Pizano,"Extracting Line Features from Images of Business Forms and Tables",Proceedings., 11th IAPR International Conference on Pattern Recognition. Vol. III. Conference C: Image, Speech and Signal Analysis,,米国,IEEE,1992年08月30日,pp.399-403 |
田中 宏、外3名,"テクスチャ領域を含む帳票画像からの罫線抽出",電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2007年03月08日,Vol.106, No.605,pp.67-72 |
Also Published As
Publication number | Publication date |
---|---|
JP2021005234A (ja) | 2021-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110942074B (zh) | 字符切分识别方法、装置、电子设备、存储介质 | |
US9189694B2 (en) | Image processing device and image processing method | |
US10740899B2 (en) | Image processing apparatus for identifying region within image, information processing method, and storage medium | |
US20130058569A1 (en) | Image processing apparatus, image processing method, and non-transitory computer readable medium | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US11341739B2 (en) | Image processing device, image processing method, and program recording medium | |
EP2569930A2 (en) | Segmentation of a word bitmap into individual characters or glyphs during an ocr process | |
JP2009169948A (ja) | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 | |
KR102090973B1 (ko) | 정보 처리장치, 정보 처리방법, 및 기억매체 | |
JP4159720B2 (ja) | 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
JP5906788B2 (ja) | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム | |
JP7267854B2 (ja) | 帳票認識装置、帳票認識方法、及び帳票認識システム | |
US8891822B2 (en) | System and method for script and orientation detection of images using artificial neural networks | |
US20220406081A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP5794154B2 (ja) | 画像処理プログラム、画像処理方法、及び画像処理装置 | |
JP7013341B2 (ja) | 帳票認識装置、帳票認識方法、及び帳票認識プログラム | |
JP7338159B2 (ja) | 情報処理装置及びプログラム | |
US20200304683A1 (en) | Image processing apparatus and non-transitory computer readable medium | |
US20220406083A1 (en) | Image processing apparatus, control method thereof, and storage medium | |
JP3058489B2 (ja) | 文字列抽出方法 | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
US7103220B2 (en) | Image processing apparatus, method and program, and storage medium | |
JP6187307B2 (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230418 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230420 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7267854 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |