JP2014235694A - 帳票処理装置、帳票処理方法、帳票処理プログラム - Google Patents
帳票処理装置、帳票処理方法、帳票処理プログラム Download PDFInfo
- Publication number
- JP2014235694A JP2014235694A JP2013118849A JP2013118849A JP2014235694A JP 2014235694 A JP2014235694 A JP 2014235694A JP 2013118849 A JP2013118849 A JP 2013118849A JP 2013118849 A JP2013118849 A JP 2013118849A JP 2014235694 A JP2014235694 A JP 2014235694A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- color
- unit
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 37
- 238000003672 processing method Methods 0.000 title claims 3
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000011156 evaluation Methods 0.000 claims description 32
- 238000000605 extraction Methods 0.000 claims description 19
- 239000003086 colorant Substances 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims 1
- 238000007639 printing Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 238000012015 optical character recognition Methods 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
Description
図1は、本発明の実施形態1に係る帳票処理装置100機能ブロック図である。帳票認識装置100は、帳票画像を処理する装置であり、画像入力部110、色抽出部120、文字認識部130、文字列生成部140、表記辞書読出部151、表記辞書152、文字列評価部160、記憶装置170、出力部180を備える。
画像入力部110は、カラー帳票画像を取得する(S401)。色抽出部120は、カラー帳票画像からプレ印刷色と記載文字色を抽出する(S402)。このとき、近似した色については同一色とみなしてもよい。ステップS402において抽出した各色について、以下のステップS404〜S405を繰り返す。
文字認識部130は、ステップS402において抽出されたいずれか1色を残してその他の色をドロップアウトすることにより、2値化画像を生成する。文字認識部130はさらに、生成した2値化画像に対してレイアウト解析を実施し、文字行を抽出する。例えば帳票画像内の罫線や点線を抽出し、抽出された罫線や点線に基づき表部分を抽出し、表の内外から文字行を抽出することができる。帳票画像全体のレイアウトについては、同様の手法により実施してもよいし、例えば表記辞書152内のレイアウト情報を用いて認識してもよい。
文字認識部130は、ステップS404において抽出した文字行内の各文字を識別するため、文字認識を実施する。具体的には、文字行から文字を切り出して文字列パターンを生成し、生成した文字パターンと表記辞書152内の文字認識辞書が保持している文字パターンを比較することにより、各文字を識別する。文字認識部130は、識別した文字パターンの帳票画像内における座標値や識別結果を、記憶装置170に格納する。
文字列生成部140は、ステップS405において認識された文字を用いて、表記辞書152内の知識辞書が保持している文字列パターンに合致する候補文字列を生成する。具体的には、プレ印刷文字と記載文字それぞれの順序を入れ替えることにより、複数の文字列パターンを候補文字列として生成する。本ステップの詳細は後述の図5で説明する。
文字列評価部160は、ステップS406において生成された候補文字列と表記辞書152内の知識辞書が保持している文字列パターンを比較することにより、言語照合を実施する(S407)。文字列評価部160は、言語照合の結果に基づき、候補文字列に対してスコアを付与する(S408)。
出力部180は、文字列評価部160による評価結果を出力する。評価結果をGUIとして出力する場合の画面例については後述の図8で説明する。
文字列生成部140は、ステップS405において認識された記載文字とプレ印刷文字を、候補文字列の初期値とする(S501)。文字列生成部140は、各文字に関連付けられている座標値に基づき、記載文字とプレ印刷文字が行単位で重なりあうか否かを確認する(S502)。行が重なり合っている場合はステップS503へ進み、重なり合っていない場合はステップS501において生成した候補文字列をそのまま用いる。
文字列生成部140は、記載文字とプレ印刷文字が行単位で重なりあうかを判断する際に、ある程度の許容範囲を設けてもよい。例えば、記載文字とプレ印刷文字が重なり合っている部分の高さが文字高さの半分以内であれば、これらは同じ行内に記載されているとみなすことができる。これにより、記載文字が高さ方向に若干ずれている場合であってもプレ印刷文字と同じ行内に記載されているものとして処理することができる。
文字列生成部140は、ステップS405の文字認識によって得られた各文字の座標値に基づき、記載文字とプレ印刷文字をそれぞれ左端座標でソートする。これにより例えば図3の文字行302内に記載されている文字列は左詰めされ、文字列303となる。
文字列生成部140は、各文字の座標値に基づき、記載文字とプレ印刷文字が文字単位で重なっているか否かを確認する。文字単位で重なっている場合はステップS505へ進み、重なっていない場合はステップS503で生成した文字列を候補文字列とする。
文字列生成部140は、記載文字の文字順とプレ印刷文字の文字順を入れ替えることにより、文字認識の最終結果の候補となる候補文字列を生成する。例えば以下のような仮説に基づいて文字順を入れ替えることにより、候補文字列を生成することができる。
(手法例1)記載文字が左にずれることにより記載文字とプレ印刷文字が文字単位で重なっていると仮定し、記載文字を右方向にX文字ずらす:
(手法例2)記載文字が右にずれることにより記載文字とプレ印刷文字が文字単位で重なっていると仮定し、記載文字を左方向にX文字ずらす:
(手法例3)記載文字が大きく右にずれることにより記載文字とプレ印刷文字が文字単位で重なっていると仮定し、まず全ての記載文字を左から順にセットし、その後にプレ印刷文字が続く文字列を生成する:
(手法例4)記載文字が大きく左にずれることにより記載文字とプレ印刷文字が文字単位で重なっていると仮定し、まず全てのプレ印刷文字を左から順にセットし、その後に記載文字が続く文字列を生成する。
文字認識部130は、記載文字の文字間隔が文字行の高さ以上ある場合は、記載文字のなかにスペース文字が含まれていると判断することもできる。プレ印刷文字についても同様である。文字列生成部140は、記載文字内のスペース部分にプレ印刷文字を挿入し、またはプレ印刷文字内のスペース部分に記載文字を挿入することにより、候補文字列を生成することもできる。各文字が複数の色で記載されている場合は、挿入する文字を色毎に組み合わせることもできる。
以上のように、本実施形態1に係る帳票処理装置100は、帳票画像から色毎に文字を認識して文字順を入れ替えることにより候補文字列を生成し、候補文字列と表記辞書152を照合することにより候補文字列が正しいか否かを評価する。これにより、プレ印刷文字と記載文字が重なっている場合であっても、文字列を精度よく認識することができる。
実施形態1では、色毎に文字を認識して文字順を入れ替えることを説明した。色毎に文字を認識する際には、認識対象外の色はドロップアウトする。このとき、記載文字やプレ印刷に濃淡むらがあると、カラードロップアウトを実施することにより文字の一部が欠落してしまう可能性がある。そこで本発明の実施形態2では、色をドロップアウトする程度が異なる複数の2値化画像を生成し、これらを比較することにより濃淡むらを補償する手法を説明する。帳票処理装置100の構成は実施形態1と同様であるため、以下では濃淡むらに関する動作について主に説明する。
以上のように、本実施形態2に係る帳票処理装置100は、カラードロップアウトを実施する範囲を変更して複数の2値化画像を生成し、これらに対する文字認識結果を照合することにより最も尤もらしい文字認識結果を特定する。これにより、記載文字に濃淡むらや滲みがある場合であっても、精度よく文字認識を実施することができる。
実施形態1〜2において、カラー帳票画像内にはプレ印刷文字と記載文字が重なっている部分と重なっていない部分が混在している場合がある。両者が重なっていない部分については従来の文字認識手法を用いるのみで充分であると考えられる。そこで、例えば入力されたカラー帳票画像に対して従来の文字認識をいったん実施し、認識できなかった部分に対してのみ実施形態1で説明した手法を実施するようにしてもよい。これにより、帳票全面に対して文字の重なりを調べる必要がなくなり、処理時間の短縮につながる。
Claims (11)
- 帳票画像を処理する装置であって、
前記帳票画像を受け取る画像入力部と、
前記帳票画像内に含まれる色を抽出する色抽出部と、
前記帳票画像内に記述されている文字を前記色抽出部が抽出した色毎に認識する文字認識部と、
前記文字認識部が前記色毎に認識した文字を連結することにより複数の候補文字列を生成する文字列生成部と、
前記帳票画像内に記述されている文字列パターンを含む複数の文字列パターンを格納する表記辞書から前記文字列パターンを読み出す表記辞書読出部と、
各前記候補文字列と前記表記辞書内の文字列パターンを比較することにより各前記候補文字列と前記表記辞書内の文字列パターンとの間の合致度を評価する文字列評価部と、
前記文字列評価部による評価結果と前記候補文字列を出力する出力部と、
を備えることを特徴とする帳票処理装置。 - 前記文字列生成部は、前記文字認識部が認識した文字を前記色抽出部が抽出した色毎に連結することにより前記色毎に前記候補文字列を生成し、
前記文字列評価部は、
前記文字認識部が生成した前記色毎の文字列が前記帳票画像内において文字単位で重なり合っている場合は、各前記文字列内の文字の位置をずらして連結することにより前記複数の候補文字列を生成し、
前記文字認識部が生成した前記色毎の文字列が前記帳票画像内において文字単位で重なり合っていない場合は、前記文字認識部が生成した前記色毎の文字列を前記候補文字列として用いる
ことを特徴とする請求項1記載の帳票処理装置。 - 前記文字認識部は、前記色毎に認識した文字間の距離が所定値以上である場合は、その文字間にはスペース文字が記載されていると認識し、
前記文字列生成部は、ある前記色について前記文字認識部がスペース文字として認識した部分に対して他の前記色の文字を挿入することによって前記候補文字列を生成する
ことを特徴とする請求項2記載の帳票処理装置。 - 前記文字認識部は、
前記帳票画像を、前記色抽出部が抽出した色を中心とする所定範囲内の色値を有する部分とその他の部分に分割することにより、前記帳票画像内において文字が記述されている部分領域を抽出し、
さらに前記所定範囲を変化させて前記分割を実施することにより、同じ文字が記述されている複数の前記部分領域を抽出し、各前記部分領域を用いて前記文字を認識した結果を照合して最も尤もらしい認識結果を特定する
ことを特徴とする請求項1記載の帳票処理装置。 - 前記文字列生成部は、前記文字認識部が認識した複数の文字のうち、文字の高さ方向において所定範囲内に含まれるものは、同じ行内に記述されている文字とみなし、同じ行内に記述されているとみなした文字を連結することにより、前記色抽出部が抽出した色毎に前記候補文字列を生成する
ことを特徴とする請求項2記載の帳票処理装置。 - 前記出力部は、前記文字列評価部が評価した前記合致度が所定範囲内にあるものについてのみ、前記評価結果を出力する
ことを特徴とする請求項1記載の帳票処理装置。 - 前記出力部は、前記文字列評価部が評価した前記文字列パターンを、前記評価結果と併せて出力する
ことを特徴とする請求項1記載の帳票処理装置。 - 前記出力部は、前記文字列評価部が評価した前記文字列パターンを、前記色抽出部が抽出した色毎に区別して出力する
ことを特徴とする請求項7記載の帳票処理装置。 - 前記出力部は、前記評価結果と前記候補文字列を画面表示する表示部として構成されており、
前記表示部は、前評価結果を修正するための修正入力欄を有し、
前記修正入力欄が表示する初期値は、最も高い前記評価結果を有する前記候補文字列である
ことを特徴とする請求項7記載の帳票処理装置。 - 帳票画像を処理する方法であって、
前記帳票画像を受け取る画像入力ステップ、
前記帳票画像内に含まれる色を抽出する色抽出ステップ、
前記帳票画像内に記述されている文字を前記色抽出ステップにおいて抽出した色毎に認識する文字認識ステップ、
前記文字認識ステップにおいて前記色毎に認識した文字を連結することにより複数の候補文字列を生成する文字列生成ステップ、
前記帳票画像内に記述されている文字列パターンを含む複数の文字列パターンを格納する表記辞書から前記文字列パターンを読み出す表記辞書読出ステップ、
各前記候補文字列と前記表記辞書内の文字列パターンを比較することにより各前記候補文字列と前記表記辞書内の文字列パターンとの間の合致度を評価する文字列評価ステップ、
前記文字列評価ステップにおける評価結果と前記候補文字列を出力する出力ステップ、
を有することを特徴とする帳票処理方法。 - 請求項10記載の帳票処理方法をコンピュータに実行させることを特徴とする帳票処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013118849A JP6118646B2 (ja) | 2013-06-05 | 2013-06-05 | 帳票処理装置、帳票処理方法、帳票処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013118849A JP6118646B2 (ja) | 2013-06-05 | 2013-06-05 | 帳票処理装置、帳票処理方法、帳票処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014235694A true JP2014235694A (ja) | 2014-12-15 |
JP6118646B2 JP6118646B2 (ja) | 2017-04-19 |
Family
ID=52138317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013118849A Active JP6118646B2 (ja) | 2013-06-05 | 2013-06-05 | 帳票処理装置、帳票処理方法、帳票処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6118646B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111008559A (zh) * | 2019-10-31 | 2020-04-14 | 浙江数链科技有限公司 | 一种面单识别结果的排版方法、系统及计算机设备 |
JP7337612B2 (ja) | 2019-09-10 | 2023-09-04 | キヤノン株式会社 | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06111057A (ja) * | 1992-09-25 | 1994-04-22 | Toshiba Corp | 光学的文字読取装置 |
JPH07114619A (ja) * | 1993-10-20 | 1995-05-02 | Hitachi Ltd | 文書認識装置 |
-
2013
- 2013-06-05 JP JP2013118849A patent/JP6118646B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06111057A (ja) * | 1992-09-25 | 1994-04-22 | Toshiba Corp | 光学的文字読取装置 |
JPH07114619A (ja) * | 1993-10-20 | 1995-05-02 | Hitachi Ltd | 文書認識装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7337612B2 (ja) | 2019-09-10 | 2023-09-04 | キヤノン株式会社 | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
CN111008559A (zh) * | 2019-10-31 | 2020-04-14 | 浙江数链科技有限公司 | 一种面单识别结果的排版方法、系统及计算机设备 |
CN111008559B (zh) * | 2019-10-31 | 2023-08-11 | 浙江数链科技有限公司 | 一种面单识别结果的排版方法、系统及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6118646B2 (ja) | 2017-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101747588B1 (ko) | 화상 처리 장치 및 화상 처리 방법 | |
RU2445699C1 (ru) | Способ обработки данных оптического распознавания символов (ocr), где выходные данные включают в себя изображения символов с нарушенной видимостью | |
WO2014030399A1 (ja) | 物体識別装置、物体識別方法、及びプログラム | |
US9098759B2 (en) | Image processing apparatus, method, and medium for character recognition | |
WO2010073540A1 (en) | Business document processor | |
JP5938393B2 (ja) | 画像処理装置 | |
TW200842734A (en) | Image processing program and image processing device | |
US20140334731A1 (en) | Methods and systems for evaluating handwritten documents | |
US7680329B2 (en) | Character recognition apparatus and character recognition method | |
JP2021043775A (ja) | 情報処理装置及びプログラム | |
US10217020B1 (en) | Method and system for identifying multiple strings in an image based upon positions of model strings relative to one another | |
CN109726369A (zh) | 一种基于标准文献的智能模板化题录技术实现方法 | |
JP6118646B2 (ja) | 帳票処理装置、帳票処理方法、帳票処理プログラム | |
RU2597163C2 (ru) | Сравнение документов с использованием достоверного источника | |
JP2012063993A (ja) | 画像処理装置及びその制御方法ならびにプログラム | |
JP6432179B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
JP4807618B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2008282094A (ja) | 文字認識処理装置 | |
JP4935459B2 (ja) | 文字認識方法、文字認識プログラムおよび文字認識装置 | |
Naz et al. | Arabic script based character segmentation: a review | |
CN110942075A (zh) | 信息处理装置、存储介质及信息处理方法 | |
US20210056254A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
AU2017225022A1 (en) | Method, system and apparatus for processing image data | |
US20210303843A1 (en) | Information processing apparatus | |
US10659654B2 (en) | Information processing apparatus for generating an image surrounded by a marking on a document, and non-transitory computer readable recording medium that records an information processing program for generating an image surrounded by a marking on a document |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160404 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170327 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6118646 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |