JP2022090469A - 書式定義装置、書式定義方法、及びプログラム - Google Patents
書式定義装置、書式定義方法、及びプログラム Download PDFInfo
- Publication number
- JP2022090469A JP2022090469A JP2020202888A JP2020202888A JP2022090469A JP 2022090469 A JP2022090469 A JP 2022090469A JP 2020202888 A JP2020202888 A JP 2020202888A JP 2020202888 A JP2020202888 A JP 2020202888A JP 2022090469 A JP2022090469 A JP 2022090469A
- Authority
- JP
- Japan
- Prior art keywords
- area
- color
- input
- unit
- input area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 31
- 238000012545 processing Methods 0.000 claims description 19
- 239000003086 colorant Substances 0.000 claims description 7
- 238000011144 upstream manufacturing Methods 0.000 claims description 5
- 239000003550 marker Substances 0.000 description 49
- 238000012015 optical character recognition Methods 0.000 description 28
- 230000008569 process Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 8
- 230000008439 repair process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
Description
図1は、書式定義システム1の全体構成を例示する図である。
図1に例示するように、書式定義システム1は、書式定義装置2と、スキャナ装置4とを含み、ネットワーク7を介して互いに接続している。複数のスキャナ装置4A及びスキャナ装置4Bを併せてスキャナ装置4と称する。
書式定義装置2は、コンピュータ端末であり、スキャナ装置4から受信した画像データに基づいて、書式を定義し、定義された書式を示す書式情報を出力する。本例の書式定義装置2は、スキャナ装置4から受信した帳票の画像データに基づいて、帳票に対するOCR(Optical Character Recognition)処理を定義する定義情報を生成し、さらに、受信した画像データを加工して未記入の帳票画像データを生成し、生成された未記入の帳票画像データ及び定義情報を外部に送信する。
一般的には、ユーザインタフェースを通じて、画像上に領域を指定するが、OCRソフトウェアの仕様を理解する必要があり、初めて利用するユーザにとっては、操作が難しい。これを解決する手段として、図1の構成において、蛍光ペンなどの色マーカーを使用して原紙に直接認識領域を記入させる手法があるが、以下のような課題がある。
図2(A)に例示するように、互いに隣接する入力項目を指定する場合には、色マーカー同士が重ならないよう記入する必要がある。しかし、入力領域(認識領域)をなるべく広く取ろうとすると、色マーカー同士が接触し易くなり、記入には慎重な作業が必要となる。
また、図2(B)に例示するように、帳票に印刷された文字を囲むことにより入力領域(識別領域)を指定した場合、他の帳票では文字数が多くなり入力領域(識別領域)から、入力文字列(本例では、数字)がはみ出てしまう場合がある。そのため、余裕を持たせた入力領域を見極めた上で記入をしなければならない。これらを入力項目ごとに行うことは煩雑であるし、考慮漏れの入力項目も発生しかねない。また周辺余白が狭い場合には慎重な記入が必要となる。
図3に例示するように、書式定義装置2は、CPU200、メモリ202、HDD204、ネットワークインタフェース206(ネットワークIF206)、表示装置208、及び、入力装置210を有し、これらの構成はバス212を介して互いに接続している。
CPU200は、例えば、中央演算装置である。
メモリ202は、例えば、揮発性メモリであり、主記憶装置として機能する。
HDD204は、例えば、ハードディスクドライブ装置であり、不揮発性の記録装置としてコンピュータプログラム(例えば、図4の書式定義プログラム3)やその他のデータファイルを格納する。
ネットワークIF206は、有線又は無線で通信するためのインタフェースであり、例えば、スキャナ装置4との通信を実現する。
表示装置208は、例えば、液晶ディスプレイである。
入力装置210は、例えば、キーボード及びマウスである。
図4に例示するように、本例の書式定義装置2には、書式定義プログラム3がインストールされる。
書式定義プログラム3は、色領域特定部300、入力領域決定部310、拡張制限部320、色登録部330、警告表示部340、属性設定部350、塗潰し部360、及び書式情報出力部370を有する。
なお、書式定義プログラム3の一部又は全部は、ASICなどのハードウェアにより実現されてもよく、また、OS(Operating System)の機能を一部借用して実現されてもよい。
また、拡張制限部320は、入力領域決定部310による領域拡張を、背景色とは異なる色が存在する領域までに制限する。これにより、入力決定部310は、色領域特定部300により特定された領域から、背景とは色調の異なる何らかの画素(文字・線・イメージなど)が出現するまで広げて、周辺余白にフィットした入力領域を生成できる。
また、拡張制限部320は、入力領域に設定された文字種が手書き文字である場合に、文字列の配列方向と直交する方向の拡張量を、設定された文字種が活字である場合よりも大きく許容する。これにより、入力決定部310は、入力領域に設定された文字種が手書き文字である場合に、設定された文字種が活字である場合よりも、文字列の配列方向と直交する方向に広い入力領域を生成し、手書き入力しやすい入力欄を提供できる。手書き文字は、活字に比べて変位しやすく、より広い記入欄を要するからである。
図5に例示するように、ステップ100(S100)において、書式定義装置2の色領域特定部300(図4)は、スキャナ装置4から、マーカーが付された帳票画像データ(図9)を取得する。
ステップ110(S110)において、属性設定部350は、図8(B)のマーカー設定情報を参照して、色領域特定部300により特定された色領域の色に対応する属性を特定する。色の特定は、例えば、色領域を取り出し、取り出した画像内に含まれる色情報をピクセル単位で識別し、黒・白・グレー付近の色(判定除外色)を除く最頻値の色を、色領域の色とする。色情報の特定に用いるピクセルは全ピクセルでもサンプリングしたピクセルでも良い。
ステップ115(S115)において、拡張制限部320は、色領域特定部300により特定された色領域のアスペクト比に基づいて、文字列の配列方法を特定し、特定された文字列配列方向と、属性設定部350により特定された属性(文字種)とに基づいて、拡張の上限範囲を決定する。上限範囲は、例えば、色領域の端部からの距離として予め設定され、文字列方向は、これと直交する方向よりも大きい値である。上限範囲は、ユーザにより変更可能な範囲である。
ステップ140(S140)において、書式情報出力部370は、生成されたOCR定義情報と、塗潰し部360により生成された未記入帳票画像データとを外部に送信する。
図6に例示するように、ステップ200(S200)において、OCR処理装置2の色登録部330(図4)は、図8(A)のマーカー設定画面900を表示して、ユーザによる色の指定操作を受け付ける。色の指定操作は、例えば、カラーパレットなどを用いて任意の色を指定することができる。
ステップ205(S205)において、警告表示部340は、ユーザにより指定された色と、色登録部330により登録されている色とを比較して、非類似であるか否かを判定する。書式定義プログラム3は、既登録の色と非類似であると判定された場合に、S210の処理に移行し、既登録の色と同一又は類似であると判定された場合に、S215の処理に移行する。色の比較は、例えば、色差の計測に基づいて行われる。
ステップ215(S215)において、警告表示部340は、ユーザに対して警告表示を行い、指定した色の変更を促す。
図7に例示するように、ステップ1200(S1200)において、拡張制限部320は、設定した上限範囲内で、色領域特定部300により特定された色領域の周囲に存在する罫線を探索する。
ステップ1205(S1205)において、書式定義プログラム3は、上限範囲内で罫線が発見された場合に、S1210の処理に移行し、上限範囲内で罫線が発見されなかった場合に、S1215の処理に移行する。
ステップ1210(S1210)において、入力領域決定部310は、拡張制限部320により発見された罫線まで、入力領域を拡張する。
ステップ1220(S1220)において、書式定義プログラム3は、上限範囲内で黒画素(非背景画素)が発見された場合に、S1225の処理に移行し、上限範囲内で黒画素が発見されなかった場合に、S1230の処理に移行する。
ステップ1230(S1230)において、入力領域決定部310は、拡張制限部320により設定された上限範囲まで、入力領域を拡張する。
図10に例示するように、入力欄に記載された文字列に色マーカーを塗った場合も、入力欄の内側に矩形で色マーカーを塗った場合も、周囲の罫線まで入力領域が拡張され、同様に、入力欄一杯まで拡張された入力領域が定義される。
図11に例示するように、横書きの文字列に色マーカーが塗られた場合には、色領域のアスペクト比から横書きであると判定され、上下方向よりも左右方向に、より大きく拡張された入力領域が定義される。一方、縦書きの文字列に色マーカーが塗られた場合には、左右方向よりも上下方向に、より大きく拡張された入力領域が定義される。これにより、入力領域に記入される文字列の長さが多少変動しても、入力領域からはみ出しにくくなる。
また、本例の書式定義システム1によれば、色マーカーの色によって、入力領域の属性を設定することができる。
上記実施形態では、OCR処理の定義情報を生成する場合を具体例として説明したが、これに限定されるものではなく、OCR処理以外の用途で書式を定義してもよい。
また、上記実施形態では、指定した色のマーカーが付された領域をOCR処理の対象外とする場合を説明したが、マーカーが存在しない領域を全てOCR処理の対象外としてもよい。
また、上記実施形態では、書式定義情報と、未記入帳票画像データをセットで提供する形態を説明したが、未記入帳票画像データのみの作成に使用してもよい。その際、入力領域の塗潰しは、白色だけでなく、入力領域周辺の背景色や、ユーザ指定の任意の色を用いてもよい。
2…書式定義装置
3…書式定義プログラム
300…色領域特定部
310…入力領域決定部
320…拡張制限部
330…色登録部
340…警告表示部
350…属性設定部
360…塗潰し部
370…書式情報出力部
Claims (12)
- 入力画像から、予め指定された色が連続して存在する領域を特定する色領域特定部と、
前記色領域特定部により特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する入力領域決定部と、
前記入力画像における、前記入力領域決定部により決定された入力領域の位置を書式情報として出力する書式情報出力部と
を有する書式定義装置。 - 前記入力画像は帳票画像であり、
前記入力領域決定部は、前記色領域特定部により特定された領域から、最も近い罫線までの領域を入力領域とする
請求項1に記載の書式定義装置。 - 前記入力領域決定部は、前記色領域特定部により特定された領域を基準として、文字列が配列される方向の上流側及び下流側に、前記入力領域を拡張する
請求項1に記載の書式定義装置。 - 前記入力領域決定部により前記入力領域を拡張できる範囲を、背景色とは異なる色が存在する領域までに制限する拡張制限部
をさらに有する請求項3に記載の書式定義装置。 - 前記入力領域決定部により前記入力領域を拡張できる距離に関して、文字列が配列された方向を、文字列の配列方向と直交する方向よりも大きく許容する拡張制限部
をさらに有する請求項3に記載の書式定義装置。 - 前記色領域特定部により特定された領域の色に応じて、前記入力領域決定部により決定された入力領域の属性を設定する属性設定部
をさらに有し、
前記書式情報出力部は、前記入力領域決定部により決定された入力領域の位置と、前記属性設定部により設定された属性とを書式情報として出力する
請求項1に記載の書式定義装置。 - 前記色領域特定部により特定された領域の色に応じて、前記入力領域決定部により決定された入力領域に入力される文字種を設定する属性設定部
をさらに有し、
前記入力領域決定部は、前記色領域特定部により特定された領域を基準として、文字列が配列される方向の上流側及び下流側、及び、文字列の配列方向に直交する方向に、前記入力領域を拡張し、
前記書式情報出力部は、前記入力領域決定部により決定された入力領域の位置と、前記属性設定部により設定された文字種とを書式情報として出力し、
前記入力領域決定部は、前記入力領域に設定された文字種が手書き文字である場合に、文字列の配列方向と直交する方向の拡張量を、設定された文字種が活字である場合よりも大きくする
請求項3に記載の書式定義装置。 - ユーザの操作に応じて、入力領域に設定する属性と、色とを互いに関連付けて登録する色登録部と、
前記色登録部に登録されている色と類似する色の新規登録が要求された場合に、警告表示を行う警告表示部と
をさらに有し、
前記属性設定部は、前記色領域特定部により特定された領域の色と、前記色登録部に登録されている色とに基づいて、前記入力領域決定部により決定された入力領域の属性を設定する
請求項6に記載の書式定義装置。 - 前記書式情報はOCR処理の定義情報であり、
前記属性設定部は、前記色領域特定部により特定された領域の色に応じて、前記入力領域決定部により決定された入力領域を、OCR処理の対象外に設定する
請求項6に記載の書式定義装置。 - 前記入力画像のうち、前記入力領域決定部により入力領域に決定された領域を、単一の色で塗り潰す塗潰し部
をさらに有し、
前記書式情報出力部は、前記塗潰し部により塗り潰された入力画像に関付けて、書式情報を出力する
請求項1に記載の書式定義装置。 - コンピュータが、入力画像から、予め指定された色が連続して存在する領域を特定する色領域特定ステップと、
コンピュータが、前記色領域特定ステップにより特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する入力領域決定ステップと、
コンピュータが、前記入力画像における、前記入力領域決定ステップにより決定された入力領域の位置を書式情報として出力する書式情報出力ステップと
を有する書式定義方法。 - 入力画像から、予め指定された色が連続して存在する領域を特定する色領域特定ステップと、
前記色領域特定ステップにより特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する入力領域決定ステップと、
前記入力画像における、前記入力領域決定ステップにより決定された入力領域の位置を書式情報として出力する書式情報出力ステップと
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020202888A JP2022090469A (ja) | 2020-12-07 | 2020-12-07 | 書式定義装置、書式定義方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020202888A JP2022090469A (ja) | 2020-12-07 | 2020-12-07 | 書式定義装置、書式定義方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022090469A true JP2022090469A (ja) | 2022-06-17 |
Family
ID=81992852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020202888A Pending JP2022090469A (ja) | 2020-12-07 | 2020-12-07 | 書式定義装置、書式定義方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022090469A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4286564A1 (en) | 2022-06-02 | 2023-12-06 | Resonac Corporation | 8-inch n-type sic single crystal substrate |
-
2020
- 2020-12-07 JP JP2020202888A patent/JP2022090469A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4286564A1 (en) | 2022-06-02 | 2023-12-06 | Resonac Corporation | 8-inch n-type sic single crystal substrate |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5058575B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
US7926732B2 (en) | OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form | |
JP3996579B2 (ja) | 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム | |
KR100325384B1 (ko) | 문자열추출장치및패턴추출장치 | |
KR100658119B1 (ko) | 문자 인식 장치 및 방법 | |
US20050248808A1 (en) | Printing control interface system and method with handwriting discrimination capability | |
JP5616308B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法 | |
JP3113827B2 (ja) | 矩形オブジェクトの認識方法及び認識装置 | |
JPH08305803A (ja) | 文字テンプレートセット学習マシン動作方法 | |
US6614929B1 (en) | Apparatus and method of detecting character writing area in document, and document format generating apparatus | |
JP2012203458A (ja) | 画像処理装置及びプログラム | |
US11348331B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
WO2019185245A2 (en) | An image processing system and an image processing method | |
JP2022066321A (ja) | 情報処理装置及びプログラム | |
CN111126266B (zh) | 文本处理方法、文本处理系统、设备及介质 | |
JP5538812B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2022090469A (ja) | 書式定義装置、書式定義方法、及びプログラム | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
US20190057276A1 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
US7095891B1 (en) | Pattern segmentation apparatus and pattern recognition apparatus | |
CN116682118A (zh) | 一种古文字识别方法、系统、终端及介质 | |
JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
JP2003046746A (ja) | 画像処理方法及び画像処理装置 | |
JP6503850B2 (ja) | 範囲指定プログラム、範囲指定方法および範囲指定装置 | |
JP2000076378A (ja) | 文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD07 | Notification of extinguishment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7427 Effective date: 20221118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221227 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230920 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20231010 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240725 |