JPH05120467A - 書式データ編集方法および装置 - Google Patents

書式データ編集方法および装置

Info

Publication number
JPH05120467A
JPH05120467A JP3281300A JP28130091A JPH05120467A JP H05120467 A JPH05120467 A JP H05120467A JP 3281300 A JP3281300 A JP 3281300A JP 28130091 A JP28130091 A JP 28130091A JP H05120467 A JPH05120467 A JP H05120467A
Authority
JP
Japan
Prior art keywords
field
format data
item field
image
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3281300A
Other languages
English (en)
Inventor
Hirotoshi Ise
広敏 伊勢
Masao Michino
正雄 道野
Kiyomichi Kurino
清道 栗野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP3281300A priority Critical patent/JPH05120467A/ja
Publication of JPH05120467A publication Critical patent/JPH05120467A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 帳票の項目名定義作業を簡単化し、作業に要
する時間を短縮する。 【構成】 書類の画像から当該書類の書式を構成する複
数の可変項目フィールドを抽出し、抽出した可変項目フ
ィールドをオペレータに表示して一つの可変項目フィー
ルドをオペレータに指示させ、その可変項目フィールド
と特定関係にある固定項目フィールドの候補を画像上の
特徴から抽出し、抽出した固定項目フィールドをオペレ
ータに表示して一つまたは複数の固定項目フィールドを
オペレータに指示させ、前記可変項目フィールドおよび
固定項目フィールドの対応情報を記憶し、その対応情報
を用いて書式データを編集する。 【効果】 項目名を簡単に短時間で定義できると共に1
つの領域または可変項目フィールドに複数の項目名があ
る場合にも対応可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、書式データ編集方法お
よび装置に関し、さらに詳しくは、書類の書式を構成す
る複数の領域間の対応情報を含んだ書式データを編集す
る書式データ編集方法および装置に関する。
【0002】
【従来の技術】可変項目フィールドに手書きされたOC
R帳票をOCRで読み取る場合、読み取り不能の文字な
どが発生するため、読取り結果を画面に表示し、ユーザ
に修正させている。その際、表示中の読取り結果がOC
R帳票のどの可変項目フィールドのものであるかをユー
ザに知らせるために、その可変項目フィールドの項目名
(あるいはタイトル,名前,見出し)を同時に表示する
必要がある。
【0003】そこで、従来、OCR帳票を読み取るため
の書式データを作成する時に、可変項目フィールドに対
応する項目名を、オペレータがOCR帳票の原紙を見な
がらキーボードで入力したり、OCR帳票の画像を解析
して自動生成している。項目名をキーボードから入力す
る従来例としては、ワークステーション2050(日立
製作所)上で動作する「フォーマットゼネレータ」があ
る。また、項目名を画像を解析して自動生成する従来例
としては、オフィスプロセッサelles(日立製作
所)上で動作する「BELIEVE」がある。
【0004】
【発明が解決しようとする課題】項目名をキーボードか
ら入力する従来例では、損害保険帳票など可変項目フィ
ールド数が数百に及ぶ場合に多大の時間と労力を要する
問題点がある。また、項目名を画像を解析して自動生成
する従来例では、損害保険帳票など1つの可変項目フィ
ールドに複数の項目名がある場合に対応困難な問題点が
ある。
【0005】そこで、本発明の目的は、項目名を簡単に
短時間で定義できると共に1つの可変項目フィールドに
複数の項目名がある場合にも対応可能な書式データ編集
方法および装置を提供することにある。
【0006】
【課題を解決するための手段】第1の観点では、本発明
は、書類の画像から当該書類の書式を構成する複数の領
域を抽出し、抽出した領域をオペレータに表示して一つ
の対象領域およびその対象領域と特定関係にある属性領
域をオペレータに指示させ、これら対象領域および属性
領域の対応情報を記憶し、その対応情報を用いて書式デ
ータを編集することを特徴とする書式データ編集方法を
提供する。
【0007】第2の観点では、本発明は、書類の画像か
ら当該書類の書式を構成する複数の領域を抽出し、抽出
した領域をオペレータに表示して一つの対象領域をオペ
レータに指示させ、その対象領域と特定関係にある属性
領域の候補を画像上の特徴から抽出し、抽出した属性領
域候補をオペレータに表示して一つまたは複数の属性領
域をオペレータに指示させ、前記対象領域および属性領
域の対応情報を記憶し、その対応情報を用いて書式デー
タを編集することを特徴とする書式データ編集方法を提
供する。
【0008】第3の観点では、書類の画像を入力する画
像入力手段と、入力した画像から可変項目フィールドお
よび固定項目フィールドを抽出するフィールド抽出手段
と、抽出した可変項目フィールドおよび固定項目フィー
ルドを表示する表示手段と、一つの可変項目フィールド
およびその可変項目フィールドと特定関係にある固定項
目フィールドをオペレータに指示させるためのフィール
ド指示手段と、指示された可変項目フィールドおよび固
定項目フィールドの対応情報を記憶するフィールド対応
情報記憶手段と、その対応情報を付加した書式データを
生成する書式データ生成手段とを具備したことを特徴と
する書式データ編集装置を提供する。
【0009】第4の観点では、本発明は、書類の画像を
入力する画像入力手段と、入力した画像から可変項目フ
ィールドおよび固定項目フィールドを抽出するフィール
ド抽出手段と、抽出した可変項目フィールドを表示する
可変項目フィールド表示手段と、一つの可変項目フィー
ルドをオペレータに指示させるための可変項目フィール
ド指示手段と、指示された可変項目フィールドと特定関
係にある固定項目フィールドの候補を画像上の特徴から
抽出する固定項目フィールド候補抽出手段と、抽出した
固定項目フィールド候補を表示する固定項目フィールド
候補表示手段と、一つまたは複数の固定項目フィールド
をオペレータに指示させるための固定項目フィールド指
示手段と、指示された可変項目フィールドおよび固定項
目フィールドの対応情報を記憶するフィールド対応情報
記憶手段と、その対応情報を付加した書式データを生成
する書式データ生成手段とを具備したことを特徴とする
書式データ編集装置を提供する。
【0010】
【作用】本発明の書式データ編集方法および装置では、
書類の領域またはフィールドが抽出されて表示されるか
ら、オペレータは、表示された領域または可変項目フィ
ールドの中から一つの対象領域または可変項目フィール
ドを選択し且つ属性領域または固定項目フィールドを選
択する。すると、対象領域または可変項目フィールドと
属性領域または固定項目フィールドが対応付けられる。
【0011】また、本発明の書式データ編集方法および
装置では、書類の領域またはフィールドが抽出されて表
示されるから、オペレータは、表示された領域または可
変項目フィールドの中から一つの対象領域または可変項
目フィールドを選択する。すると、対象領域または可変
項目フィールドに対応する属性領域または固定項目フィ
ールドの候補が推定されて表示されるから、オペレータ
は、表示された候補の中から一つまたは複数の属性領域
または固定項目フィールドを選択する。すると、対象領
域または可変項目フィールドと属性領域または固定項目
フィールドが対応付けられる。
【0012】
【実施例】以下、図に示す実施例により本発明をさらに
詳細に説明する。なお、これにより本発明が限定される
ものではない。
【0013】図1は、本発明の一実施例の帳票書式デー
タ編集装置100のブロック図である。1は、コマンド
やコードデータを入力するためのキーボードである。2
は、画面上で座標を指定したりコマンドを入力するため
のマウスである。3は、帳票の原紙などを読み取るため
のスキャナである。4は、スキャナ3を制御するための
スキャナコントローラである。7は、スキャナ3で得た
画像データやキーボード1で入力されたコードデータ等
を格納するためのメモリである。
【0014】12は、システム全体を制御するCPUで
ある。5は、帳票書式データ等を格納するファイルであ
る。6は、ファイル5を制御するためのファイルコント
ローラである。8は、プリンタである。9は、ディスプ
レイ10およびビットマップメモリ11を制御するため
のディスプレイコントローラである。10は、ディスプ
レイである。11は、ビットマップメモリである。
【0015】図2は、帳票書式データ編集装置100に
よる帳票書式データ編集処理のフロー図である。ステッ
プ100では、スキャナ3により帳票画像を入力する。
ステップ100−1では、前記帳票画像をディスプレイ
10に表示する。ステップ100−2では、前記帳票画
像を目視により確認する。再入力が必要なら、前記ステ
ップ100,100−1の処理を繰り返す。再入力が必
要でなければ、ステップ100−3に進む。
【0016】ステップ103では、帳票画像の歪補正が
必要かどうか判定する。歪補正が必要なら、ステップ1
02に進む。歪補正が不要なら、ステップ104に進
む。
【0017】ステップ102では、帳票画像の歪補正処
理を行なう。この歪補正処理を図3により説明する。ま
ず、帳票の原紙30上の点A,点B,点Cの座標を実測
し、キーボード1から入力する。例えば、点Aは、「見
出し下線」の左端点である。点Bは、「罫線枠」の右下
角点である。点Cは、「罫線枠」の左下端点である。
【0018】次に、ディスプレイ10に表示された帳票
画像31上の点A’,点B’,点C’を、前記帳票の原
紙30上の点A,点B,点Cに対応する点としてマウス
2により指定する。CPU12は、点A,点B,点C
と、点A’,点B’,点C’の対応から、歪補正係数
a,b,c,d,α,βを算出し、画像データの歪補正
を行う。なお、帳票の原紙30と帳票画像31の4点以
上の対応点の位置関係により、非線形な歪を補正するこ
とも可能である。
【0019】図2に戻り、ステップ104では、歪補正
処理した帳票画像から文字枠を抽出し、メモリ7に格納
する。この文字枠抽出処理の流れを図4により説明す
る。ステップ200では、結線処理するドット数を示す
カウンタiを<0>に初期化する。ステップ202で
は、iドットの結線処理を行う。ステップ204では、
結線処理した画像に対して、白4連結成分を抽出する。
【0020】ステップ206では、文字枠チェックを行
う。この文字枠チェックの処理を図5により説明する。
ステップ220では、連結成分の番号を示すカウンタj
を1に初期化する。ステップ222では、第j番目の連
結成分が文字枠条件を満足するかどうかを判定する。満
足する場合には、ステップ224に進む。満足しない場
合には、ステップ228に進む。ステップ224では、
文字枠条件を満足した連結成分が既に文字枠として抽出
されていたかどうかチェックする。まだ抽出されていな
い場合には、ステップ226に進む。既に抽出されてい
た場合には、ステップ228に進む。ステップ226で
は、抽出した連結成分をメモリ7の文字枠テーブル11
0に登録する。図6に文字枠テーブル110を示す。文
字枠データ70の領域70−1,70−2は、文字枠
(連結領域の外接矩形)71の左上座標x1,y1であ
る。領域70−3,70−4は、文字枠71の右下座標
x2,y2である。領域70−5は、文字枠IDであ
る。領域70−6は、1文字枠か複数文字枠かチェック
マーク枠か等を示す文字枠種別フラグである。
【0021】図5に戻り、ステップ228では、カウン
タjを1だけ増加する。ステップ230では、全連結成
分に対して上記ステップ222〜228を繰り返す。
【0022】図4に戻り、ステップ208では、黒8連
結成分を抽出する。ステップ210では、再び文字枠チ
ェック(図5)を行う。ステップ212では、結線処理
するドット数を示すカウンタiを1だけ増加する。ステ
ップ214では、カウンタiが結線処理の最大ドット数
mを超えたかどうかチェックする。超えていない場合に
は、上記ステップ202〜212を繰り返す。超えた場
合には、リターンする。
【0023】図2に戻り、ステップ104−1では、抽
出した文字枠をディスプレイ10に表示する。ステップ
104−2では、目視により抽出結果が正しいか判定す
る。正しくない場合には、ステップ106で文字枠編集
処理により抽出結果を修正する。正しい場合には、ステ
ップ108以降の処理を行なう。
【0024】文字枠編集処理の流れを図7により説明す
る。ステップ240では、文字枠に対する編集機能のう
ち「消去」機能が選択されたかどうかをチェックする。
「消去」機能が選択された場合には、ステップ250
で、文字枠消去を実行する。この文字枠消去の処理を図
8により説明する。図8の(1)は、文字枠を1個ずつ
指定して消去する方法である。41−1〜41−4は、
文字枠データに基づいてディスプレイ10に表示された
文字枠である。マウスカーソル40で文字枠41−3を
指定することにより文字枠41−3が消去され、文字枠
データが更新される。図8の(2)は、矩形内にある文
字枠を全て消去する方法である。43−1〜43−5
は、文字枠データに基づいてディスプレイ10に表示さ
れた文字枠である。44−1はマウスカーソルで初めに
指定した点であり、44−2はマウスカーソルで次に指
定した点である。これらの点44−1および点44−2
を指定することにより、点44−1および点44−2を
対角の2点とする矩形45−1の内部にある文字枠43
−3〜43−5が消去され、文字枠データが更新され
る。
【0025】図7に戻り、ステップ242では、「生
成」機能が選択されたかどうかチェックする。「生成」
機能が選択された場合には、ステップ252で文字枠生
成を実行する。文字枠生成の処理を図9により説明す
る。まず、マウスカーソル51により文字枠を生成すべ
き位置を指定する。このとき、目盛50−1,50−2
を利用して、概略位置を判別する。位置を指定すと、文
字枠指定ウィンドウ52が表示されるので、文字枠の正
確な位置をキーボード等により設定する。これにより文
字枠53が生成される。
【0026】図7に戻り、ステップ244では、「追
加」機能が選択されたかどうかチェックする。「追加」
機能が選択された場合には、ステップ254で、文字枠
追加を実行する。この文字枠追加の処理を図10により
説明する。ステップ270では、文字枠を追加する位置
を指定する。画像データに基づいく画像(図12の
(1))と文字枠データに基づく画像(図12の
(2))とがディスプレイ10に同時表示されるから、
文字枠として抽出されなかった文字枠60−3があるこ
とが明確に分かる。そこで、図12の(3)のように、
マウスカーソル62により、文字枠を追加する大体の位
置を指定する。
【0027】ステップ272では、指定された追加位置
に対応した図形候補を生成する。この追加図形候補生成
の処理を図11により説明する。ステップ300では、
追加図形候補を推定するために参照する範囲を決定す
る。図13に示す72が指定された追加位置であり、こ
の座標が(X,Y)であるとき、 (X−n1≦x1≦X+n2) (X1−n1≦x2≦X+n2) (y1≦Y≦y2) を同時に満足するか又は、 (X−n1≦x1≦X+n2) (X1−n1≦x2≦X+n2) (y1≦Y≦y2) を同時に満足するような(x1,y1),(x2,y
2)をもつ文字枠データ70(図6)が参照範囲とな
る。
【0028】ステップ302では、参照範囲にある文字
枠データが存在するかどうかをチェックする。存在する
場合には、ステップ304に進む。存在しない場合に
は、ステップ318に進む。
【0029】ステップ306では、参照範囲にある文字
枠データ70の座標値70−1〜70−4から文字枠サ
イズの頻度分布を調査する。ステップ308では、頻度
分布が高い順に追加文字枠サイズ候補を決定する。
【0030】ステップ310では、参照範囲にある文字
枠データ70の座標値70−1〜70−5から文字枠位
置の頻度分布を調査する。ステップ312では、頻度分
布が高い順に追加文字枠位置候補を決定する。
【0031】ステップ314では、参照範囲にある文字
枠データ70の文字枠種別フラグ70−6から文字枠種
別の頻度分布を調査する。ステップ316では、頻度分
布が高い順に追加文字枠種別候補を決定する。このよう
にして、図12の(4)に示すように、文字枠候補63
−3を生成する。
【0032】ステップ318では、文字枠候補なし処理
を行う。例えば、参照範囲を拡大して前記ステップ30
2に戻る。あるいは、デフォルトの文字枠候補を生成す
る。
【0033】そして、図10のステップ274にリター
ンする。
【0034】なお、上記処理では、参照範囲にある文字
枠データを平等に扱っているが、指定位置からの距離に
応じて文字枠データに重み付けしてもよい。
【0035】図10に戻り、ステップ274では、生成
した追加文字枠候補の一つと,その追加文字枠候補に重
なる元の画像データの部分のパターンマッチングを行
い、類似度を算出する。例えば、図14に示すように、
追加文字枠候補からテンプレート64を生成する。領域
64−1は、黒画素との類似度を算出するためのもので
ある。領域64−2は、白画素との類似度を算出するた
めのものである。このテンプレート64と画像データの
間でマッチングを行う。マッチング結果66の斜線領域
が一致した領域である。
【0036】図10に戻り、ステップ276では、類似
度の最大値を表すパラメータmmaxと,前記ステップ27
4で算出した類似度を比較する。算出した類似度の方が
大きい場合には、ステップ278で、算出した類似度の
値を新たなmmaxとする。mmaxの方が大きい場合には、ス
テップ280に進む。ステップ280では、次の文字枠
候補の有無をチェックする。次の文字枠候補がある場合
には、ステップ274〜280の処理を繰り返す。次の
文字枠候補が無い場合には、ステップ282に進む。
【0037】ステップ282では、mmaxが所定のしきい
値を超えているかチェックする。超えている場合には、
ステップ284で、mmaxを与えた追加文字枠候補を追加
文字枠として確定する。超えていない場合には、ステッ
プ286で、文字枠生成を行う。文字枠生成の処理は、
先に説明したステップ252の処理と同じある。
【0038】ステップ288では、さらに文字枠追加を
行うかどうかを判定する。さらに文字枠を追加する場合
には、前記ステップ270に戻る。文字枠追加を行わな
い場合には、処理を終了する。
【0039】なお、文字枠追加の処理の他の実施例とし
ては、マウス等のポインティングデバイスを利用してオ
ペレータが画像上で領域を指定すると、その指定の領域
を参照領域とするものが挙げられる。また、指定の領域
内でパターンマッチング等により追加位置を推定するも
のが挙げられる。また、マウス等のポインティングデバ
イスを利用してオペレータが画像上で文字枠と追加方向
(例えば右方向)を指定すると、その追加方向と文字枠
データとに基づいて追加位置を推定し、その推定追加位
置に前記指定の文字枠を追加するものが挙げられる。
【0040】図7に戻り、ステップ246では、「整
形」機能が選択されたかどうかチェックする。「整形」
機能が選択された場合、ステップ256で文字枠整形を
実行する。文字枠整形の処理を図15により説明する。
ステップ350では、整形対象の文字枠を含む領域を指
定する。ステップ352では、指定された領域にある文
字枠の文字枠サイズの頻度分布を調査する。ステップ3
54では、頻度分布に基づいて文字枠サイズの規格化範
囲を算出する。すなわち、極端に大きい文字枠サイズあ
るいは極端に小さい文字枠サイズを排除する。
【0041】ステップ356では、指定された領域にあ
る文字枠の位置の頻度分布を調査する。ステップ358
では、頻度分布に基づいて文字枠位置の規格化範囲を算
出する。すなわち、規則的な文字枠の並びから大きくず
れた文字枠位置を排除する。
【0042】ステップ360では、指定された領域にあ
る文字枠の順番を表すカウンタiを1に初期化する。ス
テップ362では、第i番目の文字枠の文字枠サイズ
が、規格化範囲にあるかどうかチェックする。規格化範
囲にない場合には、ステップ368に進む。規格化範囲
にある場合には、ステップ364に進む。
【0043】ステップ364では、第i番目の文字枠の
文字枠位置が、規格化範囲にあるかどうかチェックす
る。規格化範囲にない場合には、ステップ368に進
む。規格化範囲にある場合には、ステップ366に進
む。
【0044】ステップ366では、文字枠サイズおよび
文字枠位置を規格化処理する。
【0045】ステップ368では、カウンタiを「1」
だけ増加させる。ステップ370では、指定された領域
にある文字枠の全てに関して処理が終了したかどうかを
チェックする。終了していない場合には、前記ステップ
362に戻る。終了した場合には、リターンする。
【0046】なお、上記では、頻度分布に基づいて文字
枠サイズを規格化処理する基準値を1つにしているが、
規格化の基準値を複数個にし、指定された領域に存在す
る文字枠の文字枠サイズを各基準値に近い値を持つよう
に分類し、各基準値ごとに規格化することによって、同
時に複数サイズの文字枠を規格化してもよい。
【0047】図7に戻り、ステップ248では、編集を
終了する指示があったかどうかをチェックする。指示が
ない場合には、前記ステップ240に戻る。指示があれ
ば、図2のステップ108にリターンする。
【0048】なお、上記では、画像データによる表示と
フォーマットデータによる表示を並べて文字枠編集を進
めているが、これらを重ね合わせて文字枠編集を進めて
もよい。
【0049】図2のステップ108では、文字枠をフィ
ールドごとにまとめ、各フィールドを定義する。このフ
ィールド定義の処理を図16に示す。ステップ400で
は、文字枠間の距離,位置関係などを利用して文字枠の
まとまりを見つけ、各々をフィールド候補とする。
【0050】ステップ402では、ある1つのフィール
ド候補を複数のフィールドに分離する必要があるか否か
チェックする。分離が必要なら、ステップ404に進
む。分離が必要ないなら、ステップ406に進む。
【0051】ステップ404では、当該フィールド候補
を複数のフィールドに分離する。図17に、フィールド
分離の一例を示す。1つのフィールド候補74−1の文
字枠75−1〜75−10は、「区分」のフィールドと
「氏名コード」のフィールドの2つのフィールドに分離
する必要がある。そこで、マウス2を用いて矩形76を
設定し、1つのフィールドに対応する文字枠を囲む。こ
れにより、1つのフィールド候補74−1は、2つのフ
ィールド74−2およ74−3に分離される。
【0052】ステップ406では、複数のフィールド候
補を1つのフィールドに結合する必要があるか否かチェ
ックする。結合が必要なら、ステップ408に進む。結
合が必要ないなら、ステップ410に進む。
【0053】図18に、フィールド結合の一例を示す。
3つのフィールド候補78−1,78−2,78−3は
「年」,「月」,「日」にそれぞれ対応しているが、
「申込み年月日」という1つのフィールドに結合する必
要がある。そこで、結合するフィールド候補78−1,
78−2,78−3の内部にマウス2を用いてマーク7
9−1,79−2,79−3を設定する。これにより、
マーク79−1,79−2,79−3を設定された3つ
のフィールド候補78−1,78−2,78−3は、1
つのフィールド78−4に結合される。
【0054】図16に戻り、ステップ410では、フィ
ールド修正(フィールド分離,フィールド結合)が終了
したか確認する。終了しない場合は、前記ステップ40
2〜408の処理を繰り返す。終了した場合は、フィー
ルド候補をフィールドとして確定し、ステップ412に
進む。
【0055】ステップ412では、一つのフィールドに
ついて、帳票画像から抽出した情報だけでは設定できな
いフィールド属性(例えば、文字枠に記入されるべき文
字種など)をオペレータが定義する。ステップ414で
は、全フィールドついて、フィールド属性の定義が終了
したかチェックする。終了していなければ、前記ステッ
プ412の処理を繰り返す。終了すれば、ステップ41
6に進む。
【0056】ステップ416では、項目名が必要となる
フィールドに対して項目名を入力する。図19に、項目
名入力の処理を示す。ステップ420では、項目名を入
力する対象となるフィールドを指示する。ステップ42
2では、指示されたフィールドに対応する項目名領域候
補を見つけ、それを表示する。
【0057】図20に、項目名領域候補表示の処理を示
す。ステップ450では、指示されたフィールドの座標
を算出する。ステップ452では、算出したフィールド
の座標に基づいて項目名領域候補を探索する範囲を算出
する。ここでは、指示されたフィールドの左方向と上方
向の所定範囲を、項目名領域候補探索範囲として算出す
る。
【0058】ステップ454では、指示されたフィール
ドの左方向の項目名領域候補探索範囲を設定する。ステ
ップ456では、設定した項目名領域候補探索範囲に、
項目名領域が存在するか判定する。存在する場合にはス
テップ458に進み、存在しない場合にはステップ46
4に進む。ステップ458では、1つ以上の項目名領域
を項目名領域候補として識別する。
【0059】ステップ464では、指示されたフィール
ドの上方向の項目名領域候補探索範囲を設定する。ステ
ップ466では、設定した項目名領域候補探索範囲に、
項目名領域が存在するか判定する。存在する場合にはス
テップ468に進み、存在しない場合にはステップ47
4に進む。ステップ468では、1つ以上の項目名領域
を項目名領域候補として識別する。
【0060】ステップ474では、識別した項目名領域
候補を表示する。そして、図19のステップ424にリ
ターンする。
【0061】図19に戻り、ステップ424では、オペ
レータが指示したフィールドの項目名の領域が項目名領
域候補として表示されているか確認する。表示されてい
る場合は、ステップ426に進む。表示されていない場
合は、ステップ428に進む。
【0062】ステップ426では、オペレータが指示し
たフィールドに対応する項目名の領域を選択する。ステ
ップ428では、項目名領域を指定する。
【0063】図21に、上記ステップ420からステッ
プ426の処理例を示す。項目名を入力する対象となる
フィールドとしてオペレータがフィールド80−1〜8
0−5の内のフィールド80−2を指示すると、そのフ
ィールド80−2に対応した項目名領域候補81−1〜
81−6が表示される。そこで、オペレータは、例えば
項目名領域候補81−3および81−5を、指示したフ
ィールドに対応する項目名の領域として選択する。
【0064】図22に、上記ステップ420からステッ
プ428の処理例を示す。項目名を入力する対象となる
フィールドとしてオペレータがフィールド85−1〜8
5−3の内のフィールド85−1を指示すると、そのフ
ィールド85−1に対応した項目名領域候補が表示され
る。しかし、その中には、指示したフィールドに対応す
る項目名の領域がなかった。そこで、オペレータは、枠
87−1を設定し、指示したフィールドに対応する項目
名の領域を指示する。
【0065】図19に戻り、ステップ430では、項目
名の領域内の文字列を抽出し、文字認識する。ステップ
432では、文字認識結果を修正する。
【0066】ステップ434では、項目名入力を終了す
るか否かチェックする。終了しないなら、上記ステップ
420〜432を繰り返す。終了するなら、ステップ4
36に進む。ステップ436では、項目名の文字認識結
果をコードデータに変換する。そして、図16にリター
ンし、さらに、図2のステップ110にリターンする。
図2のステップ110では、図23の如きフォーマット
パラメタを出力する。なお、項目名の領域の文字列を文
字認識しコードデータに変換する代りに、項目名の領域
の画像データ(あるいは圧縮した画像データ)を、指示
したフィールドと対応付けて管理してもよい。
【0067】本発明を適用可能な他の分野としては、新
聞における見出しと本文の対応付けがある。また、表形
式文書における欄の見出しと欄の内容の対応付けがあ
る。
【0068】
【発明の効果】本発明の書式データ編集方法および装置
によれば、オペレータは、表示された領域または可変項
目フィールドの中から一つの対象領域または可変項目フ
ィールドを選択し且つ属性領域または固定項目フィール
ドを選択するだけで、項目名を入力できるようになる。
そこで、項目名を簡単に短時間で定義できると共に1つ
の領域または可変項目フィールドに複数の項目名がある
場合にも対応可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例の帳票書式データ編集装置の
構成図である。
【図2】図1の帳票書式データ編集装置における処理の
流れ図である。
【図3】歪補正処理の説明図である。
【図4】文字枠抽出処理のフロー図である。
【図5】文字枠チェック処理のフロー図である。
【図6】文字枠テーブルの例示図である。
【図7】文字枠編集処理のフロー図である。
【図8】文字枠消去処理の説明図である。
【図9】文字枠生成処理の説明図である。
【図10】文字枠追加処理のフロー図である。
【図11】追加文字枠候補生成処理のフロー図である。
【図12】文字枠追加処理の説明図である。
【図13】参照範囲の説明図である。
【図14】テンプレートマッチング処理の説明図であ
る。
【図15】文字枠整形処理のフロー図である。
【図16】フィールド定義処理のフロー図である
【図17】フィールド分離処理の説明図である
【図18】フィールド結合処理の説明図である
【図19】項目名入力処理のフロー図である
【図20】項目名領域候補表示処理のフロー図である
【図21】項目名領域候補選択操作の説明図である
【図22】項目名領域指示操作の説明図である
【図23】フォーマットパラメタの例示図である。
【符号の説明】
100 図形編集装置 1 キーボード 2 マウス 3 スキャナ 10 ディスプレイ 12 CPU

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 書類の画像から当該書類の書式を構成す
    る複数の領域を抽出し、抽出した領域をオペレータに表
    示して一つの対象領域およびその対象領域と特定関係に
    ある属性領域をオペレータに指示させ、これら対象領域
    および属性領域の対応情報を記憶し、その対応情報を用
    いて書式データを編集することを特徴とする書式データ
    編集方法。
  2. 【請求項2】 書類の画像から当該書類の書式を構成す
    る複数の領域を抽出し、抽出した領域をオペレータに表
    示して一つの対象領域をオペレータに指示させ、その対
    象領域と特定関係にある属性領域の候補を画像上の特徴
    から抽出し、抽出した属性領域候補をオペレータに表示
    して一つまたは複数の属性領域をオペレータに指示さ
    せ、前記対象領域および属性領域の対応情報を記憶し、
    その対応情報を用いて書式データを編集することを特徴
    とする書式データ編集方法。
  3. 【請求項3】 書類の画像を入力する画像入力手段と、
    入力した画像から可変項目フィールドおよび固定項目フ
    ィールドを抽出するフィールド抽出手段と、抽出した可
    変項目フィールドおよび固定項目フィールドを表示する
    表示手段と、一つの可変項目フィールドおよびその可変
    項目フィールドと特定関係にある固定項目フィールドを
    オペレータに指示させるためのフィールド指示手段と、
    指示された可変項目フィールドおよび固定項目フィール
    ドの対応情報を記憶するフィールド対応情報記憶手段
    と、その対応情報を付加した書式データを生成する書式
    データ生成手段とを具備したことを特徴とする書式デー
    タ編集装置。
  4. 【請求項4】 書類の画像を入力する画像入力手段と、
    入力した画像から可変項目フィールドおよび固定項目フ
    ィールドを抽出するフィールド抽出手段と、抽出した可
    変項目フィールドを表示する可変項目フィールド表示手
    段と、一つの可変項目フィールドをオペレータに指示さ
    せるための可変項目フィールド指示手段と、指示された
    可変項目フィールドと特定関係にある固定項目フィール
    ドの候補を画像上の特徴から抽出する固定項目フィール
    ド候補抽出手段と、抽出した固定項目フィールド候補を
    表示する固定項目フィールド候補表示手段と、一つまた
    は複数の固定項目フィールドをオペレータに指示させる
    ための固定項目フィールド指示手段と、指示された可変
    項目フィールドおよび固定項目フィールドの対応情報を
    記憶するフィールド対応情報記憶手段と、その対応情報
    を付加した書式データを生成する書式データ生成手段と
    を具備したことを特徴とする書式データ編集装置。
  5. 【請求項5】 請求項4に記載の書式データ編集装置に
    おいて、固定項目フィールド候補抽出手段は、指示され
    た可変項目フィールドの上および左の画像上の位置に存
    在する固定項目フィールドを固定項目フィールド候補と
    して抽出することを特徴とする書式データ編集装置。
  6. 【請求項6】 請求項4または請求項5に記載の書式デ
    ータ編集装置において、固定項目フィールド候補抽出手
    段は、指示された可変項目フィールドから所定の距離以
    内の画像上の位置に存在する固定項目フィールドを固定
    項目フィールド候補として抽出することを特徴とする書
    式データ編集装置。
  7. 【請求項7】 請求項4から請求項6のいずれかに記載
    の書式データ編集装置において、固定項目フィールド候
    補表示手段は、指示された可変項目フィールドの上およ
    び左の画像上の位置に存在する固定項目フィールドまた
    は指示された可変項目フィールドから所定の距離以内の
    画像上の位置に存在する固定項目フィールドを強調して
    表示することを特徴とする書式データ編集装置。
  8. 【請求項8】 請求項4から請求項7のいずれかに記載
    の書式データ編集装置において、指示された固定項目フ
    ィールド内に存在する文字などを認識してコードデータ
    を生成するコードデータ生成手段と、生成したコードデ
    ータに基づく表示を行うコードデータ表示手段と、表示
    されたコードデータをオペレータが修正するためのコー
    ドデータ修正手段とをさらに具備し、書式データ生成手
    段は、修正後のコードデータを付加した書式データを生
    成することを特徴とする書式データ編集装置。
  9. 【請求項9】 請求項4から請求項8のいずれかに記載
    の書式データ編集装置において、書式データ生成手段
    は、指示された固定項目フィールド内の画像データまた
    はその圧縮データを付加した書式データを生成すること
    を特徴とする書式データ編集装置。
JP3281300A 1991-10-28 1991-10-28 書式データ編集方法および装置 Pending JPH05120467A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3281300A JPH05120467A (ja) 1991-10-28 1991-10-28 書式データ編集方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3281300A JPH05120467A (ja) 1991-10-28 1991-10-28 書式データ編集方法および装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2000274402A Division JP2001118030A (ja) 1991-10-28 2000-09-11 書式データ編集方法および装置

Publications (1)

Publication Number Publication Date
JPH05120467A true JPH05120467A (ja) 1993-05-18

Family

ID=17637153

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3281300A Pending JPH05120467A (ja) 1991-10-28 1991-10-28 書式データ編集方法および装置

Country Status (1)

Country Link
JP (1) JPH05120467A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219442A (ja) * 1997-11-25 1999-08-10 Mitsubishi Electric Corp 文書編集出力装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219442A (ja) * 1997-11-25 1999-08-10 Mitsubishi Electric Corp 文書編集出力装置

Similar Documents

Publication Publication Date Title
JP5623079B2 (ja) ハード・コピーの書式からの書式定義の自動発生
US4933984A (en) Document analysis system
US5416849A (en) Data processing system and method for field extraction of scanned images of document forms
US7926732B2 (en) OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
US5856877A (en) Apparatus and method for processing and reproducing image information
US20070130529A1 (en) Automatic generation of user interface descriptions through sketching
US5509092A (en) Method and apparatus for generating information on recognized characters
US5235653A (en) Document analysis system
JP2007242021A (ja) 自動文書レイアウトデザイン
JP2005173730A (ja) 帳票ocrプログラム、方法及び装置
US20200104586A1 (en) Method and system for manual editing of character recognition results
JP2008145611A (ja) 情報処理装置、プログラム
JP2022066321A (ja) 情報処理装置及びプログラム
CN111860450A (zh) 票证识别装置以及票证信息管理系统
JPH08166865A (ja) 画面生成方法及びその装置
JP2006227824A (ja) 図面認識方法および装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP2001118030A (ja) 書式データ編集方法および装置
JP3319203B2 (ja) 文書ファイリング方法及び装置
JPH05120467A (ja) 書式データ編集方法および装置
JP2001126010A (ja) 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JP2022090469A (ja) 書式定義装置、書式定義方法、及びプログラム
JP4092849B2 (ja) 帳票認識装置および記録媒体
JP3182694B2 (ja) 図形編集方法および装置
JP7447614B2 (ja) 情報処理装置