JPH0520494A - 帳票属性認識・表示方法 - Google Patents
帳票属性認識・表示方法Info
- Publication number
- JPH0520494A JPH0520494A JP3170936A JP17093691A JPH0520494A JP H0520494 A JPH0520494 A JP H0520494A JP 3170936 A JP3170936 A JP 3170936A JP 17093691 A JP17093691 A JP 17093691A JP H0520494 A JPH0520494 A JP H0520494A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- input
- cell
- code
- code information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】帳票内の項目の属性をイメージデータからの入
力及び、入力装置から入力したサンプルデータに基づい
て自動決定することにより、ユーザが属性を定義する負
荷を軽減する。 【構成】イメージ認識手段(11)と属性解析手段(12)
と属性登録手段(13)と帳票作成手段(14)を有し、イ
メージ認識手段(11)は、帳票の枠と各々の文字・数値
を認識し、属性解析手段は帳票内のセル毎に着目し、セ
ンタリング処理,カンマ編集等の処理がなされているか
調べ、行,列としての属性が存在するか否か調べる。属
性登録手段(13)は、帳票IDとそのフォーマット,属
性を登録しておく。帳票作成手段(14)は帳票IDが入
力されれば、フォーマットを画面に表示し、入力エリア
に入力された文字・数値をカーソルのあるセルの属性に
従って、編集・表示を行なう。
力及び、入力装置から入力したサンプルデータに基づい
て自動決定することにより、ユーザが属性を定義する負
荷を軽減する。 【構成】イメージ認識手段(11)と属性解析手段(12)
と属性登録手段(13)と帳票作成手段(14)を有し、イ
メージ認識手段(11)は、帳票の枠と各々の文字・数値
を認識し、属性解析手段は帳票内のセル毎に着目し、セ
ンタリング処理,カンマ編集等の処理がなされているか
調べ、行,列としての属性が存在するか否か調べる。属
性登録手段(13)は、帳票IDとそのフォーマット,属
性を登録しておく。帳票作成手段(14)は帳票IDが入
力されれば、フォーマットを画面に表示し、入力エリア
に入力された文字・数値をカーソルのあるセルの属性に
従って、編集・表示を行なう。
Description
【0001】
【産業上の利用分野】本発明は帳票処理に係り、特に、
予め読み取った帳票から各セル毎の表示属性を帳票のI
Dコードと対応づけて登録しておき、後に、ユーザから
指定された帳票のIDコードに応じて入力エリアに入力
されたコード情報の属性を決定し表示する帳票属性認識
・表示方法に関する。
予め読み取った帳票から各セル毎の表示属性を帳票のI
Dコードと対応づけて登録しておき、後に、ユーザから
指定された帳票のIDコードに応じて入力エリアに入力
されたコード情報の属性を決定し表示する帳票属性認識
・表示方法に関する。
【0002】
【従来の技術】従来の帳票認識方法は、日立評論Vol.
71,No.11 の第57頁から第64頁に記されてい
る通り、イメージリーダから入力された帳票の枠と項目
名(数量や商品名等)を認識し、ユーザが数量や商品名
を入力して、帳票を作成する。この方式では、文字認識
する文字の位置,大きさ等を事前に定義しなくても認識
することができる。しかし、ユーザが入力する項目の表
示属性(センタリング,カンマ編集等)は考慮していな
い。
71,No.11 の第57頁から第64頁に記されてい
る通り、イメージリーダから入力された帳票の枠と項目
名(数量や商品名等)を認識し、ユーザが数量や商品名
を入力して、帳票を作成する。この方式では、文字認識
する文字の位置,大きさ等を事前に定義しなくても認識
することができる。しかし、ユーザが入力する項目の表
示属性(センタリング,カンマ編集等)は考慮していな
い。
【0003】
【発明が解決しようとする課題】上記従来技術は、ユー
ザが入力する項目の表示属性について配慮がされておら
ず、ユーザは、使用する帳票処理システム固有の文法に
従って、センタリングや数値のカンマ編集等の設定を行
なわなければならなかった。本発明は、完成された帳票
から表示属性を抽出し、該帳票フォーマットで帳票を作
成する際には、センタリング処理やカンマ編集等のユー
ザの入力の負荷を軽減することにある。
ザが入力する項目の表示属性について配慮がされておら
ず、ユーザは、使用する帳票処理システム固有の文法に
従って、センタリングや数値のカンマ編集等の設定を行
なわなければならなかった。本発明は、完成された帳票
から表示属性を抽出し、該帳票フォーマットで帳票を作
成する際には、センタリング処理やカンマ編集等のユー
ザの入力の負荷を軽減することにある。
【0004】
【課題を解決するための手段】上記目的を達成するため
に、イメージ認識手段と属性解析手段と属性登録手段と
帳票作成手段を有し、イメージ認識手段は、帳票の枠と
各々の文字・数値を認識し、属性解析手段は帳票内の1
枠(以下セルと呼ぶ)毎に着目し、センタリング処理,
カンマ編集等の処理がなされているか調べ、行,列とし
ての属性が存在するか否か調べる。属性登録手段は、帳
票IDとそのフォーマット,属性を登録しておく。帳票
作成手段は帳票IDが入力されれば、フォーマットを画
面に表示し、入力エリアに入力された文字・数値をカー
ソルのあるセルの属性に従って、編集・表示を行なう。
に、イメージ認識手段と属性解析手段と属性登録手段と
帳票作成手段を有し、イメージ認識手段は、帳票の枠と
各々の文字・数値を認識し、属性解析手段は帳票内の1
枠(以下セルと呼ぶ)毎に着目し、センタリング処理,
カンマ編集等の処理がなされているか調べ、行,列とし
ての属性が存在するか否か調べる。属性登録手段は、帳
票IDとそのフォーマット,属性を登録しておく。帳票
作成手段は帳票IDが入力されれば、フォーマットを画
面に表示し、入力エリアに入力された文字・数値をカー
ソルのあるセルの属性に従って、編集・表示を行なう。
【0005】
【作用】イメージ認識手段は、帳票の枠を抽出し、セル
の大きさ,セル内の文字・数値の認識を行ない、文字の
大きさ,文字間隔を求める。属性解析手段は、各セルに
着目し、左枠線から最左端の文字までの長さ,右枠線か
ら最右端の文字までの長さを調べ、左寄せ処理,右寄せ
処理,センタリング処理,カンマ編集等の処理がなされ
ているか否か判断し、セルの属性を求める。次に、各
行,各列のセルの属性に着目し、共通した属性を持って
いれば各行,各列の属性とする。属性登録手段は、帳票
IDと行,列のセルの数,それぞれの大きさ及び行属
性,列属性を記憶装置に記憶する。帳票作成手段は、ユ
ーザから帳票IDが入力されれば、属性登録手段に従っ
て画面に表示する。入力エリアに文字・数値が入力され
ると、カーソルのあるセルの行,列の属性に従って編集
・表示を行なう。
の大きさ,セル内の文字・数値の認識を行ない、文字の
大きさ,文字間隔を求める。属性解析手段は、各セルに
着目し、左枠線から最左端の文字までの長さ,右枠線か
ら最右端の文字までの長さを調べ、左寄せ処理,右寄せ
処理,センタリング処理,カンマ編集等の処理がなされ
ているか否か判断し、セルの属性を求める。次に、各
行,各列のセルの属性に着目し、共通した属性を持って
いれば各行,各列の属性とする。属性登録手段は、帳票
IDと行,列のセルの数,それぞれの大きさ及び行属
性,列属性を記憶装置に記憶する。帳票作成手段は、ユ
ーザから帳票IDが入力されれば、属性登録手段に従っ
て画面に表示する。入力エリアに文字・数値が入力され
ると、カーソルのあるセルの行,列の属性に従って編集
・表示を行なう。
【0006】
【実施例】以下、本発明の一実施例を図1により説明す
る。図1は帳票を処理するコンピュータシステムを示
す。コンピュータ10の中で帳票処理を行なう部分がイ
メージ認識部11,属性解析部12,属性登録部13,
帳票作成部14である。その他必要なハードウェアは、
完成した帳票を入力するイメージスキャナ15,帳票の
フォーマットと属性を登録しておく磁気ディスク16,
帳票を表示するディスプレイ17及びユーザが入力に用
いるキーボード18である。
る。図1は帳票を処理するコンピュータシステムを示
す。コンピュータ10の中で帳票処理を行なう部分がイ
メージ認識部11,属性解析部12,属性登録部13,
帳票作成部14である。その他必要なハードウェアは、
完成した帳票を入力するイメージスキャナ15,帳票の
フォーマットと属性を登録しておく磁気ディスク16,
帳票を表示するディスプレイ17及びユーザが入力に用
いるキーボード18である。
【0007】イメージスキャナ15から入力された帳票
をイメージ認識部11で帳票の枠線と文字・数値を分離
・認識する。属性解析部12ではそれぞれのセルの表示
属性を認識した後、各行,各列の表示属性を記憶する。
帳票作成部14は、ユーザが入力した帳票IDを参照
し、属性登録部13のフォーマットに従って、ディスプ
レイ17に帳票を表示する。
をイメージ認識部11で帳票の枠線と文字・数値を分離
・認識する。属性解析部12ではそれぞれのセルの表示
属性を認識した後、各行,各列の表示属性を記憶する。
帳票作成部14は、ユーザが入力した帳票IDを参照
し、属性登録部13のフォーマットに従って、ディスプ
レイ17に帳票を表示する。
【0008】図2に帳票の例を示す。これをイメージス
キャナ15から入力し、イメージ認識部11で認識す
る。この技術は、日立評論Vol.71,No.11 の57
頁から64頁に“BELIEVE”というシステムが述
べられているのでここでは述べない。“BELIEV
E”で対象とする帳票は、“数量”や“単価”といった
項目名だけが記述された帳票であり、帳票フォーマット
と項目名を認識の後、ユーザが帳票を作成していくもの
である。従って、帳票内での数値のカンマ編集や、右寄
せ処理等はユーザが意識して行なわなければならない。
これに対して本発明は、作成した帳票の例をイメージス
キャナ15から入力し、カンマ編集や右寄せ処理といっ
た表示属性を抽出するものである。図2の例では、第2
列の2行目から4行目までが右寄せ処理、第3列の2行
目から4行目までが右寄せ処理かつカンマ編集、第4列
の2行目から4行目までが右寄せ処理、第5列の2行目
から4行目までが右寄せ処理かつカンマ編集が施されて
いる。
キャナ15から入力し、イメージ認識部11で認識す
る。この技術は、日立評論Vol.71,No.11 の57
頁から64頁に“BELIEVE”というシステムが述
べられているのでここでは述べない。“BELIEV
E”で対象とする帳票は、“数量”や“単価”といった
項目名だけが記述された帳票であり、帳票フォーマット
と項目名を認識の後、ユーザが帳票を作成していくもの
である。従って、帳票内での数値のカンマ編集や、右寄
せ処理等はユーザが意識して行なわなければならない。
これに対して本発明は、作成した帳票の例をイメージス
キャナ15から入力し、カンマ編集や右寄せ処理といっ
た表示属性を抽出するものである。図2の例では、第2
列の2行目から4行目までが右寄せ処理、第3列の2行
目から4行目までが右寄せ処理かつカンマ編集、第4列
の2行目から4行目までが右寄せ処理、第5列の2行目
から4行目までが右寄せ処理かつカンマ編集が施されて
いる。
【0009】図3に各セルの表示属性の求め方を示す。
ここで対象とする表示属性は2種類ある。1種類は、カ
ンマ編集,左寄せ処理等で処理・編集が行なわれている
か否かをYES,NOで判断できる属性であり、YE
S,NO属性と呼ぶ。もう一方は、セルの大きさ、文字
間隔等数値で定義する属性で、数値属性と呼ぶ。次に図
3の処理を説明する。なお、ここで対象とする帳票は、
縦m行,横n列のセルから構成されているとする。
ここで対象とする表示属性は2種類ある。1種類は、カ
ンマ編集,左寄せ処理等で処理・編集が行なわれている
か否かをYES,NOで判断できる属性であり、YE
S,NO属性と呼ぶ。もう一方は、セルの大きさ、文字
間隔等数値で定義する属性で、数値属性と呼ぶ。次に図
3の処理を説明する。なお、ここで対象とする帳票は、
縦m行,横n列のセルから構成されているとする。
【0010】ステップ301:行方向の制御変数iを初
期化する。
期化する。
【0011】ステップ302:列方向の制御変数jを初
期化する。
期化する。
【0012】ステップ303:iをインクリメントす
る。
る。
【0013】ステップ304:jをインクリメントす
る。
る。
【0014】ステップ305:第i行j列のYES,N
O属性を調べる。ここでは属性の種類をセンタリング,
カンマ編集,左寄せ処理,右寄せ処理の4種類を考え
る。第i行j列のYES,NO属性を次の式で表わす。 AYN(i,j,k) …(数1) 但し、k=1,2,3,4は、それぞれセンタリン
グ,カンマ編集,左寄せ処理,右寄せ処理を意味し、処
理が行なわれていれば、 AYN(i,j,k)=1 …(数2) 行なわれていなければ、 AYN(i,j,k)=0 …(数3) とする。YES,NO属性は、排他属性(例えば、右寄
せと左寄せは重複定義できない)だけでなく、論理和属
性(例えば、カンマ編集とセンタリングは重複定義可
能)も定義できる。この場合は、 AYN(i,j,k,l) …(数4) のように次元を1つ増やせば実現可能である。ここで
は、基本的な最小の次元を取扱う。
O属性を調べる。ここでは属性の種類をセンタリング,
カンマ編集,左寄せ処理,右寄せ処理の4種類を考え
る。第i行j列のYES,NO属性を次の式で表わす。 AYN(i,j,k) …(数1) 但し、k=1,2,3,4は、それぞれセンタリン
グ,カンマ編集,左寄せ処理,右寄せ処理を意味し、処
理が行なわれていれば、 AYN(i,j,k)=1 …(数2) 行なわれていなければ、 AYN(i,j,k)=0 …(数3) とする。YES,NO属性は、排他属性(例えば、右寄
せと左寄せは重複定義できない)だけでなく、論理和属
性(例えば、カンマ編集とセンタリングは重複定義可
能)も定義できる。この場合は、 AYN(i,j,k,l) …(数4) のように次元を1つ増やせば実現可能である。ここで
は、基本的な最小の次元を取扱う。
【0015】ステップ306:第i行j列の数値属性を
調べる。これを、 ANUM(i,j,k) …(数5) で表わす。k=1,2,3,4は、それぞれ、縦方向の
セルの長さ(単位はドット),横方向のセルの長さ(単
位はドット),文字の大きさ(単位はドット),文字間
隔(単位はドット)を意味する。
調べる。これを、 ANUM(i,j,k) …(数5) で表わす。k=1,2,3,4は、それぞれ、縦方向の
セルの長さ(単位はドット),横方向のセルの長さ(単
位はドット),文字の大きさ(単位はドット),文字間
隔(単位はドット)を意味する。
【0016】前述の“BELIEVE”には、文字を抽
出し、認識する技術があるので、ここでは該技術を用
い、1文字の外接四角形に基づいて、文字の大きさ、文
字間隔を設定する。
出し、認識する技術があるので、ここでは該技術を用
い、1文字の外接四角形に基づいて、文字の大きさ、文
字間隔を設定する。
【0017】ステップ307:第n列まで調べたか否か
チェックする。
チェックする。
【0018】ステップ308:第m列まで調べたか否か
チェックする。
チェックする。
【0019】次に、AYN(i,j,k)の求め方につい
て述べる。
て述べる。
【0020】(1)k=1の時:セルの左枠線と最左端
文字との距離をDL、セルの右枠線と最右端文字との距
離をDRとして、 |DL−DR|≦d1ならばAYN(i,j,k)=1 …(数6) |DL−DR|≧d2ならばAYN(i,j,k)=−1 …(数7) d1<|DL−DR|<d2ならばAYN(i,j,k)=0 …(数8) とする。但し、||は絶対値の記号である。d1,d2
は正の定数で、 d1<d2 …(数9) とする。
文字との距離をDL、セルの右枠線と最右端文字との距
離をDRとして、 |DL−DR|≦d1ならばAYN(i,j,k)=1 …(数6) |DL−DR|≧d2ならばAYN(i,j,k)=−1 …(数7) d1<|DL−DR|<d2ならばAYN(i,j,k)=0 …(数8) とする。但し、||は絶対値の記号である。d1,d2
は正の定数で、 d1<d2 …(数9) とする。
【0021】(2)k=2の時:4桁以上の数値で3桁
毎にカンマがあれば、 AYN(i,j,k)=1 …(数10) 4桁以上の数値にもかかわらずカンマがあるべき位置
にない場合 AYN(i,j,k)=−1 …(数11) 3桁以下の数値の場合、 AYN(i,j,k)=0 …(数12) (3)k=3の時: DL<d3かつDR>d4ならばAYN(i,j,k)=1 …(数13) DL≧d3かつDR≦d4ならばAYN(i,j,k)=−1 …(数14) 上記条件以外の場合ならば、 AYN(i,j,k)=0 …(数15) とする。但し、d3,d4は正の定数で、 d3<d4 …(数16) とする。
毎にカンマがあれば、 AYN(i,j,k)=1 …(数10) 4桁以上の数値にもかかわらずカンマがあるべき位置
にない場合 AYN(i,j,k)=−1 …(数11) 3桁以下の数値の場合、 AYN(i,j,k)=0 …(数12) (3)k=3の時: DL<d3かつDR>d4ならばAYN(i,j,k)=1 …(数13) DL≧d3かつDR≦d4ならばAYN(i,j,k)=−1 …(数14) 上記条件以外の場合ならば、 AYN(i,j,k)=0 …(数15) とする。但し、d3,d4は正の定数で、 d3<d4 …(数16) とする。
【0022】(4)k=4の時:
DR<d3かつDL>d4ならばAYN(i,j,k)=1 …(数17)
DR≧d3かつDL≦d4ならばAYN(i,j,k)=−1 …(数18)
上記条件以外の場合ならば、
AYN(i,j,k)=0 …(数19)
とする。但し、d3,d4は正の定数で、
d3<d4 …(数20)
とする。
【0023】次にANUM(i,j,k)の求め方につい
て述べる。“BELIEVE”によって各セルの縦,横
の長さ及び各文字の外接四角形を求めることができる。
これによって、ANUM(i,j,1)とANUM(i,
j,2)を求めることができる。
て述べる。“BELIEVE”によって各セルの縦,横
の長さ及び各文字の外接四角形を求めることができる。
これによって、ANUM(i,j,1)とANUM(i,
j,2)を求めることができる。
【0024】(1)k=3の時:1つのセルに複数個の
文字が含まれるが、各文字の外接四角形に着目し、縦の
長さを調べる。図5に示すように、上接辺51と下接辺
52から、“J",“K",“L”の文字高さを求め、そ
の長さの平均を文字の大きさとする。
文字が含まれるが、各文字の外接四角形に着目し、縦の
長さを調べる。図5に示すように、上接辺51と下接辺
52から、“J",“K",“L”の文字高さを求め、そ
の長さの平均を文字の大きさとする。
【0025】また、他の方法として、図6に示すよう
に、最も出現頻度の高い長さを文字の大きさと定義して
もよい。この例では、29〜36ドットの文字高さが一
番出現頻度が多く、適合フォントサイズは32となる。
ここで文字の高さ方向に着目したのは、iやwなど横方
向の文字の長さはバラツキが大きいからである。
に、最も出現頻度の高い長さを文字の大きさと定義して
もよい。この例では、29〜36ドットの文字高さが一
番出現頻度が多く、適合フォントサイズは32となる。
ここで文字の高さ方向に着目したのは、iやwなど横方
向の文字の長さはバラツキが大きいからである。
【0026】(2)k=4の時:隣接する外接四角形の
左右の距離の平均を、そのセルの文字間隔とする。図7
に示すように、左接辺72と右接辺73から、w1,w
2,w3を求め、その長さの平均を文字間隔とする。ま
た、文字高さの求め方と同様に、最も出現頻度の高い長
さを文字間隔と定義してもよい。
左右の距離の平均を、そのセルの文字間隔とする。図7
に示すように、左接辺72と右接辺73から、w1,w
2,w3を求め、その長さの平均を文字間隔とする。ま
た、文字高さの求め方と同様に、最も出現頻度の高い長
さを文字間隔と定義してもよい。
【0027】各セルの属性を求めた後は、各行,各列の
属性を調べる。これはYES,NO属性についてのみ行
なう。行属性,列属性は全てのセルに表われるわけでは
ない。たとえば3桁の数値のセルにはカンマ編集は表わ
れない。だが同一行または同一列の他のセルにカンマ編
集が行なわれていれば、その行または列は、カンマ編集
の属性があると判断してもよい。一方、数値属性には、
同一行、同一列の特性はないので、YES,NO属性に
ついてのみ考える。以下、ステップ1501からステッ
プ1514までの説明を述べる。
属性を調べる。これはYES,NO属性についてのみ行
なう。行属性,列属性は全てのセルに表われるわけでは
ない。たとえば3桁の数値のセルにはカンマ編集は表わ
れない。だが同一行または同一列の他のセルにカンマ編
集が行なわれていれば、その行または列は、カンマ編集
の属性があると判断してもよい。一方、数値属性には、
同一行、同一列の特性はないので、YES,NO属性に
ついてのみ考える。以下、ステップ1501からステッ
プ1514までの説明を述べる。
【0028】ステップ1501〜1502:行方向制御
変数i及び列方向制御変数jを初期化する。
変数i及び列方向制御変数jを初期化する。
【0029】ステップ1503〜1507:第1行から
第m行について行属性を調べる。図2の例では、AYN
(i,j,k)についてiとkとを固定してjを2から5
まで調べる。一般に帳票には、表頭,表側という行,列
の内容を示す項目名がかかれていることが多い。従っ
て、行属性を調べるときは、第1列を無視することもあ
りえる。ここでは無視する。以下に示す条件(A)を満
たせば行属性あり、そうでなければ行属性なしとする。
行属性は「ACOL(i,k)」で表現する。kは、1=
センタリング,2=カンマ処理,3=左寄せ処理,4=
右寄せ処理を意味し、iは行番号である。
第m行について行属性を調べる。図2の例では、AYN
(i,j,k)についてiとkとを固定してjを2から5
まで調べる。一般に帳票には、表頭,表側という行,列
の内容を示す項目名がかかれていることが多い。従っ
て、行属性を調べるときは、第1列を無視することもあ
りえる。ここでは無視する。以下に示す条件(A)を満
たせば行属性あり、そうでなければ行属性なしとする。
行属性は「ACOL(i,k)」で表現する。kは、1=
センタリング,2=カンマ処理,3=左寄せ処理,4=
右寄せ処理を意味し、iは行番号である。
【0030】
条件(A):「AYN(i,j,k)(j=2〜5)の値に1が少なくとも1つ
あり、−1は1つも存在しない。」 …(数21)
この時、
ACOL(i,k)=1 …(数22)
そうでなければ、
ACOL(i,k)=0 …(数23)
とする。
【0031】例えば、第2行目に右寄せ処理が設定され
ている場合は、ACOL(2,4)=1となる。
ている場合は、ACOL(2,4)=1となる。
【0032】ステップ1508〜1509:列方向制御
変数j及び行方向制御変数iを初期化する。
変数j及び行方向制御変数iを初期化する。
【0033】ステップ1510〜1514:第1列から
第n列について列属性を調べる。ステップ1と同様、第
1行は無視して調べる。AYN(i,j,k)についてj
とkを固定して、iを2から4まで調べる。以下に示す
条件(B)を満たせば列属性あり、そうでなければ列属
性なしとする。
第n列について列属性を調べる。ステップ1と同様、第
1行は無視して調べる。AYN(i,j,k)についてj
とkを固定して、iを2から4まで調べる。以下に示す
条件(B)を満たせば列属性あり、そうでなければ列属
性なしとする。
【0034】列属性は「AROW(j,k)」で表現す
る。kは、1=センタリング,2=カンマ処理,3=左
寄せ処理,4=右寄せ処理を意味し、jは行番号であ
る。
る。kは、1=センタリング,2=カンマ処理,3=左
寄せ処理,4=右寄せ処理を意味し、jは行番号であ
る。
【0035】
条件(B):「AYN(i,j,k)(i=2〜4)の値に1が少なくとも1つ
あり、−1は1つも存在しない。」 …(数24)
この時、
AROW(j,k)=1 …(数25)
そうでなければ、
AROW(j,k)=0 …(数26)
とする。例えば、第3行目にカンマ処理が設定されてい
る場合には、AROW(3,2)=1となる。
る場合には、AROW(3,2)=1となる。
【0036】図2の例では、
ACOL(1,1)=1、ACOL(2,4)=1、
ACOL(3,4)=1、ACOL(4,4)=1、
AROW(1,1)=1、AROW(2,4)=1、
AROW(3,2)=1、AROW(3,4)=1、
AROW(4,2)=1、AROW(5,2)=1、
AROW(5,4)=1 …(数27)
となる。
【0037】第3行3列と第3行5列の要素“980”
にはカンマ編集がなされていないが、第3列,第5列の
列属性にはカンマ編集がなされている、と判断した。こ
のようにユーザは属性を定義する必要はない。しかし、
システムが自動的に決定した属性が誤っている場合や、
ユーザの試行錯誤や都合によって変更したい場合があ
る。この場合のユーザ操作を図8及び図16を用いて説
明する。
にはカンマ編集がなされていないが、第3列,第5列の
列属性にはカンマ編集がなされている、と判断した。こ
のようにユーザは属性を定義する必要はない。しかし、
システムが自動的に決定した属性が誤っている場合や、
ユーザの試行錯誤や都合によって変更したい場合があ
る。この場合のユーザ操作を図8及び図16を用いて説
明する。
【0038】帳票80は、ディスプレイ17に表示され
ている。
ている。
【0039】ステップ1601:キーボード18より矢
印キー等の移動方向を指定するキーを入力し、変更対象
セルを指定するためのブロックカーソル81を第3行2
列へ移動させる。
印キー等の移動方向を指定するキーを入力し、変更対象
セルを指定するためのブロックカーソル81を第3行2
列へ移動させる。
【0040】ステップ1602:キーボード18よりデ
ータ入力用のキーを入力し、帳票80のセルに表示属性
を持ったデータを入力し、最後にデータ入力の完了を意
味する復帰・改行キーを入力する。
ータ入力用のキーを入力し、帳票80のセルに表示属性
を持ったデータを入力し、最後にデータ入力の完了を意
味する復帰・改行キーを入力する。
【0041】ステップ1603:属性解析部13によ
り、セルの表示属性を解析する。
り、セルの表示属性を解析する。
【0042】ステップ1604:解析結果に従い、関連
セルを変更後の表示属性で表示する。
セルを変更後の表示属性で表示する。
【0043】以上の処理により変更が行なえる。第3行
2列にセンタリングしたデータを入力した場合の結果を
図9に示す。第3行2列に左寄せをしたデータを入力し
た場合の結果を図10に示す。第3行2列にカンマを付
加したデータを入力した場合の結果を図11に示す。
2列にセンタリングしたデータを入力した場合の結果を
図9に示す。第3行2列に左寄せをしたデータを入力し
た場合の結果を図10に示す。第3行2列にカンマを付
加したデータを入力した場合の結果を図11に示す。
【0044】次に、セルのデータ型が文字型であるか、
数値型であるかを判定する。これは、以下に示す式で表
わす。 ATYPE(j) …(数28) ATYPEのとりうる値は0,1,2,3で、それぞ
れ文字型,整数型,固定小数点型,浮動小数点型を意味
する。ここでは、同一列は同一のデータ型を持つものと
して扱う。判定の手順を図17(ステップ1701〜1
708)を用いて説明する。
数値型であるかを判定する。これは、以下に示す式で表
わす。 ATYPE(j) …(数28) ATYPEのとりうる値は0,1,2,3で、それぞ
れ文字型,整数型,固定小数点型,浮動小数点型を意味
する。ここでは、同一列は同一のデータ型を持つものと
して扱う。判定の手順を図17(ステップ1701〜1
708)を用いて説明する。
【0045】ステップ1701〜1702:行方向制御
変数i及び列方向制御変数jを初期化する。
変数i及び列方向制御変数jを初期化する。
【0046】ステップ1703〜1706:第j列の2
行から最終行までのセルの値から編集形式を解除したデ
ータを求める。
行から最終行までのセルの値から編集形式を解除したデ
ータを求める。
【0047】ステップ1707:図12の整数型構文規
則、図13の固定小数点型構文規則及び図14の浮動小
数点型構文規則のそれぞれについて型判定を行ない、一
致する型を求める。もし、一致する型がなければ文字型
とする。
則、図13の固定小数点型構文規則及び図14の浮動小
数点型構文規則のそれぞれについて型判定を行ない、一
致する型を求める。もし、一致する型がなければ文字型
とする。
【0048】ステップ1708:以上のステップを全て
の列について行なう。
の列について行なう。
【0049】属性の判断が終ると、ユーザに帳票IDを
入力してもらい、縦,横セル数,AYN,ANUM,A
COL,AROW,ATYPEと共に磁気ディスク16
に記憶する。次に登録された帳票IDに基づいて帳票を
作成する例を述べる。まず、図2の帳票から抽出した表
示属性ANUM(i,j,k)(i=1〜4,j=1〜
5,k=1〜4),行属性ACOL(i,k)(i=1〜
4,k=1〜4),列属性AROW(j,k)(j=1〜
5,k=1〜4)を帳票IDとともに磁気ディスク16
に格納しておく。それらをディスプレイ17の上に展開
する手順を図18(ステップ1801〜1808)を用
いて説明する。
入力してもらい、縦,横セル数,AYN,ANUM,A
COL,AROW,ATYPEと共に磁気ディスク16
に記憶する。次に登録された帳票IDに基づいて帳票を
作成する例を述べる。まず、図2の帳票から抽出した表
示属性ANUM(i,j,k)(i=1〜4,j=1〜
5,k=1〜4),行属性ACOL(i,k)(i=1〜
4,k=1〜4),列属性AROW(j,k)(j=1〜
5,k=1〜4)を帳票IDとともに磁気ディスク16
に格納しておく。それらをディスプレイ17の上に展開
する手順を図18(ステップ1801〜1808)を用
いて説明する。
【0050】ステップ1801:ユーザが作成したい帳
票IDをキーボード18から入力する(ここでは図2の
帳票ID)。 ステップ1802:磁気ディスク16か
ら該帳票のANUM,ACOL,AROWを調べる。
票IDをキーボード18から入力する(ここでは図2の
帳票ID)。 ステップ1802:磁気ディスク16か
ら該帳票のANUM,ACOL,AROWを調べる。
【0051】ステップ1803:ANUM(i,j,k)
(i=1〜4,j=1〜5,k=1〜4)に基づいて、
帳票の枠をディスプレイ17の上に描画する。図4にデ
ィスプレイ17と帳票の枠と入力エリア41を示す。
(i=1〜4,j=1〜5,k=1〜4)に基づいて、
帳票の枠をディスプレイ17の上に描画する。図4にデ
ィスプレイ17と帳票の枠と入力エリア41を示す。
【0052】ステップ1804:カーソルを表示し、ユ
ーザにキーボード18を用いて、入力したいセルにカー
ソルを移動してもらう。
ーザにキーボード18を用いて、入力したいセルにカー
ソルを移動してもらう。
【0053】ステップ1805:ユーザが入力エリアに
キーボード18から文字または数値を入力する。入力
後、完了キーを押下する。
キーボード18から文字または数値を入力する。入力
後、完了キーを押下する。
【0054】ステップ1806:その時のカーソルの位
置が第i行j列とすれば、ANUM(i,j,3)とAN
UM(i,j,4)から文字の大きさ,間隔を求める。文
字はベクトルフォントを有し、その大きさに拡大・縮小
すればよい。ベクトルフォントを持たない時は、所有す
るフォントを拡大・縮小するか、ANUM(i,j,
3)より大きくなく、最も近い大きさを所有するフォン
トを用いればよい。
置が第i行j列とすれば、ANUM(i,j,3)とAN
UM(i,j,4)から文字の大きさ,間隔を求める。文
字はベクトルフォントを有し、その大きさに拡大・縮小
すればよい。ベクトルフォントを持たない時は、所有す
るフォントを拡大・縮小するか、ANUM(i,j,
3)より大きくなく、最も近い大きさを所有するフォン
トを用いればよい。
【0055】ステップ1807:ACOL(i,k)とA
COL(j,k)(k=1〜4)の論理和をそのセルの表
示属性として、入力エリアの文字・数値を編集して第i
行j列のセルに表示する。これらの文字編集は従来技術
のワードプロセッサ等で公知なので、ここでは述べな
い。
COL(j,k)(k=1〜4)の論理和をそのセルの表
示属性として、入力エリアの文字・数値を編集して第i
行j列のセルに表示する。これらの文字編集は従来技術
のワードプロセッサ等で公知なので、ここでは述べな
い。
【0056】ステップ1808:帳票作成の終了が指定
された場合、作成の帳票を磁気ディスク16に格納する
などの終了処理を行う。
された場合、作成の帳票を磁気ディスク16に格納する
などの終了処理を行う。
【0057】このように、ユーザは入力したいセルにカ
ーソルを移動し、入力エリアに文字・数値を入力するだ
けでよいので、文字編集の負荷が軽減される。
ーソルを移動し、入力エリアに文字・数値を入力するだ
けでよいので、文字編集の負荷が軽減される。
【0058】
【発明の効果】本発明によれば、帳票内の項目の属性を
イメージデータからの入力及び、入力装置から入力した
サンプルデータに基づいて自動決定するので、ユーザが
属性を定義する負荷を軽減する効果がある。
イメージデータからの入力及び、入力装置から入力した
サンプルデータに基づいて自動決定するので、ユーザが
属性を定義する負荷を軽減する効果がある。
【図1】帳票処理を行なうコンピュータシステムを示す
図である。
図である。
【図2】本発明の一実施例による帳票を示す図である。
【図3】各セルの表示属性の求め方を示すフローチャー
トを示す図である。
トを示す図である。
【図4】本発明の一実施例による帳票作成画面を示す図
である。
である。
【図5】各文字高さの検出を示す図である。
【図6】出現頻度による文字高さの決定方法を示す図で
ある。
ある。
【図7】文字間隔の検出を示す図である。
【図8】本発明の一実施例による表示属性変更画面を示
す図である。
す図である。
【図9】本発明の一実施例による表示属性変更後(セン
タリング)の画面を示す図である。
タリング)の画面を示す図である。
【図10】本発明の一実施例による表示属性変更後(左
寄せ)の画面を示す図である。
寄せ)の画面を示す図である。
【図11】本発明の一実施例による表示属性変更後(カ
ンマ編集)の画面を示す図である。
ンマ編集)の画面を示す図である。
【図12】整数型の構文規則を示す図である。
【図13】固定小数点型の構文規則を示す図である。
【図14】浮動小数点型の構文規則を示す図である。
【図15】行属性,列属性を求めるフローチャートを示
す図である。
す図である。
【図16】表示属性変更のフローチャートを示す図であ
る。
る。
【図17】セルのデータ型を判定するフローチャートを
示す図である。
示す図である。
【図18】帳票作成のフローチャートを示す図である。
10…コンピュータ、11…イメージ認識部、12…属
性解析部、13…属性登録部、14…帳票作成部、15
…イメージスキャナ、16…磁気ディスク、17…ディ
スプレイ、18…キーボード、20…帳票の例、41…
帳票作成時の入力エリア、51…上接辺、52…下接
辺、71…検出した文字、72…左接辺、73…右接
辺、80…表示属性を変更する帳票、81…ブロックカ
ーソル。
性解析部、13…属性登録部、14…帳票作成部、15
…イメージスキャナ、16…磁気ディスク、17…ディ
スプレイ、18…キーボード、20…帳票の例、41…
帳票作成時の入力エリア、51…上接辺、52…下接
辺、71…検出した文字、72…左接辺、73…右接
辺、80…表示属性を変更する帳票、81…ブロックカ
ーソル。
Claims (7)
- 【請求項1】イメージ情報読み取り手段から入力された
枠線と文字・数字等のコード情報とからなる帳票から、
該枠線とコード情報を認識するためのイメージ認識手段
と、上記枠線で囲まれる一区画であるセル毎に、各セル
内のコード情報の属性を解析するための属性解析手段
と、該属性解析手段において解析された帳票の各セル毎
の属性を該帳票のIDコードと対応づけて登録するため
の属性登録手段と、ユーザから入力されたIDコードに
応じて、帳票の枠線及び項目名からなる帳票フォーマッ
トを表示し、各セル内の入力エリアに入力された文字・
数字等のコード情報を、上記IDコードと対応づけて登
録された属性に従って表示する帳票表示手段とからなる
帳票処理装置に適用する帳票属性認識・表示方法におい
て、 上記イメージ認識手段によって、イメージ情報読み取り
手段から入力された枠線とコード情報とから各セル毎に
該コード情報の属性を認識するステップと、各セル毎の
上記コード情報の属性を、ユーザから入力された第1の
帳票IDコードと対応づけて属性登録手段に登録するス
テップと、ユーザから入力された第2の帳票IDコード
に応じて、上記属性登録手段を参照することにより帳票
のフォーマットを表示し、ユーザから入力エリア内に入
力されたコード情報を、上記第2の帳票IDコードに応
じて登録された属性に従って表示するステップとからな
ることを特徴とする帳票属性認識・表示方法。 - 【請求項2】各セル毎の属性を認識した後で、それに基
づいて各行,各列の表示属性を決定する請求項第1項記
載の帳票属性認識・表示方法。 - 【請求項3】第i行j列の項目の属性を、第i行の属性
と第j列の属性から決定することを特徴とする請求項第
1項記載の帳票属性認識・表示方法。 - 【請求項4】同一項目内から文字・数値の外接四角形を
抽出し、縦方向の長さをその文字・数値の大きさである
と定義することを特徴とする請求項第1項記載の帳票属
性認識・表示方法。 - 【請求項5】同一項目内の文字・数値の外接四角形の中
で他との差がある一定以上のものを除いて残りの平均を
とり、それがその項目内の文字・数値の大きさであると
定義することを特徴とする請求項第1項記載の帳票属性
認識・表示方法。 - 【請求項6】第i行j列の項目の表示属性を、入力装置
から入力したデータに基づいて決定することを特徴とす
る請求項第1項記載の帳票属性認識・表示方法。 - 【請求項7】イメージ情報読み取り手段から入力された
枠線と文字・数字等のコード情報とからなる帳票から、
該枠線とコード情報を認識するためのイメージ認識手段
と、上記枠線で囲まれる一区画であるセル毎に、各セル
内のコード情報の属性を解析するための属性解析手段
と、該属性解析手段において解析された帳票の各セル毎
の属性を該帳票のIDコードと対応づけて登録するため
の属性登録手段と、ユーザから入力されたIDコードに
応じて、帳票の枠線及び項目名からなる帳票フォーマッ
トを表示し、各セル内の入力エリアに入力された文字・
数字等のコード情報を、上記IDコードと対応づけて登
録された属性に従って表示する帳票表示手段とからなる
帳票処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3170936A JPH0520494A (ja) | 1991-07-11 | 1991-07-11 | 帳票属性認識・表示方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3170936A JPH0520494A (ja) | 1991-07-11 | 1991-07-11 | 帳票属性認識・表示方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0520494A true JPH0520494A (ja) | 1993-01-29 |
Family
ID=15914119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3170936A Pending JPH0520494A (ja) | 1991-07-11 | 1991-07-11 | 帳票属性認識・表示方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0520494A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07138679A (ja) * | 1994-05-09 | 1995-05-30 | Toshiba Corp | ボンディングワイヤー |
JPH07138678A (ja) * | 1994-05-09 | 1995-05-30 | Toshiba Corp | 半導体装置 |
JP2011192274A (ja) * | 2010-03-11 | 2011-09-29 | Ricoh Co Ltd | フォームテンプレートを定義する方法及び装置 |
JP2015191277A (ja) * | 2014-03-27 | 2015-11-02 | 富士通株式会社 | データ識別方法、データ識別プログラム及びデータ識別装置 |
JP2018124828A (ja) * | 2017-02-01 | 2018-08-09 | 日本電信電話株式会社 | 表データ分析プログラム |
-
1991
- 1991-07-11 JP JP3170936A patent/JPH0520494A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07138679A (ja) * | 1994-05-09 | 1995-05-30 | Toshiba Corp | ボンディングワイヤー |
JPH07138678A (ja) * | 1994-05-09 | 1995-05-30 | Toshiba Corp | 半導体装置 |
JP2011192274A (ja) * | 2010-03-11 | 2011-09-29 | Ricoh Co Ltd | フォームテンプレートを定義する方法及び装置 |
JP2015191277A (ja) * | 2014-03-27 | 2015-11-02 | 富士通株式会社 | データ識別方法、データ識別プログラム及びデータ識別装置 |
JP2018124828A (ja) * | 2017-02-01 | 2018-08-09 | 日本電信電話株式会社 | 表データ分析プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR930009639B1 (ko) | 화상데이타를 이용하는 문서데이타 처리방법 및 장치 | |
JP3427692B2 (ja) | 文字認識方法および文字認識装置 | |
JP3452774B2 (ja) | 文字認識方法 | |
WO1991006057A1 (en) | Image display/processing method of formatted document and apparatus therefor | |
JP3294995B2 (ja) | 帳票読取装置 | |
US6614929B1 (en) | Apparatus and method of detecting character writing area in document, and document format generating apparatus | |
JPH11282955A (ja) | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2000315247A (ja) | 文字認識装置 | |
JPH0581473A (ja) | プログラムの作成方法 | |
JP2012190434A (ja) | 帳票定義装置、帳票定義方法、プログラム及び記録媒体 | |
US11645332B2 (en) | System and method for clustering documents | |
JPH0520494A (ja) | 帳票属性認識・表示方法 | |
JPH0689365A (ja) | 文書画像処理装置 | |
JP4466241B2 (ja) | 文書処理手法及び文書処理装置 | |
JP2974346B2 (ja) | 漢字処理装置 | |
JP3487523B2 (ja) | 文書処理装置 | |
JP3470930B2 (ja) | 自然語解析方法及び装置 | |
JP3663865B2 (ja) | 帳票処理装置及び記憶媒体 | |
JPH10302025A (ja) | 手書き文字認識装置およびそのプログラム記録媒体 | |
JP2003132078A (ja) | データベース構築装置、データベース構築方法、データベース構築プログラム、記録媒体 | |
JP3128357B2 (ja) | 文字認識処理装置 | |
JPH117492A (ja) | キー入力編集方法及び編集装置 | |
JPH06215197A (ja) | 文字認識方法および装置 | |
JP3045886B2 (ja) | 手書き入力機能付き文字処理装置 | |
CN116010421A (zh) | 一种搜索方法 |